BRPI0610520A2 - polinucleotìdeo, vetor, constructo de dna recombinante, processos para transformar uma célula hospedeira, para conferir ou aperfeiçoar a resistência a colletotrichum e a podridão do colmo, para alterar o nìvel de expressão de uma proteìna capaz de conferir resistência a colletotrichum e a podridão do colmo de identifição de plantas resistentes a colletotrichum, para determinar a presença ou ausência do lócus de rcg1, sistema de computador para identificar uma planta resistente a infecção por colletotrichum, marcador genético, métodos para a produção de planta e de um produto de milho, e usos - Google Patents
polinucleotìdeo, vetor, constructo de dna recombinante, processos para transformar uma célula hospedeira, para conferir ou aperfeiçoar a resistência a colletotrichum e a podridão do colmo, para alterar o nìvel de expressão de uma proteìna capaz de conferir resistência a colletotrichum e a podridão do colmo de identifição de plantas resistentes a colletotrichum, para determinar a presença ou ausência do lócus de rcg1, sistema de computador para identificar uma planta resistente a infecção por colletotrichum, marcador genético, métodos para a produção de planta e de um produto de milho, e usos Download PDFInfo
- Publication number
- BRPI0610520A2 BRPI0610520A2 BRPI0610520-3A BRPI0610520A BRPI0610520A2 BR PI0610520 A2 BRPI0610520 A2 BR PI0610520A2 BR PI0610520 A BRPI0610520 A BR PI0610520A BR PI0610520 A2 BRPI0610520 A2 BR PI0610520A2
- Authority
- BR
- Brazil
- Prior art keywords
- regi
- plant
- seq
- gene
- markers
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 469
- 241000196324 Embryophyta Species 0.000 title claims abstract description 372
- 238000000034 method Methods 0.000 title claims abstract description 213
- 240000008042 Zea mays Species 0.000 title claims abstract description 197
- 235000002017 Zea mays subsp mays Nutrition 0.000 title claims abstract description 116
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 109
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 109
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 109
- 230000008569 process Effects 0.000 title claims abstract description 89
- 241000222199 Colletotrichum Species 0.000 title claims abstract description 43
- 239000003550 marker Substances 0.000 title claims description 175
- 102000004169 proteins and genes Human genes 0.000 title claims description 112
- 230000014509 gene expression Effects 0.000 title claims description 72
- 230000002068 genetic effect Effects 0.000 title claims description 68
- 108020004511 Recombinant DNA Proteins 0.000 title claims description 33
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 title claims description 32
- 235000005822 corn Nutrition 0.000 title claims description 32
- 239000013598 vector Substances 0.000 title claims description 20
- 230000001131 transforming effect Effects 0.000 title claims description 13
- 230000002708 enhancing effect Effects 0.000 title claims description 6
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims abstract description 84
- 235000009973 maize Nutrition 0.000 claims abstract description 84
- 235000013339 cereals Nutrition 0.000 claims abstract description 12
- 210000004027 cell Anatomy 0.000 claims description 105
- 239000002773 nucleotide Substances 0.000 claims description 99
- 125000003729 nucleotide group Chemical group 0.000 claims description 98
- 150000007523 nucleic acids Chemical class 0.000 claims description 86
- 230000002759 chromosomal effect Effects 0.000 claims description 81
- 102000039446 nucleic acids Human genes 0.000 claims description 67
- 108020004707 nucleic acids Proteins 0.000 claims description 67
- 108700028369 Alleles Proteins 0.000 claims description 59
- 210000000349 chromosome Anatomy 0.000 claims description 58
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 54
- 239000012634 fragment Substances 0.000 claims description 53
- 229920001184 polypeptide Polymers 0.000 claims description 51
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 51
- 230000000295 complement effect Effects 0.000 claims description 42
- 238000006243 chemical reaction Methods 0.000 claims description 41
- 108091026890 Coding region Proteins 0.000 claims description 40
- 208000015181 infectious disease Diseases 0.000 claims description 40
- 230000006798 recombination Effects 0.000 claims description 39
- 238000005215 recombination Methods 0.000 claims description 39
- 241001057636 Dracaena deremensis Species 0.000 claims description 31
- 230000001976 improved effect Effects 0.000 claims description 29
- 230000009466 transformation Effects 0.000 claims description 27
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 25
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 230000001105 regulatory effect Effects 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 244000062793 Sorghum vulgare Species 0.000 claims description 14
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 238000009395 breeding Methods 0.000 claims description 13
- 108020004999 messenger RNA Proteins 0.000 claims description 13
- 230000001488 breeding effect Effects 0.000 claims description 11
- 235000019713 millet Nutrition 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 108091093088 Amplicon Proteins 0.000 claims description 8
- 238000002105 Southern blotting Methods 0.000 claims description 7
- 238000002965 ELISA Methods 0.000 claims description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 4
- 239000013612 plasmid Substances 0.000 claims description 4
- 238000001262 western blot Methods 0.000 claims description 4
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 235000005687 corn oil Nutrition 0.000 claims description 2
- 239000002285 corn oil Substances 0.000 claims description 2
- 235000013305 food Nutrition 0.000 claims description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical class CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 2
- 229920002261 Corn starch Polymers 0.000 claims 1
- 235000019759 Maize starch Nutrition 0.000 claims 1
- 235000013312 flour Nutrition 0.000 claims 1
- 230000003426 interchromosomal effect Effects 0.000 claims 1
- 201000010099 disease Diseases 0.000 abstract description 30
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 30
- 108020004414 DNA Proteins 0.000 description 270
- 230000002441 reversible effect Effects 0.000 description 71
- 239000000523 sample Substances 0.000 description 56
- 102000054766 genetic haplotypes Human genes 0.000 description 50
- 238000003752 polymerase chain reaction Methods 0.000 description 47
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 43
- 238000009396 hybridization Methods 0.000 description 40
- 108091034117 Oligonucleotide Proteins 0.000 description 32
- 230000000306 recurrent effect Effects 0.000 description 31
- 241000282326 Felis catus Species 0.000 description 30
- 238000013507 mapping Methods 0.000 description 25
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 24
- 238000003780 insertion Methods 0.000 description 24
- 210000001519 tissue Anatomy 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 23
- 230000037431 insertion Effects 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 230000009261 transgenic effect Effects 0.000 description 22
- 239000002299 complementary DNA Substances 0.000 description 20
- 240000007594 Oryza sativa Species 0.000 description 19
- 235000007164 Oryza sativa Nutrition 0.000 description 19
- 102000054765 polymorphisms of proteins Human genes 0.000 description 19
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 150000001413 amino acids Chemical class 0.000 description 17
- 238000003556 assay Methods 0.000 description 17
- 238000011081 inoculation Methods 0.000 description 17
- 244000052769 pathogen Species 0.000 description 16
- 241000894007 species Species 0.000 description 16
- 108091035707 Consensus sequence Proteins 0.000 description 15
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 15
- 230000003321 amplification Effects 0.000 description 15
- 244000053095 fungal pathogen Species 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- 108010034529 leucyl-lysine Proteins 0.000 description 15
- 238000003199 nucleic acid amplification method Methods 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 210000004901 leucine-rich repeat Anatomy 0.000 description 14
- 108010057821 leucylproline Proteins 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 208000035240 Disease Resistance Diseases 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 101000997654 Homo sapiens N-acetylmannosamine kinase Proteins 0.000 description 12
- 238000010367 cloning Methods 0.000 description 12
- 230000001717 pathogenic effect Effects 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 12
- 230000003252 repetitive effect Effects 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 description 11
- 108010013835 arginine glutamate Proteins 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 235000009566 rice Nutrition 0.000 description 11
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 10
- 238000009402 cross-breeding Methods 0.000 description 10
- 210000002257 embryonic structure Anatomy 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 238000011160 research Methods 0.000 description 10
- 238000013519 translation Methods 0.000 description 10
- 241000589158 Agrobacterium Species 0.000 description 9
- 108700019146 Transgenes Proteins 0.000 description 9
- 108090000848 Ubiquitin Proteins 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 108091060211 Expressed sequence tag Proteins 0.000 description 8
- 241000233866 Fungi Species 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 108091081024 Start codon Proteins 0.000 description 8
- 230000009418 agronomic effect Effects 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 230000002538 fungal effect Effects 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 239000003147 molecular marker Substances 0.000 description 8
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 206010061818 Disease progression Diseases 0.000 description 7
- 235000010469 Glycine max Nutrition 0.000 description 7
- 240000005979 Hordeum vulgare Species 0.000 description 7
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 7
- 102000044159 Ubiquitin Human genes 0.000 description 7
- 208000027418 Wounds and injury Diseases 0.000 description 7
- 235000007244 Zea mays Nutrition 0.000 description 7
- 230000005750 disease progression Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 101150079179 flp-27 gene Proteins 0.000 description 7
- 239000012014 frustrated Lewis pair Substances 0.000 description 7
- 108010038320 lysylphenylalanine Proteins 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 108010056582 methionylglutamic acid Proteins 0.000 description 7
- 238000003757 reverse transcription PCR Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 6
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 6
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 6
- 206010052428 Wound Diseases 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000009399 inbreeding Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- FKBFDTRILNZGAI-IMJSIDKUSA-N Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O FKBFDTRILNZGAI-IMJSIDKUSA-N 0.000 description 5
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 5
- 241001429695 Colletotrichum graminicola Species 0.000 description 5
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 5
- NJMYZEJORPYOTO-BQBZGAKWSA-N Gln-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O NJMYZEJORPYOTO-BQBZGAKWSA-N 0.000 description 5
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 description 5
- 108091092195 Intron Proteins 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 241000813090 Rhizoctonia solani Species 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 230000003902 lesion Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 230000008659 phytopathology Effects 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 108700026215 vpr Genes Proteins 0.000 description 5
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 4
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- UWXFFVQPAMBETM-ZLUOBGJFSA-N Cys-Asp-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UWXFFVQPAMBETM-ZLUOBGJFSA-N 0.000 description 4
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 4
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 4
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 4
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 4
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 4
- 241000760038 Monosis Species 0.000 description 4
- 241000918584 Pythium ultimum Species 0.000 description 4
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000013213 extrapolation Methods 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 238000003205 genotyping method Methods 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 230000002363 herbicidal effect Effects 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 235000021374 legumes Nutrition 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 230000021121 meiosis Effects 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 108010000700 Acetolactate synthase Proteins 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 3
- OSASDIVHOSJVII-WDSKDSINSA-N Arg-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N OSASDIVHOSJVII-WDSKDSINSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 3
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 3
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 3
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 3
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 3
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 3
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241001481833 Coryphaena hippurus Species 0.000 description 3
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 3
- UPJGYXRAPJWIHD-CIUDSAMLSA-N Cys-Asn-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UPJGYXRAPJWIHD-CIUDSAMLSA-N 0.000 description 3
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 3
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241001200922 Gagata Species 0.000 description 3
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 3
- CLSDNFWKGFJIBZ-YUMQZZPRSA-N Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O CLSDNFWKGFJIBZ-YUMQZZPRSA-N 0.000 description 3
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 3
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 3
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 3
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 3
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 3
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 3
- 108010025815 Kanamycin Kinase Proteins 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 3
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 3
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 3
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 3
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 3
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 3
- 241001495426 Macrophomina phaseolina Species 0.000 description 3
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 3
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 240000002853 Nelumbo nucifera Species 0.000 description 3
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 3
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 3
- 244000061176 Nicotiana tabacum Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 206010034133 Pathogen resistance Diseases 0.000 description 3
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 3
- 241000599030 Pythium debaryanum Species 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 241000221696 Sclerotinia sclerotiorum Species 0.000 description 3
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 3
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 241001250070 Sporisorium reilianum Species 0.000 description 3
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000000843 anti-fungal effect Effects 0.000 description 3
- 230000001775 anti-pathogenic effect Effects 0.000 description 3
- 229940121375 antifungal agent Drugs 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000002845 discoloration Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 241001233957 eudicotyledons Species 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 238000003976 plant breeding Methods 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000011426 transformation method Methods 0.000 description 3
- 230000002792 vascular Effects 0.000 description 3
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 3
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 2
- 241000223602 Alternaria alternata Species 0.000 description 2
- 101710083587 Antifungal protein Proteins 0.000 description 2
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 2
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 2
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 2
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 2
- NJPLPRFQLBZAMH-IHRRRGAJSA-N Asn-Tyr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O NJPLPRFQLBZAMH-IHRRRGAJSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 2
- HSGOFISJLFDMBJ-CIUDSAMLSA-N Asp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N HSGOFISJLFDMBJ-CIUDSAMLSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- 241000228439 Bipolaris zeicola Species 0.000 description 2
- 241001149956 Cladosporium herbarum Species 0.000 description 2
- 241000384516 Claviceps sorghi Species 0.000 description 2
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 2
- WVJHEDOLHPZLRV-CIUDSAMLSA-N Cys-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N WVJHEDOLHPZLRV-CIUDSAMLSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 2
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 2
- 108020003215 DNA Probes Proteins 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- 241000233732 Fusarium verticillioides Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- DXJZITDUDUPINW-WHFBIAKZSA-N Gln-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O DXJZITDUDUPINW-WHFBIAKZSA-N 0.000 description 2
- SSHIXEILTLPAQT-WHFBIAKZSA-N Gln-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSHIXEILTLPAQT-WHFBIAKZSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 2
- ARPVSMCNIDAQBO-YUMQZZPRSA-N Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ARPVSMCNIDAQBO-YUMQZZPRSA-N 0.000 description 2
- SIGGQAHUPUBWNF-BQBZGAKWSA-N Gln-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O SIGGQAHUPUBWNF-BQBZGAKWSA-N 0.000 description 2
- YGNPTRVNRUKVLA-DCAQKATOSA-N Gln-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YGNPTRVNRUKVLA-DCAQKATOSA-N 0.000 description 2
- KGNSGRRALVIRGR-QWRGUYRKSA-N Gln-Tyr Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-QWRGUYRKSA-N 0.000 description 2
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 2
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 2
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 2
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 2
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 2
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 2
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 2
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 2
- PASHZZBXZYEXFE-LSDHHAIUSA-N Gly-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN)C(=O)O PASHZZBXZYEXFE-LSDHHAIUSA-N 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 2
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 2
- WSDOHRLQDGAOGU-BQBZGAKWSA-N His-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 WSDOHRLQDGAOGU-BQBZGAKWSA-N 0.000 description 2
- WCNXUTNLSRWWQN-DCAQKATOSA-N His-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WCNXUTNLSRWWQN-DCAQKATOSA-N 0.000 description 2
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 2
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 2
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 2
- 206010061217 Infestation Diseases 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 2
- 108090001090 Lectins Proteins 0.000 description 2
- 102000004856 Lectins Human genes 0.000 description 2
- 244000309551 Leptotrochila medicaginis Species 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 2
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 2
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 2
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 2
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 241000721701 Lynx Species 0.000 description 2
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 2
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 2
- SSYOBDBNBQBSQE-SRVKXCTJSA-N Lys-Cys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O SSYOBDBNBQBSQE-SRVKXCTJSA-N 0.000 description 2
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 2
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 2
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 2
- AHFOKDZWPPGJAZ-SRVKXCTJSA-N Lys-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N AHFOKDZWPPGJAZ-SRVKXCTJSA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 2
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 2
- 241000723994 Maize dwarf mosaic virus Species 0.000 description 2
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 2
- BXNZDLVLGYYFIB-FXQIFTODSA-N Met-Asn-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BXNZDLVLGYYFIB-FXQIFTODSA-N 0.000 description 2
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 2
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 2
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000596141 Peronosclerospora sorghi Species 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- KLAONOISLHWJEE-QWRGUYRKSA-N Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KLAONOISLHWJEE-QWRGUYRKSA-N 0.000 description 2
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 2
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 2
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 2
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000233624 Phytophthora megasperma Species 0.000 description 2
- SBYVDRLQAGENMY-DCAQKATOSA-N Pro-Asn-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O SBYVDRLQAGENMY-DCAQKATOSA-N 0.000 description 2
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 2
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- 241000233639 Pythium Species 0.000 description 2
- 241000918585 Pythium aphanidermatum Species 0.000 description 2
- 241001635622 Pythium splendens Species 0.000 description 2
- 101150090155 R gene Proteins 0.000 description 2
- 241000334150 Ramulispora sorghi f. maydis Species 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 2
- 241000228417 Sarocladium strictum Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 108091035242 Sequence-tagged site Proteins 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 2
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- 241000332749 Setosphaeria turcica Species 0.000 description 2
- 101000611441 Solanum lycopersicum Pathogenesis-related leaf protein 6 Proteins 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 241000692746 Stenocarpella maydis Species 0.000 description 2
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 2
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 2
- FBGDDUKYOBNZJL-WDSOQIARSA-N Trp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FBGDDUKYOBNZJL-WDSOQIARSA-N 0.000 description 2
- YBRHKUNWEYBZGT-WLTAIBSBSA-N Trp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-WLTAIBSBSA-N 0.000 description 2
- ONWMQORSVZYVNH-UWVGGRQHSA-N Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UWVGGRQHSA-N 0.000 description 2
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- 241000233791 Ustilago tritici Species 0.000 description 2
- 229920002494 Zein Polymers 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 230000010165 autogamy Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- NNKKTZOEKDFTBU-YBEGLDIGSA-N cinidon ethyl Chemical compound C1=C(Cl)C(/C=C(\Cl)C(=O)OCC)=CC(N2C(C3=C(CCCC3)C2=O)=O)=C1 NNKKTZOEKDFTBU-YBEGLDIGSA-N 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000000151 deposition Methods 0.000 description 2
- 230000008021 deposition Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 231100000676 disease causative agent Toxicity 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 239000000417 fungicide Substances 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 102000005396 glutamine synthetase Human genes 0.000 description 2
- 108020002326 glutamine synthetase Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000002917 insecticide Substances 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000002523 lectin Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 244000000003 plant pathogen Species 0.000 description 2
- 229920000903 polyhydroxyalkanoate Polymers 0.000 description 2
- 238000012809 post-inoculation Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000008261 resistance mechanism Effects 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000005019 zein Substances 0.000 description 2
- 229940093612 zein Drugs 0.000 description 2
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- 229940087195 2,4-dichlorophenoxyacetate Drugs 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical class O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 102100026105 3-ketoacyl-CoA thiolase, mitochondrial Human genes 0.000 description 1
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 101150101112 7 gene Proteins 0.000 description 1
- WFPZSXYXPSUOPY-ROYWQJLOSA-N ADP alpha-D-glucoside Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=CN=C(C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O WFPZSXYXPSUOPY-ROYWQJLOSA-N 0.000 description 1
- 108010003902 Acetyl-CoA C-acyltransferase Proteins 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- JQDFGZKKXBEANU-IMJSIDKUSA-N Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(O)=O JQDFGZKKXBEANU-IMJSIDKUSA-N 0.000 description 1
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 1
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 1
- 241000919507 Albugo candida Species 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241001149961 Alternaria brassicae Species 0.000 description 1
- 241000323764 Alternaria zinnae Species 0.000 description 1
- 241000429811 Alternariaster helianthi Species 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 241001156002 Anthonomus pomorum Species 0.000 description 1
- 241001444080 Aphanomyces euteiches Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- NAARDJBSSPUGCF-FXQIFTODSA-N Arg-Cys-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N NAARDJBSSPUGCF-FXQIFTODSA-N 0.000 description 1
- QIWYWCYNUMJBTC-CIUDSAMLSA-N Arg-Cys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIWYWCYNUMJBTC-CIUDSAMLSA-N 0.000 description 1
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 1
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- ROWCTNFEMKOIFQ-YUMQZZPRSA-N Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N ROWCTNFEMKOIFQ-YUMQZZPRSA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 1
- XOZYYXMHMIEJET-XIRDDKMYSA-N Arg-Trp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O XOZYYXMHMIEJET-XIRDDKMYSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- 240000005410 Ascochyta medicaginicola var. medicaginicola Species 0.000 description 1
- 241001414024 Ascochyta sorghi Species 0.000 description 1
- 244000309473 Ascochyta tritici Species 0.000 description 1
- SJUXYGVRSGTPMC-IMJSIDKUSA-N Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O SJUXYGVRSGTPMC-IMJSIDKUSA-N 0.000 description 1
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 1
- LUVODTFFSXVOAG-ACZMJKKPSA-N Asn-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N LUVODTFFSXVOAG-ACZMJKKPSA-N 0.000 description 1
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- ATHZHGQSAIJHQU-XIRDDKMYSA-N Asn-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ATHZHGQSAIJHQU-XIRDDKMYSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- MUWDILPCTSMUHI-ZLUOBGJFSA-N Asp-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O MUWDILPCTSMUHI-ZLUOBGJFSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 1
- JRBVWZLHBGYZNY-QEJZJMRPSA-N Asp-Gln-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRBVWZLHBGYZNY-QEJZJMRPSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 1
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- LDLZOAJRXXBVGF-GMOBBJLQSA-N Asp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N LDLZOAJRXXBVGF-GMOBBJLQSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- DWOSGXZMLQNDBN-FXQIFTODSA-N Asp-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CS)C(=O)O DWOSGXZMLQNDBN-FXQIFTODSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- KCOPOPKJRHVGPE-AQZXSJQPSA-N Asp-Thr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O KCOPOPKJRHVGPE-AQZXSJQPSA-N 0.000 description 1
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- LEYKQPDPZJIRTA-AQZXSJQPSA-N Asp-Trp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LEYKQPDPZJIRTA-AQZXSJQPSA-N 0.000 description 1
- 241001530056 Athelia rolfsii Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 1
- 241001465178 Bipolaris Species 0.000 description 1
- 241000190150 Bipolaris sorokiniana Species 0.000 description 1
- 241000123650 Botrytis cinerea Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 229910000906 Bronze Inorganic materials 0.000 description 1
- 238000006037 Brook Silaketone rearrangement reaction Methods 0.000 description 1
- 101100394003 Butyrivibrio fibrisolvens end1 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229920008347 Cellulose acetate propionate Polymers 0.000 description 1
- 241001435629 Cephalosporium gramineum Species 0.000 description 1
- 241001290235 Ceratobasidium cereale Species 0.000 description 1
- 241001658057 Cercospora kikuchii Species 0.000 description 1
- 244000309550 Cercospora medicaginis Species 0.000 description 1
- 241000113401 Cercospora sojina Species 0.000 description 1
- 241000437818 Cercospora vignicola Species 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 102000040852 Class 2 family Human genes 0.000 description 1
- 108091071896 Class 2 family Proteins 0.000 description 1
- 241000221751 Claviceps purpurea Species 0.000 description 1
- 241001330709 Cochliobolus pallescens Species 0.000 description 1
- 241001480648 Colletotrichum dematium Species 0.000 description 1
- 241000222237 Colletotrichum trifolii Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241001537312 Curvularia inaequalis Species 0.000 description 1
- 241000223211 Curvularia lunata Species 0.000 description 1
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 1
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 1
- JTNKVWLMDHIUOG-IHRRRGAJSA-N Cys-Arg-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JTNKVWLMDHIUOG-IHRRRGAJSA-N 0.000 description 1
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 1
- AYKQJQVWUYEZNU-IMJSIDKUSA-N Cys-Asn Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O AYKQJQVWUYEZNU-IMJSIDKUSA-N 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 1
- OABOXRPGTFRBFZ-IMJSIDKUSA-N Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(O)=O OABOXRPGTFRBFZ-IMJSIDKUSA-N 0.000 description 1
- BMHBJCVEXUBGFI-BIIVOSGPSA-N Cys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)O BMHBJCVEXUBGFI-BIIVOSGPSA-N 0.000 description 1
- RWGDABDXVXRLLH-ACZMJKKPSA-N Cys-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N RWGDABDXVXRLLH-ACZMJKKPSA-N 0.000 description 1
- GOKFTBDYUJCCSN-QEJZJMRPSA-N Cys-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N GOKFTBDYUJCCSN-QEJZJMRPSA-N 0.000 description 1
- LVNMAAGSAUGNIC-BQBZGAKWSA-N Cys-His Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 LVNMAAGSAUGNIC-BQBZGAKWSA-N 0.000 description 1
- ANRWXLYGJRSQEQ-CIUDSAMLSA-N Cys-His-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ANRWXLYGJRSQEQ-CIUDSAMLSA-N 0.000 description 1
- SBDVXRYCOIEYNV-YUMQZZPRSA-N Cys-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N SBDVXRYCOIEYNV-YUMQZZPRSA-N 0.000 description 1
- NXTYATMDWQYLGJ-BQBZGAKWSA-N Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CS NXTYATMDWQYLGJ-BQBZGAKWSA-N 0.000 description 1
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 1
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 1
- WYVKPHCYMTWUCW-YUPRTTJUSA-N Cys-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)N)O WYVKPHCYMTWUCW-YUPRTTJUSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 101710096830 DNA-3-methyladenine glycosylase Proteins 0.000 description 1
- 102100039128 DNA-3-methyladenine glycosylase Human genes 0.000 description 1
- 241000866066 Diaporthe caulivora Species 0.000 description 1
- 241000042001 Diaporthe helianthi Species 0.000 description 1
- 241001508801 Diaporthe phaseolorum Species 0.000 description 1
- 241000588700 Dickeya chrysanthemi Species 0.000 description 1
- 241001422851 Didymella maydis Species 0.000 description 1
- 108700003861 Dominant Genes Proteins 0.000 description 1
- 241000710188 Encephalomyocarditis virus Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241000122692 Fusarium avenaceum Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000221779 Fusarium sambucinum Species 0.000 description 1
- 241000427940 Fusarium solani Species 0.000 description 1
- 241000145502 Fusarium subglutinans Species 0.000 description 1
- 241001508365 Gaeumannomyces tritici Species 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- OPINTGHFESTVAX-BQBZGAKWSA-N Gln-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N OPINTGHFESTVAX-BQBZGAKWSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical class [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- COYGBRTZEVWZBW-XKBZYTNZSA-N Gln-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(N)=O COYGBRTZEVWZBW-XKBZYTNZSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- WEAVZFWWIPIANL-SRVKXCTJSA-N Gln-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N WEAVZFWWIPIANL-SRVKXCTJSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- KFHASAPTUOASQN-JYJNAYRXSA-N Gln-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KFHASAPTUOASQN-JYJNAYRXSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- CVRUVYDNRPSKBM-QEJZJMRPSA-N Gln-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CVRUVYDNRPSKBM-QEJZJMRPSA-N 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- ZXLZWUQBRYGDNS-CIUDSAMLSA-N Glu-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXLZWUQBRYGDNS-CIUDSAMLSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- ZCFNZTVIDMLUQC-SXNHZJKMSA-N Glu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZCFNZTVIDMLUQC-SXNHZJKMSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 1
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 241000896246 Golovinomyces cichoracearum Species 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- UOAVQQRILDGZEN-SRVKXCTJSA-N His-Asp-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UOAVQQRILDGZEN-SRVKXCTJSA-N 0.000 description 1
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 1
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- CMQOGWZUKPHLHL-DCAQKATOSA-N His-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N CMQOGWZUKPHLHL-DCAQKATOSA-N 0.000 description 1
- CTCFZNBRZBNKAX-YUMQZZPRSA-N His-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CTCFZNBRZBNKAX-YUMQZZPRSA-N 0.000 description 1
- TXLQHACKRLWYCM-DCAQKATOSA-N His-Glu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O TXLQHACKRLWYCM-DCAQKATOSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- VTMLJMNQHKBPON-QWRGUYRKSA-N His-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 VTMLJMNQHKBPON-QWRGUYRKSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- CTGZVVQVIBSOBB-AVGNSLFASA-N His-His-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTGZVVQVIBSOBB-AVGNSLFASA-N 0.000 description 1
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 1
- QPSCMXDWVKWVOW-BZSNNMDCSA-N His-His-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QPSCMXDWVKWVOW-BZSNNMDCSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 1
- DPQIPEAHIYMUEJ-IHRRRGAJSA-N His-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N DPQIPEAHIYMUEJ-IHRRRGAJSA-N 0.000 description 1
- AYUOWUNWZGTNKB-ULQDDVLXSA-N His-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AYUOWUNWZGTNKB-ULQDDVLXSA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 1
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101000742054 Homo sapiens Protein phosphatase 1D Proteins 0.000 description 1
- 230000010740 Hormone Receptor Interactions Effects 0.000 description 1
- 241000549404 Hyaloperonospora parasitica Species 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 1
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 1
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- 206010021929 Infertility male Diseases 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 241000222058 Kabatiella Species 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 241000228457 Leptosphaeria maculans Species 0.000 description 1
- 241001198950 Leptosphaerulina trifolii Species 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- 241000234280 Liliaceae Species 0.000 description 1
- 241000215452 Lotus corniculatus Species 0.000 description 1
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- RDIILCRAWOSDOQ-CIUDSAMLSA-N Lys-Cys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RDIILCRAWOSDOQ-CIUDSAMLSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- CKSBRMUOQDNPKZ-SRVKXCTJSA-N Lys-Gln-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CKSBRMUOQDNPKZ-SRVKXCTJSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- BVRNWWHJYNPJDG-XIRDDKMYSA-N Lys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N BVRNWWHJYNPJDG-XIRDDKMYSA-N 0.000 description 1
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150050813 MPI gene Proteins 0.000 description 1
- 241000584607 Macrospora Species 0.000 description 1
- 241001598086 Magnaporthiopsis maydis Species 0.000 description 1
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 1
- 208000007466 Male Infertility Diseases 0.000 description 1
- 101000763602 Manilkara zapota Thaumatin-like protein 1 Proteins 0.000 description 1
- 101000763586 Manilkara zapota Thaumatin-like protein 1a Proteins 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 1
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 1
- HHCOOFPGNXKFGR-HJGDQZAQSA-N Met-Gln-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HHCOOFPGNXKFGR-HJGDQZAQSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 1
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 1
- YHBHDYYHOUAKLR-AVGNSLFASA-N Met-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YHBHDYYHOUAKLR-AVGNSLFASA-N 0.000 description 1
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 1
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 1
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 1
- LHXFNWBNRBWMNV-DCAQKATOSA-N Met-Ser-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LHXFNWBNRBWMNV-DCAQKATOSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- 241001022799 Microdochium sorghi Species 0.000 description 1
- 229920000881 Modified starch Polymers 0.000 description 1
- 241000700601 Moniliformis Species 0.000 description 1
- 101000966653 Musa acuminata Glucan endo-1,3-beta-glucosidase Proteins 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 241000131448 Mycosphaerella Species 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241001668536 Oculimacula yallundae Species 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 241000842783 Orna Species 0.000 description 1
- 241001147398 Ostrinia nubilalis Species 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 241000218222 Parasponia andersonii Species 0.000 description 1
- 241000787361 Parastagonospora avenae Species 0.000 description 1
- 241000736122 Parastagonospora nodorum Species 0.000 description 1
- 101710096342 Pathogenesis-related protein Proteins 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- 241000364057 Peoria Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000063951 Perconia Species 0.000 description 1
- 241000760719 Peronosclerospora maydis Species 0.000 description 1
- 241000760727 Peronosclerospora philippinensis Species 0.000 description 1
- 241001183114 Peronosclerospora sacchari Species 0.000 description 1
- 241001670203 Peronospora manshurica Species 0.000 description 1
- 241000342283 Peronospora trifoliorum Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 101000870887 Phaseolus vulgaris Glycine-rich cell wall structural protein 1.8 Proteins 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 1
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- CBENHWCORLVGEQ-HJOGWXRNSA-N Phe-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CBENHWCORLVGEQ-HJOGWXRNSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 1
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- OLZVAVSJEUAOHI-UNQGMJICSA-N Phe-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O OLZVAVSJEUAOHI-UNQGMJICSA-N 0.000 description 1
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 1
- 241001480007 Phomopsis Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 241001478707 Phyllosticta sojicola Species 0.000 description 1
- 241000471406 Physoderma maydis Species 0.000 description 1
- 241001246239 Physopella Species 0.000 description 1
- 241000233620 Phytophthora cryptogea Species 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 241000886313 Plenodomus lindquistii Species 0.000 description 1
- 229920000331 Polyhydroxybutyrate Polymers 0.000 description 1
- 241000710078 Potyvirus Species 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 1
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 1
- JRQCDSNPRNGWRG-AVGNSLFASA-N Pro-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2 JRQCDSNPRNGWRG-AVGNSLFASA-N 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- SHTKRJHDMNSKRM-ULQDDVLXSA-N Pro-Tyr-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O SHTKRJHDMNSKRM-ULQDDVLXSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- 208000037534 Progressive hemifacial atrophy Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102100038675 Protein phosphatase 1D Human genes 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 241001480435 Pseudopeziza medicaginis Species 0.000 description 1
- 241001304535 Puccinia purpurea Species 0.000 description 1
- 241001123583 Puccinia striiformis Species 0.000 description 1
- 241001192932 Pustula tragopogonis Species 0.000 description 1
- 241000190117 Pyrenophora tritici-repentis Species 0.000 description 1
- 241001622914 Pythium arrhenomanes Species 0.000 description 1
- 241001622911 Pythium graminicola Species 0.000 description 1
- 241001505297 Pythium irregulare Species 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 101150075111 ROLB gene Proteins 0.000 description 1
- 101150013395 ROLC gene Proteins 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241001183191 Sclerophthora macrospora Species 0.000 description 1
- 241001136641 Sclerotinia trifoliorum Species 0.000 description 1
- 241001597349 Septoria glycines Species 0.000 description 1
- 241000093892 Septoria helianthi Species 0.000 description 1
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 1
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- 241000266353 Setosphaeria pedicellata Species 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 241001250060 Sphacelotheca Species 0.000 description 1
- 241000893482 Sporisorium sorghi Species 0.000 description 1
- 108010039811 Starch synthase Proteins 0.000 description 1
- 101150086611 Ste gene Proteins 0.000 description 1
- 241000514831 Stemphylium botryosum Species 0.000 description 1
- 241000266365 Stemphylium vesicarium Species 0.000 description 1
- 241000116011 Stenocarpella macrospora Species 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 1
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 241000722093 Tilletia caries Species 0.000 description 1
- 241000167577 Tilletia indica Species 0.000 description 1
- 241000031845 Tilletia laevis Species 0.000 description 1
- 241000723792 Tobacco etch virus Species 0.000 description 1
- 241000218234 Trema tomentosa Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 1
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 1
- YLGQHMHKAASRGJ-WDSOQIARSA-N Trp-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YLGQHMHKAASRGJ-WDSOQIARSA-N 0.000 description 1
- LFGHEUIUSIRJAE-TUSQITKMSA-N Trp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N LFGHEUIUSIRJAE-TUSQITKMSA-N 0.000 description 1
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 1
- YTVJTXJTNRWJCR-JBACZVJFSA-N Trp-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N YTVJTXJTNRWJCR-JBACZVJFSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 1
- DXUVJJRTVACXSO-KKUMJFAQSA-N Tyr-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DXUVJJRTVACXSO-KKUMJFAQSA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- GZOCMHSZGGJBCX-ULQDDVLXSA-N Tyr-Lys-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O GZOCMHSZGGJBCX-ULQDDVLXSA-N 0.000 description 1
- KYPMKDGKAYQCHO-RYUDHWBXSA-N Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 1
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 1
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 1
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 1
- 241000965658 Uromyces striatus Species 0.000 description 1
- 241000221566 Ustilago Species 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- 101710110937 Vegetative protein Proteins 0.000 description 1
- 241001123669 Verticillium albo-atrum Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- 241001360088 Zymoseptoria tritici Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 108091000039 acetoacetyl-CoA reductase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000729 antidote Substances 0.000 description 1
- 229940075522 antidotes Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 230000000680 avirulence Effects 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 229920000704 biodegradable plastic Polymers 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 239000010974 bronze Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000009470 controlled atmosphere packaging Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000001804 debridement Methods 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 230000035613 defoliation Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000003831 deregulation Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 235000005489 dwarf bean Nutrition 0.000 description 1
- 230000010318 early mammalian development Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 230000034964 establishment of cell polarity Effects 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 239000003008 fumonisin Substances 0.000 description 1
- 244000000004 fungal plant pathogen Species 0.000 description 1
- 230000000855 fungicidal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006882 induction of apoptosis Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 230000016507 interphase Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- -1 ion ion Chemical class 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 230000000974 larvacidal effect Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 235000019426 modified starch Nutrition 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 238000012017 passive hemagglutination assay Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 239000002985 plastic film Substances 0.000 description 1
- 229920006255 plastic film Polymers 0.000 description 1
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 description 1
- 239000005015 poly(hydroxybutyrate) Substances 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 108010007513 prolyl-glycyl-prolyl-leucine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000009979 protective mechanism Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 108010050873 prunasin hydrolase Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 231100000241 scar Toxicity 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000009958 sewing Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000004577 thatch Substances 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
- A01H1/045—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/46—Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
- A01H6/4684—Zea mays [maize]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8282—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for fungal resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/172—Haplotypes
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Botany (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Physiology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Pretreatment Of Seeds And Plants (AREA)
Abstract
A presente invenção refere-se a seqfiências de polinucleotídeos que codificam um gene, o qual confere resistência ao patógeno de planta Colletotrichum, o qual causa podridão de caule por antracnose, ressecamento de folha e doença nas pontas em milho e outros cereais. A invenção refere-se ainda a plantas e sementes contendo genes quiméricos que compreendem as referidas seqüências de polinucleotídeos, as quais aumentam ou conferem resistência ao patógeno de planta Colletotrichum, e a processos de produção das referidas plantas e sementes. A invenção refere-se ainda a seqüências que podem ser usadas como marcadores moleculares, os quais são úteis na identificação da região de interesse em linhagens de milho, resultantes de novas cruzas e que podem rápida e eficazmente introgredir o gene de linhagens de milho contendo o referido gene em outras linhagens de milho que não contêm o referido gene, de modo a torná-las resistentes ao Colletotrichum e resistentes à podridão de caule.
Description
POLINUCLEOTÍDEOS E PROCESSOS DE PRODUÇÃO DE PLANTASRESISTENTES A PATOGENOS DE FUNGOS
CAMPO DA INVENÇÃO
Esta invenção se refere às composições e métodosutilizáveis na criação ou aperfeiçoamento de resistência apatógeno em plantas. Adicionalmente, a invenção refere-se aplantas que tenham sido geneticamente engenheiradas com ascomposições da invenção.
FUNDAMENTOS DA INVENÇÃO
Colletotrichum graminicola (Ces) (Cg), mais comumenteconhecido como antracnose, é o agente causador da queimadas folhas por antracnose, podridão de colmo por antracnose(ASR) e morte descendente que afeta Zea mays (L.), tambémconhecida como milho {maize ou com) . É a única podridão decolmo comum conhecida que também causa uma queima dasfolhas (Bergstrom, et al. , (1999), Plant Disease, 83:596-608, White, D.G. (1998), Compendium of Com Diseases, pp.1-78). Sabe-se que ela ocorre nos Estados Unidos desde 1855e ela tem sido relatada nas Américas, Europa, África, Ásiae Austrália (McGee, D.C. (1988), Maize Diseases: AReference Source for Seed Technologists, APS Press, St.Paul, MN; White, (1998) acima mencionado; White, et al.,(1979) Proc. Annu. Com Sorghum Res Conf (34th) , 1-15).Somente nos Estados Unidos, mais de 37,5 milhões de acressão infestados anualmente com perdas médias de produção de6,6% em todo o Pais (ver Figura 1) . As perdas de produçãosão devidas tanto ao baixo peso de grão em plantasinfectadas como ao acamamento, ou seja, a murcha dasplantas devida à fraqueza nos colmos causada pela infecção(Dodd, J., (1980), Plant Disease, 64:533-537). As plantasacamadas são mais difíceis de colher e são susceptíveis aoutras doenças. Tipicamente após a infecção, a partesuperior do colmo morre primeiramente enquanto o colmo maisbaixo ainda está verde. Externamente, a infecção pode serreconhecida por placas manchadas de preto no anel maisexterno do colmo, enquanto internamente o tecido da medulada planta fica com aparência descolorida ou preta. Ainoculação ocorre por inúmeras maneiras. As raizes podemcrescer através dos fragmentos do colmo e se tornareminfectadas. Isso se torna um problema crescente na medidaem que os métodos de agricultura de plantio direto são maisamplamente adotados devido aos seus benefícios ambientais.O fungo pode também infectar os colmos através de dano porinseto e outras feridas (ver White (1998) acima). Ainfecção do colmo pode ser precedida pela infecção da folhaque causa a queima da folha e prove o inóculo para ainfecção do colmo. Há controvérsia na literatura técnicacom referência ao número de diferentes variedades ou raçasde Cg presentes na natureza. O patógeno é transmitido pelovento ou por lotes de semente contaminada. Os esporospermanecem viáveis por até 2 anos (ver McGee (1988) acimamencionado; Nicholson, et al., (1980), Phytopathology,70:255-261; Warren, H.L. (1977), Phytopathology, 67:160-162; Warren, et al., (1975), Phytopathology, 65:620-623).Os agricultores podem combater a infecção por doençasfúngicas de milho, tal como a antracnose, através do uso defungicidas, mas estes apresentam efeitos ambientaisadversos e requerem o monitoramento de campos e técnicas dediagnóstico para determinar qual o fungo que está cusando ainfecção de modo que o fungicida correto possa ser usado.Particularmente, para lavouras em campos amplos, tal como ado milho, isto é dificil. O uso de linhagens que portamfontes genéticas ou transgênicas de resistência é maisprática se os genes responsáveis pela resistência puderemser incorporados em um germoplasma elite de altaprodutividade sem reduzir a produção. As fontes genéticasde resistência a Cg têm sido relatadas. Foram identificadasdiversas linhagens de milho que portam algum nivel deresistência a Cg (ver White et al. (1979) acima). Estasincluem A556, MP305, H21, SP288, CI88A e FR16. Uma análisedo tipo testcross de translocação reciproca usando a A556indicou que os genes que controlam a resistência comrelação à posição ASR estão nos longos ramos doscromossomos 1, 4 e 8, assim como em ambos os ramos docromossomo 6 (Carson, M.L. (1981), Sources of inheritanceof resistance to anthracnose stalk rot of com. Ph.D.Thesis, University of Illinois, Urbana-Champaign). Aintrogressão de resistência derivada de tais linhagens écomplexa. Foi relatado que uma outra endogâmica, a LB31,porta um único gene dominante que controla a resistênciarelativa a ASR, mas parece ser instável, especialmente napresença de infestação de broca de milho Europeu (Badu-Apraku et al., (1987) Phytopathology 11 : 957-959). Foiverificado que a linhagen MP305 porta dois genes dominantespara resistência, um com um efeito maior e um com efeitomenor (Carson (1981) acima). A MP305 foi tornada disponívelpel Universidade do Mississipe através do Sistema Nacionalde Germoplasma de Planta (GRIN ID: NSL 250298) operado peloDepartamento de Agricultura dos Estados Unidos. VerCompilação de Germoplasma de Melhoramento de Milho NorteAmericano, J.T. Gerdes et al., Crop Science Society ofAmerica, 1993. A semente de MP305 pode ser obtida atravésde Paul Williams, Geneticista Supervisor de Pesquisa USDA-ARS, "Corn Host Plant Resistance Research Unit", Box 9555,340 Dorman Hall, Mississippi State, MS 39762.
Foi relatado que há dois genes ligados no ramo longodo cromossomo 4 que confere resistência a Cg (Toman, etal., (1993), Phytopathology, 83: 981-986; Cowen, N et al.(1991) Maize Genetics Conference Abstracts 33). Foi tambémrelatada a existência de um lócus de caractere quantitativo(QTL) de significativa resistência no cromossomo 4 (Jung,et al., (1994), Theoretical and Applied Genetics, 89:413-418). Jung et al. (acima) relatou que o UMC15 pode serusado para selecionar o QTL no cromossomo 4 na MP305 esugeriu que o QTL está em uma região 12cM do cromossomo 4entre o UMC15 e o UMC66. De fato, como discutido em maioresdetalhes mais adiante, a região entre o UMC15 e o UMC66,como relatado no mapa genético neighbors 4 IBM2, é deaproximadamente 129 cM, e a seleção com relação ao QTL, namaneira sugerida por Jung et al. (1994, acima), seria, namelhor das hipóteses, selecionar um grande intervalocromossômico com considerável arraste de ligação e efeitofenotipico negativo, e, na pior das hipóteses, umarecombinação dupla poderia ocorrer entre os dois marcadoresresultando em uma seleção falso positiva para o lócus deRegi.
Muito trabalho tem sido feito no mecanismo deresistência à doença em plantas em geral. Alguns mecanismosde resistência são não-patogênicos específicos pornatureza, ou a chamada "resistência de não-hospedeiro".Esses podem estar baseados na estrutura da parede celularou mecanismos de proteção similares. Entretanto, apesar deem algumas plantas estar ausente um sistema imunológico comanticorpos circulantes e os outros atributos de um sistemaimunológico de mamífero, elas possuem outros mecanismospara se proteger especificamente contra patógenos. O maisimportante e mais estudado desses mecanismos é o dos genesde resistência da planta a doenças, ou genes "R". Uma dasmuitas revisões deste mecanismo de resistência e os genes Rpode ser encontrada em Bekhadir et al., (2004), CurrentOpinion in Plant Biology 7:391-399. Há cinco classesconhecidas de genes R: proteínas intracelulares com umsitio de ligação a nucleotideo (NBS) e uma repetição ricaem leucina (LRR); proteínas transmembrana com um domínioextracelular LRR (TM-LRR); LRR transmembrana e extracelularcom um domínio quinase citoplásmica (TM-CK-LRR) ; proteínasustentada no sinal de membrana com um dominio citoplásmicoespiral-espiralada (MSAP-CC); e quinases associadas amembrana com um sitio de miristilação N-terminal (MAK-N)(ver, por exemplo: Cohn, et al., (2001), Immunology, 13:55-62; Dangl, et al. (2001), Nature, 411:826-833).
O gene de resistência das concretizações da presenteinvenção codifica um novo gene R relacionado ao tipo NBS-LRR. Apesar de múltiplos genes NBS-LRR terem sidodescritos, eles diferem amplamente em sua resposta adiferentes patógenos e ação exata. No conhecimento doDepositante, o novo gene R aqui descrito é o único quecomprovadamente prove resistência a Cg.
SUMÁRIO DA INVENÇÃO
As concretizações desta invenção estão baseadas nomapeamento refinado, clonagem e caracterização do generesponsável pela maior porção do fenótipo de resistência apartir da linhagem MP305, na introgressão de um intervalocromossômico truncado com o lócus de resistência de MP305em outras linhagens com pouco ou nenhum arraste de genes,na demonstração do uso daquele gene como um transgene e nouso de marcadores moleculares para mover o gene ou otransgene para dentro das linhagens elite usando técnicasde melhoramento.
As concretizações incluem um polinucleotídeo isoladocompreendendo uma seqüência de nucleotideos codificante deum polipeptideo capaz de conferir resistência aColletotrichum, sendo que o polipeptideo possui umaseqüência de aminoácidos de pelo menos 50%, pelo menos 75%,pelo menos 80%, pelo menos 85%, pelo menos 90%, e pelomenos 95% de identidade, quando comparada com a SEQ ID No:3ou as seqüências depositadas junto à Agricultural ResearchService (ARS) Culture Collection em 22 de fevereiro de2006, como Depósito de Patente No. NRRL B-30895, com baseno algoritmo de alinhamento de Needleman-Wunsch, ou umcomplemento da seqüência de nucleotideos, sendo que ocomplemento e a seqüência de nucleotideos são compostos domesmo número de nucleotideos e são 100% complementares.
Concretizações adicionais da presente invenção incluemum vetor compreendendo o polinucleotideo de umaconcretização da presente invenção, tal como a SEQ ID No:3,ou as seqüências do plasmidio depositado como Depósito dePatente No. NRRL-30895, e um constructo de DNA recombinantecompreendendo o polinucleotideo de uma concretização dapresente invenção operacionalmente ligado a pelo menos umaseqüência de regulação. Uma célula de planta, bem como umaplanta, cada uma compreendendo o constructo de DNArecombinante de uma concretização da presente invenção, euma semente compreendendo o constructo de DNA recombinanteque também são concretizados pela presente invenção.
Os métodos concretizados pela presente invençãoincluem: (1) um método para transformar uma célulahospedeira, incluindo uma célula de planta, compreendendo atransformação da célula hospedeira com o polinucleotideo deuma concretização da presente invenção e regeneração de umaplanta a partir da célula de planta transformada, e (3)métodos para conferir ou melhorar a resistência aColletotrichum e/ou podridão do colmo, compreendendo atransformação de uma planta com o constructo de DNArecorabinante de uma concretização da presente invenção,conferindo e/ou melhorando, por esse meio, a resistência aColletotrichum ou à podridão do colmo.
Concretizações adicionais incluem métodos dedeterminação da presença ou ausência dos polinucleotideosde uma concretização da presente invenção, ou o lócus doRegi, em uma planta de milho, compreendendo pelo menos umdentre: (a) isolar moléculas de ácido nucléico a partir daplanta de milho e determinar se um gene Regi está presenteou ausente pela amplificação de seqüências homólogas aopolinucleotideo, (b) isolar moléculas de ácido nucléico apartir da planta de milho e realizar uma hibridizaçãoSouthern, (c) isolar proteínas a partir da planta de milhoe realizar um western blot usando anticorpos para aproteína Regi, (d) isolar proteínas a partir da planta demilho e realizar um ensaio ELISA usando anticorpos para aproteína Regi, ou (e) demonstrar a presença de seqüênciasde mRNA derivadas do transcripto de mRNA de Regi e únicopara o Regi, determinando, por esse meio a presença dopolinucleotideo ou do lócus de Regi na planta de milho.
Também são concretizados pela presente invenção osmétodos para alterar o nivel de expressão de uma proteínacapaz de conferir resistência a Colletotrichum ou àpodridão do colmo em uma planta ou célula de plantacompreendendo: (a) transformar uma célula de planta com oconstructo de DNA recombinante de uma concretização dapresente invenção e (b) deixar crescer a célula de plantatransformada sob condições que são apropriadas paraexpressão do constructo de DNA recombinante, sendo que aexpressão do constructo de DNA recombinante resulta naprodução de níveis alterados de uma proteína capaz deconferir resistência a Colletotrichum ou à podridão docolmo no hospedeiro transformado.
Um método adicional concretizado pela presenteinvenção é um método para conferir ou melhorar aresistência a Colletotrichum e/ou podridão do colmo em umaplanta de milho, compreendendo: (a) cruzar uma primeiraplanta de milho em que está ausente o lócus de Regi com umasegunda planta de milho contendo o lócus de Regi paraproduzir uma população segregante, (b) realizar o screeningda população segregante com relação a um membro contendo olócus de Regi com um primeiro ácido nucléico, não incluindoo UMC15a ou o UMC66, capaz de hibridizar com um segundoácido nucléico ligado a ou localizado dentro do lócus deRegi, e (c) selecionar um membro para posterior cruzamentoe seleção.
São também concretizações da presente invenção osmétodos para melhorar a resistência a Colletotrichum e/oupodridão do colmo, ou para fazer a introgressão deresistência a Colletotrichum e/ou podridão do colmo em umaplanta de milho, compreendendo a realização da seleçãoassistida por marcador da planta de milho com um marcadorde ácido nucléico, sendo que o marcador de ácido nucléicoespecificamente hibridiza com uma molécula de ácidonucléico tendo uma primeira seqüência de ácido nucléico queestá ligada a uma segunda seqüência de ácido nucléico queestá localizada no lócus de Regi da MP305 e selecionar aplanta de milho com base na seleção assistida por marcador.Os marcadores específicos FLP, MZA e o SNP especifico deRegi aqui revelados são aspectos adicionais da invenção.
As concretizações adicionais são: uma fonte doadoraaperfeiçoada de germoplasma para realizar a introgressão deresistência ou melhorar a resistência a Colletotrichum ou àpodridão do colmo em uma planta de milho, dito germoplasmacompreendendo a DE811ASR (BC5) e progênie derivada damesma. A dita progênie pode ser ainda caracterizada comocontendo as seqüências de Regi da DE811ASR (BC5) aquireveladas, os marcadores moleculares em ou geneticamenteligados ao Regi, resistência ou resistência aperfeiçoada aColletotrichum ou quaisquer combinações das mesmas.
As concretizações adicionais incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção dos alelos de pelo menos 2 marcadores na planta demilho, sendo que pelo menos um dos marcadores está em oudentro do intervalo cromossômico abaixo do UMC2041 e acimado gene Regi, e pelo menos um dos marcadores está em oudentro do intervalo abaixo do gene Regi e acima do UMC2200.
As concretizações adicionais incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção de alelos de pelo menos 2 marcadores na planta demilho, sendo que pelo menos um dos marcadores está em oudentro do intervalo cromossômico abaixo do UMC2041 e acimado gene Regi, e pelo menos um dos marcadores está em oudentro do intervalo abaixo do gene Regi e acima do UMC2200.Concretizações semelhantes englobadas por este processoincluem pelo menos um dos marcadores estando em ou dentrodo intervalo cromossômico abaixo do UMC1086 e acima do geneRegi, em ou dentro do intervalo cromossômico abaixo doUMC2285 e acima do gene Regi, e pelo menos um dosmarcadores está em ou dentro do intervalo abaixo do geneRegi e acima do UMC2200, em ou dentro do intervalo abaixodo gene Regi e acima do UMC2187, ou em ou dentro dointervalo abaixo do gene Regi e acima do UMC15a.Concretizações adicionais relacionadas ao mesmo processoincluem aquelas em que pelo menos um dos marcadores é capazde detectar um polimorfismo localizado em uma posiçãocorrespondente aos nucleotideos 7230 e 7535 da SEQ ID No:137, nucleotideos 11293 e 12553 da SEQ ID No: 173,nucleotideos 25412 e 29086 da SEQ ID No: 137, ounucleotideos 43017 e 50330 da SEQ ID No: 137.Concretizações adicionais incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção de alelos de pelo menos 2 marcadores na planta demilho, sendo que pelo menos um dos marcadores em ou dentrodo intervalo cromossômico abaixo do UMC2041 e acima do geneRegi é selecionado dos marcadores listados na Tabela 16, epelo menos um dos marcadores em ou dentro do intervaloabaixo do gene Regi e acima do UMC2200 é também selecionadodos marcadores listados na Tabela 16. As concretizaçõesincluem processos para identificar plantas de milho queapresentam resistência recentemente conferida ou melhoradaa Colletotrichum pela seleção de pelo menos quatromarcadores ou pelo menos seis, sendo que pelo menos dois outrês dos marcadores estão em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, e pelomenos dois ou três dos marcadores estão em ou dentro dointervalo abaixo do gene Regi e acima do ÜMC2200.Concretizações adicionais incluem este mesmo processoquando os dois ou três marcadores em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, bemcomo os dois ou três marcadores em ou dentro do intervaloabaixo do gene Regi e acima do UMC2200, são selecionadosdaqueles listados na Tabela 16. Uma outra concretizaçãodeste processo inclui a detecção do alelo 7 no MZA1112,detecção do alelo 2 no MZA2591, ou detecção do alelo 8 noMZA3434. As plantas e sementes de milho produzidas pelosprocessos concretizados são também concretizações dainvenção, incluindo aquelas plantas de milho que nãocompreendem alelos iguais aos da MP305 em ou acima doUMC2041, ou em ou abaixo do UMC2200 nos lócus mostrados naTabela 16.
Outras concretizações incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção de alelos de pelo menos dois marcadores na plantade milho, sendo que pelo menos um dos marcadores está em oudentro do intervalo cromossômico abaixo do UMC2041 e acimado gene Regi, e pelo menos um dos marcadores está em oudentro do intervalo abaixo do gene Regi e acima do UMC2200,e quando o processo detecta a presença ou ausência de pelomenos um marcador localizado dentro do gene Regi. Talconcretização adicional inclui uma modificação desteprocesso na qual quatro marcadores são selecionados, em quedois dos marcadores estão dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos doisdos marcadores estão dentro do intervalo abaixo do geneRegi e acima do UMC15a. Uma concretização adicional desteprocesso inclui o gene Regi que tenha sido introgredido apartir de uma planta de milho doadora, incluindo a MP305 oua DE811ASR(BC5), em uma planta de milho receptora paraproduzir uma planta de milho introgredida. Este processotambém inclui a possibilidade de quando a planta de milhointrogredida for selecionada para um evento de recombinaçãoabaixo do gene Regi e acima do UMClõa, de modo que a plantade milho introgredida retenha o primeiro intervalocromossômico derivado da MP305 abaixo do gene Regi e acimado UMC15a, e não retenha um segundo intervalo cromossômicoderivado da MP305 em ou abaixo do UMC15a. As plantas esementes de milho produzidas por esses processos são tambémconcretizações da invenção. As plantas de milhointrogredidas concretizadas pela invenção incluem aquelasque são conversões de lócus de Regi de PH705, PH5W4, PH51Kou PH87P, ou progênie das mesmas.
Uma concretização adicional da invenção é um processode identificação de uma planta de milho que apresentaresistência melhorada a infecção por Colletotrichum, peladetecção, na planta de milho, da presença ou ausência depelo menos um marcador no lócus do Regi, e seleção daplanta de milho na qual pelo menos um marcador estápresente. As concretizações incluem aquelas quando pelomenos um marcador está em ou dentro da SEQ ID No: 137, etambém quando o pelo menos um marcador é capaz de detectarum polimorfismo localizado em uma posição na SEQ ID No:137correspondente . à posição entre os nucleotideos 1 e 536,entre os nucleotideos 7230 e 7535, entre os nucleotideos11293 e 12553, entre os nucleotideos 25412 e 29086; e entreos nucleotideos 43017 e 50330, e também quando pelo menosum marcador está em ou dentro da seqüência codificante deRegi, ou localizado em ou dentro do polinucleotideoapresentado na SEQ ID NO: 1. Uma outra concretização incluiaquela quando o processo detecta um único polimorfismo denucleotideo em uma posição na SEQ ID No:l correspondente auma ou mais das posições 413, 958, 971, 1099, 1154, 1235,1250, 1308, 1607, 2001, 2598, e 3342. Os marcadoresincluídos pelos processos dessas concretizações incluem osmarcadores de SNP C00060-01 e C00060-02, marcadores quedetectam uma seqüência de mRNA derivada do transcripto demRNA do Regi e única para Regi, e marcadores de FLP em umamplicon gerado por um par de primers apresentado nestadescrição, tais como aqueles das SEQ ID Nos: 35-42, e seuscomplementos. Uma outra concretização inclui aquela quandoo processo detecta a presença ou ausência de pelo menosdois marcadores dentro do lócus de Regi, incluindo oC00060-01 e o C00060-02. As plantas e sementes de milhoproduzidas por esses processos são também concretizações dainvenção. Plantas de milho introgredidas concretizadas pelainvenção incluem aquelas que são conversões do lócus deRegi da PH705, PH5W4, PH51K ou PH87P, ou progênie dasmesmas. Tais concretizações incluem semente de milhocompreendendo um primeiro intervalo cromossômico derivadoda MP305 definido por BNLG2162 e UMC1051, e nãocompreendendo um segundo intervalo cromossômico derivado daMP305 acima do UMC2041 ou abaixo do UMC1051, e quando asemente de milho compreende o gene de Regi e, quandocrescida, produz uma planta de milho que apresentaresistência à infecção por Colletotrichum. Sementes dasconcretizações também incluem semente de milhocompreendendo um primeiro intervalo cromossômico derivadoda MP305 entre, mas não incluindo, o UMC2285 e o UMC15a, enão compreendendo um segundo intervalo cromossômicoderivado da MP305 em ou acima do UMC2285 ou em ou abaixo doUMC15a, e, além disso, tal semente de milho que compreendeo gene Regi e, quando crescida, produz uma planta de milhoque apresenta resistência à infecção por Colletotrichum. Asplantas e células de planta de milho oriundas desta sementeestão também incluídas nas concretizações da invenção.
Concretizações adicionais incluem semente de umavariedade de milho designada DE811ASR(BC5) , ou a semente demilho depositada como número de acesso ATCC PTA-7434, ouuma semente de progênie derivada a partir daquelavariedade, que compreende o gene Regi, que quando crescida,produz uma planta que apresenta resistência melhorada ourecentemente conferida a infecção por Colletotrichum. Asplantas e células de planta crescidas a partir destasemente são também concretizações, assim como a semente daprogênie que retém um primeiro intervalo cromossômicoderivado da MP305 ou da DE811ASR(BC5) dentro, mas nãoincluindo, o UMC2285 e o UMC15a, e a semente da progênieque não compreende um segundo intervalo cromossômico daMP305 em ou acima do UMC2285 ou em ou abaixo do UMC15a. Asplantas e células de planta da semente acima estãoincluídas como concretizações. A semente da progênie que éuma conversão do lócus de Regi da PH705, PH5W4, PH51K ouPH87P, ou uma progênie das mesmas é também concretizada nainvenção, assim como o são as sementes da progênie quecompreendem pelo menos dois ou mais dos alelos 7 naMZA11123, alelo 2 na MZA2591, ou alelo 8 na MZA3434. Asconcretizações adicionais incluem a semente da progênie quecompreende um nucleotídeo citosina na MZA2591.32, umnucleotideo timina na MZA2591.35, e um nucleotideo citosinana MZA3434.17.Concretizações adicionais incluem um sistema decomputador para identificar uma planta de milho queapresenta resistência recentemente conferida ou melhorada ainfecção por Colletotrichum compreendendo uma base de dadosque compreende uma informação de escore de alelo para umaou mais plantas de milho com relação a quatro ou mais lócusde marcador que estão proximamente ligados a ou dentro dolócus de Regi, e instruções que examinam a dita base dedados para determinar a herança do intervalo cromossômicoou porções do mesmo definido para quatro ou mais lócus demarcador e computar se sim ou se não uma ou mais plantas demilho compreende o gene Regi. Concretizações adicionaisincluem um sistema de computador para identificar umaplanta de milho que apresenta resistência recentementeconferida ou melhorada para infecção por Colletotrichumcompreendendo uma base de dados que compreende informaçãode escore de alelos para uma ou mais plantas de milho comrelação a um ou mais lócus de marcador dentro do lócus deRegi, e instruções que examinam dita base de dados paradeterminar a herança do lócus de Regi. A informação deescore de alelos para uma ou mais plantas de milho paratais sistemas de computador podem adicionalmentecompreender dois, três, ou mais lócus de marcador dentro dolócus de Regi.
As concretizações também incluem marcadores em oudentro das SEQ ID Nos: 140 até 146 para a MZA3434, MZA2591,MZA11123, MZA15842, MZA1851, MZA8761 e MZA11455,respectivamente. Outras concretizações incluem marcadoresgenéticos localizados em ou no lócus de Regi ou no geneRegi, incluindo aquelas localizadas na SEQ ID No: 137, porexemplo, aquelas localizadas nas regiões correspondentesaos nucleotideos entre 1 e 536, entre 7230 e 7535, entre11293 e 12553, entre 25412 e 29086, e a região entre osnucleotideos 43017 e 50330. Os marcadores concretizadostambém incluem aqueles localizados na SEQ ID No: 1, taiscomo aqueles localizados em ou dentro das posições denucleotideos 550-658 da SEQ ID No: 1, ou aquelaslocalizadas em ou dentro das posições de nucleotideos 1562-1767 da SEQ ID No: 1. Os marcadores das concretizaçõesincluem aqueles marcadores localizados nos ampliconsgerados por um par de primers, sendo que o primeiro primeré uma seqüência de número impar oriunda da SEQ ID No: 23até 41, e sendo que o segundo primer é uma seqüência denúmero par oriunda da SEQ ID No: 24 até 42.
Concretizações adicionais incluem plantas de milhoobteniveis por um método compreendendo: cruzamento da MP305ou DE811ASR(BC5) [No. de Depósito PTO-7434] como umaprimeira planta parental, com uma planta diferente na qualestá ausente um lócus de Regi, como uma segunda plantaparental, para obter, por esse meio, a progêniecompreendendo o lócus de Regi da primeira parental; eopcionalmente, ainda, compreendendo uma ou mais etapasadicionais de melhoramento para obter a progênie de uma oumais gerações posteriores que compreendem o lócus de Regida primeira parental. Tais plantas de milho concretizadasincluem ambas as plantas endogâmicas e híbridas. Assementes de tais plantas, incluindo aquelas que sãohomozigotas e heterozigotas com relação ao lócus de Regi, esão concretizados pela invenção os métodos de obtenção deprodutos de milho resultante do processamento daquelassementes. É também uma concretização da invenção o uso detal semente em alimento ou ração ou na produção de umproduto de milho, tais como farinha de milho, cereal demilho e óleo de milho.
BREVE DESCRIÇÃO DOS DESENHOS
A Figura 1 é o mapa dos Estados Unidos mostrando agravidade de infestação pela podridão do colmo porantracnose por município, em 2002.
A Figura 2 (a, b, c) é um alinhamento de uma seqüênciade polipeptídeo das concretizações (SEQ ID No: 3)comparando-a com outros polipeptídeos NBS-LRR conhecidos.
A Figura 3 é um gráfico produzido pelo softwareWindows QTL Cartographer mostrando uma análise estatísticada chance (eixo dos Y) de que o lócus responsável pelofenótipo de resistência a Cg esteja localizado em umaposição particular ao longo do cromossomo (eixo dos X) comodefinido pelos marcadores de FLP.
A Figura 4 é um blot de gel de eletroforese dealíquotas de reações de RT-PCR que revelam a presença deuma banda de 260 pb presente nas amostras derivada de ambasas plantas resistentes, a infectada e a não-infectada, masausente para as amostras susceptíveis. Os fragmentos de RT-PCR foram obtidos a partir de 12,5 ng de RNA total oriundodo tecido de colmo da DE811 e da DE811ASR. O cDNA obtidopor transcrição reversa foi amplificado usando primersespecíficos de Regi e primers de rRNA 18S como um padrãointerno.
A Figura 5 é um diagrama esquemático da estratégia demarcação com Mu (Mu-tagging) usada para validar o geneRegi.
A Figura 6 é a estrutura do Regi mostrando alocalização de quatro diferentes sitios de inserção domutator.
A Figura 7 (a-b) é uma série de imagens de mapagenético com resolução aumentada do mapa da região próximaao gene Regi. As distâncias no mapa para 7 (a) no mapaassinalado "A" estão em cM e em relação ao mapa genético 4Neighbors IBM2. As distâncias no mapa para 7 (b) no mapaassinalado "B" foram desenvolvidas usando 184 indivíduosoriundos da população BC7, e as distâncias no mapa para7 (b) no mapa assinalado "C" foram desenvolvidas usando 1060indivíduos oriundos da população BC7. O mapeamento genéticona população BC7 aumentou a resolução do mapa mais do que10 vezes, quando comparado com o mapa publicado. Alocalização dos marcadores mostrada à direita de cada mapaé baseada na extrapolação de sua localização no mapafísico.
A Figura 8(a-b) é uma imagem do mapa genéticomostrando o intervalo cromossômico com o gene Regi emDE811ASR (BC3), o tamanho reduzido do intervalocromossômico com o gene Regi obtido em DE811ASR (BC5) e oadicional tamanho reduzido do intervalo cromossômico emendogâmicas obtido por meio do uso, inicialmente, daDE811ASR (BC5) como a fonte doadora. Para todos osmarcadores, as distâncias do mapa mostradas foram relatadasno mapa neighbors IBM2 disponível publicamente no GDB demilho, separadamente para a MZA15842, FLP27 e FLP56 para asquais as posições no mapa foram extrapoladas usando aanálise de regressão relativa aos mapas de alta resoluçãona Figura 7 (b) , para os mapas B e C, usando as posições deUMC2285, PHI093 e CSU166a as quais foram comuns em ambos osmapas .
A Figura 9 (a-b) mostra em: (a) o alinhamento daregião não-colinear oriunda de DE811ASR (BC5) com relação aB73 e a Mol7. Os tamanhos do BAC na Figura 9 (a) sãoestimativos; (b) uma porção da região não-colinear comoapresentada na SEQ ID No: 137 na qual reside o Regi,incluindo as regiões repetitivas situadas nele, assim comoos exons 1 e 2 de Regi.
A Figura 10 (a-b) mostra as distribuições de tamanhomédio de lesão de folha em diferentes plantas individuaisem 15 dias após a inoculação com Cg nas linhagensDE811ASR(BC5) e DE811, respectivamente.
A Figura 11 mostra uma comparação de tamanho médio delesão de folha em plantas de DE811 e DE811ASR(BC5)infectadas com Cg nos dias 7 e 15 após a inoculação.
A Figura 12 mostra a gravidade média da doença quatroa cinco semanas após a inoculação com Cg em colmos dehíbridos derivados do cruzamento de DE811ASR(BC5) e DE811para a linhagem indicada.
A Figura 13 mostra o aperfeiçoamento da produtividadena maturidade após a inoculação com Cg em híbridosderivados do cruzamento de DE811ASR(BC5) para a linhagemindicada, em comparação com a produtividade de híbridosderivados do cruzamento de DE811 para a linhagem indicada.
A Figura 14 mostra a gravidade da doença em 5diferentes localidades causada por Cg em colmos delinhagens endogâmicas derivadas de DE811ASR(BC5) ou deMP305, quatro a cinco semanas após a inoculação. Asdiferenças entre as linhagens que foram positivas enegativas com relação ao gene Regi são estatisticamentesignificativas em um valor de P de menos que 0,05.
A figura 15 mostra a progressão da doença em colmosrepresentativos oriundos de linhagens PH705 endogâmicas quesão positivas e negativas com relação a Regi.A Figura 16 mostra a progressão da doença em colmosrepresentativos oriundos de linhagens PH87P endogâmicas quesão positivas e negativas com relação a Regi.
A Figura 17 mostra a gravidade da doença quatro acinco semanas após a inoculação em 5 diferentes localidadescausada por Cg em colmos de hibridos derivados docruzamento de DE811ASR(BC5) para a linhagem indicada. Asdiferenças entre as linhagens que são positivas e negativascom relação ao gene Regi são estatisticamentesignificativas em um valor P de menos que 0,05, exceto paraa localidade 5.
A Figura 18 mostra a progressão da doença em colmosrepresentativos oriundos de hibridos criados a partir daslinhagens PH4CV e PH705 que são positivas e negativas comrelação a Regi.
A Figura 19 mostra a progressão da doença em colmosrepresentativos oriundos de hibridos criados a partir daslinhagens PH705 e PH87P que são positivas e negativas comrelação a Regi.
A Figura 20 mostra o método de contagem de escore paraa gravidade da doença em colmos de milho. Aos colmos é dadoum escore, designado antgr75, que representa o número deinternódulos (até 5, incluindo o internódulo inoculado) queestão mais que 75% descoloridos. Estes resultados em umescore variando de 0 a 5, sendo que 0 indica menos que 75%de descoloração no internódulo inoculado, e 5 indica 75% oumais de descoloração dos primeiros cinco internódulos,incluindo o internódulo inoculado.
A Figura 21 mostra um contig no mapa fisico de B73 queé homólogo à região no interior da qual é inserida aDE811ASR (BC5) contendo a região não-colinear de Regi, oque demonstra que muitas .B73 derivadas de cromossomosartificiais bacterianos (BACs) estão disponíveis na regiãode interesse a partir da qual a informação de seqüênciapode ser obtida.
A Figura 22 mostra o alinhamento do mapa genéticocontendo os marcadores MZA e público com os mapas fisicosde Mol7 e B73. As distâncias de mapa genético foramdesenvolvidas pela utilização de 1060 indivíduos a partirda população de mapeamento BC7. Uma análise de umabiblioteca BAC de Mol7 também mostrou o lócus de Regi comosendo não-colinear com a correspondente região de Mol7. Alocalização dos marcadores mostrada por linhas pontilhadascom relação ao mapa de B73 são extrapolações a partir dalocalização no mapa fisico de Mol7. A localização dosmarcadores mostrada pelas linhas pontilhadas com relação aomapa de Mol7 são extrapolações da localização no mapafisico de B73.A Figura 23 mostra os oligos para os marcadores dehibridização de Regi desenhado para uso com reaçõesInvader™.
A Figura 24 mostra os oligos para os marcadores dehibridização de Regi desenhados para uso com reaçõesTaqMan®.
A Figura 25 mostra os resultados de um northern blotobtido a partir de aproximadamente 1,5 mg de RNA rico empolyA isolado a partir de plantas resistentes esusceptíveis nos dias 0, 3, 6, 9 e 13 após a inoculação(dpi) . A membrana foi sondada com um fragmento de primeraleatório de Regi marcado de 420 pb. O tecido resistente éoriundo de DE811ASR(BC5) e o tecido susceptível é oriundode DE811.
A Figura 26 mostra que a amplificação por PCR usandopares de primers específicos para Regi somente amplifica nalinhagem resistente DE811ASR(BC5) e na parental doadoraMP305, mas não na linhagem susceptível DE811, com exceçãode FLP110F-R, a qual amplifica a região do sitio de ligaçãoespiral espiralada-nucleotideo, a qual é altamenteconservada, e, portanto, amplifica uma região em qualquerlugar no genoma que não seja Regi na linhagem DE811. Foiusada uma ladder de 100 pb para fazer o fragmento sobmedida.
DESCRIÇÃO DETALHADA DA INVENÇÃOAs concretizações da presente invenção provêemcomposições e métodos (ou processos) dirigidos à indução deresistência em plantas a patógeno, particularmenteresistência a fungos. As composições são novas seqüênciasde nucleotideos e de aminoácidos que conferem ou melhoram aresistência de plantas a patógenos fúngicos.
Especificamente, certas concretizações provêempolipeptideos tendo a seqüência de aminoácidos apresentadaem SEQ ID No: 3, e variantes e fragmentos da mesma. Sãoainda providas moléculas de ácido nucléico isoladas, evariantes e fragmentos das mesmas, que compreendemseqüências de nucleotideos que codificam a seqüência deaminoácidos mostrada na SEQ ID No:3.
As seqüências de nucleotideos que codificam opolipeptideo da SEQ ID No: 3 são apresentadas nas SEQ IDNos: 1 e 4. As plantas, células de planta, sementes emicrorganismos compreendendo uma seqüência de nucleotideosque codifica um polipeptideo das concretizações são tambémaqui reveladas.
Foi feito um depósito da molécula de ácido nucléico deRegi em 22 de fevereiro de 2006 junto à AgriculturalResearch Service (ARS) Culture Collection, guardada naMicrobial Genomics and Bioprocessing Research Unit doNational Center for Agricultural Utilization Research(NCAUR), sob as disposições do Tratado de Budapeste. Foidado ao depósito o seguinte número de acesso: NRRL B-30895.O endereço do NCAUR é 1815 N. University Street, Peoria,IL, 61604. Este depósito será mantido sob os termos dotratado de Budapeste para o Reconhecimento Internacional doDepósito de Microrganismos para os Propósitos deProcedimento de Patente. Este depósito foi feito meramentecomo uma conveniência para aqueles técnicos no assunto enão é uma admissão de que o depósito seja requerido deacordo com' o §112 do U.S.C. 35. O depósito ficarádisponível ao público irrevogavelmente e sem restrição oucondição após a publicação de uma patente. Entretanto, deveser compreendido que a disponibilidade de um depósito nãoconstitui uma licença para praticar o objeto da invenção emdetrimento dos direitos de patente concedidos por açãogovernamental.
Uma amostra de 2500 sementes de DE811ASR (BC5) foramdepositadas junto à American Type Culture Collection(ATCC), 10801 University Blvd., Manassas, VA 20110-2209,USA em 13 de março de 2006 e atribuído o No. de DepósitoPTO-7434. O acesso a este depósito ficará disponível,durante a pendência do pedido, ao Representante de Patentese de Marcas Registradas, a pessoas indicadas peloRepresentante para serem habilitadas para tanto sobsolicitação, e correspondentes funcionários em repartiçõesde patentes estrangeiras nas quais seja depositado o pedidode patente. Este depósito será mantido sob os termos doTratado de Budapeste sobre o Reconhecimento Internacionalde Depósito de Microrganismos para os Propósitos deProcedimento de Patente. O depósito ficará disponível aopúblico irrevogavelmente e sem restrição ou condição após apublicação de uma patente. No entanto, deve ficar entendidoque a disponibilidade do depósito não constitui uma licençapara praticar o objeto da invenção ou métodos em detrimentodios direitos de patente.
O polipeptideo de comprimento completo dasconcretizações (SEQ ID No:3) compartilha variados graus dehomologia com polipeptideos conhecidos da familia NBS-LRR.
Em particular, o novo polipetideo das concretizaçõescompartilha homologia com as proteínas NBS-LRR isoladas deOryza sativa (Nos. De Acesso NP_910480 (SEQ ID No: 14),NP_910482 (SEQ ID No: 16), NP_921091 (SEQ ID No: 17) eNP_910483 (SEQ ID No: 15)) e de Hordeum vulgare (No. deAcesso AAG37354 (SEQ ID No: 18); Zhou et ai., (2001) PlantCell 13:337-350). A Figura 1 prove um alinhamento daseqüência de aminoácidos apresentada na SEQ ID No: 3 com asproteínas antifúngicas de O. sativa e de H. vulgare (SEQ IDNos: 14-18).
Os alinhamentos de aminoácidos usando o programa GAPindicam que a SEQ ID No:3 compartilha aproximadamente 42,3%de similaridade de seqüência com a proteína antifúngica deO. sativa NP_910480 (SEQ ID No: 14), 41,7% de similaridadede seqüência com a proteína de O. sativa NP_910482 (SEQ IDNo: 16), 56,9% de similaridade com a proteína de O. sativaNP_921091 (SEQ ID No: 17) e 42,1% de similaridade deseqüência com a proteína de O. sativa NP_910483 (SEQ ID No:15). Além disso, a SEQ ID No: 3 compartilha aproximadamente42,8% de similaridade de seqüência com a proteina de H.vulgare AAG37354 (SEQ ID No: 18).
O grupo NBS-LRR de genes-R é a maior classe de genes-Rdescobertos até hoje. Em Arabidopsis thaliana, estima-seque mais de 150 estejam presentes no genoma (Meyers, etal., (2003), Plant Cell, 15:809-834; Monosi, et al.,(2004), Theoretical and Applied Genetics, 109:1434-1447),enquanto que em arroz, estima-se em aproximadamente 500genes NBS-LRR (Monosi, (2004) supra) . A classe NBS-LRR degenes R está compreendida por duas subclasses. A classe 1de genes NBS-LRR contém um dominio semelhante a TIR-Toll/Interleucina-1 na sua extremidade N' , a qual, atéhoje, foi encontrada em dicotiledôneas (Meyers, (2003)acima mencionado; Monosi, (2004) acima mencionado). Asegunda classe de NBS-LRR contém tanto um dominio espiral-espiralado ou um dominio (nt) na sua extremidade N (Bai, etal. (2002) Genome Research, 12:1871-1884; Monosi, (2004)acima mencionado; Pan, et al., (2000), Journal of MolecularEvolution, 50:203-213). A classe 2 de NBS-LRR foiencontrada e ambas as espécies, monocotiledôneas edicotiledôneas (Bai, (2002) acima mencionado; Meyers,(2003) acima mencionado; Monosi, (2004) acima mencionado;Pan, (2000) acima mencionado).
O dominio NBS do gene parece desempenhar um papel desinalização nos mecanismos de defesa da planta (van derBiezen, et al., (1998), Current Biology: CB, 8:R226-R227).
A região LRR parece ser a região que interage com osprodutos AVR do patógeno (Michelmore, et al. , (1998),Genome Res., 8:1113-1130; Meyers, (2003) acima citado).Esta região LRR, em comparação com o domínio NBS está sobuma pressão de seleção muito maior para a diversificação(Michelmore, (1998) acima citado; Meyers, (2003) acimacitado; Palomino, et al., (2002), Genome Research, 12:1305-1315). Os dominios LRR também são encontrados em outroscontextos; esses motifs de residuos 20-29 estão presentesem arranjos in tandem em inúmeras proteínas com funçõesdiversas, tais como interações hormônio-receptor, inibiçãode enzima, adesão celular e tráfego celular. Inúmerosestudos recentes revelaram o envolvimento de proteínas LRRno desenvolvimento inicial de mamíferos, desenvolvimentoneural, polarização celular, regulação de expressão de genee sinalização de apoptose.
O gene das concretizações está nitidamente relacionadoao NBS-LRR da família de classe 2, mas não se ajustacompletamente ao molde clássico. A extremidade amino possuihomologia com os chamados sitios de ligação a nucleotideo(NBS). Há uma região rica em leucina também localizada,como esperado, a jusante do NBS. Entretanto, diferentementedas proteínas NBS-LRR previamente estudadas, a região ricaem leucina carece da natureza repetitiva sistemáticaencontrada nos dominios LRR mais clássicos, muito menosconsistentemente seguindo o padrão de repetição Lxx tipicoe, em particular, não tendo exemplos de seqüências deconsenso descritas por Wang et al. ((1999) Plant J. 19:55-64; ver, especialmente, a Figura 5) ou Bryan et al.((2000), Plant Cell 12:2033-204 5; ver, especialmente, aFigura 3) .
Como a região LRR é a porção receptora de um NBS-LRR,quando uma nova LRR, tal como a desta descrição, forencontrada, a faixa de sua atividade, ou seja, a faixa depatógenos aos quais ela responderá, não é imediatamenteóbvia a partir da seqüência. O gene das concretizações foiisolado com base no fenótipo de resistência a Cg, e,portanto, a nova LRR responde a Cg. Entretanto, não ficaexcluído o fato de que ela responde a outros patógenos nãotestados no trabalho feito até agora.
Os ácidos nucléicos e polipeptideos das concretizaçõesencontram uso em métodos para conferir ou melhorar aresistência em plantas a fungos. Conseqüentemente, ascomposições e métodos revelados aqui são utilizáveis naproteção de plantas contra patógenos fúngicos. Os termos"resistência a patógeno", "resistência a fungo" e"resistência a doença" têm a intenção de significar o fatode que a planta evita os sintomas da doença que são oresultado de interações planta-patógeno. Ou seja, é feita aprevenção de patógenos causarem doenças em plantas e ossintomas de doença associados, ou, alternativamente, ossintomas de doença causados pelo patógeno são minimizadosou diminuídos, tais como, por exemplo, a redução deestresse e perda de produtividade associada. Osespecialistas na técnica saberão reconhecer que ascomposições e métodos aqui revelados podem ser usados comoutras composições e métodos disponíveis na técnica paraproteger plantas do ataque de patógenos.
Em conseqüência, os métodos das concretizações podemser utilizados para proteger plantas de doenças,particularmente aquelas doenças que são causadas porpatógenos de fungos de planta. Como aqui usado, o termo"resistência a fungo" se refere a resistência melhorada outolerância com relação a um patógeno de fungo em comparaçãocom aquela de uma planta do tipo selvagem. Os efeitos podemvariar desde um leve aumento na tolerância aos efeitos dopatógeno fúngico (por exemplo, inibição parcial) atéresistência total, tal como a planta não ser afetada pelapresença do patógeno fúngico. Um nivel aumentado deresistência contra um patógeno fúngico particular ou contraum espectro mais amplo de patógenos fúngicos constitui aresistência "melhorada" ou aperfeiçoada contra fungos. Asconcretizações da invenção também melhorarão ouaperfeiçoarão a resistência da planta a patógeno de fungo,de modo que a resistência da planta a um patógeno ou apatógenos fúngicos aumentará. 0 termo "melhorar" se referea aperfeiçoar, aumentar, amplificar, multiplicar, elevar,fazer surgir e semelhantes. Aqui, as plantas da invençãosão descritas como sendo resistentes a infecção por Cg outendo resistência melhorada a infecção por Cg, comoresultado do lócus de Regi da invenção. Conseqüentemente,elas tipicamente apresentam resistência melhorada à doençaquando comparadas com plantas equivalentes que sãosusceptíveis à infecção por Cg porque lhes falta o lócus deRegi. Por exemplo, usando o sistema de contagem de escoredescrito no Exemplo 11 (ver também a Figura 20), elastipicamente apresentam um decréscimo de um ponto, de doispontos ou de três pontos ou de mais pontos no escore deinfecção, ou mesmo uma redução do escore para 1 ou 0,quando comparadas com plantas equivalentes que sãosusceptíveis a infecção por Cg porque lhes falta o lócus deRegi.
Em aspectos particulares, os métodos para conferir oumelhorar resistência de uma planta a fungos compreendem aintrodução, em uma planta, de pelo menos um cassete deexpressão, sendo que o cassete de expressão compreende umaseqüência de nucleotideos codificante de um polipeptideoantifúngico das concretizações operacionalmente ligado a umpromotor que dirige a expressão na planta. A plantaexpressa o polipeptideo, conferindo, por esse meio, aresistência antifúngica sobre a planta, ou aperfeiçoando onível de resistência inerente da planta. Em concretizaçõesparticulares, o gene confere resistência ao patógenofúngico Cg.
A expressão de um polipeptideo antifúngico dasconcretizações pode ser direcionada para tecidosespecíficos de planta onde a resistência ao patógeno éparticularmente importante, tais como, as folhas, asraízes, os colmos, ou os tecidos vasculares. Tal expressãotecido-preferida pode ser realizada por meio de promotoresraiz-preferidos, folha-preferidos, tecido vascular-preferidos, colmo-preferidos ou semente-preferidos.
Como aqui usado, o termo "ácido nucléico" incluireferência a um polimero de desoxirribonucleotideos ou deribonucleotideos, tanto na forma de simples-fita como na dedupla-fita, e a menos que seja limitado de outra forma,engloba análogos conhecidos (por exemplo, ácidos nucléicosde peptideo) tendo a natureza essencial de nucleotideosnaturais na medida em que eles hibridizam com ácidosnucléicos de simples-fita de uma maneira semelhante aosnucleotideos de ocorrência natural.
Os termos "polipeptídeo", "peptideo", e "proteína" sãoaqui usados indistintamente para se referir a um polimerode resíduos de aminoácidos. Os termos se aplicam aospolímeros de aminoácidos nos quais um ou mais residuos deaminoácido é um análogo quimico artificial de um aminoácidocorrespondente de ocorrência natural, assim como aospolímeros de aminoácidos de ocorrência natural. Ospolipeptídeos das concretizações podem ser produzidos tantoa partir de um ácido nucléico aqui revelado, como pelo usode técnicas de biologia molecular padrão. Por exemplo, umaproteína truncada das concretizações pode ser produzida porexpressão de um ácido nucléico recombinante dasconcretizações em uma célula hospedeira apropriada, oualternativamente, pela combinação de procedimentos ex vivo,tal como digestão com protease e purificação.Como aqui usados, os termos "codificar" ou"codificado", quando usados no contexto de um ácidonucléico especifico, significa que o ácido nucléicocompreende a informação de requisito para dirigir atradução da seqüência de nucleotideos para uma proteinaespecificada. A informação pela qual uma proteina écodificada é especificada pelo uso de códons. Um ácidonucléico codificante de uma proteina pode compreenderseqüências não-traduzidas (por exemplo, introns) dentro deregiões traduzidas do ácido nucléico ou tais seqüênciasnão-traduzidas interpostas (por exemplo, tal como no cDNA)podem estar ausentes.
As concretizações da invenção englobampolinucleotideos isolados ou substancialmente purificadosou composições de proteina. Um polinucleotideo ou proteina"isolado(a)" ou "purificado(a)", ou porção biologicamenteativa do mesmo, está substancialmente ou essencialmenteisento(a) de componentes que normalmente acompanham ouinteragem com o polinucleotideo ou proteina comoencontrado(a) no seu ambiente de ocorrência natural.Portanto, um polinucleotideo ou proteina isolado(a) oupurificado(a) está substancialmente isento(a) de outromaterial celular, ou meio de cultura produzido por técnicarecombinante (por exemplo, amplificação por PCR), ousubstancialmente isento(a) de precursores químicos, quandosintetizados(as) quimicamente. De modo ótimo, umpolinucleotideo "isolado" está isento de seqüências (porexemplo, seqüências codificantes de proteina) quenaturalmente flanqueiam o polinucleotídeo (ou seja,seqüências localizadas nas extremidades 5' e 3' dopolinucleotideo) no DNA genômico do organismo a partir doqual o polinucleotideo é derivado. Por exemplo, nas váriasconcretizações, o polinucleotideo isolado pode conter menosque cerca de 5 kb, cerca de 4 kb, cerca de 3 kb, cerca de 2kb, cerca de 1 kb, cerca de 0,5 kb, ou cerca de 0,1 kb daseqüência de nucleotideos que flanqueia naturalmente opolinucleotideo no DNA genômico da célula a partir da qualo polinucleotideo é derivado. Uma proteína que ésubstancialmente isenta de material celular incluipreparações de proteina tendo menos do que cerca de 30%,cerca de 20%, cerca de 10%, cerca de 5%, ou cerca de 1% (empeso seco) de proteina contaminante. Quando a proteina dasconcretizações, ou uma porção biologicamente ativa damesma, for recombinantemente produzida, de modo ótimo, omeio de cultura representa menos do que cerca de 30%, cercade 20%, cerca de 10%, cerca de 5%, ou cerca de 1% (em pesoseco) de precursores químicos ou substâncias químicas não-protéicas de interesse.
Os fragmentos e variantes das seqüências denucleotideos reveladas e proteínas codificadas por essemeio estão também englobadas pelas concretizações. O termofragmento tem a intenção de significar uma porção daseqüência de nucleotideos ou uma porção da seqüência deaminoácidos e, portanto, da proteina codificada por essemeio. Os fragmentos de uma seqüência de nucleotideos podemcodificar fragmentos de proteina que retenham a atividadebiológica da proteína natural e, assim, a capacidade deconferir, na planta, resistência a fungos.
Alternativamente, os fragmentos de uma seqüência denucleotideos que são utilizáveis como sondas dehibridização não necessariamente codificam proteínas defragmentos que retenham a atividade biológica. Portanto, osfragmentos de uma seqüência de nucleotideos pode variar depelo menos cerca de 15 nucleotideos, cerca de 50nucleotideos, cerca de 100 nucleotideos, e até a seqüênciade nucleotideos de comprimento completo codificante dospolipeptideos das concretizações.
Um fragmento de uma seqüência de nucleotideos quecodifica uma porção biologicamente ativa de um polipeptideodas concretizações codificará pelo menos cerca de 15, cercade 25, cerca de 30, cerca de 40, ou cerca de 50 aminoácidoscontíguos, ou até o número total de aminoácidos presente nopolipeptideo de comprimento completo das concretizações(por exemplo, 980 aminoácidos para o peptideo codificadopela SEQ ID No:l). Os fragmentos de uma seqüência denucleotideos que são utilizáveis como sondas ou primers dePCR, em geral, não necessitam codificar uma porçãobiologicamente ativa de uma proteína.
Como aqui usado, o termo "seqüência de comprimentocompleto", com referência a um polinucleotideoespecificado, significa que ela possui a seqüência inteirade ácido nucléico de uma seqüência natural. O termo"seqüência natural" tem a intenção de significar umaseqüência endógena, ou seja, uma seqüência não-engenheiradaencontrada no genoma de um organismo.
Portanto, um fragmento de uma seqüência denucleotideos das concretizações pode codificar uma porçãobiologicamente ativa de um polipeptideo, ou ele pode ser umfragmento que pode ser usado como uma sonda de hibridizaçãoou primer de PCR usando métodos revelados mais adiante. Umaporção biologicamente ativa de um polipeptideoantipatogênico pode ser preparada pelo isolamento de umaporção de uma das seqüências de nucleotideos dasconcretizações, expressando a porção codificada da proteínae avaliando a capacidade de a porção codificada da proteínaconferir ou melhorar a resistência a fungos em uma planta.As moléculas de ácido nucléico que são fragmentos de umaseqüência de nucleotideos das concretizações compreendempelo menos cerca de 15, cerca de 20, cerca de 50, cerca de75, cerca de 100, ou cerca de 150 nucleotideos, ou até onúmero de nucleotideos presente na seqüência denucleotideos de comprimento completo aqui revelada (porexemplo, 4212 nucleotideos para a SEQ ID No: 1) .
O termo "variantes" tem a intenção de significarseqüências substancialmente similares. Parapolinucleotideos, uma variante compreende uma deleção e/ouadição de um ou mais nucleotideos em um ou mais sitiosinternos dentro do polinucleotideo natural e/ou umasubstituição de um ou mais nucleotideos em um ou maissitios no polinucleotideo natural. Como aqui usado, umpolinucleotídeo ou polipeptideo "natural" compreende umaseqüência de nucleotideos ou seqüência de aminoácidos deocorrência natural, respectivamente. Os especialistas natécnica saberão reconhecer que variantes dos ácidosnucléicos das concretizações serão construídos de modo queo quadro aberto de leitura seja mantido. Parapolinucleotideos, as variantes conservativas incluemaquelas seqüências que, por causa da degeneração do códigogenético, codificam a seqüência de aminoácidos de um dospolipeptideos das concretizações. As variantes alélicas deocorrência natural, tais como aquelas que podem seridentificadas com o uso de técnicas de biologia molecularamplamente conhecidas, como, por exemplo, com as técnicasde reação em cadeia da polimerase (PCR) e de hibridizaçãocomo esboçadas mais adiante. Os polinucleotideos variantestambém incluem polinucleotideos derivados sinteticamente,tais como aqueles gerados, por exemplo, pelo uso demutagênese sitio-dirigida, mas que ainda codificam umaproteína das concretizações. Em geral, as variantes de umpolinucleotideo particular das concretizações terá pelomenos cerca de 40%, cerca de 45%, cerca de 50%, cerca de55%, cerca de 60%, cerca de 65%, cerca de 70%, cerca de75%, cerca de 80%, cerca de 85%, cerca de 90%, cerca de91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de95%, cerca de 96%, cerca de 97%, cerca de 98%, cerca de 99%ou mais de identidade de seqüência com relação àquelepolinucleotideo particular, como determinado pelosprogramas e parâmetros de alinhamento de seqüênciadescritos aqui em algum lugar.As variantes de um polinucleotideo particular dasconcretizações (ou seja, o polinucleotideo de referência)podem também ser avaliadas por comparação da percentagem deidentidade de seqüência entre o polipeptideo codificado porum polinucleotideo variante e o polipeptideo codificadopelo polinucleotideo de referência. Assim, por exemplo, sãorevelados os polinucleotideos isolados que codificam umpolipeptideo com uma dada percentagem de identidade deseqüência com relação ao polipeptideo de SEQ ID No:3. Aidentidade de seqüência percentual entre quaisquer doispolipeptideos pode ser calculada usando os programas eparâmetros de alinhamento de seqüências descritos aqui emalgum lugar. Quando qualquer dado par de polinucleotideosdas concretizações é avaliado por comparação da identidadede seqüência percentual compartilhada pelos doispolipeptideos que ele codifica, a identidade de seqüênciapercentual entre os dois polipeptideos codificados tem pelomenos cerca de 40%, cerca de 45%, cerca de 50%, cerca de55%, cerca de 60%, cerca de 65%, cerca de 70%, cerca de75%, cerca de 80%, cerca de 85%, cerca de 90%, cerca de91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de95%, cerca de 96%, cerca de 97%, cerca de 98%, cerca de 99%ou mais de identidade de seqüência.
O termo proteina "variante" tem a intenção designificar uma proteina derivada da proteina nativa pordeleção ou adição de um ou mais aminoácidos em um ou maissitios internos na proteina natural e/ou substituição de umou mais aminoácidos em um ou mais sitios na proteinanatural. As proteínas variantes englobadas pelasconcretizações são biologicamente ativas, ou seja, elascontinuam a possuir a atividade biológica desejada daproteina natural, isto é, a capacidade de conferir oumelhorar a resistência da planta a patógeno de fungo comoaqui descrito. Tais variantes podem resultar, por exemplo,de' polimorfismo genético ou de manipulação pelo homem. Asvariantes biologicamente ativas de uma proteina natural dasconcretizações terão pelo menos cerca de 40%, cerca de 45%,cerca de 50%, cerca de 55%, cerca de 60%, cerca de 65%,cerca de 70%, cerca de 75%, cerca de 80%, cerca de 85%,cerca de 90%, cerca de 91%, cerca de 92%, cerca de 93%,cerca de 94%, cerca de 95%, cerca de 96%, cerca de 97%,cerca de 98%, cerca de 99% ou mais de identidade deseqüência com relação à seqüência de aminoácidos para aproteina natural como determinada pelos programas eparâmetros de alinhamento de seqüências aqui descritos emalgum lugar. Uma variante biologicamente ativa de umaproteina das concretizações pode diferir daquela proteinapor tão pouco quanto cerca de 1-15 residuos de aminoácido,tão pouco quanto cerca de 1-10, tal como cerca de 6-10, tãopouco quanto cerca de 5, tão pouco quanto 4, 3, 2, ou atémesmo 1 residuo de aminoácido.
As proteínas das concretizações podem ser alteradas dediversas maneiras, incluindo substituições, deleções,truncagens e inserções de aminoácidos. Os métodos pararealizar tais manipulações são, em geral, conhecidos doestado da técnica. Por exemplo, as variantes e fragmentosda seqüência de aminoácidos das proteínas antipatogênicaspodem ser preparadas por meio de mutações no DNA. Osmétodos para mutagênese e alterações de polinucleotideossão bem conhecidos no estado da técnica. Ver, por exemplo,Kunkel (1985) Proc. Natl. Rcad. Sei. USA 82:488-492; Kunkelet al. (1987) Methods in Enzymol. 154:367-382; patente US4.873.192; Walker e Gaastra, eds. (1983) Techniques inMolecular Bíology (MacMillan Publishing Company, New York)e as referências aqui citadas. A orientação de comorealizar apropriadas substituições de aminoácidos que nãoafetem a atividade biológica da proteína de interesse podeser encontrada no modelo de Dayhoff et al. (1978) Atlas ofProtein Sequence and Structure (Natl. Biomed. Res. Found.,Washington, D.C.), aqui incorporado a titulo de referência.As substituições conservativas, tal como a troca de umaminoácido por um outro tendo propriedades similares podemser o modo ótimo.
Portanto, os genes e polinucleotideos dasconcretizações incluem ambas, as seqüências de ocorrêncianatural e as formas mutantes. Da mesma maneira, asconcretizações englobam ambas, as proteínas de ocorrêncianatural e as variações e formas modificadas das mesmas.Tais variantes continuarão a possuir a capacidade desejadade conferir ou melhorar a resistência da planta a patógenode fungo. Obviamente, as mutações que serão feitas no DNAcodificante da variante não devem ocorrer fora do quadro deleitura e, de modo ótimo, não criarão regiõescomplementares que possam produzir estrutura secundária demRNA (ver EP 0075444) .
Não se espera que as deleções, inserções esubstituições das seqüências de proteina englobadas aquiproduzam mudanças radicais nas características da proteina.Entretanto, quando for difícil predizer o efeito exato dasubstituição, deleção ou inserção antes de realizá-la, osespecialistas na técnica saberão reconhecer que o efeitoserá avaliado pelo screening de plantas transgênicas quetenham sido transformadas com a proteina variante paraaveriguar o efeito na capacidade da planta resistir aoataque patogênico do fungo.
Os polinucleotideos e proteínas variantes tambémenglobam as seqüências e proteínas derivadas deprocedimentos mutagênicos ou recombinogênicos, incluindo,mas não estando limitados a, procedimentos tal como o decombinações aleatórias de DNA. O especialista na técnicapode imaginar modificações que alterem a faixa de patogenoscom relação aos quais a proteina responde. Com talprocedimento, uma ou mais diferentes seqüênciascodificantes de proteina podem ser manipuladas para criaruma nova proteina que possua as propriedades desejadas.Desta maneira, são geradas bibliotecas de polinucleotideosrecombinantes a partir de uma população de polinucleotideosde seqüências relacionadas compreendendo regiões deseqüência que possuem substancial identidade de seqüência epodem ser homologamente recombinadas in vitro ou in vivo.Por exemplo, usando esta abordagem, os motifs de seqüênciacodificantes de um domínio de interesse podem sercombinados aleatoriamente entre o gene de proteína dasconcretizações e outros genes de proteína conhecidos paraobter um novo gene codificante de uma proteína com umapropriedade de interesse aperfeiçoada, tal como capacidadeaumentada de conferir ou melhorar a resistência da planta apatógeno de fungo. As estratégias para combinar DNAaleatoriamente são conhecidas no estado da técnica. Ver,por exemplo, Stemmer (1994) Proc. Natl. Acad. Sei. USA91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameriet al. (1997) Nature Biotech. 15:436-438; Moore et al.(1997) J. Mol. Biol. 272:336-347; Zhang et al. (1997) Proc.Natl. Acad. Sei. USA 94:4504-450.9; Crameri et al. (1998)Nature 391:288-291; e patentes US 5.605.793 e US 5.837.458.
Os polinucleotideos das concretizações podem serusados para isolar as seqüências correspondentes a partirde outros organismos, particularmente outras plantas. Destamaneira, métodos tais como PCR, hibridização e semelhantespodem ser usados para identificar tais seqüências com basena sua homologia de seqüência com relação às seqüênciasaqui apresentadas. As seqüências isoladas com base na suaidentidade de seqüência com relação às seqüências inteirasaqui apresentadas ou com relação a variantes ou fragmentosdas mesmas estão englobados pelas concretizações. Taisseqüências incluem seqüências que são ortólogas dasseqüências reveladas. O termo "ortólogas" tem a intenção designificar genes derivados de um gene ancestral comum e quesão encontrados em diferentes espécies como resultado deuma especialização. Os genes encontrados em diferentesespécies são considerados ortólogos quando suas seqüênciasde nucleotideos e/ou suas seqüências de proteína codificadacompartilham pelo menos cerca de 60%, cerca de 70%, cercade 75%, cerca de 80%, cerca de 85%, cerca de 90%, cerca de91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de95%, cerca de 96%, cerca de 97%, cerca de 98%, cerca de99%, ou mais de identidade de seqüência. As funções dosortólogos são, com freqüência, altamente conservadas entreas espécies. Portanto, polinucleotídeos isolados quecodificam uma proteína que confere ou melhora a resistênciada planta a patógeno de fungo e que hibridiza sob condiçõesestringentes com as seqüências aqui reveladas, ou comvariantes ou fragmentos das mesmas, estão englobados pelasconcretizações.
Em uma abordagem de PCR, os primers deoligonucleotídeos podem ser desenhados para uso em reaçõesde PCR para amplificar as correspondentes seqüências de DNAa partir do cDNA ou do DNA genômico extraído de qualquerorganismo de interesse. Os métodos para desenhar primers dePCR e clonagem de PCR são, em geral, conhecidos no estadoda técnica e estão descritos em Sambrook et al. (1989)Molecular Cloning: A Laboratory Manual (2d ed., Cold SpringHarbor Laboratory Press, Plainview, New York). Ver tambémInnis et al., eds. (1990) PCR Protocols: A Guide to Methodsand Applications (Academic Press, New York); Innis eGelfand, eds. (1995) PCR Strategies (Academic Press, NewYork); e Innis e Gelfand, eds. (1999) PCR Methods Manual(Academic Press, New York). Os métodos de PCR conhecidosincluem, mas não estão limitados a, métodos usando primersemparelhados, primers nested, primers únicos específicos,primers degenerados, primers gene-especificos, primersvetor-especificos, primers com emparelhamento desigualparcial, e semelhantes.
Nas técnicas de hibridização, o todo ou parte de umpolinucleotideo conhecido é usado como uma sonda queseletivamente hibridiza com outros polinucleotideoscorrespondentes presentes em uma população de fragmentos deDNA genômico clonado ou fragmentos de cDNA (ou seja,bibliotecas genômicas ou de cDNA) a partir de um organismoconhecido. As sondas de hibridização podem ser fragmentosde DNA genômico, fragmentos de cDNA, fragmentos de RNA, ououtros oligonucleotideos, e podem ser marcados com um grupodetectável, tal como 32P, ou qualquer outro marcadordetectável. Assim, por exemplo, as sondas para hibridizaçãopodem ser feitas por meio de marcação de oligonucleotideossintéticos baseados nos polinucleotideos dasconcretizações. Os métodos de preparação das sondas parahibridização e para a construção do cDNA e bibliotecasgenômicas são, em geral, conhecidos no estado da técnica eestão descritos em Sambrook et al. (1989) acima citado.
Por exemplo, o polinucleotideo inteiro aqui revelado,ou uma ou mais porções do mesmo, pode ser usado como umasonda capaz de especificamente hibridizar com oscorrespondentes polinucleotideos e RNAs mensageiros. Paraalcançar a hibridização específica sob uma variedade decondições, tais sondas incluem seqüências que são únicas e,de modo ótimo, têm um comprimento de pelo menos cerca de 10nucleotídeos, um comprimento de pelo menos cerca de 15nucleotídeos, ou um comprimento de pelo menos cerca de 20nucleotídeos. Tais sondas podem ser usadas para amplificaros correspondents polinucleotideos a partir de um organismoconhecido por meio de PCR. Esta técnica pode ser usada paraisolar seqüências codificantes adicionais a partir de umorganismo desejado ou como um ensaio de diagnóstico paradeterminar a presença de seqüências codificantes em umorganismo. As técnicas de hibridização incluem screening dehibridização de bibliotecas de DNA plaqueado (tanto placascomo colônias); ver, por exemplo, Sambrook et al. (1989)acima citado.
A hibridização de tais seqüências pode ser realizadasob condições estringentes. Os termos "condiçõesestringentes" ou "condições de hibridização estringentes"tem a intenção de significar condições sob as quais umasonda hibridizará com sua seqüência alvo com relação a umgrau detectavelmente maior do que outras seqüências (porexemplo, pelo menos duas vezes acima do background). Ascondições estringentes são seqüência-dependentes e serãodiferentes em diferentes circunstâncias. Pelo controle daestringência da hibridização e/ou das condições de lavagem,as seqüências alvo que forem 100% complementares comrelação à sonda podem ser identificadas (sondagemhomóloga). Alternativamente, as condições de estringênciapodem ser ajustadas para permitir algum emparelhamentodesigual em seqüências de modo que graus mais baixos desimilaridade sejam detectados (sondagem heteróloga) . Emgeral, uma sonda tem um comprimento menor do que cerca de1000 nucleotideos, de modo ótimo, um comprimento menor que500 nucleotideos.
Tipicamente, condições estringentes serão aquelas nasquais a concentração de sal é menor do que cerca de 1,5 Mde ion Na, tipicamente concentração de cerca de 0,01 a 1,0M de ion Na (ou outros sais) em pH 7,0 a 8,3 e atemperatura é de pelo menos cerca de 30°C para sondascurtas (por exemplo, 10 a 50 nucleotideos) e pelo menoscerca de 60°C para sondas longas (por exemplo, maiores doque 50 nucleotideos). Condições estringentes também podemser alcançadas com a adição de agentes desestabilizantes,tal como formamida. Condições de baixa estringênciaexemplificativas incluem a hibridização com uma soluçãotampão de formamida a 30 a 35%, NaCl 1 M, SDS a 1% (dodecilsulfato de sódio) a 37°C, e uma lavagem em IX a 2X SSC (20XSSC = NaCl 3,0 M /citrato trissódico 0,3 M) a umatemperatura de 50 a 55°C. Condições de moderadaestringência exemplificativas incluem hibridização emformamida a 40 a 45%, NaCl 1,0 M, SDS a 1% a 37°C, e umalavagem em 0,5X a IX SSC a uma temperatura de 55 a 60°C.Condições de alta estringência exemplificativas incluemhibridização em formamida a 50%, NaCl 1 M, SDS 1% a a 37°C,e uma lavagem final em 0,1X SSC a umatemperatura de 60 a65°C por pelo menos 30 minutos. De modo ótimo, os tampõesde lavagem podem compreender cerca de 0,1% a cerca de 1% deSDS. A duração de hibridização é, em geral, menor do quecerca de 24 horas, usualmente de cerca de 4 a cerca de 12horas. A duração do tempo de lavagem será pelo menos umperiodo de tempo suficiente para alcançar o equilíbrio.
Especificidade é tipicamente uma função das lavagenspós-hibridização, sendo os fatores críticos a força iônicae a temperatura da solução de lavagem final. Para oshíbridos de DNA-DNA, o ponto de fusão térmico (Tm) pode seraproximado a partir da equação de Meinkoth e Wahl (1984)Anal. Biochem. 138:267-284: Tm = 81,5°C + 16,6 (log M) +0,41 (%GC) - 0,61 (% form) - 500/L; onde M é a molaridadede cátions monovalentes, %GC é a percentagem denucleotideos guanosina e citosina no DNA, % form é apercentagem de formamida na solução de hibridização, e L éo comprimento do hibrido em pares de base. A Tm é atemperatura (sob força iônica e pH definidos) na qual 50%de uma seqüência alvo complementar hibridiza com uma sondaperfeitamente emparelhada. A Tm é reduzida por cerca 1°Cpara cada 1% de emparelhamento desigual; assim, a Tm, ahibridização, e/ou as condições de lavagem podem serajustadas para hibridizar com seqüências da identidadedesejada. Por exemplo, se forem desejadas seqüências com>90% de identidade, a Tm pode ser diminuída 10°C. Em geral,condições estringentes são selecionadas para serem cerca de5°C mais baixas do que a Tm para a seqüência especifica eseu complemento em uma força iônica e pH definido.Entretanto, condições severamente estringentes podemutilizar uma hibridização e/ou lavagem a 1, 2, 3, ou 4°Cmais baixa do que a Tm; condições moderadamenteestringentes podem utilizar uma hibridização e/ou lavagemem 6, 7, 8, 9, ou 10°C mais baixa do que a Tm; condições debaixa estringência podem utilizar uma hibridização e/oulavagem em 11, 12, 13, 14, 15, ou 20°C mais baixa do que aTm. Usando a equação, as composições de hibridização elavagem, e a Tm desejada, aqueles especialistas na técnicasaberão reconhecer que as variações na estringência dassoluções de hibridização e/ou lavagem estão inerentementedescritas. Se o grau desejado de emparelhamento desigualresultar em uma Tm menor que 45°C (solução aquosa) ou 32°C(solução de formamida), o modo ótimo será aumentar aconcentração de SSC de forma que uma temperatura mais altapossa ser usada. Uma orientação detalhada para ahibridização de ácidos nucléicos é encontrada em Tijssen(1993) Laboratory Techniques in Biochemistry and MolecularBiology—Hybridization with Nucleic Acid Probes, Part I,Capitulo 2 (Elsevier, New York); e Ausubel et al., eds.(1995) Current Protocols in Molecular Biology, Capitulo 2(Greene Publishing and Wiley-Interscience, New York). VerSambrook et al. (1989) acima citado.
Vários procedimentos podem ser usados para checar apresença ou ausência de uma seqüência particular de DNA,RNA ou de uma proteina. Eles incluem, por exemplo, Southernblots, northern blots, western blots, e análise ELISA.Técnicas tais como essas são bastante conhecidas no estadoda técnica e existem muitas referências que fornecemprotocolos detalhados. Tais referências incluem Sambrook etal. (1989) acima citado, e Crowther, J.R. (2001), The ELISAGuidebook, Humana Press, Totowa, NJ, USA.
Os seguintes termos são usados para descrever asrelações de seqüência entre dois ou mais polinucleotideosou polipeptideos: (a) "seqüência de referência", (b)"janela de comparação", (c) "identidade de seqüência" e (d)"percentagem de identidade de seqüência".
(a) Como aqui usada, a "seqüência de referência" éuma seqüência definida usada como base para a comparação deseqüências. Uma seqüência de referência pode ser umsubconjunto ou a integralidade de uma seqüênciaespecificada; por exemplo, como um segmento de um cDNA decomprimento completo ou seqüência de gene, ou o cDNAcompleto ou seqüência de gene.
(b) Como aqui usada, a "janela de comparação" fazreferência a um segmento contiguo e especificado de umaseqüência de polinucleotideo, sendo que a seqüência depolinucleotideo na janela de comparação pode compreenderadições ou deleções (ou seja, gaps) comparada com aseqüência de referência (a qual não compreende adições oudeleções) para o alinhamento ótimo de doispolinucleotideos. Em geral, a janela de comparação temcomprimento de pelo menos cerca de 20 nucleotideoscontíguos, e opcionalmente, pode ter cerca de 30, cerca de40, cerca de 50, cerca de 100, ou ser mais longa. Aquelesespecialistas na técnica entendem que para evitar uma altasimilaridade com uma seqüência de referência devido àinclusão de gaps na seqüência do polinucleotideo, étipicamente introduzida uma penalidade de gap e é subtraídado número de pareamentos.
Os métodos de alinhamento de seqüências paracomparação são bastante conhecidos no estado da técnica.Portanto, a determinação da identidade de seqüênciapercentual entre quaisquer duas seqüências pode serrealizada usando um algoritmo matemático. Exemplos nãolimitativos de tais algoritmos matemáticos são osalgoritmos de Myers e Miller (1988) CABIOS 4:11-17; oalgoritmo de alinhamento local de Smith et al. (1981) Adv.Appl. Math. 2:482; o algoritmo de alinhamento global deNeedleman e Wunsch (1970) J. Mol. Biol. 48:443-453; ométodo de alinhamento de busca-por-local de Pearson eLipman (1988) Proc. Natl. Acad. Sei. 85:244 4-24 48; oalgoritmo de Karlin e Altschul (1990) Proc. Natl. Acad.Sei. USA 872264, modificado como em Karlin e Altschul(1993) Proc. Natl. Acad. Sei. USA 90:5873-5877.
As implementações em computador desses algoritmosmatemáticos podem ser utilizadas para comparação deseqüências para determinar a identidade de seqüência. Taisimplementações incluem, mas não estão limitadas a: CLUSTALno programa PC/Gene (disponível a partir deIntelligenetics, Mountain View, Califórnia); o programaALIGN (Versão 2.0) e GAP, BESTFIT, BLAST, FASTA, e TFASTAno GCG Wisconsin Genetics Software Package, Versão 10(disponível a partir de Accelrys Inc., 9685 Scranton Road,San Diego, Califórnia, USA) . Os alinhamentos usando essesprogramas podem ser realizados usando os parâmetros dedefault. O programa CLUSTAL está bem descrito por Higginset al. (1988) Gene 73:237-244 (1988); Higgins et al. (1989)CABIOS 5:151-153; Corpet et al. (1988) Nucleic Acids Res.16:10881-90; Huang et al. (1992) CABIOS 8:155-65; e Pearsonet al. (1994) Meth. Mol. Biol. 24:307-331. O programa ALIGNé baseado no algoritmo de Myers e Miller (1988) acimacitado. Podem ser usadas uma tabela de peso de resíduoPAM120, uma penalidade de comprimento de gap de 12, e umapenalidade de gap de 4 com o programa ALIGN para compararseqüências de aminoácidos. Os programas BLAST de Altschulet al (1990) J. Mol. Biol. 215:403 são baseados noalgoritmo de Karlin e Altschul (1990) acima citado. Asbuscas de nucleotídeos BLAST podem ser realizadas com oprograma BLASTN, escore = 100, comprimento de palavra = 12,para obter seqüências de nucleotídeos homólogas a umaseqüência de nucleotídeos codificante de uma proteína dasconcretizações. As buscas de proteína BLAST podem serrealizadas com o programa BLASTX, escore = 50, comprimentode palavra = 3, para obter seqüências de aminoácidoshomólogas a uma proteína ou polipeptídeo dasconcretizações. Para obter os alinhamentos com gap parafinalidade de comparação, pode ser usado o Gapped BLAST (emBLAST 2.0) como descrito em Altschul et al. (1997) NucleicAcids Res. 25:3389. Alternativamente, pode ser usado o PSI-BLAST (em BLAST 2.0) para realizar uma busca iterada quedetecta relações distantes entre moléculas (ver Altschul etal. (1997) acima citado). Quando se utiliza o BLAST, GappedBLAST, PSI-BLAST, podem ser usados os parâmetros de defaultdos programas respectivos (por exemplo, BLASTN paraseqüências de nucleotideos, BLASTX para proteínas) (verwww.ncbi.nlm.nih.gov). 0 alinhamento também pode serrealizado manualmente por inspeção.
A menos que seja estabelecido diferentemente, osvalores de identidade/similaridade de seqüência aquiprovidos se referem ao valor obtido usando o GAP Versão 10utilizando os seguintes parâmetros: % de identidade e % desimilaridade para uma seqüência de nucleotideos usando oPeso de Gap de 50 e o Peso de Comprimento de 3, e a matrizde contagem de escore nwsgapdna.cmp; % de identidade e % desimilaridade para uma seqüência de aminoácidos usando oPeso de Gap de 8 e o Peso de Comprimento de 2, e a matrizde contagem de escore BLOSUM62; ou qualquer programaequivalente ao mesmo. 0 termo "programa equivalente" tem aintenção de significar qualquer programa de comparação deseqüência que, para quaisquer duas seqüências em questão,gera um alinhamento tendo nucleotideo idêntico oupareamentos de residuos de aminoácido e uma idênticaidentidade de seqüência percentual quando comparado com oalinhamento correspondente gerado pelo GAP Versão 10.
O GAP usa o algoritmo de Needleman e Wunsch (1970) J.Mol. Biol. 48:443-453 para encontrar o alinhamento de duasseqüências completas que maximize o número de pareamentos eminimize o número de gaps. O GAP considera todos osalinhamentos e posições de gap possíveis e cria oalinhamento com o maior número de bases emparelhadas e omenor número de gaps. Ele possibilita a provisão de umapenalidade de criação de gap e uma penalidade de extensãode gap em unidades de bases emparelhadas. O GAP precisa terum ganho de número de pareamentos de penalidade de criaçãode gap para cada gap que ele insere. Se for escolhida umapenalidade de extensão de gap maior do que zero, o GAPprecisa, adicionalmente, ter um ganho para cada gapinserido do comprimento do gap vezes a penalidade deextensão de gap. Os valores de penalidade de criação de gapde default e os valores de penalidade de extensão de gap naVersão 10 do GCG Wisconsin Genetics Software Package paraseqüências de proteina são 8 e 2, respectivamente. Paraseqüências de nucleotideos a penalidade de criação de gapde default é 50 enquanto que a penalidade de extensão degap de default é 3. As penalidades de criação de gap e deextensão de gap podem ser expressas como um número inteiroselecionado do grupo de números inteiros consistindo de 0até 200. Portanto, por exemplo, as penalidades de criaçãode gap e de extensão de gap podem ser 0, 1, 2, 3, 4, 5, 6,7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 oumaiores.
O GAP apresenta um membro da família dos melhoresalinhamentos. Pode haver muitos membros nesta familia, enenhum outro membro possui a melhor qualidade. O GAPapresenta quatro valores de mérito para alinhamentos:Qualidade, Razão, Identidade e Similaridade. A qualidade éo métrico maximizado de modo a alinhar as seqüências. ARazão é a qualidade dividida pelo número de bases nosegmento mais curto. A Identidade Percentual é apercentagem dos símbolos que realmente emparelham. ASimilaridade Percentual é a percentagem dos símbolos quesão similares. Os símbolos que atravessam a partir dos gapssão ignorados. É contado o escore de uma similaridadequando o valor da matriz de contagem de escore para um parde símbolos for maior que ou igual a 0,50, a similaridadelimiar. A matriz de contagem de escore usada na Versão 10..do GCG Wisconsin Genetics Software Package é BLOSUM62 (verHenikoff e Henikoff (1989) Proc. Natl. Acad. Sei. USA89:10915).
(c) Como aqui usada, a "identidade de seqüência" ou"identidade" no contexto de duas seqüências depolinucleotideo ou polipeptideo faz referência aos resíduosnas duas seqüências que são as mesmas quando alinhadas paraa máxima correspondência ao longo de uma janela decomparação especificada. Quando a percentagem de identidadede seqüência é usada com referência a proteínas, éreconhecido que as posições de resíduo que não foremidênticas freqüentemente diferem por substituiçõesconservativas de aminoácidos, onde resíduos de aminoácidosão substituídos por outros resíduos de aminoácidos compropriedades químicas semelhantes (por exemplo, carga ouhidrofobicidade) e, portanto, não mudam as propriedadesfuncionais da molécula. Quando as seqüências diferem emsubstituições conservativas, a identidade de seqüênciapercentual pode ser ajustada para cima para corrigir anatureza conservativa da substituição. Seqüências quediferem por tais substituições conservativas são ditaspossuírem "similaridade de seqüência" ou "similaridade". Osmeios para fazer este ajuste são bastante conhecidosdaqueles especialistas na técnica. Tipicamente isto envolvea contagem de escore de uma substituição conservativa comoum emparelhamento desigual parcial ao invés de umemparelhamento desigual total, aumentando, por esse meio, apercentagem de identidade de seqüência. Assim, por exemplo,quando a um aminoácido idêntico for dado um escore de 1 e auma substituição não-conservativa for dado um escore dezero, a uma substituição conservativa é dado um escoreentre zero e 1. A contagem de escore de substituiçõesconservativas é calculada, por exemplo, como implementadano programa PC/GENE (Intelligenetics, Mountain View,Califórnia).
(d) Como aqui usada, a "percentagem de identidade deseqüência" significa o valor determinado por comparação deduas seqüências alinhadas de modo ótimo ao longo de umajanela de comparação, sendo que a porção da seqüência depolinucleotídeo na janela de comparação pode compreenderadições ou deleções (ou seja, gaps) quando comparada com aseqüência de referência (a qual não compreende adições oudeleções) para o alinhamento ótimo das duas seqüências. Apercentagem é calculada para determinar o número deposições nas quais ocorre a idêntica base de ácido nucléicoou o idêntico residuo de aminoácido em ambas as seqüênciaspara produzir o número de posições pareadas, dividindo onúmero de posições pareadas pelo número total de posiçõesna janela de comparação, e multiplicando o resultado por100 para produzir a percentagem de identidade de seqüência.
O uso do termo "polinucleotideo" não tem a intenção delimitar as concretizações a polinucleotideos compreendendoDNA. Aqueles especialistas na técnica reconhecerão quepolinucleotideos podem compreender ribonucleotideos ecombinações de ribonucleotideos e desoxirribonucleotideos.Tais desoxirribonucleotideos e ribonucleotideos incluemambos, as moléculas de ocorrência natural e os análogossintéticos. Os polinucleotideos das concretizações tambémenglobam todas as formas de seqüências incluindo, mas nãoestando limitadas a, formas de simples-fita, formas dedupla-fita e semelhantes.
Os polinucleotideos isolados das concretizações podemser incorporados em constructos de DNA recombinante capazde introdução e replicação em uma célula hospedeira. Um"vetor" pode ser um constructo tal que inclui um sistema dereplicação e seqüências que são capazes de transcrição etradução de uma seqüência codificante de polipeptideo emuma dada célula hospedeira. Inúmeros vetores apropriadospara a transfecção estável de plantas transgênicas têm sidodescritos, por exemplo, Pouwels et al. , Cloning Vectors: ALaboratory Manual, 1985, supp. 1987; Weissbach e Weissbach,Methods for Plant Molecular Biology, Academic Press, 1989;e Flevin et al., Plant Molecular Biology Manual, KluwerAcademic Publishers, 1990. Tipicamente, os vetores deexpressão em planta incluem, por exemplo, um ou mais genesde planta clonados sob o controle de transcrição deseqüências de regulação 5' e 3' e um marcador selecionáveldominante. Tais vetores de expressão em planta também podemconter uma região de regulação de promotor (por exemplo,uma expressão de região de regulação de controle induzivelou constitutivo, regulada por condições ambientais ou dedesenvolvimento, ou célula- ou tecido-especifica) , um sitiode partida de iniciação de transcrição, um sitio de ligaçãoa ribossomo, um sinal de processamento de RNA, um sitio determinação de transcrição, e/ou um sinal de poliadenilação.
Os termos "constructo recombinante", "cassete deexpressão", "constructo de expressão", "constructoquimérico", "constructo", "constructo de DNA recombinante"e "fragmento de DNA recombinante" são aqui usadosindiferentemente e são fragmentos de ácido nucléico. Umconstructo recombinante compreende uma combinaçãoartificial de fragmentos de ácido nucléico, incluindo, masnão estando limitado a, seqüências de regulação ecodificantes que não são encontradas juntas na natureza.
Por exemplo, um constructo de DNA recombinante podecompreender seqüências de regulação e seqüênciascodificantes que são derivadas de diferentes fontes earrumadas em uma maneira diferente daquela encontrada nanatureza. Tais constructos podem ser usados por si mesmosou podem ser usados em conjugação com um vetor. Se forusado um vetor, então a escolha do vetor é dependente dométodo que será usado para transformar as célulashospedeiras, como é bastante conhecido dos especialistas natécnica. Por exemplo, pode ser usado um vetor plasmidial.
Os especialistas na técnica estão bem familiarizados com oselementos genéticos que devem estar presentes no vetor dede modo a transformar com sucesso, selecionar e propagarcélulas hospedeiras que compreendem quaisquer dosfragmentos de ácido nucléico isolado das concretizações. 0screening para obter as linhagens que apresentam o nivel epadrão de expressão desejado dos polinucleotideos ou dolócus de Regi pode ser realizado por amplificação, análiseSouthern de DNA, análise northern da expressão de mRNA,análise immunoblotting de expressão de proteina, análisefenotipica, e semelhantes.
O termo "construeto de DNA recombinante" se refere aum construeto de DNA montado a partir de fragmentos deácido nucléico obtido de diferentes fontes. Os tipos eorigens dos fragmentos de ácido nucléico podem ser muitodiversos.
Em algumas concretizações, são adicionalmente providoscassetes de expressão compreendendo um promotoroperacionalmente ligado a uma seqüência de nucleotideosheteróloga das concretizações. Os cassetes de expressão dasconcretizações encontram uso na geração de plantastransformadas, células de planta e microrganismos e naprática de métodos para induzir resistência da planta apatógeno de fungo aqui revelada. 0 cassete de expressãoincluirá seqüências de regulação 5' e 3' operacionalmenteligadas a um polinucleotideo das concretizações. 0 termo"operacionalmente ligado" tem a intenção de significar umaligação funcional entre dois ou mais elementos. As"seqüências de regulação" se referem a nucleotideoslocalizados a montante (seqüências não-codificantes 5' ) ,dentro ou a jusante (seqüências não-codificantes 3') de umaseqüência codificante, e que podem influenciar atranscrição, o processamento de RNA, a estabilidade, atradução da seqüência codificante associada. As seqüênciasde regulação podem incluir, mas não estão limitadas a,promotores, seqüências lider de tradução, introns eseqüências de reconhecimento de poliadenilação. Porexemplo, uma ligação operável entre um polinucleotideo deinteresse e uma seqüência de regulação (um promotor, porexemplo) é uma ligação funcional que permite a expressão dopolinucleotideo de interesse. Os elementos operacionalmenteligados podem ser contínuos ou não-continuos. Quando usadopara se referir a uma união de duas regiões codificantes deproteína, o termo operacionalmente ligado tem a intenção designificar que as regiões codificantes estão no mesmoquadro de leitura. O cassete pode ainda conter pelo menosum gene adicional para ser co-transformado dentro doorganismo. Alternativamente, o(s) gene(s) adicional(ais)pode(m) ser provido(s) em cassetes múltiplos de expressão.Tal cassete de expressão é provido com uma pluralidade desitios de restrição e/ou sitios de recombinação parainserção do polinucleotideo que codifica um polipeptideoantipatogênico para ficar sob a regulação de transcriçãodas regições de regulação. O cassete de expressão podeadicionalmente conter genes marcadores selecionáveis.
O cassete de expressão incluirá, na direção detranscrição 5'-3', uma região de iniciação de transcrição(ou seja, um promotor), região de iniciação de tradução, umpolinucleotideo das concretizações, uma região determinação da tradução e, opcionalmente, uma região determinação de transcrição funcional no organismohospedeiro. As regiões de regulação (ou seja, promotores,regiões de regulação de transcrição e regiões de terminaçãode tradução) e/ou o polinucleotideo das concretizaçõespodem ser nativos/análogos com relação à célula hospedeiraou de uma em relação à outra. Alternativamente, as regiõesde regulação e/ou os polinucleotideos das concretizaçõespodem ser heteterólogas com relação à célula hospedeira oude uma em relação à outra. Como aqui usado, o termo"heterólogo", com referência a uma seqüência é umaseqüência que se origina de espécies estrangeiras, ou, se apartir da mesma espécie, está substancialmente modificadacom relação à sua forma natural em composição e/ou lócusgenômico por deliberada intervenção humana. Por exemplo, umpromotor operacionalmente ligado a um polinucleotideoheterólogo é oriundo de uma espécie diferente da espécie apartir da qual o polinucleotideo foi derivado, ou se damesma/análoga espécie, um ou ambos estão substancialmentemodificados com relação à sua forma original e/ou lócusgenômico, ou o promotor não é o promotor natural para opolinucleotídeo operacionalmente ligado.
A região de terminação opcionalmente incluida pode sernatural com relação à região de iniciação de transcrição,pode ser natural com relação ao polinucleotideo deinteresse operacionalmente ligado, pode ser natural comrelação à planta hospedeira, ou pode ser derivada de umaoutra fonte (ou seja, estrangeira ou heteróloga) comrelação ao promotor, ao polinucleotideo de interesse, aohospedeiro, ou a qualquer combinação dos mesmos. Estãodisponíveis regiões de terminação convenientes a partir doplasmidio-Ti de A. tumefaciens, tais como as regiões determinação da octopina sintase e nopalina sintase. Vertambém Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al.(1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell2:1261^-1272; Munroe et al. (1990) Gene 91:151-158; Bailaset al. (1989) Nucleic Acids Res. 17:7891-7903; e Joshi etal. (1987) Nucleic Acids Res. 15:9627-9639. Emconcretizações particulares, é usado o terminador do geneII do inibidor de protease de batata (Pinll) . Ver, porexemplo, Keil et al. (1986) Nucl. Acids Res. 14:5641-5650;e An et al. (1989) Plant Cell 1:115-122, aqui incorporadosa título de referências em sua integralidade.
Inúmeros promotores podem ser usados na prática dasconcretizações, incluindo o promotor natural da seqüênciade polinucleotídeo de interesse. Os promotores podem serselecionados com base no resultado desejado. Uma amplafaixa de promotores de planta é discutida na recenterevisão de Potenza et al. (2004) In Vitro Cell Dev Biol -Plant 40:1-22, aqui incorporada a titulo de referência. Porexemplo, os ácidos nucléicos podem ser combinados compromotores constitutivos, tecido-preferidos, patógeno-induziveis ou outros promotores para expressão em plantas.
Tais promotores constitutivos incluem, por exemplo, opromotor de núcleo do promotor Rsyn7 e outros promotoresconstitutivos descritos no WO 99/43838 e patente US6.072.050; o promotor de núcleo de 35S de CaMV (Odell etal. (1985) Nature 313:810-812); actina de arroz (McElroy etal. (1990) Plant Cell 2:163-171); ubiquitina (Christensenet al. (1989) Plant Mol. Biol. 12:619-632 e Christensen etal. (1992) Plant Mol. Biol. 18:675-689); pEMU (Last et al.(1991) Theor. Appl. Genet. 81:581-588); MAS (Velten et al.(1984) EMBO J. 3:2723-2730); promotor da ALS (US5.659.026), e semelhantes. Outros promotores constitutivosincluem, por exemplo, os descritos nas patentes US5.608.149; US 5.608.144; US 5.604.121; US 5.569.597; US5.466.785; US 5.399.680; US 5.268.463; US 5.608.142; e US6.177.611.
Algumas vezes, pode trazer beneficio a expressão dogene a partir de um promotor induzivel, particularmente apartir de um promotor patógeno-induzivel. Tais promotoresincluem aqueles oriundos de proteínas patogênese-relacionadas (proteínas PR), as quais são induzidas aseguir à infecção por um patógeno, por exemplo, proteínasPR, proteínas SAR, beta-1,3-glucanase, chitinase, etc. Ver,por exemplo, Redolfi et al. (1983) Neth. J. Plant Pathol.89:245-254; Uknes et al. (1992) Plant Cell 4:645-656; e VanLoon (1985) Plant Mol. Virol. 4:111-116. Ver também WO99/43819, aqui incorporado a título de referência.
São de interesse os promotores que resultam emexpressão de uma proteína localmente em ou perto do sítiode infecção pelo patógeno. Ver, por exemplo, Marineau etal. (1987) Plant Mol. Biol. 9:335-342; Matton et al. (1989)Molecular Plant-Microbe Interactions 2:325-331; Somsisch etal. (1986) Proc. Natl. Acad. Sei. USA 83:2427-2430;Somsisch et al. (1988) Mol. Gen. Genet. 2 : 93-98; e Yang(1996) Proc. Natl. Acad. Sei. USA 93:14972-14977. Vertambém, Chen et al. (1996) Plant J. 10:955-966; Zhang etal. (1994) Proc. Natl. Acad. Sei. USA 91:2507-2511; Warneret al. (1993) Plant J. 3:191-201; Siebertz et al. (1989)Plant Cell 1:961-968; patente US 5.750.386 (nematódeo-induzível); e as referências aqui citadas. De particularinteresse é o promotor induzível para o gene PRms de milho,cuja expressão é induzida pelo patógeno Fusariummoniliforme (ver, por exemplo, Cordero et al. (1992)Physiol. Mol. Plant Path. 41:189-200).
Adicionalmente, como os patógenos entram nas plantasatravés de feridas ou danos provocados por insetos, podeser usado um promotor ferida-induzível nas construções dasconcretizações. Tais promotores ferida-induzíveis incluemgene de inibidor de proteinase de batata (pin II) (Ryan(1990) Ann. Rev. Phytopath. 28:425-449; Duan et al. (1996)Nature Biotechnology 14:4 94-4 98); wunl e wun2, patente US5.428.148; winl e win2 (Stanford et al. (1989) Mol. Gen.Genet. 215:200-208); sistemina (McGurl et al. (1992)Science 225:1570-1573); WIP1 (Rohmeier et al. (1993) PlantMol. Biol. 22:783-792; Eckelkamp et al. (1993) FEBS Letters323:73-76); gene' MPI (Corderok et al. (1994) Plant J.6(2):141-150); e semelhantes, aqui incorporados a titulo dereferência.
Os promotores quimico-regulados podem ser usados paramodular a expressão de um gene em uma planta através daaplicação de um regulador quimico exógeno. Dependendo doobjetivo, o promotor pode ser um promotor quimico-induzivel, quando a aplicação da substância química induz aexpressão gênica, ou um promotor quimico-suprimivel, quandoa aplicação da substância quimica suprime a expressãogênica. Os promotores quimico-induziveis são conhecidos noestado da técnica e incluem, mas não estão limitados a,promotor In2-2 de milho, que é ativado por antídotos deherbicida de benzeno-sulfonamida, promotor GST de milho,que é ativado por compostos eletrofilicos hidrofóbicos quesão usados como herbicidas pré-emergentes, e promotor PR-lade tabaco, que é ativado por ácido salicilico. Outrospromotores quimico-regulados de interesse incluempromotores esteróide-responsivos (ver, por exemplo, opomotor glucocorticóide-induzivel em Schena et al. (1991)Proc. Natl. Acad. Sei. USA 88:10421-10425 e McNellis et al.(1998) Plant J. 14 (2) : 247-257) e promotores tetraciclina-induzivel e tetraciclina-suprimivel (ver, por exemplo, Gatzet al. (1991) Mol. Gen. Genet. 227:229-237, e patentes US5.814.618 e US 5.789.156), aqui incorporados a titulo dereferência.
Os promotores tecido-preferidos podem ser utilizadospara direcionar a expressão melhorada dos polipeptideos dasconcretizações dentro de um tecido de planta particular.Por exemplo, um promotor tecido-preferido pode ser usadopara expressar um polipepetideo em um tecido de planta ondea resistência à doença é particularmente importante, taiscomo, por exemplo, as raizes, colmo ou as folhas. Ospromotores tecido-preferidos incluem Yamamoto et al. (1997)Plant J. 12 (2) :255-265; Kawamata et al. (1997) Plant CellPhysiol. 38 (7) :792-803; Hansen et al. (1997) Mol. GenGenet. 254(3):337-343; Russell et al. (1997) TransgenicRes. 6(2):157-168; Rinehart et al. (1996) Plant Physiol.112(3):1331-1341; Van Camp et al. (1996) Plant Physiol.112(2):525-535; Canevascini et al. (1996) Plant Physiol.112(2):513-524; Yamamoto et al. (1994) Plant Cell Physiol.35(5):773-778; Lam (1994) Results Probl. Cell Differ.20:181-196; Orozco et al. (1993) Plant Mol Biol.23(6) :1129-1138; Matsuoka et al. (1993) Proc Natl. Acad.Sei. USA 90(20):9586-9590; e Guevara-Garcia et al. (1993)Plant J. 4 (3) :495-505. Tais promotores podem sermodificados, se necessário, para expressão fraca.
Os promotores tecido vascular-preferidos sãoconhecidos no estado da técnica e incluem aquelespromotores que seletivamente dirigem a expressão em, porexemplo, tecido de xilema e tecido de floema. Os promotorestecido vascular-preferidos incluem, mas não estão limitadosa, promotor do gene de prunasin hidrolase de Prunusserotina (ver, por exemplo, Pedido de Patente Internacionalpublicado WO 03/006651), e também aqueles encontrados noPedido de Patente de No. de série 10/109.488.
Os promotores colmo-preferidos podem ser usados paradirigir a expressão de um polipeptideo das concretizações.Promotores colmo-preferidos exemplificativos incluem opromotor do gene MS8-15 de milho (ver, por exemplo, patenteUS 5.986.174 e Pedido de Patente Internacional publicado WO98/00533), e aqueles encontrados em Graham et al. (1997)Plant Mol Biol 33(4): 729-735.
Os promotores folha-preferidos são conhecidos noestado da técnica. Ver, por exemplo, Yamamoto et al. (1997)Plant J. 12 (2) :255-265; Kwon et al. (1994) Plant Physiol.105:357-67; Yamamoto et al. (1994) Plant Cell Physiol.35 (5) :773-778; Gotor et al. (1993) Plant J. 3:509-18;Orozco et al. (1993) Plant Mol. Biol. 23(6) :1129-1138; eMatsuoka et al. (1993) Proc. Natl. Acad. Sei. USA90 (20) :9586-9590.
Os promotores raiz-preferidos são conhecidos no estadoda técnica e podem ser selecionados dos muito disponiveis apartir da literatura ou isolados pela primeira vez a partirde várias espécies compatíveis. Ver, por exemplo, Hire etal. (1992) Plant Mol. Biol. 20 (2):207-218 (gene deglutamina sintetase raiz-específico de soja); Keller eBaumgartner (1991) Plant Cell 3 (10):1051-1061 (elemento decontrole raiz-específico no gene GRP 1.8 de feijãofrancês); Sanger et al. (1990) Plant Mol. Biol. 14(3):433-443 (promotor raiz-específico do gene da manopina sintase(MAS) de Agrobacterium tumefadens) ; e Miao et al. (1991)Plant Cell 3(l):ll-22 (clone de cDNA de comprimentocompleto codificante de glutamina sintetase (GS)citosólica, que é expressado em raízes e nódulos de raiz desoja). Ver também Bogusz et al. (1990) Plant Cell 2(7):633-641, onde são descritos dois promotores raiz-específicosisolados de genes de hemoglobina oriundos do não-legumefixador de nitrogênio Parasponia andersonii e o não-legumenão-fixador de nitrogênio relacionado Trema tomentosa. Ospromotores desses genes foram ligados a um gene repórter de(3-glucuronidase e introduzidos em ambos, o não-legumeNicotiana tabacum e o legume Lotus corniculatus, e em ambasas circunstâncias, a atividade de promotor raiz-específicoficou preservada. Leach e Aoyagi (1991) descrevem suaanálise dos promotores dos genes raiz-induzíveis rolC erolD altamente expressados de Agrobacterium rhizogenes (verPlant Science (Limerick) 79 (1) : 69-76) . Eles concluíram queo enhancer e os determinantes do DNA tecido-preferido estãodissociados naqueles promotores. Teeri et al. (1989) usarama fusão de gene ao lacZ para mostrar que o gene de T-DNA deAgrobacterium codificante da octopina sintase éespecialmente ativo na epiderme da ponta da raiz e que ogene TR2' é específico para raiz na planta intacta e éestimulado por meio de ferimento em tecido de folha, umacombinação especialmente desejável de características parauso com um gene inseticida ou larvicida (ver EMBO J.8(2):343-350) . O gene TR1', fundido ao nptll (neomicinafosfotransferase II) mostrou semelhantes características.Promotores raiz-preferidos adicionais incluem o promotor dogene VfENOD-GRP3 (Kuster et al. (1995) Plant Mol. Biol.29 (4) :759-772) ; e o promoter de rolB (Capana et al. (1994)Plant Mol. Biol. 25 (4) :681-691. Ver também patentes US5.837.876; US 5.750.386; US 5.633.363; US 5.459.252; US5.401.836; US 5.110.732; e US 5.023.179.
Os promotores semente-preferidos incluem ambos, ospromotores "semente-especificos" (aqueles promotores ativosdurante o desenvolvimento de semente, tais como ospromotores de proteínas de reserva de semente), bem como ospromotores "semente-germinadores" (aqueles promotoresativos durante a germinação da semente). Ver Thompson etal. (1989) BioEssays 10:108, aqui incorporado a titulo dereferência. Tais promotores semente-preferidos incluem, enão estão limitados a, Ciml (mensagem citocinina-induzida);CZ19B1 (zeina de 19 kDa de milho); milps (mio-inositol-1-fosfato sintase) (ver WO 00/11177 e patente US 6.225.529;aqui incorporadas a titulo de referência) . O gamma-zeina éum promotor endosperma-especifico preferido. O glob-1 é umpromotor embrião-especifico preferido. Para dicotiledôneas,os promotores semente-especificos incluem, e não estãolimitados a, (3-faseolin de feijão, napin, (3-conglicinin,lectina de soja, cruciferina, e semelhantes. Para asmonocotiledôneas, os promotores semente-especificosincluem, e não estão linmitados a, zeína de 15 kDa demilho, zeina de 22 kDa, zeina de 27 kDa, g-zeina, waxy,shrunken 1, shrunken 2, globulin 1, etc. Ver também WO500/12733, onde são descritos promotores semente-preferidosoriundos dos genes endl e end2; aqui incorporados a titulode referência.
São conhecidas modificações adicionais de seqüênciapara melhorar a expressão gênica em um hospedeiro celular.Elas incluem a eliminação de seqüências codificantes desinais espúrios de poliadenilação, sinais de sitio deprocessamento exon-intron, repetições semelhantes atransposon e outras tais seqüências bem caracterizadas quepodem ser prejudiciais à expressão gênica. 0 teor de G-C daseqüência pode ser ajustado a niveis médios para um dadohospedeiro celular, como calculado com referência aos genesconhecidos expressados na célula hospedeira. Quandopossivel, a seqüência é modificada para evitar estruturashairpin de mRNA secundário.
Os cassetes de expressão podem adicionalmente conterseqüências lider 5'. Tais seqüências lider podem atuar paramelhorar a tradução. Os lideres de tradução são conhecidos25 do estado da técnica e incluem: lideres de picornavirus,por exemplo, lider de EMCV (região não-codificante 5' deEncefalomiocardite) (Elroy-Stein et al. (1989) Proc. Natl.Acad. Sei. USA 8 6:612 6-6130); lideres de potyvirus, porexemplo, líder de TEV (Tobacco Etch Vírus) (Gallie et al.(1995) Gene 165 (2): 233-238), líder MDMV (Maize Dwarf MosaicVírus), e proteína de ligação de cadeia-longa deimunoglobulina humana (BiP) (Macejak et al. (1991) Nature353:90-94); líder não-traduzido oriundo do mRNA de proteínade capa do vírus de mosaico de alfafa (AMV RNA 4) (Joblinget al. (1987) Nature 325:622-625); líder de vírus demosaico de tabaco (TMV) (Gallie et al. (1989) in MolecularBiology of RNA, ed. Cech (Liss, New York), pp. 237-256); elíder de vírus mosqueado clorótico de milho (MCMV) (Lommelet al. (1991) Virology 81:382-385). Ver também,Della-Cioppa et al. (1987) Plant Physiol. 84:965-968.Também podem ser utilizados outros métodos conhecidos demelhorar a tradução, por exemplo, introns, e semelhantes.
No preparo do cassete de expressão, os váriosfragmentos de DNA podem ser manipulados de modo a prover asseqüências de DNA na orientação própria e, quandoapropriado, no quadro de leitura próprio. Para estafinalidade, podem ser empregados adaptadores e linkers paraunir os fragmentos de DNA ou podem estar envolvidas outrasmanipulações para prover os sítios de restriçãoconvenientes, a remoção do DNA supérfluo, a remoção dossítios de restrição, ou semelhantes. Para este propósitopodem estar envolvidos, mutagênese in vitro, reparo deprimer, restrição, anelamento, re-substituições, porexemplo, transições e transversões.
O cassete de expressão também pode compreender um genede marcador selecionável para a seleção de célulastransformadas. Os genes de marcador selecionável sãoutilizados para a seleção de células ou tecidostransformados. Os genes de marcador incluem genescodificantes de resistência a antibiótico, tais comoaqueles codificantes de neomicina fosfotransferase II (NEO)e higromicina fosfotransferase (HPT), assim como os genesque conferem resistência a compostos herbicidas, tais comoglufosinato de amônio, bromoxinil, imidazolinonas, e 2,4-diclorofenoxiacetato (2,4-D). Os marcadores selecionáveisadicionais incluem marcadores fenotipicos tais como (S-galactosidase e proteínas fluorescentes tais como proteínaverde fluorescente (GFP) (Su et al. (2004) BiotechnolBioeng 85:610-9 e Fetter et al. (2004) Plant Cell 16:215-28), proteína ciano fluorescente (CYP) (Bolte et al. (2004)J. Cell Science 117:943-54 e Kato et al. (2002) PlantPhysiol 125:913-42), e proteína amarelo fluorescente(PhiYFP™ a partir de Evrogen, ver, Bolte et al. (2004) J.Cell Science 117:943-54). Para marcadores selecionáveisadicionais, ver, em geral, Yarranton (1992) Curr. Opin.Biotech. 3:506-511; Christopherson et al. (1992) Proc. Natl.Acad. Sei. USA 89:6314-6318; Yao et al. (1992) Cell 71:63-72; Reznikoff (1992) Mol. Microbiol. 6:2419-2422; Barkley etal. (1980) em The Operon, pp. 177-220; Hu et al. (1987) Cell48:555-566; Brown et al. (1987) Cell 49:603-612; Figge etal. (1988) Cell 52:713-722; Deuschle et al. (1989) Proc.Natl. Acad. Aci. USA 86:54 00-54 04; Fuerst et al. (1989)Proc. Natl. Acad. Sei. USA 86:254 9-2553; Deuschle et al.(1990) Science 248:480-483; Gossen (1993) Tese de Ph.D.,Universidade de Heidelberg; Reines et al. (1993) Proc. Natl.Acad. Sei. USA 90:1917-1921; Labow et al. (1990) Mol. Cell.Biol. 10:3343-3356; Zambretti et al. (1992) Proc. Natl.Acad. Sei. USA 89:3952-3956; Baim et al. (1991) Proc. Natl.Acad. Sei. USA 88:5072-507 6; Wyborski et al. (1991) NucleicAcíds Res. 19:4647-4653; Hillenand-Wissman (1989) TopicsMol. Struc. Biol. 10:143-162; Degenkolb et al. (1991)Antimicrob. Agents Chemother. 35:1591-1595; Kleinschnidt etal. (1988) Biochemistry 27:1094-1104; Bonin (1993) Tese dePh.D., Universidade de Heidelberg; Gossen et al. (1992)Proc. Natl. Acad. Sei. USA 8 9:5547-5551; Oliva et al. (1992)Antimicrob. Agents Chemother. 36:913-919; Hlavka et al.(1985) Handbook of Experimental Pharmacology, Vol. 78(Springer-Verlag, Berlin); Gill et al. (1988) Nature334:721-724. Tais descrições são aqui incorporadas a titulode referência.
A lista acima de genes de marcador selecionável nãosignifica ser limitativa. Qualquer gene de marcadorselecionável pode ser usado nas concretizações.
O gene das concretizações pode ser expressado como umtransgene de modo a produzir plantas resistentes a Cg.Usando os diferentes promotores descritos em algum lugarnesta descrição, será possibilitada a sua expressão em umaforma modulada em diferentes circunstâncias. Por exemplo,podem ser desejados niveis mais altos de expressão emcolmos para melhorar a resistência à podridão do colmocausada por Cg. Em ambientes onde a queima das folhascausada por Cg for mais do que um problema, as linhagenscom niveis mais altos de expressão em folhas podem serusadas. Entretanto, também se pode inserir o gene inteiro,tendo ambos, o promotor e a seqüência codificante,naturais, como um transgene. Finalmente, o uso do gene dasconcretizações como um transgene possibilitará a rápidacombinação com outros caracteres, tal como a resistência ainseto ou a herbicida.
Em certas concretizações, as seqüências de ácidonucléico das concretizações pode ser montada com qualquercombinação de seqüências de polinucleotideo de interesse deforma a criar plantas com um desejado fenótipo. Estamontagem pode ser realizada por uma combinação de genesdentro do constructo de DNA, ou por meio de cruzamento deRegi com uma outra linhagem que compreende a combinação.Por exemplo, os polinucleotideos das concretizações podemser montados com quaisquer outros polinucleotideos dasconcretizações ou com outros genes. As combinações geradastambém podem incluir cópias múltiplas de qualquer um dospolinucleotideos de interesse. Os polinucleotideos dasconcretizações também podem ser montados com qualquer outrogene ou combinação de genes para produzir plantas com umavariedade de combinações de caracteres desejados,incluindo, mas não estando limitados a, caracteresdesejáveis para alimentação animal, tal como genes de altoteor de óleo (por exemplo, patente US 6.232.529);aminoácidos equilibrados (por exemplo hordotioninas(patentes US 5.990.389; US 5.885.801; US 5.885.802; e US5.703.409); cevada de alto teor de lisina (Williamson etal. (1987) Eur. J. Biochem. 165:99-106; e WO 98/20122); eproteínas de alto teor de metionina (Pedersen et al. (1986)J. Biol. Chem. 261:6279; Kirihara et al. (1988) Gene71:359; e Musumura et al. (1989) Plant Mol. Biol. 12:123)); aumentada digestibilidade (por exemplo, proteínas dereserva modificadas (Pedido de Patente US de No. de Série10/053.410, depositado em 7 de novembro de 2001); etioredoxinas (Pedido de ' Patente US de No. de Série10/005.429, depositado em 3 de Dezembro de 2001)), cujasdescrições são aqui incorporadas a título de referência. Ospolinucleotídeos das concretizações também podem sermontados com os caracteres desejáveis para resistência ainsetos, a doenças ou a herbicidas (por exemplo, proteínastóxicas de Bacillus thuringiensis (patentes US 5.366.892;US 5.747.450; US 5.737.514; US 5.723.756; US 5.593.881;Geiser et al (1986) Gene 48:109); lectinas (Van Damme etal. (1994) Plant Mol. Biol. 24:825); genes dedesintoxicação de fumonisina (patente US 5.792.931); genesde avirulêcia e de resistência a doenças (Jones et al.(1994) Science 266:789; Martin et al. (1993) Science262:1432; Mindrinos et al. (1994) Cell 78:1089); mutantesde acetolactato sintase (ALS) que conduzem a resistência aherbicida, tal como as mutações S4 e/ou Hra; inibidores deglutamina sintase, tais como fosfinotricina ou basta (porexemplo, gene bar); e resistência a glifosato (genes EPSPS,genes GAT tais como aqueles descritos no Pedido de Patentepublicado US US2004/0082770, também o WO02/36782 e oWO03/092360)) ; e caracteres desejáveis para processamentoou produtos de processo tal como alto teor em óleo (porexemplo, patente US 6.232.529 ); óleos modificados (porexemplo, genes de ácido graxo desnaturase (patente US5.952.544; WO 94/11516)); amidos modificados (por exemplo,ADPG pirofosforilases (AGPase), amido sintases (SS),enzimas de ramificação de amido (SBE) e enzimas de des-ramificação de amido (SDBE)); e polímeros ou bioplásticos(por exemplo, patente US 5.602.321; beta-cetotiolase,poliidroxibutirato sintase, e acetoacetil-CoA redutase(Schubert et al. (1988) J. Bacteriol. 170:5837-5847)facilitam a expressão de poliidroxialcanoatos (PHAs)),cujas descrições são aqui incorporadas a titulo dereferência. Também pode-se combinar os polinucleotideos dasconcretizações com polinucleotideos que forneçam caracteresagronômicos, tais como esterilidade masculina (por exemplo,ver patente US 5.583.210), resistência de colmo, tempo deflorescência, ou caracteres de tecnologia de transformaçãotais como regulação do ciclo da célula ou direcionamento dogene (por exemplo, WO 99/61619; WO 00/17364; WO 99/25821),cujas descrições são aqui incorporadas a titulo dereferência.
Essas combinações montadas podem ser criadas porqualquer método, incluindo, mas não estando limitado a,melhoramento por cruzamento de plantas por qualquermetodologia convencional ou por TopCross®, ou transformaçãogenética. Se os caracteres forem montados por transformaçãogenética de plantas, as seqüências de polinucleotideo deinteresse podem ser combinadas em qualquer momento e emqualquer ordem. Por exemplo, uma planta transgênicacompreendendo um ou mais caracteres desejados pode serusada como o alvo para introduzir caracteres adicionais porsubseqüente transformação. Os caracteres podem serintroduzidos simultaneamente em um protocolo de co-transformação com os polinucleotideos de interesse providospor qualquer combinação de cassetes de transformação. Porexemplo, se duas seqüências forem introduzidas, as duasseqüências podem estar contidas em cassetes detransformação separados (trans) ou contidos no mesmocassete de transformação (eis). A expressão das seqüênciaspode ser dirigida pelo mesmo promotor ou por promotoresdiferentes. Em certos casos, pode ser desejável introduzirum cassete de transformação que reprimirá a expressão dopolinucleotideo de interesse. Isto pode ser aliado aqualquer combinação de outros cassetes de supressão oucassetes de super-expressão para gerar a combinaçãodesejada de caracteres na planta.
Os métodos das concretizações podem envolver, e nãoficarem limitados a, introdução de um polipeptideo oupolinucleotideo em uma planta. 0 termo "introdução" tem aintenção de significar a apresentação de um polinucleotideoa uma planta. Em algumas concretizações, o polinucleotideoserá apresentado de tal maneira que a seqüência ganhaacesso ao interior da célula da planta, incluindo suainserção potencial no genoma de uma planta. Os métodos dasconcretizações não dependem de um método particular paraintroduzir uma seqüência em uma planta, dependem somente dofato de que o polinucleotideo tenha condições de ganharacesso ao interior de pelo menos uma célula da planta. Osmétodos para introduzir polinucleotideos no interior deplantas são conhecidos no estado da técnica, incluindo, masnão estado limitados a, métodos de transformação estável,métodos de transformação transiente e métodos mediados porvirus.
O termo "transformação" se refere à transferência deum fragmento de ácido nucléico para dentro do genoma de umorganismo hospedeiro, resultando em herança geneticamenteestável. Os organismos hospedeiros contendo os fragmentosde ácido nucléico transformado são referidos comoorganismos "transgênicos". O termo "célula hospedeira" serefere à célula no interior da qual a transformação doconstructo de DNA recombinante acontece e pode incluir umacélula de levedura, uma célula bacteriana e uma célula deplanta. Exemplos de métodos de transformação incluem atranformação Agrojbacterium-mediada (De Blaere et ai., 1987,Meth. Enzymol. 143:211) e a transformação por partículaacelerada ou tecnologia de transformação "arma de gene"(Klein et al., 1987, Nature (London) 327:70-73; patenteUS 4.945.050), entre outras.
O termo "transformação estável" tem a intenção designificar o fato de que o constructo de nucleotideosintroduzido em uma planta integra o genoma da planta e écapaz de ser herdado pela progênie da mesma. Os termos"transformação transiente" ou "expressão transiente" tem aintenção de significar o fato de que o polinucleotideo éintroduzido na planta e não se integra no genoma da plantaou que um polipeptideo é introduzido em uma planta.
Os protocolos de transformação, assim como osprotocolos de introdução de polipeptideos ou de seqüênciasde polinucleotideos em plantas pode variar dependendo dotipo de planta ou célula de planta, ou seja,monocotiledônea ou dicotiledônea, que é o alvo datransformação. Métodos apropriados para introduzirpolipeptideos e polinucleotideos em células de plantaincluem a microinjeção (Crossway et al. (1986)Biotechniques 4:320-334), a eletroporação (Riggs et al.(1986) Proc. Natl. Acad. Sei. USA 83:5602-5606, atransformação AgroJbacterium-mediada (patentes US 5.563.055e US 5.981.840), transferência direta de gene (Paszkowskiet al. (1984) EMBO J. 3:2717-2722), e aceleração balísticade partícula (ver, por exemplo, Sanford et al., patentes US4.945.050; US 5.879.918; US 5.886.244; e US 5.932.782;Tomes et al. (1995) in Plant Cell, Tissue, and OrganCulture: Fundamental Methods, ed. Gamborg and Phillips(Springer-Verlag, Berlin); McCabe et al. (1988)Biotechnology 6:923-926); e transformação de Lecl (WO00/28058) . Ver também Weissinger et al. (1988) Ann. Rev.Genet. 22:421-477; Sanford et al. (1987) ParticulateScience and Technology 5:27-37 (cebola); Christou et al.(1988) Plant Physiol. 87:671-674 (soja); McCabe et al.(1988) Bio/Technology 6:923-926 (soja); Finer e McMullen(1991) In Vitro Cell Dev. Biol. 27P:175-182 (soja); Singhet al. (1998) Theor. Appl. Genet. 96:319-324 (soja); Dattaet al. (1990) Biotechnology 8:736-740 (arroz); Klein et al.(1988) Proc. Natl. Acad. Sei. USA 85:4305-4309 (milho);Klein et al. (1988) Biotechnology 6:559-563 (milho);patentes US 5.240.855; US 5.322.783 e US 5.324.646; Kleinet al. (1988) Plant Physíol. 91:440-444 (milho); Froram etal. (1990) Biotechnology 8:833-839 (milho); Hooykaas-VanSlogteren et al. (1984) Nature (London) 311:763-764;patente US 5.736.369 (cereais); Bytebier et al. (1987)Proc. Natl. Acad. Sei. USA 84:5345-5349 (Liliaceae); De Wetet al. (1985) in The Experimental Manipulation of OvuleTissues, ed. Chapman et al. (Longman, New York), pp. 197-209 (pólen); Kaeppler et al. (1990) Plant Cell Reports9:415-418 e Kaeppler et al. (1992) Theor. Appl. Genet.84:560-566 (transformação mediada por sonda); D'Halluin etal. (1992) Plant Cell 4:1495-1505 (eletroporação); Li etal. (1993) Plant Cell Reports 12:250-255 e Christou e Ford(1995) Annals of Botany 75:407-413 (arroz); Osjoda et al.(1996) Nature Biotechnology 14:745-750 (milho viaAgrobacterium tumefaciens) ; todas as quais são aquiincorporadas a titulo de referência.
Os métodos são bem conhecidos no estado da técnicapara a inserção direcionada de um polinucleotideo em umalocalização especifica no genoma da planta. Em umaconcretização, a inserção do polinucleotideo em umadesejada localização genômica é alcançada usando um sistemade recombinação sitio-especifica. Ver, por exemplo,W099/25821, W099/25854, WO99/25840, W099/25855 eW099/25853, todos os quais são aqui incorporados a titulode referência. Em resumo, o polinucleotideo dasconcretizações pode estar contido em cassete detransferência flanqueado por dois sitios de recombinaçãonão-idênticos. O cassete de transferência que é introduzidoem uma planta possui estavelmente incorporado em seu genomaum sitio alvo que é flanqueado por dois sitios derecombinação não-idênticos que correspondem aos sitios docassete de transferência. É provida uma recombinaseapropriada e o cassete de transferência é integrado nositio alvo. O polinucleotideo de interesse é, por essemeio, integrado em uma posição cromossômica especifica nogenoma da planta.
As células que foram transformadas podem ser deixadasa crescer até plantas de acordo com maneiras convencionais.Ver, por exemplo, McCormick et al. (1986) Plant CellReports 5:81-84. Essas plantas podem, então, ser deixadas acrescer e serem tanto polinizadas com a mesma estirpetransformada ou com estirpes diferentes, e ser identificadaa progênie resultante tendo a expressão constitutiva dacaracterística fenotipica desejada. Duas ou mais geraçõespodem ser crescidas para assegurar que a expressão dacaracterística fenotipica desejada fique estavelmentemantida e seja herdada e, depois, sementes sejam colhidaspara assegurar que a expressão da característica fenotipicadesejada tenha sido alcançada. Desta maneira, asconcretizações fornecem semente transformada (tambémreferidas como "semente transgênica") tendo um constructode nucleotideos das concretizações, por exemplo, um cassetede expressão das concretizações, estavelmente incorporadono seu genoma.
Como aqui usado, o termo "planta" pode ser uma plantacompleta, qualquer parte da mesma, ou uma célula ou culturade tecido derivado de uma planta. Portanto, o termo"planta" pode se referir a qualquer um entre: plantasinteiras, componentes ou órgãos de planta (incluindo, masnão limitados a embriões, pólen, óvulos, sementes, folhas,flores, ramos, fruta, grãos (kernels), espigas, sabugos,palha, colmos, raizes, pontas de raiz, anteras, esemelhantes), tecidos de planta, células de planta,protoplastos de planta, culturas de tecido de célula deplanta a partir das quais a planta de milho pode serregenerada, calos de planta, aglomerados de planta esementes de planta. Uma célula de planta é uma célula que éretirada tanto diretamente de uma semente de uma plantaquanto da planta, ou derivada através do cultivo de umacélula retirada de uma planta. O termo grão {grain) tem aintenção de significar a semente madura produzida paraagricultores comerciais para propósitos diferentes docrescimento ou reprodução da espécie. A progênie, asvariantes e as mutantes das plantas regeneradas tambémestão incluídas dentro do escopo das concretizações, desdeque essas partes compreendam os polinucleotideosintroduzidos.
As concretizações da invenção podem ser usadas paraconferir ou melhorar a resistência a patógeno fúngico deplanta ou para proteger plantas do ataque de patógemofúngico, especialmente milho (Zea mays) . Serão protegidasdiferentes partes da planta do ataque de patógenos,incluindo, mas não estando limitadas a colmos, espigas,folhas, raizes e pendões. Outras espécies de planta tambémpodem ser de interesse na prática das concretizações dainvenção, incluindo, mas não estando limitadas a, outrasplantas monocotiledôneas de cultivo.
Quando apropriado, os polinucleotideos podem serotimizados para se obter expressão aumentada no organismotransformado. Por exemplo, os polinucleotideos podem sersintetizados usando códons planta-preferidos para expressãomelhorada. Ver, por exemplo, Campbell e Gowri (1990) PlantPhysiol. 92:1-11 para uma discussão da utilização de códonhospedeiro-preferido. Estão disponíveis no estado datécnica os métodos para sintetizar genes planta-preferidos.Ver, por exemplo, patentes US 5.380.831 e US 5.436.391, eMurray et al. (1989) Nucleic Acids Res. 17:477-498, aquiincorporados a titulo de referência.
As concretizações da presente invenção podem sereficazes contra uma diversidade de patógenos de planta,particularmente patógenos fúngicos, tais como, por exemplo,Colletotrichum, incluindo Cg. As concretizações da presenteinvenção também podem ser eficazes contra a podridão docolmo de milho, incluindo podridão do colmo por antracnose,sendo que o agente causador é o Colletotrichum. Outrosfungos patogênicos de planta e oomicetos (muitos, destesúltimos, historicamente têm sido considerados fungos,apesar de que agora os taxonomistas modernos estãoclassificando-os separadamente) incluem, mas não estãolimitados aos seguintes: Soja: Phytophthora megasperma fsp.glycinea, Macrophomina phaseolina, Rhizoctonia solani,Sclerotinia sclerotiorum, Fusarium oxysporum, Diaporthephaseolorum var. sojae (Phomopsis sojae), Diaporthephaseolorum var. caulivora, Sclerotium rolfsii, Cercosporakikuchii, Cercospora sojina, Peronospora manshurica,Colletotrichum dematium (Colletotichum truncatum),Corynespora cassiicola, Septoria glycines, Phyllostíctasojicola, Alternaria alternata, Microsphaera diffusa,Fusarium semitectum, Phialophora gregata, Glomerellaglycines, Phakopsora pachyrhízi, Pythium aphanidermatum,Pythium ultimum, Pythium debaryanum, Fusarium solani;Canola: Albugo cândida, Alternaria brassicae,Leptosphaeria maculans, Rhizoctonia solani, Sclerotiniasclerotiorum, Mycosphaerella brassiccola, Pythium ultimum,Peronospora parasitica, Fusarium roseum, Alternariaalternata; Alfalfa: Pythium ultimum, Pythium irregulare,Pythium splendens, Pythium debaryanum, Pythiumaphanidermatum, Phytophthora megasperma, Peronosporatrifoliorum, Phoma medicaginis var. medicaginis, Cercosporamedicaginis, Pseudopeziza medicaginis, Leptotrochilamedicaginis, Fusarium oxysporum, Verticillium albo-atrum,Aphanomyces euteiches, Stemphylium herbarum, Stemphyliumalfalfae, Colletotrichum trifolii, Leptosphaerulinabriosiana, Uromyces striatus, Sclerotinia trifoliorum,Stagnospora meliloti, Stemphylium botryosum, Leptotrochilamedicaginis; Trigo: ürocystis agropyri, Alternariaalternata, Cladosporium herbarum, Fusaríum graminearum,Fusarium avenaceum, Fusarium culmorum, Ustilago tritici,Ascochyta tritici, Cephalosporium gramineum, Collotetrichumgraminicola, Erysiphe graminis f.sp. tritici, Pucciniagraminis f.sp. tritici, Puccinia recôndita f.sp. tritici,Puccinia striiformis, Pyrenophora tritici-repentis,Septoria nodorum,' Septoria tritici, Septoria avenae,Pseudocercosporella herpotrichoides, Rhizoctonia solani,Rhizoctonia cerealis, Gaeumannomyces graminis var. tritici,Pythium aphanidermatum, Pythium arrhenomanes, Pythiumultimum, Bipolaris sorokiniana, Claviceps purpurea,Tilletia tritici, Tilletia laevis, Ustilago tritici,Tilletia indica, Rhizoctonia solani, Pythium arrhenomannes,Pythium gramicola, Pythium aphanidermatum; Girassol:Plasmophora halstedii, Sclerotinia sclerotiorum, Septoriahelianthi, Phomopsis helianthi, Alternaria helianthi,Alternaria zinniae, Botrytis cinerea, Phoma macdonaldii,Macrophomina phaseolina, Erysiphe cichoracearum, Rhizopusoryzae, Rhizopus arrhizus, Rhizopus stolonifer, Pucciniahelianthi, Verticillium dahliae, Erwinia carotovorum pv.carotovora, Cephalosporium acremonium, Phytophthoracryptogea, Albugo tragopogonis; Milho: Fusarium moniliformevar. subglutinans, Erwinia stewartií, Fusarium moniliforme,Gibberella zeae (Fusarium graminearum), Stenocarpella maydi(Diplodia maydis), Pythium irregulare, Pythium debaryanum,Pythium graminicola, Pythium splendens, Pythium ultimum,Pythium aphanidermatum, Aspergillus flavus, Bipolarismaydis 0, T (Cochliobolus heterostrophus), Helminthosporiumcarbonum I, II & III (Cochliobolus carbonum) , Exserohilumturcicum I, II & III, Helminthosporium pedicellatum,Physoderma maydis, Phyllosticta maydis, Kabatiella maydis,Cercospora sorghi, Ustilago maydis, Puccinia sorghi,Puccinia polysora, Macrophomina phaseolina, Penicilliumoxalicum, Nigrospora oryzae, Cladosporium herbarum,Curvularia lunata, Curvularia inaequalis, Curvulariapallescens, Trichoderma vir ide, Claviceps sorghi, Erwiniachrysanthemi pv. zea, Erwinia carotovora, Diplodiamacrospora, Sclerophthora macrospora, Peronosclerosporasorghi, Peronosclerospora philippinensis, Peronosclerosporamaydis, Peronosclerospora sacchari, Sphacelotheca reiliana,Physopella zeae, Cephalosporium maydis, Cephalosporiumacremonium; Sorgo: Exserohilum turcicum, Colletotrichumgraminicola (Glomerella graminicola), Cercospora sorghi,Gloeocercospora sorghi, Ascochyta sorghina, Pucciniapurpurea, Macrophomina phaseolina, Perconia circinata,Fusarium moniliforme, Alternaria alternata, Bipolarissorghicola, Helminthosporium sorghicola, Curvularia lunata,Phoma insidiosa, Ramulispora sorghi, Ramulisporasorghicola, Phyllachara sacchari, Sporisorium reilianum(Sphacelotheca reiliana), Sphacelotheca cruenta,Sporisorium sorghi, Claviceps sorghi, Rhizoctonia solani,Acremonium strictum, Sclerophthona macrospora,Peronosclerospora sorghi, Peronosclerospora philippinensis,Sclerospora graminicola, Fusarium graminearum, Fusariumoxysporum, Pythium arrhenomanes, Pythium graminicola, etc.O termo "germoplasma" se refere ao material genéticode um indivíduo ou oriundo de um indivíduo (por exemplo,uma planta) , de um grupo de indivíduos (por exemplo, umalinhagem, variedade ou família de planta) , ou de um clonederivado de uma linhagem, variedade, espécie ou cultura. 0germoplasma pode ser parte de um organismo ou célula, oupode ser separado a partir do organismo ou célula. Emgeral, o germoplasma prove o material genético com umacomposição molecular especifica que prove uma fundamentação(base) fisica para uma ou todas as qualidades hereditáriasde um organismo ou cultura de célula. Como aqui usado, ogermoplasma inclui células, sementes ou tecidos a partirdos quais novas plantas podem ser crescidas, ou partes deplanta, tais como folhas, caules, pólen, ou células quepodem ser cultivadas até se tornarem uma planta completa.
O termo "alelo" se refere a uma ou mais diferentesseqüências de nucleotideos que ocorrem em um lócusespecifico. Um primeiro alelo é encontrado em umcromossomo, enquanto que um segundo alelo ocorre na mesmaposição no homólogo daquele cromossomo, por exemplo, comoocorre para diferentes cromossomos de um indivíduoheterozigoto, ou entre diferentes homozigotos ou indivíduosheterozigotos em uma população. Um "alelo favorável" é oalelo em um lócus particular que confere, ou contribuipara, um fenótipo agronomicamente desejável, por exemplo,resistência à infecção por Cg. Um alelo favorável de ummarcador é um alelo de marcador que segrega com o fenótipofavorável. Uma forma alélica favorável de um segmento decromossomo é um segmento de cromossomo que inclui umaseqüência de nucleotideo que contribui para o desempenhoagronômico superior em um ou mais lócus genéticosfisicamente localizados no segmento do cromossomo. O termo"freqüência de alelo" se refere à freqüência (proporção oupercentagem) de um alelo dentro de uma população, ou umapopulação de linhagens. Pode-se estimar a freqüência dealelos dentro de uma população pela média de freqüências dealelos de uma amostra de indivíduos a partir daquelapopulação.
Um alelo se correlaciona "positivamente" com umcaractere quando o alelo está ligado ao caractere e quandoa presença do alelo é um indicador de que o caractere ouforma de caractere desejada ocorrerá em uma planta quecompreende o alelo.
Um indivíduo é "homozigoto" se ele possuir somente umtipo de alelo em um dado lócus (por exemplo, um indivíduodiplóide possui uma cópia do mesmo alelo em um lócus paracada um dos dois cromossomos homólogos) . Um indivíduo é"heterozigoto" se mais do que um tipo de alelo estiverpresente em um dado lócus (por exemplo, um indivíduodiplóide com uma cópia de cada um dos dois diferentesalelos) . Um caso especial de uma situação heterozigota équando um cromossomo possui um alelo de um gene e no outrocromossomo falta completamente aquele gene, lócus ou regiãoem outras palavras, tem uma deleção com relação aoprimeiro cromossomo. Esta situação é referida como"hemizigota". O termo "homogeneidade" indica que membros deum grupo possuem o mesmo genótipo em um ou mais lócusespecíficos. Em contraste com isso, o termo"heterogeneidade" é usado para indicar que indivíduosdentro do grupo diferem em genótipo em um ou mais lócusespecíficos.
As concretizações provêem não somente um gene e suasvariantes funcionais para uso em aplicações transgênicas,mas também seqüências e processos que permitem que o genede resistência Regi seja transportado entre linhagens demilho usando melhoramento assistido por marcador. Asconcretizações também se referem às plantas produzidas poresses processos que retêm um intervalo cromossômicotruncado compreendendo o gene de resistência Regi.
Um mapa genético é uma representação gráfica de umgenoma (ou uma porção de um genoma tal como um cromossomosimples) onde as distâncias entre os marcos de limite em umcromossomo são medidas pelas freqüências de recombinaçãoentre os marcos de limite. As recombinações entre marcos delimite genéticos podem ser detectadas usando umadiversidade de marcadores genéticos moleculares (tambémchamados de marcadores moleculares) que são aqui descritosem maiores detalhes.
Para que os marcadores sejam utilizáveis em detectarrecombinações, eles precisam detectar diferenças, oupolimorfismos, dentro de uma população que está sendomonitorada. Para marcadores moleculares, isto significadiferenças ao nivel de DNA devido às diferenças deseqüência de polinucleotideo (por exemplo, SSRs, RFLPs,FLPs, SNPs) . A variabilidade genética pode ser de qualquerorigem, por exemplo, inserções, deleções, duplicações,elementos de repetição, mutações pontuais, eventos derecombinação, ou a presença e seqüência de elementos detransposição. Os marcadores moleculares podem ser derivadosde ácidos nucléicos genômicos ou expressados (por exemplo,ESTs) . Os ESTs são em geral bem conservados dentro de umaespécie, enquanto que outras regiões de DNA (tipicamentenão-codificante) tendem a acumular polimorfismos e,portanto, podem ser mais variáveis entre indivíduos damesma espécie. Um grande número de marcadores molecularesde milho é conhecido no estado da técnica e estãopublicados ou disponíveis a partir de várias fontes, taiscomo o recurso de internet Maize GDB e o recurso deinternet Arizona Genomics Institute rodado pela Universidadedo Arizona.
Os marcadores moleculares podem ser usados em umadiversidade de aplicações de melhoramento de planta (ver,por exemplo, Staub et al. (1996) Hortscience 31: 729-741;Tanksley (1983) Plant Molecular Biology Repórter. 1: 3-8).
Uma das principais áreas de interesse é aumentar aeficiência de retrocruzamento e introgressão de genes usandoa seleção marcador-assistida (MAS). Um marcador molecularque mostra ligação com um lócus que afeta um desejadocaractere fenotípico prove uma ferramenta utilizável para aseleção do caractere em uma população de plantas. Isto éparticularmente verdade quando o fenótipo é difícil de seranalisado, por exemplo, muitos caracteres de resistência adoenças, ou ocorre em um estágio mais tardio nodesenvolvimento de plantas, por exemplo, características degrão. Na medida em que os ensaios de marcador de DNA sãomenos trabalhosos e ocupam menos espaço físico do que afenotipagem de campo, populações muito grandes podem seranalisadas, aumentando as chances de encontrar umrecombinante com o segmento alvo oriundo da linhagem doadoratransportado para a linhagem receptora. Quanto mais próximafor a ligação, mais utilizável será o marcador, na medida emque a recombinação é menos provável ocorrer entre o marcadore o gene causador do caractere, o que pode resultar emfalsos positivos. Com o uso de marcadores flanqueadoresdiminuem as chances de que a seleção de falso positivoocorra, tanto quanto seja necessário um evento de duplarecombinação. A situação ideal é ter um marcador no própriogene, de modo que a recombinação não possa ocorrer entre omarcador e o gene. Tal marcador é chamado um "marcadorperfeito".
Quando um gene é introgredido por MAS, não é somente ogene que é introduzido mas também as regiões flanqueadoras(Gepts. (2002). Crop Sei; 42: 1780-1790). Isto é referidocomo "arraste de ligação". No caso em que a planta doadorafor altamente não-relacionada com relação à plantareceptora, como no caso do lócus de Regi que está sendointrogredido a partir da MP305, uma fonte exótica, emendogâmicas elite, essas regiões flanqueadoras portam genesadicionais que podem codificar caracteres agronomicamenteindesejáveis. Este "arraste de ligação" também poderesultar em produtividade reduzida ou outrascaracterísticas agronômicas negativas mesmo após múltiplosciclos de retrocruzamento na linhagem de milho elite. Istotambém é algumas vezes referido como "arraste deprodutividade". O tamanho da região flanqueadora pode serdiminuído por retrocruzamento adicional, apesar de que istonão é sempre bem sucedido na medida em que os melhoristasnão têm controle sobre o tamanho da região .ou sobre osbreakpoints de recombinação (Young et al. (1998) Genetics120:57 9-585). No melhoramento clássico, usualmente, ésomente por acaso que recombinações que são selecionadascontribuem para a redução no tamanho do segmento da doadora(Tanksley et al. (1989). Biotechnology 7: 257-264). Mesmoapós 20 retrocruzamentos deste tipo, espera-se encontrar umaporção bastante grande do cromossomo da doadora ainda ligadaao gene que está sendo selecionado. Com marcadores,entretanto, é possível selecionar aqueles raros indivíduosque tenham experimentado recombinação perto do gene deinteresse. Em 150 plantas retrocruzadas, há 95% de chance deque pelo menos uma planta tenha experimentado um crossover(cruzamento) dentro de 1 cM do gene, com base em umadistância no mapa de meiose simples. Os marcadorespossibilitarão identificação inequívoca desses indivíduos.Com um retrocruzamento adicional de 300 plantas, pode haveruma chance de 95% de um crossover dentro de uma distância nomapa de meiose simples de 1 cM, gerando um segmento em tornodo gene alvo de menos que 2 cM com base em uma distância nomapa de meiose simples. Isto pode ser realizado em duasgerações com marcadores, enquanto que requereria uma médiade 100 gerações sem marcadores (ver Tanksley et al., acimamencionado). Quando a localização exata de um gene éconhecida, uma série de marcadores flanqueadores no entornodo gene pode ser utilizada para selecionar recombinações emdiferentes tamanhos de população. Por exemplo, emrecombinações de tamanhos menores de população pode seresperada uma distância adicional do gene, de modo quemarcadores flanqueadores mais distais devem ser requeridospara detectar a recombinação.
A disponibilidade de mapas de ligação integrada dogenoma de milho contendo densidades aumentadas demarcadores de milho públicos facilitou o mapeamentogenético de milho e do MAS. Ver, por exemplo, o mapaNeighbors 4 IBM2 [online], [recuperado em 21-3-2006].Recuperação feita a partir do sitio de Internet:<URL:http://www.maizegdb.org/ cgi-bin/displaymaprecord.cgi?id=871214>.
Os componentes chave para a implementação do MAS são:
(i) definir a população dentro da qual a associaçãomarcador-caractere será determinada, a qual pode ser umapopulação segregante, ou uma população aleatória ouestruturada; (ii) monitorar a segregação ou associação demarcadores polimórficos com relação ao caractere edeterminar a ligação ou associação usando métodosestatísticos; (iii) definir um conjunto de marcadoresdesejáveis com base nos resultados da análise estatística e(iv) usar e/ou extrapolar esta informação ao conjunto atualde germoplasma de melhoramento para possibilitar as decisõesda seleção baseada em marcador. Os três tipos de marcadordescritos neste relatório podem ser. usados em protocolos deseleção assistida por marcador; marcadores de repetiçãosimples de seqüência (SSR, também conhecida comomicrossatélite), marcadores de polimorfismo simples denucleotídeos (SNP) e marcadores polimórficos de comprimentode fragmento (FLP). As SSRs podem ser definidas comocorridas relativamente curtas de DNA repetido em tandem comcomprimentos de 6 pb ou menos (Tautz (1989) Nucleic AcidResearch 17: 6463-6471; Wang et al. (1994) Theoretical andApplied Genetics, 88:1-6) . Os polimorfismos surgem devido àvariação no número de unidades de repetição, provavelmentecausada por deslizamento durante a replicação de DNA(Levinson e Gutman (1987) Mol Biol Evol 4: 203-221). Avariação no comprimento da repetição pode ser detectadapelo desenho de primers de PCR para as regiõesflanqueadoras não-repetitivas conservadas (Weber e May(1989) Am J Hum Genet 44:388-396). As SSRs são altamenteapropriadas para o mapeamento e para o MAS na medida em queelas são multi-alélicas, co-dominantes, reproduzíveis ereceptivas à automação de alta produção (Rafalski et al.(1996) Generating and using DNA markers in plants. In:Non-mammalian genomic analysis: a practical guide. Academicpress . pp 75-135) .Por exemplo, no Exemplo 5 mais adiante, é provido umperfil de marcador de SSR de MP305. Este perfil de marcadorfoi gerado por eletroforese em gel dos produtos deamplificação gerados pelos pares de primers para essesmarcadores. A contagem de escore de genótipo de marcador ébaseada no tamanho do fragmento amplificado, o qual, nestecaso, foi medido por meio de peso de par de bases dofragmento. Apesar do fato de que a variação no primer usadoou nos procedimentos de laboratório podem afetar o peso dopar de bases relatado, os valores relativos permanecerãoconstantes independentemente do primer especifico ou dolaboratório usado. Portanto, quando se compara linhagens,os perfis de SSR que estão sendo comparados devem serobtidos a partir do mesmo laboratório, de modo que sejamusados os mesmos primers e equipamento. Por esta razão,quando se compara plantas ou marcadores específicos delinhagens vis à vis, é preferível determinar que taisplantas linhagens possuam os mesmos (ou diferentes) alelosem lócus específicos (por exemplo, pode-se dizer que se umaplanta não compreende o intervalo cromossômico derivado daMP305 em ou abaixo do UMC15a, ela não compreenderá alelosiguais à MP305 em todos os lócus em ou abaixo do UMC15alistados na Tabela 6 no Exemplo 5). Um serviço de SSR paramilho está disponível ao público em uma base contratual pormeio de marcos de DNA em Saint-Jean-sur-Richelieu, Quebec,Canadá.
Vários tipos de marcadores de FLP podem ser gerados.Mais comumente, primers de amplificação são usados paragerar polimorfismos de comprimento de fragmento. Taismarcadores de FLP são, em muitas maneiras, similares aosmarcadores de SSR, exceto pelo fato de que a regiãoamplificada pelos primers não é tipicamente uma regiãoaltamente repetitiva. Além disso, a região amplificada, ouamplicon, terá suficiente variabilidade entre ogermoplasma, freqüentemente devido a inserções ou deleções,de modo que os fragmentos gerados pelos primers deamplificação podem ser distinguidos entre indivíduospolimorficos, e de que é reconhecido que tais indelsocorrem freqüentemente em milho (Bhattramakki et al.(2002). Plant Mol Biol 48, 539-547; Rafalski (2002b), acimacitado). O termo "indel" se refere a uma inserção oudeleção, sendo que uma linhagem pode ser referida comotendo uma inserção com relação a uma segunda linhagem, ou asegunda linhagem pode ser referida como tendo uma deleçãocom relação à primeira linhagem. Os marcadores de MZA aquirevelados são exemplos de marcadores de FLP amplificadosque haviam sido selecionados porque eles estão em estreitaproximidade com relação ao gene Regi.
Os marcadores de SNP detectam substituições denucleotideos em par de bases simples. De todos os tipos demarcadores moleculares, os SNPs são os mais abundantes,tendo, portanto, o potencial para prover a resolução maisalta de mapa genético (Bhattramakki et al. 2002 PlantMolecular Biology 48:539-547). Os SNPs podem ser analisadosem um nível ainda mais alto de produção do que as SSRs, emum assim chamado modo 'ultra-alta-produção' ( yultra-high-throughput'), na medida em que eles não requerem grandesquantidades de DNA e a automação do ensaio pode ser direta.Os SNPs também têm o compromisso de serem sistemas de custorelativamente baixo. Esses três fatores juntos tornam osSNPs altamente atrativos para uso em MAS. Diversos métodosestão disponíveis para a genotipagem do SNP, incluindo, masnão estando limitados a, hibridização, extensão de primer,ligação de oligonucleotideo, clivagem por nuclease,miniseqüenciamento e esferas codificadas. Tais métodosforam revisados em: Gut (2001) Hum Mutat 17 pp. 475-492;Shi (2001) Clin Chem 47, pp. 164-172; Kwok (2000)Pharmacogenomics 1, pp. 95-100; Bhattramakki e Rafalski(2001) Discovery and application of single nucleotidepolymorphism markers in plants. In: R.J. Henry, Ed, PlantGenotyping: The DNA Fingerprinting of Plants, CABIPublishing, Wallingford. Uma ampla faixa de tecnologiascomercialmente disponíveis utilizam esses e outros métodospara examinar os SNPs, incluindo Masscode™ (Qiagen),Invader® (Third Wave Technologies), SnapShot® (AppliedBiosystems), Taqman® (Applied Biosystems) e Beadarrays™(Illumina).
Inúmeros SNPs juntos dentro de uma seqüência, ouatravés de seqüências ligadas, podem ser usados paradescrever um haplótipo para qualquer genótipo particular(Ching et al. (2002), BMC Genet. 3:19 pp Gupta et al. 2001,Rafalski (2002b) , acima citado) . Os haplótipos podem sermais informativos do que os SNPs simples e podem ser maisdescritivos do que qualquer genótipo particular. Porexemplo, um SNP simples pode ser o alelo >T" para a MP305,mas o alelo AT' também pode ocorrer na população demelhoramento de milho que está sendo utilizada para osparentais recorrentes. Neste caso, um haplótipo, porexemplo, uma série de alelos em marcadores de SNP ligados,pode ser mais informativo. Uma vez que um haplótipo únicotenha sido designado para uma região cromossômica dadoadora, esse haplótipo pode ser usado naquela população ouem qualquer subconjunto da mesma para se determinar se umindivíduo possui um gene particular. Ver, por exemplo,WO2003054229. O uso de plataformas de detecção de marcadorde alta produção automatizadas conhecidas daquelesespecialistas na técnica torna este processo altamenteeficiente e eficaz.
Como aqui descrito, muitos dos primers listados nasTabelas 1 e 2 podem ser usados como marcadores de FLP paraselecionar lócus de Regi. Esses "primers também podem serconvertidos nesses marcadores para SNP ou outros marcadoresestettturalmente semelhantes ou funcionalmente equivalentes(SSRs, CAPs, indels, etc), nas mesmas regiões. Umaabordagem muito produtiva para a conversão de SNP estádescrita em Rafalski (2002a) Current opinion in plantbiology 5 (2) : 94-100 e também em Rafalski (2002b) PlantScience 162: 329-333. No uso de PCR, os primers sãoutilizados para amplificar segmentos de DNA a partir deindivíduos (preferencialmente endogâmicos) que representama diversidade na população de interesse. Os produtos de PCRsão seqüenciados diretamente em uma ou ambas as direções.As seqüências resultantes são alinhadas e os polimorfismossão identificados. Os polimorfismos não estão limitados aPolimorfismos Simples de Nucleotideos (SNPs), mas tambémincluem indels, CAPS, SSRs, e VNTRs (número variável derepetições em tandem). Especificamente com relação àinformação refinada de mapa aqui descrita, pode-seprontamente usar a informação aqui provida para obter SNPs(e outros marcadores) polimórficos adicionais dentro daregião amplificada pelos primers listados nesta descrição.
Os marcadores dentro da região descrita do mapa pode serhibridizada com BACs ou outras bibliotecas genômicas, oualinhadas, por meios eletrônicos, com seqüências genômicaspara encontrar novas seqüências na mesma localizaçãoaproximada com relação aos marcadores descritos.
Em adição aos SSR's, FLPs e SNPs acima descritos,outros tipos de marcadores moleculares são tambémamplamente utilizados, incluindo, mas não estando limitadosa, marcadores [tags) de seqüências expressadas (ESTs) emarcadores de SSR derivados de seqüências EST, e DNApolimórfico aleatoriamente amplificado (RAPD). Como aquiusado, o termo "Marcador Genético" se referirá a qualquermarcador baseado em ácido nucléico, incluindo, mas nãoestando limitado a, Polimorfismo de Comprimento deFragmento de Restrição (RFLP), Repetição Simples deSeqüência (SSR), DNA Polimórfico Aleatoriamente Amplificado(RAPD), Seqüências Polimórficas Clivadas Amplificadas(CAPS) (Rafalski e Tingey, 1993, Trends in Genetics 9:275-280) , Polimorfismo de Comprimento de Fragmento Amplificado(AFLP) (Vos et al., 1995, Nucleic Acids Res. 23:4407-4414),Polimorfismo Simples de Nucleotideo (SNP) (Brookes, 1999,Gene 234:177-18 6), Região Amplificada de SeqüênciaCaracterizada (SCAR) (Paran e Michelmore, 1993, Theor.Appl. Genet. 85:985-993), Sitio Marcado {Tagged) deSeqüência (STS) (Onozaki et ai., 2004, Euphytica 138:255-262), Polimorfismo de Conformação de Simples Fita (SSCP)(Orita et al., 1989, Proc Natl Acad Sei USA 8 6:27 66-277 0),Repetição de Seqüência Inter-Simples (ISSR) (Blair et al.,1999, Theor. Appl. Genet. 98:780-792), PolimorfismoAmplificado Inter-Retrotransposon (IRAP), PolimorfismoAmplificado de Retrotransposon-Microsatélite (REMAP)(Kalendar et al. , 1999, Theor. Appl. Genet. 98:704-711), uraproduto de clivagem de RNA (tal como um tag Lynx) esemelhantes.
Mais genericamente, o termo "marcador molecular" podeser usado para se referir a um marcador genético, comodefinido acima, ou a um produto codificado pelo mesmo (porexemplo, uma proteina) usado como um ponto de referênciaquando se identifica um lócus ligado. Um marcador pode serderivado de seqüências genômicas de nucleotideos ou deseqüências expressadas de nucleotideos (por exemplo,oriundo de um RNA processado {spliced) , de um cDNA, etc),ou a partir de um polipeptideo codificado. O termo tambémse refere às seqüências de ácido nucléico complementares aou flanqueando as seqüências de marcador, tais como osácidos nucléicos usados como sondas ou pares de primercapazes de amplificar a seqüência de marcador. Uma "sondade marcador molecular" é uma seqüência de ácido nucléico oumolécula que pode ser usada para identificar a presença deum lócus de marcador, por exemplo, uma sonda de ácidonucléico que é complementar a uma seqüência de lócus demarcador. Alternativamente, em alguns aspectos, uma sondade marcador se refere a uma sonda de qualquer tipo que écapaz de distinguir (ou seja, genótipo) o alelo particularque está presente em um lócus de marcador. Ácidos nucléicossão "complementares" quando eles hibridizam especificamenteem solução, por exemplo, de acordo com as regras depareamento de bases de Watson-Crick. Alguns dos marcadoresaqui descritos também são referidos como marcadores dehibridização quando localizados em uma região de indel, talcomo a região não-colinear aqui descrita. Isto é devido aofato de que a região de inserção é, por definição, umpolimorfismo vis à vis uma planta sem a inserção. Portanto,o marcador precisa somente indicar se a região de indelestá presente ou ausente. Qualquer apropriada tecnologia dedetecção de marcador pode ser usada para identificar talmarcador de hibridização, por exemplo, a tecnologia de SNPé usada nos exemplos aqui fornecidos.
Um "ácido nucléico genômico" é um ácido nucléico quecorresponde, em seqüência, a um ácido nucléico hereditárioem uma célula. Exemplos comuns incluem DNA genômico denúcleo e amplicons do mesmo. Um ácido nucléico genômico é,em alguns casos, diferente de um RNA processado (spliced) ,ou um correspondente cDNA, em que o RNA spliced ou o cDNA éprocessado, por exemplo, por meio da maquinaria deprocessamento, para remover introns. Os ácidos nucléicosgenômicos opcionalmente compreendem seqüências não-transcritas (por exemplo, seqüências estruturais docromossomo, regiões de promotor, regiões de enhancer, etc.)e/ou não-traduzidas (por exemplo, introns), enquanto que oRNA spliced/cDNA tipicamente não possuem seqüências nãotranscritas ou introns. Um "ácido nucléico template" é umácido nucléico que serve como um molde em uma reação deamplificação (por exemplo, uma reação de amplificaçãobaseada em polimerase, tal como PCR, uma reação deamplificação mediada por ligase, tal como LCR, uma reaçãode transcrição, ou semelhante). Um ácido nucléico templatepode ser genômico na origem, ou, alternativamente, pode serderivado de seqüências expressadas, por exemplo, um cDNA ouum EST.
O termo "amplificar", no contexto de amplificação deácido nucléico é qualquer processo pelo qual são produzidascópias adicionais de um ácido nucléico selecionado (ou deuma forma transcrita do mesmo). Métodos tipicos deamplificação incluem vários métodos de replicação baseadosem polimerase, incluindo a reação em cadeia de polimerase(PCR), métodos mediados por ligase, tais como a reação emcadeia de ligase (LCR) e métodos de amplificação baseada empolimerase de RNA (por exemplo, por transcrição) . Um"amplicon" é um ácido nucléico amplificado, por exemplo, umácido nucléico que é produzido por amplificação de um ácidonucléico template por qualquer método de amplificaçãodisponível (por exemplo, PCR, LCR, transcrição ousemelhantes).
Os perfis de isozima e as características morfologicasligadas também podem, em alguns casos, ser indiretamenteusados como marcadores. Mesmo que eles não detectemdiretamente diferenças de DNA, eles freqüentemente sãoinfluenciados por diferenças genéticas específicas.Entretanto, os marcadores que detectam variação de DNA sãomuito mais numerosos e polimórficos do que os marcadores deisozima ou morfológicos (Tanksley (1983) Plant MolecularBiology Repórter 1:3-8).
Os alinhamentos de seqüência ou contigs também podemser usados para encontrar seqüências a montante ou ajusante dos marcadores específicos listados aqui. Essasnovas seqüências, próximas dos marcadores descritos aqui,são depois usadas para descobrir e desenvolver marcadoresfuncionalmente equivalentes.
Por exemplo, diferentes mapas físicos ou genéticos sãoalinhados para localizar marcadores equivalentes nãodescritos neste relatório, mas que estão dentro de regiõessimilares. Esses mapas podem estar dentro de espécies demilho, ou mesmo ao longo de outras espécies, as quais nãotenham sido geneticamente ou fisicamente alinhadas commilho, tais como arroz, trigo, cevada ou sorgo.Como observado no Exemplo 2, pelo uso de seqüênciascomuns oriundas da região flanqueadora do lócus de Regi quehibridizou com BACs nas bibliotecas do Mol7 de do BAC deB73, os BACs oriundos de ambas as bibliotecas foramdispostos com o BAC oriundo da região flanqueadora homólogaDE811ASR(BC5) do lócus de Regi em uma rota diferente(tiling path) como mostrado na Figura 9(a). Os BACs de B73públicos c0113f01 e c0117el8 foram identificados comodiretamente norte e sul, respectivamente, do lócus de Regi.
Com esta informação, uma tiling path não-contiguaestendida de BACs de B73 entre os marcadores genéticosUMC2285 e UMC15a, UMC2285 e UMC2187, UMC1086 e UMC2200, ouUMC2041 e UMC2200, pode ser criada por alinhamento demarcadores genéticos dentro desta região com o mapa fisicodo BAC de B73. A informação de alinhamento dos mapasgenético e fisico de B73 é obtida a partir da base de dadosdo genoma de milho do Arizona Genomics Institute disponívelna world wide web, acessado pela entrada do seguinteendereço na web com o prefixo "www.">:genome.arizona.edu/fpc/maize/#webagcol. Na vista WebChrom,pode-se selecionar os marcadores genéticos nas vizinhançasdo gene Regi e obter um link com o contig fisico onde essesmarcadores estão localizados. Pelo alinhamento do mapafisico com o mapa genético feito dessa maneira, pode-seencontrar um plethora de BACs de B73 na região entre osintervalos cromossômicos definidos pelos marcadoresgenéticos UMC2285 e UMC15a, UMC2285 e UMC2187, UMC1086 eUMC2200, ou UMC2041 e UMC2200. Os BACs podem ser usadospelos especialistas na técnica para desenvolver novosmarcadores para introgressão do lócus de Regi nogermoplasma de milho. Em particular, tais marcadoresgenéticos são utilizáveis no rastreamento do lócus de Regiem quaisquer linhagens nas quais o lócus de Regi ou o geneRegi tenha sido introgredido, e na seleção do genoma deparental recorrente em um programa de retrocruzamento.
Por exemplo, a informação de seqüência da região nasvizinhanças do lócus de Regi pode ser usada para desenharmarcadores polimórficos que serão utilizáveis emintrogressão e seleção do gene ou lócus de Regi em outrogermoplasma de milho. Há muitos B73 derivados decromossomos artificiais bacterianos (BACs) disponíveis naregião de interesse a partir da qual a informação deseqüência pode ser obtida. Um exemplo de BACs na região deinteresse é ilustrada na Figura 21, a qual mostra um contigno mapa fisico de B73 que é homólogo à região de Regi emDE811ASR (BC5) [Figura 21 encontrada em 10-03-2006] .Buscada a partir do sitio de Internet <URL:http://www.genome.arizona.edu/egi-bin//WebAGCoL/WebFPC/WebFPC Direct v2.1.cgi?name=maize&contig=187&marker=ssul>. A informação de seqüência é obtidatanto através de informação que já está disponível aopúblico (por exemplo, seqüência-terminal de BAC, seqüênciade Tags de Seqüência Expressada (ESTs) que hibridizam comBACs nesta região, sondas do tipo overgo (sobreposição) quefreqüentemente se relacionam com esses ESTs, etc.) ou paraobter nova seqüência pelo seqüenciamento direto de clonesde BAC nesta região. A partir desta seqüência podem serdeterminadas quais regiões são, em maioria, únicas usandodiversos métodos diferentes conhecidos dos especialistas natécnica. Por exemplo, pelo uso do software de predição degene ou pela técnica de blasting da seqüência contra todasas seqüências disponíveis de milho, pode-se selecionar aseqüência não-repetitiva. A seqüência de baixo número decópias pode ser usada para desenvolver uma ampla série demarcadores baseados em ácido nucléico. Esses marcadores sãousados para realizar o screening do material de planta noqual o lócus de Regi está presente e o material de plantano qual o lócus de Regi está ausente. Se for desejado ummarcador fora do lócus de Regi, então os marcadores sãousados para realizar o screening do material de planta noqual o lócus de Regi está presente e o material de plantano qual o lócus de Regi está ausente para se determinar seo marcador é polimórfico em tal germoplasma. Os marcadorespolimórficos são então usados na introgressão assistida pormarcador e na seleção da região de Regi e, de modo ótimo,também na seleção do genoma do parental recorrente, emoutro germoplasma de milho. Portanto, com a localização dolócus de Regi identificada e estabelecida sua associaçãocom a resistência a Colletotrichum, os especialistas natécnica podem utilizar qualquer número de marcadoresexistentes, ou prontamente desenvolver novos marcadores,que podem ser usados na introgressão ou identificação dapresença ou ausência do lócus de Regi em germoplasma, eselecionar o genoma do parental recorrente em um programade retrocruzamento.Em um mapa genético, a ligação de um marcadormolecular a um gene ou a um outro marcador molecular émedida como uma freqüência de recombinação. Em geral, osdois lócus mais próximos (por exemplo, os dois marcadoresde SSR) estão no mapa genético mais próximos do que elesficam um do outro no mapa fisico. Uma distância genéticarelativa (determinada pela sobreposição de freqüências,medida em centimorgans; cM) pode ser proporcional àdistância fisica (medida em pares de base, por exemplo, empares de quilobases [kb] ou em mega-pares de bases [Mbp] )que separa dois lócus ligados entre si em um cromossomo. Aausência de proporcionalidade precisa entre cM e adistância fisica pode resultar da variação em freqüênciasde recombinação para diferentes regiões cromossômicas, porexemplo, algumas regiões cromossômicas são recombinação dotipo "hot spots", enquanto outras regiões não mostramqualquer recombinação, ou somente demonstram raros eventosde recombinação. Alguns dos dados de introgressão e deinformação de mapeamento sugerem que a região em torno dolócus de Regi é uma daquelas que possuem uma grandequantidade de recombinação.
Em geral, quanto mais próximo um marcador estiver deum outro marcador, se medido em termos de recombinação oudistância fisica, mais fortemente eles estão ligados.Quanto mais próximo um marcador estiver de um gene quecodifica um polipeptideo que confere um fenótipo particular(resistência a doença), se medido em termos de recombinaçãoou de distância fisica, melhor aquele marcador será paramarcar o caractere fenotipico desejado. Se possível, omelhor marcador é aquele que fica dentro do próprio gene,na medida em que ele sempre permanecerá ligado com o genecausador do fenótipo desejado.
A variabilidade genética de mapeamento também pode serobservada entre diferentes populações da mesma espécie decultura, incluindo milho. A despeito desta variabilidade nomapa genético que pode ocorrer entre populações, o mapagenético e a informação de marcador derivada de umapopulação geralmente permanece utilizável ao longo demúltiplas populações na identificação de plantas comcaracteres desejados, contra-seleção de plantas comcaracteres indesejáveis e na orientação de MAS.
Na localização de marcadores equivalentes ao longo demapas genéticos, uma população de mapeamento pode ser usadapara confirmar se qualquer marcador equivalente está dentroda região aqui descrita e, portanto, utilizável na seleçãode Regi. Usando este método, o marcador equivalente,juntamente com os marcadores listados aqui, é mapeado nadita população de mapeamento. Qualquer marcador equivalenteque fique dentro da mesma região pode ser usado paraselecionar o Regi. As populações de mapeamento conhecidasdo estado da técnica e que podem ser usadas para estafinalidade incluem, mas não ficam limitadas a, populaçõesIBM e a população T218 X GT119 IF2 descrita em Sharopova,N. et al. (2002) Plant Mol Biol 4 8 (5) : 4 63-4 81 e Lee, M. etal. (1999): Tools for high resolution genetic mapping inmaize - status report. Proc. Plant Animal Genome VII,January 17-21, 1999, San Diego, USA, P. 146; a populaçãoUMC 98, descrita em Davis, G.L. et al. (1999) Genetics152 (3) : 1137-72 e em Davis, M.D. et al., (1998) The 1998 UMCMaize Genetic Map: ESTs, Sequenced Core Markers, andNonmaize Probes as a Foundation for Gene Discovery, MaizeGenetics Conference Abstracts 40.
Como aqui usado, o termo "introgressão" e"introgredir" se referirá a mover um gene ou lócus de umalinhagem para uma outra por: (1) cruzamento de indivíduosde cada linhagem para criar uma população; e (2) seleção deindivíduos que portam o gene ou lócus desejado. Após cadacruzamento, o processo de seleção é repetido. Por exemplo,o gene das concretizações, ou o lócus contendo-o, pode serintrogredido para um parental recorrente que não sejaresistente, ou seja, somente parcialmente resistente,significando que é sensível ou susceptível ou parcialmentesensível ou susceptível a Cg. A linhagem parentalrecorrente com o gene ou lócus introgredido possui, então,resistência melhorada ou recentemente conferida a Cg. Estalinhagem na qual o lócus de Regi foi introgredido éreferida aqui como uma conversão de lócus de Regi.
0 processo de introgressão é freqüentemente referidocomo "retrocruzamento" quando o processo é repetido duas oumais vezes. Na introgressão ou retrocruzamento, a parental"doadora" se refere à planta parental com o gene ou lócusdesejado a ser introgredida. A parental "receptora" (usadauma ou mais vezes) ou parental "recorrente" (usada duas oumais vezes) se refere à planta parental na qual o gene oulócus está sendo introgredido. Por exemplo, ver Ragot, M.et al. (1995) Marker-assisted backcrossing: a practicalexample, in Techniques et Utilisations des MarqueursMoleculaires (Les Colloques, Vol. 72, pp. 45-56) e Openshawet al., (1994) Marker-assisted Selection in BackcrossBreeding, Analysis of Molecular Marker Data, pp. 41-43. Ocruzamento inicial dá origem à geração Fl; o termo "BC1"então se refere ao segundo uso do parental recorrente, o"BC2" se refere ao terceiro uso do parental recorrente eassim por diante.
No caso do Regi, onde a seqüência do gene e as regiõesmuito próximas estão disponíveis, os marcadores de DNAbaseados no próprio gene ou em seqüências proximamenteligadas podem ser desenvolvidos para seleção direta do genedoador no background do parental recorrente. Apesar depoder ser usada qualquer seqüência de DNA polimórficooriundo da região cromossômica que porta o gene, asseqüências providas nas concretizações permitem o uso demarcadores de DNA dentro ou próximas do gene, minimizando aseleção de falso positivo para o gene. Os marcadores deflanqueamento limitam o tamanho dos fragmentos do genomadoador introduzidos no background do receptor, minimizando,assim, o chamado "arraste de ligação" que significa aintrodução de seqüências indesejáveis da linhagem doadora eque pode impactar no desempenho da planta em germoplasmaelite diferente. As concretizações provêem múltiplosexemplos de marcadores de DNA que podem ser assim usados, eos especialistas na técnica serão capazes de usar asseqüências genômicas providas para criarem até mesmo maismarcadores. Um exemplo é usar marcadores que hibridizam (nocaso de ensaios de RFLP) ou anelam (no caso de ensaios dePCR) especificamente (exclusivamente) com seqüênciasproximamente ligadas, incluindo aquelas dentro do lócus. Emprincipio, as seqüências que também hibridizam ou anelam emalgum lugar no genoma podem ser usadas se diversosmarcadores forem usados em combinação. Quando são usadasreações de PCR, na prática, o comprimento dos primersusados na reação de amplificação devem ter pelo menos cercade 15 nucleotideos, mas dependendo das seqüências e dascondições de hibridização, qualquer comprimento que forneçaanelamento especifico pode ser usado, tal como cerca de 16,cerca de 17, cerca de 18, cerca de 19, cerca de 20, cercade 21, cerca de 22, cerca de 23, cerca de 24, cerca de 25,cerca de 26, cerca de 27, cerca de 28 ou mais longas. Parareações de PCR, o termo "anelar" é comumente usado, e, comoaqui usado, deve ser entendido como tendo o mesmosignificado de "hibridizar".
Portanto, com o uso de marcadores e processos aquidescritos, pode-se produzir uma planta compreendendo umintervalo cromossômico truncado que compreende o lócus deRegi e/ou o gene Regi. O termo "intervalo cromossômico" ou"segmento cromossômico" se refere a um intervalo linearcontíguo de DNA genômico que reside na planta em um únicocromossomo, usualmente definido com referência a doismarcadores que definem os dois pontos extremos do intervalocromossomico. O intervalo especificado pode incluir osmarcadores nos pontos extremos (por exemplo, um ou maismarcadores em ou dentro do intervalo cromossomico definidopor marcador A e marcador B) ou pode excluir os marcadoresnos pontos extremos do intervalo (por exemplo, um ou maismarcadores dentro do intervalo cromossomico definido pelomarcador A e marcador B) . Um intervalo cromossomicotruncado se refere a um intervalo cromossomico que foireduzido em tamanho pela seleção de um ou mais eventos derecombinação que reduziram o tamanho do intervalocromossomico. Um "evento cromossomico" se refere àocorrência de recombinação entre cromossomos homólogos, ese refere a uma localização cromossômica especifica ondetal recombinação tenha ocorrido (por exemplo, umarecombinação do intervalo cromossomico interno aos pontosextremos do cromossomo terão um evento de recombinação emcada extremo do intervalo cromossomico). O intervalocromossomico truncado pode ser definido com referência a umou ambos os novos marcadores nos pontos extremos dosegmento. O comprimento dos dois segmentos cromossômicospode ser medido tanto em centimorgans como em pares debases. Os elementos genéticos ou genes localizados em umúnico intervalo cromossomico são fisicamente ligados. Otamanho de um intervalo cromossomico não é particularmentelimitado, mas, no contexto das concretizações da presenteinvenção, em geral, os elementos genéticos localizadosdentro de um intervalo cromossômico também são ligadosgeneticamente.
Pelo uso dos processos das concretizações, é possívelselecionar uma planta que compreende um intervalocromossômico truncado compreendendo o gene Regi.Especificamente, com respeito à invenção descrita emmaiores detalhes nos exemplos mais adiante, o intervalocromossômico pode ser reduzido a um comprimento de 12cM oumenos, 10 cM ou menos, 8 cM ou menos, 6 cM ou menos, 4 cMou menos, 3cM ou menos, 2,5 cM ou menos, 2 cM ou menos, 1,5cM ou menos, 1 cM ou menos, 0,7 5 cM ou menos, 0,50 cM oumenos, ou 0,25 cM ou menos, em cada caso como medido comrespeito às distâncias do mapa como mostrado no mapagenético Neighbors 4 do IBM2 colocado em prática em 21 demarço de 2006. Quando medido em pares de bases, o intervalocromossômico pode ser reduzido a um comprimento de 15 mpbou menos, 10 mpb ou menos, 5 mpb ou menos, 3 mpb ou menos,1 mpb ou menos, 500 kpb ou menos, ou 250 kpb ou menos. Osespecialistas na técnica podem compreender que é desejávelcausar uma quebra na região cromossômica bem próxima àseqüência codificante de Regi (por exemplo, dentro de 5kpbou menos, dentro de 4 kpb ou menos, 3 kpb ou menos, 2 kpbou menos, 1 kpb ou menos, ou 0,5 kpb ou menos), de modo queo promotor e os outros elementos de regulação a montantefiquem não-ligados a partir da seqüência codificante.
O termo "lócus", em geral, se refere a uma regiãogeneticamente definida de um cromossomo que porta um geneou, possivelmente, dois ou mais genes tão proximamenteligados que geneticamente eles se comportam como um únicolócus responsável por um fenótipo. Quando aqui usado comrespeito ao Regi, o "lócus de Regi" se referirá à regiãodefinida do cromossomo que porta o gene Regi incluindo suasseqüências de regulação associadas, mais a região vizinhado gene Regi que é não-colinear com B73, ou qualquer porçãomenor do mesmo que retém o gene Regi e as seqüências deregulação associadas. Este lócus também foi referido emalgum lugar como o lócus de ASR, e será aqui referido comoo lócus de Regi.
Um "gene" deve se referir a uma região genéticacodificante especifica dentro de um lócus, incluindo assuas seqüências de regulação associadas. A regiãocodificante do transcripto primário de Regi, referida aquicomo a "seqüência codificante de Regi", será usada paradefinir a posição do gene Regi, e os especialistas natécnica compreendem que as seqüências de regulaçãoassociada estarão dentro de uma distância de cerca de 4 kba partir da seqüência codificante de Regi, com o promotorlocalizado a montante. Uma concretização da presenteinvenção é o isolamento do gene Regi e a demonstração deque ele é o gene responsável pelo fenótipo conferido pelapresença do lócus.
Como aqui usados, os termos "ligado" ou "ligação"(como distinguido do termo "operacionalmente ligado") devese referir à ligação genética ou fisica dos lócus ou genes.Os lócus ou genes são considerados geneticamente ligados sea freqüência de recombinação entre eles for menor do quecerca de 50%, como determinado em um mapa de meiosesimples. Eles são progressivamente mais ligados se afreqüência de recombinação for cerca de 40%, cerca de 30%,cerca de 20%, cerca de 10% ou menos, como determinado em ummapa de meiose simples. Dois ou mais genes são fisicamenteligados (ou sintênicos) se ficar demonstrado que eles estãolocalizados em uma única porção de DNA, tal como umcromossomo. Genes geneticamente ligados, na prática,estarão- fisicamente ligados (ou sintênicos), mas adistância fisica exata (número de nucleotideos) pode nãoter sido ainda calculada. Como aqui usado, o termo"proximamente ligado" se refere a marcadores geneticamenteligados dentro de 15 cM ou menos, incluindo sem limitação12 cM ou menos, 10 cM ou menos, 8 cM ou menos, 7 cM oumenos, 6 cM ou menos, 5 cM ou menos, 4 cM ou menos, 3 cMou menos, 2 cM ou menos, 1 cM ou menos e 0,5 cM ou menos,como calculado no mapa genético neighbors 4 de IBM2disponível ao público no website Maize GDB anteriormentereferenciado nesta descrição. Uma seqüência de DNA, talcomo um oligonucleotideo curto representando uma seqüênciadentro de um lócus ou uma complementar da mesma, é tambémligada àquele lócus.
Uma "linhagem" ou "estirpe" é um grupo de indivíduosde parentesco idêntico que são geralmente endogâmicos emalgum grau e que são geralmente homozigotos e homogêneos namaioria dos lócus.Uma "linhagem ancestral" ou "progenitor" é umalinhagem parental usada como fonte de genes, por exemplo,para o desenvolvimento de linhagens elite. A "progênie" sãoos descendentes da linhagem ancestral, e podem estarseparados dos seus ancestrais por muitas gerações demelhoramento. Por exemplo, muitas linhagens elite sãoprogênies de B73 ou Mol7. Uma "estrutura pedigree" define arelação entre um descendente e cada ancestral que deuorigem àquele descendente. Uma estrutura pedigree pode seexpandir por uma ou mais gerações, descrevendo relaçõesentre os descendentes e seus pais, avós, bisavós, etc.
Uma "linhagem elite" ou "variedade elite" é umalinhagem ou variedade agronomicamente superior que resultoude muitos ciclos de melhoramento e seleção para odesempenho agronômico superior. Uma "linhagem eliteendogâmica" é uma linhagem elite que é uma endogâmica e quemostrou ser utilizável para produzir variedades híbridas deprodutividade suficientemente alta e agronomicamenteajustadas (uma "variedade hibrida elite"). Numerosaslinhagens e variedades elite estão disponíveis e sãoconhecidas daqueles especialistas na técnica demelhoramento de milho. Semelhantemente, "germoplasma elite"é um germoplasma agronomicamente superior, tipicamentederivado de e/ou capaz de dar origem a uma planta comdesempenho agronômico superior, tal como uma linhagem elitede milho existente ou recentemente desenvolvida.Por outro lado, uma "linhagem de milho exótica" ou"germoplasma de milho exótico" é o germoplasma derivado demilho não pertencente a uma linhagem elite disponível,variedade elite ou germoplasma elite. No contexto de umcruzamento entre duas plantas de milho, uma linhagemexótica ou germoplasma exótico não é proximamenterelacionada pelo descendente da linhagem elite, variedadeelite ou germoplasma elite com o qual é cruzado. Maiscomumente, a linhagem exótica ou germoplasma exótico éselecionada para introduzir novos elementos genéticos(tipicamente novos alelos) em um programa de melhoramento.
Unidades, prefixos e símbolos podem ser indicados porsua forma aceita do SI. A menos que seja indicado de mododiferente, os ácidos nucléicos são escritos da esquerdapara a direita na orientação 5' para 3' ; as seqüências deaminoácidos são escritas da esquerda para a direita emorientação amino para carboxil, respectivamente. As faixasnuméricas são inclusivas dos números que definem a faixa.
Os aminoácidos podem ser aqui referidos tanto por seussímbolos de três letras comumente conhecidos ou pelossímbolos de uma letra recomendado pela Comissão deNomenclatura Bioquímica da IUPAC-IUB. Da mesma forma, osnucleotideos podem ser referidos por seus códigos de umaletra comumente aceitos. Os termos acima definidos são maiscompletamente definidos por referência à descrição como umtodo.Com relação às direções do mapa aqui observadas, aoinvés dos termos 5' e 3', são usados os termos "norte" e"acima" (por exemplo, um marcador norte do gene Regi serefere a um marcador acima do gene Regi, como determinadocom referência aos mapas providos em uma orientaçãovertical, tal como as Figuras 7 e 8, e à esquerda do geneRegi, como determinado com referência aos mapas providos emuma orientação horizontal, tal como a Figura 22) . Da mesmaforma, são usados os termos "sul" e "abaixo" (por exemplo,um marcador sul do gene Regi se refere a um marcador abaixodo gene Regi, como determinado com referência aos mapasorientados verticalmente aqui providos, e para a direita dogene Regi, como determinado com referência aos mapasorientados horizontalmente providos aqui). Maisespecificamente, acima da seqüência codificante de Regi serefere ao cromossomo acima, ou norte do transcriptoprimário na SEQ ID No:l (perto de FLP110F) , e abaixo daseqüência codificante de Regi se refere ao cromossomoabaixo ou sul do transcripto primário na SEQ ID NO:l (pertode FLPA1R). Ver Figura 26. Os termos "proximal" e "distai"são termos relativos, significando, respectivamente, maisperto e mais afastado de uma localização especificada (porexemplo, o gene Regi) quando usado para comparar doispontos em um mapa com relação à localização especificada.
O termo "sistemas de computador" se refere, em geral,a vários sistemas automatizados usados para realizaralgumas ou todas as etapas dos métodos aqui descritos. Otermo "instruções" se refere ao código computacional queinstrui o sistema de computador para realizar algumas outodas as etapas do método. Adicionalmente, para praticaralgumas ou todas as etapas do método, sistemas digitais ouanalógicos, por exemplo, compreendendo um computadordigital ou analógico, também pode controlar uma variedadede outras funções tal como um mostrador visivel ao usuário(por exemplo, para permitir a visualização dos resultadosdo método pelo usuário) e/ou o controle dos aspectos desaida (por exemplo, para assistir na seleção assistida pormarcador ou no controle do equipamento de campoautomatizado).
Certos métodos aqui descritos são opcionalmente (etipicamente) implementados via um programa ou programas decomputador (por exemplo, que armazenam e podem ser usadospara analisar dados de marcador molecular). Portanto, asconcretizações provêem sistemas digitais, por exemplo,meios legíveis por computador, e/ou sistemas integradoscompreendendo instruções (por exemplo, concretizados emsoftware apropriado) para realizar os métodos aquirevelados. O sistema digital incluirá informação (dados)correspondente ao genótipo de planta para um conjunto demarcadores genéticos e, opcionalmente, valores fenotípicose/ou relações de familia. O sistema também pode ajudar umusuário a realizar a seleção assistida por marcador paraRegi de acordo com os métodos aqui revelados, ou podecontrolar o equipamento de campo com seleção, colheita e/ouesquemas de melhoramento automatizados.As aplicações desktop padrão, tal como o software deprocessamento de palavra (por exemplo, Microsoft Word™ ouCorel WordPerfect™) e/ou software de base de dados (porexemplo, software de planilha eletrônica, tal comoMicrosoft Excel™, Corel Quattro Pro™, ou programas de basede dados tal como Microsoft Access™ ou Paradox™) podem seradaptados às concretizações pela entrada de dados os quaissão alimentados na memória de um sistema digital, e pelarealização de uma operação como observado aqui nos dados.
Por exemplo, os sistemas podem incluir o softwareprecedente tendo os dados genotipicos apropriados e,opcionalmente, os dados de pedigree, que são usados emconjugação com uma interface de usuário (por exemplo, umGUI em um sistema de operação padrão tal como o sistemaWindows, Macintosh ou LINUX) para realizar qualquer análiseobservada aqui, ou simplesmente para adquirir os dados (porexemplo, em uma planilha eletrônica) a serem usados nosmétodos aqui revelados. 0 computador pode ser, por exemplo,um PC (máquina Intel x8 6 ou Pentium chip-compativel DOS™,OS2™, WINDOWS™, WINDOWS NT™, WINDOWS95™, WINDOWS98™, LINUX,compatível com o Apple, compatível com o MACINTOSH™,compatível com o Power PC, ou um compatível com o UNIX (porexemplo, estação de trabalho SUN™)) ou outro computadorcomercialmente comum que é conhecido dos especialistas natécnica. O software para realizar análise de associaçãoe/ou predição de valor fenotipico pode ser construído porum especialista na técnica usando linguagem de programaçãopadrão tal como Visualbasic, Fortran, Basic, Java, ousemelhantes, de acordo com os métodos aqui revelados.Qualquer controlador de sistema ou computadoropcionalmente inclui um monitor o qual pode incluir, porexemplo, um mostrador de tubo de raios catódicos ("CRT"),um mostrador de painel plano (por exemplo, um mostrador decristal liquido de matriz ativa) ou outros. Os circuitos decomputador são freqüentemente colocados em uma caixa, aqual inclui numerosos chips de circuito integrado, taiscomo microprocessador, memória, circuitos de interface eoutros. A caixa também, opcionalmente, inclui uma unidadede disco rígido, uma unidade de disco flexível, uma unidaderemovível de alta capacidade, tal como um CD-ROM gravável,e outros elementos periféricos comuns. Os dispositivos deentrada, tais como um teclado ou mouse opcionalmentefornecem a entrada para o usuário e para a seleção pelousuário de genótipo de marcador genético, valor fenotípicoos semelhantes no sistema computacional relevante.
O computador tipicamente inclui software apropriadopara receber instruções do usuário, tanto na forma deentrada de usuário em um conjunto de campos de parâmetro,por exemplo, em um GUI, ou na forma de instruçõesprogramadas, por exemplo, programadas para uma variedade dediferentes operações específicas. O software então converteessas instruções em uma linguagem apropriada para instruiro sistema a executar qualquer operação desejada. Porexemplo, um sistema digital pode instruir a seleção deplantas compreendendo certos marcadores, ou controlar amaquinaria de campo para colheita, seleção, cruzamento oupreservação de culturas de acordo com o método relevanteaqui revelado.
A invenção também pode ser concretizada dentro da redede circuitos de um circuito integrado especifico deaplicação (ASIC) ou dispositivo lógico programável (PLD).
Em tal caso, a invenção é concretizada em uma linguagem dedescritor legivel por computador que pode ser usada paracriar um ASIC ou PLD. A invenção também pode serconcretizada dentro da rede de circuitos ou processadoreslógicos de uma variedade de outros aparelhos digitais, taiscomo PDAs, sistemas de computador laptop, mostradores,equipamento de edição de imagem, etc.
EXEMPLOS
As concretizações da invenção são adicionalmentedefinidas nos exemplos a seguir, nos quais todas as partese percentagens são em peso e graus Celsius, a menos queseja estabelecido diferentemente. Deve ficar compreendidoque esses exemplos, apesar de indicarem concretizações dainvenção, são dados a titulo de ilustração somente. Apartir da discussão acima e desses exemplos, osespecialistas na técnica podem determinar ascaracterísticas essenciais das concretizações destainvenção e, sem se afastar do espirito e escopo da mesma,podem fazer várias mudanças e modificações para adaptá-la avárias utilizações e condições. Portanto, váriasmodificações das concretizações da invenção, em adiçãoàquelas mostradas e descritas aqui, ficarão evidentesàqueles especialistas na técnica a partir da descriçãoprecedente. Tais modificações também têm a intenção deficar dentro do escopo das reivindicações em anexo. Adescrição de cada referência apresentada aqui é incorporadaa titulo de referência em sua integralidade. Os Exemplos 1-4 e 7-12 são reais. Os Exemplos 5, 6 e 13 são reais emparte e proféticos em outra parte.
EXEMPLO 1
MAPEAMENTO REFINADO DO LÓCUS DE Regi PARA UMA REGIÃOESPECÍFICA DE 4L
De modo a mapear e clonar o gene responsável pelaresistência da linhagem de milho MP305 a Cg, linhagens quetinham sido previamente criadas e que diferiamgeneticamente tão pouco quanto possivel uma da outra, comexceção da presença do lócus responsável pelo fenótiporesistente. Tais linhagens são chamadas linhagensisogênicas próximas. Para esta finalidade, a DE811 foicruzada com a MP305 e a progênie foi retrocruzada com alinhagem sensivel DE811, por três vezes, sendo feita a cadaretrocruzamento a seleção com relação à resistência a Cg ede diferença com relação às características de DE811(Weldekidan and Hawk, (1993), Maydica, 38:189-192). Alinhagem resultante foi designada de DE811ASR (BC3)(Weldekidan and Hawk, (1993) acima mencionado). Estalinhagem foi usada como ponto de partida para o mapeamentorefinado do lócus de Regi. Foi primeiro necessário saberaproximadamente onde, no genoma de milho, ele estavalocalizado. Usando métodos genéticos padrão, Jung et al.((1994) acima citado) localizou previamente o lócus no ramolongo do cromossomo 4.
Na medida em que o lócus de Regi havia sidopreviamente mapeado no ramo longo do cromossomo 4 de milho,usando a informação sobre marcadores próximos ao lócusobtidos por Jung et al. (1994) acima citado, todos osmarcadores de repetição de seqüência simples (SSR),disponíveis ao público ou privados, localizados na regiãodo cromossomo designado 4.06-4.08, foram analisados paradeterminar se esses marcadores eram polimórficos entre asduas linhagens isogênicas próximas DE811 e DE811ASR (BC5).A linhagem DE811ASR (BC5) foi derivada da linhagem DE811ASR(BC3) descrita por Weldekidan e Hawk (1993), acimamencionado, através de dois retrocruzamentos com a DE811sob seleção com relação à resistência a Cg, seguidos por 5gerações de autofecundação e seleção para obter a linhagemBC5. A linhagem BC5 foi retrocruzada duas vezes mais com aDE811 para criar a população segregante BC7 usada para omapeamento refinado. De forma a possibilitar a condução daavaliação fenotipica em base familiar, os indivíduos BC7foram autofecundados para criar famílias BC7S1.
A partir desta análise, foi descoberto que doismarcadores de SSR, PHI093 e UMC2041, são polimórficos.Usando o mapa neighbors de B73 X Mol7 (IBM) (Lee et al.(2002) Plant Mol Biol 48:453-61; Sharopova et al. , (2002)Plant Mol Biol 48:463-81) inter-pareado (inter-mated)publicamente disponível (Coe et al. (2002) Plant Physiol.128:9-12; Gardiner, et al., (2004), Plant Physiol.,134:1317-1326; Yim et al., (2002) Plant Physiol. 130:1686-1696) , as seqüências de três marcadores próximos dePolimorfismo de Comprimento de Fragmento de Restrição(RFLP), CD0365, CSU166 e CD0127, foram usadas para criarmarcadores polimórficos de Comprimento de Fragmento (aquidesignados FLPs) . Os FLPs são marcadores que podem seranalisados usando eletroforese em gel ou qualquer métodosimilar de separação de fragmentos de alta resoluçãoseguindo-se uma reação de PCR usando os primers de umaseqüência definida. Foi verificado que os três marcadoressão polimórficos. Os FLPs usados no mapeamento do lócus deRegi estão resumidos na Tabela 1. Quaisquer primers para osFLPs de MZA mostrados na Tabela 1, a qual também tem osmesmos nomes de marcadores MZA mostrados na Tabela 2,amplificarão a região interna de FLP para a seqüênciainterna mostrada na Tabela 2. A temperatura de anelamentopara todos os primers listados na Tabela 1 é de 60°C.
De modo a determinar se a presença desses três FLPspolimórficos e dois SSRs polimórficos estava associada como fenótipo de resistência, indicando que a região portadorado lócus de Regi foi localizada em um segmento cromossomicocontendo esses três marcadores, foi criada uma tabela naqual foram alimentados os status fenotipicos de 4784indivíduos determinados por observação de campo e os statusgenotipicos com relação a cada um dos cinco marcadores,determinado pela análise de tamanho de fragmento. Estesdados foram submetidos seqüencialmente aos programas desoftware Joinmap (Van Ooijen, et al., (2001), PlantResearch International, Wageningen, the Netherlands) eWindows QTL Cartographer (Wang, et al., (2004), (online,versão 2.0 recuperada em 14-06-2004 e versão 2.5 recuperadaem 22-02-2005)) ; recuperado a partir da North CarolinaState University Statistical Genetics e do website deBioinformática na Internet em <URL:
http://statgen.ncsu.edu/qtlcart/WQTLCart.htm>. O primeiroprograma determina a ordem dos marcadores ao longo daregião cromossômica. O segundo programa determina se umalelo particular de um marcador (uma forma particular dasduas formas polimórficas do marcador) estásignificativamente associado com a presença do fenótipo. Osmarcadores para os quais a presença de um ou dos outrosalelos é mais significativamente associada com o fenótipode resistência mais provavelmente estão mais próximos dogene responsável pelo fenótipo de resistência. A Figura 3representa um gráfico produzido pelo QTL de WindowsCartographer mostrando uma análise estatística da chance(eixo dos Y) de que o lócus responsável pela resistência aCg esteja localizado em uma posição particular ao longo docromossomo (eixo dos X) como definido pelos marcadores FLP.
A partir do mapa fisico e genético integrado, comodescrito por Fengler, et al., ((2004) Plant and AnimalGenome XII Abstract Book, Página 192 (Pôster número P487),10-14 de janeiro, San Diego, Califórnia) e Gardiner, (2004)acima mencionado, é possivel identificar dois contigs decromossomo bacteriano (BAC), derivados de uma biblioteca deBAC de Mol7, cultivando os acima mencionados marcadoresgenéticos.
Entretanto, os dois contigs de BAC contendo osmarcadores flanqueadores da região de interesse continhamum gap de tamanho desconhecido. De modo a identificaradicionais BACs para fazer a ponte deste gap, foi usado umdenso mapa genético contendo marcadores (Fengler, (2004)acima citado) com posições conhecidas no mapa fisico paraencontrar marcadores adicionais geneticamente ligados amarcadores previamente ligados identificados nos doiscontigs de BAC. Esses marcadores adicionais na Tabela 2,foram usados para identificar contigs de BAC a partir deuma biblioteca de B73 a qual fechou o gap fisico entre ospreviamente encontrados contigs de BAC Mol7-derivados (Coeet al. (2002) acima citado; Gardiner (2004) acima citado;Yim et al. (2002) acima citado. Quatro marcadores,MZA11455, MZA6064, MZA2591 e MZA15842, foram usados parafinalidades de mapeamento. Na Tabela 2, "E" significa"externo" e "I" significa "interno", os quais,respectivamente, se referem aos primers externo e internousados durante o PCR nested. O conjunto externo é usado naprimeira rodada de PCR, após a qual as seqüências internassão usadas para uma segunda rodada de PCR nos produtos daprimeira rodada. Isto aumenta a especificidade da reação.As letras em caixa-alta indicam porções do primer baseadasem seqüências de vetor, as quais são mais tarde usadas paraseqüenciar os produtos de PCR. Elas não são seqüências demilho. Para os primers de MZA nested internos forward, aporção em caixa-alta da seqüência é a SEQ ID No:126, e paraos primers de MZA nested internos reversos, a porção emcaixa-alta é a SEQ ID No:127. As seqüências mostradas naTabela 2 para os primers de MZA nested internos forwardsão, portanto, uma combinação da SEQ ID No: 126 mais a SEQID No: para cada respectivo primer. De modo semelhante, asseqüências mostradas na Tabela 2 para os primers nested deMZA internos reversos são uma combinação da SEQ ID No: 127mais a SEQ ID No: para cada respectivo primer. Essascombinações estão indicadas na coluna de SEQ ID No: daTabela 2. A temperatura de anelamento para todos os primerslistados na Tabela 2 é de 55°C. Todos os marcadoresapresentados na Tabela 2 mostraram polimorfismo dentro deum painel diverso de germoplasma de milho, incluindo aMP305 e as linhagens de milho mostradas na Tabela 18.
As seqüências das extremidades de diversos dessesBACs, assim como os ESTs conhecidos a serem localizadosnesses BACs, foram usados de modo a identificar novosmarcadores com os quais é feito o posterior estreitamentode faixa na qual o lócus está localizado. Os marcadoresadicionais usados para esta finalidade são designados FLP8,FLP27, FLP33, FLP41, FLP56 e FLP95 na Tabela 1. De formasimilar àquela descrita acima, foram feitas as correlaçõesfenotipicas e genotipicas. Foi determinado que o lócusmuito provavelmente estava localizado entre o FLP 8 e o FLP27 (ver Figura 3).Tabela 1: Marcadores e pares de primers usados nos Exemplos 1, 4 e 5
<table>table see original document page 131</column></row><table><table>table see original document page 132</column></row><table>
Tabela 2: Pares de Primers de MZA Nested Usados no Examplo 1
<table>table see original document page 132</column></row><table><table>table see original document page 133</column></row><table>EXEMPLO 2
ISOLAMENTO DE CLONES DE BAC A PARTIR DE LINHAGENSRESISTENTES E IDENTIFICAÇÃO DE GENES CANDIDATOS NA REGIÃODO LÓCUS DE RCG1
De maneira a isolar o gene responsável pelo fenótipoconferido pelo lócus de Regi, os BACs contendo a regiãoentre os marcadores FLP 8 e FLP 27 foram isolados a partirde uma biblioteca BAC preparada a partir da linhagemresistente DE811ASR (BC5). Esta biblioteca foi preparadausando técnicas padrão para a preparação de DNA genômico(Zhang et al. (1995) Plant Journal 7:175-184) seguida peladigestão parcial com HindIII e ligação dos fragmentos detamanho selecionado para uma forma modificada do vetorcomercialmente disponível pCCIBAC™ (Epicentre, Madison,USA). Após a transformação em células de E. coli EPI300™seguindo as instruções do fornecedor (Epicentre, Madison,USA), 125.184 clones recombinantes foram dispostos em 326placas de microtitulação de 384 poços. Esses clones foramentão colocados em filtros de nylon (Hybond N+, AmershamBiosciences, Piscataway, USA).
A biblioteca foi sondada com sondas deoligonucleotideos de sobreposição (sondas overgo; Ross et<3l. (1999) Screening large-insert librar ies byhybridization, p. 5.6.1-5.6.52, In A. Boyl, ed. CurrentProtocols in Human Genetics. Wiley, New York) desenhadas nabase de seqüências encontradas nas seqüências BAC mostradasno exemplo anterior para estarem presentes entre o FLP8 e oFLP27. Foi feita análise de busca BLAST para submeter ascreening as seqüências repetidas e identificar asseqüências únicas para o desenho da sonda. A posição e ointer-espaçamento das sondas ao longo do contig foiverificada por PCR. Para cada sonda, foram desenhados doisoligos de 24-meros auto-complementares sobre 8 pb. Seuanelamento resultou em um overgo de 40 pb, no qual os doisoverhangs de 16 pb foram preenchidos. As sondas usadasdesta maneira são apresentadas na Tabela 4. Observe-se quealgumas dessas sondas foram baseadas em marcadores tambémusados no Exemplo 1 e Tabela 1, mas as seqüências exatassão diferentes na medida em que elas foram produzidas paraserem usadas como sondas overgo ao invés de somente primersde PCR. As sondas para hibridização foram preparadas comodescrito (Ross et al. (1999) acima citado), e os filtrospreparados pela colocação em rede da biblioteca BAC foramhibridizados como descrito por (Ross et al. (1999) acimacitado). Foi usada a análise de Phosphorimager para adetecção de sinais de hibridização. Depois disso, asmembranas foram separadas das sondas pela colocação dasmesmas em uma solução recém-fervida de 0,1X SSC e 0,1% SDSe deixadas a resfriar até a temperatura ambiente na soluçãodurante a noite.
Os BACs que deram um sinal positivo foram isolados apartir das placas. Foram usados o mapeamento de restrição,os experimentos de PCR com primers correspondentes aosmarcadores previamente usados e as seqüências obtidas apartir das extremidades de cada BAC para determinar a ordemdos BACs que cobrem a região de interesse. Quatro BACs quese espalharam pela região inteira foram selecionados paraseqüenciamento. Esses BACs foram seqüenciados usandotécnicas de seqüenciamento do tipo shotgun padrão e asseqüências foram montadas usando o Phred/Phrap/Consedsoftware package (Ewing et al. (1998) Genome Research,8:175-185).
Após a montagem, as seqüências consideradas comoestando na região mais próxima do lócus com base nos dadosde mapeamento foram anotadas, significando que foramdeduzidas as possíveis regiões codificantes de gene e asregiões representando elementos repetitivos. As regiõescodificantes de genes (regiões gênicas) foram buscadasusando o fGenesH software package (Softberry, Mount Kisco,New York, USA). O fGenesH permitiu a predição de uma porçãode uma proteína que, quando submetida ao BLAST (BLASTx/nr),mostrou parcial homologia ao nivel de aminoácido comrelação a uma porção de uma proteína de arroz que foiverificada como codificante de uma proteína que confereresistência, em arroz, à doença. A porção da seqüência demilho que apresentou homologia com relação a esta proteínafoi localizada como estando na extremidade de uma extensãocontígua da seqüência consenso de BAC e pareceu sertruncada. De modo a obter a representação completa do geneno BAC de milho, foi usada a seqüência de aminoácidos dearroz em uma análise de tBLASTn contra todas as outrasseqüências consenso oriundas do mesmo clone de BAC demilho. Isto resultou na identificação de uma seqüênciaconsenso representando a extremidade 3' do gene de milho.
Entretanto, a porção central do gene não foi representadanas seqüências assim obtidas. Os primers de PCR foramdesenhados com base nas regiões 5' e 3' do gene putativo eusados em um experimento de PCR com DNA do BAC de milhooriginal como um template. A seqüência do produto de PCRresultante continha a seqüência que faz a ponte dosfragmentos 5' e 3' previamente isolados.
A DE811ASR (BC5) foi depositada junto à ATCC, e osmétodos aqui descritos podem ser usados para obter o clonede BAC compreendendo o lócus de Regi. Como mostrado naFigura 9 (a), o intervalo cromossômico de DE811ASR (BC5) como lócus de Regi é não-colinear com relação à regiãocorrespondente de B73 e Mol7 (ver Figuras 9 e 22), comodeterminado pela análise de bibliotecas de BAC.
Usando a seqüência comum que hibridiza com BACs nasbibliotecas de BAC da Mol7 e da B73, os correspondentesBACs oriundos de ambas as bibliotecas foram dispostas emuma rota tracejada como mostrado na Figura 22. Foram dadosnomes mais curtos aos BACs de B73 na Figura 22 parafinalidade de ilustração. A Tabela 3, a seguir, mostra a IDde BAC para cada designação indicada na Figura 22. Os BACsde B73 disponíveis ao público, c0113f01 e c0117el8 sãodiretamente norte e sul, respectivamente, da região indeldo lócus de Regi, com a deleção ocorrendo na B73. Ainformação desses dois BACs pode ser vista em diversossítios da Web, incluindo o website de GDB de milho(maizegdb.org), o website Gramene (gramene.org) e a base dedados do genoma de milho do Arizona Genomics Institute(genome.arizona.edu). O website do Arizona GenomicsInstitute também prove o Mapa FPC de Agarose de Milho,versão 19 de julho de 2005, o qual identifica os BACscontíguos em relação a c0113f01 e c0117el8. Pela buscanessas bases de dados, foi identificada uma multidão deBACs que formam um contig das regiões flanqueadoras dolócus de Regi. Portanto, a localização precisa do lócus deRegi e do gene Regi foi agora identificada em ambos osmapas fisico e genético de milho (ver Figuras 7(a,b) e 22).
Tabela 3: Designações de BAC na Figura 22, as quaisforam parte tanto do contig 187 (B73a até B73p) como docontig 188 (B73q até B73af) do B73 como mostrado no websitedo Arizona Genomics Institute acima mencionado
<table>table see original document page 138</column></row><table><table>table see original document page 139</column></row><table>
A seqüência completa do gene putativo é apresentada naSEQ ID No: 1. O gene contém um intron, desde o nucleotideo950 até o nucleotideo 1452 da SEQ ID No: 1. Foi usada PCRde tanscriptase reversa utilizando o RNA preparado a partirde plantas da DE811ASR (BC5) para determinar os limites dointron. A seqüência codificante da proteina do gene éapresentada na SEQ ID No: 2, e a tradução em aminoácidos éapresentada na SEQ ID No: 3. A proteina predita possui umpeso molecular de 110,76 kD.A extremidade amino a partir aproximadamente dosaminoácidos 157 até 404 tem homologia com relação aoschamados sitios de ligação a nucleotideo (NBS) . Há umaregião com homologia vaga com relação aos domínios de LRRlocalizados aproximadamente a partir dos aminoácidos 528até 846. Entretanto, diferentemente das proteínas de NBS-LRR anteriormente estudadas, a região rica em leucinacarece de natureza repetitiva sistemática (Lxx) encontradaem domínios de LRR mais clássicos e, em particular, semcircunstâncias das seqüências consenso descritas por Wanget al. ((1999), Plant J. 19:55-64) ou Bryan et al. ((2000),Plant Cell 12:2033-2045). Como mostrado na Figura 2 (a, b ec) , o gene possui vaga homologia com relação à familia dosgenes de arroz e com relação a um gene de cevada. A maiorparte da homologia está na extremidade amino terminal daproteína; a extremidade carboxil é bastante distinta. Istoé demonstrado pelo uso do estilo negrito, na Figura 2 (a, be c), os quais são aminoácidos idênticos ao gene dasconcretizações, enquanto que aqueles não idênticos nãoestão mostrados em negrito.
Tabela 4. Oligonucleotideos anelados para sintetizar sondasovergo
<table>table see original document page 140</column></row><table><table>table see original document page 141</column></row><table>
EXEMPLO 3
COMPARAÇÃO DA ESTRUTURA GENÉTICA NA REGIÃO DO LÓCUS DERCG1 ENTRE LINHAGENS RESISTENTE E SUSCEPTÍVEL E PERFIS DEEXPRESSÃO DE GENES CANDIDATOS ENCONTRADOS NAQUELA REGIÃOENTRE LINHAGENS RESISTENTE E SUSCEPTÍVEL
Tendo encontrado um gene candidato na regiãogeneticamente definida para portar o lócus responsável pelofenótipo de resistência à antracnose, foram feitos esforçospara primeiramente determinar se haveriam outros genespresentes na região e, em segundo lugar para determinar seos padrões de expressão do gene candidato eram consistentescom o seu papel putativo. Fu e Dooner ((2002), Proc NatlAcad Sei 99:9573-9578) e Brunner et al. ((2005), Plant Cell17:343-360) demonstraram que diferentes linhagensendogâmicas de milho podem ter significativos rearranjos eausência de colinearidade entre si. A comparação de taisgenomas ao longo das regiões maiores pode, portanto, sercomplexa. Tal comparação dos genomas de Mol7 (Missouri 17)e DE811ASR (BC5) revelou que, na região onde o genecandidato é encontrado na DE811ASR (BC5), está presente umagrande inserção com relação à Mol7. As regiões dentro e nasvizinhanças da inserção foram seqüenciadas e escaneadas comrelação a possíveis genes. Um gene codificante de umasubunidade de Ribulose bisfosfato carboxilase (Rubisco, umaproteina envolvida na fixação de carbono após afotossintese, cujo gene está presente em múltiplas cópiasno genoma de milho) foi encontrado em ambos os genomas, daDE811ASR (BC5) e da Mol7, exatamente a jusante da posiçãodo gene Regi. Foi encontrado um pseudo-gene (um genetornado não-funcional devido a mutações que rompem aseqüência codificante) relacionado com uma proteina dereserva vegetativa, presente somente no genoma de DE811ASR(BC5) a alguma distância a montante do gene Regi. O únicogene estruturalmente intacto provavelmente para codificaruma proteina com uma função possivelmente relacionada comresistência a doença foi o gene Regi isolado no exemploanterior. Do mesmo modo, foram localizados outros genesimprováveis de estarem envolvidos com a resistência àdoença a uma maior distância da posição mais provável dolócus, assim como um grande número de seqüênciasrepetitivas.
Para determinar se um gene Regi foi transcrito, equando, foram usadas duas técnicas. Primeiramente foramexaminados os perfis de RNA de materiais de plantaresistente e susceptível usando o Seqüenciamento deAssinatura Massivãmente Paralela (Massively ParallelSignature Sequencing - MPSS; Lynx Therapeutics, Berkeley,USA). Resumidamente, bibliotecas de cDNA foram construídase imobilizadas em microcontas como descrito em Brenner etal. (Brenner, S. et al. (2000) Nat. Biotechnol. 18(6):630-634). A construção da biblioteca sobre um suportesólido permite que a biblioteca seja disposta em umamonocamada e milhares de clones sejam submetidos à análisede seqüência de nucleotideos em paralelo. A análise resultaem uma seqüência de "assinatura" de 17-meros cujafreqüência de ocorrência é proporcional à abundânciadaquele transcripto no tecido da planta. O cDNA derivado deRNA preparado a partir da DE811ASR (BC5) e da DE811(linhagem controle, susceptível a Cg) foi submetida aanálise de MPSS. A inspeção por bioinformática das" assinaturas resultantes mostrou que a seqüência deassinatura, aqui referida como Lynxl9, (SEQ ID No: 19)estava presente em 43 partes por milhão (ppm) nas amostrasde RNA oriundas de colmos não-infectados de DE811ASR (BC5)e em 65 ppm em colmos resistentes infectados 9 dias após ainoculação (DPI) com Cg. Esta seqüência de assinatura nãofoi detectada em bibliotecas de cDNA de colmos não-infectados ou infectados por Cg da linhagem de milhosusceptível DE811. Uma análise da seqüência de Regi indicaque o marcador (tag) de 17-meros está presente nosnucleotideos 3945 a 3961 da SEQ ID No: 1 na região não-traduzida 3' putativa do gene.
A prova adicional de que o Regi é exclusivamenteexpressado em linhagens de milho que são derivadas da MP305e resistentes à podridão do colmo por antracnose foi obtidapelos experimentos de RT-PCR. O RNA total foi isolado apartir de colmos não-infectado e infectado por Cg delinhagens de milho, resistente (DE811ASR1 (BC5)) esusceptível (DE811), usando RNA STAT-60™ (Iso-TexDiagnostics, Friendswood, Texas, USA). O RNA total (250 ng)de amostras resistente e susceptível de 0, 3, 6, 9, e 13DPI foi copiado para o cDNA e amplificado usando um kitGeneAmp® RNA-PCR (Applied Biosystems, Foster City,Califórnia, USA) . A reação de sintese de cDNA foi montadade acordo com o protocolo do kit usando hexâmerosaleatórios como primers e incubada a 42°C por 45 minutos.Para realizar a PCR, foram usados o KEB131 (SEQ ID No: 20)e o KEB138 (SEQ ID No: 21), ambos desenhados a partir daseqüência não-traduzida 3' putativa do Regi, como osprimers a montante e a jusante, respectivamente. O cDNA foiamplificado por 30 ciclos consistindo de 1 minuto a 94°C, 2minutos a 50°C e 3 minutos a 72°C seguido por uma extensãode 7 minutos a 72°C. Como mostrado na Figura 4, aeletroforese em gel de agarose de uma aliquota dos RT-PCRsrevelou a presença de uma banda de 260 pb presente nasamostras derivadas de ambas as plantas resistentes, ainfectada e a não-infectada, mas ausente nas amostrassusceptíveis. A análise de seqüência de DNA confirmou ofato de que este fragmento correspondia ao nt 3625 até 3884da seqüência de Regi consistente com o produto deamplificação predito a partir dos primers KEB131 e KEB138.
EXEMPLO 4
ISOLAMENTO DAS LINHAGENS CONTENDO INSERÇÕES MU NO GENECANDIDATO
Um método um fenótipo, inserção de umpara determinar se um gene é responsável poré romper geneticamente o gene através daelemento de transposição (a chamada marcaçãopor transposon) e depois determinar se o fenótipo relevanteda planta está alterado, neste caso, de resistente a Cgpara susceptível a Cg. Em milho, isto pode ser feito usandoo elemento mutator (Mu) (Walbot, V. (1992) Annu. Rev. PlantPhysiol. Plant Mol. Biol. 43:49-82). A estratégia básica,esboçada na Figura 5, foi a de introduzir elementos mutatorativos em linhagens portadoras do gene de resistência,isolando as plantas homozigotas com relação ao gene deresistência através da análise de marcadores de DNAassociados, assim como de resistência a Cg pela inoculaçãocom Cg, depois cruzando aquelas plantas homozigotas com umalinhagem susceptível de "teste". Se o gene de resistênciafor dominante, em principio, toda a progênie resultantedeve ser resistente, mas heterozigota com relação ao gene.
Entretanto, se um elemento Mu inserido no gene resistenteem um modo que rompe sua função, aquele indivíduo deve sersusceptível a Cg. O gene rompido pode depois ser isolado ecaracterizado.
A MP305 foi cruzada com quinze diversos estoquesmutator (linhagens portadoras de elementos mutator ativos).As Fls resultantes foram inter-casadas (cruzadas uma com aoutra) em todas as combinações possíveis. Para rastrear aregião cromossômica 4L na qual foi descoberto que o lócusde resistência reside (ver Exemplo 1), uma variedade demarcadores de DNA conhecidos como estando nas vizinhançasdo lócus, a partir do trabalho descrito no Exemplo 1, foiselecionada e usada nas materiais marcados com Mu. Cerca de1500 plantas da progênie oriundas do processo de inter-cruzamento foram examinadas com relação à resistência a Cge com relação à presença desses marcadores. A análise dosmarcadores foi feita usando tanto Southern blots (Botsteinet al., (1980) Am. J. Hum. Gen. 32:314-331) para marcadoresde RFLP como por PCR para marcadores de FLP como descritono Exemplo 1. As plantas que foram homozigotas para todosos marcadores testados e resistentes a Cg foramselecionadas e submetidas a teste de cruzamento comlinhagens de teste susceptíveis (A63, EH6WA e EF09B). Cercade 16.000 sementes de teste de cruzamento geradas a partirdessas plantas homozigotas e resistentes foram depoisplantadas e foram usadas como parentais femininos(significando que os pendões produtores de pólen foramremovidos) e cruzadas com as linhagens de testesusceptíveis usadas como masculinas. Todas as plantasfemininas foram submetidas a screening com relação àsusceptibilidade a Cg. Mais de dez plantas susceptíveis(mutantes knockout putativas) foram identificadas. Asemente polinizada aberta de cada uma dessas plantassusceptíveis foi colhida, juntamente com oito irmãsresistentes como controle.
Foi extraído o DNA de um conjunto de 24 mudas(crescidas em toalhas de papel) de cada um dos knockoutsputativos e das irmãs resistentes controle. Este DNA foiusado como tamplate para a amplificação da seqüênciaflanqueadora oriunda do sitio de inserção-de-Mu usandoprimers gene-especificos em combinação com um primerconsenso desenhado a partir de repetições invertidasterminais (TIR) oriundas da seqüência do elemento Mutator(SEQ ID No: 125) . Em outras palavras, os produtos de PCRdevem somente ser observados se um elemento Mu tiver sidoinserido no gene candidate isolado no Exemplo 2. Os primersFLP110F, FLP110R, FLP111F, FLP111R, FLP112F, FLP112R,FLP113F, e FLPA1R foram usados como primers gene-especificos (ver Tabela 1) . Os produtos amplificados porPCR foram submetidos a blotting sobre membranas ehibridizados com uma sonda de DNA a partir do genecandidato isolado no Exemplo 2. Os produtos de PCR quemostraram forte hibridização foram excisados a partir dogel, purificados, clonados e seqüenciados. As seqüênciasresultantes foram analisadas por meio de alinhamento comseqüências oriundas do gene candidato e Mu-TIR. Oselementos Mutator causam uma duplicação direta de 9 pb e ositio de inserção. Com base na informação da seqüênciaflanqueadora e em uma duplicação direta de 9 pb, foramidentificadas quatro inserções independentes no exon 1 dogene candidato (Figura 5) . Uma inserção (ml77) foidetectada aproximadamente 97 pb a montante do códon deiniciação, na região não-traduzida 5' do gene. Um evento deinserção comum, 270 pb a jusante do códon de iniciação, foidetectado em três plantas susceptíveis: ml64, ml59 e ml79.
Foi descoberto que a planta susceptível ml71 contém duasinserções-Mu, 556 pb e 286 pb a jusante do códon deiniciação. Quando foram realizados Southern blots usando aregião do exonl do gene como uma sonda de DNA, o padrão dehibridização modificado observado posteriormente confirmouesses resultados.Este e os exemplos precedentes podem ser resumidoscomo se segue. O trabalho inicial citado no Exemplo 1mostrou que um lócus previamente observado como conferindoresistência a Cg foi localizado no ramo longo do cromossomo4 de milho. A natureza deste lócus, sua exata localizaçãoou gene(s) codificado(s) por ele eram completamentedesconhecidos. O trabalho feito no Exemplo 1 demonstra queo lócus pode ser mapeado para uma região muito pequena doramo longo do cromossomo 4. O Exemplo 2 demonstra que hásomente um gene a ser encontrado nesta região cromossômicaprovavelmente sendo dito gene de resistência. Ele codificauma nova forma de uma proteína NBS-LRR, uma família deproteínas conhecidas por estarem envolvidas na resistênciaa patógenos, mas que variam amplamente em sua seqüência eespecificidade de resistência. O Exemplo 3 mostra que estegene está presente somente na linhagem de resistência, enão na linhagem susceptível isogênica, e que ostranscriptos correspondentes a este gene são encontrados nalinhagem resistente, indicando que o gene é expressado, eque esses transcriptos são encontrados somente na linhagemresistente. O Exemplo 4 demonstra que, nos quatro eventosindependentemente isolados de inserção Mu, quando o gene érompido pela inserção de um elemento Mu, o fenótipo dessasplantas é mudado de resistente para susceptível a Cg.Tomados em conjunto, esses dados fornecem evidênciadecisiva de que o objeto das concretizações desta invençãoé um gene que pode melhorar ou conferir resistência a Cg emplantas de milho.EXEMPLO 5
RETROCRUZAMENTO DO LÓCUS DE RCG1 EM LINHAGENSSUSCEPTÍVEIS
Foi feita a introgressão de um lócus de Regi em umaendogâmica para confirmar o fato de que o lócus de Regipode ser retrocruzado com sucesso em endogâmicas, e que oshíbridos produzidos com a linhagem endogâmica com o lócusde Regi deve ter resistência a Cg melhorada ou conferida. ADE811ASR (BC5) também foi desenvolvida e usada como umafonte doadora aperfeiçoada para a introgressão do lócus deRegi. Em seguida, diversas endogâmicas adicionais foramutilizadas como parentais recorrentes de modo a usarmétodos, aqui descritos, de melhoramento assistido pormarcador para introgredir eficientemente o lócus de Regi emuma diversidade de backgrounds genéticos endogâmicos ehibridos, melhorando ou conferindo, por esse meio,resistência a Cg. Cada um desses exemplos é discutido emmaiores detalhes a seguir.
Prova de Conceito (PH09B)
A MP305 é uma linhagem endogâmica de cor de grãobranca com forte resistência a Cg, mas seu florescimentotardio, baixa produtividade e fracas característicasagronômicas a tornam uma parem tal doadora pobre na ausênciado uso dos métodos aqui descritos de melhoramentoassistidos por marcador. Um perfil de marcador molecular daMP305 é provido na Tabela 6. Os primers usados para as SSRsrelatadas na tabela podem ser construídos a partir deseqüências disponíveis ao público encontradas no GDB deMilho na World Wide Web em maizegdb.org (patrocinado peloUSDA Agricultural Research Service), em Sharopova et al.(Plant Mol. Biol. 48 (5-6) : 463-481) , e/ou em Lee et al.(Plant Mol. Biol. 48(5-6); 453-461). Um UMC15a é ummarcador de RFLP, e o escore relatado é baseado no sitio derestrição EcoRl.
Para demonstrar o valor fenotipico do lócus de Regi, olócus foi primeiramente introgredido na linhagem PH09B(patente US 5.859.354) até o estágio BC3 como se segue. Apopulação Fl derivada do cruzamento entre a MP305 e alinhagem PH09B foi retrocruzada uma vez mais com a linhagemPH09B, resultando em uma população BC1. As mudas foramplantadas e retrocruzadas novamente com a linhagem PH09Bpara desenvolver uma população BC2. 0 DNA foi preparado apartir de punções de folha das famílias BC2. Paradeterminar quais famílias BC2 plantar para posterioresretrocruzamentos, foi realizada genotipagem no DNA dasfamílias BC2 usando ou primers para marcadoresflanqueadores da região de interesse, UMC2041, PHI093 eCSU166 (ver Tabela 1) . As sementes oriundas da família BC2foram plantadas e as plantas individuais foram genotipadascontra a presença da versão MP305 daquela região docromossomo usando os mesmos três marcadores acima anotados.As plantas positivas foram retrocruzadas com a linhagemPH09B uma vez mais para desenvolver as populações BC3. Assementes dessas populações BC3 foram plantadas e as plantasforam autofecundadas para obter famílias BC3S1 segregantespara a região de interesse, assim como as famílias BC3S1faltando a região de interesse. Essas famílias foram usadaspara a comparação fenotípica (BC3S1 segregantes versusBC3S1 sem a região de interesse).
De forma a observar o desempenho do gene Regi, em umasituação heterozigota, tal como seria encontrada em umhíbrido comercial, foram feitos cruzamentos de testeapropriados. Especificamente, famílias BC3S1 segregantespara a região de interesse foram plantadas e plantasindividuais BC3S1 foram genotipadas. Foram usadas asplantas homozigotas para o gene Regi, assim como as plantashomozigotas para o alelo nulo (faltando o gene em ambos oscromossomos) dentro de cada família, para realizar oscruzamentos de teste com as endogâmicas PH2EJ (patente US6.333.453), PH2NO (patente US 6.124.533), PH4CV (patente US6.897.363) e PH8CW (patente US 6.784.349).
No caso de ambas as linhagens BC3S1 e os híbridos, asdiferenças fenotípicas observadas indicaram significativoaperfeiçoamento com relação à resistência de ASR emlinhagens e híbridos contendo a região portadora de Regi. Oefeito do lócus de Regi introgredido nas famílias BC3S1 eos híbridos de cruzamento de teste derivados resultou em umaperfeiçoamento em termos de ambos, no número deinternódulos infectados e no número de internódulosinfectados em mais do que 75%. Os escores usando um sistemade contagem de escore visual comumente usado pelosmelhoristas de planta são mostrados na Tabela 5 maisadiante. Os dados nitidamente demonstram que o uso detécnicas de cruzamento para transportar o gene dasconcretizações para outras linhagens geneticamentecompetentes em usar o gene resultam em resistênciamelhorada a Cg.
Tabela 5: Efeito da região Regi introgredida no grau deresistência à podridão do colmo por antracnose em familiasBC3S1 e cruzamentos de teste derivados
<table>table see original document page 152</column></row><table>Tabela 6
<table>table see original document page 153</column></row><table>
DE811ASR(BC5) como a Doadora mais Provável para Uso emRetrocruzamentoApesar de a MP305 ter sido utilizada no experimentoacima, como está ilustrado na Figura 8 (a), a DE811ASR(BC5)retém um intervalo cromossômico da MP305 menor com o lócusde Regi do que a DE811ASR (BC3) (e, é claro, também aMP305), e, portanto, é particularmente utilizável como umafonte doadora do gene Regi. Foi mostrado que o intervalocromossômico estreitado oriundo a fonte DE811ASR(BC5) estáassociado com um fenótipo agronômico aperfeiçoado. Vinte eduas plantas oriundas da linhagem derivada DE811ASR(BC3),20 plantas oriundas da linhagem derivada the DE811ASR(BC5),cinco plantas DE811 e cinco plantas MP305 foram crescidasem uma casa de vegetação de novembro de 2005 até março de2006 e foram recolhidos dados com relação à altura daplanta e altura da espiga; foram observadas as datas quando50% das plantas soltaram pólen (midshed), quando 50% dasplantas tinham um visual de brotos de espiga (midves) equando 50% das plantas tinham os estilo-estigmas apontandonas brotações de espiga {midslk) ; e a cor do grão. Namedia, a linhagem DE811ASR(BC5) foi mais curta que aDE811ASR (BC3) (293 cm versus 345 cm) e a localização daespiga foi mais baixa na DE811ASR (BC5) do que naDE811ASR (BC3) (146 cm versus 183 cm), os quais sãocaracteres positivos em termos de desenvolvimento devariedade elite. A DE811ASR(BC5) foi mais precoce comrelação a midshed, midves e midslk quando comparada com aDE811ASR(BC3). A característica de midshed foiaproximadamente 1 dia mais cedo, a midves foiaproximadamente 6 dias mais cedo e a midslk foiaproximadamente 3 dias mais cedo para a DE811ASR(BC5)quando comparada à DE811ASR(BC3) . Os grãos da DE811ASR(BC5)tiveram uma cor marrom-amarelada (bronze) enquanto que osgrãos de DE811ASR(BC3) tiveram uma capa amarelo pálida. Asdatas para midshed, midves e midslk foram similares para aDE811ASR(BC5) e para a DE811, enquanto que a MP305 foiaproximadamente 11 dias mais tarde para midshed e nãoproduziu 50% de brotos de espiga visiveis, nem 50% deestilo-estigmas durante o periodo de crescimento. Apesar deque esses dados são baseados somente em umas poucas plantaspara a DE811 e para a MP305, e as espigas não foramproduzidas naquelas poucas linhagens, esses resultados decasa de vegetação se assemelham com observações dessaslinhagens no campo. Esses dados indicam que a DE811ASR(BC5)se assemelha à parental recorrente DE811 muito maisproximamente do que a DE811ASR(BC3). Portanto, aDE811ASR(BC5) é uma excelente fonte doadora inicial dolócus de Regi e do gene Regi, em ambos os aspectos,genotipicamente e fenotipicamente. Adicionalmente, aDE811ASR(BC5) é particularmente utilizável quando daintrogressão do lócus de Regi no germoplasma com adaptaçãosemelhante à DE811.
A DE811 foi desenvolvida por J. Hawk (Hawk, J.A.(1985). Crop Science Vol 25: p716) e foi descrita como umalinhagem endogâmica dentada amarela originada deautofecundação e seleção de seis gerações em um programa depedigree escolhidas dentre aquelas de um cruzamento de B68com uma endogâmica derivada de [B37 Ht X (duplo cruzamentode C103 X Mp3204) sei.]. A DE811 desenvolveu o estilo-estigma de 1 a 2 dias mais tarde do que a B73 em testes emDelaware, mas 4 dias mais tarde do que a B73 emMissouri. Os ensaios limitados de produtividade indicaramque a DE811 possui satisfatória capacidade de combinação. Éuma boa formadora de estilo-estigma (forma bons estilo-estigmas, um componente da flor fêmea de milho importantepara a fertilização) e liberadora de' pólen e pode sercruzada com germoplasma de maturidade precoce paraadaptação ao nordeste dos Estados Unidos e para germoplasmade maturidade mais tardia para adaptação ao sudeste dosEstados Unidos. Portanto, a DE811ASR (BC5), em combinaçãocom os marcadores e métodos de melhoramento aqui revelados,é utilizável como uma fonte doadora inicial paraintrogressão do gene Regi em uma ampla diversidade degermoplasma, incluindo o germoplasma adaptado a todas asregiões dos Estados Unidos onde o Cg está presente.
Criação de Conversões de Lócus de Regi Endogâmico
Seguindo-se aos testes para a introgressão bem-sucedida de lócus de Regi em PH09B descrita acima, foramrealizadas conversões de lócus de Regi adicionais em outraslinhagens endogâmicas. A primeira série tinha 5retrocruzamentos, sendo a MP305 e a DE811ASR(BC5) asdoadoras. Para a segunda série de retrocruzamentos, foramusados marcadores moleculares para reduzir o intervalocromossômico nas conversões de BC5 oriundas da primeirasérie. Essas conversões de BC5 foram selecionadas parapermutas {crossovers) abaixo do gene Regi. Aquelas plantasselecionadas. foram depois retrocruzadas para criar ageração BC6. As plantas com crossovers acima do gene foramselecionadas na geração BC6.
Primeira Série de Retrocruzamentos
Na primeira série, foi usada a DE811ASR(BC5) como aprimeira fonte doadora, mas introgressões paralelas tambémforam feitas para as mesmas endogâmicas usando a MP305 comouma fonte doadora. Esses dados, descritos em maioresdetalhes mais adiante, mostram que enquanto a DE811ASR(BC5}é a doadora preferida em muitas situações, a MP305 tambémpode ser eficazmente usada com os métodos de melhoramentoassistido com marcador das concretizações ensinadas aqui.
As linhagens endogâmicas elite primariamente adaptadasàs condições de crescimento norte-americanas foramselecionadas para uso como parentais recorrentes. Aslinhagens endogâmicas inicialmente selecionadas para usocomo parentais recorrentes foram as linhagens PH0R8 (US6.717.036), PH7CH (US 6.730.835), PH705 (US 6.903.25),PH5W4 (US 6.717.040), PH51K (US 6.881.881) e PH87P (US6.888.051). Cada uma dessas linhagens foi cruzada com aDE811ASR (BC5) assim como com a MP305. A geração Flderivada de cada um desses cruzamentos foi retrocruzada umavez com a respectiva linhagem endogâmica, resultando em umaprimeira geração de retrocruzamento (a parental recorrenteBC1) . As mudas foram plantadas e o DNA foi preparado apartir de punções de folha. As reações de PCR foramrealizadas usando primers para marcadores que flanqueiam aregião de interesse; foram usados UMC1466, UMC1418,BNLG2162, UMC1086, UMC2041, UMC1612, CSU166, UMC1051,ÜMC2187, UMC1371, e UMC1856 nas primeiras rodadas de BC(ver Tabela 1) enquanto que, nas últimas rodadas de BC,foram usados UMC1418, BNLG2162, UMC1051, UMC2041, UMC2187,UMC1371 e UMC1856. As mudas cujas reações de PCR deram umresultado positivo (significando que o lócus de Regiderivado de MP305 estava presente) foram depoisadicionalmente retrocruzadas com as respectivas linhagensendogâmicas para produzir uma BC2. Este procedimento,chamado "genotipagem", identifica a composição genética deuma planta no sitio de um marcador particular. Essas etapasforam repetidas para o desenvolvimento das . parentaisrecorrentes BC3, BC4 e BC5. A análise mostra que, apóscinco retrocruzamentos, essas linhagens retinham umintervalo cromossômico significativamente truncadocompreendendo o lócus de Regi, e, com base em observaçõesvisuais, não foi observada nenhuma indicação de efeitosnegativos resultantes da presença do lócus de Regi.
A seleção de parental recorrente também foi realizadapela seleção das plantas fenotipicamente mais parecidas coma parental recorrente. Usando esses métodos genotipicos efenotipicos, foram selecionadas conversões de altaqualidade com uma alta percentagem de parental recorrenteao longo de todo o genoma.Este exemplo também ilustra o fato de que osmarcadores flanqueadores não são usados exclusivamente paraselecionar tanto dentro como fora do gene Regi. As mudascujas reações de PCR deram um resultado positivo(significando que o lócus de Regi derivado da MP305 estavapresente) foram depois adicionalmente retrocruzadas com asrespectivas linhagens endogâmicas para produzir oretrocruzamento final (a geração BC5 parental recorrente)nesta primeira série. Quando os marcadores polimórficosflanqueadores mais próximos determinaram que o gene estavapresente, foi usado o próximo conjunto de marcadorespolimórficos flanqueadores duplos mais distais com relaçãoao gene para a seleção do parental recorrente. Portanto, ouso de marcadores que flanqueiam o gene Regi ou o lócus doRegi serve para clarear a recombinação que ocorre naregião.
Segunda Série de Retrocruzamento
As conversões do lócus de Regi endogâmicas feitasusando as SSRs que flanqueiam o lócus de Regi na primeirasérie de retrocruzamento foram depois usadas como doadorasem uma rodada sucessiva de retrocruzamentos. Para estaprimeira série de retrocruzamentos, foram desenvolvidosmarcadores de SNP para o gene Regi que possibilita aseleção assistida com marcador em um modo de alta produção,como descrito no Exemplo 13, para selecionar com relação aogene Regi. Os marcadores de SNP também foram desenhados naregião em torno do lócus de Regi, permitindo que osmarcadores flanqueadores sejam usados para selecionar forado intervalo cromossômico de MP305 que rodeia o lócus deRegi, e para selecionar o genótipo parental recorrente,reduzindo, por esse meio, grandemente o arraste de ligação.
É somente através do mapeamento fisico e clonagem do geneque é possível tal seleção precisa de parental recorrenteassistida com marcador.
Primeiramente, as plantas BC5 parentais recorrentesresultantes da primeira série de retrocruzamentos forammais uma vez submetidas a screening com um conjunto demarcador mais preciso, e a recombinação foi selecionadapara o sul do gene Regi. Os marcadores f lanqueadoresfirmemente ligados ao gene Regi (MZA8761, MZA1851, UMC1051,e UMC2187) foram usados para selecionar o parentalrecorrente para o sul do gene em pequenos tamanhos depopulação de aproximadamente 40 progênies (ver Figura 8 (a-b) ) . Essas progênies foram depois analisadas usando osmarcadores de FLP aqui revelados, para mais precisamentedeterminar o ponto de recombinação. Estes dados mostraramque foram selecionadas algumas progênies com genomaparental recorrente de menos que 1 cM (com base nasdistâncias de mapa genético Neighbors IBM2) do sul do geneRegi, como mostrado na Figura 8 (b) . Outra progênie tinhagenoma parental recorrente de menos que 4 cM do sul do geneRegi. Essas conversões de BC5 selecionadas com marcadorforam depois usadas como doadores, e cruzadas com contra-partes aproximadamente isogênicas de PH705, PH5W4, PH51K ePH87P como as parentais recorrentes para dar a populaçãoBC6. Os marcadores no gene Regi foram novamente usados paraselecionar com relação ao Regi, com marcadoresflanqueadores com relação ao norte do Regi, desta vez sendousado para selecionar o parental recorrente. Nesta rodadade seleções, as recombinações foram detectadas em cada umadas populações entre o Regi e o marcador MZA15842. Aposição do MZA15842 no mapa genético Neighbors IBM2 podeser extrapolada a partir da sua posição no mapa de altaresolução mostrado na Figura 7(b), mapa B, usando regressãocom relação aos marcadores flanqueadores UMC2285 e PHI093.Isto colocou o MZA15842 em 520, 5 cM no mapa genéticoNeighbors IBM2. Portanto, como mostrado na Figura 8 (b), emduas rodadas de retrocruzamento, o genoma doador foireduzido a um segmento de menos que 6 cM em cada população,ou menos que 0,8% do cromossomo 4, com base nas distânciasdo mapa genético Neighbors IBM2, e em algumas progênies osegmento foi de menos que 2,1 cM, ou menos que 0,25% docromossomo 4. Para fins de comparação, o intervalocromossômico de MP305 com o lócus de Regi em DE811ASR (BC3)foi de 131 cM, ou aproximadamente 16% do cromossomo 4, combase nas distâncias do mapa genético Neighbors IBM2. Ésomente através do mapeamento fisico e clonagem do gene queé possível tal seleção precisa e eficiente de parentalrecorrente assistida com marcador.
Análise Posterior
Portanto, como resultado do mapeamento refinado dalocalização do gene Regi, pode-se utilizar quaisquer doismarcadores flanqueadores que são geneticamente ligados como gene Regi para selecionar uma pequena região cromossômicacom crossovers ao norte e ao sul do gene Regi. Isto trazcomo beneficio a redução do arraste de ligação, o qual podeser um fator de confusão quando se tenta introgredir umgene especifico oriundo de germoplasma não adaptado, talcomo a MP305, para um germoplasma elite, tal como aslinhagens endogâmicas observadas acima. As Figuras 7 e 22 ea Tabela 16 mostram muitas combinações de marcadores queflanqueiam o gene e o lócus de Regi que podem ser usadaspara este propósito. Alguns marcadores flanqueadoresespecíficos que podem ser usados para selecionar intervaloscromossômicos truncados que incluem o gene ou o lócus deRegi são UMC2285 e UMC15a, UMC2285 e UMC2187, UMC1086 eUMC2200, UMC2041 e UMC2200, UMC2041 e PHI093, MZA11455 eUMC15a, MZA11455 e MZA3434, MZA15842 e MZA3434, e FLP8 eFLP33. Opcionalmente, em ou dentro de cada um dessesintervalos cromossômicos, pode-se utilizar pelo menos 1, 2,3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 ou maismarcadores de modo a localizar o evento de recombinação eselecionar o gene Regi ou o lócus de Regi com a máximaquantidade de genótipo parental recorrente. Adicionalmente,pode-se ter pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,13, 14, 15, ou mais marcadores entre a extremidade norte detal intervalo cromossômico e o topo do gene Regi e/ou entrea extremidade sul de tal intervalo cromossômico e o fundodo gene Regi.É vantajoso ter marcadores flanqueadores estreitamenteligados para a seleção de um gene, e é altamente vantajosoter marcadores dentro do próprio gene. Isto é umaperfeiçoamento sobre o uso de um único marcador ou demarcadores flanqueadores distantes, na medida em que, comum único marcador ou com marcadores flanqueadoresdistantes, a ligação associada com o Regi pode ser quebradae, por seleção de tais marcadores é mais provável queocorra a seleção inadvertidamente de plantas sem o geneRegi. Na medida em que a seleção assistida com marcador éfreqüentemente usada, ao invés da seleção fenotipica, umavez que a associação marcador-caractere tenha sidoconfirmada, o resultado inauspicioso de tal erro pode ser aseleção de plantas que não são resistentes a Cg e descartarplantas que são resistentes a Cg. Neste aspecto, osmarcadores dentro do gene Regi são particularmenteutilizáveis, já que eles, por definição, permanecerãoligados com resistência a Cg como melhorado ou conferidopelo gene. Além disso, os marcadores dentro do lócus deRegi são justamente utilizáveis por uma razão similar.Devido à sua proximidade muito estreita com relação ao geneRegi, muito provavelmente eles permanecem ligados ao geneRegi. Uma vez introgredidas com o gene Regi, taisendogâmicas elite podem ser usadas para a produção desemente híbrida e como fonte doadora de posteriorintrogressão do gene Regi em outras linhagens endogâmicas.
Portanto, os dados nitidamente mostram que a progênieendogâmica convertida pelo uso da DE811ASR(BC5) como umafonte doadora retém o intervalo cromossômico truncado daMP305. As endogâmicas compreendendo o intervalocromossômico truncado da MP305 são muito úteis como aspróprias fontes doadoras e não há necessidade de reverterpara a DE811ASR (BC5) como uma fonte doadora. Pelo uso demelhoramento assistido com marcador como acima descrito, ointervalo cromossômico truncado de MP305 pode ser aindareduzido em tamanho quando for necessário sem preocupaçãode perder a ligação entre os marcadores e o gene Regi.Fenotipicamente, um intervalo cromossômico reduzido estáassociado com o desempenho agronômico aperfeiçoado, comofoi demonstrado para a DE811ASR(BC5) versus a DE811ASR(BC3)acima descritas.
EXEMPLO 6
Uso do Regi como um transgene para criar plantas demilho resistentes
O gene Regi também pode ser expressado como umtransgene, permitindo a modulação de sua expressão emdiferentes circunstâncias. Os exemplos a seguir mostramcomo o gene Regi pode ser expressado em diferentes maneiraspara combater diferentes doenças ou proteger diferentesporções da planta, ou simplesmente mover o gene Regi paradiferentes linhagens de milho como um transgene, como umaalternativa para o método descrito no Exemplo 5.
EXEMPLO 6A:Neste exemplo, o gene Regi é expressado usando seupróprio promotor. A região a montante do gene Regi foiseqüenciada usando os mesmos BACs que, no Exemplo 2,forneceram as seqüências da seção codificante de proteinado gene. A seqüência 5' de 1684 pb até o ATG estáapresentada na SEQ ID No: 24. De modo a transformar o geneRegi completo, incluindo o promotor e a região codificantede proteina, um fragmento de 5910 pb que se estende desde aposição 41268 até a posição 47176 na SEQ ID No: 137 foiamplificado por PCR usando o clone de BAC #24 (pk257m7)como template de DNA. Para possibilitar a clonagem usando aTecnologia Gateway® (Invitrogen, Carlsbad, USA), sitiosattB foram incorporados em primers de PCR, e o produtoamplificado foi clonado no vetor pDONR221 por reação derecombinação BP Gateway®. O fragmento resultante,flanqueado por sitios attL, foi transportado pela reação derecombinação LR Gateway® em um vetor binário. O DNA doconstrueto foi depois usado para a transformação de milhocomo descrito no Exemplo 7.
EXEMPLO 6B:
De modo a expressar o gene Regi através da planta emum baixo nivel, a região codificante do gene e seuterminador são colocados atrás dos promotores tanto do genede actina de arroz (patentes US 5.641.876 e US 5.684.239)como do gene F3.7 (patente US 5.850.018). Para possibilitara clonagem usando a Tecnologia Gateway® (Invitrogen,Carlsbad, USA), sítios attB são incorporados nos primers dePCR que são usados para amplificar o gene Regi começando 35pb a montante do seu códon de iniciação. É adicionado umsitio Notl ao primer attBl. 0 produto de Regi amplificado éclonado no vetor pDONR221 pela reação de recombinação BPGateway® (Invitrogen, Carlsbad, USA) . Após a clonagem, ogene Regi resultante é flanqueado por sitios attL e possuium único sitio Notl no 35 pb a montante do códon deiniciação. Depois disso, os fragmentos de promotor sãoamplificados por PCR usando primers que contêm sitios Notl.Cada promotor é fundido ao sitio Notl do Regi. Na etapafinal, o gene quimérico é transportado pela reação derecombinação LR Gateway® (Invitrogen, Carlsbad, USA) para ovetor binário PHP20622. Isto é usado para a transformaçãode milho como descrito no Exemplo 7.
EXEMPLO 6C:
De modo a expressar o gene Regi através da planta emum alto nivel, a região codificante do gene e seuterminador foram colocados atrás do promotor da região 5'não-traduzida e de um intron de um gene de ubiquitina demilho (Christensen et al. (1989) Plant Mol. Biol. 12:619-632; Christensen et al. (1992) Plant Mol. Biol. 18:675-689) . Para possibilitar a clonagem usando a TecnologiaGateway® (Invitrogen, Carlsbad, USA), sitios attB foramincorporados nos primers de PCR que foram usados paraamplificar o gene Regi começando no pb 142 a montante docódon de iniciação. 0 produto de amplificação foi clonadono pDONR221 (Invitrogen, Carlsbad, USA) usando uma reaçãode recombinação BP Gateway® (Invitrogen, Carlsbad, USA).Após a clonagem, o gene Regi resultante foi flanqueado porsitios attL. Na etapa final, o clone Regi foi transportadopor meio de uma reação de recombinação LR Gateway(Invitrogen, Carlsbad, USA) para um vetor que continha opromotor de ubiquitina de milho, a região 5' não-traduzidae o primeiro intron do gene de ubiquitina como descrito porChristensen et al. (acima mencionado) seguido por sitiosATTR1 e R2 Gateway® para a inserção do gene Regi, atrás docassete de expressão de ubiquitina. O vetor também continhaum gene marcador apropriado para transformação de milho, demodo que o plasmideo resultante, portanto o gene quimérico(promotor de ubiquitina de milho - região não-traduzida 5'de ubiquitina - intron 1 de ubiquitina - Regi), foiapropriado para a transformação de milho como descrito no Exemplo 7.
EXEMPLO 6D:
De modo a expressar o gene de Regi sob condições debaixo nivel de expressão colmo-preferida, a regiãocodificante do gene e seu terminador são colocados atrás dopromotor do gene Br2 (Pedido de Patente US No. de Série10/931.077). O fragmento descrito no Exemplo 6b contendo aregião codificante de Regi flanqueada pelos sitios attL econtendo um sitio único Notl 35 pb a montante do códon deiniciação de Regi é usado para possibilitar a clonagemusando a Tecnologia Gateway® (Invitrogen, Carlsbad, USA) .Os fragmentos de promotor tanto do Br2 como do ZM-419 sãoamplificados por PCR usando primers que contêm sitios Notl.Cada promotor é fundido ao sitio Notl de Regi. Na etapafinal, o construeto de gene quimérico é transportado pormeio de reação de recombinação LR Gateway (Invitrogen,Carlsbad, USA) para o vetor binário PHP20622. Este é usadopara a transformação de milho como descrita no Exemplo 7.
EXEMPLO 7
Transformação de milho mediada por Agrobacterium eregeneração de plantas transgênicas
Os construetos de DNA recombinante preparados noExemplo 6a e 6c foram usados para preparar plantastransgênicas de milho como se segue.
O milho foi transformado com construetos depolinucleotideo selecionados descritos no Exemplo 6a e 6cusando o método de Zhao (patente US 5.981.840, e Pedido dePatente PCT publicado W098/32326). Resumidamente, embriõesimaturos foram isolados a partir de milho e os embriõesforam contatados com uma suspensão de Agrobacterium, naqual as bactérias foram capazes de transferir o construetode polinucleotideo a pelo menos uma célula de pelo menos umdos embriões imaturos (etapa 1: a etapa de infecção). Nestaetapa, os embriões imaturos foram imersos em uma suspensãode Agrobacterium para a iniciação da inoculação. Osembriões foram co-cultivados por um tempo com oAgrobacterium (etapa 2: a etapa de co-cultivo). Os embriõesimaturos foram cultivados em meio sólido seguindo-se aetapa de infecção. A seguir deste periodo de co-cultivo,foi realizada uma etapa opcional de "descanso". Nesta etapade descnaso, os embriões foram incubados na presença depelo menos um antibiótico conhecido por inibir ocrescimento de Agrobacterium sem a adição de um agente deseleção para os transformantes de planta (etapa 3: etapa dedescanso). Os embriões imaturos foram cultivados em meiosólido com antibiótico, mas sem um agente de seleção, paraa eliminação do Agrobacterium e para uma fase de descansodas células infectadas. Em seguida, os embriões inoculadosforam cultivados em meio contendo um agente de seleção, e ocalo transformado crescido foi recuperado (etapa 4: a etapade seleção). O calo foi então regenerado para plantas(etapa 5: a etapa de regeneração), e os calos crescidos nomeio de seleção foram cultivados em meio sólido pararegenerar as plantas.
EXEMPLO 8
Avaliação da planta transgênica
As plantas transgênicas foram produzidas como descritono Exemplo 7 usando constructos descritos nos Exemplos 6a e6c, respectivamente. Para ambos os constructos, do geneRegi natural e do gene Regi de ubiquitina, foram gerados 30eventos independentes e 10 eventos de controle de vetorsomente.Discos de folha de cada evento transgênico de genenatural foram colhidos para isolamento do RNA total. O RT-PCR foi realizado usando os primers específicos de geneFLP111F e FLP111R apresentados nas SEQ ID Nos: 37 e 38. Em30 dos 30 eventos transgênicos, a banda de RT-PCR esperadade 637 pb estava presente, indicando a expressão doconstructo' de gene natural. Os ensaios de doença foramrealizados na casa de vegetação nos mesmos 30 eventostransgênicos de Regi natural para determinar se as plantaseram resistentes a Cg. Para realizar isto, primeiramenteforam feitos os ensaios de queima das folhas em 5 plantasirmãs de cada evento usando os procedimentos descritos noExemplo 10. Foi verificado que um único evento mostrou umasignificativa redução na doença com relação às plantascontrole nas quais está ausente o constructo do gene Reginatural. As plantas que foram submetidas ao ensaio dequeima de folha foram deixadas a desenvolver por duassemanas após a antese e, depois, adicionalmente testadaspela inoculação de Cg no interior do primeiro internódulode colmo alongado. Esses ensaios de infecção de colmomostraram um único evento transgênico que expressa otransgene Regi natural como sendo mais resistente àinfecção por Cg quando comparado com as plantas controle.Entretanto, este evento diferiu do evento positivoidentificado via os ensaios de infecção de folha.
As plantas transformadas com o constructo de Regi deubiquitina descritos no Exemplo 6c foram analisadas de ummodo semelhante. A análise de RT-PCR mostrou que 28 dos 30eventos transgênicos continham a esperada banda detranscripto, indicando a expressão do constructo de Regi deubiquitina. Quando os ensaios de infecção de folha foramrealizados em 5 plantas a partir de cada um dos 30 eventos,foi identificado um único evento que mostrou uma reduçãoestatisticamente significativa na doença comparada com asplantas controle. As plantas transgênicas foramadicionalmente analisadas pelos ensaios de infecção decolmo. Foram encontrados três eventos como apresentandoaumenta resistência à podridão do colmo quando comparadoscom as plantas controle nas quais está ausente o gene Regide ubiquitina. Esses eventos transgênicos não incluem oprimeiro evento positivo identificado no ensaio de queimade folha.
Os resultados desses experimentos foram consideradosencorajadores com relação aos eventos que mostraram algumaresistência, mas inconclusos, no geral, por diversasrazões. Eventos positivos mostrando resistência aumentada àdoença pelo ensaio de queima da folha falharam emcorrelacionar tais eventos com aqueles identificados peloensaio de infecção do colmo. Isto é o oposto do controlepositivo DE811ASR(BC5) que mostra um nitido aumento deresistência com relação à DE811 em ambos os ensaios dequeima de folha e de infecção de colmo. Adicionalmente, osensaios dos tansgênicos primários mostraram um grau maisalto de variabilidade quando comparados com os ensaios decontroles de DE811 ou DE811ASR (BC5) . Isto foifreqüentemente visto nas replicatas e também através doseventos de controle negativo. Esta última observação podetornar dificil a discriminação dos eventos positivos dosnegativos. As causas possíveis para a natureza inconclusados resultados dos ensaios de doença incluem, mas não estãolimitadas, às que se seguem. É bem conhecido dosespecialistas na técnica que aquelas plantas transgênicasque são derivadas de cultura de tecido apresentam maiorvariabilidade de planta para planta com relação às plantascontrole que são derivadas de semente. Além disso, aexpressão em transformantes primários, ou seja, plantas queforam submetidas ao processo de transformação e regeneraçãocomo descrito no Exemplo 7, é freqüentemente não previsíveldevido ao estresse dos procedimentos de cultura de tecido.
Se, de fato, os eventos forem negativos, os quais não podemser determinados neste ponto, há diversas razões técnicaspara que isto ocorra. Os ensaios realizados também nãodeterminaram se a proteína codificada pelo gene Regi estárealmente presente nas linhagens transgênicas - somente apresença de um segmento do mRNA predito foi analisadousando o RT-PCR. Pode ser que artefatos tenham sidointroduzidos no cassete gênico durante a transformação -não foram realizados exaustivos Southern blots eseqüenciamento para determinar a integridade do construetocompleto nas linhagens transgênicas. De modo a se estudarmais apuradamente essas linhagens transgênicas, as plantasdas últimas gerações serão crescidas em grandes quantidadessob condições de campo e analisadas com relação àresistência à doença. Pode ser antecipado que essas futurasplantas transgênicas apresentarão mais nitidamenteresistência aumentada a Cg.
EXEMPLO 9
Análise de Distribuição do Gene Regi ao longo doGermoplasma e Identificação de Variantes da Seqüência deRegi
Em seguida à identificação, seqüenciamento emapeamento refinado de Regi, outras linhagens foramsubmetidas a screening com relação ao gene Regi. Paradeterminar a presença do gene Regi em outro germoplasma demilho, foram usadas combinações dos primers específicosFLP111F e FLP111R assim como FLP113F e FLPA1R paraamplificar o DNA genômico a partir de um painel diverso delinhagens endogâmicas de milho, incluindo aquelas listadasna Tabela 18 e a F2834T, por reação em cadeia dapolimerase. Em somente 14 (incluindo a MP305) , de um painelde linhagens endogâmicas de milho, foi detectado um produtode amplificação, indicando que o gene Regi é o únicopresente em uma percentagem muito pequena das linhagensendogâmicas que foram submetidas a screening. Portanto, emadição ao uso da MP305 ou da DE811ASR (BC5) como fontedoadora, outras fontes contendo o gene Regi também podemser usadas como uma fonte doadora. Por exemplo, podem serusadas as linhagens endogâmicas disponíveis ao públicoTX601 (disponível sob a ID ^Ames 22763' a partir doNational Plant Germplasm System (NPGS)) e F2834T(disponível sob a ID 'Ames 27112' a partir do NPGS) asquais contêm o gene Regi como fontes doadoras emcruzamentos com outras linhagens endogâmicas de milho quenão contêm o gene Regi, e seleção com relação ao gene Regipelo uso de marcadores como aqui descrito.
Variantes do gene Regi também foram identificadas eanalisadas com- relação a polimorfismos simples denucleotideos (SNPs). Os SNPs foram identificados emposições na Seqüência ID número 1 correspondentes a uma oumais das posições 413, 958, 971, 1099, 1154, 1235, 1250,1308, 1607, 2001, 2598 e 3342 (ver Tabela 7) . Nem todas asvariantes alélicas do gene Regi indicaram um fenótiporesistente. Conseqüentemente, esses SNPs podem ser usadoscomo marcadores para identificar e rastrear precisamente aseqüência de Regi em um programa de melhoramento de plantae para distinguir entre variantes alélicas resistentes esusceptíveis. Além disso, esses SNPs indicam que háseqüências que mostram o fenótipo resistente e que podemser usadas em métodos e produtos aqui revelados. Tambémpode ser verificado que quatro outras linhagens contêm umalelo de Regi: BYD10, 7F11, CML261 e CML277. O testerealizado em 10 plantas não forneceu dados suficientespara determinar conclusivamente se a linhagem 7F11 éresistente. Não há dados disponíveis com relação àresistência das linhagens BYD10, CML261 e CML277, e oseqüenciamento desses alelos não foi completado.Tabela 7
<table>table see original document page 175</column></row><table>
Comprimento da seqüência Consenso = 4212 nucleotídeos. SEQ ID No : 1 é a seqüência de Rcg1. Para as linhagens restantes, a seqüência disponível se expandiu desde o códon de início "atg" no primeiro exon até o códon de parada "tga" no segundo exon. A posição consenso ébaseada na SEQ ID No: 1.EXEMPLO 10
Linhagens contendo o gene Regi são resistentes aqueima de folha induzida por Antracnose
As linhagens aproximadamente isogênicas DE811 eDE811ASR descritas no Exemplo 1 foram testadas com relaçãoàs diferenças de resistência à queima de folha causada porCg usando o procedimento a seguir. Quatro agulhas comuns decostura caseira foram coladas a um suporte de metal de modoque os orifícios para a linha se estendessem para fora dapeça de metal, sendo que todas as quatro agulhas seestenderam por igual distância. Esse conjunto foimergulhado em uma suspensão de esporos de Cg a 5 X IO6esporos/mL e depois empurrado através da superfície de umafolha jovem de milho de modo que a folha ficasse ferida eas feridas fossem simultaneamente inoculadas com osesporos. Uma mecha de algodão úmido foi colocada na nervuracentral perto do sitio de inoculação e a área inteira foicoberta com filme plástico e, sobre este, um pano refletor,ambos amarrados com uma faixa para mantê-la úmida eprotegida. As plantas foram deixadas nesse estado por 50-54horas em uma casa de vegetação padrão, após o que a faixa,o pano e o filme plástico foram removidos. Nos dias 7 e 15após a inoculação, o tamanho da lesão foi medido eregistrado em unidades de centímetros quadrados.
A Figura 10 (a-b) mostra a distribuição de tamanhos delesão 15 dias após a inoculação ao longo do todo das folhasindividuais. Os tamanhos de lesão variam em cada conjuntode dados, mas virtualmente todos os das folhas da DE811(Figura 10b) tinham tamanhos de lesão significativamentemaiores do que as maiores lesões a serem encontradas nasfolhas da DE811ASR(BC5) (Figura 10a). Os dados estãoresumidos para ambos os conjuntos de dados, os do dia 7 eos do dia 15 após a inoculação, como visto na Figura 11. Emambos os dias 7 e 15, o tamanho médio de lesão foi menornas folhas portadoras do gene Regi. A diferença se tornoumaior ao longo do tempo, à medida que o fungo tivesse tempopara crescer e causar dano adicional, de modo que enquantoa diferença é de aproximadamente duas vezes nos dias 7, nosdias 15 ela é mais do que quatro vezes e, de fato, o fungofez somente progresso minimo nas folhas da DE811ASR(BC5).Esses resultados demonstram claramente que a presença dolócus contendo o gene Regi confere resistência à queima defolha por antracnose.
EXEMPLO 11
Linhagens hibridas derivadas da DE811ASR(BC5) possuemmais alta produtividade do que as hibridas da DE811 quandoinfectadas com Colletotrichum graminicola
De forma a demonstrar que as hibridas de milhocontendo o gene Regi possuem mais alto potencial deprodutividade quando infectados com Cg em comparação com aslinhagens hibridas sem Regi, a DE811ASR (BC5) e a DE811, aslinhagens isogênicas descritas no Exemplo 1, foram, cadauma delas, cruzadas com as linhagens endogâmicas B73Ht eMol7Ht, as quais são ambas susceptíveis a Cg.
As linhagens híbridas foram crescidas e avaliadas comrelação à resposta a Cg em 2005, em seis localidades emcinco estados diferentes dos Estados Unidos da América.Para cada linhagem híbrida, foram plantadas trêsreplicações de quatro fileiras a aproximadamente 74.000plantas por hectare. As plantas foram inoculadas com Cg nabase do colmo aproximadamente 10 dias após a florescência.
A primeira fileira de cada parcela de quatro fileiras foiavaliada para verificar se as inoculações tinham sido bemsucedidas, através da determinação da resposta a Cg quatroa cinco semanas após a inoculação. Os colmos foram rachadose a progressão da doença foi contabilizada em escore pormeio de observação da cor preta característica do fungo àmedida que ele se espalha ascendentemente no colmo. Osíndices de doença foram conduzidos como descrito por Junget al. (1994) Theoretical and Applied Genetics, 89:413-418). O número total de internódulos descoloridos maior doque 75% (antgr75) foi registrado nos primeiros cincointernódulos (ver Figura 20) . Isto forneceu um escore dedoença variando de 0 a 5, sendo que zero indica seminternódulos que sejam mais do que 75% descoloridos e 5indicando a completa descoloração dos primeiros cincointernódulos. As duas parcelas centrais foram colhidas namaturidade fisiológica através da máquina de ceifar edebulhar e foi determinada a produtividade de grão emkg/ha.Os resultados resumidos oriundos de todas aslocalidades são mostrados na Figura 12 com relação àgravidade da doença e na Figura 13 com relação àprodutividade. Os dados mostram que os híbridos contendo oRegi (DE811ASR(BC5)/B73Ht e DE811ASR(BC5)/Mol7Ht) possuemmuito menos progresso de doença do que os híbridos sem oRegi (DE811/B73Ht e DE811/Mol7Ht) . Os ' altos escoresrelativos ao progresso da doença nos híbridos susceptíveis(ausência do Regi) mostram a infecção bem sucedida doexperimento com Cg. Além disso, os dados mostram que,quando infectados com Cg, os híbridos contendo Regi possuemuma produtividade maior do que os híbridos com ausência doRegi. As diferenças das comparações em pares individuaissão significantes em P<0,05.
Esses resultados demonstram claramente que, por meiodo uso dos métodos das concretizações, podem ser criadoshíbridos que produzam mais kg de grão por hectare quandoinfectados com Cg.
EXEMPLO 12
Conversões de lócus de Regi de endogâmicos e híbridosderivados de DE811ASR (BC5) ou MP305 são resistentes apodridão de colmo induzida por Colletotrichum graminicola
De modo a demonstrar que as linhagens comerciais demilho podem ser tornadas resistentes a podridão do colmoinduzida por Cg, as MP305 e DE811ASR (BC5) foram cruzadascom PH87P, PH5W4, e PH705. A progênie resultante foicruzada novamente com as três linhagens (ou seja, aslinhagens foram usadas como parentais recorrentes em umprograma de retrocruzamento) mais três vezes, a cada vezsendo feita a seleção com relação à presença do gene Regiusando marcadores moleculares, como descrito no Exemplo 5acima. Como controles, foram também coletadas linhagensselecionadas de retrocruzamento nas quais estava ausente ogene Regi a partir do mesmo programa de retrocruzamento.
Após terem sido completados três retrocruzamentos, diversasversões foram selecionadas e autofecundadas para obter asfamílias BC3S1. Plantas individuais de BC3S1 foramgenotipadas e as plantas positivas homozigotas e negativashomozigotas com relação ao Regi foram autofecundadas paraobter familias BC3S2, as quais foram depois fenotipadas. Asversões de BC3S2 contendo Regi e, como controles, versõesselecionadas sem o gene, foram plantadas em parcelas defileiras simples contendo aproximadamente 25 plantas porfileira. O experimento foi reproduzido em cinco diferenteslocalidades em cinco diferentes estados dos Estados Unidos,designadas Localidades 1, 2, 3, 4 e 5. A aproximadamenteduas semanas após a florescência, as plantas foraminoculadas com Cg na base do colmo. Quatro a cinco semanasmais tarde os colmos foram rachados e foi avaliado oprogresso da doença por estimativa visual da quantidade dedoença no colmo. Um escore visual foi assinalado para cadacolmo com base no grau de infecção de cada internódulo comrelação ao internódulo infectado e os quatro internódulosacima do internódulo de inoculação. Portanto, um baixoescore indica resistência à doença. Os resultadoscompilados para todas as fileiras e localidades estãoresumidos na Figura 14. Imagens representativas de duaslinhagens são mostradas nas Figuras 15 e 16. Os dadosmostram que em todas as localidades, cada uma das linhagensendogâmicas elite foi tornada mais resistente à doença pelapresença do gene Regi.
A semente de milho vendida aos agricultores é"híbrida", indicando que ela é mais comumente o resultadode um cruzamento de duas parentais endogâmicas, referidascomo um híbrido de cruzamento simples. Muitos anos demelhoramento e experiência de produção mostraram que o usode híbridos de cruzamento simples resulta em produtividadesmais altas. Portanto, é importante, para aplicaçõescomerciais, que o gene Regi funcione nas plantas híbridas(aquelas do campo de produção do agricultor), mesmo queesteja presente em somente um dos dois parentais usado paraproduzir a semente hibrida de cruzamento simples. Uma daslinhagens endogâmicas com a qual a linhagem de Regi tenhasido cruzada, a PH705, foi assim usada para criar a sementehibrida por cruzamento com a PH4CV, uma endogâmica eliteque não porta o gene Regi. As sementes híbridas resultantesforam usadas em experimentos idênticos àqueles descritospara as linhagens endogâmicas como discutido acima econtabilizado em escore da mesma maneira em todas as cincolocalidades. Os dados estão resumidos para todas aslocalidades na Figura 17, a qual também mostra o desempenhoda endogâmica PH705, e imagens representativas mostradasnas Figuras 18 e 19. Como pode ser visto, uma nitidadiferença no progresso da doença foi observado em todas aslocalidades para o hibrido PH705 x PH5W4 e em quatro dascinco localidades para o PH705 x PH87P. Na quintalocalidade, as condições ambientais foram muitoestressantes para o crescimento da planta, resultando emplantas que estavam em fraca condição. Sob essas condições,as medidas de resistência da planta à doença freqüentementenão são confiáveis.
Os resultados com ambas as linhagens, a endogâmica ecombinações hibridas contendo Regi, nitidamente demonstramque, usando os métodos das concretizações, pode-se criarlinhagens utilizáveis comercialmente, as quais sãoresistentes a podridão do colmo induzida por Cg.
EXEMPLO 13
Marcadores dentro da seqüência codificante de Regilocalizações de marcador e desenho dentro do lócus de Regie haplótipos para a região cromossômica flanqueadora
Três niveis de localização de marcador podem serutilizados como o resultado de um mapeamento refinado eclonagem do gene Regi, marcadores desenhados dentro daseqüência codificante de Regi, marcadores desenhados dentroda região não-colinear que identifica o lócus de Regi (masfora da seqüência codificante de Regi) e marcadoresdesenhados dentro da região colinear flanqueadora.
Marcadores dentro da seqüência codificante de Regi
Seguindo-se à identificação e ao mapeamento refinadodo gene Regi, foram desenhados marcadores de hibridizaçãoque funcionarão em plataformas de SNP. Na medida em que ogene Regi ocorre em uma região não co-linear do genoma demilho, os marcadores de hibridização estarão presentes emlinhagens compreendendo o gene Regi e ausentes em linhagensque não compreendem o gene Regi. Esses marcadoresidentificam seqüências de polinucleotideo especificas paraa seqüência codificante de Regi listada na SEQ ID No: 1.Como observado na Tabela 7, há outras linhagens de milhocom variantes da seqüência codificante de Regi apresentadana SEQ ID No: 1, e esses marcadores também foram desenhadospara também identificar essas variantes de seqüênciacodificante de Regi.
Para realizar isso, foi criado um mapa consenso daseqüência codificante de Regi a partir de diferentesfontes, como mostrado na Tabela 7. Este mapa consensoalinhou 4209 bases da seqüência codificante de Regi isoladada MP305 com 3451 bases oriundas da PHBTB e 3457 basesoriundas da PH26T. O gene Regi em ambas, PHBTB e PH26T,mostrou resistência à antracnose. Em seguida, os segmentosda seqüência codificante de Regi foram submetidos ao BLASTcontra diversas bases de dados incluindo a NT (DNA Públicoa partir do NCBI) e os mais altos sucessos de homologiaforam alinhados com a seqüência consenso de Regi paradeterminar os segmentos que compartilhavam alta homologia etinham segmentos comuns com outros genes de resistência nafamília NBS-LRR. As regiões únicas para a seqüênciacodificante de Regi e comuns entre as diferentes fontes deRegi foram selecionadas para o desenho do marcador.Especificamente, na medida em que os primers FLP111F eFLP111R produziram um único amplicon que confiavelmentediagnosticou a presença de Regi oriundo de diferentesfontes, as regiões em que FLP111F e FLP111R hibridizaramforam, portanto, tomadas como alvo para o desenvolvimentode um desenho de marcador de SNP.
Um marcador Invader™ {Third Wave Technologies,Madison, WI) foi desenhado usando um segmento de 1413pb apartir da seqüência consenso que continha ambos os sitiosdo primer, sendo que as regiões do primer em si foramtornadas alvo com relação à sonda e hibridização do oligodo Invader™. Os primers foram desenhados em torno de cadasítio de sonda para dar um tamanho de amplicon abaixo de150 pb. Este marcador indicou a presença da seqüênciacodificante de Regi com fluorescência devida àhibridização, sendo que a ausência da seqüência codificantede Regi resultou em não-fluorescência. Um sinal defluorescência controle também pode ser gerado pelo desenhode um marcador que hibridiza com um segundo gene de milhoaltamente conservado, de modo que a presença da seqüênciacodificante de Regi resulta em f luorescência de doiscorantes {Regi e o gene conservado) e a ausência de Regiresulta em fluorescência devida ao gene conservado somente.Esta fluorescência 'controle' pode ser usada para reduzir oerro laboratorial por meio da distinção entre as situaçõesem que o Regi está de fato ausente e a situação em que umfalso negativo tenha ocorrido por causa de uma reaçãofalha. Tais marcadores não estão limitados a uma plataformade detecção de marcador especifico. Os marcadores Taqman®(Applied Biosystems) também foram desenhados para a mesmalocalização (par de primers FLP111F e FLP111R) , que foramusados da mesma meneira que para os marcadores Invader™. Osmarcadores estão mostrados na Tabela 15 e Figuras 23 e 24.
Os desenhos de marcador C00060-01-A e C00060-02-Aforam testados para uma ampla variedade de fontes e foramaltamente bem sucedidos em identificar plantas quecontinham o lócus de Regi e o gene Regi, independentementeda fonte do lócus de Regi ou do gene Regi. Esses marcadorestambém foram usados contra um conjunto controle de perto de100 linhagens endogâmicas diversas conhecidas como nãoportadoras do gene, e nenhuma fluorescência foi detectadano conjunto controle. As plantas em que um ou ambos osdesenhos de marcador, C00060-01-A e C00060-02-A,confirmadas como tendo o Regi incluem aquelas mostradas naTabela 7.
Portanto, este exemplo mostra que, com base noensinamento aqui provido, podem ser construídos marcadoresque identificam a seqüência codificante de Regi em umadiversidade de fontes.
Marcadores dentro do lócus de Rcgl
Podem ser desenhados marcadores para o lócus de Rcgl
em adição a ou ao invés de usar marcadores dentro daprópria- seqüência codificante de Rcgl. A distância fisicapróxima entre a seqüência codificante de Rcgle a região não-colinear torna improvável o fato de que a ligação entremarcadores dentro da região não-colinear, mas fora daseqüência codificante de Regi, seja perdida através derecombinação. Da mesma forma que com marcadores para aseqüência codificante de Rcgl, um marcador mostrando comopresente ou ausente seria suficiente para identificar olócus de Rcgl.
Para desenhar marcadores para esta região, foiseqüenciado um segmento de 64.4 60 pb da região não-colinearincluindo o gene Regi e a região diretamente ao norte dogene Rcgl. Os BACs nesta região foram rompidos em sub-clones com comprimento de aproximadamente 800 nucleotideose seqüenciados. Estas seqüências foram depois montadas paraconstruir a seqüência BAC, e as regiões gênicas erepetitivas foram identificadas. As regiões repetitivasforam identificadas de modo a evitar a colocação demarcadores em regiões repetitivas. Semelhantemente, asseqüências com alta homologia com relação a seqüências demilho conhecidas foram facilmente evitadas por meio de umabusca simples de BLAST. Foram evitadas as seqüênciaspotenciais que contivessem SSRs, corridas de As, Ts ou Gs,ou que resultassem na geração de sondas de baixo teor de GCque podem causar problemas dentro da plataforma Invader™(ver Figura 9(b) e Tabela 17).
Os segmentos selecionados foram depois colocados nosoftware Invader Creator™ (Third Wave, Madison, WI) , o qualgera oligos para uma reação Invader™. Isto produziu umdesenho sense e um antisense para todos os SNPs. Foramselecionados os desenhos sense com os melhores escores esem penalidades. Apesar de esses marcadores terem sidodesenhados, eles ainda não foram testados.
Foram desenhados primers usando o Primer3 (Steve Rozene Helen J. Skaletsky (2000) Primer3 disponível na Web parausuários em geral e para programadores em biologia. In:Krawetz S, Misener S (eds) Bioinformatics Methods andProtocols: Methods in Molecular Biology. Humana Press,Totowa, NJ, pp 365-386) . Os primers foram selecionados forados components Invader™, e foram selecionados os primerspreferidos perto de ou abaixo do comprimento de 150 pb. Atemperatura e o comprimento do primer foram ajustados paraser o mais utilizável pela plataforma Invader™, apesar deque, se forem usados com outras plataformas de detecção, osprimers devem ser otimizados para uso com tais plataformas.
Marcadores na região co-linear e haplotipos associadosMarcadores proximamente ligados flanqueando o lócus deRegi podem ser eficazmente usados para selecionar umaplanta de progênie que tenha herdado o lócus de Regi de umaparental que compreende o lócus de Regi. Os marcadores aquidescritos, tais como aqueles listados na Tabela 16, assimcomo outros marcadores geneticamente ou fisicamentemapeados com relação ao mesmo segmento cromossômico, podemser usados para selecionar um segmento cromossômicotruncado compreendendo o lócus de Regi. Tipicamente, umconjunto desses marcadores será usado (por exemplo, 2 oumais, 3 ou mais, 4 ou mais, 5 ou mais) na regiãoflanqueadora acima do gene e conjunto semelhante na regiãoflanqueadora abaixo do gene. Opcionalmente, como descritoacima, um marcador dentro do gene Regi e/ou do lócus deRegi também pode ser usado. Os parentais e sua progênieforam submetidos a screening com relação a esses conjuntosde marcadores, e os marcadores que são polimórficos entreos dois parentais são usados para seleção. Os marcadorespolimórficos mais próximos do gene Regi ou do lócus de Regisão usados para selecionar com relação ao gene ou ao lócus.Em um programa de introgressão, isto permite a seleção dogenótipo do gene Regi ou do lócus de Regi nos marcadorespolimórficos mais próximos, e seleção com relação aogenótipo do parental recorrente nos marcadores polimórficosmais distantes. Como descrito em maiores detalhes noExemplo 5 acima, este processo permitiu a seleção eficientede um segmento cromossômico truncado compreendendo o lócusde Regi.O processo descrito acima requer conhecimento dosgenótipos dos parentais usados no cruzamento.Opcionalmente, podem ser usados haplótipos de maneira que ogene Regi ou o lócus de Regi possa ser selecionado semprimeiramente genotipar os parentais específicos usados nocruzamento. Esta é uma maneira altamente eficiente deselecionar o lócus de Regi, especialmente na ausência deuso de marcadores dentro do gene Regi ou do lócus de Regi.
Todas as plantas a serem usadas no programa demelhoramento, tal como um programa de introgressão de gene,são submetidas a screeníng com marcadores. Podem ser usadosos marcadores aqui revelados ou marcadores equivalentes nomesmo segmento cromossômico. Os haplótipos de planta (umasérie de SNP ou outros marcadores em desequilíbrio deligação) são observados. O haplótipo da planta resistenteem torno do lócus de Regi é comparado com o haplótipo dasoutras plantas a serem usadas que não compreendem o lócusde Regi. Um haplótipo único com relação à planta resistenteem torno do lócus de Regi é então usado para seleção, eeste haplótipo identificará especificamente o segmentocromossômico oriundo da planta resistente com o lócus deRgcl.
Com base em uma análise da MP305 e um conjunto diversode várias centenas de linhagens de milho, incluindo as 50linhagens de milho públicas mostradas na Tabela 18, foiidentificado um único haplótipo de SNP para o segmentocromossômico da MP305 com o lócus de Regi. Este haplótipode SNP identifica de modo único o segmento cromossômico daMP305 que se estende ao longo de MZA3434, MZA2591 eMZA11123. Ver Figura 22, SEQ ID NoO: 140, 141 e 142, eTabelas 8, 9 e 10.
Primeiramente, os pares de primer denscritos na Tabela2 para os três MZA's foram usados para identificar oshaplótipos. Os pares de primers MZA3434 E forward e reverseforam usados para amplificar o DNA genômico do conjunto delinhagens de milho. Os fragmentos de PCR foramposteriormente purificados por amplificação com os pares deprimers MZA3434 I forward e reverse. Este processo foirepetido para a MZA2591 e a MZA11123. Os fragmentos de PCRresultants foram seqüenciados na direção forward e reversee as seqüências foram alinhadas para dar uma seqüênciaconsenso (ver as seqüências apresentadas em SEQ ID Nos:140, 141 e 142). Os SNPs e indels dentro dessas seqüênciasconsenso são mostrados nas Tabelas 8, 9 e 10. Essas sériesde SNPs e indels foram comparados com o conjunto degenótipos.
Para a MZA3434, o haplótipo 8 foi um raro alelo dehaplótipo e foi o único para a MP305 e para somente umaoutra linhagem de milho. Este processo foi repetido para aMZA2591, e foi verificado que a MP305 possui o haplótipo 2em MZA2591, o qual foi compartilhado por somente duasoutras linhagens de milho. A MP305 foi a única linhagem demilho a possuir ambos, o haplótipo 8 em MZA3434 e ohaplótipo 2 em MZA2591 e, portanto, a combinação dessesdois haplótipos, 8 em MZA3434 e 2 em MZA2591, identifica demodo único a região cromossômica da MP305 compreendendo olócus de Regi. A MP305 também tinha um haplótipoinformativo em MZA11123. Foi verificado que a MP305 possuio haplótipo 7, que era compartilhado com 66 outraslinhagens de milho, mas nenhuma dessas linhagens de milhotinha o haplótipo 8 em MZA3434, ou haplótipo 2 em MZA2591.Portanto, qualquer combinação de 2 haplótipos em MZA3434,MZA2591 ou MZA11123 pode ser usado para identificar de modoúnico a MP305 dentre esses genótipos. Os haplótipos podemdepois ser interrogados por seqüenciamento do fragmento oupelo desenho de marcadores para cada SNP ou indel dentro deum fragmento.
Os polimorfismos dentro dos haplótipos podem serusados para marcar o haplótipo. Os chamados 'Tag-SNPs', ouxhaplótipo-tags' podem ser muito úteis no melhoramento deplantas, na medida em que pode ser determinada maisinformação do que o polimorfismo em si via extrapolaçãopara o haplótipo. Um haplótipo pode ser definido como umasérie de polimorfismos ao longo das seqüências e eles podemser denomonados 'haplótipos de longa-faixa'.
Foram observados raros polimorfismos dentro dehaplótipos que devem ser usados como 'marcadores (tags) dehaplótipo'. Por exemplo, tanto os SNPs MZA2591.32 (alelo c)ou MZA2591.35 (alelo t) podem ser usados para marcar ohaplótipo 2 em MZA2591, e da mesma maneira que o haplótipo2, ambos foram únicos para a MP305 e duas outras linhagensde milho. A combinação dos SNPs MZA2591.32 (alelo c) eMZA2591.35 (alelo t) combinada com o MZA3434.17 (alelo c)deu um haplotipo de *longa-faixa' que pode ser usado paradistinguir a MP305 de todos os outros genótipos no estudo.
Adicionalmente, outros marcadores, MZA15842, MZA11455,MZA8761 e MZA1851 também mostraram polimorfismo com aMP305. Para o MZA15842, somente 18 das outras linhagens demilho compartilharam haplotipo igual ao da MP305; para oMZA11455, somente 43 das outras linhagens de milhocompartilharam haplotipo igual ao da MP305; para o MZA8761,somente cerca de metade das outras linhagens de milhocompartilhou haplotipo igual ao da MP305; e para o MZA1851,somente cerca de metade das outras linhagens de milhocompartilhou haplotipo igual ao da MP305. Foramdesenvolvidas seqüências consenso para esses marcadores queestão apresentadas nas SEQ ID Nos: 143-146. Os SNPs eindels dentro de três seqüências consenso estão mostradosnas Tabelas 11-14. Quatro exemplos de haplótipos únicosusando os marcadores de MZA são:
MZA11123 (haplotipo 7)
MZA15842 (haplotipo 3)
MZA8761 (haplotipo 1)e
MZA11123 (haplotipo 7)
MZA15842 (haplotipo 3)
MZA1851 (haplotipo 1)e<table>table see original document page 193</column></row><table>
Múltiplas combinações no seio de todos os marcadoresaqui revelados, ou outros marcadores dentro da regiãotambém conterão haplótipos únicos que identificam' o lócusde Regi.
Tabela 8: Polimorfismos de MZA3434M='Mutante': difere do consenso; W=,tipo selvagem': igualao consenso
<table>table see original document page 193</column></row><table>Tabela 9: Polimorfismos de MZA2591
<table>table see original document page 194</column></row><table>Table 9 (cont.): Polimorfismos de MZA2591
<table>table see original document page 195</column></row><table>Tabela 10: Polimorfismos de MZA11123
<table>table see original document page 196</column></row><table>Tabela 11: Polimorfismos de MZA15842
<table>table see original document page 197</column></row><table>Tabela 12: Polimorfismos de MZA8761
<table>table see original document page 198</column></row><table>Tabela 13: Polimosrfismos de MZA1851
<table>table see original document page 199</column></row><table>Tabela 14: Polimorfismos de MZA11455
<table>table see original document page 200</column></row><table>Tabela 15: Marcadores dentro da Seqüência Codificante de Regi
<table>table see original document page 201</column></row><table><table>table see original document page 202</column></row><table>Tabela 16: Marcadores contidos dentro dos intervaloscromossômicos definidos que podem ser usados paraselecionar o Regi
Os marcadores públicos são retirados do mapa 4neighbors IBM2, enquanto que as localizações relativas dosmarcadores Pioneer (prefixo *MZA') foram determinados pormeio de mapeamento com relação ao mesmo mapa genético e pormeio da localização no mapa fisico.
<table>table see original document page 203</column></row><table><table>table see original document page 204</column></row><table>Tabela 17: Marcadores dentro do Lócus de Regi
<table>table see original document page 205</column></row><table>Tabela 18: Lista de Linhagens Públicas usadas em AnáliseHaplótipos
<table>table see original document page 206</column></row><table>LISTAGEM DE SEQÜÊNCIAS
1) INFORMAÇÕES GERAIS:
I.a) (1) Requerente: E.I. DUPONT DE NEMOURS ANDCOMPANY
I.b) Endereço: 1007 Market Street, Wilmington,Delaware 19898 (US)
I.a) (2) Requerente: PIONEER HI-BRED INTERNATIONALINC.
I.b) Endereço: 7100 N.w., 62nd Avenue, Johnston, Iowa50131-1014 (US)
I.a) (2) Requerente: UNIVERSITY OF DELAWARE
I.b) Endereço: Office of Vice Provost of Research,210 Hullihen Hall, Newark, Delaware,19716 (US)
II) Dados de Prioridade Unionista: US - No.60/668.241 de 04/04/2005 e US - No.60/75.664 de 28/04/2005
III) Titulo da Invenção: POLINÜCLEOTÍDEOS EPROCESSOS DE PRODUÇÃO DE PLANTAS RESISTENTES APATÓGENOS DE FUNGOS
IV) Número de Seqüências: 232 (duzentos e trinta eduas).
V) Formato para leitura em computador:
V.a) Meio utilizado: disquete de 3,5 polegadas.
V.b) Computador utilizado: compatível com IBM PC.
V.c) Sistema operacional: PC-DOS/MS-DOS (FastSEQfor Windows Version 4.0 - software usadopara criar Lista de Seqüências).
2) INFORMAÇÕES GERAIS DAS SEQÜÊNCIAS:I.a) Número identificador da seqüência: SEQ ID No: 1
II) Caracteristicas da seqüência:II.a) tamanho: 4212Il.b) tipo: DNAII.c) organismo: Zea mays
III) Caracteristicas
III.1 .aIII.1 .bIII. l.c
III.1 .aIII. l.bIII .l.c
III. 1 .aIII. l.bIII.l.c
III.1.aIII. l.bIII .l.c
III. 1 .aIII .l.b
III. 1 .aIII .l.b
Nome/chave: geneLocalização: (0) ... (0)outra informação relevante
nucleotideos para Regi
Seqüência de
Nome/chave: exonLocalização: (143) ... (948)outra informação relevante: exon 1
Nome/chave: exonLocalização: (1452) ... (3588)outra informação relevante: exon 2
Nome/chave: intronLocalização: (949) ... (1451)outra informação relevante: intron 1
Nome/chave: CDSLocalização: (143) ... (948)
Nome/chave: CDSLocalização: (1452) ... (3588)
IV) Seqüência: 1aaaaccctca ccacattttc ctcaaccaca tgatggagat tggggctact agatactatg 60cctggtggta gactggtagc tgatgtcttt ggaccagtag ttggtgctag atttgtgaac 120tctaccaagg tgagaaacgg ag atg gag gct gcc ctg ctg age ggg ttc ate 172
Met Glu Ala Ala Leu Leu Ser Gly Phe lie15 10
aaa acc ate ctg cca agg etc ttc tca ctg gta caa ggg aga tac aag 220Lys Thr lie Leu Pro Arg Leu Phe Ser Leu Vai Gln Gly Arg Tyr Lys15 20 25
ctg cac aag ggc etc aag age gac ate aaa tcg ctg gag aaa gag etc 268Leu His Lys Gly Leu Lys Ser Asp lie Lys Ser Leu Glu Lys Glu Leu30 35 40
cat atg ate gct gtt aca ate gat gaa caa ate tcg ctg ggg agg aag 316His Met lie Ala Vai Thr lie Asp Glu Gln lie Ser Leu Gly Arg Lys45 50 55
gat cag gga gct gtg ctg age etc tca att gat gag ctg cat gaa ctg 364Asp Gln Gly Ala Vai Leu Ser Leu Ser lie Asp Glu Leu His Glu Leu60 65 70
gct cac caa ate gag gac tec ata gat cgc ttc ttg tac cat gtg acc 412Ala His Gln lie Glu Asp Ser lie Asp Arg Phe Leu Tyr His Vai Thr75 80 85 90
agg gag cag caa gea tec ttt ttt cgt cgg act gta cgg tcg ceg aag 460Arg Glu Gln Gln Ala Ser Phe Phe Arg Arg Thr Vai Arg Ser Pro Lys95 100 105
act ctg ttg tca cgt cag cgg ctg gct gcc gag gtt cag ttc ctg aag 508Thr Leu Leu Ser Arg Gln Arg Leu Ala Ala Glu Vai Gln Phe Leu Lys110 115 120
aag ata ceg gag gag gcg cac cag cga gag aag agg tac agg gtc ttc 556Lys lie Pro Glu Glu Ala His Gln Arg Glu Lys Arg Tyr Arg Vai Phe125 130 135gcc ggc ctt tct tcc tct acc cgg cac act gaa tcg tct tcc tgt tcg 604Ala Gly Leu Ser Ser Ser Thr Arg His Thr Glu Ser Ser Ser Cys Ser140 145 150
tct gta tct gat ccg cac aca ctt aag gcc gac gtc gtc ggc ate gac 652Ser Vai Ser Asp Pro His Thr Leu Lys Ala Asp Vai Vai Gly lie Asp155 160 165 170
ggt cec agg gac gag ctt gtg cag cag tta acc gaa gag gea gag ggc 700Gly Pro Arg Asp Glu Leu Vai Gln Gln Leu Thr Glu Glu Ala Glu Gly175 180 185
cta aca aag cag etc aag gtg ate tcc ate gtc ggg ate cat ggc tcc 748Leu Thr Lys Gln Leu Lys Vai lie Ser lie Vai Gly lie His Gly Ser190 195 200
ggc aag acc gtc ctt gcc aga gag gta tac gag age gac gtc ggc cgg 796Gly Lys Thr Vai Leu Ala Arg Glu Vai Tyr Glu Ser Asp Vai Gly Arg205 210 215
cag ttc agt etc cgg gea tgg gtt tct gct act gac aga ggt ccg aga 844Gln Phe Ser Leu Arg Ala Trp Vai Ser Ala Thr Asp Arg Gly Pro Arg220 225 230
gag gtg etc atg gag ate etc cga aat ttt ggt agg cca gtg gtg gat 892Glu Vai Leu Met Glu lie Leu Arg Asn Phe Gly Arg Pro Vai Vai Asp235 240 245 250
age tct agt att gac cag ctt acg gta gat etc agg aaa cac ttg ggt 940Ser Ser Ser lie Asp Gln Leu Thr Vai Asp Leu Arg Lys His Leu Gly255 260 265
gag aaa ag gtgaaaaaaa cctcttcttt atgttattta ttatttatga agtttcttca 998Glu Lys Ser
actacgggtt ttcatgttca aattgcctct ctgaacttcg aaaacgttta ataccaattg 1058
aattgaggat cttagctttg gaaaagcggt agtgttttga cgttttgcat acatttetea 1118
ccgttatttt attcatttat aatttagagt ttaagcagta tattcatttt gaaatttatg 1178
agatttctgt ctgcacgctt acttccatgc ccaaaacatg tccgattgag aacagaaggt 1238
aattttgttt gatctttgag atcagacaca ctgattgagt agtaacagga aacaagtgct 1298
caccaatcac ccaagtcact tacaaagaat ttcatgctta caaaacacac tgattgttaa 1358
ggatagagac tatgtttgat ctgcatagtt tgaattttga ttatgtcatc gtcgattgtt 1418
atcattaact tttgttggaa atttctcttg tag c tat ttc att gta ate gat 1470
Tyr Phe lie Vai lie Asp270 275
ggc atg caa aca gat cag tgg age acc att gaa act gcc ttc cca gaa 1518Gly Met Gln Thr Asp Gln Trp Ser Thr lie Glu Thr Ala Phe Pro Glu280 285 290
aac aat gtt gtt age age aga gta att gtt aca aca aca ate cgg tca 1566Asn Asn Vai Vai Ser Ser Arg Vai lie Vai Thr Thr Thr lie Arg Ser295 300 305
gta gct aat tct tgc age tct tct aac ggt tat gtg cac aaa atg aaa 1614Vai Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Vai His Lys Met Lys310 315 320aga ctt agt gac gaa cac tca gag caa ttg ttt ate aag aaa gct tgc 1662Arg Leu Ser Asp Glu His Ser Glu Gln Leu Phe lie Lys Lys Ala Cys325 330 335
cca aca aaa tat tca ggt tat act cga ceg gaa tca aaa gaa gtt ctg 1710Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys Glu Vai Leu340 345 350 355
aag aaa tgt gat ggt caa cca ctt gct ctt gtt act atg ggc caa ttc 1758Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Vai Thr Met Gly Gln Phe360 365 370
ttg agg aaa aat ggt tgg cec aca gga cec aac tgc gaa aat gtg tgt 1806Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu Asn Vai Cys375 380 385
aga gat ctt aga cga cat ctg gag cag gat gat aca ttg gag aga atg 1854Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu Glu Arg Met390 395 400
cga agg gtg ctt ate cac age tta tet agt ctt cet age cat gtt cec 1902Arg Arg Vai Leu lie His Ser Leu Ser Ser Leu Pro Ser His Vai Pro405 410 415
aaa gcc tgc ctt ttg tat ttt ggt atg ttt cca tgt gat cat cec ata 1950Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp His Pro lie420 425 430 435
aag agg aag age ctg atg agg cga tgg tta gea gag gga ttt gta caa 1998Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly Phe Vai Gln440 445 450
aca cag cet tca tet agt gaa aac ttc aac acc etc ata gac cgg aat 2046Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu lie Asp Arg Asn455 460 465
att att gag cec ate ggc ata tgt aac gat gat cag gta aag aca tgc 2094lie lie Glu Pro lie Gly lie Cys Asn Asp Asp Gln Vai Lys Thr Cys470 475 480
aaa aca tat ggc atg atg cac gag ttc att ttg tta atg tec acc tec 2142Lys Thr Tyr Gly Met Met His Glu Phe lie Leu Leu Met Ser Thr Ser485 490 495
cat gac ttc att acc ctg ctt tgt aat aat aaa gtt gaa cac aaa tat 2190His Asp Phe lie Thr Leu Leu Cys Asn Asn Lys Vai Glu His Lys Tyr500 505 510 515
gtg cgt cgg ctt tet etc cat cat cat agt gct aca agt ggc agt ttt 2238Vai Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser Gly Ser Phe520 525 530
tcg gtc ate gac tta tet ctt gtt aga tet ctg atg gtt ttt ggg gag 2286Ser Vai lie Asp Leu Ser Leu Vai Arg Ser Leu Met Vai Phe Gly Glu535 540 545
gct ggc aaa act att ttg agt ttc cga aag tac gag cta ttg aga gtc 2334Ala Gly Lys Thr lie Leu Ser Phe Arg Lys Tyr Glu Leu Leu Arg Vai550 555 560ttg gat ctt gaa caa tgt acc gac ttg gaa gat gat cac etc aaa gac 2382Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His Leu Lys Asp565 570 575
ata tgc aac ctt ttt ctt atg aaa tat cta age etc gga gaa act att 2430lie Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly Glu Thr lie580 585 590 595
aga agt ctt cca aag gag ata gaa aaa ctg aag etc ttg gag aca ctt 24 78Arg Ser Leu Pro Lys Glu lie Glu Lys Leu Lys Leu Leu Glu Thr Leu600 605 610
gac ttg agg aga aca aag gtg aaa aca cta cet ata gag gtc etc ctg 2526Asp Leu Arg Arg Thr Lys Vai Lys Thr Leu Pro lie Glu Vai Leu Leu615 620 625
etc cec tgt tta etc cat ctg ttt ggg aag ttc caa ttt tet gat aaa 2574Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe Ser Asp Lys630 635 640
ate aag ata aca agt gac atg cag aag ttt ttc tta act gga cag agt 2622lie Lys lie Thr Ser Asp Met Gln Lys Phe Phe Leu Thr Gly Gln Ser645 650 655
aac tta gag aca ctt tca gga ttt ate aca gat ggg tet caa gga ttg 2670Asn Leu Glu Thr Leu Ser Gly Phe lie Thr Asp Gly Ser Gln Gly Leu660 665 670 675
cca cag atg atg aat tae atg aat tta aga aag ctt aag ata tgg ttt 2718Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys lie Trp Phe680 685 690
gag agg agt aag aga age acc aac ttc acc gat ctt gtg aat gct gtc 2766Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Vai Asn Ala Vai695 700 705
caa aag ttc ate cat gat gac aaa gag age aat gat cca cgt tet cta 2814Gln Lys Phe lie His Asp Asp Lys Glu Ser Asn Asp Pro Arg Ser Leu710 715 720
tca ctt cat ttc gat gac ggc act gaa aac ate ctg aac tet ttg aag 2862Ser Leu His Phe Asp Asp Gly Thr Glu Asn lie Leu Asn Ser Leu Lys725 730 735
gct cet tgt tac ctt agg tca ttg aag tta aaa ggg aat ttg ctg gaa 2910Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn Leu Leu Glu740 745 750 755
ctt cec cag ttt gtc ata tca atg cgg ggt etc cgg gag ata tgc ctt 2958Leu Pro Gln Phe Vai lie Ser Met Arg Gly Leu Arg Glu lie Cys Leu760 765 770
tca tca aca aaa ttg aca tcg ggc etc ctt gea aca etc gct aac ttg 3006Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu Ala Asn Leu775 780 785
aaa ggc ttg cag cat etc aag ctg att gea gat gtc ctt gaa gat ttt 3054Lys Gly Leu Gln His Leu Lys Leu lie Ala Asp Vai Leu Glu Asp Phe790 795 800ate att gaa ggt cag gea ttc ctg ggg ctg cta cac cta tgt ttt gtclie lie Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu Cys Phe Vai805 810 815
3102
cta gaa cgt gcc acc tta cca ata att gaa gga gga gct ttg ceg tacLeu Glu Arg Ala Thr Leu Pro lie lie Glu Gly Gly Ala Leu Pro Tyr820 825 830 835
3150
etc ate tca ctt aag cta ate tgc aaa gat cta gtt ggc etc ggt gacLeu lie Ser Leu Lys Leu lie Cys Lys Asp Leu Vai Gly Leu Gly Asp840 845 850
3198
ate aaa ate aac cgc etc aaa tgt ctt aag gaa gtc agt cta gat catlie Lys lie Asn Arg Leu Lys Cys Leu Lys Glu Vai Ser Leu Asp His855 860 865
3246
aga gtc gct tcg gaa aca aga gaa ate tgg gaa aaa gct gcc gag aag 3294Arg Vai Ala Ser Glu Thr Arg Glu lie Trp Glu Lys Ala Ala Glu Lys870 875 880
cat cca aac cgg ceg aaa gta ttg ttg gtc aac tca tet gat gaa ageHis Pro Asn Arg Pro Lys Vai Leu Leu Vai Asn Ser Ser Asp Glu Ser885 890 895
3342
gaa att aag gct gta gac tgt tet gtt gct tca aga cca gct gtg agtGlu lie Lys Ala Vai Asp Cys Ser Vai Ala Ser Arg Pro Ala Vai Ser900 905 910 915
3390
gag gct aat gga act tet cec atg tca gag gtt gat gta cga gag gatGlu Ala Asn Gly Thr Ser Pro Met Ser Glu Vai Asp Vai Arg Glu Asp920 925 930
3438
gac att cag atg ata ctt aac cag ggg etc tet gcc gct gct gag aaaAsp lie Gln Met lie Leu Asn Gln Gly Leu Ser Ala Ala Ala Glu Lys935 940 945
3486
cag atg aat tgt gea gtt cag cca agt tca aaa gct gaa ctg aac tetGln Met Asn Cys Ala Vai Gln Pro Ser Ser Lys Ala Glu Leu Asn Ser950 955 960
3534
gat ttc aat aat att agt ttc cca gag gtt gcg ctt ggt tta acc gagAsp Phe Asn Asn lie Ser Phe Pro Glu Vai Ala Leu Gly Leu Thr Glu965 970 975
3582
ctg tga attgcttgga attgaaatgt gtcttcatac acctattgat ccttgattgt
Leu *
980
3638
ccatggtcagcaaatcttttcaacaatggcttcgcttttacaacggtttgtacagggatcctgaaaagaccagatgctaattcatgtacaaaagtatcag
tttcgttgcagttgttaaggattaattttttacagatatgagttgctggatcataactagttttgtaacagttcgcagttataataccggtttcaacggt
cttgcagcatccataaattgtttctgcttggtgatgccatgttgctagaagatggttgaaataaagcatagggcctggactgattgctgttgtcccgcgc
attactatgacatattatagaatctacaaagtcattttgatattgatacagataatttgccctttgcttctttatcatgttgttatataacate
ggctagtatccacaacaagcttteatcattctttgcagcaacttcagtttgattgtttccctacttttttttatccagcttctatattta-
atgtaaattatggtatgtctattttgcaattatatgcaagactcgaaggcttcagtgtcagaagttacttgtttatttgttactatagtt
3698375838183878393839984058411841784212I.a) Número identificador da seqüência: SEQ ID No: 2
II) Características da seqüência:II.a) tamanho: 2943
II.b) tipo: DNA
II. c) organismo: Zea mays
III) Características:
III.1.a)Nome/chave: gene
III. l.b) Localização: (1) ... (2943)
III.l.c) outra informação relevante: Regiãocodificante somente do gene Regi
III.1.a)Nome/chave: CDS
III.l.b) Localização: (1) ... (2943)
IV) Seqüência: 2
atg gag gct gcc ctg ctg age ggg ttc ate aaa acc ate ctg cca agg 48Met Glu Ala Ala Leu Leu Ser Gly Phe lie Lys Thr lie Leu Pro Arg10 15
etc ttc tca ctg gta caa ggg aga tac aag ctg cac aag ggc etc aag 96Leu Phe Ser Leu Vai Gln Gly Arg Tyr Lys Leu His Lys Gly Leu Lys25 30
age gac ate aaa tcg ctg gag aaa gag etc cat atg ate gct gtt aca 144Ser Asp lie Lys Ser Leu Glu Lys Glu Leu His Met lie Ala Vai Thr35 40 45
ate gat gaa caa ate tcg ctg ggg agg aag gat cag gga gct gtg ctg 192lie Asp Glu Gln lie Ser Leu Gly Arg Lys Asp Gln Gly Ala Vai Leu50 55 60
age etc tca att gat gag ctg cat gaa ctg gct cac caa ate gag gac 240Ser Leu Ser lie Asp Glu Leu His Glu Leu Ala His Gln lie Glu Asp65 70 75 80
tcc ata gat cgc ttc ttg tac cat gtg acc agg gag cag caa gea tcc 288Ser lie Asp Arg Phe Leu Tyr His Vai Thr Arg Glu Gln Gln Ala Ser85 90 95
ttt ttt cgt cgg act gta cgg tcg ceg aag act ctg ttg tca cgt cag 336Phe Phe Arg Arg Thr Vai Arg Ser Pro Lys Thr Leu Leu Ser Arg Gln100 105 110
cgg ctg gct gcc gag gtt cag ttc ctg aag aag ata ceg gag gag gcg 384Arg Leu Ala Ala Glu Vai Gln Phe Leu Lys Lys lie Pro Glu Glu Ala115 120 125
cac cag cga gag aag agg tac agg gtc ttc gcc ggc ctt tet tcc tetHis Gln Arg Glu Lys Arg Tyr Arg Vai Phe Ala Gly Leu Ser Ser Ser130 135 140acc cgg cac act gaa tcg tct tec tgt tcg tet gta tet gat ceg cac 480Thr Arg His Thr Glu Ser Ser Ser Cys Ser Ser Vai Ser Asp Pro His145 , 150 155 160
aca ctt aag gcc gac gtc gtc ggc ate gac ggt cec agg gac gag ctt 528Thr Leu Lys Ala Asp Vai Vai Gly lie Asp Gly Pro Arg Asp Glu Leu165 170 175
gtg cag cag tta acc gaa gag gea gag ggc cta aca aag cag etc aag 576Vai Gln Gln Leu Thr Glu Glu Ala Glu Gly Leu Thr Lys Gln Leu Lys180 185 190
gtg ate tec ate gtc ggg ate cat ggc tec ggc aag acc gtc ctt gcc 624Vai lie Ser lie Vai Gly lie His Gly Ser Gly Lys Thr Vai Leu Ala195 200 205
aga gag gta tac gag age gac gtc ggc cgg cag ttc agt etc cgg gea 672Arg Glu Vai Tyr Glu Ser Asp Vai Gly Arg Gln Phe Ser Leu Arg Ala210 215 220
tgg gtt tct gct act gac aga ggt ceg aga gag gtg etc atg gag ate 720Trp Vai Ser Ala Thr Asp Arg Gly Pro Arg Glu Vai Leu Met Glu lie225 230 235 240
etc cga aat ttt ggt agg cca gtg gtg gat age tct agt att gac cag 768Leu Arg Asn Phe Gly Arg Pro Vai Vai Asp Ser Ser Ser lie Asp Gln245 250 255
ctt acg gta gat etc agg aaa cac ttg ggt gag aaa agg tat ttc att 816Leu Thr Vai Asp Leu Arg Lys His Leu Gly Glu Lys Arg Tyr Phe lie260 265 270
gta ate gat ggc atg caa aca gat cag tgg age acc att gaa act gcc 864Vai lie Asp Gly Met Gln Thr Asp Gln Trp Ser Thr lie Glu Thr Ala275 280 285
ttc cca gaa aac aat gtt gtt age age aga gta att gtt aca aca aca 912Phe Pro Glu Asn Asn Vai Vai Ser Ser Arg Vai lie Vai Thr Thr Thr290 295 300
ate cgg tca gta gct aat tct tgc age tct tct aac ggt tat gtg cac 960lie Arg Ser Vai Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Vai His305 310 315 320
aaa atg aaa aga ctt agt gac gaa cac tca gag caa ttg ttt ate aag 1008Lys Met Lys Arg Leu Ser Asp Glu His Ser Glu Gln Leu Phe lie Lys325 330 335
aaa gct tgc cca aca aaa tat tca ggt tat act cga ecg gaa tca aaa 1056Lys Ala Cys Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys340 345 350
gaa gtt ctg aag aaa tgt gat ggt caa cca ctt gct ctt gtt act atg 1104Glu Vai Leu Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Vai Thr Met355 360 365
ggc caa ttc ttg agg aaa aat ggt tgg cec aca gga cec aac tgc gaa 1152Gly Gln Phe Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu370 375 380aat gtg tgt aga gat ctt aga cga cat ctg gag cag gat gat aca ttg 120CAsn Vai Cys Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu385 390 395 400
gag aga atg cga agg gtg ctt ate cac age tta tet agt ctt cet age 1248Glu Arg Met Arg Arg Vai Leu lie His Ser Leu Ser Ser Leu Pro Ser405 410 415
cat gtt cec aaa gcc tgc ctt ttg tat ttt ggt atg ttt cca tgt gat 1296His Vai Pro Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp420 425 430
cat cec ata aag agg aag age ctg atg agg cga tgg tta gea gag gga 1344His Pro lie Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly435 440 445
ttt gta caa aca cag cet tca tet agt gaa aac ttc aac acc etc ata 1392Phe Vai Gln Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu lie450 455 460
gac cgg aat att att gag cec ate ggc ata tgt aac gat gat cag gta 1440Asp Arg Asn lie lie Glu Pro lie Gly lie Cys Asn Asp Asp Gln Vai465 470 475 480
aag aca tgc aaa aca tat ggc atg atg cac gag ttc att ttg tta atg 1488Lys Thr Cys Lys Thr Tyr Gly Met Met His Glu Phe lie Leu Leu Met485 490 495
tec acc tec cat gac ttc att acc ctg ctt tgt aat aat aaa gtt gaa 1536Ser Thr Ser His Asp Phe lie Thr Leu Leu Cys Asn Asn Lys Vai Glu500 505 510
cac aaa tat gtg cgt cgg ctt tet etc cat cat cat agt gct aca agt 1584His Lys Tyr Vai Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser515 520 525
ggc agt ttt tcg gtc ate gac tta tet ctt gtt aga tet ctg atg gtt 1632Gly Ser Phe Ser Vai lie Asp Leu Ser Leu Vai Arg Ser Leu Met Vai530 535 540
ttt ggg gag gct ggc aaa act att ttg agt ttc cga aag tac gag cta 1680Phe Gly Glu Ala Gly Lys Thr lie Leu Ser Phe Arg Lys Tyr Glu Leu545 550 555 560
ttg aga gtc ttg gat ctt gaa caa tgt acc gac ttg gaa gat gat cac 1728Leu Arg Vai Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His565 570 575
etc aaa gac ata tgc aac ctt ttt ctt atg aaa tat cta age etc gga 1776Leu Lys Asp lie Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly580 585 590
gaa act att aga agt ctt cca aag gag ata gaa aaa ctg aag etc ttg 1824Glu Thr lie Arg Ser Leu Pro Lys Glu lie Glu Lys Leu Lys Leu Leu595 600 605
gag aca ctt gac ttg agg aga aca aag gtg aaa aca cta cet ata gag 1872Glu Thr Leu Asp Leu Arg Arg Thr Lys Vai Lys Thr Leu Pro lie Glu610 615 620gtc etc ctg etc cec tgt tta etc cat ctg ttt ggg aag ttc caa ttt 1920Vai Leu Leu Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe625 630 635 640
tet gat aaa ate aag ata aca agt gac atg cag aag ttt ttc tta act 1968Ser Asp Lys lie Lys lie Thr Ser Asp Met Gln Lys Phe Phe Leu Thr645 650 655
gga cag agt aac tta gag aca ctt tca gga ttt ate aca gat ggg tet 2016Gly Gln Ser Asn Leu Glu Thr Leu Ser Gly Phe lie Thr Asp Gly Ser660 665 670
caa gga ttg cca cag atg atg aat tac atg aat tta aga aag ctt aag 2064Gln Gly Leu Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys675 680 685
ata tgg ttt gag agg agt aag aga age acc aac ttc acc gat ctt gtg 2112lie Trp Phe Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Vai690 695 700
aat gct gtc caa aag ttc ate cat gat gac aaa gag age aat gat cca 2160Asn Ala Vai Gln Lys Phe lie His Asp Asp Lys Glu Ser Asn Asp Pro705 710 715 720
cgt tet cta tca ctt cat ttc gat gac ggc act gaa aac ate ctg aac 2208Arg Ser Leu Ser Leu His Phe Asp Asp Gly Thr Glu Asn lie Leu Asn725 730 735
tet ttg aag gct cet tgt tac ctt agg tca ttg aag tta aaa ggg aat 2256Ser Leu Lys Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn740 745 750
ttg ctg gaa ctt cec cag ttt gtc ata tca atg cgg ggt etc cgg gag 2304Leu Leu Glu Leu Pro Gln Phe Vai lie Ser Met Arg Gly Leu Arg Glu755 760 765
ata tgc ctt tca tca aca aaa ttg aca tcg ggc etc ctt gea aca etc 2352lie Cys Leu Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu770 775 780
gct aac ttg aaa ggc ttg cag cat etc aag ctg att gea gat gtc ctt 2400Ala Asn Leu Lys Gly Leu Gln His Leu Lys Leu lie Ala Asp Vai Leu
785 790 795 800
gaa gat ttt ate att gaa ggt cag gea ttc ctg ggg ctg cta cac cta 244 8Glu Asp Phe lie lie Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu805 810 815
tgt ttt gtc cta gaa cgt gcc acc tta cca ata att gaa gga gga gct 24 96Cys Phe Vai Leu Glu Arg Ala Thr Leu Pro lie lie Glu Gly Gly Ala820 825 830
ttg ceg tac etc ate tca ctt aag cta ate tgc aaa gat cta gtt ggc 254 4Leu Pro Tyr Leu lie Ser Leu Lys Leu lie Cys Lys Asp Leu Vai Gly835 840 845
etc ggt gac ate aaa ate aac cgc etc aaa tgt ctt aag gaa gtc agt 2592Leu Gly Asp lie Lys lie Asn Arg Leu Lys Cys Leu Lys Glu Vai Ser850 855 860cta gat cat aga gtc gct tcg gaa aca aga gaa ate tgg gaa aaa gct 2640Leu Asp His Arg Vai Ala Ser Glu Thr Arg Glu lie Trp Glu Lys Ala865 870 875 880
gcc gag aag cat cca aac cgg ceg aaa gta ttg ttg gtc aac tca tet 2688Ala Glu Lys His Pro Asn Arg Pro Lys Vai Leu Leu Vai Asn Ser Ser885 890 895
gat gaa age gaa att aag gct gta gac tgt tet gtt gct tca aga cca 2736Asp Glu Ser Glu lie Lys Ala Vai Asp Cys Ser Vai Ala Ser Arg Pro900 905 910
gct gtg agt gag gct aat gga act tet cec atg tca gag gtt gat gta 2784Ala Vai Ser Glu Ala Asn Gly Thr Ser Pro Met Ser Glu Vai Asp Vai915 920 925
cga gag gat gac att cag atg ata ctt aac cag ggg etc tet gcc gct 2832Arg Glu Asp Asp lie Gln Met lie Leu Asn Gln Gly Leu Ser Ala Ala930 935 940
gct gag aaa cag atg aat tgt gea gtt cag cca agt tca aaa gct gaa 2880Ala Glu Lys Gln Met Asn Cys Ala Vai Gln Pro Ser Ser Lys Ala Glu945 950 955 960
ctg aac tet gat ttc aat aat att agt ttc cca gag gtt gcg ctt ggt 2928Leu Asn Ser Asp Phe Asn Asn lie Ser Phe Pro Glu Vai Ala Leu Gly965 970 975
tta acc gag ctg tga 2943Leu Thr Glu Leu *980
5 I.a) Número identificador da seqüência: SEQ ID No: 3
II) Características da seqüência:II.a) tamanho: 980
II. b) tipo: Proteína
10 II.c) organismo: Zea mays
III) Característica:
III. a)Nome/chave: DOMÍNIO
III.b) Localização: (157) ... (404)15 III.c) outra informação relevante: Região
mostrando homologia com o domínio dositio de ligação a nucleotideo (NBS)
III.a)Nome/chave: DOMÍNIOIII.b) Localização: (528) ... (843)20 III.c) outra informação relevante: Região
mostrando homologia com o domínio derepetição rico em leucina (LRR)<table>table see original document page 219</column></row><table><table>table see original document page 220</column></row><table>Leu Pro Tyr 835 Leu Ile Ser Leu Lys Leu Ile 840 Cys Lys Asp 845 Leu Vai Gly
Leu Gly Asp 850 Ile Lys Ile Asn 855 Arg Leu Lys Cys Leu 860 Lys Glu Vai Ser
Leu Asp His Arg Vai Ala Ser Glu Thr Arg Glu Ile Trp Glu Lys Ala
865 870 875 880
Ala Glu Lys His Pro 885 Asn Arg Pro Lys Vai 890 Leu Leu Vai Asn Ser 895 Ser
Asp Glu Ser Glu Ile Lys Ala Vai Asp Cys Ser Vai Ala Ser Arg Pro
900 905 910
Ala Vai Ser Glu Ala Asn Gly Thr Ser Pro Met Ser Glu Vai Asp Vai
915 920 925
Arg Glu Asp Asp Ile Gln Met Ile Leu Asn Gln Gly Leu Ser Ala Ala
930 935 940
Ala Glu Lys Gln Met Asn Cys Ala Vai Gln Pro Ser Ser Lys Ala Glu
945 950 955 960
Leu Asn Ser Asp Phe 965 Asn Asn Ile Ser Phe 970 Pro Glu Vai Ala Leu 975 Gly
Leu Thr Glu Leu
980
I.a) Número identificador da seqüência: SEQ ID No: 4
II) Características da seqüência:II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer do
oligonucleotideo a20Cforw4881
IV) Seqüência: 4
cagggcctac ttggtttagt aata 24
I.a) Número identificador da seqüência: SEQ ID No: 5
II) Características da seqüência:II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer do
oligonucleotideo a20Crev4920IV) Seqüência: 5gggtactaca ctagcctatt acta 24
I.a) Número identificador da seqüência: SEQ ID No: 6
II) Características da seqüência:II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer dooligonucleotideo a20fisl9forwlllO
IV) Seqüência: 6
cggttacaag gtctacccaa tctg 24
I.a) Número identificador da seqüência: SEQ ID No: 7
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III.c) outra informação relevante: Primer dooligonucleotideo a20fisl9revll49
IV) Seqüência: 7gtcaaacaga tagccgcaga ttgg 24
I.a) Número identificador da seqüência: SEQ ID No: 8
II) Características da seqüência:
II.a) tamanho: 24II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer dooligonucleotideo n07fisl3for'w5152 4
IV) Seqüência: 8tacaaaacta ctgcaacgcc tata 24I.a) Número identificador da seqüência: SEQ ID No: 9
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer dooligonucleotídeo n07fisl3rev51563
IV) Seqüência: 9
cctcacccca agtatatata ggcg 24
I.a) Número identificador da seqüência: SEQ ID No: 10
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III.c) outra informação relevante: Primer dooligonucleotídeo n07Bforwl0439/53434
IV) Seqüência: 10
cattggacct cttccccact aaga 24
I.a) Número identificador da seqüência: SEQ ID No: 11
II) Características da seqüência:
II.a) tamanho: 24Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer do
oligonucleotídeo n07Brevl0478/53473
IV) Seqüência: 11tccttgagtc cagtgctctt agtg 24I.a) Número identificador da seqüência: SEQ ID No: 12
II) Características da seqüência:
II,a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer dooligonucleotideo n07Aforw4333
IV) Seqüência: 12
gaaactaggc gcgtcaggtt ttat 24
I.a) Número identificador da seqüência: SEQ ID No: 13
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Caracteristica:
III.c) outra informação relevante: Primer do
oligonucleotideo n07Arev4372
IV) Seqüência: 13
aaggcagcca ctgaaaataa aacc 24
I.a) Número identificador da seqüência: SEQ ID No: 14
II) Características da seqüência:
II.a) tamanho: 954
II.b) tipo: Proteína
II. c) organismo: Oryza sativa
III) Característica:
III. a)Nome/chave: PEPTÍDEO
III.b) Localização: (0) ... (0)
III.c) outra informação relevante: np_910480,Arroz NBS-LRRIV) Seqüência: 14
Met Glu Gly Ala Vai Phe Ser Leu Thr Glu Gly Ala Vai Arg Ser Leu
1 5 10 15
I>eu Cys Lys Leu Gly Cys Leu Leu Thr Glu Asp Thr Trp Leu Vai Gln
20 25 30
Gly Vai His Gly Glu lie Gln Tyr lie Lys Asp Glu Leu Glu Cys Met
35 40 45
Asn Ala Phe Leu Arg Asn Leu Thr lie Ser Gln He His Asp Asp Gln
50 55 60
Vai Arg lie Trp Met Lys Gln Vai Arg Glu He Ala Tyr Asp Ser Glu
65 70 75 80
Asp Cys lie Asp Glu Phe lie His Asn Leu Gly Glu Ser Ser Glu Met
85 90 95
Gly Phe Phe Gly 100 Gly Leu lie Ser Met 105 Leu Arg Lys Leu Ala Cys Arg 110
His Arg lie 115 Ala Leu Gln Leu Gln 120 Glu Leu Lys Ala Arg 125 Ala Gln Asp
Vai Gly Asp Arg Arg Ser Arg Tyr Gly Vai Glu Leu Ala Lys Ala Thr
130 135 140
His Glu Glu Ala His Pro Arg Leu Thr Arg His Ala Ser Leu His He
145 150 155 160
Asp Pro Gln Leu His 165 Ala Leu Phe Ala Glu 170 Glu Ala Gln Leu Vai Gly 175
lie Asp Glu Pro Arg Asn Glu Leu Vai Ser Trp Leu Met Glu Glu Asp
180 185 190
Leia Arg Leu Arg Vai Leu Ala lie Vai Gly Phe Gly Gly Leu Gly Lys
195 200 205
Thr Thr 210 Leu Ala Arg Met Vai 215 Cys Gly Ser Pro Vai 220 Vai Lys Ser Ala
Asp Phe Gln Cys Cys Pro Leu Phe lie He Ser Gln Thr Phe Asn He
225 230 235 240
Arg Ala Leu Phe Gln 245 His Met Vai Arg Glu 250 Leu He Gln Glu Pro His 255
Lys Ala Met Ala lie Ala Gly Cys Lys His Gly Leu lie Thr Asp Asp
260 265 270
Tyr Leu Glu Gly Met Glu Arg Trp Glu Vai Ala Ala Leu Thr Lys Asn
275 280 285
Leu Arg Arg Tyr Phe Gln Asp Lys Arg Tyr He Vai He Leu Asp Asp
290 295 300
lie Trp Thr Vai Ser Ala Trp Glu Ser He Arg Cys Ala Leu Pro Asp
305 310 315 320
Asn Leu Lys Gly Ser Arg lie lie Vai Thr Thr Arg Asn Ala Asp Vai
325 330 335
Ala Asn Thr Cys 340 Cys Ser Arg Pro Gln 345 Asp Arg He Tyr Asn He Gln 350
Arg Leu Ser 355 Glu Thr Thr Ser Arg 360 Glu Leu Phe Phe Lys 365 Lys He Phe
Gly Phe 370 Ala Asp Asp Lys Ser 375 Pro Thr Asp Glu Phe 380 Glu Glu Vai Ser
Asn Ser Vai Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala He Vai Asn
385 390 395 400lie Gly Ser Leu Leu Ala Ser Lys Thr Asn Arg Thr Lys Glu Glu Trp
405 410 415
Gln Lys Vai Cys Asn Asn Leu Gly Ser Glu Leu Glu Asn Asn Pro Thr
420 425 430
Leu Glu Gly Vai Lys Gln Vai Leu Thr Leu Ser Tyr Asn Asp Leu Pro
435 440 445
Tyr His Leu Lys Ala Cys Phe Leu Tyr Leu Ser lie Phe Pro Glu Asn
450 455 460
Tyr Vai lie Lys Arg Gly Pro Leu Vai Arg Arg Trp lie Ala Glu Gly
465 470 475 480
Phe Vai Ser Gln Arg His Gly Gln Ser Met Glu Gln Leu Ala Glu Ser
485 490 495
Tyr Phe Asp Glu Phe Vai Ala Arg Ser lie Vai Gln Pro Vai Arg Thr
500 505 510
Asp Trp Thr Gly Lys Vai Arg Ser Cys Arg Vai His Asp Leu Met Leu
515 520 525
Asp Vai lie Vai Ser Arg Ser lie Glu Glu Asn Phe Ala Ser Phe Leu
530 535 540
Cys Asp Asn Gly Ser Thr Leu Ala Ser His Asp Lys lie Arg Arg Leu
545 550 555 560
Ser lie His Ser Ser Tyr Asn Ser Ser Gln Lys Thr Ser Ala Asn Vai
565 570 575
Ser His Ala Arg Ser Phe Thr Met Ser Ala Ser Vai Glu Glu Vai Pro
580 585 590
Phe Phe Phe Pro Gln Leu Arg Leu Leu Arg Vai Leu Asp Leu Gln Gly
595 600 605
Cys Ser Cys Leu Ser Asn Glu Thr Leu His Cys Met Cys Arg Phe Phe
610 615 620
Gln Leu Lys Tyr Leu Ser Leu Arg Asn Thr Asn Vai Ser Lys Leu Pro
625 630 635 640
His Leu Leu Gly Asn Leu Lys His Leu Glu Thr Leu Asp lie Arg Ala
645 650 655
Thr Leu lie Lys Lys Leu Pro Ala Ser Ala Gly Asn Leu Ser Cys Leu
660 665 670
Lys His Leu Phe Ala Gly His Lys Vai Gln Leu Thr Arg Thr Ala Ser
675 680 685
Vai Lys Phe Leu Arg Gln Ser Ser Gly Leu Glu Vai Ala Thr Gly Vai
690 695 700
Vai Lys Asn Met Vai Ala Leu Gln Ser Leu Vai His lie Vai Vai Lys
705 710 715 720
Asp Lys Ser Pro Vai Leu Arg Glu lie Gly Leu Leu Gln Asn Leu Thr
725 730 735
Lys Leu Asn Vai Leu Leu Arg Gly Vai Glu Glu Asn Trp Asn Ala Phe
740 745 750
Leu Glu Ser Leu Ser Lys Leu Pro Gly Pro Leu Arg Ser Leu Ser lie
755 760 765
His Thr Leu Asp Glu Lys Glu His Ser Leu Ser Leu Asp Asn Leu Ala
770 775 780
Phe Vai Glu Ser Pro Pro Leu Phe lie Thr Lys Phe Ser Leu Ala Gly
785 790 795 800
Glu Leu Glu Arg Leu Pro Pro Trp lie Pro Ser Leu Arg Asn Vai Ser
805 810 815
Arg Phe Ala Leu Arg Arg Thr Glu Leu His Ala Asp Ala lie Gly Vai
820 825 830
Leu Gly Asp Leu Pro Asn Leu Leu Cys Leu Lys Leu Tyr His Lys Ser
835 840 845Tyr Ala Asp Asn Cys lie Vai Phe
850 855Lys Leu Leu lie lie Asp Asn Leu865 870Asp Ala Gly Ser Vai Thr Asn Leu885
Arg Glu Pro Lys Tyr Gly lie Ser900
Lys Glu lie Glu Phe Phe Gly Asp915 920Vai Ala Ser Cys Vai Lys Ala His
930 935Asp Lys Trp Asn lie Vai Thr Glu945 950
Cys His Gly Lys Phe Vai Lys Leu860
Glu Arg lie Glu Lys Met Gln Phe875 880Glu Arg Leu Thr Leu Ser Phe Leu
890 895Gly Leu Glu Asn Leu Pro Lys Leu905 910lie lie Leu Ser Vai Vai Thr Lys925
Pro Asn His Pro Arg Vai lie Gly940
Tyr Ala
I.a) Número identificador da seqüência: SEQ ID No: 15
II) Características da seqüência:II.a) tamanho: 953
II. b) tipo: Proteína
II.c) organismo: Oryza sativa
III) Característica:
III. a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)
III.c) outra informação relevante: np_910483,Arroz NBS-LRR
IV) Seqüência: 15
Met Glu Gly Ala lie Phe Ser Vai Ala Glu Gly Thr Vai Arg Ser Leu
5 10 15
Leu Ser Lys Leu Ser Ser Leu Leu Ser Gln Glu Ser Trp Phe Vai Arg
20 25 30
Gly Vai His Gly Asp lie Gln Tyr lie Lys Asp Glu Leu Glu Ser Met
35 40 45
Asn Ala Phe Leu Arg Tyr Leu Thr Vai Leu Glu Asp His Asp Thr Gln
50 55 60
Vai Arg lie Trp Met Lys Gln Vai Arg Glu lie Ala Tyr Asp Ala Glu
70 75 80
Asp Cys lie Asp Gln Phe Thr His His Leu Gly Glu Ser Ser Gly lie
85 90 95
Gly Phe Leu Tyr Arg Leu lie Tyr lie Leu Gly Lys Leu Cys Cys Arg
100 105 110
His Arg lie Ala Met Gln Leu Gln Glu Leu Lys Ala Arg Ala Gln Asp
65 115 120 125
Vai Ser Glu Arg Arg Ser Arg Tyr Glu Vai Met Leu Pro Lys Thr Thr
130 135 140
Leu Gln Gly Ala Gly Pro Arg Leu Thr Arg His Ala Ser Arg His Leu
145 150 155 160
Asp Pro Gln Leu His Ala Leu Phe Thr Glu Glu Ala Gln Leu Vai Gly
165 170 175Leu Asp Glu Pro 180 Arg Asp Lys Leu Vai 185 Arg Trp Vai Met Glu 190 Ala Asp
Pro Cys Arg Arg Vai Leu Ala lie Vai Gly Phe Gly Gly Leu Gly Lys
195 200 205
Thr Thr Leu Ala Arg Met Vai Cys Glu Asn Pro Met Vai Lys Gly Ala
210 215 220
Asp Phe His Cys Cys Pro Leu Phe lie Vai Ser Gln Thr Phe Asn lie
225 230 235 240
Arg Thr Leu Phe Gln Tyr Met lie Arg Glu Leu lie Gln Arg Pro Asn
245 250 255
Lys Ala Met Ala Vai Ala Gly Gly Lys His Gly His Thr Met Asp Gly
260 265 270
Asn Met Asp 275 Gly Met Glu Arg Trp 280 Glu Vai Ala Vai Leu 285 Ala Glu Lys
Vai Arg Gln Tyr Leu Leu Asp Lys Tyr lie Vai lie Phe Asp Asp lie
290 295 300
Trp Thr lie Ser Ala Trp Glu Ser lie Arg Cys Ala Leu Pro Asp Asn 305 310 315 320
Lys Lys Gly Ser Arg 325 Vai lie lie Thr Thr 330 Arg Asn Glu Asp Vai 335 Ala
Asn Thr Cys Cys Ser Gly Pro Gln Asp Gln Vai Tyr Lys Met Gln Arg
340 345 350
Leu Ser Asp 355 Ala Ala Ser Arg Glu 360 Leu Phe Phe Lys Arg 365 lie Phe Gly
Ser Ala Asp lie Ser Ser Asn Glu Glu Leu Asp Glu Vai Ser Asn Ser
370 375 380
lie Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala lie Vai Ser lie Gly
385 390 395 400
Ser Leu Vai Ala Ser 405 Lys Thr Asn Arg Thr 410 Lys Glu Glu Trp Gln 415 Lys
lie Cys Asp Asn 420 Leu Gly Ser Glu Leu 425 Glu Thr Asn Pro Thr 430 Leu Glu
Vai Ala Lys 435 Gln Vai Leu Thr Leu 440 Ser Tyr Asn Asp Leu 445 Pro Tyr His
Leu Lys 450 Ala Cys Phe Leu Tyr 455 Leu Ser lie Phe Pro 4 60 Glu Asn Tyr Vai
lie Arg Arg Gly Pro Leu Vai Arg Arg Trp lie Ala Glu Gly Phe Vai
4 65 470 475 480
Asn Gln Arg His Gly 485 Leu Ser Met Glu Glu 4 90 Vai Ala Glu Ser Tyr 495 Phe
Asp Glu Phe Vai 500 Ala Arg Ser lie Vai 505 Gln Pro Vai Lys lie 510 Asp Trp
Ser Gly Lys 515 Vai Arg Thr Cys Arg 520 Vai His Asp Met Met 525 Leu Glu Vai
lie lie Ser Lys Ser Leu Glu Glu Asn Phe Ala Ser Phe Leu Cys Asp
530 535 540
Asn Gly His Pro Leu Vai Cys His Asp Lys lie Arg Arg Leu Ser lie
545 550 555 560
His Asn Ser His Asn Ser Vai Gln Arg Thr Arg Vai Ser Vai Ser His
565 570 575
Vai Arg Ser Phe 580 Thr Met Ser Ala Ser 585 Vai Glu Glu Vai Pro 590 Met Phe<table>table see original document page 229</column></row><table>III) Característica:
III.a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)
III.c) outra informação relevante: np_910482,Arroz NBS-LRR
IV) Seqüência: 16
<table>table see original document page 230</column></row><table>Lys Lys Gly Ser355
Asn Thr Cys Cys370
Leu Ser Asp Ala385
Met Ala Asp Ala
Asp Ser lie Leu420
lie Gly Ser Leu435
Gln Lys Vai Cys450
Leu Glu Gly Thr465
Tyr His Leu Lys
His Vai lie Lys500
Phe Vai Thr Gln515
Tyr Phe Asp Glu530
Asp Trp Ser Gly545
Glu Vai lie Vai
Cys Asp Asn Gly580
Ser lie Arg Ser595
Vai Ala His Vai610
Pro Phe Phe Phe625
Gly Ser Arg Cys
Phe Gln Leu Lys660
Pro Arg Leu IIe675
Glu Thr Leu Ile690
Leu Lys His Leu705
Ser Vai Lys Phe
Vai Ile Arg Asn740
Lys Glu His Pro755
Arg Lys Leu Ser770
Arg Ile Ile Vai
360
Cys Arg Pro Gln
375
Ala Ser Arg Glu
390
Gly Ala Pro Asp
405
Lys Lys Cys Gly
Leu Ala Ser Lys
440
Asp Asn Leu Gly
455
Lys Gln Vai Leu
470
Ala Cys Phe Leu
485
Arg Gly Pro Leu
Arg His Gly Leu
520
Phe Vai Ser Arg
535
Lys Vai Arg Ser
550
Ser Lys Ser Leu
5 65
Thr Glu Leu Vai
Ser Ser Tyr Ser
600
Arg Thr Phe Arg
615
Pro Gln Leu Arg
630
Met Ser Asn Lys
645
Tyr Leu Ser Leu
Gly Asn Leu Asn
680
Lys Lys Leu Pro
695
Leu Ala Gly His
710
Leu Arg Pro Ser
725
Met Ala Lys Leu
Ser Vai Phe Gln
7 60
Vai Leu Phe Tyr
775
Thr Thr Arg Asn
Asp Arg Ile Tyr380
Leu Phe Phe Lys395
Asp Asp Glu Leu410
Gly Leu Pro Leu425
Pro Asn Arg Ser
Ser Glu Leu Glu460
Thr Leu Ser Tyr475
Tyr Leu Ser Ile490
Vai Arg Met Trp505
Ser Met Glu Gln
Ser Met Vai His540
Cys Lys Vai His555
Glu Glu Asn Phe570
Ser His Asp Lys585
Ser Ala Gln Arg
Met Ser Pro Ser620
Leu Leu Arg Vai635
Asn Leu Asp Cys650
Arg Asn Thr Ser665
His Leu Glu Thr
Ser Ser Ala Ala700
Lys Glu Gln Leu715
Ser Gly Leu Lys730
Gln Ser Leu Vai745
Glu Ile Ala Leu
Gly Ile Glu Vai780
Glu Asp Vai Ala
365
Lys Ile Gln Arg Arg Ile Phe Gly
400
Lys Gln Vai Ser
415
Ala Ile Vai Ser
430
Lys Glu Glu Trp
445
Ser Asn Pro Thr
Asn Asp Leu Pro
480
Phe Pro Glu Asn
495
Ile Ala Glu Gly
510
Vai Gly Glu Arg
525
Leu Vai Arg Ile
Asp Ile Met Leu
560
Ala Ser Phe Phe
575
Ile Arg Arg Leu
590
Thr Ser Asn Ser
605
Ile Asp Asn Ile
Leu Asp Met Gln
640
Ile Cys Arg Phe
655
Vai Ser Ile Leu
670
Leu Asp Ile Arg 685
Asn Leu Thr Cys
Thr Arg Thr Ser
720
Met Ser His Gly
735
His Vai Glu Ile
750
Leu Gln Asn Leu
765
Asn Trp Lys ProPhe Leu Glu Leu Leu Asn Met Leu Ser Gly Ser Vai Arg Ser Leu Ser
785 790 795 800
lie Asp lie Phe Asp Ala Gln Gly Asn lie Ser lie Ser Ser Leu Glu
805 810 815
Met Leu Ser Ser Leu Vai Ser Pro Pro lie Phe lie Thr Ser Phe Ser
820 825 830
Leu Thr Gly Lys Leu Gly Ser Leu Pro Pro Trp Vai Ala Ser Leu Arg
835 840 845
Ser Vai Ser Arg Leu Thr Leu Arg Arg Ser Gln Leu Arg Ala Asp Ala
850 855 860
lie His Vai Leu Gly Gly Leu Gln Asn Leu Leu Cys Leu Lys Leu Tyr
8 65 870 875 880
His Lys Ser Tyr Ala Asp Asp Arg Leu Vai Phe Pro Gln Gly Gly Phe
885 890 895
Ala Arg Vai Lys Leu Leu lie Asp Asp Asn Leu Vai Asn Leu Glu Lys
900 905 910
Leu His Phe Asn Glu Gly Ser Met Pro Asn Leu Glu Arg Leu Thr Leu
915 920 925
Ser Phe Leu Arg Glu Pro Lys Asp Gly lie Ser Gly Leu Asn Asn Leu
930 935 940
Leu Lys Leu Lys Glu Vai Glu Phe Phe Gly Asn lie Vai Ser Ser Vai
945 950 955 960
Vai Ser Lys Vai Vai Ser Cys Vai Lys Asp His Pro Asn His Pro Arg
965 970 975
Vai Vai Gly Asp Lys Trp Asn lie Vai Thr Vai Tyr Asn
980 985
I • a) Número identificador da seqüência: SEQ ID No: 17
5
II) Características da seqüência:II.a) tamanho: 998
II.b) tipo: Proteína
II.c) organismo: Oryza sativa
10
III) Característica:
III.a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)
III.c) outra informação relevante: np_921091.1,
Resistência a doença em arroz
IV) Seqüência: 17
Met Glu Thr Ala Vai Leu Ser Ala Vai Leu Arg Thr Leu Gly Pro Lys
1 5 10 15
Leu Tyr Ala Phe Leu Arg Asp Gly His Asp Leu Leu Arg Arg Asp Leu
20 25 30
Glu Arg Asp Vai His Tyr lie Arg Asn Glu Leu Ala Met lie Ala Ala
35 40 45
Ala He Glu Glu His Asp Arg Arg Pro Pro Pro Ala Ala Gly Asp Vai 50 55 60
Arg Ser Ala Trp lie Arg Gly Vai Arg Asp Leu Ala Cys Asp Met Glu
65 70 75 80Asp Cys Vai Asp Arg Phe Vai His
85
Ser Met Gly Ala Arg Ala Lys Phe
100
Arg Lys Ser Glu Glu Leu Ser Arg
115 120
Ala Gly Glu Pro Ser Cys Trp Vai
130 135
Leu Pro Ala Ser Ser Ser Glu Ala
145 150
Gly Met Asp Gly Pro Arg Asp Glu
165
Gln Gly Gln Leu Lys Vai He Ser
180
Lys Thr Leu Leu Ala Arg Gln He
195 200
Gln Phe His Pro Arg He Trp Vai
210 215
Asp Vai Leu Met Asp lie Leu Gln
225 230
Cys His Ala Ser Asn Leu Vai Vai
245
Lys Arg Phe Phe Vai Vai He Asp
260
Ser Ser Phe Arg Asn Ala Phe Pro
275 280
Vai lie Vai Thr Thr Ala He Gln
290 295
Arg Asn Ser His Vai Tyr Vai Met
305 310
Arg Gln Leu Phe Leu Lys Glu Ala
325
Ser Glu Ala He Leu Lys Lys Cys
340
Thr Thr Ala Gln Phe Leu Gln Ser
355 360
Cys Ala Lys Leu Cys Asp Asn Leu
370 375
Thr Leu Ala Arg Met Lys Arg Vai
385 390
Pro Gly His Vai lie Lys Ala Cys
405
Ser Gly His Pro Vai Arg Arg Lys
420
Glu Gly Phe Vai Gly Ala Asp His
435 440
lie Asp Ser Phe Glu Glu Leu Vai
450 455
Asp Vai Ser Ser Asn Thr Glu Vai
465 470
Met Leu Glu Phe He Leu His Lys
485
Phe Leu Tyr Gly cnn Gln Ala Arg Leu
500
7/123
Arg Ala Thr Gly His Gly Leu Ala
90 95
Ala Ala Vai He Gln Glu Leu Arg
105 110
Leu Arg Ala Ser Tyr Ala Ala Ala
125
Ala Thr Gly Ser Ser Ala Leu Thr
140
His Thr Leu Ala Ser Asp He Vai
155 160
He Leu Glu Leu He Gly Glu Thr
170 175
He Vai Gly Phe Gly Gly Leu Gly
185 190
Tyr Glu Ser Asp Ala Vai Ala Ala
205
Arg Ala Ala Gly Lys Asn Ala Glu
220
Gln Leu Gly Met Pro Vai His His
235 240
Asn Leu Arg Asn Cys Leu Glu Ser
250 255
Asp Met Gln Arg Glu Tyr Trp Asn 265 270
Ser Asp Thr Gly Leu Ser Ser He
285
Ser He Ala Asn Ala Cys Ser Ser
300
Arg Thr Leu Asn Glu Glu His Ser
315 320
Ser Trp Lys Asp Tyr Pro Pro Gly
330 335
Asp Gly Leu Pro Leu Ala Leu Vai
345 350
Arg Cys Gln Gln Gln Pro Leu Gly
365
Gly Lys His Leu Vai Thr Glu Asp
380
Leu Vai His His Tyr Ser Ser Leu
395 400
Leu Leu Tyr Leu Gly He Phe Pro
410 415
Thr Leu He Arg Arg Trp Ser Ala
425 430
His Arg Ser Ser Leu Asp Vai Ala
445
Asn Arg Ser He He Gln Pro Vai
4 60
Lys Thr Cys Gln Thr His Gly Met
475 480
Ser He Cys Asp Asn Phe He Thr
4 90 495
Pro Asp Lys He Arg Cys Vai Ser
505 510<table>table see original document page 234</column></row><table>Vai Lys Arg Pro Ala945
Ser Leu Pro Ala Lys965
Gln Ser Ser Gly Thr980
Ser Gln Arg His Phe995
Arg Glu Glu Ser Asp
950
Met Ala Arg Leu Leu970
Gln Gly Glu Leu Ser985
Ser
lie Ser Ala Ala Leu Ala955 960Gly Ala Ala Ser lie His975
Cys Gly Gly Asn Gly Ala990
I.a) Número identificador da seqüência: SEQ ID No: 18
II) Características da seqüência:II.a) tamanho: 958
II.b) tipo: Proteína
II. c) organismo: Herdeum vulgare
III) Característica:
III. a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)
III.c) outra informação relevante: AAG37354,Proteina de resistência a oidio de cevada
IV) Seqüência: 18
Met Asp lie Vai Thr Gly Ala lie Ser Asn Leu lie Pro Lys Leu Gly
1 5 10 15
Glu Leu Leu Thr 20 Glu Glu Phe Lys Leu 25 His Lys Gly Vai Lys 30 Lys Asn
lie Glu Asp Leu Gly Lys Glu Leu Glu Ser Met Asn Ala Ala Leu lie
35 40 45
Lys lie Gly Glu Vai Pro Arg Glu Gln Leu Asp Ser Gln Asp Lys Leu
50 55 60
Trp Ala Asp Glu Vai Arg Glu Leu Ser Tyr Vai lie Glu Asp Vai Vai
65 70 75 80
Asp Lys Phe Leu Vai 85 Gln Vai Asp Gly lie 90 Gln Phe Asp Asp Asn 95 Asn
Asn Lys Phe Lys Gly Phe Met Lys Arg Thr Thr Glu Leu Leu Lys Lys
100 105 110
Vai Lys His 115 Lys His Gly lie Ala 120 His Ala lie Lys Asp 125 lie Gln Glu
Gln Leu 130 Gln Lys Vai Ala Asp 135 Arg Arg Asp Arg Asn 140 Lys Vai Phe Vai
Pro His Pro Thr Arg Thr lie Ala lie Asp Pro Cys Leu Arg Ala Leu
145 150 155 160
Tyr Ala Glu Ala Thr Glu Leu Vai Gly lie Tyr Gly Lys Arg Asp Gln
165 170 175
Asp Leu Met Arg Leu Leu Ser Met Glu Gly Asp Asp Ala Ser Asn Lys
180 185 190
Arg Leu Lys 195 Lys Vai Ser lie Vai 200 Gly Phe Gly Gly Leu 205 Gly Lys Thr
Thr Leu 210 Ala Arg Ala Vai Tyr 215 Glu Lys lie Lys Gly 220 Asp Phe Asp CysArg Ala Phe Vai Pro Vai Gly Gln Asn Pro His Met Lys Lys Vai Leu225 230 235 240
Arg Asp lie Leu lie Asp Leu Gly Asn Pro His Ser Asp Leu Ala Met
245 250 255
Leu Asp Ala Asn Gln Leu lie Lys Lys Leu Arg Glu Phe Leu Glu Asn
260 265 270
Lys Arg Tyr Leu Vai lie lie Asp Asp lie Trp Asp Glu Lys Leu Trp
275 280 285
Glu Gly lie Asn Phe Ala Phe Ser Asn Arg Asn Asn Leu Gly Ser Arg
290 295 300
Leu lie Thr Thr Thr Arg lie Vai Ser Vai Ser Asn Ser Cys Cys Ser305 310 315 320
Ser His Gly Asp Ser Vai Tyr Gln Met Glu Pro Leu Ser Vai Asp Asp
325 330 335
Ser Arg lie Leu Phe Trp Lys Arg lie Phe Pro Asp Glu Asn Gly Cys
340 345 350
Leu Asn Glu Phe Glu Gln Vai Ser Arg Asp lie Leu Lys Lys Cys Gly
355 360 365
Gly Vai Pro Leu Ala lie lie Thr lie Ala Ser Ala Leu Ala Gly Asp
370 375 380
Gln Lys Met Lys Pro Lys Cys Glu Trp Asp lie Leu Leu Gln Ser Leu385 390 395 400
Gly Ser Gly Leu Thr Glu Asp Asn Ser Leu Glu Glu Met Arg Arg lie
405 410 415
Leu Ser Phe Ser Tyr Ser Asn Leu Pro Ser His Leu Lys Thr Cys Leu
420 425 430
Leu Tyr Leu Cys lie Tyr Pro Glu Asp Ser Lys lie His Arg Asp Glu
435 440 445
Leu lie Trp Lys Trp Vai Ala Glu Gly Phe Vai His His Glu Asn Gln
450 455 460
Gly Asn Ser Leu Tyr Leu Leu Gly Leu Asn Tyr Phe Asn Gln Leu lie465 470 475 480
Asn Arg Ser Met lie Gln Pro lie Tyr Gly Phe Asn Asp Glu Vai Tyr
485 490 495
Vai Cys Arg Vai His Asp Met Vai Leu Asp Leu lie Cys Asn Leu Ser
500 505 510
Arg Glu Ala Lys Phe Vai Asn Leu Leu Asp Gly Ser Gly Asn Ser Met
515 520 525
Ser Ser Gln Gly Asn Cys Arg Arg Leu Ser Leu Gln Lys Arg Asn Glu
530 535 540
Asp His Gln Ala Lys Pro lie Thr Asp lie Lys Ser Met Ser Arg Vai545 550 555 560
Arg Ser lie Thr lie Phe Pro Pro Ala lie Glu Vai Met Pro Ser Leu
565 570 575
Ser Arg Phe Asp Vai Leu Arg Vai Leu Asp Leu Ser Arg Cys Asn Leu
580 585 590
Gly Glu Asn Ser Ser Leu Gln Leu Asn Leu Lys Asp Vai Gly His Leu
595 600 605
Thr His Leu Arg Tyr Leu Gly Leu Glu Gly Thr Asn lie Ser Lys Leu
610 615 620
Pro Ala Glu lie Gly Lys Leu Gln Phe Leu Glu Vai Leu Asp Leu Gly625 630 635 640
5Asn Asn His Asn Leu 645 Lys Glu Leu
Arg Leu Ile Tyr 660 Leu Asn Leu Phe
Gly Vai Leu 675 Gln Asn Leu Thr Ser 680
Vai Ser Vai Asn Ile Ile Ala Gln
690 695
Arg Vai Leu Asp Ile Cys Phe Arg
705 710
Asp Phe Vai Lys Ser Leu Cys Asn
725
Ile Glu Cys Asn 740 Ser Arg Glu Thr
Leu Gly Glu Arg Trp Vai Pro Pro
755 760
Ser Met Pro Ser Gln Leu Ser Ala
770 775
Pro Ser His Leu Ser Asn Leu Ser
785 790
Asp Vai Gln Gln Asp Asp Vai Glu
805
Arg Arg Leu Phe Ile Ile Thr Ser
820
Vai Ile Arg Ala Asp Gly Phe Arg
835 840
Cys Gly Ser Ala Thr Gln Ile Leu
850 855
Ala Vai Arg Vai Trp Phe Ser Leu
865 870
Gly Asn Arg Gly Phe Asp Leu Gly
885
Arg Glu Phe Vai 900 Ser Vai Tyr Met
Glu Ala Lys 915 Glu Ala Glu Ala Ala 920
Pro Ser His Pro Arg Ile Tyr Ile
930 935
Gly Ala His Asp Asp Asp Leu Cys
945 950
Pro Ser Thr Vai Cys Asn Phe Arg 650 655
Gly Cys Pro Vai Vai Pro Pro Vai
665 670
Ile Glu Vai Leu Arg 685 Gly Ile Leu
Glu Leu Gly Asn Leu Glu Arg Leu
700
Asp Gly Ser 715 Leu Asp Leu Tyr Lys 720
Leu His His Ile Glu Ser Leu Arg 730 735
Ser Ser Phe Glu Leu Vai Asp Leu
745 750
Vai His Phe Arg Glu 765 Phe Vai Ser
Leu Arg Gly Trp Ile Lys Arg Asp
780
Glu Leu Ile 795 Leu Ser Ser Vai Lys 800
Ile Ile Gly Gly Leu Leu Cys Leu
810 815
Thr Asp Gln Thr Gln Arg Leu Leu
825 830
Cys Thr Vai Asp Phe 845 Arg Leu Asp
Phe Glu Pro Gly Ala Leu Pro Arg
860
Gly Vai Arg Vai Thr Lys Glu Asp
875 880
Leu Gln Gly Asn Leu Phe Ser Leu
890 895
Tyr Cys Gly Gly Ala Arg Vai Gly 905 910
Vai Arg Arg Ala Leu Glu Ala His
925
Gln Met Arg Pro 940 His Ile Ala Lys
Glu Asp Glu 955 Glu Glu Asn
5 I.a) Número identificador da seqüência: SEQ ID No: 19
II) Características da seqüência:II.a) tamanho: 17
II. b) tipo: DNA
10 II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Marcador (Tag)
de Seqüência de Assinatura de MPSS
15IV) Seqüência: 19gatctcataa ctaggat 17
I.a) Número identificador da seqüência: SEQ ID No: 20
II) Características da seqüência:II.a) tamanho: 2 0
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de KEB131
IV) Seqüência: 20
tgatccttga ttgtccatgg 20
I.a) Número identificador da seqüência: SEQ ID No: 21
II) Características da seqüência:II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de KEB138
IV) Seqüência: 21
ccattacttcr catatatact 20
I.a) Número identificador da seqüência: SEQ ID No: 22
II) Características da seqüência:II.a) tamanho: 1684
II.b) tipo: DNA
II. c) organismo: Zea mays
III) Características:
III. 1.a)Nome/chave: PromotorIII.l.b) Localização: (0) ... (0)
III.l.c) outra informação relevante: Região depromotor do RegiIV) Seqüência: 22
actgtcgggg
catcageata
agtgactcga
acttccgtct
ccttggcttc
gggcatttaa
gaggtgaccg
tgcgccactc
ccgaaggcgc
cccggaagac
ggaagacggc
agacggcgaa
cggcgaactc
cgaactccgc
aactccgcct
cgcctcgccc
cggcttcgga
aacgtcatca
gtccggccag
gcccccagct
tgtccctcca
ccagatctct
acacgtagca
aggaaggacc
gctctcttgg
agcgcacctg
gctcggctcc
tgggctgggg
gaca
accataatta
aagctgcaaa
tcgcgcttca
cgcccgaggc
gctcagaagc
cgcaaaggtg
ccgtcactcc
cgactgcagt
cacggcgaac
ggcgaactcc
gaactccgct
ctccgctccg
cgctccgccc
tccgcccgac
cgcccgaccc
gaccccctgg
ggaaacccca
tcaccctacc
ctccgccaga
ctcttacggc
tcaggctccg
ccggctgcca
ctctgctaca
agggtcttct
ggccgctcgc
acctgggcgc
ggccgcctcg
cacgcagcac
ggggtaccctggcctgatggcccgagcctaccccctttttaaccttgactgcctgacaccaccgctccacgccactcgactccgctccgcgctccgcccgccgcccgacccccgaccccagaccccagggcccagggctccagggctcggctcgggctcgcgtcgccctgccgaatcgacggggcaatgaagcaggacaaccgcaccacccatcggcatgtccccattgtcagagaaggtttccctcaccgggacgaacacctctcccccactcactcgt
caagacgcctgcacgattaagcctcggccgatggcggacaaaatcaccactctatcctgatggccagtctagagtgagtcccgaccccagaccccagggcccagggctcggggctcggacctcggactcgagactcaggcactccgccctgccacagcaacctagagcactcgggtcacgtggcgctccacgtcagcagggatagccacgtacctagggcacacctgggttggccgcgcgcgcgtggacgcgaaggccgcctccgcgctccggcttaggg
aattetcagegtcagggatcaaggcagccgcatcaccggcaccgactgaccacgcgccccgacagaaggatgacaggcaaggctcggacttcggactcgggactcgggcttcgggctaagggctaagacctaagacccggggcctcggccctgaaggcaaagaccgccacgagaacaagacgagctctatgactcgaccgacatcacgccactagctctccctctccttaggaccgaggacttgtaacccgggacttccagcccacgcgcaccocctgtc
tggtaaccccagtccacacgacetegagagttgcccaaggcaaattgcagcggcagagcccagcgccgccctaggccttgcgggctaagagctaagacccaagacccggaacccggaagacggaagacggaagacgacgaggacgacttcgactcaacctgtcaacaggaccggcgtctcgacgacggcgctccaacagcagcaggatgccctccgctagcgactataaacgggacaggcccctactgcacctctctcactcgacccatctcgaaacgcc
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1684
I.a) Número identificador da seqüência: SEQ ID No: 23
II) Caracteristicas da seqüência:II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer de
oligonucleotideo de FLP8 Reverso
IV) Seqüência: 23acatgggtcc aaagatcgac 20I.a) Número identificador da seqüência: SEQ ID No: 24
II) Características da seqüência:II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP8 Forward
IV) Seqüência: 24
catggaagcc ccacaataac 20
I.a) Número identificador da seqüência: SEQ ID No: 25
II) Características da seqüência:
II.a) tamanho: 20II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP27 Reverso
IV) Seqüência: 25gcatgcccca tctggtatag 20
I.a) Número identificador da seqüência: SEQ ID No: 26
II) Características da seqüência:II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP27 Forward
IV) Seqüência: 26agccctattt cctgctcctg 20I.a) Número identificador da seqüência: SEQ ID No: 27
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP33 Reverso
IV) Seqüência: 27
gcattcacat gttcctcacc 20
I.a) Número identificador da seqüência: SEQ ID No: 28
II) Características da seqüência:
II.a) tamanho: 20II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de FLP33 Forward
IV) Seqüência: 28ctgtcgttcg gttttgcttc 20
I.a) Número identificador da seqüência: SEQ ID No: 29
II) Características da seqüência:II.a) tamanho:'20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de FLP41 Reverso
IV) Seqüência: 29ctgtaaggca cccgatgttt 20I.a) Número identificador da seqüência: SEQ ID No: 30
II) Características da seqüência:II.a) tamanho: 20
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP41 Forward
IV) Seqüência: 30
tgtgttcgca tcaaaggtgt 20
I.a) Número identificador da seqüência: SEQ ID No: 31
II) Características da seqüência:
II.a) tamanho: 21II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP56 Reverso
IV) Seqüência: 31tgtccagggt tacagaaaac g 21
I.a) Número identificador da seqüência: SEQ ID No: 32
II) Características da seqüência:II.a) tamanho: 21
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de FLP56 Forward
IV) Seqüência: 32ggtctgggaa tgctaaagag g 21I.a) Número identificador da seqüência: SEQ ID No: 33
II) Caracteristicas da seqüência:II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP95 Forward
IV) Seqüência: 33atttcgacgg agggttcttc 20
I.a) Número identificador da seqüência: SEQ ID No: 34
II) Caracteristicas da seqüência:
II.a) tamanho: 20II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP95 Reverso
IV) Seqüência: 34gcagcaggag gagctcatag 20
I.a) Número identificador da seqüência: SEQ ID No: 35
II) Caracteristicas da seqüência:II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP110 Forward
IV) Seqüência: 35atggaggctg ccctgctgag 20I.a) Número identificador da seqüência: SEQ ID No: 36
II) Caracteristicas da seqüência:II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP110 Reverso
IV) Seqüência: 36
cgtatacctc tctggcaagg acgg 24
I.a) Número identificador da seqüência: SEQ ID No: 37
II) Caracteristicas da seqüência:
II.a) tamanho: 25II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP111 Forward
IV) Seqüência: 37ttcctgttcg tctgtatctg atccg 25
I.a) Número identificador da seqüência: SEQ ID No: 38
II) Caracteristicas da seqüência:II.a) tamanho: 25
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP111 Reverso
IV) Seqüência: 38tttgattccg gtcgagtata acctg 25I.a) Número identificador da seqüência: SEQ ID No: 39
II) Características da seqüência:
II.a) tamanho: 25
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP112 Forward
IV) Seqüência: 39gaaactgcct tcccagaaaa caatg 25
I.a) Número identificador da seqüência: SEQ ID No: 40
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP112 Reverso
IV) Seqüência: 40caagatcggt gaagttggtg cttc 24
I.a) Número identificador da seqüência: SEQ ID No: 41
II) Características da seqüência:
II.a) tamanho: 25
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de FLP113F Forward
IV) Seqüência: 41atcacagatg ggtctcaagg attgc 25I.a) Número identificador da seqüência: SEQ ID No: 42
II) Características da seqüência:II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de AlexlR Reverso
IV) Seqüência: 42ttccaagcaa ttcacagctc 20
I.a) Número identificador da seqüência: SEQ ID No: 43
II) Características da seqüência:
II.a) tamanho: 2 4II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl612 Forward
IV) Seqüência: 43aggtccaggt tacagagcaa gaga 24
I.a) Número identificador da seqüência: SEQ ID No: 44
II) Características da seqüência:II.a) tamanho: 24
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl612 Reverso
IV) Seqüência: 44gctagtaggt gcatggtggt ttct 24I.a) Número identificador da seqüência: SEQ ID No: 45
II) Características da seqüência:
II.a) tamanho: 2 4
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umc2041 Forward
IV) Seqüência: 45
ctacacaagc atagaggcct ggag 24
I.a) Número identificador da seqüência: SEQ ID No: 46
II) Características da seqüência:
II.a) tamanho: 23II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de umc2041 Reverso
IV) Seqüência: 46cagtacgaga cgatggagga cat 23
I.a) Número identificador da seqüência: SEQ ID No: 47
II) Características da seqüência:
II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de cdol27 Forward
IV) Seqüência: 47tgctgttgtt actcgggttg 20I.a) Número identificador da seqüência: SEQ ID No: 48
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de cdol27 Reverso
IV) Seqüência: 48
ctctgcctca gcacaaattc 20
I.a) Número identificador da seqüência: SEQ ID No: 49
II) Características da seqüência:
II.a) tamanho: 2 6
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de phi093 Forward
IV) Seqüência: 49agtgcgtcag cttcatcgcc tacaag 26
I.a) Número identificador da seqüência: SEQ ID No: 50
II) Características da seqüência:
II.a) tamanho: 30
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de phi093 Reverso
IV) Seqüência: 50
aggccatgca tgcttgcaac aatggataca 30I.a) Número identificador da seqüência: SEQ ID No: 51
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de cdo365 Forward
IV) Seqüência: 51
cttccagagg caaagcgtag 20
I.a) Número identificador da seqüência: SEQ ID No: 52
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA ' "
II. c) organismo: Seqüência artifical
III.) Característica:
III. c) outra informação relevante: Primer de
oligonucleotideo de cdo365 Reverso
IV.) Seqüência: 52tgtcacccat gatccagttg 20
I.a) Número identificador da seqüência: SEQ ID No: 53
II) Características da seqüência:
II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de csul66 Forward
IV) Seqüência: 53tattgtgcac gtcaccttgg 20I.a) Número identificador da seqüência: SEQ ID No: 54
II) Características da seqüência:
II.a) tamanho: 20
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de csul66 Reverso
IV) Seqüência: 54
gggcagactt actgctggag 20
I.a) Número identificador da seqüência: SEQ ID No: 55
II) Características da seqüência:
II.a) tamanho: 2 0
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umc2285 Forward
IV) Seqüência: 55atctgcctcc ttttccttgg 20
I.a) Número identificador da seqüência: SEQ ID No: 56
II) Características da seqüência:
II.a) tamanho: 2 0
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umc2285 Reverso
IV) Seqüência: 56aagtagctgg gcttggaggg 20I.a) Número identificador da seqüência: SEQ ID No: 57
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de MZA11455 Forward
IV) Seqüência: 57acgaagcaat ttcaccttcc 20
I.a) Número identificador da seqüência: SEQ ID No: 58
II) Características da seqüência:
II.a) tamanho: 23
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de MZA11455 Reverso
IV) Seqüência: 58tgtggaacta accctcagca tag 23
I.a) Número identificador da seqüência: SEQ ID No: 59
II) Características da seqüência:
II.a) tamanho: 19
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de MZA6064 Forward
IV) Seqüência: 59cgagaaccgg agaagaagg 19I.a) Número identificador da seqüência: SEQ ID No: 60
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Reverso
IV) Seqüência: 60ttgggctgct gtattttgtg 20
I.a) Número identificador da seqüência: SEQ ID No: 61
II) Características da seqüência:
II.a) tamanho: 19
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA158 41 Forward
IV) Seqüência: 61gacgcagctg tgaagttgg 19
I.a) Número identificador da seqüência: SEQ ID No: 62
II) Características da seqüência:
II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA15841 Reverso
IV) Seqüência: 62caccggaata ccttgaccac 20I.a) Número identificador da seqüência: SEQ ID No: 63
II) Caracteristicas da seqüência:
II.a) tamanho: 2 4
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl086 Forward
IV) Seqüência: 63
catgaaagtt ttcctgtgca gatt 24
I.a) Número identificador da seqüência: SEQ ID No: 64
II) Caracteristicas da seqüência:
II.a) tamanho: 25
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl086 Reverso
IV) Seqüência: 64gggcaacttt agaggtcgat ttatt 25
I.a) Número identificador da seqüência: SEQ ID No: 65
II) Caracteristicas da seqüência:
II.a) tamanho: 21
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umc!4 66 Forward
IV) Seqüência: 65gatccactag ggtttcgggg t 21I.a) Número identificador da seqüência: SEQ ID No: 66
II) Caracteristicas da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de umcl466 Reverso
IV) Seqüência: 66
cgaatagtgg tctcgcgtct atct 24
I.a) Número identificador da seqüência: SEQ ID No: 67
II) Características da seqüência:
II.a) tamanho: 21
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de umcl418 Forward
IV) Seqüência: 67gagccaagag ccagagcaaa g 21
I.a) Número identificador da seqüência: SEQ ID No: 68
II) Características da seqüência:
II. a) 'tamanho: 24
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de umcl418 Reverso
IV) Seqüência: 68tcacacacac actacactcg caat 24I.a) Número identificador da seqüência: SEQ ID No: 69
II) Características da seqüência:II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de BNLG2162 Forward
IV) Seqüência: 69caccggcatt cgatatcttt 20
I.a) Número identificador da seqüência: SEQ ID No: 70
II) Características da seqüência:
II.a) tamanho: 20Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de BNLG2162 Reverso
IV) Seqüência: 70gtctgctgct agtggtggtg 20
I.a) Número identificador da seqüência: SEQ ID No: 71
II) Características da seqüência:II.a) tamanho: 20
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotídeo de csul66 Forward
IV) Seqüência: 71aaatatcggc tttggtcacg 20I.a) Número identificador da seqüência: SEQ ID No: 72
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de csul66
IV) Seqüência: 72tcgtccttcc tcaattcgac 20
I.a) Número identificador da seqüência: SEQ ID No: 73
II) Características da seqüência:
II.a) tamanho: 24II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl051 Forward
IV) Seqüência: 73aatgatcgaa atgccattat ttgt 24
I.a) Número identificador da seqüência: SEQ ID No: 74
II) Características da seqüência:II.a) tamanho: 2 4
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl051 Reverso
IV) Seqüência: 74ctgatctgac taaggccatc aaac 24I.a) Número identificador da seqüência: SEQ ID No: 75
II) Caracteristicas da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de umc2187 Forward
IV) Seqüência: 75
acccaacaag tcttaatcgg gttt 24
I.a) Número identificador da seqüência: SEQ ID No: 76
II) Caracteristicas da seqüência:
II.a) tamanho: 2 4
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de umc2187 Reverso
IV) Seqüência: 76gtccacccta cctctcaaca aaca 24
I.a) Número identificador da seqüência: SEQ ID No: 77
II) Caracteristicas da seqüência:
II.a) tamanho: 23
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl371 Forward
IV) Seqüência: 77catgtgaatg gaagtgtccc ttt 23I.a) Número identificador da seqüência: SEQ ID No: 78
II) Características da seqüência:II.a) tamanho: 2 4
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl371 Reverso
IV) Seqüência: 78gcatcctttt cgtttcaaat atgc 24
I.a) Número identificador da seqüência: SEQ ID No: 79
II) Características da seqüência:
II.a) tamanho: 24II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer de
olgonucleotideo de umcl856 Forward
IV) Seqüência: 79agatctgttt tgctttgctc tgct 24
I.a) Número identificador da seqüência: SEQ ID No: 80
II) Características da seqüência:II.a) tamanho: 2 4
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de umcl856 Reverso
IV) Seqüência: 80catgccttta ttctcacaca aacg 24I.a) Número identificador da seqüência: SEQ ID No: 81
II) Características da seqüência:II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1215 Primer
Forward Nested Externo
IV) Seqüência: 81agcccaattc tgtagatcca a 21
I.a) Número identificador da seqüência: SEQ ID No: 82
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1215 Primer
Reverso Nested Externo
IV) Seqüência: 82tgcatgcacc ggatccttc 19
I.a) Número identificador da seqüência: SEQ ID No: 83
II) Características da seqüência:II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1215 Primer
Forward Nested Interno
IV) Seqüência: 83
agcagcagac gatgcaaaga 20I.a) Número identificador da seqüência: SEQ ID No: 84
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) orqanismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1215 Primer
Reverso Nested Interno
IV) Seqüência: 84
aggctggcgg tggacttga 19
I.a) Número identificador da seqüência: SEQ ID No: 85
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1216 Primer
Forward Nested Externo
IV) Seqüência: 85
ccggcctacg gcaacaagaa 20
I.a) Número identificador da seqüência: SEQ ID No: 86
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1216 Primer
Reverso Nested Externo
IV) Seqüência: 86
agggtacggt gacccgaag 19I.a) Número identificador da seqüência: SEQ ID No: 87
II) Caracteristicas da seqüência:II.a) tamanho: 20
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1216 Primer
Forward Nested Interno
IV) Seqüência: 87ttcgagacgc tgtcgtacct 20
I.a) Número identificador da seqüência: SEQ ID No: 88
II) Caracteristicas da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1216 Primer
Reverso Nested Interno
IV) Seqüência: 88acgacgcatg gcactagcta 20
I.a) Número identificador da seqüência: SEQ ID No: 89
II) Caracteristicas da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA3434 Primer
Forward Nested Externo
IV) Seqüência: 89tgtaccgcga gaactccaI.a) Número identificador da seqüência: SEQ ID No: 90
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA3434 Primer
Reverso Nested Externo
IV) Seqüência: 90ttgcattcac atgttcctca c 21
I.a) Número identificador da seqüência: SEQ ID No: 91
II) Caracteristicás da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA3434 Primer
Forward Nested Interno
IV) Seqüência: 91
ctactacgac ggccgcta 18
I.a) Número identificador da seqüência: SEQ ID No: 92
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA3434 Primer
Reverso Nested Interno
IV) Seqüência: 92ttgcagtagt tttgtagcag g 21I.a) Número identificador da seqüência: SEQ ID No: 93
II) Caracteristicas da seqüência:
II.a) tamanho: 22
5 II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA2591 Primer
Forward Nested Externo
IV) Seqüência: 93agtaaataac agcattgacc tc 22
I.a) Número identificador da seqüência: SEQ ID No: 94
II) Caracteristicas da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA2591 Primer
Reverso Nested Externo
IV) Seqüência: 94tccaacggcg gtcactcc 18
I.a) Número identificador da seqüência: SEQ ID No: 95
II) Caracteristicas da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Caracteristica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA2591 Primer
Forward Nested Interno
IV) Seqüência: 95ctatataaca gggccctgga a 21I.a) Número identificador da seqüência: SEQ ID No: 96
II) Características da seqüência:
II.a) tamanho: 20
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA2591 Primer
Reverso Nested Interno
IV) Seqüência: 96cacaaagccc acaagctaag 20
I.a) Número identificador da seqüência: SEQ ID No: 97
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:.
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11123 Primer
Forward Nested Externo
IV) Seqüência: 97accacaatct gaagcaagta g 21
I.a) Número identificador da seqüência: SEQ ID No: 98
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11123 Primer
Reverso Nested Externo
IV) Seqüência: 98cacagaaaca tctggtgctg 20I.a) Número identificador da seqüência: SEQ ID No: 99
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11123 Primer
Forward Nested Interno
IV) Seqüência: 99aaagaccaag aaatgcagtc c 21
I.a) Número identificador da seqüência: SEQ ID No: 100
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11123 Primer
Reverso Nested Interno
IV) Seqüência: 100agacatcacg taacagtttc c 21
I.a) Número identificador da seqüência: SEQ ID No: 101
II) Características da seqüência:
II.a) tamanho: 2 0
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA15842 Primer
Forward Nested Externo
IV) Seqüência: 101ctcgattggc atacgcgata 20I.a) Número identificador da seqüência: SEQ ID No: 102
II) Características da seqüência:
II.a) tamanho: 20
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA15842 Primer
Reverso Nested Externo
IV) Seqüência: 102
ttccttctcc acgcagttca 20
I.a) Número identificador da seqüência: SEQ ID No: 103
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA15842 Primer
Forward Nested Interno
IV) Seqüência: 103
agaaggtatt tgccatggct ta 22
I.a) Número identificador da seqüência: SEQ ID No: 104
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA15842 Primer
Reverso Nested Interno
IV) Seqüência: 104
gtttcacttg ctgaaggcag tc 22I.a) Número identificador da seqüência: SEQ ID No: 105
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11455 Primer
Forward Nested Externo
IV) Seqüência: 105gaccgatgaa ggcaattgtg a 21
I.a) Número identificador da seqüência: SEQ ID No: 106
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11455 Primer
Reverso Nested Externo
IV) Seqüência: 106accaaatagt cctagataat gg 22
I.a) Número identificador da seqüência: SEQ ID No: 107
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11455 Primer
Forward Nested Interno
IV) Seqüência: 107ttcaaccttc tgactgacac at 22I.a) Número identificador da seqüência: SEQ ID No: 108
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11455 Primer
Reverso Nested Interno
IV) Seqüência: 108taaacatagt cataaaaatt ac 22
I.a) Número identificador da seqüência: SEQ ID No: 109
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Primer
Forward Nested Externo
IV) Seqüência: 109tcgaatgtat tttttaatgc gg 22
I.a) Número identificador da seqüência: SEQ ID No: 110
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Primer
Reverso Nested Externo
IV) Seqüência: 110atccacaatg gcacttgggt 20I.a) Número identificador da seqüência: SEQ ID No: 111
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Primer
Forward Nested Interno
IV) Seqüência: 111cagctatttt tgtcttcttc ct 22
I.a) Número identificador da seqüência: SEQ ID No: 112
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Primer
Reverso Nested Interno
IV) Seqüência: 112ggtcagattc caattcggac 20
I.a) Número identificador da seqüência: SEQ ID No: 113
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11394 Primer
Forward Nested Externo
IV) Seqüência: 113tcgtcctaac agcctgtgttI.a) Número identificador da seqüência: SEQ ID No: 114
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11394 Primer
Reverso Nested Externo
IV) Seqüência: 114gtccggatca aatggatcgt 20
I.a) Número identificador da seqüência: SEQ ID No: 115
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11394 Primer
Forward Nested Interno
IV) Seqüência: 115aacagcctgt gttgaataag gt 22
I.a) Número identificador da seqüência: SEQ ID No: 116
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA11394 Primer
Reverso Nested Interno
IV) Seqüência: 116cgtgttccgt cgagggagtI.a) Número identificador da seqüência: SEQ ID No: 117
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA8761 Primer
Forward Nested Externo
IV) Seqüência: 117ttctttgatt ctactcttga gc 22
I.a) Número identificador da seqüência: SEQ ID No: 118
II) Características da seqüência:
II.a) tamanho:
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA8761 Primer
Reverso Nested Externo
IV) Seqüência: 118cttcaggac gcctgagatt 20
I.a) Número identificador da seqüência: SEQ ID No: 119
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA8761 Primer
Forward Nested Interno
IV) Seqüência: 119tagagctttc tgaactgata gc 22I.a) Número identificador da seqüência: SEQ ID No: 120
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA8761 Primer
Reverso Nested Interno
IV) Seqüência: 120
ttggcattta gcttctctcc a 21
I.a) Número identificador da seqüência: SEQ ID No: 121
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1851 Primer
Forward Nested Externo
IV) Seqüência: 121
atatattgca ccacttaaag cc 22
I.a) Número identificador da seqüência: SEQ ID No: 122
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1851 Primer
Reverso Nested Externo
IV) Seqüência: 122
gggtgttatc acttgttcta taI.a) Número identificador da seqüência: SEQ ID No: 123
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1851 Primer
Forward Nested Interno
IV) Seqüência: 123tggagtcctt gaccatttgc 20
I.a) Número identificador da seqüência: SEQ ID No: 124
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1851 Primer
Reverso Nested Interno
IV) Seqüência: 124tatatgcact tctagcgagt at 22
I.a) Número identificador da seqüência: SEQ ID No: 125
II) Características da seqüência:
II.a) tamanho: 32
Il.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deconsenso de oligonucleotideo degeneradodesenhado a partir das repetiçõesinvertidas terminais (TIR) oriundas daseqüência do elemento MutarorIV) Seqüência: 125agagaagcca acgccawcgc ctcyatttcg tc 32
I.a) Número identificador da seqüência: SEQ ID No: 126
II) Características da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III.c) outra informação relevante: Primer deoligonucleotideo usado ligado emcombinação com primers internos de MZA deforma a seqüenciar produtos de PCR
IV) Seqüência: 126tgtaaaacga cggccagt ^8
I.a) Número identificador da seqüência: SEQ ID No: 127
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo usado ligado emcombinação com primers internos de MZA deforma a seqüenciar produtos de PCR
IV) Seqüência: 127ggaaacagct atgaccatg 19
I.a) Número identificador da seqüência: SEQ ID No: 128
II) Características da seqüência:
II.a) tamanho: 1698
II.b) tipo: DNA
II.c) organismo: Seqüência artificialIII) Características:
III.l.c) outra informação relevante: Promotor deRegi com 14 pb de seqüência deoligonucleotideo de clonagem adicionadana extremidade 5'
IV) Seqüência: 128
gaggctcggg ggctactgtc ggggaccata attaggggta ccctcaagac gcctaattct 60cagctggtaa cccccatcag cataaagctg caaaggcctg atgggcacga ttaagtcagg 120gatcagtcca cacgagtgac tcgatcgcgc ttcacccgag cctagcctcg gccgaaggca 180gccgacctcg agagacttcc gtctcgcccg aggcccccct ttttatggcg gacacatcac 240cggcttgccc aaggccttgg cttcgctcag aagcaacctt gactaaatca ccacaccgac 300tgaccaaatt gcaggggcat ttaacgcaaa ggtggcctga cacctctatc ctgacacgcg 360cccccggcag agccgaggtg accgccgtca ctccaccgct ccactggcca gtctgacaga 420aggacagcgc cgcctgcgcc actccgactg cagtgccact cgacagagtg agtctgacag 480gcaactaggc cttgccgaag gcgccacggc gaactccgct ccgcccgacc ccagggctcg 540gactcgggct aagacccgga agacggcgaa ctccgctccg cccgacccca gggctcggac 600tcgggctaag acccggaaga cggcgaactc cgctccgccc gaccccaggg ctcggactcg 660ggctaagacc cggaagacgg cgaactccgc tccgcccgac cccagggctc ggactcgggc 720taagacccgg aagacggcga actccgctcc gcccgacccc agggctcgga ctcgggctaa 780gacccggaag acggcgaact ccgctccgcc cgaccccagg gctcagactc aggctaagac 840ccggaagacg acgaaactcc gcctcgcccg accccagggc tcggactccg ccctggcctc 900ggccggacga cttccgcctc gcccgacccc ctggctcggg ctcggccaca gcaactgaag 960gcaagactca acctcggctt cggaggaaac cccacgtcgc cctgcctaga gcacagaccg 1020ccacgtcaac aggaaacgtc atcatcaccc taccccgaat cgactcgggt cacggagaac 1080aagaccggcg tctcgtccgg ccagctccgc cagaggggca atgatggcgc tccacgagct 1140ctatgacgac ggcggccccc agctctctta cggcagcagg acaacgtcag cagggactcg 1200accgctccaa cagctgtccc tccatcaggc tccgccgcac caccgatagc cacgacatca 1260cgccagcagg atgcccagat ctctccggct gccacatcgg catgtaccta gggcactagc 1320tctccctccg ctagacacgt agcactctgc tacatcccca ttgtacacct gggtcctctc 1380cttacgacta taaaaggaag gaccagggtc ttetcagaga aggttggccg cgcgggaccg 1440aggacgggac aggcgctctc ttggggccgc tcgcttccct cacccgcgtg gacgcttgta 1500acccccctac tgcaagcgca cctgacctgg gcgcgggacg aacacgaagg ccgcgggact 1560tccacctctc tcacgctcgg ctccggccgc ctcgcctctc ccccctccgc gctcgcccac 1620gcgctcgacc catctgggct ggggcacgca gcacactcac tcgtcggctt agggaccccc 1680tgtctcgaaa cgccgaca 1698
I.a) Número identificador da seqüência: SEQ ID No: 129
II) Características da seqüência:
II.a) tamanho: 20
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer Forward Nested ExternoIV) Seqüência: 129
aacaacaagg cgacggtgat 20
I.a) Número identificador da seqüência: SEQ ID No: 130
II) Características da seqüência:
II.a) tamanho: 20
Il.b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III.c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer
Reverso Nested Externo
IV) Seqüência: 130tcatcttcgt cgtcctcatc 20
I.a) Número identificador da seqüência: SEQ ID No: 131
II) Características da seqüência:
II.a) tamanho: 18
II. b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer Forward Nested Interno
IV) Seqüência: 131
gatcatcctg ccggagtt 18
I.a) Número identificador da seqüência: SEQ ID No: 132
II) Características da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II.c) organismo: Seqüência artifical
III) Característica:III.c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer
Reverso Nested Interno
IV) Seqüência: 132aaccgaaaac acaccctc 18
I.a) Número identificador da seqüência: SEQ ID No: 133
II) Caracteristicas da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1719 Primer
Forward Nested Externo
IV) Seqüência: 133ccagcggtag attatataca g 21
I.a) Número identificador da seqüência: SEQ ID No: 134
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1719 Primer
Reverso Nested Externo
IV) Seqüência: 134cggtttggtc tgatgaggc 19
I.a) Número identificador da seqüência: SEQ ID No: 135
II) Características da seqüência:II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1719 Primer
Forward Nested Interno
IV) Seqüência: 135ctcgggaacc ttgttggga 19
I.a) Número identificador da seqüência: SEQ ID No: 136
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artifical
III) Característica:
III. c) outra informação relevante: Primer deoligonucleotideo de MZA1719 Primer
Reverso Nested Interno
IV) Seqüência: 136
tgaaatccag aacctccttt g 21
I.a) Número identificador da seqüência: SEQ ID No: 137
II) Características da seqüência:
II.a) tamanho: 50330
II.b) tipo: DNA
II. c) organismo: Zea mays
III) Características:
III. 1.a)Nome/chave: misc_fature
III.l.b) Localização: (0) ... (0)
III.l.c) outra informação relevante: Seqüêncianão-colinear
III.1.a)Nome/chave: repeat_region
III.l.b) Localização: (537) ... (7229)
III.l.c) outra informação relevante: regiãoaltamente repetitivaIII.1.a)Nome/chave: repeat_region
III.l.b) Localização: (7536) ... (11292)
III. l.c) outra informação relevante: regiãoaltamente repetitiva
III.1.a)Nome/chave: repeat_region
III.l.b) Localização: (12554) ... (25411)
III.l.c) outra informação relevante: regiãoaltamente repetitiva
III.1.a)Nome/chave: repeat_region
III.l.b) Localização: (29087) ... (43016)
III.l.c) outra informação relevante: regiãoaltamente repetitiva
III.1.a)Nome/chave: misc_feature
III.l.b) Localização: 48839, 48840, 48841, 48842,
48843, 48844, 48845, 48846, 48847, 48848,
48849, 48850, 48851, 48852, 48853, 48854,
48855, 48856, 48857, 48858, 48859, 48860,
48861, 48862, 48863, 48864, 48865, 48866,
48867, 48868, 48869, 48870, 48871
III.l.c) outra informação relevante: n = A, T, Cou G
IV) Següência: 137
taaaaacttg atttagaaac tcagctagtggctgcatgtc tagaggtaga ggagtagactagtatactca gccttgcttg tggcataattggagtgactt ggccgtccat cttgccaccggctgaggagg agcatgagga gtgatgggacttagtttatt tccgctgcac ttcgaacaatgatgatgatg gtgatgtaat aatttaatacatttgctctg tgactcacct tcgagtgagatcggactaga tccgagggat tgacgggttagcggggctta ggcacttaag ttggaataatggatgaaata gcaatttttc ctaaccctttgattgaatct tggggatcct tgttcttgaccatgtggttt gtgcatccgc tgtcgataatcaaggcaaat ttaggcttgg gtcttaggtattacaatagt cttagagacc caaatgcaagtcctagcaat taccttctta tcctttctacaaattgtaca aggttcattc attactttcctatgatgaac aacatttttc ctagcaaattaatcatggca tgagaatcaa aagcatcataatcatgatac atgaaagcac ggttcttttgctccttggcg gagatggaag ccttatggctaagaccatcc ttaattgagg ggtgtctacctttgtcaaat tcactcttgc tagtcttaagcaatttagaa attgaaacta ggcgttcactattgcaaact acaacatgtt ctacacaaga
cttttggcaa ccaaacccca cagccaaaca 60cctcacaccg ggtaagtcta gctgagtatt 120tttacaggtt ctctggagga aatggttgct 180ggttggactg tcgagtggga ccctgccttg 240aggcttcccc atctctctat ttatttaccg 300gatggttact tttgcaaaaa ctccgaggat 360tctgacatgt atggttttat gctttattgt 420ttgtggtact tgatcctgtc agtggccgtg 480ttcccaatta agtgtggtct agcctctaag 540tcgggcagtt ccgccacaaa tagagtgctc 600caccttgcct tggttcccat cactgaatat 660gtaggaagag aacatcctct tttcccccgt 720ccagcttgag cccccggatg cataaacctg 780cccaactcat gttgggtcct acaaggttag 840tcttgtctcc cttacatttg gcccctaatt 900aaatagcaaa ggaagcattg caagcataat 960tagggacatg aacaatattt attctaggca 1020tttatcatgc ataatagaag aactagaagc 1080acttctatac acattcctag aatgtctcct 1140agcactacta gccatagggg ccttcccttt 1200tgttaagttc ttgacttccc tcttgaagcc 1260aatcgtgtag gcatcccttg caaattttag 1320ttgagcatta agactagcca cttcatcatt 1380acaagcatca acattaaaat ctttacacct 1440tgttgattta ttagctattt ctaacttagc 1500actcaaatca tcatttatgc tctttaagctacaagaaagc atttcattcc ttttaatttccttatcatgt tcttcataca aaagatcctccaaggcatca attaattcat taatcttatcacatgaatag tctatttcat catcgctagaagtatcacga gtgcttacct tcttttccctgaagagggac gatttgttga aggcggtggccgaacaatcc gagtcccact ccttgccaagcttcttcttt tccctcttgt tcccttgttcgataaaatga ccaatcttac cacatttgaagttgggatgc tccttacgac cctttagcgcttcttcatca ttaagcccgg ccgcctcaacgctcctcgtt gctttgagag caatggtttgatcaacgtat ctagcctcct tgatcatcatctcgggcgtc atcttggtgt acctaggattaaggacagta aaagacttta gcattaggcgtccatagctc cttattttgt tgacgagggtttcgcccctg atcattgcga atctcccaagcatggtgacg tcgtttccct catgagagatatccaagccg ctcaccttat ggtattcatcagcttgtgca tttttgtgaa tttgctcattgtgcattcca ttttctacta tctcccatatcattttgtga ctccaaaatc cgtagtcctcaatggaaagc aaatgagcat tgaaactttgtgaattaacc gtcttctttt tctcgtagtcttcgtcgctg tcgtagtaga ctatctccttgtttcttttg tggcccgacc ccgagtcagtggactccttc tccttatcat tgaccaccattgattagtcc ctttcttgaa gagaacggctgggtgaatag gtgatcctgt aaaacttgaaagcacgatta aagccaagtg gctagagagggattaatcac atatagacac agtggtttattactccacgt tgtggcgtcc caacggacgaaaagacccac ttgaatacca cggtgttttgatctccacaa cttggagcct ctcgcccttaaagggaggga tgagcaacgc acacaagacacacaacacga gctctcaaca caactcaaagtatcacaaag aatcaaatgc gcggaatcgagcttggtgta ctcctccatg cgcctaggggccgttgagat cattccaaga aggcaattctccggtgcacc accggacact gtccggtgcggttggagatt cagagtcgtt ggcgcaccggtgcccccttc tgaccgttgg ctctgccacgggcccggctg actgttggct caccggacagtatagccgta caccaccgtc aaagtcccgagcaccggaca ctgtccggtg caccaccggatggctgtaca cagccaactt ctccaaaatttacattagtc ttcaaaacaa tgtactaagtcttcttgagt ccatggcaca atttaacactaaatatttag aaatggccca agggcacattagagctcccc ctcgacaaag ccgaagctcgcttactgggc gatgaaaagg agctctaccacatatccatc gctgaaggac aggagctattccatgtagca cctcgagccc tcgttgggaacgcggtggcc gacgccacta ggattgtacgacagacgcac ctgcccgctc agaccctgcagtggggtctg gacctcgtcg gtccattgcagtcgccatcg acaaattctc caagtggatcgagcaggcgg tggcgttctt caccaacatcatcaccgaca atggcaccca gttcactggc
agaaatagag tcatgacatg tagacaattc 1560taaagcaagg gatttttgtg cctctacaaa 1620ttgcttttct aataacctgt ttctatcatt 1680aactttagtt ctatctaggc ccttgaataa 1740ttcttcatca cttgaggaag cgtaagtact 1800tgccatgagg caggtgtgat gctcattggg 1860ggcgagtcct ttgttgtcgg agtcggacga 1920gtgtgcctcg cccttagcct tcttgtaagt 1980ctggtcacta tcattatcgg gacaattagc 2040gcatgagcgt ttcccctttg tcttgttctt 2100cgtcttgaaa cgcttgatga tgagggccat 2160ttgtgccacc ttgctaggta gcgcctcctt 2220aggctcttgg attaggccat tcaatgcatc 2280ccgcccgctt acgaactttc caagtatctc 2340ctcacgaata ttgttcacaa gatgtggatc 2400gacgacgtcg tggtccgtcc atcgcgtgct 24 60cttgagccgg ttgtatgttt gggttggttc 2520ttctccctcc accaactcca tcttggtgag 2580cttgagggtg tcccaaatct gcttggcatt 2640cctgcacaat gaagctagaa gaaaagtagt 2700aatgaacatg ggactatccg tactatcaaa 27 60acttggatgg agagagaata agtggttgtg 2820tccatcaaag tgggggggtt' taccgagggg 2880cggaatatga gaataatcaa aggaaaagat 2940gttgtcatcg tccttttggg aagaggaaga 3000gatgcgcctt gttttcttct tcctcccgtc 3060aggcttgtca tcctttagat cattgacgaa 3120ccccttgccc ttaggatcca tctcttcggg 3180ctgataccaa ttgagagcac ctagaggggg 3240acttaatgcc acaaaacttg attagtagtt 3300agttcttgca agacccgata accacaagag 3360cccgtggttc ggccaagttc aacacttgcc 3420gggttgcaat caacccctct caagtggtcc 3480ctttgcttta ctatatcccg cttgcgagga 3540cactttgatg ttcacaaaga agcacggagt 3600caaaattaga gtgacaatac gcacacaagt 3660agttctctac tcaaatggag ctctagttgc 3720agtcttggtg cttagtaatg cttagagaat 3780tcccttttat agccccaagg cagctatgaa 3840tgccttctgt cgcctggcgc accagacagt 3900gatttctttc cttctttggc gaagccgacc 3960acactgtccg gtgcacaccg gacagtccgg 4020cgtcgcgcgc gaattacgcg gccgaccgtt 4080tccggtgcac caccggacag tctggtgaat 4140gagcagccat ttgacagacg ccagcctggc 4200cagtccggtg caccccgacg agcagccttt 4260gtttctccta tttctagcac ttagacacaa 4320ctagaaacat acctttaatc ttgatttgca 4380tatgcacttg tgttggacac ttaatcacca 4440tccctttcac ctgcaatatc tccaccaagg 4500gtgactggcg cggcgcgcca agtcgttcgt 4560ccgcatcccc tcaggcatcc tccaacgatg 4620gcaagagata cactcgaggg cttgcggtca 4680cgccttccga caaggcttct actggccgac 4740ctcctgccaa gggtgtcaat tctacgcaag 4800gacaataccc atcacttggt catttgttgt 4860aaaggcacct ggggcttctc gcacctgctg 4920gaggtccgac ccctaaccag catcaggtcc 4 980gtccatcgct tcagggtccc gaactccatc 5040aagaggttcc tggacttctg cgaggaccac 5100cacatccggg tggactgggc cgccgtggctgccaacggta tgctcctgca aggactaaaaggcaagcaat ggatgaagga actaccctcgtgagccacgg gcttctcacc gttctttctagacttagagt acggttcccc gaggatgaggcgagaagact cactggacca gctggaggagcgatatcagc agtctcgacg ctaccacgccggagacttgg tgcttcggct gcggcaagactgggaggggc cattcatcat ctccaagattaatcaaggcg aggtctacaa caacgcttggtaagatgttt tcaagtcgtt catatacctcaggaagggtc agccttgcct cggcaaagccaccccctctg cgtaaaaaat ttcctcggaatttttgactg cttcgatagc gggatcctgacgaccgagcc gagggactcc tacgcctccgtgataagtaa ctcacgctcg gataagcgataaacttttct gccagaacga ttttcgtgccggacgagtaa gagtgcacgt aagcggcgagcgggatacgg atacctcact catcaccttcattctgttac cgacgaacaa gtccagatacacaacacaac aatgatatgt ttgggcctcaacaaactctc cctgcaggtt cagacatcagctccaccttc ggcggaatct ggcccggcctcctcgaagat ggaagccaac accaagctcgcccggcccgg gcaaacgcct cgaccggccggacatcagcc cgactcatgg cctcgacagcgacctggcca ggttccagcc gccgctgttg-ctaggccaac gaagcttctt ctcgagccgactccggctcc ggctcatcgc agagcggccggggtggcaag gccgaccgag ccgagggactcgtcaccttc cgcagtgggc aactcacactagtcctggtg ctcgaaatga ggaagaaacaggcctcgaca gccataatga acaaacaccgcggttccact cccgcgggta tgaacaaccttctagttggc tcgccgccga ccgctccatcctgaacagca gcagcgatga cctcagggcatccccactcg aggggcgagg acaagctatcgtggcgccga gaaaccttct ctggctgccagcccaccaac acccgccggg ccgtgaccaacagggttgcc tcgagtcgcg gcaccggttcacggtcgata tagccaaaag cgggccagcacagtcaagtt gtctgcaggc tcacgtccccccccaggggg tccctggacc aacgagtaaatggcgcgaga cggaacacag agggggggaagtggatgcgc ttgcagtagg gggttacaagtgttcgtcgg cccgtcctcc cgcgcgaccatttatagatg taagaagagg gtccaggtgttctggcagag aggagccaga gccctatgtagagccctgtg catgcgatgt cgtggccgtcactgttgggg ctgtcgggac cttgctgacggccgtcgtca tggccgcacg cggggagccagggacaccga tcttgttccc tgtagcctgaccctgtggcg tggtcggtcc gagcccaagggaggtcgggg ttgggtgagg acgcgattccgggtcgggcg aggcggagac catcctccgaggcgaggcgg agtccatctt ccgaggccgagcggagactt ctcctgaggc cgaggcctaactgaggctgg actcagctgc tgtcagcctcgggcaggcgg cgctgttttc ttgtcaggtcactttggccc taccgactga ggaacgtgcg
caccccatga caaatgggca agtggagcgt 516Cccgaggatct acaacgacct caacaagttt 5220gtggtctgga gtctgaggac gacgccaagc 5280gtctatgggg ccgaggctat cttgcccata 534 0gcgtacgacg accaaagcaa ctagaccagc 5400gctcaggacg tggccttgct acacttggca 5460cgaggtgttc ggccccgaga cctccaagtg 5520gctcgagggc gccacaagct tactcctccc 5580ttgaagcccg gaacttacaa gctggccaac 5640aacatccgac aactacattg cttttaccct 5700attttctatt caaataaagt ctaaccgtta 5760cgaccctccc tcgggggcta gaagggggga 5820aaagtctttc tgccagaaca tctttcgcgc 5880aaacgacgga gtacacgtaa gcggcaaggc 5940ggatacggat acctcactca tcaccttctg 6000tttgctgacc gaacaagtgt taacgctcga 6060ttctcgacta tatcgataac agaatcctac 6120gccgaccgag ccgaggaact cctatgcctc 6180tgtgaaaagt aactctcgct cggataaacg 6240tcgaaataag aggaaaggaa acgcagcttt 6300gcggccgcga aaaacatacg cacactacag 6360cagagggagc agcagcaccc tcgacgtcgt 6420tggacggcga cgtgggcgga aggatctcca 6480ggccatcata gccaaggtct ccgtaagggt 6540ctccgtagcc tcagccagct gtcccccgag 6600ctgactccgg ggttggtccc gccagcggac 6660cacctcctcg accagggagg ccaagtgctc 6720ctcagcctct gtccacactg acaccgctgc 6780agggttcttt aactgagcaa gagaagcctt 6840cctacgcctc cgggatatgg atacctcact 6900tggttaagcg gttcagctag ccgacaggcg 6960tggtattgca ctcaaatacc tagatgttca 7020gcactcaagg tgccattaca aacggaactc 7080ccacatcgga gggcctgcgg gacgacaaac 7140agcagcgaca acgacctccg ctccgggcgg 7200gacgctgctg cgacaaggcc ctcgcccgca 7260aaagccgaag agccggaggt ccgaccgcag 7320ccacctcagc accgacgacg gcagccacct 7380tgtgctcggt tggcactgtt gggtcatgcg 744 0cgcagtcgag aaggcgcggg aggaggcgcg 7500gtaatggcga cagcaggcga gcggaagcag 7560tacctggcgc gccaactgtc ggcgtttcga 7620ttgtcgctgc gtgccccagc ccagatgggt 7680aaccgcggct tcgtgttgtc ctgcgccaga 7740cgtccacgag ggagagaaag agagagtgcc 7800ccctcccgta tgagggccct ggaccttcct 7860acaatggggg tgtagcaata tgctaacgtg 7920catgccaacg tggctgtcgg agaggtgcta 7980ggaggagcac ttgagccctg tagaagcaca 8040tctccttact tccgtaaggg gctgagagcc 8100tcattacttg ttaccggggc gagcctggat 8160gctagctagg ggtagggtaa tgatgatccc 8220tcgggcgagg cggaaactcc tcctgaggcc 8280ttctgaggtc ggggccgagg tcgagccctg 8340ggtcgaggtc gaggctgagc cctggggtca 8400ggcgagggcc gagccctagg gtcgggcaag 8460ggtcgggcga ggcggagctt cctgtggcgc 8520atcttggcag gtggcacagc agtcggagcg 8580agtcagtgga ggggcgacgt gactgcggtc 8640tcaggataag gtgtcaggcg atccttgcat 8700tgaatgctcc tgcgatacag tcggttggtgaagcctgccc gagctgggcc tcgggcgagtctcgggcgag gcgtgaatcc gcctgggtctaggcgagatc gcgtcccttg tcacacccggataatcacca ggtgtgctgg gaccaagtctgaatgtcaca tctttactac ataacaggagataaggagac aacggtccag caacccaaagtcacgaactc atcgcagcat cctccatgcgtggggggggt gagacagcaa gagtgagctcgaataatgtg catgatctcg ccaaaggtgggaggatggtt agagctgagc attgcttttaaagtataagt aaataccaac ccaattaagtatgcaatgca tatgacaaat tgagtttaaggctgctcatg accgtgagct cggctagtatctttacccac aagtcatgtt acccatttgcccaaggaggc gaggcagggt aacactacgaaacccgctac agtttatagg aagctccaataaaatcaacc aaggacctcc ctacactgactaaggtagtc ctccactggc tttcctaattggtggcacgt gtttctcaag ttaagctctagaacataaat agaataacaa aataactggaccatgtaaag caatagcaaa ctacccaagtacaatctagg gtaacctatt gggtcccatcaacgaatatt attgggtaac agaagtgatcgctcagctac ttcaacctgc tgctcaccagacaatacaaa caagcacaat atatagagaatacacagtaa taatctatgc attaaaataaagttatagat tttaagttat ggattttcaaaggaattaaa tttcttactg ttttcatgacaattacaaaa atttagaaag tggaatggagattattgaag ttctagcaat tattttcctaaatttcaaac agctctggat cgagcctcaaaattttctaa gactcagaat actatgcagtggtttctctt acaaaactga cccgcgaaggaagtggacgg cccagattaa ttcatacaacggatacgaaa tccatgaccg agagagttcctataaccagt ggctcagatt tcatctgcgaccattcagat cgaacgatcc acatctagttacagatcaaa ggcccacggc aagcgcttctgacagggcac cgcggcggcg ccatcgccggacccgagcga taaatggtgc aaacgggagatttaccgtga atcgagtagc aggactcgccagttgatgcc cgacgaggaa tttcccggccagcccgcgtt cgggtatccc tcacgaacacccccagggtt gaatcgaccg aggcggtcatggtgcgcaac tggttttcct gatagtgggcccccgatgca ccgacccaca atcgccaagggatggccgaa gcacagcaca gcaggtggacttggggcgag cagggaggag aagaggaacaaggaggggac gaacaggtca cgctggcgcgaggacgttaa ccgggcggcg ctagaatcctgcggcgggca ggtgtgccgc cagcgctgtataggggtccg cgatttccgt gaatcgggcacgaagcggag gaaatgtagg gagggagaaggctgggtgac cctggaatgt ggggcccgcctgaggggcgt tgggtcgtgc ggtatcggaagcccaagtag tgttttattg tttttctttttcccatttaa attcaaattt agtggtggatatggcatggg tgaacttatt tattttcaatctccaaatta gagtttaaat gctatgtgtccatttatttt actatccaca aatgcacaat
aggcgatctg gccaaggttg cttcactgcg 8760cgggggtgcg ctcgtttctt tgaggaggcc 8820actgttcctg cccgaggctg ggctcgagcg 8880atttcagggc accaagaccc gggcgcgaac 8940cacacatatg atgattcatg gcacaggatc 9000ttctatacaa aataaataag taattacatt 9060ttgactggga gacgacgacc tagatctctc 9120cctcatcctg cggtacttgt tcttgacctg 9180acatacgttc atcgctcaac aagttgtggg 9240gagctcacgt gaagtgtaag gcttaccaaa 9300aagttggtca aaattttatt agcaattact 9360agtagaacaa aagtaacaac atcacctgcg 9420ttccataatt taatcatcag agagtcctga 9480accagtttta cactctgcag aggttgtacc. 9540gaagggatcg cgacttccca tacacctcta 9600ggcctttaca aagttccact agcttcagaa 9660gcagggttct tgcctgaccg ccatcgcagc 9720cactccccta ctgcccttgc ccctttcggg 9780aatcagccaa gagcgtccat aaacccttgt 9840tgttccaatt aacattaatg atcttgacat 9900acatagatat gataattaat tatcccaaat 9960gattcagggg taaacaaggt aatgagataa 10020aaaattaacc tatgcatgaa tagtgataat 10080aagggcacaa cttgccttta atgagcacct 10140gatcctcatt cacgggctct tctactcgcc 10200atcaacatca caccaaacat gtaaacaaac 10260aatcctagga acagaaatca taattttcgg 10320aggttttatg tgtttaaaat agattaagtg 10380aaaacagagg ctctaagtga tagagaatta 10440taatttgggg ttcatataca ttttctatga 10500ttaaaaatcc cttttccaat ttatttactc 10560ttaccgaaaa gtgcaggggc ttctgcgcat 10620ggacggcggg tttattcctc ggttttccag 10680ggtatcagcc gatctcggcc gcaggatgtg 10740ttaacaaatc ggtatgcacc caaggcccac 10800acgtcattga cctaacctaa ccatcggatc 10860aggaggtatg ctgtatataa tctcgctcgt 10920tgaacccgat ctaatctaga tcgttcgtac 10980cttccccctc cggccacccg tgcggccagg 11040caacacggtc ggtcggcccc tacagcctta 11100ggaagagatg caaaaccaaa tgggagcgat 11160gcccacggag acacgcaggt tcacagcaag 11220atggctcgcc cagtcgactg gagagcgcct 11280cccaaaccac atgccgaggc tgtagagtcg 11340ttctcccctg accacggcga agagcggcac 11400accggcgtga aattaggccg ccaactcgcg 11460cttctgctgc gcaaacgagt tccccgctgt 11520ggcagcggac cagtcgcggc ggcgcacaga 11580gcggcttcgg gtgttatagg cgcagggtaa 11640atgccgcacc tatatgacga gtccgggctg 11700ggggcttcgg cagaggccgt tgcgggagta 11760cgcggggtcg gggcacggag gttgttgcgc 11820cgagctcacc agcgccaccg gttttgcgca 11880aagaccactg ccggctgggt ggataagtta 11940tggcggcgac gcgaaggcca cacgagcgag 12000aaaaaagaat gggccgaaag tgaggattcg 12060tcttattttt tttcaaattc aactttaaat 12120ctatcttcac attaatttcc caacttaaac 12180atttatttta ttaaaactag tgctatgttt 12240ccttaatata ttaatatatg ggtactaaca 12300caagtaaaaa ctcagcatga tgcataattt 12360atttgagtgt cttctattaa ttatttattgatagggataa cccacacaca tgtaaaggaaaagtgggtgt tacatccctt gagtggacggctgcagtttg cgctgatggt gattaccagcttatggtacc cgacaactgg tatggacgagtataacctcc gtgaacaggg aaatgtgtgtcacgggagcg ggaagctcag tggtggttgaaccttacagc aattgccttt ctctaagaaaagcatgtatg atataggtct ctttctctttagtgtattca cccatattta tttatgttttcttgattgag agggctgtgt ctgcacccagtctactgcgc ttcatcttct ggctctctcgatttaaactc tgtactattt gaagaaaggattgtatcaca tttgagtccc aaaggatcggtaggggtacc ctcaagacgc ctaattctcaaaggcctgat gggtacgatt aagtcagggacgcccgagcc tagcctcggc caagggcagcgccccccttt gtaatggcgg acacacctccagcaaccctg actaaatcgc cgtgccgactgtggcctgac acctttatcc tgacacgcgcctccaccgct ctactgacca gtctgacagacagtgccact cgacagagtg agtctgacaggaactccgct ccgcccgacc ccagggctcgctccgctccg cccgacccag ggctcggactgctccgcccg accccagggc tcggactcggccgcccgacc ccagggctcg gactcgggctcccgacccag ggctcggact cgggctcagcgacccagggc tcggactccg ccctggcctcatggctcgga ctcggcctcg gcaacagaagccacgtcgcc cgacctaggg cgcaggcccgtaccccgagc cgactcgggt cacggagaaccagatggaca atgatggcgc cccacaagctcggaagcagg gcaacgtcag caaggactcgtccgtcgctc ctccgacagc cacgacatcagccacattgg catgtaccta gggcgctagctacacccccc attgtacacc tggatcctctcttcttagag gaggttggcc gcgcggggacctcgcttccc tcacccgcgt ggacgcttgtggcgcgggac gaacacgaag gccgcgggatcctcgcctct ccccccttcg cgctcgaccccgtcggctcg gggacccccc ggtctcgaaatgctgcgtgc tgacgaacag cttcccgtcatccggcccgg gacggtgctc cgtttcgggaacgacatgat actccttcct ccgccgcgcggccggcggcg gaatcggcga catcttcccctccgtcctct cccccgccga cggaggaggagcgcttcgtc ggctgtcgag cgaatcgacggcgtcgacct cgcgttcgag atggaggcagagcaagaaga cgacgccagc gcgctcgcggggatgacggt gcaaccagtc cccgatgtgacgactaactc ccatcttacg tcatttcgactggcgggcgc tctcgttgag gcaagtgcaagggaccggtt gacggacgtc tcaacctacgccagcatcta ttgggatttc tctggacttgccgcatgcga ctactgcctc tccgactgttgctgcggccc aagccgcgaa tgtttccacgatcttggcat gccggaggac ggtgattttcgggagctagc tgtggtcctc gttccggcgggcggggcgca ggctaggctc gacgagggaatagggcaggt atgggcgggc caacccccggctccagcacc gcgtcgccaa cgatgtcagg
tatagatgag gtgtccacat gaaatggtaa 12420tataatctct ccttttagat ttttcttaca 12480agccttgacc tgaattgcgc ccaacagcct 12540cgagtttagg agtcttgggg gtacccctaa 12600tctggtgtgg tatgacaatt agagattttc 12660gtaagtgcat actgaaaaag aaaacaaggc 12720gtattttgtt acttttaagt ctttgggaaa 12780atgaagagtg acttcaactc caccaaataa 12840acgggagcgc ggtgggcttg cggaatacct 12900tcagcagccg aagacttctt ttctgctatg 12960ttctgcctgt ggcttgggct agtatatttt 13020agcttgtacc cccgtattgt aataactctt 13080atgtgtttac tagcctcatg ggactactaa 13140gacgcttcag aaaatgtcgg ggaccataat 13200gctggtaacc cccatcagca taaagctgca 13260tcagtccaca cgagtgactc gatcacgctt 13320cgacctcgag agacttccgt ctcgcccgag 13380ggctcgcccg aggccctggc ttcgcttaga 13440gaccaggttg caggagcatt taacgcaaag 13500cccccggcag agccgaagtg accgccgtca 13560aggacagcgc cgcctgcgcc actccgactg 13620gcaatcaggc cttgccaaag gcgccatagg 13680gactcgggct aagacccgga agacggcgaa 13740cgggctaaga cccggaagac ggcgaactcc 13800gctaagaccc ggaagacggc gaactccgct 13860aagacccgga agacggcgaa ctccgctccg 13920cccagaagac gacgaaactc cgcctcgccc 13980ggccgaacga cctccgcctc gcccgaccca 14040acagactcaa cctcggcttc ggaggagccc 14100ccacgtcaac aaggagcgcc atcatcatcc 14160aagactggcg tcccatctgg ccagctccgc 14220ctgtgacgac ggcggctctc agctctctta 14280accgctccaa cagctgtccc tccgccaggc 14340cgccagcaag gtgccaagac ctctccggct 14400tctctctccg ctagacacgt agcactctgc 14 460ccttacgact ataaaaggaa ggaccagggc 14520gaggacgaga catgcgctct cttggggccg 14580aaccccccta ctgcaagcgc acccgacctg 14640ctccacctct ctcacgcccg tctcaggcca 14700atctgggctg gggcacgcag cacactcact 14760cgccgacagt tggcgcgcca ggtaggggcc 14820agctccagat gggcagtctc cagaaacctc 14 880gtctcgagtt catgtccttc aacggcagct 14940acaacgacaa tggcggccga caacccgccc 15000gcgtggcgga agaacaacat tcgagctcgc 15060ggcgaggcaa ccaaggccaa gcgggaggcc 15120tccccagcgc cccgacggaa ggcacgccgg 15180gcgccgtccc cccgcgacac gctgatcccg 15240gaagcctgca ggacgtcgcc ctcgtacctg 15300ctacgtcgct cctcgtcgac caaaaggtac 15360tcggcctcaa cccgccaagc gacctcgctt 15420ccccactggg gtttcgtatg cggtcgcctt 15480ggccctccga gtccgaggaa gatgacgatc 15540gcaaccccag tgccatgcgg gacttcatga 15600ccgacggaag tcgcagcctt gacgatgagg 15660ttgagctggg ggatccctcc gaaggcaacc 15720ctaggcccgt gcctcgcgcc gacatcccgc 15780ggggtcacga cccacagctc gagcgagtcc 15840caggagcgct tgagacgatc cgccgagacg 15900gccggagaaa tacgtcacct gccccagggt 15960gtcaggccgc cgcccgcatc cagcgqqgtt 16020ggtcagaacc tggcagccgc agcgatgctc ctccgcgcga tgccggagcc atcaaccacc 16080gagggtcggc gaatccaggg agagctcaag aatcttctgg aaggcgctgc ggcctgacgg 16140gccgagagca ctgcctcccg aaggtaggga tatccctcgg aacctcatgc cgcgacttcc 16200cgattcatgc gggaagcctc ggtctacacc gggcgcacgc gtaacaccgc gcctgcggcc 16260ccgggccacc tcggcaacga gcaccatcga cgcgaccgtc gggcccacct cgacgaaagg 16320gtgcgccgag gctaccaccc caggcgtggg ggacgctacg acagcgggga ggatcggagt 16380ccctcgcccg aaccacccgg cccgcaggcc ttcagtcggg ccatccgacg ggcgccgttc 16440ccgacccggt tccgaccccc gactactatc gcgaagtact cgggggaaac gagaccggaa 16500ctgtggctcg cggactaccg cctggcctgc caactgggtg gaacggacga cgacaacctc 16560atcatccgta acctccccct gttcctctcc gacactgctc gcgcctggtt ggagcacctg 16620cctccggggc agatctccaa ctgggacgac ttggtccaag ccttcgctgg caatttccag 16680ggcacatacg tgcgcccogg gaattcttgg gaccttcgaa gctgccggca acagccggga 16740gagtctctcc gggactacat ccggcgattc tcgaagcagc gcaccgagct gcccaacatc 16800accgactcgg atgtcatcgg cgcgttcctc gccggcacca cttgccgcga cctggtgagc 16860aagctgggtc gcaagacccc caccagggcg agcgagctga tggacatcgc caccaagttc 16920gcctctggcc aggaggcggt tgaggctatc ttccgaaagg acaagcagcc ccagggccgc 16980ccgtcggaag aggctcccga ggcgtctact ccgcgcggcg ccaagaagaa aggcaagaag 17040aagtcgcaat cgaaacgcgg caccgctgat gcggaccttg tcgccgccgc cgagtacaag 17100aaccctcgga agccccccgg aggtgctaac ctcttcgaca agatgctcaa ggagccgtgc 17160ccctaccatc agggacccat caagcacacc ctcgaggagt gcgtcatgct tcggcgtcac 17220ttccacaggg ccgggccacc cgccgagggt ggcagggctc gcaacgacga caaaaacgaa 17280gatcaccaag caggagagtt ccccgaggtc cgcgactgct tcatgatcta cggtgggcat 17340gcggcgaacg cctcggcttg gcaccacaag caagagcgcc gggaggtctg ctcggtgaag 17400gtggcggcgc cagtctacct agactggtcc gacaagccca tcaccttcga ccaggccgac 174 60caccccgacc acgtgccgag cccggggaaa tacccgctcg tcgtcgaccc cgtcatcggc 17520gacgtcaggc tcaccaaggt cctgatggat gggggcagct gcctcaacat catctatgcc 17580gagaccctca agctcctgcg cgtcgatcag tcctccgtcc gggcaggcgc tgcgccattc 17 640cacgggatcg tccctgggaa gcgcgtccag cccttcggac gactcgacct ccccgtctgc 17700ttcggaacgc cctccaactt ccgaagggag accctgacgt tcgaggtggt cgggttccga 17760ggaacctacc acgcggtact ggggaggcca tgctacgcga agttcatggc cgtccccaac 17820tacacctact tgaagctcaa gatgccgggc cccaacgggg tcatcaccgt cggccccacg 17880tacaaacacg cgttcgaatg cgacgtggag tgcgtggagt acgccgaggc cctcgccgag 17 940tccgaggccc tcatcgccga cctggagaac ctctccaagg aggtgccagc cgtgaagcgt 18 000cacgccggca acttcgagcc agcggagacg gttaaggccg tccctctcga ccccagtggc 18060gacacctccg agcagatccg gattgggtcc gggctcgacc ccaaatagga agcagtgctc 18120gtcgactttc tccgcgcaaa cgccgatgtc tttgcatgga gtccctcgga catgcctggc 18180ataccgaggg atgtcgtcga acactcgctg gatactcgga cctgagtctg atccgtcagg 18240cagcctctgc gcctcggtca tcaaggaagg gtcggccttg cctcggcaga gcccgaccct 18300ccctcggggg ctaaaagggg ggaacccctc tgcgtcgaga ttgggcatac ttctccgcat 18360cgaaaatttt caatcaaaaa aggggcctct tgcgttctcc tggctatgtc agaagcaggg 18420tttcaaggag cgaacatggg tacatgtaaa tggcaaggcc gactgagccg agggactcct 18480gtgcctccgg gttagggata cctcactcat cacctgccac gaagaatgac ccaactcgag 18540aagccaccct attattgaca agctaggacg aacacgcaga tggaaagaaa ggagggtacg 18600acttcatgca agaaagacaa agtgttcagg cctcagcggc cacggtgaga cgcgcatcca 18660acaagaaatt gttcaaacaa gaattaggcg ccgccttggg aaggagccgc gccctcagct 18720tcgtccccgc cgtcggtgag gtccatctcg gcctccggtg atggcgcagg gggaaggatc 18780tccgcctcáa aggtggtcgc cagcaccgtg ctcggacccg cggcgaccgc gtcaagccgc 18840tggacctctg ccagggcagc atcgtcttcg tcaggaagac agtacccctc actaacccgc 18900tccaggtcca cgacgtagtg ggaagcgagc acggcgaagg cccgcctgac gccgtggtgt 18960agcgcctcgc ggactctgcc gcgcgtgtga tcacccaagg ctcgaaggcg gctttgaggg 19020gagcttcctg aagggacgtc gccagagccg aggatacgat aaaagtccga gacggcctcg 19080gacatggccg cgaggtcagc ttccctctgc tcggcagctc cggcaagcgc ctcggcgagc 19140gccttggcgg actcatcaag ggcggactca agctctgcga gcaaccagga gaaatacctc 19200aagcacaagc aaaggaaacg gacaagaaca agaaccaggg aggaccaaga catacctccg 19260gctcggacac gatgctccga ggccgcgacc tgggccgcgg ctaggtcggc cgcgagggtc 19320tcagctcggc tttcggcctc ggcagcccgg ccccgagatt ggtcccgctc ctcgacgacc 19380tgggcgagct ccgatcgctg ccgttgcgcc tccgcacgcg ctgctgccgc ctcggccctc 19440aggtcggcgc agagcagctg gaggtccgct accttggcat cctgctgaga aaggcgcgcg 19500gtagccccgg cgagcgagga cctcagggat cgcagcgagc cctagacgtc gacctcgcgg 19560cggatgaacg acgacttggc ggcgctccgg tctgacagat cctggggaaa ggaaacaggg 19620cgtcacgacg agtgcctcgc tcacagaaggggattttggg gacgtctctg cagaaaacctcctcagcaca ctcgcggagc tcatcccaggagacagggtc cgaggcctcg ccggtccggattcgccacac agcgatgagg ctgtcacccgcttctgaggc cttgggcgcc gacgcatcagctccgacagg gacggcgaca acctcggcgggcgggctcag ggccacgttg gcgtcagccgaagagccggc ctcgggagcc cgcttctcagaagtaccccg cgaaagggtt ggctgaatgaccggcgccgt cttgagggcc ttccggggtgtggatataaa aaaagaggag gaaagaaagaagacgaagac gtcccgggat actcacccacaggtctcttg gatcccggct cccaaggcgggcgccaccct cgccgtggac gcccgggaaggagggtcacc cccatgcgcc accggtgcgacctggccctc cggagccacc tcagctcctcgcccccgtgc ctcggactgg gaccccgacgcgcgcggggg ctggctcgac gactcctggcgggcggccat gtcgtcctcc tcctcatcatgcgacggctc cctcgggagt ccttccctctcccgagcccg cctccgctcg cgggcccgggcctccgcggc gactcgccgc gctgcacggtagggcttgtg ccaccccaca tcctaaaaggcggaacgacc caatgtacga agaaggaaggggtcggggcg catccgaagc tgggagtatgacacccgcca ttggagggcg ttgaagggaaagtcagcctc tggggtcatc tcctagagcgtccgacggtg gatggcagcg atcactcccgtcagggcctg gagaaggggc tcgaggttctaggcgtcggt ggcagcagta actactctcttccggaggta gaaccaccgg cgctgccacctgtactgtga cgcccgcgac tgcctcagcacacggaccct cctctcctcc gtcgacaagggcaaatccca atggggggcg atccccaagtcctgcgagat ggagttgggg gagaggttatctcgcataaa gcggcccgtc ggcacaccgacgacgtaccc cagcggtggg gacggagcgggctgcttatc ggtgaggggg cggagcaaacctgtcaccgt ggaaaaaggc cacggatcactcaccaaaat ggaagagatg gcggcgcggggactaaagtt tcccgggttg cgaaaacctacgtcaccgga ccccctctcg agtatatgaacccggaccgg acgcgggatt cgaaaaacgcgcgcacgcgc aacggccgcc ccgccaaccaacaggcggcg cctctggcag gagaagcggatcaaaaaagg tacgccacgt cgttcgattttgcaacaggg accgggaaag ggggatacccggctccgagc ccccctactg atcagaggtttcgcctcaga tcgcgtgggc ccgacacccaccgaagggct ccatggccgc ctcaggctacttcgaaggct ggcccccgaa gggttcacagggggtacgtt cgatacataa ccgaggctcgtccgagacca gcgggaacga tcttgtaacgcggaccccgt cgccagggga ccgggtccggctctgggccc ctagccgacc cccaacgaacttgcagctca ccggagacac catgttcggtcctcctcctt gcggaaaggc gacgtaggggtcgtcctctc gccctgtgca gaggctcgggaccgttgaca gcgtcaacat accagcccgaacggccagtt cgcatgaggg aacaaccaga
aaaaaggtat gcctgaaacc gctacctgga 19680ccagcgatga ccggagcgac cccaccgttg 19740actggtcctc ctgctcatcg tcgagaacga 19800atcggagcaa cgggcgccgg gcctcggggc 19860gctggacgga tcgcgcgtcc acgcccacct 19920ccatcccgac actggcggca actggtcgct 19980tggcgggcgc cggcatggcc ggcacgacag 20040cctcctcaac cacgatggcc gcctcggcag 20100agaccggcga cgcccgagcc ccctgcggtg 20160caaggcccgg ggcggcgctg gccacacagt 20220ccaggtcggt ctggccatga ctttgcttgc 20280tcacggccga gacatatgaa tgggaagcca 20340ttcgggccat tatccaccgc gcctgggggg 20400ccgccgaggt ccgcttcgcc ggcattttcg 20460aagattgccc gggcgcggtt gcgacgacct 20520gcggcggccc ctcgggagcg gacgccctga 20580cggccgaggg aacaggtgac acctcgggtc 20640ccccaactcc ggggactgat ggtgtcggcc 20700cgcaccccga gccggggccg aggccgagac 20760cgtcgtcatc gtcgtcgtcg ggcgtctccg 20820cctgctggcg acggcgcttc tccaaggcgt 20880ccttctccgc gtccttcttt ttcttcttct 20940ccaccgcatc ctccgggacc cgtggcaggg 21000aggggagaaa ggaacccgat cataaggacc 21060agcgaacact caccaaagtt acgcacccct 21120cgtgggggtc cggcttcccc atcgcagccg 21180gaggatcagg ggacattcgc gagccctccc 21240acagccgccg ctccgccaat ggaagcaccc 21300cagcggtgag tcccccctcc cgcaactcct 21360tctgtctctc gtgcggggtc ctgtggcgcc 21420gggagaacgg tgggagcaac tcaccgtcat 21480ccttgttcga ggacgcaaga atggcaggaa 21540aaagagtgca gccgccggcc cgcaccgctg 21600cgaaaagctc ggcgaggaag agatgagtcc 21660acccttcgca taccgctacg aagatagcgg 21720gcaattccac cccgtagtgg aacaggatag 21780atccccgctc gtggaaggag acgaagctca 21840ctccacccac gggaggaatc cactctggcc 21900cctcgccgac cagctcctcc agatcgctcg 21960gcggggggat tatggtcact cgatccgcca 22020gggcagggag ggcggttttt tctcttctcc 22080aagggaaagg aaggaagaag agcaaagaac 22140ggccagggcg aaaccgtttc cagcgctcca 22200gaggcgaaac agccgttcct cgaacggctc 22260ctcgccccgt cgcattaact ccgcggcggg 22320cgacgcttcg ccttcgccgt aataaccgcg 22380cgtatccttt tttcctcttt ctctatctct 22440cgaaaaggat ccttctctgt gaaggaaccg 22500cgaaggctgg ccctccgagg ggttcaacag 22560ctactggtca ggggttcgaa ggccggcccc 22620tcgggctccg cacccattac tgatcagggg 22680tcgcctcaga cgccgagcga gggatgacca 22740ggctgcgctc ccgaggtacc ctaggacatt 22800gaatcccatc ggagggaggc atcgagccct 22860caaatcaccc gcaggtactt ttgggcgtgc 22920ggggcacgga cgtccactcg gattacccgc 22980gcccatcgag ggtaacatgg cgctctcccc 23040cgtatgtaaa aaagccgagt ctgtccctga 23100ggctgctctc gcaaacccgg ctccggccaa 23160gagcttgggc cctgaccgtg cacccgggct 23220ccagccgaag cattacgcaa ggcattaaga 23280cctcgaagga gtgtaaccac tcctccgagg cctcgggggc tacacccggc gggtgcgctc 23340gcgcgcaccc accggaacaa aatgcaaccg agaaaggctg gtccccttgc aaaaaagtgc 23400gacgaaagcc tccaagcgag tgctaacact cccttcgagg ctcgggggct actgtcgggg 23460accataatta ggggtaccct caagacgcct aattctcagc tggtaacccc catcagcata 23520aagctgcaaa ggcctgatgg gtacgattaa gtcagggatc agtccacacg agtgactcga 23580tcacgcttcg cccgagccta gcctcagcca agggcagccg acctcgagag acttccgtct 23640cggccgaggc ccccctttgt aacggcggac acacctccgg ctcgcccgag gccctggctt 23700tgcttagaag caaccctgac taaatcgccg tgccgactga ccaggttgca ggagcattta 23760acgcaaaggt ggtctgacac ctttatcctg acacgcgccc cccggcagag ccgaagtgac 23820cgccgtcact ccaccgctct actgaccagt ctgacagaag gacagcgccg tctgcgccac 23880tccgactgca gtgccactcg acagagtgag tctgacaggc agtcaggcct taccaaaggc 23940gccataggga actccgctcc gcccgacccc agggctcgga ctcgggctat gacccggaag 24000acggcgaact ccgctccgcc cgacccaggg ctcggactcg ggctaagacc cggaagacgg 24060cgaactccgc tccgcccgac cccagggctc ggactcgggc taagacccgg aagacggcga 24120actccgctcc gcccgacccc agggctcgga ctcgggctaa gacccggaag acggcgaact 24180ccgctccgcc cgaccccagg gctcggactc gggctaagac ccggaagacg gcgaactccg 24240ctccgcccga cccagggctc ggactcgggc tcagccccag aagacgacga aactccgcct 24300cgcccgaccc agggctcgga ctccgccctg gcctcggccg aatgacctcc gcctcgcccg 24360acccagggct cggactcggg ctaagacccg gaagacggcg aactccgctc cgcccgaccc 24420cagggctcgg actcgggcta agacccggaa gacggcgaac tccgctccgc ccgacccatg 24480gctcggactc gggcttagcc ccagaagacg acgaaactcc gcctcgcccg acccagggct 24540cggactccgc cctggcctcg gccgaacgac ctccgcctcg cccgacccaa tggctcggcc 24600tcggcctcgg caacagaaga cagactcaac ctcggcttcg gaggagcccc cacgtcgccc 24660gacctagggc gcaggcccgc cacgtcaaca aggagcgcca tcatcatcct accccgagcc 24720gactcgggtc acggagaaca agaccggcgt cccatctggc cagctccgcc agatggacaa 24780tgatggcgcc ccacaagctc tgtgacgacg gcggctctca gctctcttac ggaagcaggg 24840cgacgtcagc aaggactcga ccgctccaac agctgtccct ccgccaggct ccgtcgctcc 24900tccgacagcc acgacatcac gccagcaagg tgccaagacc tctccggctg ccacattggc 24960atgtacctag ggcgctagct ctctctccgc tagacacgta gcactctgct acacccccca 25020ttgtacacct ggatcctctc cttacgacta taaaaggaag gaccagggcc ttcttagagg 25080aggttggccg cgcggggacg aggacgagac atgcgctctc ttggggccgc tcgcttccct 25140cacccgcgtg gacgcttgta acccccctac tgcaagcgca cccgacctgg gcgcgggacg 25200aacacgaagg ctgcgggatc tccacctctc tcacgcccgt ctccggccac ctcgcctctc 25260cccccttcgc gctcgcccac acgctcgacc catctgggct ggggcacgca gcacactcac 25320tcgtcggctc ggggaccccc cggtctcgaa acgccgacag aaaataaggc catattttcg 25380gcggctaggg tctagccgcc gaaagtagct tattttcggc ggccacaagt cagtcgccga 25440aaattacctg ttcttttcgg tgggcctctg acggccgccg aaaataacaa gtgccgaaaa 25500tagtatttaa aaatacaaaa aataacagaa aattcataca ataacagaaa attcatactt 25560gagtccacaa cataaaactt aagtccatac aaacataaag tccacaaata gtccatacaa 25620acataaagtc cacaaatagt ccattacaaa gcacaatgcc gcacaaagct aactccatca 25680catatcgggg tcgttggagt tgtgtccact accttcagaa gcgaaaaact cgttgacgaa 25740gtcgtgtaac gggtttagat tctaaagaaa aaagaagaca ttaataacga tattagttac 25800atgtatgacc actattcaaa caaattgttt ctcaaactaa cctctcatgg agtagctccc 25860tcccctgcat atgctcctcc tggtgctggt atgagcggtg gtggcgtgtt gtggcccatg 25920accccggatc cctacaaaat caagtttagt aaagatttga aattagattg atacaaacga 25980caagtcttaa ctaaattgaa gcacctgagg tggaggtggc ggagcatgta atccccactg 26040aggcatcgac ggctgaaact gagggaaaac aaatggttgt tgttgtgcct gctgtggaaa 26100ccaagaccgt tgcaaatata atatgttagt tatagaacca atatcgagcg tgttgagaag 26160aaataagaca ctcacgttca ttgcttgttg ggcctgtgcg ttgtaagcag ccatgtactc 26220tgattgctct ttgaggaatg ccatttgttg ttgccgcagc tcttcacgaa actttttttg 26280ctactccctc atagcctcct ccatgctaga tacagagcgg caactacgcc tgctactaca 26340acaacccgcc tgcgcgcggg cggtcggcgg cgcgcaggcg tgggcggcgg acagcgcgcg 26400ggcgtgggtg gctgatttgg gagaggagag agagagagga aaaacaaaga agaagaaggg 26460cgtcggtttt aaaaagacta ttttcggcgg ccccctggca cagccgccga aaatagcgtt 26520actttcggtg gccctctgac acagccgccg aaagtagcct tatttccggc ggctgtgtga 26580gaggccaccg aaaatagcct tatttccggc ggttgtggca ggccgccaaa aatagcagat 26640aattttcggc ggctataggt gggccatcga aaattacatt ggccgccgaa aatgttcaac 26700agtgttgttg tgatagcaac caacaggtat gagccacaat actacacatt gcaacttggg 26760aaagtaattt actggtcacc atatttccga atagctggtt atgatatgat atttacaaat 26820cttccaattc attccttcag cttaaatgaa tctcattaat tcatctagga aacatctggg 26880ctgaaacgtc agaacaacag tgttttctac tgttaacatg atccgtttat cttgtaaaaa 26940acaaggtttt gtaaatggat ttatttttat gctcaaactt aaattqaaca attcaatcac 27000gcacaattgc tatgctgaca gaagtttatg acaagtttga gcataatgtt gtaataataa 27060tgagaccctt catgatcttg ttgttattcc acatttccat ctctcctcga agcatagcag 27120tgcccaccat tttctaccga gtcagcaaca ataatctagg ctgaaagaac aatggacaac 27180agcttcgtgt gttgtccatc tagtagtcct ttgaataaca gtataatatg cttatgagaa 27240tcaatattat tttcatggca cacttgtttt tttcatgaat agtttcattt ttgtagataa 27300ttttcagttc tctgtcacag gtacaatatt tgcctatggt gttacaagga gtggaaagat 27360acatacgatg catgtgggaa aacttattac aatatttttc ctttaataag ttttaccttt 27420gtagagtgta tgtttctagt cataggcttt gaagtatgcc tcatgctacc aattaacatg 27480caaaaacttg gactaatctt actgatacta agatctaaca tagttgtcaa cctccttggt 27540tggacatttt agttgctttt gttgtattaa gcttttaatt ctctacaggc tgaggatgat 27600gatggcactg atcttttcgg gacgaaaccg aagaggacaa gaaggctgct gatgagcatg 27660tccctaccaa ggtctcttat agaaagtctc tttatcgaag aggacaagaa gtgctaacct 27720acattatttc agttaggggc atgcctttga gaagtctctt tacaatgcaa cgggcaaaat 27780gcccccgaag caaccctagg gatgatgccg gatccaagtg agacagggca tatagtggga 27840ggggaagcaa tgggggcata cctgacgacg ttagagagaa agagggcgag gactttggcg 27900acgaagccgg gtagcaggtt gacaatatta atgtacttga cgcagagact cgagacgggt 27960gcgacgtcgt agctgtgcag tgcctcaacg atctccaccg gcttcatcag cgggaaggag 28020agctcgccct cccctccgtc gcaggcacca caggtaaact gctgcattga cgacttcctg 28080gcgatggctt cctctgtcac tcaaagccgc ggccgccgcg cgctcggcgc atatccttgg 28140ccgggctggt gtgaggaggt ctaggatggt ggccgggttc cgtcgtacga tctcattccc 28200aacgcctagg tcctcgacgc cgccaacggg aggcgcgggg cccagcgctg ccaacaagta 28260tggggcctac cgcgcgtggt tgatgagcct gccatgccgg ttccacctgc gggagctggt 28320aggccgcctt gcgtcgaaag cctccgtgga ggccatgacc gagggtgcgg catggcgggg 28380ccgcgtggtc ttgtcactct ccgagctgct gcaccagccg ctgcgccggc tcggcccgtc 28440cctgtagggt cgcgtcgtcg ggcggggggg gattggattt gtggtggggt gcgtgggcgg 28500gcatcacgcg tggcgatggc actggaagca cggggaacag ggcaggtgta gggtgggggc 28560aggcgatgga atggcgcggc atgcttgcgg ccgattgtcc ttgcgtggat ggaggggatt 28620gcgggctcga ggatgaggat ggcgggatgc gcgcgccttt cgtcgatcga acgtgggcac 28680gggacgagga ttgcattgcg cggccacgcg ggggcgagat tggcgtcgtc ggtgggatgt 28740aggcttcgat gactgtcagc ggggtgggac gtgaatcacg ggggcgaaac aattgctatt 28800ttagcccttc taacgtgggc tctctgctat tatgtgaccc tctgtctatg acttgtgtga 28860ccatttgtgt ctatgatttg tgggactggt ggtaaaatag agaagttcac aactgagagt 28920gacaaaatag caaattctcc cacgggggcg ggggcacgac gcaccagtgt ggacgtccac 28980actatagcct tatagagtag tggagattat tttttttaat taaactatac ttaatatttc 29040tacttaacat aatatttgat gtaacatgga cgactaaact tttccctcaa gccggtatta 29100caaggacaco gggacacgtg ctgtgcggtg acaaaactgt cggggaccat aattaggggt 29160accctcaaga cgcctaattc tcagctggta acccccatca gcataaagct gcaaaggcct 29220gatgggcacg attaagtcag ggatcagtcc acacgagtga ctcgatcgcg cttcacccga 29280gcctagcctc ggccgaaggc agccgacctc gagagacttc cgtctcgccc gaggcccccc 29340tttttatggc ggacacatca ccggcttgcc caaggccttg gcttcgctca gaagcaacct 29400tgactaaatc accacaccga ctgaccaaat tgcaggggca tttaacgcaa aggtggcctg 29460acacctctat cctgacacgc gcccccggca gagccgaggt gaccgccgtc actccaccgc 29520tccactggcc agtctgacag aaggacagcg ccgcctgcgc cactccgact gcagtgccac 29580tcgacagagt gagtctgaca ggcaactagg ccttgccgaa ggcgccacgg cgaactccgc 29640tccgcccgac cccagggctc ggactcgggc taagacccgg aagacggcga actccgctcc 29700gcccgacccc agggctcgga ctcgggctaa gacccggaag acggcgaact ccgctccgcc 29760cgaccccagg gctcggactc gggctaagac ccggaagacg gcgaactccg ctccgcccga 29820ccccagggct cggactcggg ctaagacccg gaagacggcg aactccgctc cgcccgaccc 29880cagggctcgg actcgggcta agacccggaa gacggcgaac tccgctccgc ccgaccccag 29940ggctcagact caggctaaga cccggaagac gacgaaactc cgcctcgccc gaccccaggg 30000ctcggactcc gccctggcct cggccggacg acttctgcct cgcccgaccc cctggctcgg 30060gctcggccac ggcaactgaa ggcaagactc aacctcggct tcggaggaaa ccccacgtcg 30120ccctgcctag agcacagacc gccacgtcaa taggaaacgt catcatcacc ctaccccgaa 30180tcgactcggg tcacggagaa caagaccggc gtctcgtccg gccagctccg ctagaggggc 30240aatgatggcg ctccacgagc tctatgacga cggcggcccc cagctctctt acggcagcag 30300gacaacgtca gcagggactc gaccgctcca acagctgtcc ctccatcagg ctccgccgca 30360ccaccgatag ccacgacatc acgccagcag gatgcccaga tctctccggc tgccacatcg 30420tcatgtacct agggcactag ctctccctcc gctagacacg tagcactctg ctacatcccc 30480attgtacacc tgggtcctct ccttacgact ataaaaggaa ggaccagggc cttctcagag 30540aaggttggcc gcgcgggacc gaggacgggà caggcgctct cttggggccg ctcgcttccc 30600tcacccgcgt ggacgcttgt aaccccccta ctgcaagcgc acctgacctg ggcgcgggac 30660gaacacgaag gccgcgggac ttccacctct ctcacgctcg gctccggccg cctcgcctct 30720cccccctccg cgctcgccca cgcgctcgac ccatctgggc tggggcacgc agcacactca 30780ctcgtcggct tagggacccc cctgtctcga aacgccgaca gttggcgcgc caggtagggg 30840cacgctgcgt gctgacgaat agctccccgt caagctccag atgggcagtc tccagcaacc 30900tctccggccc gggacggtgc ttcgtttcgg ggctctcgag ttcatgtcct tcgacggcag 30960ctacgacatg atacttcttc caccgccgtg cgaccacgac aatggcggcc gacaacccgc 31020ccgccggcgg cggaatcgac gacgtctacc ccgcgtggtg gaaaagcaac attcgggctc 31080gctccgttct ctcccccgcc aacggaggag gaggcggggc cgtcaaggcc agacgggaga 31140ccgcgcttcg ccggccgtcg agcgaatcga cgcccccgac gccccgacgg aaggcacgcc 31200ggacaccgac ctcgcgttca agacggaggc aagcgccgtc cccccgcggc acgacgaccc 31260cgagcaagaa gacgacgccg gcgcgctcgc ggaaagcctg caggacgtcg ccctcgaacc 31320agagatgacg gcgcaaccag tccccgatgt gactacgtcg ctcctcgtcg accaaaaggt 31380aacgactaac tcccatcttg cgtcatttcg actcggcctc aacccgccaa acgacctcgt 31440tttggcgggc gccctcattg aggcgagtgc aaccccactg aggttctgta tgcgatcgcc 31500ttgggaccga ctgacggacg tctcgaccta cgggccctct gggtccgagg aagatgacga 31560ccccagcatc ggttgggatt tctccggact tggcaacccc agtgtcgtgc cggacttcat 31620ggccgcatgt gactactgtc tgtccgactg ttccgatgca agccgcagcc ttggcgacga 31680gagctgcggc ccaagccgcg aatgtttcca catcgagcta gggaatccca ccgaaggcaa 31740ccatcttggc atgccggagg atggtgatct ccctaggccg gtgcctcgcg ccgacatccc 31800acgggagcta gctgtggtcc ccgctccggc ggggggttac gacccacaac tcgagcaagt 31860ccgcgaggcg caggccaggc tcaacgaggg aacgggagcg cttgagccga tccgtcggga 31920cgtcggacag gcatgggtgg gccaacccct ggccggagaa atacgtcatc tgccccaagg 31980tctccagcac cgcgtcgcca acgacatcag gatcaggccg ccgcccgcat ccagcggggt 32040cggtcagaac ctggcaaccg cagcaatgct catccgcgcg atgccggagc cgtcaaccac 32100cgagggtcgg cggatccagg gagaactcaa gaatctcctg gaaggcgccg cggcccggcg 32160ggccgagagc actgcatccc gaaggcaagg atatccctcg gaacctcatg ccgcgacttc 32220ccgattcatg cgggaagcct cggtctacac cgggcgcacg cgcaacaccg cgcctgcggc 32280cccgggccac ctcggcaacg agcaccatcg acacgaccgt cgggctcacc tcgacgaaag 32340ggtgcgccga ggctatcacc ccaggcgtgg gggacgttac gacagcgggg aggatcggag 32400tccttcgccc gaaccacccg gtccgcaggc tttcagtcgg gccatccgac gggcgccatt 32460cccgacccgg ttccgacccc cgactactat cgtaaagtac tcgggggaaa cgagaccgga 32520gctgtggctc gcggactacc gccttgcctg ccaactgggt ggaacggacg acgacaacct 32580catcatccgc aacctccccc tgttcctctc cgacactgct cgtgcctggt tggagcacct 32640gcctccgggg cagatttcca actgggacga cttggtccaa gccttcgctg gcaatttcca 32700gggcacatac gtgcgccccg ggaattcctg ggaccttcga agctgccggc aacagccggg 32760ggagtcgctc cgggactaca tccagcgatt ctcgaagcag cacaccgagc tgcccaacat 32820caccgactcg gatgtcatcg gcgcgttcct cgccggcacc acttgccgcg acctggtgag 32880caagctgggt cgcaaaaccc ccaccagggc cagcgagctg atggacatcg ccaccaagtt 32940cgcctccggc caggaggcgg tcgaggctat cttccgaaag gacaagcagc cccagggccg 33000cccgtcggaa gaagctcccg agacgtctgc tccgcgcggc gccaagaaga aaggcaagaa 33060gaagtcgcaa tcgaaacgcg acgccgccga cgcggacctt gtcgccgccg ccgagtataa 33120gaaccctcgg aagcccccca gaggtgcaaa cctcttcgac aagatgctca aggagccgtg 33180cccctaccat cagaggcccg tcaagcacac cctcgaggag tgcgttatgc ttcggcgtca 33240tttccacagg gccgggccac ccgccgaggg tggcagggcc cacgacgaca acaagaacga 33300agaataccca gcaggggggt tccccgaggt ccgcgactgc ttcatgatct acggagggca 33360tgcggcgaat gcctcggctc ggcaccgcaa gcaagagcgc cgggaggtct gctcgttgaa 33420ggtggcggcg ccagtctaoc tagactggtc cgacaagccc atcactttcg accgagccga 33480ccaccccgac catgtgccga gcccggggaa atacccgctc gtcgtcgacc ccgttgtcgg 33540cgatgtcagg ctcaccaagg tcctgatgga cgggggcagc tgcctcaaca tcatctacgc 33600cgagaccctc aagctcctgc gcgtcgatcc gtccaccgtc cgagcaggcg ctgcgccctt 33660ccacgggatc atccctggga agcgcgtcca gcccctcggg cgactcgacc tcccagtctg 33720cttcgggaca ccctccaact tccgaaggaa gaccctgacg ttcgaagtgg tcgggttccg 33780aggaacctac cacgccgtgt tagggaggcc atgctacgcg aagttcatgg ccgtccccaa 33840ctacacctac ctgaagctca agatgccggg ccccaacggg gtcatcaccg tcggccccac 33900gtacaaacac gcgttcgaat gcgacgtgga gtgcgtggag tacgccgagg ccctcgccga 33960gtccgaggcc ctcatcgccg acctggagaa cctctccaag gaggtcccag acgtgaagcg 34020ccatgccggc aacttcgagc cagcggagac ggtcaaggcc gtccccctcg accccagcgg 34080cgacaccacc aagcagatcc ggatcggttc cgggctcgac cccaaatagg aagcagtgct 34140cgtcgacttt ctccgcgcaa acgccgacgt ctttgcgtgg agtccctcgg acatgcccgg 34200cataccgagg gatgtcgccg agcactcgct ggatattcgg gccggagccc gacccgtcag 34260acagcctctg cgccgattcg acgaggagaa gcgcagagcg attggcgaag agatccacaa 34320gctaatggcg gcagggttca tcaaagaggtgcttgtgagg aagaaagggg ggaaatggcgagcatgtccg aaggttccct accctctgcctgggtgcgaa accctgtcct tcctcgatgcagagtccgac cagctcgcga cctctttcatcatgccgttc ggcctgagga atgcaggcgccggcgaacac atcggtcgca cagtcgaggcgaaggctccc aacctcctct ccgaccttgaagtcaagctt aatcctgaga agtgtgtcttcatcgtctct gagcgaggca tcgaggccaaggggcccatc aaggacttaa aaggggtacaccgcttcatc tcacgcctcg gcgaaagaggcgagtgtttc gtttggaccc ctgaggccgatacaaaggcg ccagtcttgg tgccgccggccgcgaccact caggtggtta gcgccgcgatattgcccgtt cagaggccgg tttacttcatctacccacaa gttcaaaagc tgctgtatgcctacttcgag tcccatccgg tgactgtggtgtgccgagag gcctcgggca ggatcgcaaactcgttcgcc cctcggaagg ccatcaagtcggtcgacacc caactaccaa cgactccgatcgggtcgctg atgaagacgg gggccggtgcgcacttgcgc tacgtgctgc gcctccacttagctctggtc aacggattgc ggatcgccattggtgattcg cagctcgtca tcgaccaagtgatggaggcc tactgcgacg aggttcggcgcaaccatatc gctcggcgct acaacgaaacgcgaacgaca gtccccccgg acgtcttctccgacgacgcg cccgagcccg aggtatcctccgaggtaccc tcggttcagc ccgaggcacccgagggcagg gcattgaacg tcgaggaagggcaggccccg tacctgcaat atctccgtcgtcggcgggta gcgcgacgcg ccaagtcattccatcgcagc ccctcgggca tcctccagcggctgcaagaa gtacactcgg gggcttgcggaaatgctttc cggcaaggct tctactggccccgcacctgc gaagggtgcc aattctatgcgcagacaata cccatcacct ggcccttcgcgcaaaaggcg cccgggggct acacgcacctgatcgaggtc cgacctctga acagcatcagcatcatccat cgcttcgggg tcccgaactccggcaaaaaa ttcttggatt tttgcgaggaggctcatccc atgtcgaatg ggcaagtagacaagcctcgg atctacaacg acctcaacaactcggtggtc tggagcctaa ggacgacgcccctggtctat ggggctgaag ctatcctgccgagggcctac accgagcaaa gcaaccaagcggaagctcgg gacagggcct tactacactcccacgcccga ggggtccggt cccgagaactacaagacgcc cgagggaggc acaagctcaccaaagttctg aagcccggaa catacaagctcgcttggaac atcaaacagc tacgtcgcttatacctcgca cctacgcaaa gtttagttgtcccgaccctc cctcgggggc taaaaggggggaaaaaggac ctctttttag caggatttctatcctggaaa cgacgaggta cacgtaagcacgcctccggg atacggatac ctcactcgtctaaagcgact ccgtggaccg aacgagtcatccttcaagct ttctcgacta aatcggggacaagcggcaag gccgaccgag ccgagggattcgtcccttcc gcgaaaagca actctcgctc
attccatccc aaatggcttg ccaaccctgt 3438Cgatgtgtgta gactacactg gtctcaacaa 3444Ctcgcatcgac caaatcgtgg attccactgc 3450Cctactcgggg tatcaccaga tccggatgaa 34560cacgccgttc ggcatgtact gctacgtcac 34620gacgtaccag cggtgcatga accatgtgtt 34680ctacgtcgat gacatcgtag tcaagacacg 34740agtgacattc cggtgtctca aggcgaaagg 34800cggggtgccc cgaggcatgc tcctagggtt 34860cccggagaag atcgcggcca tcaccagcat 34920gagggtcatg ggatgcctcg cggccctgag 34980tctgcccctg taccgccttt taaggaaagc 35040ggaagccctc ggcaacctaa aggcgctcct 35100ggacggagaa accctcttgg tctacgtcgc 35160tgtggtcgaa aggcaggagg aagggcatac 35220cagcgaagtg ctgtccgaga ctaagatccg 35280tgtgatcctg acgaggcgga agctacgaca 35340gtcatccttc cccctggggg agatcatcca 35400gtgggcagtg gagatcatgg gcgaaacgat 35460ccaagtgttg gcggatttcg tggctgaatg 35520ccaaccggag ctctggacca tgtttttcga 35580gggcctgctc ttcatctcgc ccctcggaaa 35640cccggcgtcc aacaatgtgg ccgagtacga 35700cgagctaggg gtcagacgcc tcgacgcccg 35760catgaagaac tcccactgcc gcgacccgaa 35820cctggaagac aagttcttcg ggctcgagct 35880cgcagacgag ctggcgaaga tagcctcggg 35940ccgggatctg catcaaccct ccgtcaagct 36000ggctcagccc gaggtaccct cggctcagcc 36060ctcggcccag cccgaggtac tctcggcccc 36120gcagagcggg gccacgccag accaggattg 36180aggagagcta cccctcgacc aagtcgaggc 36240cgtcttgctg ggcgacgaag aggagctcta 36300atgcatctcc atcgccgaag gtcgggaact 36360ccaccacgca gcaccccgag cccttgttgg 36420aacggcggtg gctgacgcca ctagaattgt 36480gaagcggaca cacctgcccg ctcaggctct 36540tgtatggggt ctggacctcg tcggtccctt 36600gctggtcgcc atcgacaaat tctccaagtg 36660gtccgagcag gcggtggcat tcttcaccaa 36720catcatcacc gacaacggca cccagttcac 36780tcatcatatc cgggtggact gggccgccgt 36840gcgtgccaac ggcatgattc tacaagggct 36900gttcggcagg cgatggatga aggaactccc 36960gagtcgtgcc acgggcttca cgccgttttt 37020cactgacctg gaatacggct ccccaagggc 37080cagccgagag gaatcgctgg accagttgga 37140ggcgcggtac caacagtccc tgcgacgtta 37200ccaggtgggc gacctggtgc ttcggctgcg 37260gcccccctgg aaagggccgt tcgtcatcgc 37320ggccaacaat caaggcgaga tctacggcaa 37380ctacccttaa gatgttttca agttgttcac 37440caaggaaggg tcggcctagc ctcggcaaag 37500gagaccccct ctgcgtcgaa ttttttcctc 37560tccgtgcttc ttgactactt tggaaagcgg 37620gccaaggctg accaagccga gggactccta 37680cccttctgcg ataagtaact tgcgctcgga 37740cacgttcgga agctctcctg ccgaagcagt 37800agggcctcat ggacgggtga aagtacgcgt 37860cccacgcctc tgggatacgg atacctcact 37920acacaaacat ccctattacc gacagagtcc 37980agatgctcga aacaagagga aaaaaggacgttctggcctc ggcggccgca gaaagcgcacggtcttcacg ccgaagggag ccgtagcacccgacccagcc tcgggcggcg ccgaggtccagcggctcaac cggttacccc tggggcctcgtccaaggcct cgactgaccg acttgggcgttccggccaac caggttcccc attctcgagctacccccggc ctcgatccac caaagggcgggcctcacgta acaaggccga acgggccgagtcacccgtca ccttgacacg gggcaactcaaggcgagact tagtgctcgg aaatgaggaaatgttcaggc ctcgacagcc acaatgaacgacggaactcc ggttccccct ccgcaggtaccggagcaacg gaagaccgac gaacggcgcggcgacttctg ctccgggggg ccgaacagcgtcaggaggcc cccgcccgtg ccaaaactcggatggaggtc agcccgtggc cggtcccggctgccgtggca gacgccgacg ccgcaaggggcacgctgcag ctgccggacg ccacgggcaaggagcgggcc accgcccacg caggggctgattggtgatga aaatccttga ggctgaggaaccccaccatc aagctggagg tcgccatctcgctgcgtggt gaaaatcctt gaagccgaacttgcgttcct ccaacgagga ggcggaaaggagacgggaag acccggcgct taagggaggatccctccttt taaaggcaac tcccctacgttccaacacgc tccaaggccc tcccctgcgagccggctcag ggcagaagaa gccaaaccgctacaggcgac cccccatttc cgcccagaccgcggcatgca accgcgccag atggacgcgccccaggccca cgcgtcgagc aactggcacgcacttgtgcc accgtcgcgc ctcttcggttcaacagcgcc agactggcgc gtcggtcaaagtggcaggcg ggcgggcgca gcggtcacgtcagcaagaga gcctcctctc acggcgtgaaggatcacccg cgcgcaacgg ccgccccgccgcgggacacg cggcgcttct ggcaggaggaccgcgtcaga aaaggtacgc cacgtcgtctctctatctct tgcatcaggg accggggaaggaaggaaccg ggctccgcgc cccccattacgggttcaaca gccgcctcag atcgcgtgggaggccggccc tccgaagggc tccacggccgctgatcaggg gttcgaaggc tggcccccgaagggatgacc aggggtacgt tcgatacatacctaggacat atccgagacc agcgggaacgcatcgagccc tcggaccccg tcgccaggggtttgggcgtg cctctgggcc cctagccgacggattacccg cttgcagctc accggagacagcgcactccc ccctcctcct tgcggaaaggctgtccctga tcgtcctctc gccctgtgcagctccggcca aatcgttgac agcgtcaacagcacccgggc tacggccagt tcgcatgaggaagtattaag acctcgaagg agtgtaacca=gggtgcgct cgcgcgcacc caccggaacgcaaaaaagtg cgacaaaagc ctccaagcgatactgtcggg gaccataatt aggggtacccccatcagcat aaagctgcaa aggcctgatggagtgactcg atcgcgcttc acccgagcctgacttccgtc tcgcctgagg ccccccttttgccttggctt cgctcagaag caaccttgacggggcattta acgcaaaggt ggcctgacac
cagcttcgca agcgcggcga gggcgtgttc 38040gctacaagat gatctgatcc tgcaggctcg 38100ctcggcatcg acgacgtcta cagcaaagcc 38160ggggctcctc caggaatccg gcccgagcag 38220ggcaaccggc ttccaagggc gctagcccga 38280cggcaccgct gacgggcgac acggctaggc 38340caactccgcc tctgttcaca ctgatatcgc 38400ccgaggggtc ccttcaacta agctagaaga 38460ggattcctac gcctccggga tacggatacc 38520tgcttggtaa agcggtttag ataataaaac 38580aaaacacggc tccgtgccaa aattacatac 38640aactcactgg cattcgaagt gccattacaa 38700gaacaacccc actccgaggg ggaaggcctg 38760ccgtcacctg ctccagcagt ggcgacgacg 38820gcaacgctga cctcagggtg gatgccgctg 38880tgaggcaagg acgggcagaa ggccgtagaa 38940cgccgcgccg gcggaagaac ctcttccggc 39000ccccgaagcc actcgcggct gaagaacagg 39060tgcccgcttc tccccccatc actgagtgaa 39120ccccaactcg gcactctccc ctccccagcc 39180ggggcagagg ccacagcccg gctcgctttc 39240gggtgaccgc cggtgaaggg gtgcgaccgg 39300gatggctgag aggtaccaac tcccatggag 39360cggcggatat cccccatccg ggggcttgga 39420agaagacatg gtcgccttac gaaaggagcc 39480gcgcccccag gcgccgcggg ccgagtcttc 39540ctcgggggct gggtcccgca tgtcatgcaa 39600cgcgcatggt gcgcacgacc gtccagcggt 39660aacaggcaga aggggcgagc agccatgcag 39720ttctccaact tctgacacgc cagcctgggg 39780ccagttgctg catgcaagca accgcaccgc 39840gcgaagccta tgccacgact cgaggcgacc 39900gcgaccgaaa gtgggccggc agtaatagcg 39960cgtcagccag gctcacgtcc catcctgaga 40020gacggtgcac ccgtgacccg ttcctcgaac 40080aaccactcgc cccgtcgcat taactccgcg 40140gcgcgcgacg cttcacctcc gccttaataa 40200gatttcgtat ccttttccat tttcctcttt 40260ggggataccc cgagagggat ccttctccgc 4032Ctgatcagggg ttcgaaggct ggccccccga 4038Ccccgacaccc actactggtc aggggttcga 4044Ccctcaggcta ctcgggctcc gcgcccatta 40500agggttcaca gtcgcctcag acaccgagcg 40560accgaggctc gggctgcgct cccgaggtac 40620atcttgtaac ggaatcccat cggagggagg 40680accgggtccg gcaagtcacc cgcatgtact 40740ccccaacgaa cggggcacgg acgtccactc 40800ccatgttcgg tgcccatcga gggtaacatg 40860cgacgtaggg gcgtatgtaa aaagccgagt 40920gaggctcggg ggctgctctc gcaaaaaccg 40980taccagcccg agagcttggg ccccgaccgt 41040gaacgaccag accagccgaa gcgctaagcg 41100ctcctccgag gcctcggggg ctacacccgg 41160aaatgcaacc gagaaaggct ggtccccttg 41220gtgctaacac tcccttcgag gctcgggggc 41280tcaagacgcc taattctcag ctggtaaccc 41340ggcacgatta agtcagggat cagtccacac 41400agcctcggcc gaaggcagcc gacctcgaga 41460tatggcggac acatcaccgg cttgcccaag 41520taaatcacca caccgactga ccaaattgca 41580ctctatcctg acacgcgccc ccggcagaqc 41640cgaggtgacc gccgtcactc caccgctcca ctggccagtc tgacagaagg acagcgccgc 41700ctgcgccact ccgactgcag tgccactcga cagagtgagt ctgacaggca actaggcctt 41760gccgaaggcg ccacggcgaa ctccgctccg cccgacccca gggctcggac tcgggctaag 41820acccggaaga cggcgaactc cgctccgccc gaccccaggg ctcggactcg ggctaagacc 41880cggaagacgg cgaactccgc tccgcccgac cccagggctc ggactcgggc taagacccgg 41940aagacggcga actccgctcc gcccgacccc agggctcgga ctcgggctaa gacccggaag 42000acggcgaact ccgctccgcc cgaccccagg gctcggactc gggctaagac ccggaagacg 42060gcgaactccg ctccgcccga ccccagggct cagactcagg ctaagacccg gaagacgacg 42120aaactccgcc tcgcccgacc ccagggctcg gactccgccc tggcctcggc cggacgactt 42180ccgcctcgcc cgaccccctg gctcgggctc ggccacagca actgaaggca agactcaacc 42240tcggcttcgg aggaaacccc acgtcgccct gcctagagca cagaccgcca cgtcaacagg 42300aaacgtcatc atcaccctac cccgaatcga ctcgggtcac ggagaacaag accggcgtct 42360cgtccggcca gctccgccag aggggcaatg atggcgctcc acgagctcta tgacgacggc 42420ggcccccagc tctcttacgg cagcaggaca acgtcagcag ggactcgacc gctccaacag 42480ctgtccctcc atcaggctcc gccgcaccac cgatagccac gacatcacgc cagcaggatg 42540cccagatctc tccggctgcc acatcggcat gtacctaggg cactagctct ccctccgcta 42600gacacgtagc actctgctac atccccattg tacacctggg tcctctcctt acgactataa 42660aaggaaggac cagggtcttc tcagagaagg ttggccgcgc gggaccgagg acgggacagg 42720cgctctcttg gggccgctcg cttccctcac ccgcgtggac gcttgtaacc cccctactgc 42780aagcgcacct gacctgggcg cgggacgaac acgaaggccg cgggacttcc acctctctca 42840cgctcggctc cggccgcctc gcctctcccc cctccgcgct cgcccacgcg ctcgacccat 42900ctgggctggg goacgcagca cactcactcg tcggcttagg gaccccctgt ctcgaaacgc 42960cgacaaaaac cctcaccaca ttttcctcaa ccacatgatg gagattgggg ctactagata 43020ctatgcctgg tggtagactg gtagctgatg tctttggacc agtagttggt gctagatttg 43080tgaactctac caaggtgaga aacggagatg gaggctgccc tgctgagcgg gttcatcaaa 43140accatcctgc caaggctctt ctcactggta caagggagat acaagctgca caagggcctc 43200aagagcgaca tcaaatcgct ggagaaagag ctccatatga tcgctgttac aatcgatgaa 43260caaatctcgc tggggaggaa ggatcaggga gctgtgctga gcctctcaat tgatgagctg 43320catgaactgg ctcaccaaat cgaggactcc atagatcgct tcttgtacca tgtgaccagg 43380gagcagcaag catccttttt tcgtcggact gtacggtcgc cgaagactct gttgtcacgt 43440cagcggctgg ctgccgaggt tcagttcctg aagaagatac cggaggaggc gcaccagcga 43500gagaagaggt acagggtctt cgccggcctt tcttcctcta cccggcacac tgaatcgtct 43560tcctgttcgt ctgtatctga tccgcacaca cttaaggccg acgtcgtcgg catcgacggt 43620cccagggacg agcttgtgca gcagttaacc gaagaggcag agggcctaac aaagcagctc 43680aaggtgatct ccatcgtcgg gatccatggc tccggcaaga ccgtccttgc cagagaggta 43740tacgagagcg acgtcggccg gcagttcagt ctccgggcat gggtttctgc tactgacaga 43800ggtccgagag aggtgctcat ggagatcctc cgaaattttg gtaggccagt ggtggatagc 43860tctagtattg accagcttac ggtagatctc aggaaacact tgggtgagaa aaggtgaaaa 43920aaacctcttc tttatgttat ttattattta tgaagtttct tcaactacgg gttttcatgt 43980tcaaattgcc tctctgaact tcgaaaacgt ttaataccaa ttgaattgag gatcttagct 44040ttggaaaagc ggtagtgttt tgacgttttg catacatttc tcaccgttat tttattcatt 44100tataatttag agtttaagca gtatattcat tttgaaattt atgagatttc tgtctgcacg 44160cttacttcca tgcccaaaac atgtccgatt gagaacagaa ggtaattttg tttgatcttt 44220gagatcagac acactgattg agtagtaaca ggaaacaagt gctcaccaat caccaagtca 44280cttacaaaga atttcatgct tacaaaacac actgattgtt aaggatagag actatgtttg 44340atctgcatag tttgaatttt gattatgtca tcgtcgattg ttatcattaa cttttgttgg 44400aaatttctct tgtagctatt tcattgtaat cgatggcatg caaacagatc agtggagcac 44460cattgaaact gccttcccag aaaacaatgt tgttagcagc agagtaattg ttacaacaac 44520aatccggtca gtagctaatt cttgcagctc ttctaacggt tatgtgcaca aaatgaaaag 44580acttagtgac gaacactcag agcaattgtt tatcaagaaa gcttgcccaa caaaatattc 44640aggttatact cgaccggaat caaaagaagt tctgaagaaa tgtgatggtc aaccacttgc 44700tcttgttact atgggccaat tcttgaggaa aaatggttgg cccacaggac ccaactgcga 44760aaatgtgtgt agagatctta gacgacatct ggagcaggat gatacattgg agagaatgcg 44820aagggtgctt atccacagct tatctagtct tcctagccat gttcccaaag cctgcctttt 44880gtattttggt atgtttccat gtgatcatcc cataaagagg aagagcctga tgaggcgatg 44940gttagcagag ggatttgtac aaacacagcc ttcatctagt gaaaacttca acaccctcat 45000agaccggaat attattgagc ccatcggcat atgtaacgat gatcaggtaa agacatgcaa 45060aacatatggc atgatgcacg agttcatttt gttaatgtcc acctcccatg acttcattac 45120cctgctttgt aataataaag ttgaacacaa atatgtgcgt cggctttctc tccatcatca 45180tagtgctaca agtggcagtt tttcggtcat cgacttatct cttgttagat ctctgatggt 45240ttttggggag gctggcaaaa ctattttgag tttccgaaag tacgagctat tgagagtctt 45300ggatcttgaa caatgtaccg acttggaaga tgatcacctc aaagacatat gcaacctttt 45360tcttatgaaa tatctaagcc tcggagaaacactgaagctc ttggagacac ttgacttgagggtcctcctg ctcccctgtt tactccatctcaagataaca agtgacatgc agaagtttttttcaggattt atcacagatg ggtctcaaggaagaaagctt aagatatggt ttgagaggaggaatgctgtc caaaagttca tccatgatgaacttcatttc gatgacggca ctgaaaacattaggtcattg aagttaaaag ggaatttgctgggtctccgg gagatatgcc tttcatcaaccgctaacttg aaaggcttgc agcatctcaacattgaaggt caggcattcc tggggctgctcttaccaata attgaaggag gagctttgccagatctagtt ggcctçggtg acatcaaaattctagatcat agagtcgctt cggaaacaagtccaáaccgg ccgaaagtat tgttggtcaaagactgttct gttgcttcaa gaccagctgtagaggttgat gtacgagagg atgacattcatgctgagaaa cagatgaatt gtgcagttcatttcaataat attagtttcc cagaggttgcgaattgaaat gtgtcttcat acacctattgcacttgcagc atattactat gaggctagtaggccataaat tgcatattat agcacaacaatttttctgct tgaatctaca aatttcatcatggtgatgcc atgtcatttt gactttgcaggagttgctag aatattgata caacttcagtaggatggttg aagataattt gcgattgtttcaataaagca tacctttgct tcctacttttttgggcctgg actttatcat gtttatccagggtgattgct gttgttatat aatctatattgttgtcccgc gccatctttt tacaaataatcacgcctata gatggccaaa cggcggtccgctggcccagg cacgtcatgc cgggtcagctatgttaaaaa acagtgtaag agttggagttaagacacttg gtgaagctat ctaaccaataatataaattg tatatatgta tatacattttcgggctgtgc cagcactacg gactgaggcttcttgcaagc attagattgt ttctgagactaggttgctga attggatgaa gcaacaatgaatttgttatt tttaaacgtt agttattgctccagttttta ttgatgcctg actttaacaaaagtttgagt tcagtgactt attttagaaactctgtatgg tggaattatg tcattttatactttcttcta actgctcact tcattggccgaccataacat cagatagtta aatcaaaaaaaaaaatcttg aaattttttg gtggatagttgcacgtgtaa ccgactagta ctaagtgaatttatatgaac gaatattgta ggtaaatgagatctggtacg tcaaaaccac gtatgtaccagactgaagta aagaatctca tccatcgactaggtcccaaa catgtcacca cttaccaattaactagcaaa agttgctgtc tccacaaactttcagaaacc gtggtagcat tgacattttaagcgtcttgt acatttattc tctcacagtaattccattgg agaatagcgg actttttgtttgcaattagc cactctgccc ttttgcgttatttctcattg ccaggtcact tgtttttgaaaacaattaga actgacatta ccgaagaaacnnnnnnnnnn nnnnnnnnnn nnnnnnnnnnttnnnnnnnn gnnngnnggn aatnnnannncnntagttta atttgtttac cctcccagga
tattagaagt cttccaaagg agatagaaaa 45420gagaacaaag gtgaaaacac tacctataga 45480gtttgggaag ttccaatttt ctgataaaat 45540cttaactgga cagagtaact tagagacact 45600attgccacag atgatgaatt acatgaattt 45660taagagaagc accaacttca ccgatcttgt 45720caaagagagc aatgatccac gttctctatc 45780cctgaactct ttgaaggctc cttgttacct 45840ggaacttccc cagtttgtca tatcaatgcg 45900aaaattgaca tcgggcctcc ttgcaacact 45960gctgattgca gatgtccttg aagattttat 46020acacctatgt tttgtcctag aacgtgccac 4 6080gtacctcatc tcacttaagc taatctgcaa 4 6140caaccgcctc aaatgtctta aggaagtcag 4 6200agaaatctgg gaaaaagctg ccgagaagca 4 6260ctcatctgat gaaagcgaaa ttaaggctgt 4 6320gagtgaggct aatggaactt ctcccatgtc 46380gatgatactt aaccaggggc tctctgccgc 4 6440gccaagttca aaagctgaac tgaactctga 4 6500gcttggttta accgagctgt gaattgcttg 4 6560atccttgatt gtccatggtc agtttcgttg 46620tcatgtaaat tacaaatctt ttgttgttaa 46680gctggtatgt ctcaacaatg gcattaattt 4 6740ttattttgca atttcgcttt tatacagata 46800catatatgca agcaacggtt tgagttgctg 46860ttactcgaag gctacaggga tctcataact 46920ccttcagtgt cactgaaaag acttttgtaa 4 6980ttgaagttac ttcagatgct aagttcgcag 47040ctgtttattt gtttcatgta caataatacc 47100tatactatag ttaaagtatc agtttcaacg 47160ccatcacaaa tatttcaaat taacccgatg 47220gcacgggcca gatgccttcg ggccacaact 47280cattagcccg ttcgattaaa tcagcgtaaa 47340tgaacccatg ccctgattaa agaagggcaa 47400gaacatcatg ctcaaatatt ttaatattga 47460tttataaaat ttaaaaaatt ataatcgtgt 47520acagcccaag cacggcacga cgttcttggc 47580acattggcgc aatggactcg atggtgtttg 47640tttgtcacac taacagtaaa atgaaaggtt 47700acgaagtagc ataatttata tgaagtacat 47760tcacttcata ttttgatata tcttttttat 47820tttgagctca caaactttct cttatttggt 47880atttttgttc gttcagccag tcgttgtgaa 47940tattgtacca agacatattg gatgtagtaa 48000atattatacg gagagcggag acaataaata 48060tatataggta ttgttgtaag ccgtcgcaac 48120tccccacttg tgggaattgt gagattgttt 48180taacataata ttccttttgt taacaccttg 48240tatgttttaa cttttgtatc tggtagaatg 48300gctgctaata tatgcagctt cccagatcag 48360aaatctctta tttacttggc cttcccatga 48420gcaggtcaat tcgtttcttt agcgccttat 48480ctcatctgga tagtttcggc ttgaatacgt 48540acagctaact cctgtgcaaa gatgcggctt 48600ttatttagtt tcagctctct ggttgcaact 48660cctacattct atctagcaag gcagccaatg 48720ggctgtgcgg aagaaacatt tctacaaaca 48780agttaagtca aaagcttgtt ggttggatnn 48840nnnnnnnngt tcnttcttgc gttccgttgn 48900taaannagnn actnaatnnn aagnttatac 48960atattgcacg cctcgatgta ggcctccact 49020cagactttat ttgggtactt tagtattggggtgtgctcat ttttatcctt ggttccgcttatagaacaga agggcaaaag tgagcaaaaaccagcaaaac cgagggcacc actataaaaagagtggaggc ctaaatagag gcttgctaatataaaatatc cactgaaatt agaaaattgaatgagggttc gtccgtcttc caacctgattaaaattgagt gcggtctgtg cccccgctaaggttcacaca tatgtggtgt gattgaagggctgtcttcgc tgaagtgtca ttcagtggtgcagagaacat tacaagttaa cataactgaagcctgcaaca gtcaatttgt tctgattcctgacgagaaaa gcagttctaa gccggttgaacagactgaac ctcattgtgg atggcaatatcagcatgttt tgtccatccc catggcaatgttgaggatca ggggacaagt caatcttgtgtctgaaatat cacatcgagc gattgtgtgtactgaagttt tcatttttct caagtcataagttatggagg ggacaaatag agcaaaatgtgaaaaggaaa cataatctgt tcatccgctgaacctacaac ccattgtcac cgttgctctatgttctaggc ggatggcgac ggcgattagg
gtttttatag tggtgccctc ggttttgctg 4908Ctattttgctc agttttgccc ttccagtgct 4914Caaaacacaac taaggataaa aatgagcaca 4920Cccccaatact aaagtaccca aataaagtct 4926Ctattagacct ttataactac attaaataag 4932Cgtgaggtctg tgcccccgct aagccgtcca 4938Caaataagata aaatatccac taaaattaga 4944Cgccgcccaac ccaaccttga tgaatttcct 4950Cttacacgaaa aacctcacaa ccccgatggc 4956Catcaggaaca aatcccatcc caaactcaag 4962Cgttgaaccag atggtggtca gaatgagaag 4968Ctttgtgcagg ctgctacagg ttgttctcct 4974Cttcgtgcagg atgcatacaa cagaaccatg 4980Cttttttcaat ctctgatact agtaccaagt 4986Cgcatagagat agaactttct ataaatagtc 49920aaatcctaag taatacggag tacaagtttg 49980gcgcgcctac tagctcatga aagtcctggt 50040attatgcagg atgttataac tccacagagg 50100ggatggaaac atagaacaca gcaggctgcg 50160acacaaaagc aagaacctct atttgagtgg 50220ttgggtcttc agaagaaatt ttgactagaa 50280catcgtttct ccttcatgaa 50330
I.a) Número identificador da seqüência: SEQ ID No: 138
II) Características da seqüência:
II.a) tamanho: 507
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA3434
IV) Seqüência: 138
gtcatgtccc ccctcattag aggcgctact ggacatgtgg aagctgccat gttcggctgc 60aacgacgcca cccaggtgta caaggagctg caggaggcca tcaaatccta cccggacgcc 120ttccaccgcg tcatcggctt cgacaacatc aagcagacgc agtgcgtcag cttcatcgcc 180tacaagcccc cgggcagcga ctagaccgcg cccgccggcc gccccccgcc ggctagctag 240ctagctagct cctgcgtgag ctagtagcta gctagtgcca tgcgtcgtct ctgtcgttcg 300gttttgcttc ggggtcaccg tgtacccttt gcttgcttgg tttcttcttt ccttttttcc 360tttttttttt cttcttttcc ccggccatgg ttcctttgct ttccagcagt tctctgctgg 420atgtaatgta tccattgttg caagcatggc cttgcattgg ctacctctat acctgctaaa 480aaactactgc aaatggtcat agctgtc 507I.a) Número identificador da seqüência: SEQ ID No: 139
II) Características da seqüência:II.a) tamanho: 650
Il.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Seqüênciaconsenso processada de MZA2591
IV) Seqüência: 139
asggtaccaa ctaaaagggc ctggaatcat ggaagcccac aataaccagg agcgagctac 60ctgcgaagcc acatctctcc ttcctcttca tcgatagtac tcatctccat attcaggtaa 120ataacatcgt ctgcatgccg cgcgccccta atagcatctc gatcacattt ttgtgttctt 180gacttctcct cggaagcctt cttgtttaac aaacttatat tagtcgttgg tcgatctttg 240gacccacatg taaatcttgg ttcgcgtccg ccgtgcagtg cagaggcaca agctaagcca 300tgagcaacgg tggtaaccgc agcaggggcg gcgcgaggtt cgagctgcag ctgcacctgt 360cgccgccgcc gcccgtggct aggagggtgt aggtttactg cgtatgctac tgcagcgact 420cgtcttcttc cccgagctcg tgcgtgtcgt ctgactgcat tccagggagc aattcgccga 480ttgtaatcgg cgcctgcacg cggtgcatga tgtactgcat ggtgtccaag aatgacttcc 540ccacctgcat caactgcaag cagccctgcc tcgtgtacct cctccactgc tcttggcccc 600tgctgcagcg gcaccggcaa ggccaattaa aakgacttca acctttcgta 650
I.a) Número identificador da seqüência: SEQ ID No: 140
II) Características da seqüência:
II.a) tamanho: 731
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA11123
IV) Seqüência: 140
tcaaatcctg gggggaaacc ttccgggtgg gtcattgcaa aatgggcagt ttatgggctc 60cttaatgatg gggggtcacg gttcgggggt tttttcggcc gggaccatgt ttcggtctct 120tcttaatata ataccgggag gcagtttttc ctcctccccg gccgcgtttt ttagtgtaaa 180tatgcaaatg taccatcttg attggcttct atgatctaca ttttagtgta ggctgcaagt 240ccacgagctt tgaaaagtta cacaatctgg attatttgca agtcgtaaac acttatagga 300ctcagtgact agattggacc agcctgttgc attcatgcaa ttgttaggct aattgtcatt 360tcaccttcag tctacaatga aatggttaac atagtgcatg gatttcttcc attggtacat 420caataataat atccaacagc gctaatgaga tgtacgtctt gtttccagat gttacagatc 480caactgcaaa tggtgcagcg tggcgctgct gggccgccca gtaacgagaa tactgagcac 540acagaagaat gactgaatct gtgaacagac acttctgcat cgtggtgtaa taataaggag 600aatactgatg agcacacacg ctgaagaatc tgtaaatagg cggcgatgag gatgggacaa 660aagaaagcca aggattggcg atacctgggc tggggaaact gtacgggtaa aaacttaata 720agggggttta a 731
I.a) Número identificador da seqüência: SEQ ID No: 141
II) Características da seqüência:
II.a) tamanho: 704
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial.
III) Características:
III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA15842
IV) Seqüência: 141
taaccacccg cctggctaat tgttccgacc atttttatag cctgcatggc ttacattgtc 60
ttcacgaggg tcaacaggat attcagattg cgcatttgga cttaaaacca gcaaatatat 120
tacttgacag tgacatggtt cctaaacttg ctgattttgg tatgtcaagg ctcttcagtc 180
tcgaacaagt ttatatcctt gcttccaagc ctatgggaac aatgtaagct cattaagttt 240
actgaatgtg ctttcttgat cttatatggc ttgcaacacc tttgaaactt atttggttta 300
aaagacacat ttaattttcc ttcattagta catgtgtcct gaagtataag gaaaccttag 360
ttcgttaact caaaagattt ctatttggct aagtttatag agaagagtat tagcatatac 420
catattaaaa agctagctat gaaaatatat ttcatagtgg gtttaatgat gatcatttga 480
tactccctct gccccaattt ataatccgtt taactttttt actctaagtt tgatcgactc 540
gtcttattca aaacttatgc gagaaaatgg aaaattcaaa gccatactta aagcatatta 600
tatgctaaat gacatcacag taaaaattaa taacaattat gattttttta ataggacgaa 660
ttggtcaaag ttagggtaaa aaagtcaaac aaattataaa ttgg 704
I.a) Número identificador da seqüência: SEQ ID No: 142
II) Características da seqüência:
II.a) tamanho: 665
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA1851
IV) Seqüência: 142
aaaaaggaaa tttttttttt taaaaaaaac ggaggctcta acagggctct gggtagtggc 60ccaaactgtg ccaatatgga taatggaaga ttcttggggc agagtattaa gggaagttgt 120ttttttcttc ttcttttggt tggtcttttt aagctgaatg gatgacatga ttgcctatgt 180tatgtattgg gtaattttag ttgtcaaaat atatctttac agctatacgc tatcgctgtg 240ctctgagcac ctcaaaacat ccaggtgatgatgggacttt tttcgaagag ggccattcttccacaactgt ttccgcttga tggcaacaatattcatatgg atatggtcga actgacttgctattttgagc otatgatggt tccctttggcggcttcaatc atactggtgc aatttacgagtgcagacagc agatccgcat gtcttggagaggaaa
acatctacac atggggttgg ggaggcgcca 300ccggtggaca gctggtgagt tgctttcaga 360gtgcggcatg cataatcccc acaggacacc 420tacttgcagg gacatggaaa cgacgtagac 4 80acgaatgcca gagccgtcca tgtatcgtgt 540tgctccgagg actttgactg acgtgagact 600cttaggttag ttatcaaata tactcgctga 660
I.a) Número identificador da seqüência: SEQ ID No: 143
II) Caracteristicas da seqüência:
II.a) tamanho: 698
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA8761
IV) Seqüência: 143
tgccaaaggg ggaacagtta aggctttata gaagggraag atttggttca ggtaactggg 60ctcacatttg ttactatttg gaatcatagg ggttcaagca tttaaaaaga actgggatcc 120ctaccaccag tttggagtgt tccacaaata cacttttatg tccttgggca tcgccaaggg 180ctgctttttt ttctttgggt attcctgtta actcagatgc tcaaaaattg ggacaatatt 240gacatgccct cttgattaga agtgtttgta gtttgtaatt tgcatcttat actttcatga 300gtactcgagc cattgttgtg ttctcagttg atgtaatttc attatttaaa cttcttgttg 360ggttgtctaa tggaatgcaa aaaaaatact tgaaaaatga cagatagcag atccagcagc 420aattgaggca atggtagata aagtaattgc tgataatcca aagcaacttg agcagtaccg 4 80tgctggaaaa actaagctac aaggattttt tgctggccag gtttgtcaat tgatgactag 540cactgtttgt cccttcagct aggatgtatt atcagtgatc atatttgttt caattgatta 600taggtgatga aagcatcgaa gggaaggcca acccagtttt gttgaataaa attcttgaaa 660aattcttgga gagaagtttt tgctaaattt tatataaa 698
I.a) Número identificador da seqüência: SEQ ID No: 144
II) Caracteristicas da seqüência:
II.a) tamanho: 521
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA11455IV) Seqüência: 144
ttgaggcaat ttaaataagc attgcaggga aggcccagta caaacgttca accttctgac 60
tgacacatgt tgtggaacta accctcagca taggagcaag agaaaaatga ctgggaagag 120
aatgactggg aagagagatt gtttgcatgc acgtagcaga tatctgagag ctacagagga 180
aagctgggaa atagaagaag ctctaaaaca aggagtgttt ctggaaattc tttagttttc 240
aaaaaacact ttctgaaaat gtgtgtacaa gaaaattcca ggaaggtgaa attgcttcgt 300
tgactgcagt gggaagggga aagagagaag ctagaatctc atgtcgagta atccagtaca 360
atgtgttctt ttgtctggtc taaattcttg taacagctct tcctatgatg gaagaatcca 420
ttcaacaatt ccacctatga ttactggatt gagtatgttg aataggttgg ttgaggctat 480
ctagtaattt tatgactatt taatttattt ataactattt a 521
I.a) Número identificador da seqüência: SEQ ID No: 145
II) Características da seqüência:
II.a) tamanho: 18
Il.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer dooligonucleotideo C00060-01-F1
IV) Seqüência: 145
ggtcttcgcc ggcctttc 18
I.a) Número identificador da seqüência: SEQ ID No: 146
II) Características da seqüência:
II.a) tamanho: 25
II. b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer dooligonucleotideo C00060-02-F1
IV) Seqüência: 146ggtcagtagc taattcttgc agctc 25I.a) Número identificador da seqüência: SEQ ID No: 147
II) Características da seqüência:
II.a) tamanho: 17
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer dooligonucleotideo C00060-01-F-Taq
IV) Seqüência: 147tcttcgccgg cctttct 17
I.a) Número identificador da seqüência: SEQ ID No: 148
II) Características'da seqüência:
II.a) tamanho: 2 6
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer dooligonucleotideo C00060-02-F-Taq
IV) Seqüência: 148cagagcaatt gtttatcaag aaagct 26
I.a) Número identificador da seqüência: SEQ ID No: 149
II) Características da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer dooligonucleotideo C00060-01-R1IV) Seqüência: 149
gggaccgtcg atgccgac 18
I.a) Número identificador da seqüência: SEQ ID No: 150
II) Caracteristicas da seqüência:
II.a) tamanho: 29
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Caracteristicas:
III.l.c) outra informação relevante: Primer dooligonucleotídeo C00060-02-R1
IV) Seqüência: 150
tttcctcaag aattggccca tagtaacaa 29
I.a) Número identificador da seqüência: SEQ ID No: 151
II) Caracteristicas da seqüência:
II.a) tamanho: 22
II. b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Primer dooligonucleotídeo C00060-01-R-Taq
IV) Seqüência: 151
gcggatcaga tacagacgaa ca 22
I.a) Número identificador da seqüência: SEQ ID No: 152
II) Caracteristicas da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Caracteristicas:III.l.c) outra informação relevante: Primer dooligonucleotídeo C00060-02-R-Taq
IV) Seqüência: 152ggttgaccat cacatttctt caga 24
I.a) Número identificador da seqüência: SEQ ID No: 153
II) Características da seqüência:
II.a) tamanho: 25
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer dooligonucleotídeo FLP111RB
IV) Seqüência: 153caggttatac tcgaccggaa tcaaa 25
I.a) Número identificador da seqüência: SEQ ID No: 154
II) Características da seqüência:
II.a) tamanho: 30
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda dooligonucleotídeo C00060-01-PCA
IV) Seqüência: 154acggacgcgg aggaacagga agacgattca 30
I.a) Número identificador da seqüência: SEQ ID No: 155
II) Características da seqüência:II. a) tamanho: 2 9
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda dooligonucleotideo C00060-02-PCA
IV) Seqüência: 155
acggacgcgg agctcgaccg gaatcaaaa 29
I.a) Número identificador da seqüência: SEQ ID No: 156
II) Características da seqüência:
II.a) tamanho: 2 6
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Sonda dooligonucleotideo C00060-01-P-Taq
IV) Seqüência: 156
cctctacccg gcacactgaa tcgtct 26
I.a) Número identificador da seqüência: SEQ ID No: 157
II) Características da seqüência:
II.a) tamanho: 32
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda dooligonucleotideo C00060-02-P-Taq
IV) Seqüência: 157
cccaacaaaa tattcaggtt atactcgacc ggI.a) Número identificador da seqüência: SEQ ID No: 158
II) Caracteristicas da seqüência:
II.a) tamanho: 259
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0001-01
IV) Seqüência: 158tttagaaact cagctagtgc ttttggcaac caaaccccac agccaaacag ctgcatgtct 60agaggtagag gagtagactc ctcacaccgg gtaagtctag ctgagtatta gtatactcag 120ccttgcttgt ggcataattt ttacaggttc tctggaggaa atggttgctg gagtgacttg 180gccgtccatc ttgccaccgg gttggactgt cgagtgggac cctgccttgg ctgaggagga 240gcatgaggag tgatgggac 259
I.a) Número identificador da seqüência: SEQ ID No: 159
II) Caracteristicas da seqüência:
II.a) tamanho: 34
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Oligo
Invader para Marcador PHD0001-01
IV) Seqüência: 159tgccacaagc aaggctgagt atactaatac tcat 34
I.a) Número identificador da seqüência: SEQ ID No: 160
II) Caracteristicas da seqüência:
II.a) tamanho: 26
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: SondaInvader para Marcador PHD0001-01IV) Seqüência: 160cgcgccgagg gctagactta cccggt 26
I.a) Número identificador da seqüência: SEQ ID No: 161
II) Características da seqüência:II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer de
oligonucleotideo Forward para MarcadorPHD0001-01
IV) Seqüência: 161
tagtgctttt ggcaaccaaa cc 22
I.a) Número identificador da seqüência: SEQ ID No: 162
II) Características da seqüência:
II.a) tamanho: 22
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para Marcador
PHD0001-01
IV) Seqüência: 162
ccatttcctc cagagaacct gt 22
I.a) Número identificador da seqüência: SEQ ID No: 163
II) Características da seqüência:
II.a) tamanho: 259
Il.b) tipo: DNAII. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0002-01
IV) Seqüência: 163
ggcttcccca tctctctatt tatttaccgt tagtttattt ccgctgcact tcgaacaatg 60atggttactt ttgcaaaaac tccgaggatg atgatgatgg tgatgtaata atttaatact 120ctgacatgta tggttttatg ctttattgta tttgctctgt gactcacctt cgagtgagat 180tgtggtactt gatcctgtca gtggccgtgt cggactagat ccgagggatt gacgggttat 240tcccaattaa gtgtggtct 259
I.a) Número identificador da seqüência: SEQ ID No: 164
II) Características da seqüência:
II.a) tamanho: 36
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Oligo
Invader para Marcador PHD0002-01
IV) Seqüência: 164ggccactgac aggatcaagt accacaatct cactct 36
I.a) Número identificador da seqüência: SEQ ID No: 165
II) Características da seqüência:
II.a) tamanho: 27
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0002-01
IV) Seqüência: 165cgcgccgagg gaaggtgagt cacagagI.a) Número identificador da seqüência: SEQ ID No: 166
II) Características da seqüência:
II.a) tamanho: 23
Il.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer de
oligonucleotideo Forward para MarcadorPHD0002-01
IV) Seqüência: 166ggatgatgat gatggtgatg taa 23
I.a) Número identificador da seqüência: SEQ ID No: 167
II) Características da seqüência:
II.a) tamanho: 22
II. b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para Marcador
PHD0002-01
IV) Seqüência: 167
ccgtcaatcc ctcggatcta gt 22
I.a) Número identificador da seqüência: SEQ ID No: 168
II) Características da seqüência:
II.a) tamanho: 269
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0003-01IV) Seqüência: 168
acgctgctgc gacaaggccc tcgcccgcataagccgaaga gccggaggtc cgaccgcaggcacctcagca ccgacgacgg cagccacctggtgctcggtt ggcactgttg ggtcatgcgcgcagtcgaga aggcgcggga ggaggcgcg
ccccactcga ggggcgagga caagctatca 60tggcgccgag aaaccttctc tggctgccac 120cccaccaaca cccgccgggc cgtgaccaat 180agggttgcct cgagtcgcgg caccggttcc 240
I.a) Número identificador da seqüência: SEQ ID No: 169
II) Características da seqüência:
II.a) tamanho: 21
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: OligoInvader para Marcador PHD0003-01
IV) Seqüência: 169
tggctgccgt cgtcggtgct t 21
I.a) Número identificador da seqüência: SEQ ID No: 170
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0003-01
IV) Seqüência: 170cgcgccgagg gaggtggtgg cagc 24
I.a) Número identificador da seqüência: SEQ ID No: 171
II) Características da seqüência:
II.a) tamanho: 22II.b) tipo: DNAII. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0003-01
IV) Seqüência: 171
ggacaagcta tcaaagccga ag 22
I.a) Número identificador da seqüência: SEQ ID No: 172
II) Características da seqüência:
II.a) tamanho: 2 0
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Primer de
oligonucleotideo Reverso para MarcadorPHD0003-01
IV) Seqüência: 172
caaccgagca cattggtcac 20
I.a) Número identificador da seqüência: SEQ ID No: 173
II) Características da seqüência:
II.a) tamanho: 279
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Seqüência
SNP para Marcador PHD0004-01
IV) Seqüência: 173
cacgaacacc ccaaaccaca tgccgaggct gtagagtcgc cccagggttg aatcgaccga 60
ggcggtcatt tctcccctga ccacggcgaa gagcggcacg gtgcgcaact ggttttcctg 120
atagtgggca ccggcgtgaa attaggccgc caactcgcgc cccgatgcac cgacccacaa 180
tcgccaaggc ttctgctgcg caaacgagtt ccccgctgtg atggccgaag cacagcacag 240
caggtggacg gcagcggacc agtcgcggcg gcgcacaga 279I.a) Número identificador da seqüência: SEQ ID No: 174
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: OligoInvader para Marcador PHD0004-01
IV) Seqüência: 174tggcggccta atttcacgcc ggtt 24
I.a) Número identificador da seqüência: SEQ ID No: 175
II) Características da seqüência:
II.a) tamanho: 28II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0004-01
IV) Seqüência: 175cgcgccgagg gcccactatc aggaaaac 28
I.a) Número identificador da seqüência: SEQ ID No: 176
II) Características da seqüência:II.a) tamanho: 21
II. b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0004-01
IV) Seqüência: 176ggtcatttct cccctgacca c 21I.a) Número identificador da seqüência: SEQ ID No: 177
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.1.c) outra informação relevante: Primer de
oligonucleotideo Reverso para MarcadorPHD0004-01
IV) Seqüência: 177agcagaagcc ttggcgatt 19
I.a) Número identificador da seqüência: SEQ ID No: 178
II) Características da seqüência:
II.a) tamanho: 300
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0005-01
IV) Seqüência: 178
ttggggcgag cagggaggag aagaggaacaaggaggggac gaacaggtca cgctggcgcgaggacgttaa ccgggcggcg ctagaatcctgcggcgggca ggtgtgccgc cagcgctgtataggggtccg cgatttccgt gaatcgggca
gcggcttcgg gtgttatagg cgcagggtaa 60atgccgcacc tatatgacga gtccgggctg 120ggggcttcgg cagaggccgt tgcgggagta 180cgcggggtcg gggcacggag gttgttgcgc 240cgagctcacc agcgccaccg gttttgcgca 300
I.a) Número identificador da seqüência: SEQ ID No: 179
II) Características da seqüência:
II.a) tamanho: 23
Il.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: OligoInvader para Marcador PHD0005-01IV) Seqüência: 179cgctactccc gcaacggcct ctt 23
I.a) Número identificador da seqüência: SEQ ID No: 180
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0005-01
IV) Seqüência: 180cgcgccgagg gccgaagccc ca 22
I.a) Número identificador da seqüência: SEQ ID No: 181
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0005-01
IV) Seqüência: 181ctatatgacg agtccgggct ga 22
I.a) Número identificador da seqüência: SEQ ID No: 182
II) Características da seqüência:
II.a) tamanho: 19II.b) tipo: DNA
II.c) organismo: Seqüência artificialIII) Características:
III.1.c) outra informação relevante: Primer deoligonucleotídeo Reverso para MarcadorPHD0005-01
IV) Seqüência: 182acccctagcg caacaacct 19
I.a) Número identificador da seqüência: SEQ ID No: 183
II) Características da seqüência:
II.a) tamanho: 290
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Seqüência
SNP para Marcador PHD0006-01
IV) Seqüência: 183
cgaagcggag gaaatgtagg gagggagaag aagaccactg ccggctgggt ggataagtta 60gctgggtgac cctggaatgt ggggcccgcc tggcggcgac gcgaaggcca cacgagcgag 120tgaggggcgt tgggtcgtgc ggtatcggaa aaaaaagaat gggccgaaag tgaggattcg 180gcccaagtag tgttttattg tttttctttt tcttattttt tttcaaattc aactttaaat 240tcccatttaa attcaaattt agtggtggat ctatcttcac attaatttcc 290
I.a) Número identificador da seqüência: SEQ ID No: 184
II) Características da seqüência:
II.a) tamanho: 23
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Oligo
Invader para Marcador PHD0006-01
IV) Seqüência: 184
tcgctcgtgt ggccttcgcg tct 23I.a) Número identificador da seqüência: SEQ ID No: 185
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0006-01
IV) Seqüência: 185cgcgccggg gccgccaggc g 21
I.a) Número identificador da seqüência: SEQ ID No: 186
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotídeo Forward para MarcadorPHD0006-01
IV) Seqüência: 186ggctgggtgg ataagttagc tg 22
I.a) Número identificador da seqüência: SEQ ID No: 187
II) Características da seqüência:
II.a) tamanho: 21
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotídeo Reverso para MarcadorPHD0006-01IV) Seqüência: 187cactttcggc ccattctttt t 21
I.a) Número identificador da seqüência: SEQ ID No: 188
II) Caracteristicas da seqüência:II.a) tamanho: 300
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Seqüência
SNP para Marcador PHD0007-01
IV) Seqüência: 188
caacttaaac atggcatggg tgaacttatttgctatgttt ctccaaatta gagtttaaatggtactaaca catttatttt actatccacatgcataattt atttgagtgt cttctattaagaaatggtaa atagggataa cccacacaca
tattttcaat atttatttta ttaaaactag 60gctatgtgtc ccttaatata ttaatatatg 120aatgcacaat caagtaaaaa ctcagcatga 180ttatttattg tatagatgag gtgtccacat 240tgtaaaggaa tataatctct ccttttagat 300
I.a) Número identificador da seqüência: SEQ ID No: 189
II) Caracteristicas da seqüência:
II.a) tamanho: 58
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. 1.c) outra informação relevante: Oligo
Invader para Marcador PHD0007-01
IV) Seqüência: 189
tttctccaaa ttagagttta aatgctatgt gtcccttaat atattaatat atgggtat 58
I.a) Número identificador da seqüência: SEQ ID No: 190
II) Caracteristicas da seqüência:
II.a) tamanho: 36
II.b) tipo: DNAII.c) organismo: Seqüência artificial
III) Características:
III.1.c) outra informação relevante: Sonda
Invader para Marcador PHD0007-01
IV) Seqüência: 190
cgcgccgagg ctaacacatt tattttacta tccaca 36
I.a) Número identificador da seqüência: SEQ ÍD No: 191
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0007-01
IV) Seqüência: 191
ttaaacatgg catgggtgaa ct 22
I.a) Número identificador da seqüência: SEQ ID No: 192
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer de
oligonucleotideo Reverso para MarcadorPHD0007-01
IV) Seqüência: 192tgcatcatgc tgagttttta cttg 24I.a) Número identificador da seqüência: SEQ ID No: 193
II) Características da seqüência:
II.a) tamanho: 274
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Seqüência
SNP para Marcador PHD0008-01
IV) Seqüência: 193
cggcggccac aagtcagtcg ccgaaaattagccgaaaata acaagtgccg aaaatagtattacaataaca gaaaattcat acttgagtccaaagtccaca aatagtccat acaaacataatgccgcacaa agctaactcc atcacatatc
cctgttcttt tcggtgggcc tctgacggcc 60ttaaaaatac aaaaaataac agaaaattca 120acaacataaa acttaagtcc atacaaacat 180agtccacaaa tagtccatta caaagcacaa 240gggg 274
I.a) Número identificador da seqüência: SEQ ID No: 194
II) Características da seqüência:
II.a) tamanho: 51
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Oligo
Invader para Marcador PHD0008-01
IV) Seqüência: 194
tttgtatgga ctatttgtgg actttatgtt tgtatggact taagttttat t 51
I.a) Número identificador da seqüência: SEQ ID No: 195
II) Características da seqüência:
II.a) tamanho: 29
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0008-01IV) Seqüência: 195cgcgccgagg gttgtggact caagtatga 29
I.a) Número identificador da seqüência: SEQ ID No: 196
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0008-01
IV) Seqüência: 196cgaaaataac aagtgccgaa aa 22
I.a) Número identificador da seqüência: SEQ ID No: 197
II) Características da seqüência:
II.a) tamanho: 23
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0008-01
IV) Seqüência: 197ggcattgtgc tttgtaatgg act 23
I.a) Número identificador da seqüência: SEQ ID No: 198
II) Características da seqüência:
II.a) tamanho: 259
II.b) tipo: DNAII. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Seqüência
SNP para Marcador PHD0009-01
IV) Seqüência: 198
cgttggagtt gtgtccacta ccttcagaag cgaaaaactc gttgacgaag tcgtgtaacg 60ggtttagatt ctaaagaaaa aagaagacat taataacgat attagttaca tgtatgacca 120ctattcaaac aaattgtttc tcaaactaac ctctcatgga gtagctccct cccctgcata 180tgctcctcct ggtgctggta tgagcggtgg tggcgtgttg tggcccatga ccccggatcc 240ctacaaaatc aagtttagt 25 9
I.a) Número identificador da seqüência: SEQ ID No: 199
II) Características da seqüência:
II.a) tamanho: 49
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Oligo
Invader para Marcador PHD0009-01
IV) Seqüência: 199
gggagctact ccatgagagg ttagtttgag aaacaatttg tttgaatat 49
I.a) Número identificador da seqüência: SEQ ID No: 200
II) Características da seqüência:
II.a) tamanho: 34
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Sonda
Invader para Marcador PHD0009-01
IV) Seqüência: 200
cgcgccgagg gtggtcatac atgtaactaa tatc 34I.a) Número identificador da seqüência: SEQ ID No: 201
II) Características da seqüência:
II.a) tamanho: 2 4
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0009-01
IV) Seqüência: 201aagtcgtgta acgggtttag attc 24
I.a) Número identificador da seqüência: SEQ ID No: 202
II) Características da seqüência:
II.a) tamanho: 19
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0009-01
IV) Seqüência: 202cagcaccagg aggagcata 19
I.a) Número identificador da seqüência: SEQ ID No: 203
II) Características da seqüência:
II.a) tamanho: 250
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0010-01IV) Seqüência:
aaagatttga aattagattgtggaggtggc ggagcatgtaaaatggttgt tgttgtgccttatagaacca atatcgagcgggcctgtgcg
203
atacaaacga caagtcttaaatccccactg aggcatcgacgctgtggaaa ccaagaccgttgttgagaag aaataagaca
ctaaattgaa gcacctgagg 60ggctgaaact gagggaaaac 120tgcaaatata atatgttagt 180ctcacgttca ttgcttgttg 240
250
I.a) Número identificador da seqüência: SEQ ID No: 204
II) Caracteristicas da seqüência:
11.a) tamanho: 34
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Oligo
Invader para Marcador PHD0010-01
IV) Seqüência: 204
gcaggcacaa caacaaccat ttgttttccc tcat 34
I.a) Número identificador da seqüência: SEQ ID No: 205
II) Caracteristicas da seqüência:
II.a) tamanho: 26
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0010-01
IV) Seqüência: 205
cgcgccgagg gtttcagccg tcgatg 26
I.a) Número identificador da seqüência: SEQ ID No: 206
II) Caracteristicas da seqüência:
II.a) tamanho: 22
II.b) tipo: DNAII.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0010-01
IV) Seqüência: 206ggagcatgta atccccactg ag 22
I.a) Número identificador da seqüência: SEQ ID No: 207
II) Características da seqüência:
II.a) tamanho: 22
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0010-01
IV) Seqüência: 207tctcaacacg ctcgatattg gt 22
I.a) Número identificador da seqüência: SEQ ID No: 208
II) Características da seqüência:
II.a) tamanho: 259
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0011-01
IV) Seqüência: 208atttccggcg gttgtggcag gccgccaaaa atagcagata attttcggcg gctataggtg 60ggccatcgaa aattacattg gccgccgaaa atgttcaaca gtgttgttgt gatagcaacc 120aacaggtatg agccacaata ctacacattg caacttggga aagtaattta ctggtcacca 180tatttccgaa tagctggtta tgatatgata tttacaaatc ttccaattca ttccttcagc 240ttaaatgaat ctcattaat 259I.a) Número identificador da seqüência: SEQ ID No: 209
II) Características da seqüência:
II.a) tamanho: 40
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Oligo
Invader para Marcador PHD0011-01
IV) Seqüência: 209
agttgcaatg tgtagtattg tggctcatac ctgttggttt 40
I.a) Número identificador da seqüência: SEQ ID No: 210
II) Características da seqüência:
I.a) tamanho: 2 9
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante:
Invader para Marcador PHD0011-01
IV) Seqüência: 210cgcgccgagg gctatcacaa caacactgt
Sonda
29
I.a) Número identificador da seqüência: SEQ ID No: 211
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer de
oligonucleotideo Forward para MarcadorPHD0011-01
IV) Seqüência: 211taggtgggcc atcgaaaatt ac 22I.a) Número identificador da seqüência: SEQ ID No: 212
II) Caracteristicas da seqüência:
II.a) tamanho: 2 4
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0011-01
IV) Seqüência: 212ttcggaaata tggtgaccag taaa 24
I.a) Número identificador da seqüência: SEQ ID No: 213
II) Caracteristicas da seqüência:
II.a) tamanho: 2 69
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0012-01
IV) Seqüência: 213ttgtaaaaaa caaggttttg taaatggattttcaatcacg cacaattgct atgctgacagtaataataat gagacccttc atgatcttgtgcatagcagt gcccaccatt ttctaccgagatggacaaca gcttcgtgtg ttgtccatc
tatttttatg ctcaaactta aattgaacaa 60aagtttatga caagtttgag cataatgttg 120tgttattcca catttccatc tctcctcgaa 180tcagcaacaa taatctaggc tgaaagaaca 240
I.a) Número identificador da seqüência: SEQ ID No: 214
II) Caracteristicas da seqüência:
II.a) tamanho: 51
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: OligoInvader para Marcador PHD0012-01
IV) Seqüência: 214gtggaataac aacaagatca tgaagggtct cattattatt acaacattat t
I.a) Número identificador da seqüência: SEQ ID No: 215
II) Características da seqüência:
II.a) tamanho: 31
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: SondaInvader para Marcador PHD0012-01
IV) Seqüência: 215cgcgccgagg gctcaaactt gtcataaact t 31
I.a) Número identificador da seqüência: SEQ ID No: 216
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0012-01
IV) Seqüência: 216
tcaatcacgc acaattgcta tg 22
I.a) Número identificador da seqüência: SEQ ID No: 217
II) Características da seqüência:
II.a) tamanho: 22
II.b) tipo: DNAII. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0012-01
IV) Seqüência: 217agaaaatggt gggcactgct at 22
I.a) Número identificador da seqüência: SEQ ID No: 218
II) Características da seqüência:
II.a) tamanho: 259
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0013-01
IV) Seqüência: 218
tacaatattt gcctatggtg ttacaaggag tggaaagata catacgatgc atgtgggaaa 60acttattaca atatttttcc tttaataagt tttacctttg tagagtgtat gtttctagtc 120ataggctttg aagtatgcct catgctacca attaacatgc aaaaacttgg actaatctta 180ctgatactaa gatctaacat agttgtcaac ctccttggtt ggacatttta gttgcttttg 240ttgtattaag cttttaatt 259
I.a) Número identificador da seqüência: SEQ.ID No: 219
II) Características da seqüência:
II.a) tamanho: 4 5
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Oligo
Invader para Marcador PHD0013-01
IV) Seqüência: 219
ccaagttttt gcatgttaat tggtagcatg aggcatactt caaatI.a) Número identificador da seqüência: SEQ ID No: 220
II) Características da seqüência:
II.a) tamanho: 31
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante:
Invader para Marcador PHD0013-01
IV) Seqüência: 220cgcgccgagg gcctatgact agaaacatac a
Sonda
31
I.a) Número identificador da seqüência: SEQ ID No: 221
II) Características da seqüência:
II.a) tamanho: 22
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Primer de
oligonucleotídeo Forward para MarcadorPHD0013-01
IV) Seqüência: 221
acatacgatg catgtgggaa aa 22
I.a) Número identificador da seqüência: SEQ ID No: 222
II) Características da seqüência:
II.a) tamanho: 22
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotídeo Reverso para MarcadorPHD0013-01IV) Seqüência: 222aatgtccaac caaggaggtt ga
I.a) Número identificador da seqüência: SEQ ID No: 223
II) Caracteristicas da seqüência:II.a) tamanho: 269
II.b) tipo: DNA
II. c) organismo: Seqüência artificiai
III) Caracteristicas:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0014-01
IV) Seqüência: 223
attggatttg tggtggggtg cgtgggcggg catcacgcgt ggcgatggca ctggaagcac 60ggggaacagg gcaggtgtag ggtgggggca ggcgatggaa tggcgcggca tgcttgcggc 120cgattgtcct tgcgtggatg gaggggattg cgggctcgag gatgaggatg gcgggatgcg 180cgcgcctttc gtcgatcgaa cgtgggcacg ggacgaggat tgcattgcgc ggccacgcgg 240gggcgagatt ggcgtcgtcg gtgggatgt 269
I.a) Número identificador da seqüência: SEQ ID No: 224
II) Caracteristicas da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Caracteristicas:
III. l.c) outra informação relevante: OligoInvader para Marcador PHD0014-01
IV) Seqüência: 224ccgccatcct catcctcgag ccct 24
I.a) Número identificador da seqüência: SEQ ID No: 225
II) Caracteristicas da seqüência:
II.a) tamanho: 25
II.b) tipo: DNAII.c) organismo: Seqüência artificial
III) Características:
III.1.c) outra informação relevante: Sonda
Invader para Marcador PHD0014-01
IV) Seqüência: 225
cgcgccgagg gcaatcccct ccatc 25
I.a) Número identificador da seqüência: SEQ ID No: 226
II) Características da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II.c) organismo: Seqüência artificial
III) Características:
III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0014-01
IV) Seqüência: 226
cttgcggccg attgtcct 18
I.a) Número identificador da seqüência: SEQ ID No: 227
II) Características da seqüência:
II.a) tamanho: 18
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. 1.c) outra informação relevante: Primer de
oligonucleotideo Reverso para MarcadorPHD0014-01
IV) Seqüência: 227accgacgacg ccaatctc 18I.a) Número identificador da seqüência: SEQ ID No: 228
II) Características da seqüência:
II.a) tamanho: 210
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0015-01
IV) Seqüência: 228
aattgctatt ttagcccttc taacgtgggc tctctgctat tatgtgaccc tctgtctatg 60acttgtgtga ccatttgtgt ctatgatttg tgggactggt ggtaaaatag agaagttcac 120aactgagagt gacaaaatag caaattctcc cacgggggcg ggggcacgac gcaccagtgt 180ggacgtccac actatagcct tatagagtag 210
I.a) Número identificador da seqüência: SEQ ID No: 229
II) Características da seqüência:
II.a) tamanho: 39
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: OligoInvader para Marcador PHD0015-01
IV) Seqüência: 229cccgtgggag aatttgctat tttgtcactc tcagttgtt 39
I.a) Número identificador da seqüência: SEQ ID No: 230
II) Características da seqüência:
II.a) tamanho: 32
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Sonda
Invader para Marcador PHD0015-01IV) Seqüência: 230cgcgccgagg gaacttctct attttaccac ca
I.a) Número identificador da seqüência: SEQ ID No: 231
II) Características da seqüência:
II.a) tamanho: 24
II.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0015-01
IV) Seqüência: 231
tgacttgtgt gaccatttgt gtct 24
I.a) Número identificador da seqüência: SEQ ID No: 232
II) Características da seqüência:
II.a) tamanho: 19
Il.b) tipo: DNA
II. c) organismo: Seqüência artificial
III) Características:
III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0015-01
IV) Seqüência: 232gtccacactg gtgcgtcgt 19
Claims (111)
1. Polinucleotideo isolado, caracterizado pelo fato deque compreende um polinucleotideo selecionado do grupoconsistindo de:(a) uma seqüência de nucleotideos codificante de umpolipeptideo que confere resistência aColletotrichum, sendo que o polipeptideo possuiuma seqüência de aminoácidos com pelo menos 75%de identidade quando comparada à SEQ ID No.:3 combase no algoritmo de alinhamento de Needleman-Wunsch;(b) um complemento da seqüência de nucleotideos,sendo que o complemento e a seqüência denucleotideos consistem do mesmo número denucleotideos e são 100% complementares, e(c) uma seqüência de nucleotideos codificante de umpolipeptideo que confere ou aperfeiçoa aresistência a Colletotrichum, sendo que opolipeptideo possui uma seqüência de aminoácidoscom identidade de pelo menos 75% quando comparadaà seqüência do plasmidio depositado como Depósitode Patente No. NRRL B-30895 com base no algoritmode alinhamento de Needleman-Wunsch.
2. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de aminoácidosdo polipeptideo e a seqüência de aminoácidos da SEQ ID No.: 3 possuem pelo menos 90% de identidade baseada no algoritmode alinhamento de Needleman-Wunsch.
3. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de aminoácidosdo polipeptideo e a seqüência de aminoácidos da SEQ ID No.: 3 possuem pelo menos 95% de identidade baseada no algoritmode alinhamento de Needleman-Wunsch.
4. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de nucleotideoscompreende a SEQ ID No.: 3.
5. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de nucleotideoscompreende a seqüência do plasmidio depositado comoDepósito de Patente No. NRRL B-30895.
6. Vetor, caracterizado pelo fato de que compreende opolinucleotideo como definido na reivindicação 1.
7. Constructo de DNA recombinante, caracterizado pelofato de que compreende o polinucleotideo como definido nareivindicação 1, operacionalmente ligado a pelo menos umaseqüência de regulação.
8. Processo para transformar uma célula hospedeira,caracterizado pelo fato de que compreende a transformaçãoda célula hospedeira com o polinucleotideo como definido nareivindicação 1.
9. Processo de acordo com a reivindicação 8,caracterizado pelo fato de que a célula hospedeira é umacélula de planta.
10. Processo de acordo com a reivindicação 9,caracterizado pelo fato de que a célula de planta é oriundade milho.
11. Célula de planta, caracterizada pelo fato de quecompreende o constructo de DNA recombinante como definidona reivindicação 7.
12. Célula de planta, caracterizada pelo fato de quecompreende o polinucleotideo como definido na reivindicação 1 .
13. Célula de planta de acordo com a reivindicação 12,caracterizada pelo fato de que a dita célula de planta éoriunda de milho.
14. Processo para produzir uma planta, caracterizado pelofato de que compreende a transformação de uma célula deplanta com o constructo de DNA recombinante como definidona reivindicação 7 e a regeneração de uma planta a partirda célula da planta transformada.
15. Planta, caracterizada pelo fato de que compreende oconstructo de DNA recombinante como definido nareivindicação 7.
16. Planta de acordo com a reivindicação 15, caracterizadapelo fato de que a planta é milho.
17. Semente, caracterizada pelo fato de que compreende oconstructo de DNA recombinante como definido nareivindicação 7.
18. Semente de acordo com a reivindicação 17,caracterizada pelo fato de que dita semente é semente demilho.
19. Processo para conferir ou aperfeiçoar a resistência aColletotrichum, caracterizado pelo fato de que compreende atransformação de uma planta com o constructo de DNArecombinante como definido na reivindicação 7, conferindoou aperfeiçoando, por esse meio, a resistência aColletotrichum.
20. Processo para determinar a presença ou ausência dopolinucleotideo como definido na reivindicação 1 em umaplanta de milho, caracterizado pelo fato de que compreendepelo menos um dentre:(a) isolar moléculas de ácido nucleico de dita plantade milho e amplificar as seqüências homólogas dopolinucleotideo como definido na reivindicação 1;ou(b) isolar moléculas de ácido nucleico de ditasplantas de milho e realizar a hibridizaçãoSouthern; ou(c) isolar proteínas de dita planta de milho erealizar um western blot usando anticorpos para aproteína Regi; ou(d) isolar proteínas de dita planta de milho erealizar um ensaio ELISA usando anticorpos para aproteína Regi; ou(e) demonstrar a presença de seqüências de mRNAderivadas do transcripto do mRNA Regi e únicopara Regi, determinando, por esse meio, apresença do polinucleotideo como definido nareivindicação 1 na dita planta de milho.
21. Processo para determinar a presença ou ausência dolócus de Regi em uma planta de milho, caracterizado pelofato de que compreende pelo menos um dentre:(a) isolar moléculas de ácido nucleico de dita plantade milho e amplificar as seqüências homólogas dopolinucleotideo como definido na reivindicação 1;ou(b) isolar moléculas de ácido nucleico de dita plantade milho e realizar a hibridização Southern; ou(c) isolar proteínas de dita planta de milho erealizar um western blot usando anticorpos para aproteína Regi; ou(d) isolar proteínas de dita planta de milho erealizar um ensaio ELISA usando anticorpos para aproteína Regi; ou(e) demonstrar a presença de seqüências de mRNAderivadas do transcripto do mRNA Regi e únicopara Regi, determinando, por esse meio, apresença do lócus de Regi na dita planta demilho.
22. Processo para alterar o nivel de expressão de umaproteína capaz de conferir resistência a Colletotrichum emuma célula de planta, caracterizado pelo fato de quecompreende:(a) transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; e(b) colocar para crescer a célula de plantatransformada sob condições que são apropriadaspara a expressão do constructo de DNArecombinante sendo que a expressão do constructode DNA recombinante resulta na produção de niveisalterados de uma proteina capaz de conferirresistência a Colletotrichum na célula de plantatransformada.
23. Processo para alterar o nivel de expressão de umaproteina capaz de conferir resistência a podridão do colmoem uma célula de planta, caracterizado pelo fato de quecompreende:(a) transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; e(b) colocar para crescer a célula de plantatransformada sob condições que são apropriadaspara a expressão do constructo de DNArecombinante sendo que a expressão do constructode DNA recombinante resulta na produção de niveisalterados de uma proteina capaz de conferirresistência a podridão do colmo na célula deplanta transformada.
24. Processo para alterar o nivel de expressão de umaproteína capaz de conferir resistência a Colletotrichum emuma célula de planta, caracterizado pelo fato de quecompreende:(a) transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; e(b) regenerar a planta transformada a partir dacélula de planta transformada; e(c) colocar para crescer a célula de plantatransformada sob condições que são apropriadaspara a expressão do constructo de DNArecombinante sendo que a expressão do constructode DNA recombinante resulta na produção de niveisalterados de uma proteína que é capaz de conferirresistência a Colletotrichum na célula de plantatransformada.
25. Processo para alterar o nivel de expressão de umaproteína capaz de conferir resistência a podridão do colmoem uma célula de planta, caracterizado pelo fato de quecompreende:a. transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; eb. regenerar a planta transformada a partir dacélula de planta transformada; ec. colocar para crescer a planta transformada sobcondições que são apropriadas para a expressão doconstructo de DNA recombinante sendo que aexpressão do constructo de DNA recombinanteresulta na produção de niveis alterados de umaproteina que é capaz de conferir resistência apodridão do colmo na célula de plantatransformada.
26. Processo para conferir ou aperfeiçoar a resistência aColletotrichum em uma planta de milho, caracterizado pelofato de que compreende:(a) o cruzamento de uma primeira planta de milho emque está ausente o lócus de Regi com uma segundaplanta de milho contendo o lócus de Regi paraproduzir uma população segregante;(b) realizar o screening de dita população segregantecom relação a um membro contendo o lócus de Regicom um primeiro ácido nucléico, não incluindo oUMC15 ou o UMC66, capaz de hibridizar com umsegundo ácido nucléico ligado ao lócus de Regi; e(c) selecionar dito membro para posterior cruzamentoe seleção.
27. Processo de acordo com a reivindicação 26,caracterizado pelo fato de que dito primeiro ácido nucléicoé selecionado do grupo consistindo de:(a) uma seqüência compreendendo um fragmento de pelomenos cerca de 18 nucleotideos contíguosselecionado de SEQ ID No.: 1;(b) uma seqüência compreendendo um fragmento de pelomenos 18 nucleotideos contíguos selecionado dogrupo consistindo de SEQ ID Nos.: 4-13 e SEQ IDNos.: 23-124;(c) uma seqüência que hibridiza com dito segundoácido nucléico, sendo que dito segundo ácidonucléico possui uma seqüência de ácido nucléicode SEQ ID No.: 1; e(d) uma seqüência que hibridiza com dito segundo ácidonucléico, na qual dito segundo ácido nucléicopossui a seqüência de ácido nucléico selecionadado grupo consistindo de SEQ ID Nos.: 4-13 e SEQID Nos.: 23-124.
28. Processo de acordo com a reivindicação 26,caracterizado pelo fato de que a segunda planta de milho éa MP305.
29. Processo de acordo com a reivindicação 26,caracterizado pelo fato de que a segunda planta de milho éa DE811ASR(BC5).
30. Processo para conferir ou aperfeiçoar a resistência apodridão do colmo, caracterizado pelo fato de quecompreende:(a) cruzar uma primeira planta de milho na qual estáausente o lócus de Regi para produzir umapopulação segregante;(b) realizar o screening de dita população segregantecom relação a um membro contendo o lócus de Regicom um primeiro ácido nucleico, não incluindo oUMC15 ou o UMC66, capaz de hibridizar com umsegundo ácido nucleico ligado ao lócus de Regi; e(c) selecionar dito membro para posterior cruzamentoe seleção.
31. Processo de introgressão de resistência ou deresistência aperfeiçoada com relação a Colletotrichum emuma planta de milho, caracterizado pelo fato de quecompreende a realização de seleção assistida por marcadorde dita planta de milho com um marcador de ácido nucléico,sendo que dito marcador de ácido nucléico especificamentehibridiza com uma molécula de ácido nucléico tendo umaprimeira seqüência de ácido nucléico que está ligada a umasegunda seqüência de ácido nucléico que está localizada nolócus de Regi da MP305 e selecionar dita planta de milhocom base em dita seleção assistida por marcador.
32. Processo de acordo com a reivindicação 31,caracterizado pelo fato de que dita introgressão deresistência ou resistência aperfeiçoada a Colletotrichum érealizada por retrocruzamento com uma parental de milhorecorrente que não é resistente a Colletotrichum.
33. Processo de acordo com a reivindicação 31,caracterizado pelo fato de que dita seqüência de marcadorde primeiro ácido nucléico compreende um fragmento de pelomenos cerca de 18 nucleotideos contíguos selecionados deSEQ ID Nos.: 4-13 e SEQ ID Nos.: 23-124 e complementos dasmesmas.
34. Processo de introgressão de resistência ou deresistência aperfeiçoada a podridão do colmo em uma plantade milho, caracterizado pelo fato de que compreende arealização da seleção assistida por marcador de dita plantade milho com um marcador de ácido nucléico, sendo que ditomarcador de ácido nucléico hibridiza com uma molécula deácido nucléico tendo uma primeira seqüência de ácidonucléico que é ligada a uma segunda seqüência de ácidonucléico que está localizada no lócus de Regi e selecionardita planta de milho com base na seleção assistida pormarcador.
35. Processo de identificação de uma planta de milho queapresenta resistência recentemente conferida ouaperfeiçoada a infecção por Colletotrichum, caracterizadopelo fato de que dito processo compreende detectar, nosalelos de planta de milho, pelo menos dois marcadores,sendo que pelo menos um de ditos marcadores está em oudentro do intervalo cromossomico abaixo do UMC2041 e acimado gene Regi, e pelo menos um de ditos marcadores está emou dentro do intervalo cromossomico abaixo do gene Regi eacima do UMC2200.
36. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro do intervalo cromossomicoabaixo do UMC108 6 e acima do gene Regi, e pelo menos um deditos marcadores está em ou dentro do intervalocromossomico abaixo do gene Regi e acima do UMC2200.
37. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro do intervalo cromossomicoabaixo do UMC2285 e acima do gene Regi, e pelo menos um deditos marcadores está em ou dentro do intervalocromossomico abaixo do gene Regi e acima do UMC2187.
38. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos um deditos marcadores está em ou dentro do intervalocromossômico abaixo do gene Regi e acima do UMC15a.
39. Processo de acordo com a reivindicação 38,caracterizado pelo fato de que compreende ainda a seleçãode pelo menos quatro marcadores, sendo que pelo menos doisde ditos marcadores estão dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos doisde ditos marcadores estão dentro do intervalo cromossômicoabaixo do gene Regi e acima do UMC15a.
40. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro da SEQ ID No.: 137, sendo quepelo menos um marcador é capaz de detectar um polimorfismolocalizado em uma posição selecionada do grupo consistindoda:(a) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 7230 e 7535;(b) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 11293 e 12553;(c) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 25412 e 29086; e(d) posição na SEQ ID No.:137 correspondente aosnucleotideos entre 43017 e 50330.
41. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que o pelo menos um de ditosmarcadores que está em ou dentro do intervalo cromossômicoabaixo do UMC2041 e acima do gene Regi é selecionado dosmarcadores listados na Tabela 16, e sendo que pelo menos ummarcador em ou dentro do intervalo cromossômico abaixo dogene Regi e acima do UMC2200 é selecionado dos marcadoreslistados na Tabela 16.
42. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que compreende ainda a seleçãode pelo menos quatro marcadores, sendo que pelo menos doisde ditos marcadores estão em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, e pelomenos dois de ditos marcadores estão em ou dentro dointervalo cromossômico abaixo do gene Regi e acima doUMC2200.
43 . Processo de acordo com a reivindicação 42,caracterizado pelo fato de que os pelo menos doismarcadores em ou dentro do intervalo cromossômico abaixo doUMC2041 e acima do gene Regi são selecionados a partir dosmarcadores listados na Tabela 16, e sendo que os pelo menosdois marcadores em ou dentro do intervalo cromossômicoabaixo do gene Regi e acima do UMC2200 são selecionados apartir dos marcadores listados na Tabela 16.
44. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que compreende ainda a seleçãode pelo menos seis marcadores, sendo que pelo menos três deditos marcadores estão em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, e pelomenos três de ditos marcadores estão em ou dentro dointervalo cromossômico abaixo do gene Regi e acima doUMC2200.
45. Processo de acordo com a reivindicação 44,caracterizado pelo fato de que os pelo menos trêsmarcadores em ou dentro do intervalo cromossômico abaixo doUMC2041 e acima do gene Regi são selecionados a partir dosmarcadores listados na Tabela 16, e em que os pelo menostrês marcadores que estão em ou dentro do intervalocromossômico abaixo do gene Regi e acima do UMC2200 sãoselecionados a partir dos marcadores listados na Tabela 16.
46. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que dito processo compreendeainda detectar pelo menos dois ou mais dentre: (a) alelo 7em MZA11123, (b) alelo 2 em MZA2591 e (c) alelo 8 emMZA3434.
47. Planta de milho, caracterizada pelo fato de que éobtenivel pelo processo como definido na reivindicação 46.
48. Semente, caracterizada pelo fato de que é da planta demilho como definida na reivindicação 47.
49. Planta de milho obtida pelo processo como definido nareivindicação 35, caracterizada pelo fato de que a plantade milho não compreende os mesmos alelos como providos naMP305 em ou acima do UMC2041 ou em ou abaixo do UMC2200 noslócus mostrados na Tabela 16.
50. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que compreende ainda dadostransmitidos eletronicamente ou armazenados eletronicamenterepresentantes dos alelos detectados em um meio de leiturapor computador.
51. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que detecta ainda, na planta demilho, a presença ou ausência de pelo menos um marcadordentro do gene Regi.
52. Processo de acordo com a reivindicação 51,caracterizado pelo fato de compreende ainda a seleção depelo menos quatro marcadores, sendo que pelo menos dois deditos marcadores estão dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos doisde ditos marcadores estão dentro do intervalo cromossômicoabaixo do gene Regi e acima do UMC15a.
53. Processo de acordo com a reivindicação 51,caracterizado pelo fato de que o gene Regi é colocado porintrogressão, a partir de uma planta de milho doadora, emuma planta de milho receptora para produzir uma planta demilho introgredida.
54. Processo de acordo com a reivindicação 53,caracterizado pelo fato de que a planta de milho doadora éa MP305 ou a DE811ASR(BC5).
55. Processo de acordo com a reivindicação 53,caracterizado pelo fato de que a planta de milhointrogredida é selecionada para um evento de recombinaçãoabaixo do gene Regi e acima do UMC15a, de modo que a plantade milho introgredida retém um primeiro intervalocromossômico derivado da MP305 abaixo do gene Regi e acimado UMC15a, e não retém um segundo intervalo cromossômicoderivado da MP305 em ou abaixo do UMC15a.
56. Planta de milho introgredida, caracterizada pelo fatode que é obtenivel pelo processo como definido nareivindicação 55.
57. Semente de planta de milho introgredida, caracterizadapelo fato de que a planta é a planta de milho introgredidacomo definida na reivindicação 56.
58. Planta de milho introgredida produzida pelo processocomo definido na reivindicação 55, caracterizada pelo fatode que a planta de milho introgredida é uma conversão delócus de Regi da PH705, PH5W4, PH51K ou PH87P, ou umaprogênie das mesmas.
59. Processo de identificação de uma planta de milho queapresenta resistência aperfeiçoada a infecção porColletotr ichum, caracterizado pelo fato de que ditoprocesso compreende detectar na planta de milho a presençaou ausência de pelo menos um marcador no lócus de Regi, eselecionar a planta de milho na qual pelo menos um marcadorestá presente.
60. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que o pelo menos um marcadorestá em ou dentro da SEQ ID No.: 137.
61. Processo de acordo com a reivindicação 60,caracterizado pelo fato de que o pelo menos um marcador écapaz de detectar um polimorfismo localizado em uma posiçãoselecionada do grupo consistindo da:(a) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 1 e 536;(b) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 7239 e 7535;(c) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 11293 e 12553;(d) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 25412 e 29086; e(e) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 43017 e 50330.
62. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que o pelo menos um marcadorestá em ou dentro da seqüência codificante do Regi.
63. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que a seqüência codificante daRegi compreende uma seqüência de nucleotideos codificantede um polipeptideo, sendo que o polipeptideo possui umaseqüência de aminoácidos com pelo menos 95% de identidadequando comparada com a SEQ ID No.:3 baseada no algoritmo dealinhamento de Needleman-Wunsch.
64. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que o pelo menos um marcadorestá em ou dentro do polinucleotideo definido na SEQ ID No.: 1.
65. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que pelo menos um marcadordetecta um polimorfismo simples de nucleotideos em umaposição na seqüência de nucleotideos definida como SEQ IDNo. : 1 correspondente a uma ou mais posições 413, 958, 971, 1099, 1154, 1235, 1250, 1308, 1607, 2001, 2598, e 3342.
66. Processo de acordo comcaracterizado pelo fato de que oum marcador de SNP selecionado C00060-01 e C00060-02.
67. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que o pelo menos um marcador éum marcador de FLP em um amplicon gerado por um par deprimers compreendendo um primeiro e um segundo primer,sendo que o primeiro primer é selecionado do grupoconsistindo da:a reivindicação 62, pelo menos um marcador édo grupo consistindo de(a) seqüência definida na SEQ ID No.: 35 e ocomplemento da mesma;(b) seqüência definida na SEQ ID No.: 37 e ocomplemento da mesma;(c) seqüência definida na SEQ ID No.: 39 e ocomplemento da mesma; e(d) seqüência definida na SEQ ID No.: 41 e ocomplemento da mesma;e sendo que o segundo primer é selecionado do grupoconsistindo da:(a) seqüência definida na SEQ ID No.: 36 e ocomplemento da mesma;(b) seqüência definida na SEQ ID No.: 38 e ocomplemento da mesma;(c) seqüência definida na SEQ ID No.: 40 e ocomplemento da mesma; e(d) seqüência definida na SEQ ID No.: 42 e ocomplemento da mesma.
68. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que o pelo menos um marcadordetecta uma seqüência de mRNA derivada do transcripto demRNA Regi e único para Rcg1.
69. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que dito processo compreendeainda a detecção na planta de milho da presença ou ausênciade pelo menos dois marcadores dentro do lócus de Regi.
70. Processo de acordo com a reivindicação 69,caracterizado pelo fato de que os pelo menos doismarcadores são o C00060-01 e o C00060-02.
71. Processo de acordo com a reivindicação 70,caracterizado pelo fato de que o lócus de Regi é colocadopor introgressão, a partir de uma planta de milho doadora,em uma planta de milho receptora para produzir uma plantade milho introgredida.
72. Processo de acordo com a reivindicação 71,caracterizado pelo fato de que a planta de milho doadora éa MP305 ou a DE811ASR(BC5).
73. Planta de milho introgredida, caracterizada pelo fatode que é obtenivel pelo processo como definido nareivindicação 72.
74. Semente de uma planta de milho introgredida,caracterizada pelo fato de que dita planta é a planta demilho introgredida como definida na reivindicação 73.
75. Planta de milho introgredida produzida pelo processocomo definido na reivindicação 72, caracterizada pelo fatode que a planta de milho introgredida é uma conversão dolócus de Regi da PH705, PH5W4, PH51K ou da PH87P, ou de umaprogênie da mesma.
76. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que compreende dadoseletronicamente transmitidos ou eletronicamente armazenadosrepresentando a presença ou ausência do pelo menos ummarcador em um meio de leitura em computador.
77. Semente de milho, caracterizada pelo fato de quecompreende um primeiro intervalo cromossômico derivado daMP305 definido por BNLG2162 e UMC1051, e não compreendendo um segundo intervalo cromossômico derivado da MP305 acimado BNLG2162 ou abaixo do UMC1051.
78. Semente de milho de acordo com a reivindicação 77,caracterizada pelo fato de que dita semente de milhocompreende o gene Regi e, quando crescida, produz umaplanta de milho que apresenta resistência a infecção porColletotrichum.
79. Semente de milho, caracterizada pelo fato de quecompreende um primeiro intervalo cromossômico derivado daMP305 entre, mas não incluindo, o MZA15842 e o UMC15a, enão compreendendo um segundo intervalo cromossômicoderivado da MP305 em ou acima do MZA15842 ou em ou abaixodo UMC15a.
80. Semente de milho de acordo com a reivindicação 79,caracterizada pelo fato de que dita semente de milhocompreende o gene Regi e, quando crescida, produz umaplanta de milho que apresenta resistência a infecção porColletotrichum.
81. Semente de milho, caracterizada pelo fato de que é deuma variedade designada DE811ASR(BC5), ou uma semente daprogênie derivada da mesma que compreende o gene Regi, quequando crescida, produz uma planta que apresentaresistência aperfeiçoada ou recentemente conferida ainfecção por Colletotrichum.
82. Semente de acordo com a reivindicação 81,caracterizada pelo fato de que uma amostra representativade dita variedade de milho DE811ASR(BC5) foi depositadacomo número de acesso ATCC PTA-7434.
83. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que dita semente de progênieretém um primeiro intervalo cromossômico derivado da MP305ou da DE811ASR(BC5) dentro do, mas não incluindo, UMC2285 eUMC15a.
84. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que dita semente de progênieretém um primeiro intervalo cromossômico derivado da MP305ou da DE811ASR(BC5) dentro do, mas não incluindo, MZA15842e UMC15a.
85. Planta, caracterizada pelo fato de que é produzida ápartir da semente como definida em qualquer uma dasreivindicações 77 a 84.
86. Célula de planta, caracterizada pelo fato de que é daplanta como definida na reivindicação 85.
87. Semente de progênie de acordo com a reivindicação 84caracterizada pelo fato de que a semente de progênie é umaconversão do lócus de Regi de PH705, PH5W4, PH51K ou PH87P,ou de uma progênie das mesmas.
88. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que a semente de progêniecompreende pelo menos dois ou mais dentre: (a) alelo 7 noMZA11123, (b) alelo 2 no MZA2591, ou (c) alelo 8 noMZA3434.
89. Planta de milho, caracterizada pelo fato de que éproduzida pela semente de progênie como definida nareivindicação 88.
90. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que a semente de progêniecompreende um nucleotídeo citosina no MZA2591.32, umnucleotideo timina no MZA2591.35, e um nucleotideo citosinano MZA3434 .17 .
91. Planta de milho, caracterizada pelo fato de que éproduzida pela semente de progênie como definidareivindicação 96.
92. Sistema de computador para identificar uma planta demilho que apresenta resistência recentemente conferida ouaperfeiçoada a infecção por Colletotrichum, caracterizadopelo fato de que o sistema compreende:(a) uma base de dados compreendendo uma informação deescore de alelos para uma ou mais plantas demilho com relação a quatro ou mais lócus demarcador proximamente ligados ou dentro do lócusde Regi, e(b) instruções que examinem a dita base de dados paradeterminar a hereditariedade do intervalocromossômico ou porções do mesmo definida pelosquatro ou mais lócus de marcador e computar ainformação se uma ou mais plantas de milhocompreendem ou não o gene Regi.
93. Sistema de computador para identificar uma planta demilho que apresenta resistência recentemente conferida ouaperfeiçoada a infecção por Colletotrichum, caracterizadopelo fato de que o sistema compreende:(a) uma base de dados compreendendo informação deescore de alelos para uma ou mais plantas demilho com relação a um ou mais lócus de marcadordentro do lócus de Regi, e(b) instruções que examinem dita base de dados paradeterminar a hereditariedade do lócus de Regi.
94. Sistema de computador de acordo com a reivindicação 93, caracterizado pelo fato de que a informação de escorede alelos para uma ou mais plantas de milho adicionalmentecompreende dois ou mais lócus de marcador dentro do lócusde Rcg1.
95. Sistema de computador de acordo com a reivindicação-93, caracterizado pelo fato de que a informação de escorede alelos para uma ou mais plantas de milho adicionalmentecompreende três ou mais lócus de marcador dentro do lócusde Rcg1.
96. Marcador genético, caracterizado pelo fato de que estáem ou dentro de uma seqüência selecionada do grupoconsistindo de: <table>table see original document page 357</column></row><table>
97. Marcador genético, caracterizado pelo fato de estarlocalizado em ou no lócus de Rcg1.
98. Marcador genético de acordo com a reivindicação 97,caracterizado pelo fato de que o marcador genético está emSEQ ID No.: 137, em uma região selecionada do grupoconsistindo da:(a) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 1 e 536;(b) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 7230 e 7535;(c) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 11293 e 12553;(d) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 25412 e 29086; e(e) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 43017 e 50330.
99. Marcador genético de acordo com a reivindicação 97,caracterizado pelo fato de que o marcador genético está emou dentro do gene Regi.
100. Marcador genético de acordo com a reivindicação 99,caracterizado pelo fato de que o marcador genético está emSEQ ID No.: 1, em ou dentro da posição selecionada do grupoconsistindo de: (a) posição 550-658 da SEQ ID No.: 1; (b)posição 1562-1767 da SEQ ID No.: 1.
101. Marcador genético de acordo com a reivindicação 99,caracterizado pelo fato de que o marcador genético está emum amplicon gerado por um par de primers compreendendo umprimeiro e um segundo primer, sendo que o dito primeiroprimer é selecionado do grupo consistindo de:(a) SEQ ID No.: 23 e o complemento da mesma;(b) SEQ ID No.: 25 e o complemento da mesma;(c) SEQ ID No.: 27 e o complemento da mesma;(d) SEQ ID No.: 29 e o complemento da mesma;(e) SEQ ID No.: 31 e o complemento da mesma;(f) SEQ ID No.: 33 e o complemento da mesma;(g) SEQ ID No.: 35 e o complemento da mesma;(h) SEQ ID No.: 37 e o complemento da mesma;(i) SEQ ID No.: 39 e o complemento da mesma; e(j) SEQ ID No.: 41 e o complemento da mesma,e sendo que o segundo primer é selecionado do grupoconsistindo de:(a) SEQ ID No.: 24 e o complemento da mesma;(b) SEQ ID No.: 26 e o complemento da mesma;(c) SEQ ID No.: 28 e o complemento da mesma;(d) SEQ ID No.: 30 e o complemento da mesma;(e) SEQ ID No.: 32 e o complemento da mesma;(f) SEQ ID No.: 34 e o complemento da mesma;(g) SEQ ID No.: 36 e o complemento da mesma;(h) SEQ ID No.: 38 e o complemento da mesma;(i) SEQ ID No.: 40 e o complemento da mesma; e(j) SEQ ID No.: 42 e o complemento da mesma.
102. Planta de milho, caracterizada pelo fato de que éobtenivel pelo método compreendendo: o cruzamento da MP305ou DE811ASR(BC5) [Depósito No. PTO-7434], como uma primeiraplanta parental, com uma planta diferente na qual estáausente um lócus de Regi, como uma segunda parental,obtendo-se, por esse meio, a progênie compreendendo o lócusde Rcg1 da primeira parental e, opcionalmente, aindacompreendendo uma ou mais etapas de melhoramento para obtera progênie de uma ou mais gerações posteriorescompreendendo o lócus de Regi da primeira parental.
103. Planta de milho de acordo com a reivindicação 102,caracterizada pelo fato de que é uma planta de milhoendogâmica.
104. Planta de milho de acordo com a reivindicação 102,caracterizada pelo fato de que é uma planta de milhohíbrida.
105. Semente da planta como definida em qualquer uma dasreivindicações 102 a 104, caracterizada pelo fato de quecontém um lócus de Regi.
106. Semente da planta definida na reivindicação 105,caracterizada pelo fato de que é homozigota com relação adito lócus de Regi.
107. Semente da planta como definida na reivindicação 105,caracterizada pelo fato de que é heterozigota com relação adito lócus de Regi.
108. Método de obtenção de um produto de milho,caracterizado pelo fato de que compreende o provimento desemente que inclui uma semente como definida em qualqueruma das reivindicações 105 a 107 e processamento de ditasemente para obter dito produto.
109. Método de obtenção de um produto de milho,caracterizado pelo fato de que compreende o crescimento deuma planta como definida em qualquer uma das reivindicações 102 a 104, obter a semente da mesma e processamento de ditasemente para obter dito produto.
110. Uso da semente como definida em qualquer uma dasreivindicações 105 a 107, caracterizado pelo fato de que éem alimento ou forragem ou na produção de um produto demilho.
111. Método ou uso de acordo com qualquer uma dasreivindicações 108 a 110, caracterizado pelo fato de quedito produto é farinha de milho, amido de milho, cereal demilho ou óleo de milho.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US66824105P | 2005-04-04 | 2005-04-04 | |
| US60/668,241 | 2005-04-04 | ||
| US67566405P | 2005-04-28 | 2005-04-28 | |
| US60/675,664 | 2005-04-28 | ||
| PCT/US2006/012443 WO2006107931A2 (en) | 2005-04-04 | 2006-04-04 | Polynucleotides and methods for making plants resistant to fungal pathogens |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BRPI0610520A2 true BRPI0610520A2 (pt) | 2010-06-22 |
| BRPI0610520B1 BRPI0610520B1 (pt) | 2022-04-05 |
Family
ID=36940190
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0610520-3A BRPI0610520B1 (pt) | 2005-04-04 | 2006-04-04 | Vetor, constructo de dna recombinante, e processos para transformar uma célula hospedeira, produzir uma planta, conferir ou aperfeiçoar a resistência a colletotrichum, determinar a presença ou ausência de um polinucleotídeo, alterar o nível de expressão de uma proteína, e de identificação de uma planta de milho |
Country Status (6)
| Country | Link |
|---|---|
| US (10) | US20060225151A1 (pt) |
| EP (1) | EP1874935B2 (pt) |
| BR (1) | BRPI0610520B1 (pt) |
| CA (1) | CA2604351C (pt) |
| MX (1) | MX2007012302A (pt) |
| WO (1) | WO2006107931A2 (pt) |
Families Citing this family (51)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2011109661A1 (en) | 2010-03-04 | 2011-09-09 | Mendel Biotechnology Inc. | Transcription regulators for improving plant performance |
| US20060225151A1 (en) * | 2005-04-04 | 2006-10-05 | E.I. Du Pont De Nemours And Company | Polynucleotides and methods for making plants resistant to fungal pathogens |
| WO2008157432A1 (en) | 2007-06-15 | 2008-12-24 | E. I. Dupont De Nemours & Company | Polynucleotides and methods for making plants resistant to fungal pathogens |
| US8115055B2 (en) | 2007-12-18 | 2012-02-14 | E.I. Du Pont De Nemours And Company | Down-regulation of gene expression using artificial microRNAs |
| US8900808B2 (en) * | 2008-07-15 | 2014-12-02 | E.I. Du Pont De Nemours And Company | Genetic loci associated with mechanical stalk strength in maize |
| AR075465A1 (es) | 2008-10-22 | 2011-04-06 | Basf Se | Uso de herbicidas de sulfonilurea en plantas cultivadas |
| AR075466A1 (es) | 2008-10-22 | 2011-04-06 | Basf Se | Uso de herbicidas tipo auxina en plantas cultivadas |
| EP2584887B1 (en) | 2010-06-25 | 2018-05-30 | E. I. du Pont de Nemours and Company | Compositions and methods for enhancing resistance to northern leaf blight in maize |
| TWI667347B (zh) | 2010-12-15 | 2019-08-01 | 瑞士商先正達合夥公司 | 大豆品種syht0h2及偵測其之組合物及方法 |
| US9062317B2 (en) | 2011-05-09 | 2015-06-23 | E I Du Pont De Nemours And Company | Methods and compositions for silencing gene families using artificial microRNAs |
| US20150250174A1 (en) | 2012-10-01 | 2015-09-10 | Basf Se | Use of n-thio-anthranilamide compounds on cultivated plants |
| KR101640278B1 (ko) * | 2012-10-05 | 2016-07-15 | 경희대학교 산학협력단 | 흰잎 마름병 및 도열병 저항성 인산화 효소 및 이를 이용한 형질전환 벼 |
| WO2014079820A1 (en) | 2012-11-22 | 2014-05-30 | Basf Se | Use of anthranilamide compounds for reducing insect-vectored viral infections |
| WO2014116989A1 (en) | 2013-01-25 | 2014-07-31 | Pioneer Hi-Bred International, Inc. | Maize event dp-032218-9 and methods for detection thereof |
| US8902663B1 (en) | 2013-03-11 | 2014-12-02 | Monolithic 3D Inc. | Method of maintaining a memory state |
| WO2014159306A1 (en) | 2013-03-13 | 2014-10-02 | Pioneer Hi-Bred International, Inc. | Glyphosate application for weed control in brassica |
| MX369750B (es) | 2013-03-14 | 2019-11-20 | Pioneer Hi Bred Int | Composiciones y metodos para controlar plagas de insectos. |
| US10023877B2 (en) | 2013-03-15 | 2018-07-17 | Pioneer Hi-Bred International, Inc. | PHI-4 polypeptides and methods for their use |
| MX359026B (es) | 2013-08-16 | 2018-09-12 | Pioneer Hi Bred Int | Proteinas insecticidas y metodos de uso. |
| US10667524B2 (en) | 2013-09-13 | 2020-06-02 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| WO2015120276A1 (en) | 2014-02-07 | 2015-08-13 | Pioneer Hi Bred International Inc | Insecticidal proteins and methods for their use |
| CN114763376A (zh) | 2014-02-07 | 2022-07-19 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
| WO2016044092A1 (en) | 2014-09-17 | 2016-03-24 | Pioneer Hi Bred International Inc | Compositions and methods to control insect pests |
| EP3207143B1 (en) | 2014-10-16 | 2023-11-22 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| EP3028573A1 (en) | 2014-12-05 | 2016-06-08 | Basf Se | Use of a triazole fungicide on transgenic plants |
| WO2016091674A1 (en) | 2014-12-12 | 2016-06-16 | Basf Se | Use of cyclaniliprole on cultivated plants |
| US20170359965A1 (en) | 2014-12-19 | 2017-12-21 | E I Du Pont De Nemours And Company | Polylactic acid compositions with accelerated degradation rate and increased heat stability |
| EP3244727B1 (en) | 2015-01-15 | 2025-10-22 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| WO2016162371A1 (en) | 2015-04-07 | 2016-10-13 | Basf Agrochemical Products B.V. | Use of an insecticidal carboxamide compound against pests on cultivated plants |
| CN108064233B (zh) | 2015-05-19 | 2022-07-15 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
| US20160355840A1 (en) | 2015-06-03 | 2016-12-08 | E I Du Pont De Nemours And Company | Methods of identifying and selecting maize plants with resistance to anthracnose stalk rot |
| MX2017016119A (es) | 2015-06-16 | 2018-03-07 | Pioneer Hi Bred Int | Composiciones y metodos para controlar plagas de insectos. |
| EP3943602A1 (en) | 2015-08-06 | 2022-01-26 | Pioneer Hi-Bred International, Inc. | Plant derived insecticidal proteins and methods for their use |
| JP2018527931A (ja) | 2015-08-28 | 2018-09-27 | パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド | 植物のオクロバクテリウム(ochrobactrum)媒介形質転換 |
| EA037614B1 (ru) * | 2015-10-16 | 2021-04-21 | Пайонир Хай-Бред Интернэшнл, Инк. | Получение растений маиса с повышенной устойчивостью к северной пятнистости листьев |
| WO2017192560A1 (en) | 2016-05-04 | 2017-11-09 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
| EP3472323A1 (en) | 2016-06-16 | 2019-04-24 | Pioneer Hi-Bred International, Inc. | Compositions and methods to control insect pests |
| US11155829B2 (en) | 2016-07-01 | 2021-10-26 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins from plants and methods for their use |
| US20210292778A1 (en) | 2016-07-12 | 2021-09-23 | Pioneer Hi-Bred International, Inc. | Compositions and methods to control insect pests |
| CN109844121A (zh) | 2016-10-13 | 2019-06-04 | 先锋国际良种公司 | 产生北方叶枯病抗性玉蜀黍 |
| BR112019008800A2 (pt) | 2016-11-01 | 2019-07-16 | Pioneer Hi-Bred International, Inc. | polipeptídeo inseticida, composição inseticida, polinucleotídeo recombinante, construto de dna, célula de planta ou planta transgênica, método para inibir o crescimento ou exterminar uma população de praga de inseto agrícola, método para inibir o crescimento ou exterminar uma praga de inseto, método para controlar infestação de inseto lepidoptera e/ou coleoptera em uma planta transgênica e fornecer gerenciamento de resistência de inseto e uso de pelo menos um polipeptídeo inseticida |
| EP3338552A1 (en) | 2016-12-21 | 2018-06-27 | Basf Se | Use of a tetrazolinone fungicide on transgenic plants |
| CA3092078A1 (en) | 2018-03-14 | 2019-09-19 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins from plants and methods for their use |
| CN116410286A (zh) | 2018-03-14 | 2023-07-11 | 先锋国际良种公司 | 来自植物的杀昆虫蛋白及其使用方法 |
| EP3833182A1 (en) * | 2018-06-06 | 2021-06-16 | Huazhong Agricultural University | Methods of identifying, selecting, and producing southern corn rust resistant crops |
| CN109234431B (zh) * | 2018-09-27 | 2022-11-01 | 北京大北农生物技术有限公司 | 玉米抗茎腐病qtl的分子标记及其应用 |
| CA3109984A1 (en) | 2018-10-16 | 2020-04-23 | Pioneer Hi-Bred International, Inc. | Genome edited fine mapping and causal gene identification |
| US12371706B2 (en) | 2019-08-23 | 2025-07-29 | Pioneer Hi-Bred International, Inc. | Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops |
| BR112022020714A2 (pt) | 2020-04-15 | 2022-12-20 | Pioneer Hi Bred Int | Identificação de gene efetor de patógeno vegetal e de resistência à doença, composições e métodos de uso |
| CN115867564A (zh) | 2020-07-14 | 2023-03-28 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
| WO2025191167A1 (en) | 2024-03-15 | 2025-09-18 | Limagrain Europe | Chimeric resistance genes for maize resistance against pathogens |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6479731B1 (en) | 1998-08-04 | 2002-11-12 | E. I. Du Pont De Nemours And Company | Pi-ta gene conferring fungal disease resistance to plants |
| US20060225151A1 (en) * | 2005-04-04 | 2006-10-05 | E.I. Du Pont De Nemours And Company | Polynucleotides and methods for making plants resistant to fungal pathogens |
| EP1867723A1 (en) | 2006-06-16 | 2007-12-19 | Genoplante-Valor | Plants with increased tolerance to water deficit |
| WO2008157432A1 (en) * | 2007-06-15 | 2008-12-24 | E. I. Dupont De Nemours & Company | Polynucleotides and methods for making plants resistant to fungal pathogens |
-
2006
- 2006-04-04 US US11/397,153 patent/US20060225151A1/en not_active Abandoned
- 2006-04-04 CA CA2604351A patent/CA2604351C/en not_active Expired - Lifetime
- 2006-04-04 WO PCT/US2006/012443 patent/WO2006107931A2/en not_active Ceased
- 2006-04-04 US US11/397,275 patent/US20060223102A1/en not_active Abandoned
- 2006-04-04 US US11/397,247 patent/US20060225152A1/en not_active Abandoned
- 2006-04-04 EP EP06740467.3A patent/EP1874935B2/en not_active Expired - Lifetime
- 2006-04-04 MX MX2007012302A patent/MX2007012302A/es active IP Right Grant
- 2006-04-04 BR BRPI0610520-3A patent/BRPI0610520B1/pt not_active IP Right Cessation
-
2007
- 2007-01-29 US US11/699,105 patent/US20080072341A1/en not_active Abandoned
- 2007-07-06 US US11/774,121 patent/US8084671B2/en active Active
- 2007-07-20 US US11/780,499 patent/US7619133B2/en not_active Expired - Lifetime
- 2007-10-26 US US11/924,639 patent/US8062847B2/en active Active
-
2011
- 2011-10-11 US US13/270,722 patent/US8884126B2/en active Active
-
2014
- 2014-11-11 US US14/538,238 patent/US9884896B2/en active Active
-
2017
- 2017-12-27 US US15/855,435 patent/US20180112280A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| US9884896B2 (en) | 2018-02-06 |
| US8084671B2 (en) | 2011-12-27 |
| US20080072341A1 (en) | 2008-03-20 |
| US7619133B2 (en) | 2009-11-17 |
| EP1874935B1 (en) | 2013-11-06 |
| US20060225151A1 (en) | 2006-10-05 |
| US20080022426A1 (en) | 2008-01-24 |
| BRPI0610520B1 (pt) | 2022-04-05 |
| EP1874935A2 (en) | 2008-01-09 |
| MX2007012302A (es) | 2008-04-14 |
| US20090035765A1 (en) | 2009-02-05 |
| US20080016595A1 (en) | 2008-01-17 |
| US20180112280A1 (en) | 2018-04-26 |
| US20060223102A1 (en) | 2006-10-05 |
| WO2006107931A3 (en) | 2006-12-07 |
| US8884126B2 (en) | 2014-11-11 |
| EP1874935B2 (en) | 2023-10-18 |
| CA2604351C (en) | 2012-08-28 |
| US8062847B2 (en) | 2011-11-22 |
| US20120054921A1 (en) | 2012-03-01 |
| WO2006107931A2 (en) | 2006-10-12 |
| US20160201079A1 (en) | 2016-07-14 |
| US20060225152A1 (en) | 2006-10-05 |
| CA2604351A1 (en) | 2006-10-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10731225B2 (en) | Methods for making plants resistant to fungal pathogens | |
| EP1874935B2 (en) | Polynucleotides and methods for making plants resistant to fungal pathogens | |
| CN108770333A (zh) | 小麦条锈病抗性基因及其使用方法 | |
| CN101189341B (zh) | 用于制备抗真菌病原体的植物的多核苷酸和方法 | |
| CA2874040A1 (en) | Arabidopsis nonhost resistance gene(s) and use thereof to engineer disease resistant plants | |
| US10087461B2 (en) | Glycine max resistance gene(s) and use thereof to engineer plants with broad-spectrum resistance to fungal pathogens and pests | |
| US10087462B2 (en) | Arabidopsis nonhost resistance gene(s) and use thereof to engineer SDS resistant plants | |
| Butler et al. | 11111111111111111111111111111111111111111111111111111111111111111111111111 II OI IIi | |
| Huang | High-resolution mapping and molecular cloning of leaf rust resistance gene Lr21 in wheat | |
| BRPI0813360B1 (pt) | Polinucleotídeo isolado, vetor, processo para transformar uma célula hospedeira, processo para a produção de uma planta, processo para conferir ou melhorar a resistência a colletotrichum, processo para alterar o nível de expressão de proteínas capazes de conferir resistência a colletotrichum e a podridão no caule de uma célula vegetal e processo de identificação de uma planta de milho |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
| B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
| B09B | Patent application refused [chapter 9.2 patent gazette] | ||
| B12B | Appeal against refusal [chapter 12.2 patent gazette] | ||
| B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 04/04/2006, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO. |
|
| B21F | Lapse acc. art. 78, item iv - on non-payment of the annual fees in time |
Free format text: REFERENTE A 18A ANUIDADE. |
|
| B24D | Patent annual fee: restoration after fee payment |