BRPI0709258A2

BRPI0709258A2 - métodos para melhorar caracterìsticas relacionadas a rendimento em plantas, para a produção de uma planta transgênica, para aumentar rendimento de planta em relação a plantas de controle adequadas e para aumentar resistência a estresse abiótico em plantas em relação a plantas de controle, planta ou parte da mesma, construção, uso de uma construção, planta, parte de planta ou célula de planta, planta transgênica, partes colhìveis de uma planta, produtos, usos de um ácido nucleico, polipeptìdeo isolado, e, molécula isolada de ácido nucleico

Info

Publication number: BRPI0709258A2
Application number: BRPI0709258-0A
Authority: BR
Inventors: Valerie Frankard; Christophe Reuzeau; Ana Isabel Sanz Molinero
Original assignee: Basf Plant Science Gmbh
Priority date: 2006-03-31
Filing date: 2007-03-30
Publication date: 2011-06-28

Abstract

MéTODOS PARA MELHORAR CARACTERìSTICAS RELACIONADAS A RENDIMENTO EM PLANTAS, PARA A PRODUçãO DE UMA PLANTA TRANSGêNICA, PARA AUMENTAR RENDIMENTO DE PLANTA EM RELAçãO A PLANTAS DE CONTROLE ADEQUADAS E PARA AUMENTAR RESISTêNCIA A ESTRESSE ABIóTICO EM PLANTAS EM RELAçãO A PLANTAS DE CONTROLE, PLANTA OU PARTE DA MESMA, CONSTRUçãO, USO DE UMA CONSTRUçãO, PLANTA, PARTE DE PLANTA OU CéLULA DE PLANTA, PLANTA TRANSGêNICA, PARTES COLHìVEIS DE UMA PLANTA, PRODUTOS, USOS DE UM áCIDO NUCLEICO, E DE UMA CONSTRUçãO POLIPEPTìDEO ISOLADO, E, MOLéCULA ISOLADA DE áCIDO NUCLEICO. A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar características relacionadas a rendimento em plantas, em particular para aumentar rendimento de planta e/ou vigor precoce, em relação a plantas de controle. Mais especificamente, a presente invenção se relaciona a um método para melhorar características relacionadas a rendimento compreendendo modificar a expressão de um ácido nucleico codificando um polipeptídeo HAL3, polipeptídeo MADS15, polipeptídeo fator de transcrição PLT, fator de transcrição basic/helix-loop-helix (bHLH), ou fator de transcrição SPL15. A invenção também fornece construções úteis nos métodos da invenção.

Description

' "MÉTODOS PARA MELHORAR CARACTERÍSTICASRELACIONADAS A RENDIMENTO EM PLANTAS, PARA APRODUÇÃO DE UMA PLANTA TRANSGÉNICA, PARA AUMENTARRENDIMENTO DE PLANTA EM RELAÇÃO A PLANTAS DECONTROLE ADEQUADAS E PARA AUMENTAR RESISTÊNCIA AESTRESSE ABIÓTICO EM PLANTAS EM RELAÇÃO A PLANTAS DECONTROLE, PLANTA OU PARTE DA MESMA, CONSTRUÇÃO, USODE UMA CONSTRUÇÃO, PLANTA, PARTE DE PLANTA OU CÉLULADE PLANTA, PLANTA TRANSGÉNICA, PARTES COLHÍVEIS DE UMAPLANTA, PRODUTOS, USO DE UM ÁCIDO NUCLEICO,POLIPEPTÍDEO ISOLADO, E, MOLÉCULA ISOLADA DE ÁCIDONUCLEICO"

A presente invenção geralmente se refere ao campo debiologia molecular e se relaciona a um método para melhorar váriascaracterísticas de crescimento vegetal modulando expressão em uma planta deum ácido nucleico codificando uma GRP (Proteína Relacionada aCrescimento). A presente invenção também se relaciona a plantas tendoexpressão modulada de um ácido nucleico codificando uma GRP, cujasplantas têm características de crescimento melhoradas em relação a plantastipo selvagem correspondentes ou outras plantas de controle. A invençãotambém fornece construções úteis nos métodos da invenção.

A sempre crescente população mundial e a oferta minguantede terra arável disponível para agricultura impulsiona pesquisa para aumentara eficiência de agricultura. Meios convencionais para melhoramentosculturais e horticulturais utilizam técnicas de melhoramento seletivo paraidentificar plantas tendo características desejáveis. Entretanto, tais técnicas demelhoramento seletivo têm diversas desvantagens, quer dizer que estastécnicas são tipicamente de trabalho intensivo e resultam em plantas quefreqüentemente contêm componentes genéticos heterogêneos que podem nemsempre resultar na característica desejável sendo passada adiante a partir deplantas parentais. Avanços em biologia molecular permitiram ao ser humanomodificar o germoplasma de animais e plantas. Engenharia genética deplantas exige o isolamento e manipulação de material genético (tipicamentena forma de DNA ou RNA) e a subseqüente introdução de tal materialgenético em uma planta. Tal tecnologia tem a capacidade de gerar culturas ouplantas tendo várias características econômicas, agronômicas ou horticulturaismelhoradas.

Uma característica de particular interesse econômico éprodução aumentada. Produção normalmente é definido como a produçãomensurável de valor econômico de uma cultura. Isto pode ser definido emtermos de quantidade e/ou qualidade. Produção é diretamente dependente dediversos fatores, por exemplo, o número e tamanho dos órgãos, arquiteturavegetal (por exemplo, o número de galhos), produção de sementes,senescência foliar e mais. Desenvolvimento de raiz, absorção de nutrientes,tolerância a estresse e vigor precoce também podem ser fatores importantespara determinar produção. Otimizar os fatores mencionados acima podeportanto contribuir para aumentar produção de cultura.

Produção de sementes é uma característica particularmenteimportante, uma vez que as sementes de muitas plantas são importantes paranutrição humana e animal. Colheitas tal como, milho, arroz, trigo, canola esoja respondem por mais da metade do consumo calórico humano total, queratravés de consumo das próprias sementes ou através de consumo de produtosde carne criados com sementes processadas. Elas também são uma fonte deaçúcares, óleos e muitos tipos de metabólitos usados em processos industriais.Sementes contêm um embrião ( a fonte de novas partes aéreas e raízes) e umendosperma ( a fonte de nutrientes para crescimento de embrião durantegerminação e durante crescimento precoce de plântulas). O desenvolvimentode uma semente envolve muitos genes, e requer a transferência de metabólitosdas raízes, folhas e caules para a semente em desenvolvimento. Oendosperma, em particular, assimila os precursores metabólicos decarboidratos, óleos e proteínas e sintetiza estes em macromoléculas dearmazenamento para preencher o grão.

Outra importante característica para muitas culturas é vigorprecoce. Melhorar vigor precoce é um importante objetivo de programasmodernos de melhoramento de arroz tanto em cultivares de arroz temperadascomo tropicais. Raízes longas são importantes para ancoramento apropriadoao solo em arroz semeado em água. Onde arroz é semeado diretamente emcampos alagados, e onde plantas devem emergir rapidamente através de água,partes aéreas maiores estão associados com vigor. Onde sementeira em sulcosé praticada, mesocótilos e coleóptilos maiores são importantes para boaemergência de plântula. A capacidade de manipular vigor precoce em plantasseria de grande importância em agricultura. Por exemplo, vigor precoce fracotem sido uma limitação para a introdução de híbridos de milho (Zea mays L.)baseados em germoplasma de Cinturão do Milho no Atlântico Europeu.

Uma característica importante adicional é aquela de tolerânciamelhorada a estresse abiótico. Estresse abiótico é uma causa primária deperda de cultura ao redor do mundo, reduzindo produções médias para amaioria das principais cultivares em mais do que 50% (Wang et al., Planta(2003) 218: 1-14). Estresses abióticos podem ser causados por seca,salinidade, extremos de temperatura, toxicidade química e estresse oxidativo.

A capacidade de melhorar tolerância vegetal a estresse abiótico seria degrande vantagem econômica para fazendeiros ao redor do mundo e iriapermitir o cultivo de culturas durante condições adversas e em territórios ondecultivo de culturas pode não ser possível de outra maneira.

Rendimento de colheita portanto pode ser aumentadootimizando um dos fatores mencionados acima.

Dependendo da utilização, a modificação de certascaracterísticas de produção pode ser favorecida sobre outras. Por exemplopara aplicações tal como produção de forragem ou madeira, ou recurso debiocombustível, um aumento nas partes vegetativas de uma planta pode serdesejável, e para aplicações tal como produção de trigo, amido ou óleo, umaumento em parâmetros de semente pode ser particularmente desejável.

Mesmo entre os parâmetros de semente, alguns podem ser favorecidos sobreoutros, dependendo da aplicação. Vários mecanismos podem contribuir paraaumentar produção de sementes, quer isto seja na forma de tamanho desemente aumentado ou número de sementes aumentado.

Uma abordagem para aumentar produção (produção e/oubiomassa de sementes) em plantas pode ser através de modificação dosmecanismos de crescimento inerentes de uma planta, tal como o ciclo celularou várias vias de sinalização envolvidas em crescimento vegetal ou emmecanismos de defesa.

Foi descoberto agora que várias características de crescimentopodem ser melhoradas em plantas modulando expressão em uma planta de umácido nucleico codificando uma GRP (Proteína Relacionada a Crescimento)em uma planta. A GRP pode ser uma das seguintes: um fator de transcriçãoMADS-box (OsMADS15), um fator de transcrição PLT, um fator detranscrição bHLH, um fator de transcrição SPL15, e uma proteína dehalotolerância (HAL3).

INTRODUÇÃO

Proteínas de halotolerância

Muitos processos enzimáticos em uma célula requerem oenvolvimento de Coenzima A (CoA ou CoASH). Coenzima A (CoASH) éuma molécula altamente polar, consistindo de adenosina 3',5'-difosfato ligadaa ácido 4-fosfopantetênico (Vitamina B5) e desde então a β-mercaptoetilamina. O grupo SH livre pode ser esterificado, dependendo doprocesso no qual CoA está envolvida. A via de síntese de CoA foi elucidadaem bactérias, animais e plantas. Em plantas, a conversão do precursor de CoA4'-fosfopantotenoil-cisteína (PPC) em 4'-fosfopanteteína é catalisada pelaflavoproteína 4'-fosfopantotenoil-cisteína descarboxilase (PPCDC ou HAL3,Kupke et al. J. Biol. Chem. 276, 19190-19196, 2001). O gene codificandoproteínas HAL3 pode ser parte de uma família pequena de genes: o genomade Arabidopsis compreende duas isoformas (AtHAL3a e AtHAL3b;Espinoza-Ruiz et al. Plant J. 20, 529-539, 1999), em tabaco 3 genes HAL3estão presentes (Yonamine et al. J. Exp. Bot. 55, 387-395, 2004), embora emarroz HAL3 seja um gene de única cópia. E sugerido que AtHAL3 e outrasproteínas HAL3 funcionem como um trímero, com cada monômero tendo ummononucleotídeo de flavina (FMN) ligado (Albert et al. Structure 8, 961-969,2000). É postulado que o cofator FMN desempenha um papel na reação redoxgerando 4'- fosfopanteteína.

A função molecular de proteínas HAL3 não é completamenteelucidada ainda. As proteínas HAL3 mostram homologia com a proteína SIS2de levedura, que está envolvida em halotolerância (Ferrando et al., Mol. Cell.Biol. 15, 5470-5481). Plantas ou células de planta expressando ectopicamenteHALS mostram tolerância salina, osmótica ou a estresse por lítio melhorada(Espinoza-Ruiz et al., 1999; Yonamine et al., 2004). Superexpressão deHAL3a tabaco em células BY2 de acordo com o relatado causou um aumentoem conteúdo intracelular de prolina, o que pode contribuir para o fenótipotolerante a sal (Yonamine et al., 2004). Além disso, plantas de Arabidopsissuperexpressando AtHALSa apresentaram uma taxa de crescimento maisrápida do que as plantas tipo selvagem (Espinoza-Ruiz et al., 1999). Aproteína AtHAL3b também mostrou interagir com a proteína de ciclo celularCDKBl;1 (Patente Internacional 00/36124), portanto foi postulado queAtHAL3b é útil para conferir tolerância a estresse salino a plantas e paraaumentar a taxa de crescimento de plantas em condições de estresse salino.Surpreendentemente, foi descoberto agora que aumentar preferencialmenteexpressão de um ácido nucleico codificando um polipeptídeo HAL3 emtecidos em expansão gera plantas tendo produção aumentada em relação aplantas de controle, cujo aumento de produção é de pelo menos 10%comparado com as plantas de controle.

Fatores de transcrição

Fatores de transcrição normalmente são definidos comoproteínas que se ligam a um elemento cis-regulador (eg. um acentuador, umacaixa TATA) e que, em associação com RNA polimerase, são capazes deativar e/ou reprimir transcrição. O genoma de Arabidopsis codifica para pelomenos 1533 reguladores transcricionais, que respondem por -5.9% de seunúmero total estimado de genes (Riechmann et aí., 2000 (Science Vol. 290,2105-2109)).

MADS15

Os genes MADS-box constituem uma grande família de genesde reguladores transcricionais eucarióticos envolvidos em diversos aspectosde desenvolvimento de levedura, planta e animal. Genes MADS-boxcodificam um domínio MADS fortemente conservado responsável por ligarDNA a caixas específicas na região reguladora de seus genes alvo. A famíliade genes pode ser dividida em duas linhagens principais, tipo I e tipo II.Genes Tipo II também são chamados de proteínas tipo MIKC5 referindo aosquatro domínios funcionais que eles possuem (Figura 5, (Jack, Plant Mol.Biol. 46,515-520, 2001)):

- MADS para ligação de DNA5 cerca de 60 aminoácidos(altamente conservados) localizado na extremidade N-terminal da proteína;- I para domínio interveniente (menos conservado),envolvido na formação seletiva de dímero MADS;

- K para domínio de queratina (bem conservado)responsável por dimerização;

- C para região C-terminal (variável em seqüência ecomprimento) envolvida em ativação transcricional, ou na formação de umcomplexo multimérico de fator de transcrição.

Mais de 100 genes MADS-box foram identificados emArabidopsis, e foram filogeneticamente classificados em 12 ciados, cadaciado tendo derivações específicas do consenso de MADS (Thiessen et ai. JMol. Evol. 43, 484-516, 1996). OsMADS15 pertence ao ciado SQUA (paraSQUAMOSA, de Antirrhinum majus). Genes do ciado SQUA sãoclassificados como genes de identidade de órgão de função A com referênciaao modelo de especificação de identidade de órgão floral ABC, proposto porCoen e Meyerowitz em 1991 (Nature 353, 31-7). Além de OsMADS15,OsMADS 14, OsMADS18, e OsMADS20 de arroz também são parte do ciadoSQUA.

O ciado SQUA em plantas dicotiledôneas (dicotiledôneas) ésubdividido em dois subgrupos, os subclados APl e o FUL (nos qualOsMADS 15 se agrupa). Estes subclados divergem essencialmente comrespeito aos motivos de aminoácidos específicos localizados no término C desuas respectivas proteínas (Litt and Irish, Genetics 165, 821-833, 2003). Emadição à presença de um motivo de aminoácido APl específico, as proteínasrelacionadas a ciado APl de dicotiledônea normalmente compreendem ummotivo de farnesilação no término C (este motivo é CAAX, onde C é cisteína,A normalmente é um aminoácido alifático, e X é metionina, glutamina,serina, cisteína ou alanina). Em plantas monocotiledôneas(monocotiledôneas), as proteínas de ciado SQUA também são subdivididasem dois grupos principais, que podem ser distinguidos baseados em motivosC-terminais conservados localizados dentro dos últimos 15 aminoácidos dasproteínas: LPPWMLS (por exemplo, OsMADS 15, SEQ ID NO: 117) eLPPWMLR (por exemplo, OsMADS 18). Em contraste com seqüências dedicotiledôneas do ciado SQUA, seqüências de monocotiledôneas do ciadoSQUA não possuem um motivo de farnesilação em seu término C.OsMADS 15 foi postulado funcionar em um complexo comoutras proteínas para controlar formação de órgão. Entretanto, até agoranenhum mutante com um fenótipo visível foi identificado; nenhum dadoexperimental foi apresentado em relação à expressão ectópica ou expressãodiminuída de OsMADSl 5, exceto para os dados apresentados em PatenteInternacional 01/14559 (Patente Européia 1209232, Patente Norte-Americana6.995.302). Nesta descrição, plantas transgênicas de Fagopyrum esculentumexpressando OsMADS15 em direção sentido mostraram ramificaçãoaumentada, ao passo que transgênicas expressando a construção antisentidotiveram crescimento diminuído e ramificação suprimida. Kalanchoèdaigremontiana transformada com a construção sentido teve desenvolvimentofoliar ao redor das raízes, que foi adotado como uma indicação de ramificaçãoaumentada. Os autores determinaram que nenhuma mudança foi observadaem termos de desenvolvimento floral e estrutura destas flores. O ortólogo deOsMADS 15 em Arabidopsis é APETALAI (AP1). Expressão ectópica deAPl resulta em uma diminuição de tempo de florescimento, e APl mutantesexibem florescimento atrasado e têm flores anormais.

PLT

A família de AP2(apetala2)/ERF (fator de ligação de elementoresponsivo a etileno) compreende fatores de transcrição com pelo menos umdomínio de ligação de DNA altamente conservado, o domínio AP2. Odomínio AP2 foi originalmente descrito em APETALA2 (AP2), uma proteínade Arabidopsis envolvida em programas de desenvolvimento tal comoregulação de identidade de meristema e especificação de órgão floral (Jofukuet al, (1994) Plant Cell 6, 1211-1225). Proteínas AP2/ERF são divididas emsubfamílias baseado em se elas contêm um (subfamília ERF) ou dois(subfamília AP2) domínios de ligação de DNA (Figura 12). Mais do que 140genes AP2/ERF foram identificados no genoma de Arabidopsis thaliana(Reichmann et ai. (2000) Science 290: 2105-2110), dentre os quais até 18pertencem à subfamília AP2 (Kim et ai. (2006) Mol Bio Evol 23(1): 107-120).

Dois polipeptídeos de fator de transcrição AP2 de Arabidopsis,codificados pelos genes Plethora 1 (PLTl) e Plethora 2 (PLT2),colletivamente chamados de genes PLT, mostraram ser requeridos paraespecificação de célula tronco e manutenção especificamente no meristema deraiz. Em análise RT-PCR, transcritos de PLT foram detectadosprincipalmente em raízes in, indicando que expressão de PLT é fortementeassociada com identidade de raiz. Expressão ectópica de PLT no embrião deArabidopsis induz transformação homeótica de domínios apicais em célulastronco de raiz, raízes, ou hipocótilos (Aida et al (2004) Cell 119:109-120).

Pedido de Patente Norte-Americana 2004/0045049 e Pedidode Patente Internacional W003/013227 fornecem a seqüência de ácidosnucleicos codificando o fator de transcrição PLTl de Arabidopsis (referidosnos pedidos como Gl 793). Superexpressão de G1793 (usando o promotorCaMV 35S) em Arabidopsis foi relatada produzindo alterações emmorfologia de coltilédone, uma leve redução em tamanho geral de planta einflorescências finas (possivelmente com flores anormais) comparado comcontroles tipo selvagem. Superexpressores de G1793 produzem mais óleo desemente do que plantas de controle. Seqüências de ácidos nucleicoscodificando ortólogos potenciais de Glycine max, Oryza sativa e Zea mayssão fornecidas.

Pedido de Patente Internacional WO 03/002751 estabeleceuma seqüência de ácidos nucleicos de Glycine max codificando umpolipeptídeo PLT, com similaridade de seqüência com uma seqüência deácidos nucleicos de milho identificada por definição de perfil de (pormicroarranjo de DNA).

Pedido de Patente Internacional WO 05/075655 estabeleceseqüências de ácidos nucleicos de Oryza sativa e Zea mays com similaridadede seqüência com os genes PLT de Arabidopsis.

bHLH

As proteínas hélice-alça-hélice básicas (bHLH) são umasuperfamília de fatores de transcrição que se ligam como dímeros a sítios alvode DNA específicos e que foram bem caracterizados em eucariotos nãovegetais como componentes reguladores importantes em diversos processosbiológicos. As características diferenciadas da superfamília bHLH é umdomínio bipartido consistindo de aproximadamente 60 aminoácidos. Estedomínio bipartido é compreendido de uma região básica de ligação de DNA,que se liga a um hexanucleotídeo consenso E-box e duas α-hélices separadaspor uma região circular variável. As duas α-hélices promovem dimerização,permitindo a formação de homo e heterodímeros entre diferentes membros defamília. Enquanto que o domínio bHLH é evolutivamente conservada, hápouca similaridade de seqüência entre ciados além do domínio.

Bailey et ai, 2003 (The Plant Cell, Vol. 15, 2497-2501)relatam o número total de genes bHLH detectados em Arabidopsis thalianacomo sendo 162, tornando genes bHLH uma das maiores famílias de fatoresde transcrição em Arabidopsis; o genoma de arroz de acordo com o relatadocontém 131 genes bHLH (Buck and Atchley, 2003 (J. Mol. Evol. 56:742-750)). Heim et al., 2003 (Mol. Biol. Evol. 20(5):735-747) identificaram 12subfamílias de genes bHLH de Arabidopsis thaliana baseados emsimilaridades estruturais.

As proteínas bHLH de plantas que foram caracterizadas foramrelatadas funcionando em biossíntese de antocianina, sinalização defitocromo, expressão de globulina, deiscência dos frutos, desenvolvimento decarpelo e epidérmico (Buck and Atchley, 2003).

SPL

Os polipeptídeos de fator de transcrição tipo proteína deligação de promotor Squamosa (SPL) são proteínas estruturalmente diversasque compartilham um domínio de ligação de DNA (DBD) altamenteconservado de cerca de 80 resíduos de aminoácidos de comprimento (Klein etal. (1996) Mol Gen Genet 259: 7-16; Cardon et al. (1999) Gene 237: 91-104).O sítio de ligação de seqüência consenso de DNA de fator de transcrição SPLno promotor de genes alvo é 5 '-TNCGTACAA-3' onde N representa qualquerbase. Dentro do DBD de SPL há dez resíduos conservados de cisteína (Cys)ou histidina (His) (veja Figura 23) dos quais oito são resíduos coordenadoresde zinco ligando dois íons de zinco necessários para a formação de estruturaterciária de dedo de zinco específico de SPL (Yamasaki et al. (2004) J MolBiol 337: 49-63). Uma segunda característica conservada dentro do DBD deSPL é um sinal de localização nuclear bipartido. Fora do DBD, um motivoalvo (miR156) de micro RNA (miRNA) é encontrado na maioria dasseqüências de ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL (ou na região de codificação, ou na 3' UTR) ao longo doreino vegetal (Rhoades et al. (2002) Cell 110: 513-520). miRNAs controlamexpressão de gene SPL pós-transcricionalmente direcionando mRNAscodificando SPL para degradação ou por repressão traducional.

Riechmann et al. (Science 290: 2105-2109, 2000) relatam 16polipeptídeos de fator de transcrição SPL em Arabidopsis thaliana, compouca similaridade de seqüência entre eles (além das característicasmencionadas acima), o tamanho do polipeptídeo SPL deduzido variando de131 a 927 aminoácidos. Contudo, pares de polipeptídeos de fator detranscrição SPL compartilhando maior homologia de seqüência foramdetectadas dentro da família SPL desta planta (Cardon et al. (1999)).

Os polipeptídeos de fator de transcrição SPL (apenasencontrados em plantas) caracterizados até o momento demonstraramfuncionar em desenvolvimento vegetal, em particular em desenvolvimentofloral. Plantas transgênicas superexpressando um polipeptídeo de fator detranscrição SPL3 demonstraram florescer mais cedo (Cardon et al. (1997)PlantJ 12:367-377).

Em Pedido de Patente Européia EP1033405, as seqüências deácidos nucleicos e polipeptídeo deduzido do polipeptídeo de fator detranscrição SPL15 são apresentadas.

Em Pedido de Patente Internacional W003013227, aseqüência de ácidos nucleicos (e seqüência de polipeptídeo deduzido;referência interna G2346) é apresentada que codifica parte do polipeptídeo defator de transcrição SPL15 entretanto 38 aminoácidos da extremidade C-terminal do fator de transcrição SPLl5. Plantas transgênicas de Arabidopsisthaliana superexpressando constitutivamente o polipeptídeo de fator detranscrição SPL15 modificado (ou G2346) teve cotilédones levementeaumentados. Em estágios tardios de desenvolvimento, as mesmas plantas nãodemonstraram nenhuma diferença consistente de plantas de controle.

SUMÁRIO DA INVENÇÃO

Surpreendentemente, foi descoberto agora que aumentarpreferencialmente expressão de um ácido nucleico codificando umpolipeptídeo HAL3 em tecidos em expansão gera plantas tendo característicasde produção melhoradas, em particular vigor precoce aumentado e produçãoaumentada de sementes em relação a plantas de controle, cujo aumento emprodução de sementes é pelo menos 10% comparado com as plantas decontrole.

De acordo com outra forma de realização da presenteinvenção, é fornecido um método para melhorar características de produção,em particular para aumentar vigor precoce de uma planta e aumentarprodução de sementes de uma planta, em relação a plantas de controle,compreendendo aumentar preferencialmente expressão de um ácido nucleicocodificando um polipeptídeo HAL3 em tecidos em expansão de uma planta.

Surpreendentemente, foi descoberto agora que modularexpressão de um ácido nucleico codificando um polipeptídeo MADS15 geraplantas tendo características de produção melhoradas, em particular produçãoaumentada em relação a plantas de controle.

De acordo com uma forma de realização, é fornecido ummétodo para aumentar produção vegetal em relação a plantas de controle,compreendendo aumentar expressão de um ácido nucleico codificando umpolipeptídeo MADS15 em uma planta. A produção aumentada compreendeubiomassa vegetativa aumentada, mas não produção aumentada de sementes.

De acordo com outra forma de realização, a presente invençãofornece métodos para aumentar produção de uma planta em relação a plantasde controle, compreendendo diminuir o nível e/ou atividade de umpolipeptídeo MADS15 endógeno. A produção aumentada compreendeu maiorprodução de sementes, mas não compreendeu biomassa vegetativaaumentada.

Surpreendentemente, foi descoberto agora que aumentarexpressão de um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT gera plantas tendo características de produção melhoradas,em particular produção aumentada em relação a plantas de controle.

De acordo com uma forma de realização adicional, é fornecidoum método para aumentar produção vegetal em relação a plantas de controle,compreendendo aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT.

Surpreendentemente, foi descoberto agora que modularexpressão em uma planta de um ácido nucleico codificando uma classeparticular de fator de transcrição bHLH gera plantas tendo características deprodução melhoradas em relação a plantas de controle. A classe particular defator de transcrição bHLH adequada para melhorar características deprodução em plantas é descrita em detalhe abaixo.

De acordo com uma forma de realização adicional, a presenteinvenção fornece um método para melhorar características de produção emplantas em relação a plantas de controle, compreendendo modular expressãoem uma planta de um ácido nucleico codificando uma classe particular defator de transcrição bHLH.

Surpreendentemente, foi descoberto agora que aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeode fator de transcrição SPL15 gera plantas tendo características de produçãomelhoradas, em particular produção aumentada em relação a plantas decontrole.

De acordo com uma forma de realização adicional, a invençãofornece um método para aumentar produção em plantas em relação a plantasde controle, compreendendo aumentar expressão em uma planta de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15.DEFINIÇÕES

Polipeptideo(S)ZProteina(S)

Os termos "polipeptídeo" e "proteína" são usadospermutavelmente neste lugar e se referem a aminoácidos em uma formapolimérica de qualquer comprimento.

Polinucleotídeo(s)/Acido(s) nucleico(s)/Seqüência(s) de ácidosnucleicos/seqüência(s) de nucleotídeos

Os termos "polinucleotídeo(s)", "seqüência(s) de ácidosnucleicos", "seqüência(s) de nucleotídeos", "ácido(s) nucleico(s)" são usadospermutavelmente neste lugar e se referem a nucleotídeos, ou ribonucleotídeosou desoxirribonucleotídeos ou uma combinação de ambos, em uma formapolimérica de qualquer comprimento.

Planta(s) de controle

A escolha de plantas de controle adequadas é uma parte derotina de uma estrutura experimental e pode incluir plantas tipo selvagemcorrespondentes ou plantas correspondentes sem o gene de interesse. A plantade controle é tipicamente da mesma espécie de planta ou mesmo a mesmavariedade do que a planta a ser verificada. A planta de controle também podeser um nulizigoto da planta a ser verificada. Uma "planta de controle" comousado neste lugar se refere não apenas a plantas inteiras, mas também a partesvegetais, incluindo sementes e partes de sementes.

Homólogo(s)

"Homólogos" de uma proteína abrangem peptídeos,oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições,deleções e/ou inserções de aminoácidos em relação à proteína não modificadaem questão e tendo atividade biológica e funcional similar à proteína nãomodificada da qual eles são derivados.

Uma deleção se refere a remoção de um ou mais aminoácidosde uma proteína.

Uma inserção se refere a um ou mais resíduos de aminoácidossendo introduzidos em um sítio pré-determinado em uma proteína. Inserçõespodem compreender fusões N-terminais e/ou C-terminais assim comoinserções intra-seqüência de aminoácidos únicos ou múltiplos. Geralmente,inserções dentro da seqüência de aminoácidos serão menores do que fusõesN- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos deproteínas ou peptídeos de fusão N- ou C-terminais incluem o domínio deligação ou domínio de ativação de um ativador transcricional como usado nosistema de dois híbridos de levedura, proteínas de revestimento de fago,etiqueta de (histidina)-ó, etiqueta de glutationa S-transferase, proteína A,proteína de ligação de maltose, dihidrofolato redutase, epítopo Etiqueta· 100,epítopo c-myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligaçãocalmodulina), epítopo HA, epítopo de proteína C e epítopo VSV.

Uma substituição se refere à substituição de aminoácidos daproteína por outros aminoácidos tendo propriedades similares (tal comohidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ouquebrar estruturas α-helicoidais ou estruturas de folha β similares).Substituições de aminoácidos tipicamente são de resíduos únicos, mas podemser agrupadas dependendo de restrições funcionais colocadas no polipeptídeo;inserções normalmente serão da ordem de cerca de 1 a 10 resíduos deaminoácidos. As substituições de aminoácidos são preferivelmente assubstituições de aminoácidos conservativas. Tabelas de SubstituiçãoConservativa são bem conhecidas na arte (veja, por exemplo, Creighton(1984) Proteins. W.H. Freeman and Company e Tabela 1 abaixo).

Tabela 1: Exemplos de substituições conservadas deaminoácidos

<table>table see original document page 17</column></row><table>

Substituições, deleções e/ou inserções de aminoácidos podemser prontamente feitas usando técnicas de peptídeo sintético bem conhecidasna arte, tal como síntese de peptídeo em fase sólida e os semelhantes, ou pormanipulação de DNA recombinante. Métodos para a manipulação deseqüências de DNA para produzir variantes de substituição, inserção oudeleção de uma proteína são bem conhecidos na arte. Por exemplo, técnicaspara fazer mutações por substituição em sítios pré-determinados em DNA sãobem conhecidas por aqueles versados na arte e incluem mutagênese Ml3,mutagênese in vitro T7-Gen (USB, Cleveland, OH), mutagênese dirigida asítio QuickChange (Stratagene, San Diego, CA), mutagênese dirigida a sítiomediada por PCR ou outros protocolos de mutagênese dirigida a sítio.

Derivados"Derivados" incluem peptídeos, oligopeptídeos, polipeptídeosque podem, comparados com a seqüência de aminoácidos da formanaturalmente ocorrente da proteína, tal como a proteína de interesse,compreender substituições de aminoácidos com resíduos de aminoácidos nãonaturalmente ocorrentes, ou adições de resíduos de aminoácidos nãonaturalmente ocorrentes. "Derivados" de uma proteína também abrangempeptídeos, oligopeptídeos, polipeptídeos que compreendem resíduos deaminoácidos naturalmente ocorrentes alterados (glicosilados, acilados,prenilados, fosforilados, miristoilados, sulfatados etc.) ou resíduos deaminoácidos não naturalmente alterados comparado com a seqüência deaminoácidos de uma forma naturalmente ocorrente do polipeptídeo. Umderivado também pode compreender um ou mais substituintes ou adições denão aminoácidos comparado com a seqüência de aminoácidos da qual ele éderivado, por exemplo uma molécula repórter ou outro ligante,covalentemente ou não covalentemente ligado à seqüência de aminoácidos, talcomo uma molécula repórter que é ligada para facilitar sua detecção, eresíduos de aminoácidos não naturalmente ocorrentes em relação à seqüênciade aminoácidos de uma proteína não naturalmente ocorrente.

Ortólogo(s)/Parálogo(s)

Ortólogos e parálogos abrangem conceitos evolutivos usadospara descrever relações ancestrais de genes. Paralogues são genes dentro damesma espécie que se originaram através de duplicação de um gene ancestrale ortólogos são genes de organismos diferentes que se originaram através deespeciação.

Domínio

O termo "domínio" se refere a um conjunto de aminoácidosconservados em posições específicas ao longo de um alinhamento deseqüências de proteínas evolutivamente relacionadas. Enquanto queaminoácidos em outras posições podem variar entre homólogos, aminoácidosque são são altamente conservados em posições específicas indicamaminoácidos que provavelmente são essenciais na estrutura, estabilidade oufunção de uma proteína. Identificados por seu alto grau de conservação emseqüências alinhadas de uma família de homólogos de proteína, eles podemser usados como identificadores para determinar se qualquer polipeptídeo emquestão pertence a uma família de polipeptídeo previamente identificada.

Motivo/Seqüência consenso/Assinatura

O termo "motivo" ou "seqüência consenso" ou "assinatura" serefere a uma região conservada curta na seqüência de proteínasevolutivamente relacionadas. Motivos freqüentemente são partes altamenteconservadas de domínios, mas também podem incluir apenas parte dodomínio, ou estarem localizados fora de domínio conservado (se todos osaminoácidos do motivo caem fora de um domínio definido).

Hibridização

O termo "hibridização" como definido neste lugar é umprocesso caracterizado pelo fato de que seqüências de nucleotídeoscomplementares substancialmente homólogas se anelam uma a outra. Oprocesso de hibridização pode ocorrer inteiramente em solução, i.e. ambosácidos nucleicos complementares estão em solução. O processo dehibridização também pode ocorrer com um dos ácidos nucleicoscomplementares imobilizado a uma matriz tal como microesferas magnéticas,microesferas de Sepharose ou qualquer outra resina. O processo dehibridização além disso pode ocorrer com um dos ácidos nucleicoscomplementares imobilizado a um suporte sólido tal como uma membrana denitrocelulose ou de náilon ou imobilizado por e.g. fotolitografia a, porexemplo, um suporte de vidro silicioso (o último conhecido como arranjos oumicroarranjos de ácido nucleico ou como circuitos integrados de ácidonucleico). A fim de permitir que hibridização ocorra, as moléculas de ácidosnucleicos geralmente são termalmente ou quimicamente desnaturadas paraderreter uma dupla fita em duas fitas simples e/ou para remover estruturas emgrampo ou outras estruturas secundárias de ácidos nucleicos de fita simples.

O termo "estringência" se refere às condições nas quais umahibridização pode ocorrer. A estringência de hibridização é influenciada porcondições tal como temperatura, concentração salina, força iônica ecomposição de tampão de hibridização. Geralmente, condições de baixaestringência são selecionadas para ser cerca de 30°C menores do que o pontode fusão térmica (Tm) para a seqüência específica em uma força iônica e pHdefinidos. Condições de média estringência são quando a temperatura é 20°Cabaixo de Tm, e condições de alta estringência são quando a temperatura é10°C abaixo de Tm. Condições de hibridização de alta estringênciatipicamente são usadas para isolar Seqüências de hibridização que têm altasimilaridade de seqüência com a seqüência de ácidos nucleicos alvo.Entretanto, ácidos nucleicos podem desviar em seqüência e ainda codificarum polipeptídeo substancialmente idêntico, devido à degenerescência docódigo genético. Portanto condições de hibridização de média estringênciapodem ser algumas vezes necessárias para identificar tais moléculas de ácidosnucleicos.

A Tm é a temperatura em força iônica e pH definidos, na qual50% da seqüência alvo hibridiza com uma sonda perfeitamente compatível. ATm é dependente das condições de solução e da composição de base ecomprimento da sonda. Por exemplo, seqüências maiores hibridizamespecificamente em temperaturas superiores. A taxa máxima de hibridização éobtida a partir de cerca de 16°C até 32°C abaixo de Tm. A presença de cátionsmonovalentes na solução de hibridização reduz a repulsão eletrostática entreas duas fitas de ácidos nucleicos com isso promovendo formação de híbrido;este efeito é visível para concentrações de sódio de até 0,4M (paraconcentrações maiores, este efeito pode ser ignorado). Formamida reduz atemperatura de fusão de duplexes DNA-DNA e DNA-RNA com 0,6 a 0,7°Cpara cada formamida percentual, e adição de 50% de formamida permite quehibridização seja realizada a 30 a 45°C, embora a taxa de hibridização sejadiminuída. Pareamento incorreto de bases reduz a taxa de hibridização e aestabilidade térmica dos duplexes. Em média e para sondas grandes, a Tmdiminui cerca de 1°C por % de pareamento incorreto de bases. A Tm pode sercalculada usando as seguintes equações, dependendo dos tipos de híbridos:

1) Híbridos de DNA-DNA (Meinkoth and Wahl, Anal.Biochem., 138: 267-284, 1984):

Tm= 81,5°C + 16,6xlogi0[Na+]a + 0,41x%[G/Cb] - SOOxtLc]-1 -0,6 lx% formamida

2) Híbridos de DNA-RNA ou RNA-RNA:

Tm= 79,8 + 18,5 (logio[Na+]a) + 0,58 (%G/Cb) +11,8 (%G/Cb)2

- 820/Lc

3) Híbridos de oligo-DNA ou oligo-RNAd:

Para <20 nucleotídeos: Tm= 2 (In)

Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)

a ou para outro cátion monovalente, mas apenas acurado nointervalo 0,01-0,4 M.

b apenas acurado para %GC no intervalo de 30% a 75%.

cL = comprimento de duplex em pares de bases.

d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador= 2x(no. de G/C)+(no. de A/T).

Ligação não específica pode ser controlada usando qualqueruma das diversas técnicas conhecidas tal como, por exemplo, bloqueando amembrana com soluções contendo proteína, adições de RNA, DNA, e SDSheterólogo ao tampão de hibridização, e tratamento com Rnase. Para sondasnão homólogas, uma série de hibridizações podem ser realizadas variando umde (i) diminuindo progressivamente a temperatura de anelamento (porexemplo de 68°C para 42°C) ou (ii) diminuindo progressivamente aconcentração de formamida (por exemplo de 50% para 0%). O artesãoversado está ciente de vários parâmetros que podem ser alterados durantehibridização e que irão ou manter ou mudar as condições de estringência.

Além das condições de hibridização, especificidade dehibridização tipicamente também depende da função de lavagens póshibridização. Para remover antecedentes resultando de hibridização nãoespecífica, amostras são lavadas com soluções salinas diluídas. Fatorescríticos de tais lavagens incluem a força iônica e temperatura da solução delavagem final: quanto menor a concentração salina e maior a temperatura delavagem, maior é a estringência da lavagem. Condições de lavagem sãotipicamente realizadas em ou abaixo de estringência de hibridização. Umahibridização positiva gera um sinal que é pelo menos duas vezes aquele doantecedente. Geralmente, condições estringentes adequadas para ensaios dehibridização de ácidos nucleicos ou procedimentos de detecção deamplificação de gene são como expostos acima. Condições mais ou menosestringentes também podem ser selecionadas. O artesão versado está ciente devários parâmetros que podem ser alterados durante lavagem e que irão oumanter ou mudar as condições de estringência.

Por exemplo, condições de hibridização de alta estringênciatípicas para híbridos de DNA maiores do que 50 nucleotídeos abrangemhibridização a 65°C em Ix SSC ou a 42°C em Ix SSC e 50% formamida,seguido por lavagem a 65°C em 0.3x SSC. Exemplos de condições dehibridização de média estringência para híbridos de DNA maiores do que 50nucleotídeos abrangem hibridização a 50°C em 4x SSC ou a 40°C em 6x SSCe 50% formamida, seguido por lavagem a 50°C em 2x SSC. O comprimentodo híbrido é o comprimento antecipado para o ácido nucleico hibridizante.

Quando ácidos nucleicos de seqüência conhecida são hibridizados, ocomprimento de híbrido pode ser determinado alinhando as seqüências eidentificando as regiões conservadas descritas neste lugar. IxSSC é 0,15M deNaCl e 15mM de citrato de sódio; a solução de hibridização e soluções delavagem podem incluir adicionalmente 5 χ de reagente de Denhardt, 0,5-1,0%de SDS, 100 μg/ml de DNA de esperma de salmão fragmentado desnaturado,0,5% de pirofosfato de sódio.

Para os propósitos de definir o nível de estringência, referênciapode ser feita a Sambrook et al. (2001) Molecular Cloning: a laboratorymanual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New Yorkou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989e atualizações anuais).

Variante de processamento

O termo "variante de processamento" como usado neste lugarabrange variantes de uma seqüência de ácidos nucleicos nas quais íntrons e/ouéxons selecionados foram cortados, substituídos, deslocados ou adicionados,ou nas quais íntrons foram encurtados ou alongados. Tais variantes serãoumas nas quais a atividade biológica da proteína é substancialmente mantida;isto pode ser atingido mantendo seletivamente segmentos funcionais daproteína. Tais variantes de união podem ser encontradas na natureza oupodem ser feitas pelo homem. Métodos para prever e isolar tais variantes deunião são bem conhecidos na arte (veja por exemplo Foissac and Schiex,BMC Bioinformatics. 2005; 6: 25).

Variante alélica

Alelos ou variantes alélicas são formas alternativas de umdado gene, localizado na mesma posição cromossômica. Variantes alélicasabrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim comoPolimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho deINDELs normalmente é menor do que 100 bp. SNPs e INDELs formam omaior conjunto de variantes de seqüência em linhagens polimórficasnaturalmente ocorrentes da maioria dos organismos.

Embaralhamento gênico/Evolução dirigidaEmbaralhamento gênico ou evolução dirigida consiste derepetições de embaralhamento de DNA seguido por triagem e/ou seleçãoapropriada para gerar variantes de ácidos nucleicos ou porções destescodificando proteínas tendo uma atividade biológica modificada (Castle et al.,(2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e6.395.547).

Elemento regulador/Seqüência de controle/Promotor

Os termos "elemento regulador", "seqüência de controle" e"promotor" são todos usados permutavelmente neste lugar e devem seradotados em um amplo contexto para se referir a seqüências reguladoras deácidos nucleicos capazes de efetuar expressão das seqüências aos quais elessão ligados. O termo "promotor" tipicamente se refere a uma seqüência decontrole de ácido nucleico localizada antes do início transcricional de umgene e que está envolvida em reconhecimento e ligação de RNA polimerase eoutras proteínas, com isso dirige transcrição de um ácido nucleicooperacionalmente ligado. Abrangidas pelos termos mencionados acima sãoseqüências reguladoras transcricionais derivadas de um gene genômicoeucariótico clássico (incluindo a caixa TATA que é requerida para iniciaçãoacurada de transcrição, com ou sem uma seqüência de caixa CCAAT) eelementos reguladores adicionais (i.e. seqüências situadas acima dospromotores gênicos, acentuadores e silenciadores) que alteram expressão degene em resposta a desenvolvimento e/ou estímulos externos, ou de umamaneira tecido específica. Também incluída dentro do termo é uma seqüênciareguladora transcricional de um gene procariótico clássico, em cujo caso elapode incluir uma seqüência de caixa -35 e/ou seqüências reguladorasadicionais de caixa -10. O termo "elemento regulador" também abrange umamolécula de fusão sintética ou derivado que confere, ativa ou acentuaexpressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.

Um "promotor vegetal" compreende elementos reguladores,que mediam a expressão de um segmento de seqüência de codificação emcélulas de planta. Por conseguinte, um promotor vegetal não precisa ser deorigem vegetal, mas pode se originar de vírus ou microorganismos, porexemplo de vírus que atacam células de planta. O "promotor vegetal" tambémpode se originar de uma célula vegetal, e.g. da planta que é transformada coma seqüência de ácidos nucleicos a ser expressa no processo inventivo edescrito neste lugar. Isto também se aplica outros sinais reguladores"vegetais", tal como terminadores "vegetais". Os promotores antes dasseqüências de nucleotídeos úteis nos métodos da presente invenção podem sermodificados por uma ou mais substituição(ões), inserção(ões) e/oudeleção(ões) de nucleotídeos sem interferir na funcionalidade ou atividade dequalquer dos promotores, o quadro aberto de leitura (ORF) ou a regiãoreguladora 3' tal como terminadores ou outras regiões reguladoras 3' que estãolocalizadas fora do ORR Além disso é possível que a atividade dospromotores seja aumentada por modificação de sua seqüência, ou que elessejam completamente substituídos por promotores mais ativos, mesmopromotores de organismos heterólogos. Para expressão em plantas, amolécula de ácido nucleico deve, como descrito acima, ser operacionalmenteligada a ou compreender um promotor adequado que expressa o gene nomomento certo e com o padrão de expressão espacial requerido.

Para a identificação de promotores funcionalmenteequivalentes, a força de promotor e/ou padrão de expressão de um promotorcandidato pode ser analisado por exemplo ligando operacionalmente opromotor a um gene repórter e ensaiando o nível e padrão de expressão dogene repórter em vários tecidos da planta. Genes repórteres bem conhecidosadequados incluem por exemplo beta-glucuronidase ou beta galactosidase. Aatividade de promotor é ensaiada medindo a atividade enzimática da beta-glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão deexpressão podem ser comparados com aqueles de um promotor de referência(tal como aquele usado nos métodos da presente invenção). Alternativamente,força de promotor pode ser ensaiada quantificando níveis de mRNA oucomparando níveis de mRNA do ácido nucleico usado nos métodos dapresente invenção, com níveis de mRNA de genes responsáveis pelamanutenção do metabolismo celular tal como 18S rRNA, usando métodosconhecidos na arte, tal como Northern blotting com análise densitométrica deautoradiogramas, PCR quantitativo em tempo real ou RT-PCR (Heid et al.,1996 Genome Methods 6: 986-994). Geralmente por "promotor" fraco épretendido um promotor que dirige expressão de uma seqüência decodificação em um nível baixo. Por "nível baixo" é pretendido em níveis decerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos a cerca de1/500.0000 transcritos por célula. Inversamente, um "promotor forte" dirigeexpressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10transcritos a cerca de 1/100 transcritos a cerca de 1/1.000 transcritos porcélula.

Operacionalmente ligado

O termo "operacionalmente ligado" como usado neste lugar serefere a uma ligação funcional entre a seqüência de promotor e o gene deinteresse, de forma que a seqüência de promotor é capaz de iniciar transcriçãodo gene de interesse.

Promotor constitutivo

Um "promotor constitutivo" se refere a um promotor que étranscricionalmente ativo durante a maioria, mas não necessariamente todas,fases de crescimento e desenvolvimento e na maioria das condiçõesambientais, em pelo menos uma célula, tecido ou órgão. Tabela 2 abaixofornece exemplos de promotores constitutivos.Tabela 2: Exemplos de promotores constitutivos

<table>table see original document page 27</column></row><table>

Promotor ubíquo

Um promotor ubíquo é ativo em substancialmente todostecidos ou células de um organismo.

Promotor regulado por desenvolvimento

Um promotor regulado por desenvolvimento é ativo durantecertos estágios de desenvolvimento ou em partes da planta que passam pormudanças evolutivas.

Promotor induzível

Um promotor induzível tem início de transcrição induzido ouaumentado em resposta a um estímulo químico (para uma revisão veja Gatz1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental oufísico, ou pode ser "induzível por estresse", i.e. ativado quando uma planta éexposta a várias condições de estresse, ou um "induzível por patógeno" i.e.ativado quando uma planta é exposta à exposição a vários patógenos.

Promotor Órgão específico/Tecido específicoUm promotor órgão específico ou tecido específico é um que écapaz de preferencialmente iniciar transcrição em certos órgãos ou tecidos, talcomo as folhas, raízes, tecido de semente etc. Por exemplo, um "promotorraiz específico" é um promotor que é transcricionalmente ativopredominantemente em raízes vegetais, substancialmente para a exclusão dequaisquer outra partes de uma planta, enquanto que ainda permitindo qualquerexpressão evasiva nestas outras partes vegetais. Promotores capaz de iniciartranscrição em certas células apenas são referidos neste lugar como "célulaespecíficos".

Um promotor tecido verde específico como definido nestelugar é um promotor que é transcricionalmente ativo predominantemente emtecido verde, substancialmente para a exclusão de quaisquer outras partes deuma planta, enquanto que ainda permitindo qualquer expressão evasiva nestasoutras partes vegetais.

Exemplos de promotores tecido verde específicos que podemser usados para realizar os métodos da invenção são mostrados em Tabela 3abaixo.

Tabela 3: Exemplos de promotores tecido verde específicos

<table>table see original document page 28</column></row><table>

Outro exemplo de um promotor tecido específico é umpromotor meristema específico, que é transcricionalmente ativopredominantemente em tecido meristemático, substancialmente para aexclusão de quaisquer outras partes de uma planta, enquanto que aindapermitindo qualquer expressão evasiva nestas outras partes vegetais.Terminador

O termo "terminador" abrange uma seqüência de controle queé uma seqüência de DNA na extremidade de uma unidade transcricional quesinaliza processamento 3' e poliadenilação de um transcrito primário etérmino de transcrição. O terminador pode ser derivado do gene natural, deuma variedade de outros genes vegetais, ou de T-DNA. O terminador a seradiconado pode ser derivado, por exemplo, dos genes de nopalina sintase ouoctopina sintase, ou alternativamente de outro gene vegetal, ou menospreferivelmente de qualquer outro gene eucariótico.

Modulação

O termo "modulação" significa em relação a expressão ouexpressão de gene, um processo no qual o nível de expressão é mudado porexpressão de gene em comparação com a planta de controle, preferivelmenteo nível de expressão é aumentado. A expressão original não modulada podeser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) oumRNA com subsequente tradução. O termo "modular a atividade" devesignificar qualquer mudança da expressão das seqüências de ácidos nucleicosinventivas ou proteínas codificadas, que leva a produção aumentada e/oucrescimento aumentado das plantas.

Expressão aumentada/superexpressão

O termo "expressão aumentada" ou "superexpressão" comousado neste lugar significa qualquer forma de expressão que é adicional aonível de expressão original de tipo selvagem.

Métodos para aumentar expressão de genes ou produtos degene são bem documentados na arte e incluem, por exemplo, superexpressãodirigida por promotores apropriados, o uso de acentuadores de transcrição ouacentuadores de tradução. Ácidos nucleicos isolados que servem comoelementos promotores ou acentuadores podem ser introduzidos em umaposição apropriada (tipicamente antes) de uma forma não heteróloga de umpolinucleotídeo de forma a aumentar expressão de um ácido nucleicocodificando o polipeptídeo de interesse. Por exemplo, promotores endógenospodem ser alterados in vivo por mutação, deleção, e/ou substituição (veja,Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al.,PCT/US93/03868), ou promotores isolados podem ser introduzidos em umacélula vegetal na orientação e distância apropriada de um gene da presenteinvenção de forma a controlar a expressão do gene.

Se expressão de polipeptídeo é desejada, geralmente édesejável incluir uma região de poliadenilação na extremidade 3' de umaregião de codificação de polinucleotídeo. A região de poliadenilação pode serderivada do gene natural, de uma variedade de outros genes vegetais, ou de T-DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, porexemplo, dos genes de nopalina sintase ou octopina sintase, oualternativamente de outro gene vegetal, ou menos preferivelmente de qualqueroutro gene eucariótico.

Uma seqüência de íntron também pode ser adicionada à região5' não traduzida (UTR) ou à seqüência de codificação da seqüência decodificação parcial para aumentar a quantidade da mensagem madura que seacumula no citosol. Inclusão de um íntron processável na unidade detranscrição tanto em construções vegetais como animais mostrou aumentarexpressão de gene tanto no nível de mRNA como protéico em até 1000 vezes(Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987)Genes Dev 1:1183-1200). Tal estimulação de íntron de expressão de genetipicamente é maior quando colocada perto da extremidade 5' da unidade detranscrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntronBronze-I são conhecidos na arte. Para informação geral veja: The MaizeHandbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

Gene endógeno

Referência neste lugar a um gene "endógeno" se refere nãoapenas ao gene em questão como encontrado em uma planta em sua formanatural (i.e., sem haver qualquer intervenção humana), mas também se refereao mesmo gene (ou um ácido nucleico/gene substancialmente homólogo) emuma forma isolada subseqüentemente (re)introduzido em uma planta (umtransgene). Por exemplo, uma planta transgênica contendo um tal transgenepode confrontar uma redução substancial da expressão de transgene e/ouredução substancial de expressão do gene endógeno.

Expressão diminuída

Referência neste lugar a "redução ou eliminação substancial" éadotada para significar uma diminuição em expressão de gene endógeno e/ouníveis de polipeptídeo e/ou atividade de polipeptídeo em relação a plantas decontrole. A redução ou eliminação substancial é em ordem crescente depreferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%, 80%, 85%,90%, ou 95%, 96%, 97%, 98%, 99% ou mais reduzida comparada com aquelade plantas de controle.

Para a redução ou eliminação substancial de expressão umgene endógeno em uma planta, um comprimento suficiente de nucleotídeossubstancialmente contíguos de uma seqüência de ácidos nucleicos érequerido. A fim de realizar silenciamento gênico, isto pode ser tão poucoquanto 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 ou menos nucleotídeos,alternativamente isto pode ser tanto quanto o gene inteiro (incluindo a 5' e/ou3' UTR, ou em parte ou inteira). O trecho de nucleotídeos substancialmentecontíguos pode ser derivado do ácido nucleico codificando a proteína deinteresse (gene alvo), ou de qualquer ácido nucleico capaz de codificar umortólogo, parálogo ou homólogo da proteína de interesse. Preferivelmente, otrecho de nucleotídeos substancialmente contíguos é capaz de formar ligaçõesde hidrogênio com o gene alvo (ou fita sentido ou antisentido), maispreferivelmente, o trecho de nucleotídeos substancialmente contíguos tem, emordem crescente de preferência, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%,97%, 98%, 99%, 100% de identidade de seqüência com o gene alvo (ou fitasentido ou antisentido). A seqüência de ácidos nucleicos codificando umpolipeptídeo (funcional) não é um requerimento para os vários métodosdiscutidos neste lugar para a redução ou eliminação substancial de expressãode um gene endógeno.

Esta redução ou eliminação substancial de expressão pode seratingida usando ferramentas e técnicas de rotina. Um método preferido para aredução ou eliminação substancial de expressão de gene endógeno éintroduzir e expressar em uma planta uma construção genética na qual o ácidonucleico (neste caso um trecho de nucleotídeos substancialmente contíguosderivado do gene de interesse, ou de qualquer ácido nucleico capaz decodificar um ortólogo, parálogo ou homólogo de qualquer uma das proteínasde interesse) é clonado como uma repetição invertida (em parte oucompletamente), separada por um espaçador (DNA não codificante).

Em um tal método preferido, expressão do gene endógeno éreduzida ou substancialmente eliminada através de silenciamento mediado porRNA usando uma repetição invertida de um ácido nucleico ou uma partedeste (neste caso um trecho de nucleotídeos substancialmente contíguosderivado do gene de interesse, ou de qualquer ácido nucleico capaz decodificar um ortólogo, parálogo ou homólogo da proteína de interesse),preferivelmente capaz de formar uma estrutura em forma de grampo. Arepetição invertida é clonada um vetor de expressão compreendendoseqüências de controle. Uma seqüência de ácidos nucleicos de DNA nãocodificante (um espaçador, por exemplo um fragmento de região deacoplamento de matriz (MAR), um íntron, um poliligante, etc.) estálocalizado entre os dois ácidos nucleicos invertidos formando a repetiçãoinvertida. Depois de transcrição da repetição invertida, um RNA quiméricocom uma estrutura auto-complementar é formado (parcial ou completo). Estaestrutura de RNA dupla fita é referida como o RNA em forma de grampo(hpRNA). O hpRNA é processado pela planta em siRNAs que sãoincorporados em um complexo de silenciamento induzido por RNA (RISC).O RISC adicionalmente cliva os transcritos de mRNA, com isso reduzindosubstancialmente o número de transcritos de mRNA a serem traduzidos empolipeptídeos. Para detalhes gerais adicionais veja por exemplo, Grierson etal. (1998) Patente Internacional 98/53083; Waterhouse et ai. (1999) PatenteInternacional 99/53050).

Desempenho dos métodos da invenção não se fia em introduzire expressar em uma planta uma construção genética na qual o ácido nucleicoé clonado como uma repetição invertida, mas qualquer um ou mais dediversos métodos bem conhecidos de "silenciamento gênico" podem serusados para atingir os mesmos efeitos.

Um tal método para a redução de expressão de gene endógenoé silenciamento mediado por RNA de expressão de gene (regulação de formanegativa). Silenciamento neste caso é desencadeado em uma planta por umaseqüência de RNA dupla fita (dsRNA) que é substancialmente similar ao geneendógeno alvo. Este dsRNA é adicionalmente processado pela planta emcerca de 20 a cerca de 26 nucleotídeos chamados RNAs de interferênciacurtos (siRNAs). Os siRNAs são incorporados em um complexo desilenciamento induzido por RNA (RISC) que cliva o transcrito de mRNA dogene endógeno alvo, com isso reduzindo substancialmente o número detranscritos de mRNA a serem traduzidos em um polipeptídeo.Preferivelmente, a seqüência de RNA dupla fita corresponde a um gene alvo.

Outro exemplo de um método de silenciamento de RNAenvolve a introdução de seqüências de ácidos nucleicos ou partes destas(neste caso um trecho de nucleotídeos substancialmente contíguos derivadodo gene de interesse, ou de qualquer ácido nucleico capaz de codificar umortólogo, parálogo ou homólogo da proteína de interesse) em uma orientaçãosentido em uma planta. "Orientação sentido" se refere a uma seqüência deDNA que é homóloga a um transcrito de mRNA deste. Deve ser introduzidaem uma planta portanto pelo menos uma cópia da seqüência de ácidosnucleicos. A seqüência de ácidos nucleicos adicional irá reduzir expressão dogene endógeno, gerando um fenômeno conhecido como co-supressão. Aredução de expressão de gene será mais pronounciada se diversas cópiasadicionais de uma seqüência de ácidos nucleicos são introduzidas na planta,pois existe uma correlação positiva entre altos níveis de transcrito e odesencadeamento de co-supressão.

Outro exemplo de um método de silenciamento de RNAenvolve o uso de seqüências de ácidos nucleicos antisentido. Uma seqüênciade ácidos nucleicos "antisentido" compreende uma seqüência de nucleotídeosque é complementar a uma seqüência de ácidos nucleicos "sentido"codificando uma proteína, i.e. complementar à fita de codificação de umamolécula de cDNA dupla fita ou complementar a uma seqüência transcrita demRNA. A seqüência de ácidos nucleicos antisentido preferivelmente écomplementar ao gene endógeno a ser silenciado. A complementaridade podeestar localizada na "região de codificação" e/ou na "região não codificante"de um gene. O termo "região de codificação" se refere a uma região daseqüência de nucleotídeos compreendendo códons que são traduzidos emresíduos de aminoácidos. O termo "região não codificante" se refere aseqüências 5' e 3' que flanqueaim a região de codificação que são transcritasmas não traduzidas em aminoácidos (também referidas como regiões 5' e 3'não traduzidas).

Seqüências de ácidos nucleicos antisentido pode ser construídade acordo com as regras de pareamento de bases de Watson e Crick. Aseqüência de ácidos nucleicos antisentido pode ser complementar à seqüênciade ácidos nucleicos inteira (neste caso um trecho de nucleotídeossubstancialmente contíguos derivado do gene de interesse, ou de qualquerácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo daproteína de interesse), mas também pode ser um oligonucleotídeo que éantisentido para apenas uma parte da seqüência de ácidos nucleicos (incluindoa UTR 5' e 3' de mRNA). Por exemplo, a seqüência de oligonucleotídeosantisentido pode ser complementar à região circundando o sítio de início detranscrição de um transcrito de mRNA codificando um polipeptídeo. Ocomprimento de uma seqüência de oligonucleotídeos antisentido adequada éconhecido na arte e pode começar de cerca de 50, 45, 40, 35, 30, 25, 20, 15 ou10 nucleotídeos de comprimento ou menos. Uma seqüência de ácidosnucleicos antisentido de acordo com a invenção pode ser construída usandoreações de síntese química e ligação enzimática usando métodos conhecidosna arte. Por exemplo, uma seqüência de ácidos nucleicos antisentido (e.g.,uma seqüência de oligonucleotídeos antisentido) pode ser quimicamentesintetizada usando nucleotídeos naturalmente ocorrentes ou nucleotídeosmodificados de forma variada construídos para aumentar a estabilidadebiológica das moléculas ou para aumentar a estabilidade física do duplexformado entre as seqüências de ácidos nucleicos antisentido e sentido, e.g.,derivados de fosforotioato e nucleotídeos substituídos com acridina podem serusados. Exemplos de nucleotídeos modificados que podem ser usados paragerar as seqüências de ácidos nucleicos antisentido são bem conhecidos naarte. Modificações conhecidas de nucleotídeos incluem metilação, ciclizaçãoe 'caps' e substituição de um ou mais dos nucleotídeos naturalmenteocorrentes por um análogo tal como inosina. Outras modificações denucleotídeos são bem conhecidas na arte.

A seqüência de ácidos nucleicos antisentido pode serproduzida biologicamente usando um vetor de expressão no qual umaseqüência de ácidos nucleicos foi subclonada em uma orientação antisentido(i.e., RNA transcrito a partir do ácido nucleico inserido será de umaorientação antisentido para um ácido nucleico alvo de interesse).Preferivelmente, produção de seqüências de ácidos nucleicos antisentido emplantas ocorre por meio de uma construção de ácido nucleico estavelmenteintegrada compreendendo um promotor, um oligonucleotídeo antisentidooperacionalmente ligado, e um terminador.

As moléculas de ácido nucleico usadas para silenciamento nosmétodos da invenção (quer introduzidas em uma planta ou geradas in situ)hibridizam com ou se ligam a transcritos de mRNA e/ou DNA genômicocodificando um polipeptídeo para com isso inibir expressão da proteína, e.g.,inibindo transcrição e/ou tradução. A hibridização pode ser porcomplementaridade convencional de nucleotídeos para formar um duplexestável, ou, por exemplo, no caso de uma seqüência de ácidos nucleicosantisentido que se liga a duplexes de DNA, através de interações específicasna principal fenda da dupla hélice. Seqüências de ácidos nucleicos antisentidopodem ser introduzidas em uma planta por transformação ou injeção diretaem um sítio de tecido específico. Alternativamente, seqüências de ácidosnucleicos antisentido podem ser modificadas para direcionar célulasselecionadas e então sistemicamente administradas. Por exemplo, paraadministração sistêmica, seqüências de ácidos nucleicos antisentido podemser modificadas de forma que elas se liguem especificamente a receptores ouantígenos expressos em uma superfície celular selecionada, e.g., ligando aseqüência de ácidos nucleicos antisentido a peptídeos ou a anticorpos que seligam a receptores ou antígenos de superfície celular. As seqüências de ácidosnucleicos antisentido também podem ser liberadas para células usando osvetores descritos neste lugar.

De acordo com um aspecto adicional, a seqüência de ácidosnucleicos antisentido é uma seqüência de ácidos nucleicos α-anomérica. Umaseqüência de ácidos nucleicos α-anomérica forma híbridos dupla fitaespecíficos com RNA complementar nos quais, ao contrário das unidades busuais, as fitas correm paralelas uma a outra (Gaultier et al. (1987) Nucl AcRes 15: 6625-6641). A seqüência de ácidos nucleicos antisentido tambémpode compreender um 2-o-metilribonucleotídeo (Inoue et al. (1987) Nucl AcRes 15, 6131-6148) ou um análogo quimérico de RNA-DNA (Inoue et al.(1987) FEBS Lett. 215, 327-330).

A redução ou eliminação substancial de expressão de geneendógeno também pode ser realizada usando ribozimas. Ribozimas sãomoléculas catalíticas de RNA com atividade de ribonuclease que são capazesde clivar uma seqüência de ácidos nucleicos de fita simples, tal como ummRNA, ao qual eles têm uma região complementar. Assim, ribozimas (e.g.,ribozimas cabeça-de-martelo (descritas em Haselhoff and Gerlach (1988)Nature 334, 585-591) podem ser usadas para clivar cataliticamente transcritosde mRNA codificando um polipeptídeo, com isso reduzindo substancialmenteo número de transcritos de mRNA a serem traduzidos em um polipeptídeo.

Uma ribozima tendo especificidade para uma seqüência de ácidos nucleicospode ser construída (veja por exemplo: Cech et al. Patente Norte-AmericanaNo. 4.987,071; e Cech et al. Patente Norte-Americana No. 5.116.742).

Alternativamente, transcritos de mRNA correspondendo a uma seqüência deácidos nucleicos podem ser usados para selecionar um RNA catalítico tendouma atividade específica de ribonuclease a partir de um conjunto demoléculas de RNA (Bartel and Szostak (1993) Science 261, 1411-1418). Ouso de ribozimas para silenciamento de genes em plantas é conhecido na arte(e.g., Atkins et al. (1994) Patente Internacional 94/00012; Lenne et al. (1995)Patente Internacional 95/03404; Lutziger et al. (2000) Patente Internacional00/00619; Prinsen et al. (1997) Patente Internacional 97/13865 e Scott et al.(1997) Patente Internacional 97/38116).

Silenciamento gênico também pode ser atingido pormutagênese por inserção (por exemplo, inserção de T-DNA ou inserção detransposon) ou por estratégias como descrito por, entre outros, Angell andBaulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS PatenteInternacional 98/36083), ou Baulcombe (Patente Internacional 99/15682).Silenciamento gênico também pode ocorrer se existe umamutação on um gene endógeno e/ou uma mutação em um gene/ácido nucleicoisolado subseqüentemente introduzido em uma planta. A redução oueliminação substancial pode ser causada por um polipeptídeo não funcional.Por exemplo, um polipeptídeo pode ser ligar a várias proteínas de interação;uma ou mais mutação(ões) e/ou truncamento(s) pode(m) portanto fornecer umpolipeptídeo que ainda é capaz de se ligar a proteínas de interação (tal comoproteínas receptoras) mas que não podem exibir sua função normal (tal comoligante de sinalização).

Uma abordagem adicional para silenciamento gênico édirecionar seqüências de ácidos nucleicos complementares à regiãoreguladora do gene (e.g., o promotor e/ou acentuadores) para formarestruturas de tripla hélice que previnem transcrição do gene em células alvo.Veja Helene, C., Anticancer Drug Res. 6, 569-84, 1991; Helene et al., Ann.N.Y. Acad. Sei. 660, 27-36 1992; e Maher, L.J. Bioassays 14, 807-15, 1992.

Outros métodos, tal como o uso de anticorpos dirigidos a umpolipeptídeo endógeno para inibir sua função em planta, ou interferência navia de sinalização na qual um polipeptídeo está envolvido, serão bemconhecidos por alguém versado. Em particular, pode ser contemplado quemoléculas fabricadas podem ser úteis para inibir a função biológica de umpolipeptídeo alvo, ou para interferir na via de sinalização na qual opolipeptídeo alvo está envolvido.

Alternativamente, um programa de triagem pode ser ajustadopara identificar em uma população vegetal variantes naturais de um gene,cujas variantes codificam polipeptídeos com atividade reduzida. Taisvariantes naturais também podem ser usadas por exemplo, para realizarrecombinação homóloga.

MicroRNAs (miRNAs) artificiais e/ou naturais podem serusados para nocautear expressão de gene e/ou tradução de mRNA. miRNAsendógenos são RNAs pequenos de fita simples de tipicamente 19-24nucleotídeos de comprimento. Eles funcionam primariamente para regularexpressão de gene e/ ou tradução de mRNA. A maioria de microRNAs(miRNAs) de plantas têm complementaridade perfeita ou quase perfeita comsuas seqüências alvo. Entretanto, há alvos naturais com até cincomalpareamentos. Eles são processados a partir de RNAs não codificantesmaiores com estruturas reversas características por RNases de dupla fitaespecíficas da família Dicer. Mediante processamento, eles são incorporadosno complexo de silenciamento induzido por RNA (RISC) se ligando a seucomponente principal, uma proteína Argonauta. MiRNAs servem como oscomponentes de especificidade de RISC, uma vez que eles pareaim bases comácidos nucleicos alvo, principalmente mRNAs, no citoplasma. Eventosreguladores subsequentes incluem clivagem de mRNA alvo e destruição e/ouinibição traducional. Efeitos de superexpressão de miRNA são assimfreqüentemente refletidos em níveis diminuídos de mRNA de genes alvo.

MicroRNAs artificiais (amiRNAs), os quais são tipicamentede 21 nucleotídeos de comprimento, podem ser geneticamente manipuladosespecificamente para regular negativamente expressão de gene de um oumúltiplos genes de interesse. Determinantes de seleção de alvo de microRNAvegetal são bem conhecidos na arte. Parâmetros emoíricos parareconhecimento de alvo foram definidos e podem ser usados para auxiliar aconcepção de amiRNAs específicos, Schwab R, 2005. Ferramentasconvenientes para concepção e geração de amiRNAs e seus precursorestambém estão disponíveis para o público, Schwab et ai., 2006.

Para desempenho ótimo, as técnicas de silenciamento gênicousadas para reduzir expressão em uma planta de um gene endógeno requeremo uso de seqüências de ácidos nucleicos de plantas monocotiledôneas paratransformação de plantas monocotiledôneas, e de plantas dicotiledôneas paratransformação de plantas dicotiledôneas. Preferivelmente, a seqüência deácidos nucleicos de qualquer dada espécie vegetal é introduzida naquelamesma espécie. Por exemplo, uma seqüência de ácidos nucleicos de arroz étransformada em uma planta de arroz. Entretanto, não é um requerimentoabsoluto que a seqüência de ácidos nucleicos a ser introduzida se origine damesma espécie de planta que a planta na qual ela será introduzida. Esuficiente que exista uma homologia substancial entre o gene endógeno alvo eo ácido nucleico a ser introduzido.

São descritos acima exemplos de vários métodos para aredução ou eliminação substancial de expressão em uma planta de um geneendógeno. Uma pessoa versada na arte deve ser prontamente capaz de adaptaros métodos mencionados acima para silenciamento de forma a atingir reduçãode expressão de um gene endógeno em uma planta inteira ou em partes destaatravés do uso de um promotor apropriado, por exemplo.

Marcador selecionável (geneVGene repórter

"Marcador selecionável", "gene marcador selecionável" ou"gene repórter" inclui qualquer gene que confere um fenótipo em uma célulana qual ele é expresso para facilitar a identificação e/ou seleção de células quesão transfectadas ou transformadas com uma construção de ácido nucleico dainvenção. Estes genes marcadores possibilitam a identificação de umatransferência bem sucedida das moléculas de ácido nucleico através de umasérie de princípios diferentes. Marcadores adequados podem ser selecionadosa partir de marcadores que conferem resistência a antibiótico ou herbicida,que introduzem uma nova característica metabólica ou que permitem seleçãovisual. Exemplos de genes marcadores selecionáveis incluem genesconferindo resistência a antibióticos (tal como nptll que fosforila neomicina ecanamicina, ou hpt, fosforilando higromicina, ou genes conferindo resistênciaa, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol,ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina),®a herbicidas (por exemplo bar que fornece resistência a Basta ; aroA ou goxfornecendo resistência contra glifosato, ou os genes conferindo resistência a,por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou genes quefornecem uma característica metabólica (tal como manA que permite queplantas usem manose como única fonte de carbono ou xilose isomerase para autilização de xilose, ou marcadores antinutritivos tal como a resistência a 2-desoxiglucose). Expressão de genes marcadores visuais resulta na formaçãode cor (por exemplo β-glucuronidase, GUS ou β-galactosidase com seussubstratos coloridos, por exemplo X-Gal), luminescência (tal como o sistemade luciferina/luceferase) ou fluorescência (Proteína fluorescente verde, GFP, ederivados deste). Esta lista representa apenas um pequeno número depossíveis marcadores. O trabalhador versado é familiar com tais marcadores.Diferentes marcadores são preferidos, dependendo do organismo e do métodode seleção.

Sabe-se que mediante integração estável ou transiente deácidos nucleicos em células de planta, apenas uma minoria das célulasabsorve o DNA exógeno e, se desejado, o integra em seu genoma,dependendo do vetor de expressão usado e da técnica de transfecção usada.

Para identificar e selecionar estes integrantes, um gene codificando para ummarcador selecionável (tal como aqueles descritos acima) normalmente éintroduzido nas células hospedeiras junto com o gene de interesse. Estesmarcadores podem ser por usados em mutantes nos quais estes genes não sãofuncionais, por exemplo, por deleção por métodos convencionais. Além disso,moléculas de ácido nucleico codificando um marcador selecionável podemser introduzida em uma célula hospedeira no mesmo vetor que compreende aseqüência codificando os polipeptídeos da invenção ou usados nos métodosda invenção, ou ainda em um vetor separado. Células que foram estavelmentetransfectadas com o ácido nucleico introduzido podem ser identificadas porexemplo por seleção (por exemplo, células que integraram o marcadorselecionável sobrevivem ao passo que as outras células morrem).Uma vez que os genes marcadores, particularmente genes pararesistência a antibióticos e herbicidas, não são mais requeridos ou sãoindesejados na célula hospedeira transgênica uma vez os ácidos nucleicostenham sido introduzidos com sucesso, o processo de acordo com a invençãopara introduzir os ácidos nucleicos vantajosamente emprega técnicas quepossibilitam a remoção ou excisão destes genes marcadores. Um tal método éo que é conhecido como co-transformação. O método de co-transformaçãoemprega dois vetores simultaneamente para a transformação, em vetorcarregando o ácido nucleico de acordo com a invenção e um segundocarregando o(s) gene(s) marcador(es). Uma grande proporção detransformantes recebe ou, no caso de plantas, compreende (até 40% ou maisdos transformantes), ambos os vetores. Em caso de transformação comAgrobactérias, os transformantes normalmente recebem apenas uma parte dovetor, i.e. a seqüência flanqueada pelo T-DNA, que normalmente representa agaveta de expressão. Os genes marcadores podem ser subseqüentementeremovidos da planta transformada realizando cruzamentos. Em outro método,genes marcadores integrados em um transposon são usados para atransformação junto com ácido nucleico desejado (conhecida como atecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte detransposase ou os transformantes são transformados com uma construção deácido nucleico conferindo expressão de uma transposase, transientemente ouestavelmente. Em alguns casos (aprox. 10%), o transposon pula fora dogenome da célula hospedeira uma vez que transformação tenha ocorrido comsucesso e é perdido. Em diversos casos adicionais, o transposon pula parauma localização diferente. Nestes casos o gene marcador deve ser eliminadorealizando cruzamentos. Em microbiologia, foram desenvolvidas técnicas quetornam possível, ou facilitam, a detecção de tais eventos. Um métodovantajoso adicional se fia no que é conhecido como sistemas derecombinação; cuja vantagem é de que eliminação por cruzamento pode serdispensada. O sistema mais conhecido deste tipo é o que é conhecido como osistema Cre/lox. Crel é uma recombinase que remove as seqüênciaslocalizadas entre as seqüências IoxP. Se o gene marcador está integrado entreas seqüências IoxP, ele é removido uma vez que transformação tenha ocorridocom sucesso, por expressão da recombinase. Sistemas de recombinaçãoadicionais são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J.Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149,2000: 553-566). Uma integração sítio específica no genoma vegetal dasseqüências de ácidos nucleicos de acordo com a invenção é possível.Naturalmente, estes métodos também podem ser aplicados a microorganismostal como levedura, fungos ou bactérias.

Transgênico/Transgene/Recombinante

Para os propósitos da invenção, "transgênico", "transgene" ou"recombinante" significa com erlação a, por exemplo, uma seqüência deácidos nucleicos, uma gaveta de expressão, construção gênica ou um vetorcompreendendo a seqüência de ácidos nucleicos ou um organismotransformado com as seqüências de ácidos nucleicos, gavetas de expressão ouvetores de acordo com a invenção, todas estas construções causadas pormétodos recombinantes nos quais ou

(a) as seqüências de ácidos nucleicos codificando proteínasúteis nos métodos da invenção, ou

(b) seqüência(s) de controle genético que é(são)operacionalmente ligada(s) com a seqüência de ácidos nucleicos de acordocom a invenção, por exemplo um promotor, ou

(c) a) e b)não estão localizadas em seu ambiente genético natural ouforam modificadas por métodos recombinantes, sendo possível para amodificação tomar a forma de, por exemplo, uma substituição, adição,deleção, inversão ou inserção de um ou mais resíduos de nucleotídeos. Oambiente genético natural é entendido como significando o locus genômicoou cromossômico natural na planta original ou a presença em uma bibliotecagenômica. No caso de uma biblioteca genômica, o ambiente genético naturalda seqüência de ácidos nucleicos é preferivelmente mantido, pelo menos emparte. O ambiente flanqueia a seqüência de ácidos nucleicos pelo menos emum lado e tem um comprimento de seqüência de pelo menos 50 bp,preferivelmente pelo menos 500 bp, especialmente preferivelmente pelomenos 1000 bp, mais preferivelmente pelo menos 5000 bp. Uma gaveta deexpressão naturalmente ocorrente - por exemplo, a combinação naturalmenteocorrente do promotor natural das seqüências de ácidos nucleicos com aseqüência de ácidos nucleicos correspondente codificando um polipeptídeoútil nos métodos da presente invenção, como definido acima - se torna umagaveta de expressão quando esta gaveta de expressão é modificada pormétodos não naturais, sintéticos ("artificiais") tal como, por exemplo,tratamento mutagênico. Métodos adequados são descritos, por exemplo, emPatente US 5.565.350 ou Patente Internacional 00/15815.

Uma planta transgênica para os propósitos da invenção é assimentendida como significando, como acima, que os ácidos nucleicos usados nométodo da invenção não estão em seu locus natural no genoma de dita planta,sendo possível para os ácidos nucleicos serem expressos homologamente ouheterologamente. Entretanto, como mencionado, transgênico tambémsignifica que, enquanto os ácidos nucleicos de acordo com a invenção ouusados no método inventivo estão em sua posição natural no genoma de umaplanta, a seqüência foi modificada com relação à seqüência natural, e/ou queas seqüências reguladoras das seqüências naturais foram modificadas.

Transgênica é preferivelmente entendido como significando a expressão dosácidos nucleicos de acordo com a invenção em um locus não natural nogenoma, i.e. expressão homóloga ou, preferivelmente, heteróloga dos ácidosnucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar.Transformação

O termo "introdução" ou "transformação" como referido nestelugar abrange a transferência de um polinucleotídeo exógeno para uma célulahospedeira, independente do método usado para transferência. Tecido vegetalcapaz de subseqüente propagação clonal, quer por organogênese ouembriogênese, pode ser transformado com uma construção genética dapresente invenção e uma planta inteira regenerada a partir daí. O tecidoparticular escolhido irá variar dependendo dos sistemas de propagação clonaldisponíveis para, e melhor adequados para, a espécie particular sendotransformada. Alvos de tecido exemplares incluem discos foliares, pólen,embriões, cotilédones, hipocótilos, megagametófitos, tecido de calo, tecidomeristemático existente (e.g., meristema apical, gemas axilares, e meristemasde raiz), e tecido de meristema induzido (e.g., meristema de cotilédone emeristema de hipocótilo). O polinucleotídeo pode ser transientemente ouestavelmente introduzido em uma célula hospedeira e pode ser mantido nãointegrado, por exemplo, como um plasmídeo. Alternativamente, ele pode serintegrado no genoma hospedeiro. A célula vegetal transformada resultantepode então ser usada para regenerar uma planta transformada de uma maneiraconhecida por pessoas versadas na arte.

A transferência de genes exógenos para o genoma de umaplanta é chamada transformação. Transformação de espécies vegetais é agorauma técnica bastante rotineira. Vantajosamente, qualquer dos diversosmétodos de transformação pode ser usado para introduzir o gene de interesseem uma célula ancestral adequada. Os métodos descritos para a transformaçãoe regeração de plantas a partir de tecidos vegetais ou células de planta podemser utilizados para transformação transiente ou estável. Métodos detransformação incluem o uso de lipossomos, eletroporação, produtos químicosque aumentam absorção de DNA livre, injeção do DNA diretamente naplanta, bombardeamento por pistola de partícula, transformação usando vírusou pólen e microprojeção. Métodos podem ser selecionados a partir dométodo de cálcio/polietilenoglicol para protoplastos (Krens, F.A. et al., (1982)Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373);eletroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); microinjeção em material vegetal (Crossway A et al., (1986) Mol. GenGenet 202: 179-185); bombardeamento de partícula revestida de DNA ouRNA (Klein TM et al., (1987) Nature 327: 70) infecção com (não integrativa)vírus e os semelhantes. Plantas transgênicas, incluindo plantas de culturatransgênicas, preferivelmente são produzidas através de transformaçãomediada por Agrobacterium. Um método de transformação vantajoso é atransformação em planta. Para esta finalidade, é possível, por exemplo,permitir que as agrobactérias atuem em grãos vegetais ou inocular omeristema vegetal com agrobactérias. Provou-se particularmente adequadoem conformidade com a invenção permitir que uma suspensão deagrobactérias transformadas atue na planta intacta ou pelo menos nosprimórdios florais. A planta é subseqüentemente cultivadas até que assementes da planta tratada sejam obtidas (Clough and Bent, Plant J. (1998)16, 735-743). Métodos para transformação mediada por Agrobacterium dearroz incluem métodos bem conhecidos para transformação de arroz, tal comoaqueles descritos em qualquer dos seguintes: pedido da Patente Européia EP1198985 Al, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al.(Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282,1994), cujas descrições são incorporadas por referência neste lugar como secompletamente apresentadas. No caso de transformação de milho, o métodopreferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50,1996) ou Frame et al. (Plant Physiol 129(1): 13-22, 2002), cujas descriçõessão incorporadas por referência neste lugar como se completamenteapresentadas. Ditos métodos são adicionalmente descritos como forma deexemplo em B. Jenes et al., Techniques for Gene Transfer, in: TransgenicPlants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu5Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol.Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção aser expressa é preferivelmente clonada em um vetor, que é adequado paratransformar Agrobacterium tumefaciens, por exemplo pBinl9 (Bevan et ai.,Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um talvetor podem ser usadas de uma maneira conhecida para a transformação deplantas, tal como plantas usadas como um modelo, como Arabidopsis{Arabidopsis thaliana está dentro do escopo da presente invenção nãoconsiderada como uma planta de cultivo), ou plantas de cultura tal como,como forma de exemplo, plantas de tabaco, por exemplo imergindo folhasmachucadas ou folhas picadas em uma solução agrobacteriana e então ascultivando em meio adequado. A transformação de plantas por meio deAgrobacterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzerem Nucl. Acid Res. (1988) 16, 9877 ou é conhecida entre outras maneiras apartir de F.F. White, Vectors for Gene Transfer in Higher Plants; inTransgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R.Wu, Academic Press, 1993, pp. 15-38.

Em adição à transformação de células somáticas, que entãotêm que ser regeneradas em plantas intactas, também é possível transformaras células de meristemas vegetais e em particular aquelas células que sedesenvolvem em gametas. Neste caso, os gametas transformados seguem odesenvolvimento vegetal natural, gerando plantas transgênicas. Assim, porexemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementessão obtidas a partir das plantas em desenvolvimento das quais uma certaproporção é transformada e assim transgênica [Feldman, KA and Marks MD(1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-HChua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific,Singapore, pp. 274-289]. Métodos alternativos são baseados na remoçãorepetida das inflorescências e incubação do sítio de excisão no centro daroseta com agrobactérias transformadas, através do que sementestransformadas podem da mesma maneira ser obtidas em um momentoposterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet,245: 363-370). Entretanto, um método especialmente efetivo é o método deinfiltração a vácuo com suas modificações tal como o método de "botãofloral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sobpressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold,N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso dométodo de "botão floral" o tecido floral em desenvolvimento é incubadobrevemente com uma suspensão agrobacteriana tratada com surfactante[Clough, SJ und Bent, AF (1998). The Plant J. 16, 735-743]. Uma certaproporção de sementes transgênicas são coletadas em ambos os casos, e estassementes pode ser distinguidas de sementes não transgênicas cultivando nascondições seletivas descritas acima. Em adição, a transformação estável deplastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmentereduzindo ou eliminando o risco de fluxo de transgene através de pólen namaioria das culturas. A tranformação do genoma de cloroplasto geralmente éatingida por um processo que foi esquematicamente apresentado em Klaus etal., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente asseqüências a serem transformadas são clonadas junto com um gene marcadorselecionável entre seqüências flanqueadoras homólogas ao genoma decloroplasto. Estas seqüências flanqueadoras homólogas dirigem integraçãosítio específica no plastoma. Transformação plastidial foi descrita para muitasespécies de plantas diferentes e uma visão geral é dada em Bock (2001)Transgenic plastids in basic research and plant biotechnology. J Mol Biol.2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towardscommercialization of plastid transformation technology. Trends Biotechnol.21, 20-28. Progresso biotecnológico adicional foi recentemente relatado emforma de transformantes de plastídeos livres de marcador, que podem serproduzidos por um gene marcador co-integrado transiente (Klaus et al., 2004,Nature Biotechnology 22(2), 225-229).

Identificação por ativação de T-DNA

Identificação por ativação de T-DNA (Hayashi et al. Science(1992) 1350-1353), envolve inserção de T-DNA, normalmente contendo umpromotor (também pode ser um acentuador de tradução ou um íntron), naregião genômica do gene de interesse ou 10 kb antes ou depois da região decodificação de um gene em uma configuração de forma que o promotor dirigeexpressão do gene dirigido. Tipicamente, regulação de expressão do genedirigido por seu promotor natural é interrompida e o gene cai sob o controledo promotor recentemente introduzido. O promotor é tipicamente embebidoem um T-DNA. Este T-DNA é aleatoriamente inserido no genoma vegetal,por exemplo, através de infecção por Agrobacterium e leva a expressãomodificada de genes perto do T-DNA inserido. As plantas transgênicasresultantes mostram fenótipos dominantes devido a expressão modificada degenes próximos ao promotor introduzido.

TILLING

TILLING (Lesões Locais Induzidas Dirigidas em Genomas) éuma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicoscodificando proteínas com expressão e/ou atividade modificada. TILLINGtambém permite seleção de plantas carregando tais variantes mutantes. Estasvariantes mutantes podem exibir expressão modificada, ou em força ou emlocalização ou em momento (se as mutações afetam o promotor por exemplo).Estas variantes mutantes podem exibir atividade maior do que aquela exibidapelo gene em sua forma natural. TILLING combina mutagênese de altadensidade com métodos de triagem rápida. As etapas tipicamente seguidas emTILLING são: (a) mutagênese EMS (Redei GP and Koncz C (1992) InMethods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds.Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al.,(1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold SpringHarbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner Jand Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods onMolecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b)preparação de DNA e combinação de indivíduos; (c) amplificação por PCRde uma região de interesse; (d) desnaturação e anelamento para permitirformação de heteroduplexes; (e) DHPLC, onde a presença de umheteroduplex em uma combinação é detectada como um pico extra nocromatograma; (f) identificação do mutante individual; e (g) seqüenciamentodo produto de PCR mutante. Métodos para TILLING são bem conhecidos naarte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto porStemple (2004) Nat Rev Genet 5(2): 145-50).

Recombinação homóloga

Recombinação homóloga permite introdução em um genomade um ácido nucleico selecionado em uma posição selecionada definida.Recombinação homóloga é uma tecnologia padrão usada rotineiramente emciências biológicas para organismos inferiores tal como levedura ou o musgoPhyscomitrella. Métodos para realizar recombinação homóloga em plantasforam descritos não apenas para plantas modelo (Offringa et al. (1990)EMBO J 9(10): 3077-84) mas também para plantas de cultura, por exemploarroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida and Terada(2004) Curr Opin Biotech 15(2): 132-8).

Produção

O termo "produção" em geral significa uma produçãomensurável de valor econômico, tipicamente relacionada a uma culturaespecificada, a uma área, e a um período de tempo. Partes vegetais individuaiscontribuem diretamente para produção baseada em seu número, tamanho e/oupeso, ou a produção atual é a produção por acre para uma cultura e ano, que édeterminada dividindo produção total (inclui tanto produção coletada comoavaliada) por acres plantados.

Vigor precoce

Vigor precoce (crescimento bem equilibrado saudável ativoespecialmente durante estágios iniciais de crescimento vegetal) pode resultarde aptidão vegetal aumentada devido a, por exemplo, as plantas serem melhoradaptadas a seu ambiente (i.e. otimizando o uso de recursos energéticos eparticionamento entre parte aérea e raiz). Plantas tendo vigor precoce tambémmostram uma sobrevivência de plântula aumentada e um melhorestabelecimento da cultura, o que freqüentemente resulta em camposaltamente uniformes (com a cultura crescendo de maneira uniforme, i.e. coma maioria das plantas atingindo os vários estágios de desenvolvimentosubstancialmente ao mesmo tempo), e freqüentemente produção melhor emaior. Portanto, vigor precoce pode ser determinado medindo vários fatores,tal como peso de mil sementes, porcentagem de germinação, porcentagem deemergência, crescimento de plântula, altura de plântula, comprimento de raiz,biomassa de raiz e parte aérea e muito mais.

Aumento/Melhora/Acentuação

Os termos "aumento", "melhora" ou "acentuação" sãopermutáveis e devem significar no sentido do pedido pelo menos a 5%, 6%,7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, maispreferivelmente 25%, 30%, 35% ou 40% mais produção e/ou crescimento emcomparação com plantas de controle como definido neste lugar.

Produção de sementes

Produção aumentada de sementes pode ser manifestada comoum ou mais dos seguintes: a) um aumento em biomassa de semente (pesototal de semente) que pode ser em uma base de semente individual e/ou porplanta e/ou por hectare ou acre; b) número aumentado de flores por planta; c)número aumentado de sementes (cheias); d) taxa aumentada de enchimento degrãos (que é expressa como a proporção entre o número de grãos cheiosdividido pelo número total de grãos); e) índice de colheita aumentado, que éexpresso como proporção da produção de partes aptas para corte, tal comosementes, dividida pela biomassa total; e f) Peso de Mil Sementes (TKW)aumentado, que é extrapolado a partir do número de grãos cheios contados eseu peso total. Um TKW aumentado pode resultar de um tamanho de sementee/ou peso de semente aumentado, e também pode resultar de um aumento emtamanho de embrião e/ou endosperma.

Um aumento em produção de sementes também pode sermanifestado como um aumento em tamanho de semente e/ou volume desemente. Além disso, um aumento em produção de sementes também podeser manifestado como um aumento em área de semente e/ou comprimento desemente e/ou largura de semente e/ou perímetro de semente. Produçãoaumentada também pode resultar em arquitetura modificada, ou pode ocorrerpor causa de arquitetura modificada.

Planta

O termo "planta" como usado neste lugar abrange plantasinteiras, ancestrais e progênie das plantas e partes vegetais, incluindosementes, partes aéreas, caules, folhas, raízes (incluindo tubérculos), flores, etecidos e órgãos, caracterizado pelo fato de que cada um dos mencionadosacima compreende o gene/ácido nucleico de interesse. O termo "planta"também abrange células de planta, culturas em suspensão, tecido de calo,embriões, regiões meristemáticas, gametófitos, esporófitos, pólen emicrósporos, de novo caracterizado pelo fato de que cada um dosmencionados acima compreende o gene/ácido nucleico de interesse.

Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos selecionados a partir da lista compreendendo Acer spp., Actinidiaspp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera,Allium spp., Amaranthus spp., Ammophila arenaria, Ananas eomosus,Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagusoffieinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina,Avena fatua var. sativa, Avena hybrida), Averrhoa carambola, Bambusa sp.,Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassica spp. (e.g.Brassica napus, Brassiea rapa ssp. [canola, oilseed rape, turnip rape]),Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa,Capsicum spp., Carex elata, Carica papctya, Carissa macrocarpa, Caryaspp., Carthamus tinetorius, Castanea spp., Ceiba pentandra, Cichoriumendivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffeaspp., Colocasia eseulenta, Cola spp., Corchorus sp., Coriandrum sativum,Corylus spp., Crataegus spp., Croeus sativus, Cueurbita spp., Cueumis spp.,Cynara spp., Daucus earota, Desmodium spp., Dimocarpus longan,Dioseorea spp., Diospyros spp., Eehinochloa spp., Elaeis (e.g. Elaeisguineensis, Elaeis oleifera), Eleusine eoraeana, Erianthus sp., Eriobotryajaponiea, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp.,Festuea arundinaeea, Fieus cariea, Fortunella spp., Fragaria spp., Ginkgobiloba, Glyeine spp. (e.g. Glycine max, Soja hispida ou Soja max), Gossypiumhirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva,Hibiseus spp., Hordeum spp. (e.g. Hordeum vulgare), Ipomoea batatas,Juglans spp., Laetuea sativa, Lathyrus spp., Lens eulinaris, Linumusitatissimum, Litehi ehinensis, Lotus spp., Luffa aeutangula, Lupinus spp.,Luzula sylvatiea, Lyeopersieon spp. (e.g. Lyeopersieon eseulentum,Lycopersicon lyeopersicum, Lyeopersieon pyriforme), Maerotyloma spp.,Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica,Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Menthaspp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp.,Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (e.g.Oryza sativa, Oryza latifolia), Panicum miliaceum, Panicum virgatum,Passiflora edulis, Pastinaea sativa, Pennisetum sp., Persea spp.,Petroselinum erispum, Phalaris arundinaeea, Phaseolus spp., Phleumpratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp.,Pistaeia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp.,Psidium spp., Puniea granatum, Pyrus eommunis, Quereus spp., Raphanussativus, Rheum rhabarbarum, Ribes spp., Ricinus eommunis, Rubus spp.,Saecharum spp., Salix sp., Sambueus spp., Seeale cereale, Sesamum spp.,Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium ouSolanum lycopersicum), Sorghum bieolor, Spinaeia spp., Syzygium spp.,Tagetes spp., Tamarindus indica, Theobroma caeao, Trifolium spp.,Triticoseeale rimpaui, Triticum spp. (e.g. Tritieum aestivum, Tritieum durum,Tritieum turgidum, Tritieum hybernum, Triticum maeha, Tritieum sativum ouTritieum vulgare), Tropaeolum minus, Tropaeolum majus, Vaeeinium spp.,Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizania palustris,Ziziphus spp., entre outras.

DESCRIÇÃO DETALHADA DA INVENÇÃO

Descrição detalhada para HAL3

De acordo com uma primeira forma de realização da presenteinvenção, é fornecido um método para aumentar produção vegetal em relaçãoa plantas de controle, compreendendo aumentar preferencialmente expressãode um ácido nucleico codificando um polipeptídeo HAL3 em tecidos emexpansão de uma planta.

Qualquer referência daqui por diante a uma "proteína útil nosmétodos da invenção" é adotada para significar um polipeptídeo HAL3 comodefinido neste lugar. Qualquer referência daqui por diante a um "ácidonucleico útil nos métodos da invenção" é adotada para significar a ácidonucleico capaz de codificar um tal polipeptídeo HAL3. O ácido nucleico a serintroduzido em uma planta (e portanto útil para realizar os métodos dainvenção) é qualquer ácido nucleico codificando o tipo de proteína que seráagora descrito, daqui por diante também chamado "ácido nucleico HAL3" ou"gene HALT.

Uma "referência", "planta de referência", "controle", "plantade controle", "tipo selvagem" ou "planta tipo selvagem" é em particular umacélula, um tecido, um órgão, uma planta, ou uma parte desta, que não foiproduzida de acordo com o método da invenção. Por conseguinte, os termos"tipo selvagem", "controle" ou "referência" são permutáveis e podem ser umacélula ou uma parte da planta tal como uma organela ou tecido, ou umaplanta, que não foi modificada ou tratada de acordo com o método descritoneste lugar de acordo com a invenção. Por conseguinte, a célula ou uma parteda planta tal como uma organela ou uma planta usada como tipo selvagem,controle ou referência corresponde à célula, planta ou parte desta tanto quantopossível e é em qualquer outra propriedade mas no resultado do processo dainvenção tão idêntica ao assunto da invenção quanto possível. Assim, o tiposelvagem, controle ou referência é tratado identicamente ou tão idênticoquanto possível, alegando que apenas condições ou propriedades podem serdiferentes que não influenciam a qualidade da propriedade testada. Istosignifica em outras palavras que o tipo selvagem significa (1) uma planta, quecarrega a forma inalterada ou não modificada de um gene ou alelo ou (2) omaterial/planta inicial do qual as plantas produzidas pelo processo ou métododa invenção são derivadas.

Preferivelmente, qualquer comparação entre as plantas tiposelvagem e as plantas produzidas pelo método da invenção é realizada emcondições análogas. O termo "condições análogas" significa que todas ascondições tal como, por exemplo, condições de cultura ou crescimento,condições de ensaio (tal como composição de tampão, temperatura,substratos, cepa de patógeno, concentrações e os semelhantes) sào mantidasidênticas entre os experimentos a serem comparados.

A "referência", "controle", ou "tipo selvagem" épreferivelmente um sujeito, e.g. uma organela, uma célula, um tecido, umaplanta, que não foi modulada, modificada ou tratada de acordo com oprocesso descrito neste lugar da invenção e é em qualquer outra propriedadetão similar ao assunto da invenção quanto possível. A referência, controle, outipo selvagem é em seu genoma, transcriptoma, proteoma ou metaboloma tãosimilar quanto possível ao sujeito da presente invenção. Preferivelmente, otermo organela, célula, tecido ou planta de "referência" "controle" ou "tiposelvagem", se refere a uma organela, célula, tecido ou planta, que é quasegeneticamente idêntica à organela, célula, tecido ou planta, da presenteinvenção ou uma parte desta preferivelmente 95%, mais preferidos são 98%,ainda mais preferidos são 99,00%, em particular 99,10%, 99,30%, 99,50%,99,70%, 99,90%, 99,99%, 99, 999% ou mais. Preferivelmente a "referência","controle", ou "tipo selvagem" é preferivelmente um sujeito, e.g. umaorganela, uma célula, um tecido, uma planta, que é geneticamente idêntico àplanta, organela celular usada de acordo com o método da invenção excetoque moléculas de ácido nucleico ou o produto de gene codificado por elas sãotrocados, modulados ou modificados de acordo com o método inventivo.

Em caso, um controle, referência ou tipo selvagem diferindodo sujeito da presente invenção apenas não sujeito do método da invenção nãopode ser fornecido, um controle, referência ou tipo selvagem pode ser umaplanta na qual a causa para a modulação da atividade conferindo o aumentodos metabólitos como descrito em exemplos.

O aumento referido da atividade das quantidades depolipeptídeo em uma célula, um tecido, uma organela, um órgão ou umorganismo ou uma parte deste preferivelmente para pelo menos 5%,preferivelmente para pelo menos 10% ou para pelo menos 15%,especialmente preferivelmente para pelo menos 20%, 25%, 30% ou mais,muito especialmente preferivelmente são para pelo menos 40%, 50% ou 60%,mais preferivelmente são para pelo menos 70% ou mais em comparação como controle, referência ou tipo selvagem.

O termo "rendimento aumentado" é adotada para significar umaumento em biomassa (peso) de uma ou mais partes de uma planta, o quepode incluir partes (aptas para corte) acima do solo e/ou partes (aptas paracorte) abaixo do solo. Preferivelmente, o aumento em produção é pelo menos10% sobre a produção de plantas tipo selvagem correspondentes.

Em particular, tais partes aptas para corte são sementes, edesempenho dos métodos da invenção resulta em plantas tendo produçãoaumentada de sementes em relação à produção de sementes de plantas decontrole.

O termo "expressão" ou "expressão de gene" significa oaparecimento de uma característica fenotípica como uma conseqüência datranscrição de um gene específico ou genes específicos. O termo "expressão"ou "expressão de gene" em particular significa a transcrição de um gene ougenes em RNA estrutural (rRNA, tRNA) ou mRNA com traduçãosubseqüente do último em uma proteína. O processo inclui transcrição deDNA, processamento do produto de mRNA resultante e sua tradução em umaproteína ativa.

Desempenho dos métodos da invenção gera plantas tendocaracterísticas de produção melhoradas. Em particular desempenho dosmétodos da invenção gera plantas tendo produção aumentada, especialmenteprodução aumentada de sementes em relação a plantas de controle. Os termos"produção" e "produção de sementes" são descritos em mais detalhe na seçãode "definições" neste lugar.

Referência neste lugar a características de produçãomelhoradas é adotada para significar um aumento em biomassa (peso) de umaou mais partes de uma planta, o que pode incluir partes (aptas para corte)acima do solo e/ou partes (aptas para corte) abaixo do solo. Em particular, taispartes aptas para corte são sementes, e desempenho dos métodos da invençãoresulta em plantas tendo produção aumentada de sementes em relação àprodução de sementes de plantas de controle adequadas.

Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas por hectare ou acre, um aumento no número de espigas por planta, umaumento no número de fileiras, número de sementes por fileira, peso desemente, peso de mil sementes, comprimento/diâmetro de espiga, aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), entre outros. Adotando arrozcomo um exemplo, um aumento de produção pode ser manifestado como umaumento em um ou mais dos seguintes: número de plantas por hectare ouacre, número de panículas por planta, número de espiguilhas por panícula,número de flores (floretes) por panícula (que é expresso como uma proporçãodo número de grãos cheios pelo número de panículas primárias), aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), aumento em peso de milsementes, entre outros.

De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo produçãoaumentada de sementes em relação a plantas de controle. Portanto de acordocom a presente invenção, é fornecido um método para aumentar produção desementes em plantas em relação à produção de sementes de plantas decontrole, o método compreendendo aumentar preferencialmente expressão deum ácido nucleico codificando um polipeptídeo HAL3 em tecidos de partesaéreas, preferivelmente em tecidos em expansão de um parte aérea vegetal.

Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas de controle em um estágiocorrespondente em seu ciclo de vida.

A taxa de crescimento aumentada pode ser específica para umaou mais partes de uma planta (incluindo sementes), ou pode estarsubstancialmente ao longo de toda a planta. Plantas tendo uma taxa decrescimento aumentada podem ter um ciclo de vida mais curto. O ciclo devida de uma planta pode ser adotado para significar o tempo necessário paracrescer de semente madura seca até o estágio onde a planta produziu sementesmaduras secas, similares ao material inicial. Este ciclo de vida pode serinfluenciado por fatores tal como vigor precoce, taxa de crescimento, índicerelativo ao verde, tempo de florescimento e velocidade de maturação desementes. O aumento em taxa de crescimento pode ocorrer em um ou maisestágios no ciclo de vida de uma planta ou durante substancialmente o ciclode vida inteiro de planta. Taxa de crescimento aumentada durante os estágiosiniciais no ciclo de vida de uma planta pode permitir vigor melhorado. Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível (um efeito similar pode ser obtidocom tempo de florescimento adiantado). Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).

Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contra-partestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).

Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.

A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.

De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle. Portanto, deacordo com a presente invenção, é fornecido um método para aumentar a taxade crescimento de plantas, cujo método compreende modular expressão,preferivelmente aumentar expressão, em uma planta de um ácido nucleicocodificando um polipeptídeo HAL3 como definido neste lugar.

Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.

Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devido a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido a seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.

Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.

Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle adequadas cultivadas emcondições comparáveis. Portanto, de acordo com a presente invenção, éfornecido um método para aumentar produção em plantas cultivadas emcondições de não estresse ou em condições de seca branda, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo HAL3.

Desempenho dos métodos da invenção gera plantas cultivadasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo HAL3. Deficiência de nutrientes pode resultarde uma carência ou excesso de nutrientes tal como nitrogênio, fosfatos eoutros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio,manganês, ferro e boro, entre outros.

De acordo com uma segunda característica preferida dainvenção, desempenho dos métodos da invenção gera plantas tendo vigorvegetal aumentado em relação a plantas de controle, particularmente duranteos estágios iniciais de desenvolvimento vegetal (tipicamente três, quatrosemanas após germinação no caso de arroz e milho, mas isto irá variar deespécie para espécie) levando a vigor precoce. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar o vigor precoce deplanta, cujo método compreende modular, preferivelmente aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeoHAL3. Preferivelmente o aumento em vigor de plântula é atingidoexpressando o ácido nucleico codificando o polipeptídeo HAL3 sob ocontrole de um promotor específico de parte aérea. Também é fornecido ummétodo para produzir plantas tendo vigor precoce em relação a plantas decontrole, cujo método compreende modular, preferivelmente aumentar,expressão em uma planta de um ácido nucleico codificando um polipeptídeoHAL3.

Vigor precoce também pode resultar de aptidão vegetalaumentada devido, por exemplo, às plantas serem mais bem adaptadas a seuambiente (i.e. otimizando o uso de recursos energéticos e particionamentoentre parte aérea e raiz). Plantas tendo vigor precoce também mostram umasobrevivência de plântula aumentada e um melhor estabelecimento da cultura,o que freqüentemente resulta em campos altamente uniformes (com a culturacrescendo de maneira uniforme, i.e. com a maioria das plantas atingindo osvários estágios de desenvolvimento substancialmente ao mesmo tempo), efreqüentemente produção melhor e maior. Portanto, vigor precoce pode serdeterminado medindo vários fatores, tal como peso de mil sementes,porcentagem de germinação, porcentagem de emergência, crescimento deplântula, altura de plântula, comprimento de raiz, biomassa de raiz e parteaérea e muito mais.

Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.

Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia.

Outras plantas vantajosas são selecionadas a partir do grupoconsistindo de Asteraceae tal como os gêneros Helianthus, Tagetes e.g. asespécies Helianthus annus [girassol], Tagetes lúcida, Tagetes ereeta ouTagetes tenuifolia [Cravo], Brassicaceae tal como os gêneros Brassica,Arabadopsis e.g. as espécies Brassica napus, Brassica rapa ssp. [canola, colza, nabo] ou Arabidopsis thaliana. Fabaceae tal como os gêneros Glycinee.g. as espécies Glycine max, Soja hispida ou Soja max [soja]. Linaceae talcomo os gêneros Linum e.g. a espécie Linum usitatissimum, [linho, sementede linho]; Poaceae tal como os gêneros Hordeum, Secale, Avena, Sorghum,Oryza, Zea, Triticum e.g. as espécies Hordeum vulgare [cevada]; Secalecereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatuavar. sativa, Avena hybrida [aveia], Sorghum bicolor [Sorgo, milheto], Oryzasativa, Oryza latifolia [arroz], Zea mays [milho, mais] Triticum aestivum,Tritieum durum, Tritieum turgidum, Triticum hybernum, Tritieum macha,Tritieum sativum ou Tritieum vulgare [trigo, trigo da classe pão, trigocomum]; Solanaceae tal como os gêneros Solanum, Lycopersicon e.g. asespécies Solanum tuberosum [batata], Lyeopersieon esculentum, Lycopersiconlyeopersieum, Lyeopersieon pyriforme, Solanum integrifolium ou Solanumlyeopersieum [tomate].

O termo "polipeptídeo HAL3" como definido neste lugar serefere a uma proteína pertecendo à superfamília HFCD (Flavina Homo-oligomérica contendo Cys Descarboxilases; Kupke J. Biol.Chem. 276, 27597-27604, 2001). Estas proteínas compartilham um motivo de ligação de flavina,resíduos conservados de sítio ativo e são enzimas triméricas oudodecaméricas. Proteínas HAL3 compreendem preferivelmente de término Na término C (i) uma hélice de ligação de substrato, (ii) um motivo His deinserção, (iii) um motivo PXMNXXMW e (iv) um grampo dereconhecimento de substrato (Figura 1). Estes quatro domínios são previstosestarem envolvidos em ligação de substrato, o motivo His de inserçãocompreende um resíduo His conservado que está envolvido no sítio ativo aopasso que a seqüência no grampo de reconhecimento de substrato pode ser dealguma maneira variável em seqüência e comprimento (Blaesse et al., EMBOJ. 19, 6299-6310, 2000). As características estruturais (i) a (iv) também sãodescritas em Kupke et al. (2001), cuja descrição é incorporada neste lugar porreferência. Tipicamente, polipeptídeos HAL3 são capazes de ligação decofatores FMN.

Tipicamente a hélice ligação de substrato é compreendida emmotivo de seqüência 1 com a seguinte seqüência consenso (SEQ ID NO: 6):(K/R)PR(V/I)(I/L)LAA(S/T)GSVA(A/S)(I/MA^)KF(G/E/A/S)(N/S/I)L(C/V/A)(H/R7G)(C/S/I)(F/L)(T/S/C)(E/D/Q) WA(E/D) V(RZK)A V(V/A/S).

O motivo His de inserção, o motivo PXMNXXMW e ogrampo de reconhecimento de substrato são parte de motivo de seqüência 2com a seguinte seqüência consenso (SEQ ID NO: 7):VLHIELR(R/K/Q)WAD(V/I/A)(LM)(V/I)IAPLSANTL(G/A)KJAGG(L/M)CDNLLTC(W)(W)RAWD(Y/F)(T/S/N/D/K)KP(L/F/M/I)F(V/A)APAMNT(L/F)MW(N/S/T)NPFT(E/S/Q/A)(R/K)H(L/F/I)F(M)(D/N/S)(E/L/Q)(L/M)G(W/L)(T/S/A/I)L(W)PP(W/T)(K7T/S)K(R/T/K)LACGD(Y/H)G(N/T)GAM(A/S)E

em que Xi pode ser qualquer aminoácido, preferivelmente X1 éum de L, V, Ε, H, D, Μ, I ou Q e caracterizado pelo fato de que X2 pode serqualquer aminoácido, preferivelmente X2 é um de S, L5 T, A, ou V.

Estes motivos formam parte de uma região conservada maiorna proteína, como um exemplo, a região conservada de HAL3a deArabidopsis é dada como SEQ ID NO: 8. Polipeptídeos HAL3 úteis nosmétodos da presente invenção têm em ordem crescente de preferência pelomenos 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüênciacom a região conservada representada por SEQ ID NO: 8.

A região conservada em proteínas HAL3, como exemplificadoem SEQ ID NO: 8 e compreendendo as características descritas acima (i) a(iv), abrange um domínio de Flavoproteína que pode ser identificado usandobancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl.Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30,242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318),Prosite (Bucher and Bairoch (1994), A generalized profile syntax forbiomolecular sequences motifs and its funetion in automatic sequenceinterpretation. (In) ISMB-94; Proceedings 2nd International Conference onIntelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P.,Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al.,Nucl. Acids. Res. 32:D134-D137, (2004)) ou Pfam (Bateman et al., NucleicAcids Research 30(1): 276-280 (2002)). Este domínio de ligação de FMN(Pfam entry PF02441, InterPro entry IPR003382) é tipicamente encontradoem enzimas flavoproteína. Os termos "domínio" e "motivo" são definidos naseção de definições acima.

A região conservada em SEQ ID NO: 2, como representadopor SEQ ED NO: 8, também pode ser identificada em outras proteínas HAL3,usando métodos para o alinhamento de seqüências para comparação comodescrito acima. Em algumas instâncias, os parâmetros padrão podem serajustados para modificar a estringência da busca. Por exemplo usandoBLAST, o limiar de significância estatística (chamado valor esperado") pararelatar pareamentos contra seqüências de banco de dados pode ser aumentadopara mostrar pareamentos menos estringentes. Desta maneira, pareamentoscurtos praticamente exatos podem ser identificados, incluindo os motivosconservados 1 e 2 (SEQ ID NO: 6 e 7), ou pareamentos com uma ou maismudança conservativa em qualquer posição.

Polipeptídeos HAL3 (pelo menos em sua forma nativa) e seushomólogos tipicamente catalisam a descarboxilação de 4'-fosfopantotenoilcisteína para 4'-fosfopanteteína, uma etapa em biossíntese decoenzima A, cuja reação pode ser testada em um ensaio bioquímico;alternativamente, atividade de HAL3 pode ser ensaiada por um teste decomplementação com uma cepa de E. coli dfp mutante (Kupke et al 2001;Yonamine et al 2004). A enzima também é capaz de descarboxilarpantotenoilcisteína a pantotenoilcisteamina. Além disso, a proteína estáenvolvida em conferir tolerância a estresse salino e osmótico a plantas, cujacaracterística pode ser útil em um bioensaio para HAL3.

SEQ ID NO: 2 (codificado por SEQ ID NO: 1) é um exemplode um polipeptídeo HAL3 compreendendo características de término N atérmino C (i) uma hélice de ligação de substrato, (ii) um motivo His deinserção, (iii) um motivo PXMNXXMW e (iv) um grampo dereconhecimento de substrato; e tendo em ordem crescente de preferência pelomenos 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüênciacom a região conservada representada por SEQ ID NO: 8. Exemplosadicionais de polipeptídeos HAL3 compreendendo características (i) a (iv)são dados em Tabela A na seção de exemplos abaixo:

Homólogos de um polipeptídeo HAL3 também podem serusados para realizar os métodos de invenção. Homólogos (ou proteínashomólogas) podem ser prontamente identificados usando técnicas de rotinabem conhecidas na arte, tal como por alinhamento de seqüências. Métodospara o alinhamento de seqüências para comparação são bem conhecidos naarte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA.GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas quemaximiza o número de pareamentos e minimiza o número de lacunas. Oalgoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calculaidentidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Biotechnology Information. Homólogos podem ser prontamenteidentificados usando, por exemplo, o algoritmo de alinhamento de múltiplasseqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamentopareado, e um método de pontuação em porcentagem. Porcentagens globaisde similaridade e identidade também podem ser determinadas usando um dosmétodos disponíveis no pacote de aplicativo computacional MatGAT(Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: anapplication that generates similarity/identity matrices using protein or DNAsequences.). Edição manual secundária pode ser realizada para otimizaralinhamento entre motivos conservados, como seria evidente para uma pessoaversada na arte.

Os valores de identidade de seqüência podem ser determinadosao longo do domínio conservado inteiro (como indicado acima) ou ao longoda seqüência de ácidos nucleicos ou de aminoácidos de comprimentocompleto usando os programas mencionados acima usando os parâmetrospadrão.

Homólogos também incluem ortólogos e parálogos. Ortólogose parálogos podem ser facilmente encontrados realizando uma assim chamadabusca blast recíproca. Isto pode ser feito por um primeiro BLAST envolvendosubmeter uma seqüência de consulta (por exemplo, SEQ ID NO: 1 ou SEQ IDNO: 2) a uma busca BLAST contra qualquer banco de dados de seqüências,tal como o banco de dados publicamente disponível de NCBI. BLASTN ouTBLASTX (usando valores pré-determinados padrão) podem ser usados ao iniciar de uma seqüência de nucleotídeos e BLASTP ou TBLASTN (usandovalores pré-determinados padrão) podem ser usados ao iniciar de umaseqüência de proteínas. Os resultados de BLAST podem ser opcionalmentefiltrados. As seqüências de comprimento completo ou dos resultados filtradosou dos resultados não filtrados são então submetidas a uma segunda buscaBLAST (BLAST de retorno) contra seqüências do organismo do qual aseqüência de consulta é derivada (onde a seqüência de consulta é SEQ IDNO: 1 ou SEQ ID NO: 2 o segundo BLAST deve portanto ser contraseqüências de Arabidopsis). Os resultados da primeira e segunda buscaBLAST são então comparados. Um parálogo é identificado se um acerto dealto pontuação do primeiro BLAST é da mesma espécie da qual a seqüênciade consulta é derivada; um ortólogo é identificado se um acerto de altopontuação não é da mesma espécie da qual a seqüência de consulta éderivada. Ortólogos preferidos são ortólogos de AtHAL3a (SEQ ID NO: 2),AtHAL3b (SEQ ID NO: 10) ou a forma grande de AtHAL3b (SEQ ID NO:40). Acertos de alto pontuação são aqueles tendo um baixo valor E. Quantomenor o valor E, mais significante é o pontuação (ou em outras palavrasmenor a chance de que o acerto tenha sido encontrado ao acaso). Computaçãodo valor E é bem conhecida na arte. No caso de famílias grandes, ClustalWpode ser usado, seguido por uma árvore de agrupamento de vizinhos, paraajudar a visualizar agrupamento de genes relacionados e para identificarortólogos e parálogos. Em adição a valores E, comparações também sãopontuadas por identidade percentual. Identidade percentual se refere aonúmero de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüênciasde ácidos nucleicos (ou polipeptídeos) comparadas ao longo de umcomprimento particular. Preferivelmente, homólogos de polipeptídeo HAL3têm em ordem crescente de preferência pelo menos 60%, 70%, 80%, 85%,90%, 95%, 96%, 97%, 98% ou 99% ou mais identidade ou similaridade deseqüência (identidade funcional) com um polipeptídeo HAL3 não modificadocomo representado por SEQ ID NO: 2. Preferivelmente, homólogos depolipeptídeo HAL3 são as representados pelas seqüências referidas em TabelaA.

O polipeptídeo HAL3 útil nos métodos da presente invençãopode ser um derivado de SEQ ID NO: 2. "Derivados" incluem peptídeos,oligopeptídeos, polipeptídeos que podem, comparados com a seqüência deaminoácidos da forma naturalmente ocorrente da proteína, tal como aquelaapresentada em SEQ ID NO: 2, compreender substituições de aminoácidospor resíduos de aminoácidos não naturalmente ocorrentes, ou adições deresíduos de aminoácidos não naturalmente ocorrentes. Derivados dasproteínas como representado pelas seqüências listadas em Tabela A sãoexemplos adicionais que podem ser adequados para uso nos métodos dainvenção

Exemplos de ácidos nucleicos codificando polipeptídeosHAL3 incluem mas não são limitados àqueles representados pelas seqüênciaslistadas em Tabela A. Variantes de ácidos nucleicos codificando polipeptídeosHAL3 podem ser adequadas para uso nos métodos da invenção. Variantesadequadas incluem porções de ácidos nucleicos codificando polipeptídeosHAL3 e/ou ácidos nucleicos capazes de hibridizar com ácidosnucleicos/genes codificando polipeptídeos HAL3. Variantes adicionaisincluem variantes de união e variantes alélicas de ácidos nucleicoscodificando polipeptídeos HAL3.

O termo "porção" como definido neste lugar se refere a umpedaço de DNA codificando um polipeptídeo compreendendo decaracterísticas de término N a término C (i) uma hélice de ligação desubstrato, (ii) um motivo His de inserção, (iii) um motivo PXMNXXMW e(iv) um grampo de reconhecimento de substrato; e tendo em ordem crescentede preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90% ou 95% deidentidade de seqüência com a região conservada representada por SEQ ID NO: 8.

Uma porção pode ser preparada, por exemplo, fazendo uma oumais deleções a um ácido nucleico codificando um polipeptídeo HAL3. Asporções podem ser usadas em forma isolada ou elas podem ser fusionadas aoutras seqüências de codificação (ou não codificantes) a fim de, por exemplo,produzir uma proteína que combina diversas atividades. Quando fusionado aoutras seqüências de codificação, o polipeptídeo resultante produzidomediante tradução pode ser maior do que aquele previsto para a porção deHAL3. Preferivelmente, a porção codifica para um polipeptídeo comsubstancialmente a mesma atividade biológica que o polipeptídeo HAL3 deSEQ ID NO: 2. A porção é tipicamente é de pelo menos 50, 100, 150 ou 200nucleotídeos de comprimento, preferivelmente pelo menos 250, 300, 350 ou400 nucleotídeos de comprimento, mais preferivelmente pelo menos 450, 500,550, 600 ou 650 nucleotídeos de comprimento.

Preferivelmente, a porção é uma porção de um ácido nucleicocomo representado pelas seqüências listadas em Tabela A. Maispreferivelmente a porção é uma porção de um ácido nucleico comorepresentado por SEQ ID NO: 1.

Os termos "fragmento", "fragmento de uma seqüência" ou"parte de uma seqüência" "porção" ou "porção desta" significam umaseqüência truncada da seqüência original referida. A seqüência truncada(seqüência de ácidos nucleicos ou proteínas) pode variar amplamente emcomprimento; o tamanho mínimo sendo uma seqüência de tamanho suficientepara fornecer uma seqüência com pelo menos uma função e/ou atividadecomparável da seqüência original referida ou hibridizar com a molécula deácido nucleico da invenção ou usado no processo da invenção em condiçõesestringentes, enquanto o tamanho máximo não é crítico. In some applications,o tamanho máximo normalmente não é substancialmente maior do que aquelerequerido para fornecer a(s) atividade(s) e/ou íunções(s) desejada(s) daseqüência original. Uma função comparável significa pelo menos 40%, 45%ou 50%, preferivelmente pelo menos 60%, 70%, 80% ou 90% ou mais daseqüência original.

Outra variante de um ácido nucleico codificando umpolipeptídeo HAL3, útil nos métodos da presente invenção, é um ácidonucleico capaz de hibridizar em condições de estringência reduzida,preferivelmente em condições estringentes, com uma sonda derivada do ácidonucleico como definido acima, cuja seqüência de hibridização codifica umpolipeptídeo compreendendo características de término N a término C (i) umahélice de ligação de substrato, (ii) um motivo His de inserção, (iii) um motivoPXMNXXMW e (iv) um grampo de reconhecimento de substrato; e tem emordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%ou 95% de identidade de seqüência com a região conservada representada porSEQ ID NO: 8.

Preferivelmente, a seqüência de hibridização é uma que écapaz de hibridizar com um ácido nucleico como representado por (ou comsondas derivadas de) as seqüências listadas em Tabela A, ou com uma porçãode qualquer destas seqüências (a seqüência alvo). Mais preferivelmente aseqüência de hibridização é capaz de hibridizar com SEQ ID NO: 1 (ou comsondas derivadas desta). Sondas geralmente são de menos do que 700 bp ou600 bp de comprimento, preferivelmente menos do que 500, 400 bp, 300 bp200 bp ou 100 bp de comprimento. Comumente, comprimentos de sondaspara hibridizações DNA-DNA tal como Southern blotting, variam entre 100 e500 bp, ao passo que a região hibridizante em sondas para hibridizaçõesDNA-DNA tal como em amplificação por PCR geralmente são menores doque 50, mas maiores do que 10 nucleotídeos, preferivelmente elas são de 15,20, 25, 30, 35, 40, 45 ou 50 bp de comprimento.

O polipeptídeo HAL3 pode ser codificado por uma variante deprocessamento. O termo "variante de processamento" como usado neste lugarabrange variantes de uma seqüência de ácidos nucleicos na qual íntrons e/ouéxons selecionados foram cortados, substituídos, deslocados ou adicionados,ou na qual íntrons foram encurtados ou alongados. Tais variantes serão umasnas quais a atividade biológica substancial da proteína é mantida, o que podeser atingido retendo seletivamente segmentos funcionais da proteína. Taisvariantes de união podem ser encontradas na natureza ou podem ser feitaspelo homem. Métodos para fazer tais variantes de união são bem conhecidosna arte.

Variantes de união preferidas são variantes de união do ácidonucleico codificando um polipeptídeo HAL3 compreendendo de término N atérmino C (i) uma hélice de ligação de substrato, (ii) um motivo His deinserção, (iii) um motivo PXMNXXMW e (iv) um grampo dereconhecimento de substrato; e tendo em ordem crescente de preferência pelomenos 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüênciacom a região conservada representada por SEQ ID NO: 8.

Variantes de união adicionalmente preferidas de ácidosnucleicos codificando polipeptídeos HAL3 compreendendo característicascomo definidas acima são variantes de união de um ácido nucleico comorepresentado por qualquer uma das seqüências listadas em Tabela A. Maispreferido é uma variante de processamento de uma seqüência de ácidosnucleicos como representado por SEQ ID NO: 1.

O polipeptídeo HAL3 também pode ser codificado por umavariante alélica de um ácido nucleico codificando um polipeptídeocompreendendo de término N a término C (i) uma hélice de ligação desubstrato, (ii) um motivo His de inserção, (iii) um motivo PXMNXXMW e(iv) um grampo de reconhecimento de substrato; e tendo em ordem crescentede preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90% ou 95% deidentidade de seqüência com a região conservada representada por SEQ EDNO: 8.

Variantes alélicas preferidas de ácidos nucleicos codificandopolipeptídeos HAL3 compreendendo características como definidas acima sãovariantes alélicas de um ácido nucleico como representado por qualquer umadas seqüências listadas em Tabela A. Mais preferido é uma variante alélica deuma seqüência de ácidos nucleicos como representado por SEQ ID NO: 1.

Evolução dirigida (ou embaralhamento gênico) também podeser usada para gerar variantes de ácidos nucleicos codificando polipeptídeosHAL3. Mutagênese dirigida a sítio pode ser usada para gerar variantes deácidos nucleicos codificando polipeptídeos HAL3. Estão disponíveis diversosmétodos para atingir mutagênese dirigida a sítio, o mais comum sendométodos baseados em PCR (Current Protocols in Molecular Biology. Wiley

Eds.).

Ácidos nucleicos codificando polipeptídeos HAL3 podem serderivados de qualquer fonte natural ou artificial. O ácido nucleico pode sermodificado a partir de sua forma nativa em composição e/ou ambientegenômico através de deliberada manipulação humana. Preferivelmente oácido nucleico HAL3 é de uma planta, ainda preferivelmente de uma plantadicotiledônea, mais preferivelmente da família Brassicaceae, maispreferivelmente o ácido nucleico é de Arabidopsis thaliana.

A expressão aumentada de um ácido nucleico codificando umpolipeptídeo HAL3, preferencialmente em partes aéreas de uma planta, podeser realizada introduzindo uma modificação genética (preferivelmente nolocus de um gene HAL3). O locus de um gene como definido neste lugar éadotado para significar uma região genômica, que inclui o gene de interesse e1OKB antes ou depois da região de codificação.

A modificação genética pode ser introduzida, por exemplo, porqualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLINGe recombinação homóloga (como descrito na seção de definições) ouintroduzindo e aumentando expressão um ácido nucleico codificando umpolipeptídeo HAL3 preferencialmente em tecidos em expansão de uma planta.Seguindo introdução da modificação genética, segue uma etapa opcional deselecionar para expressão aumentada de um ácido nucleico codificando umpolipeptídeo de fator HAL3 preferencialmente em tecidos em expansão, cujaexpressão aumentada gera plantas tendo produção aumentada.

Identificação por ativação de T-DNA resulta em plantastransgênicas que mostram fenótipos dominantes devido a expressãomodificada de genes próximos ao promotor introduzido. O promotor a serintroduzido pode ser qualquer promotor capaz de aumentar expressão doácido nucleico codificando um polipeptídeo HAL3 preferencialmente emtecidos em expansão de uma planta.

Uma modificação genética também pode ser introduzida nolocus de um gene codificando um polipeptídeo HAL3 usando a técnica deTILLrNG (Lesões Locais Induzidas Dirigidas em Genomas). Plantascarregando tais variantes mutantes têm expressão aumentada de um ácidonucleico codificando um polipeptídeo HAL3 preferencialmente em tecidosvegetais em expansão.

Ativação de T-DNA e TILLING são exemplos de tecnologiasque possibilitam a geração de modificações genéticas compreendendoaumentar preferencialmente expressão de um ácido nucleico codificando umpolipeptídeo HAL3 em tecidos em expansão de plantas.

Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga. O ácido nucleico a ser direcionadopreferivelmente é a região controlando a expressão natural de um ácidonucleico codificando um polipeptídeo HAL3 em uma planta. Um promotorfraco específico para expressão em partes aéreas é introduzido nesta região,substituindo-a parcialmente ou substancialmente toda ela.

Um método preferido para introduzir uma modificaçãogenética (que neste caso não precisa ser no locus de um gene HAL3) éintroduzir e expressar preferencialmente na parte aérea de uma planta umácido nucleico codificando um polipeptídeo HAL3, como definido acima. Oácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico decomprimento completo ou pode ser uma porção ou uma seqüência dehibridização ou outra variante de ácido nucleico como definido acima.

Os métodos da invenção se fiam em expressãopreferencialmente aumentada de um ácido nucleico codificando umpolipeptídeo HAL3 no tecido de parte aérea de uma planta, preferivelmentena zona de expansão celular de partes aéreas vegetativas.

A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão preferencial das seqüências de ácidosnucleicos úteis nos métodos de acordo com a invenção, em partes aéreas,preferivelmente em tecidos em expansão de uma planta shoots.

Portanto, é fornecido uma construção gênica compreendendo:

(i) um ácido nucleico codificando um polipeptídeo HAL3como definido acima;

(ii) uma ou mais seqüências de controle, das quais pelo menosuma é um promotor específico de parte aérea, operacionalmente ligado aoácido nucleico de (i).

Construções úteis nos métodos de acordo com a presenteinvenção podem ser construídas usando tecnologia de DNA recombinantebem conhecida por pessoas versadas na arte. As construções gênicas podemser inseridas em vetores, que podem estar disponíveis comercialmente,adequados para transformação em plantas e adequados para expressão dogene de interesse nas células transformadas. A invenção portanto fornece usode uma construção gênica como definido acima nos métodos da invenção.

Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeoHAL3). O artesão versado é bem ciente dos elementos genéticos que devemestar presentes no vetor a fim de transformar com sucesso, selecionar epropagar células hospedeiras contendo a seqüência de interesse. A seqüênciade interesse é operacionalmente ligado a uma ou mais seqüências de controle(pelo menos a um promotor).

Promotores adequados, que são funcionais em plantas,geralmente são conhecidos. Eles podem adotar a forma de promotoresconstitutivos ou induzíveis. Promotores adequados podem possibilitar aexpressão desenvolvimento e/ou tecido específica em eucariotosmulticelulares; assim, promotores folha, raiz, flor, semente, estômato,tubérculo ou fruto específicos podem ser vantajosamente usados em plantas.

Diferentes promotores vegetais utilizáveis em plantas sãopromotores tal como, por exemplo, o USP, o LegB4, o promotor DC3 ou opromotor de ubiquitina de salsa.

Para expressão em plantas, a molécula de ácido nucleico deve,como descrito acima, ser operacionalmente ligada a ou compreender umpromotor adequado que expressa o gene no momento certo e de uma maneiracélula ou tecido específica. Promotores utilizáveis são promotoresconstitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), tal como aquelesque se originam de vírus vegetais, tal como 35S CAMV (Franck et al., Cell 21(1980) 285-294), 19S CaMV (veja também Patente Norte-Americana5352605 e Patente Internacional 84/02913), 34S FMV (Sanger et al., Plant.Mol. Biol., 14, 1990: 433-443), o promotor de ubiquitina de salsa, oupromotores vegetais tal como o promotor de subunidade pequena de Rubiscodescrito em Patente Norte-Americana 4.962.028 ou os promotores vegetaisPRP1 [Ward et al., Plant. Mol. Biol. 22 (1993)], SSU, PGEL1, OCS [Leisner(1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai(1990) Plant Mol Biol 15 (3):373-381], STLS1, ScBV (Schenk (1999) PlantMol Biol 39(6):1221-1230), B33, SADl ou SAD2 (promotores de linho, Jainet al., Crop Science, 39 (6), 1999: 1696-1701) ou nos [Shaw et al. (1984)Nucleic Acids Res. 12(20):7831-7846]. Exemplos adicionais de promotoresconstitutivos vegetais são os promotores de V-ATPase de beterraba açucareira(Patente Internacional 01/14572). Exemplos de promotores constitutivossintéticos são o Super promotor (Patente Internacional 95/14098) epromotores derivados de G-boxes (Patente Internacional 94/12015). Seapropriado, promotores quimicamente induzíveis além disso também podemser usados, compare Patente Européia A 388186, Patente Européia A 335528,Patente Internacional 97/06268. Expressão constitutiva estável das proteínasde acordo com a invenção uma planta pode ser vantajosa. Entretanto,expressão induzível do polipeptídeo da invenção é vantajosa, se umaexpressão tardia antes da colheita é vantajosa, pois manipulação metabólicapode levar a retardo de crescimento vegetal.

A expressão de genes vegetais também pode ser facilitadaatravés de um promotor quimicamente induzível (para uma revisão, veja Gatz1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108). Promotoresquimicamente induzíveis são particularmente adequados quando se é desejadoexpressar o gene de uma maneira tempo específica. Exemplos de taispromotores são um promotor induzível por ácido salicílico (PatenteInternacional 95/19443), e promotor induzível por ácido abscísico (PatenteEuropéia 335 528), um promotor induzível por tetraciclina (Gatz et al. (1992)Plant J. 2, 397-404), um promotor induzível por ciclohexanol ou etanol(Patente Internacional 93/21334) ou outros como descrito neste lugar.

Outros promotores adequados são aqueles que reagem acondições de estresse biótico ou abiótico, por exemplo o promotor de genePRPl induzido por patógeno (Ward et al., Plant. Mol. Biol. 22 (1993) 361-366), o promotor hsp80 induzível por calor de tomate (Patente Norte-Americana 5.187.267), o promotor de alfa-amilase induzível por frio de batata(Patente Internacional 96/12814) ou o promotor pinll induzível por ferimento(Patente Européia A-O 375 091) ou outros como descrito neste lugar.

Promotores preferidos são em particular aqueles que induzemexpressão de gene em tecidos e órgãos, em células de semente, tal comocélulas de endosperma e células do embrião em desenvolvimento. Promotoresadequados são o promotor de gene de napina de colza (Patente Norte-Americana 5,608,152), o promotor USP de Vicia faba (Baeumlein et al., MolGen Genet, 1991, 225 (3): 459-67), o promotor de oleosina de Arabidopsis(Patente Internacional 98/45461), o promotor de faseolina de Phaseolusvulgaris (Patente Norte-Americana 5,504,200), o promotor Bce4 de (PatBrassica ente Internacional 91/13980), o promotor arc5 de feijão, o promotorDcG3 de cenoura, ou o promotor de Legumina B4 (LeB4; Baeumlein et al.,1992, Plant Journal, 2 (2): 233-9), e promotores que causam a expressãosemente específica em plantas monocotiledôneas tal como milho, cevada,trigo, centeio, arroz e as semelhantes. Promotores semente específicosvantajosos são o promotor de proteína de ligação de sucrose (PatenteInternacional 00/26388), o promotor de faseolina e o promotor de napina.Promotores adequados que devem ser considerados são o promotor de genelpt2 ou Iptl de cevada (Patente Internacional 95/15389 e Patente Internacional95/23230), e os promotores descritos em Patente Internacional 99/16890(promotores do gene de hordeína de cevada, do gene de glutelina de arroz, dogene de orizina de arroz, do gene de prolamina de arroz, do gene de gliadinade trigo, do gene de glutelina de trigo, do gene de zeína de milho, do gene deglutelina de aveia, do gene de casirina de sorgo e do gene de secalina decenteio). Promotores adequados adicionais são Amy32b, Amy 6-6 eAleuraína [Patente Norte-Americana 5.677.474], Bce4 (colza) [Patente Norte-Americana 5.530.149], glicinina (soja) [Patente Européia 571 741],fosfoenolpiruvato carboxilase (soja) [Patente Japonesa 06/62870], ADRl2-2(soja) [Patente Internacional 98/08962], isocitrato liase (colza) [Patente US5.689.040] ou α-amylase (cevada) [Patente Européia 781 849]. Outrospromotores que estão disponíveis para a expressão de genes em plantas sãopromotores folha específicos tal como aqueles descritos em DE-A 19644478ou promotores regulados por luz tal como, por exemplo, o promotor petE deervilha.

Promotores vegetais adequados adicionais são o promotor deFBPase citosólica ou o promotor ST-LSI de batata (Stockhaus et al., EMBO J.8, 1989, 2445), o promotor de fosforibosilpirofosfato amidotransferase deGlycine max (No. de Acesso de GenBank U87999) ou o promotor nóespecífico descrito em Patente Européia A-O 249 676.

Em uma forma de realização preferida, a seqüência de ácidosnucleicos codificando um polipeptídeo HAL3 é operacionalmente ligada a umpromotor parte aérea específico. Um promotor específico de parte aérea serefere a qualquer promoter capaz de dirigir expressão do gene de interesse emtecidos vegetativos de parte aérea de planta. Preferivelmente, o promotorparte aérea específico é capaz de dirigir preferencialmente expressão do genede interesse em tecidos em expansão de partes aéreas vegetativas, isto é nazona de expansão celular de partes aéreas vegetativas. Referência neste lugara dirigir "preferencialmente" expressão na parte aérea é adotada parasignificar dirigir expressão de qualquer seqüência operacionalmente ligada aeste na zona de expansão celular de partes aéreas vegetativassubstancialmente para a exclusão de expressão dirigida em qualquer outrolugar na planta, além de qualquer expressão residual devido a expressãoevasiva de promotor. O promotor parte aérea específico pode ser ou umpromotor natural ou um sintético.

Preferivelmente, o promotor parte aérea específico é umpromotor isolado de um gene de beta-expansina, tal como um promotorEXBP9 de beta expansina de arroz (Patente Internacional 2004/070039),como representado por SEQ ID NO: 5 ou um promotor de força similar e/ouum promotor com um padrão de expressão similar como o promotor de betaexpansina de arroz (i.e. um promotor funcionalmente equivalente).

Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico codificando um polipeptídeo HAL3 representadopor SEQ ID NO: 1, nem é a aplicabilidade da invenção restrita a expressão deum ácido nucleico codificando um polipeptídeo HAL3 quando dirigida porum promotor de beta expansina.

Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta. Elementos reguladores adicionais podem incluiracentuadores transcricionais assim como traducionais. Aqueles versados naarte estarão cientes de seqüências terminadoras e acentuadoras que podem seradequadas para uso para realizar a invenção. Tais seqüências devem serconhecidas ou podem ser prontamente obtidas por uma pessoa versada naarte.

As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl.Outras seqüências de controle (além de promotor, acentuador,silenciador, seqüências de íntrons, regiões 3'UTR e/ou 5'UTR) podem serproteína e/ou agentes estabilizantes de RNA.

Para a detecção e/ou seleção da transferência bem sucedida dasseqüências de ácidos nucleicos como descrito no protocolo de seqüência eusadas no processo da invenção, é vantajoso usar genes marcadores (= genesrepórteres). Estes genes marcadores possibilitam a identificação de umatransferência bem sucedida das moléculas de ácido nucleico através de umasérie de princípios diferentes, por exemplo, através de identificação visualcom o auxílio de fluorescência, luminescência ou na variação de comprimentode onda de luz que é discernível pelo olho humano, por uma resistência aherbicidas ou antibióticos, através do que são conhecidos como marcadoresnutritivos (marcadores de auxotrofismo) ou marcadores antinutritivos, atravésde ensaios enzimáticos ou através de fitormônios. Exemplos de taismarcadores que podem ser mencionados são GFP (= proteína fluorescenteverde); o sistema luciferina/luciferase, a β-galactosidase com seus substratoscoloridos, por exemplo, X-Gal, as resistências a herbicida para, por exemplo,imidazolinona, glifosato, fosfinotricina ou sulfoniluréia, e resistências aantibiótico para, por exemplo, bleomicina, higromicina, estreptomicina,canamicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina(G418), espectinomicina ou blasticidina, para mencionar apenas alguns,marcadores nutritivos tal como a utilização de manose ou xilose, oumarcadores antinutritivos tal como a resistência a 2-desoxiglicose. Esta lista éum número pequeno possível de marcadores. O trabalhador versado é muitofamiliar com tais marcadores. Diferentes marcadores são preferidos,dependendo do organismo e do método de seleção.

A presente invenção também abrange plantas viáveis pelosmétodos de acordo com a presente invenção. A presente invenção portantofornece plantas, partes vegetais ou células de planta destas viáveis pelométodo de acordo com a presente invenção, cujas plantas ou partes ou célulasdestas compreendem um transgene de ácido nucleico codificando umpolipeptídeo HAL3 sob o controle de um promotor específico de parte aérea.

A invenção também fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, compreendendo introdução e expressão preferencial de um ácidonucleico codificando um polipeptídeo HAL3 na parte aérea de uma planta.

Plantas hospedeiras para os ácidos nucleicos ou o vetor usadono método de acordo com a invenção, a gaveta de expressão ou construção ouvetor são, em princípio, vantajosamente todas as plantas, que são capazes desintetizar os polipeptídeos usados no método inventivo.

Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada cujométodo compreende:

(i) introduzir e preferencialmente expressar um ácido nucleicocodificando um polipeptídeo HAL3 na parte aérea de uma planta; e

(ii) cultivar a célula vegetal em condições que promovemcrescimento e desenvolvimento vegetal.

O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.

A transferência de genes exógenos para o genoma de umaplanta é chamada transformação. Ao fazer isto os métodos descritos para atransformação e regeração de plantas a partir de tecidos vegetais ou células deplanta são utilizados para transformação transiente ou estável. Para selecionarplantas transformadas, o material vegetal obtido na transformação é, comouma regra, sujeito a condições seletivas de forma que plantas transformadaspodem ser distinguidas de plantas não transformadas. Por exemplo, assementes obtidas da maneira descrita acima podem ser plantadas e, depois deum período inicial de crescimento, sujeitas a uma seleção adequada porpulverização. Uma possibilidade adicional consiste em cultivar as sementes,se apropriado depois de esterilização, em placas de ágar usando um agente deseleção adequado de forma que apenas as sementes transformadas podemcrescer até plantas. Métodos de transformação vantajosos adicionais, emparticular para plantas, são conhecidos pelo trabalhador versado e sãodescritos neste lugar abaixo.

Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, eguindo o que o material transformado éregenerado em uma planta inteira.

Como mencionado Agrobactérias transformadas com um vetorde expressão de acordo com a invenção também podem ser usadas da maneiraconhecida por si para a transformação de plantas tal como plantasexperimentais como Arabidopsis ou plantas de cultura, tal como, porexemplo, cereais, milho, aveia, centeio, cevada, trigo, soja, arroz, algodão,beterraba-açucareira, canola, girassol, linho, cânhamo, batata, tabaco, tomate,cenoura, pimentão, colza, tapioca, mandioca, araruta, cravo, alfafa, alface e asvárias espécies de árvores, nozes, e videiras, em particular plantas de culturacontendo óleo tal como soja, amendoim, mamona, girassol, milho, algodão,linho, colza, coco, dendê, açafrão (<Carthamus tinctorius) ou cacau, porexemplo, banhando folhas escarificadas ou segmentos foliares em umasolução agrobacteriana e subseqüentemente cultivando-as em meio adequado.

Em adição à transformação de células somáticas, as quaisentão têm que ser regeneradas em plantas intactas, também é possíveltransformar as células de meristemas vegetais e em particular aquelas célulasque se desenvolvem em gametas. Neste caso, os gametas transformadosseguem o desenvolvimento vegetal natural, gerando plantas transgênicas.Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactériase sementes são obtidas a partir das plantas em desenvolvimento das quais umacerta proporção é transformada e assim transgênica [Feldman, KA and MarksMD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz,N-H Chua and J Shell, eds, Methods in Arabidopsis Research. WordScientific, Singapore, pp. 274-289]. Métodos alternativos são baseados naremoção repetida das inflorescências e incubação do sítio de excisão nocentro da roseta com agrobactérias transformadas, através do que sementestransformadas podem da mesma maneira ser obtidas em um momentoposterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet,245: 363-370). Entretanto, um método especialmente efetivo é o método deinfiltração a vácuo com suas modificações tal como o método de "botãofloral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sobpressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold,N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso dométodo de "botão floral" o tecido floral em desenvolvimento é incubadobrevemente com uma suspensão agrobacteriana tratada com surfactante[Clough, SJ und Bent, AF (1998). The Plant J. 16, 735-743]. Uma certaproporção de sementes transgênicas são coletadas em ambos os casos, e estassementes podem ser distinguidas de sementes não transgênicas cultivando nascondições seletivas descritas acima. Em adição a transformação estável deplastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmentereduzindo ou eliminando o risco de fluxo de transgene através de pólen namaioria das culturas. A tranformação do genoma de cloroplasto geralmente éatingida por um processo, que foi esquematicamente apresentado em Klaus etal., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente asseqüências a serem transformadas são clonadas junto com um gene marcadorselecionável entre seqüências flanqueadoras homólogas ao genoma decloroplasto. Estas seqüências flanqueadoras homólogas dirigem integraçãosítio específica no plastoma. Transformação plastidial foi descrita para muitasespécies de plantas diferentes e uma visão geral pode ser tirada de Bock(2001) Transgenic plastids in basic research and plant biotechnology. J MolBiol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towardscommercialization of plastid transformation technology. Trends Biotechnol.21, 20-28. Progresso biotecnológico adicional foi recentemente relatado emforma de transformantes de plastídeos livres de marcador, que podem serproduzidos por um gene marcador cointegrado transiente (Klaus et al., 2004,Nature Biotechnology 22(2), 225-229).

As células de planta geneticamente modificadas podem serregeneradas através de todos os métodos com os quais o trabalhador versado éfamiliar. Métodos adequados podem ser encontrados nas publicaçõesmencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hõfgen andWillmitzer.

Seguindo transferência de DNA e regeneração, plantasputativamente transformadas podem ser avaliadas, por exemplo usandoanálise Southern, para a presença do gene de interesse, número de cópias e/ouorganização genômica. Alternativamente ou adicionalmente, níveis deexpressão do DNA recentemente introduzido podem ser monitorados usandoanálise Northern e/ou Western, ou PCR quantitativo, todas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.

As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).

A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo1 com a invenção.

A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um polipeptídeo HAL3. Célulashospedeiras preferidas de acordo com a invenção são células de planta.

A invenção também se estende a partes aptas para corte de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.

A presente invenção também abrange uso de ácidos nucleicoscodificando polipeptídeos HAL3 e uso de polipeptídeos HAL3 para aumentarprodução vegetal como definido acima nos métodos da invenção.

Ácidos nucleicos codificando polipeptídeos HAL3, oupolipeptídeos HAL3, podem encontrar uso em programas de melhoramentonos quais é identificado um marcador de DNA que pode ser geneticamenteligado a um gene HAL3. Os ácidos nucleicos/genes, ou os polipeptídeosHAL3 podem ser usados para definir um marcador molecular. Este marcadorde DNA ou proteína pode então ser usado em programas de melhoramentopara selecionar plantas tendo produção aumentada como definido acima nosmétodos da invenção.

Variantes alélicas de um ácido nucleico/gene HAL3 tambémpodem encontrar uso em programas de melhoramento auxiliados pormarcador. Tais programas de melhoramento algumas vezes requeremintrodução de variação alélica por tratamento mutagênico das plantas, usandopor exemplo mutagênese EMS; alternativamente, o programa pode começarcom uma coleção de variantes alélicas de assim chamada origem "natural"causadas não intencionalmente. Identificação de variantes alélicas entãoocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção devariantes alélicas superiores da seqüência em questão e que geram produçãoaumentada. Seleção tipicamente é realizada monitorando desempenho decrescimento de plantas contendo diferentes variantes alélicas da seqüência emquestão. Desempenho de crescimento pode ser monitorado em uma casa devegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantasnas quais a variante alélica superior foi identificada com outra planta. Istopode ser usado, por exemplo, para fazer uma combinação de característicasfenotípicas interessantes.

Um ácido nucleico codificando um polipeptídeo HAL3também pode ser usado como sondas para mapear geneticamente efisicamente os genes dos quais elas são uma parte de, e como marcadores paracaracterísticas ligadas a tais genes. Tal informação pode ser útil emmelhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos HÃL3 requer apenas uma seqüência deácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidosnucleicos HAL3 podem ser usados como marcadores de polimorfismo decomprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J5Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)de DNA genômico vegetal digerido por restrição podem ser sondados com osácidos nucleicos HAL3. O padrão de bandeamento resultante pode então sersujeito a análises genéticas usando programas computacionais tal comoMapMaker (Lander et ai. (1987) Genomics 1: 174-181) a fim de construir ummapa genético. Em adição, os ácidos nucleicos podem ser usados para sondarSouthern blots contendo DNAs genômicos tratados com endonuclease derestrição de um conjunto de indivíduos representando ancestral e progênie deum cruzamento genético definido. Segregação dos polimorfismos de DNA éobservada e usada para calcular a posição do ácido nucleico HAL3 no mapagenético previamente obtido usando esta população (Botstein et al. (1980)Am. J. Hum. Genet. 32:314-331).

A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley (1986)Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas, e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.

As sondas de ácido nucleico também podem ser usadas paramapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).

Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.

Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessárioidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.

Os métodos de acordo com a presente invenção resultam emplantas tendo produção aumentada, como descrito acima. Esta produçãoaumentada também pode ser combinada com outras característicaseconomicamente vantajosas, tal como características acentuadoras deprodução adicionais, tolerância a outros estresses abióticos e bióticos,características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.

Descrição detalhada para MADS15 acima

Surpreendentemente, foi descoberto agora que modularexpressão em uma planta de um ácido nucleico codificando um polipeptídeoMADS15 gera plantas tendo características de produção melhoradas emrelação a plantas de controle. A classe particular de polipeptídeos MADS15adequados para melhorar características de produção em plantas é descrita emdetalhe abaixo.

A presente invenção fornece um método para melhorarcaracterísticas de produção em plantas em relação a plantas de controle,compreendendo modular expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15.

Qualquer referência daqui por diante a uma "proteína útil nosmétodos da invenção" é adotada para significar um polipeptídeo MADS15como definido neste lugar. Qualquer referência daqui por diante a um "ácidonucleico útil nos métodos da invenção" é adotada para significar a ácidonucleico capaz de codificar um tal polipeptídeo MADS15.

Um método preferido para modular (preferivelmente,aumentar) expressão de um ácido nucleico codificando uma proteína útil nosmétodos da invenção é introduzir e expressar em uma planta um ácidonucleico codificando uma proteína útil nos métodos da invenção comodefinido abaixo.

O ácido nucleico a ser introduzido em uma planta (e, portantoútil para realizar os métodos da invenção) é qualquer ácido nucleicocodificando o tipo de proteína que será agora descrito, daqui por diantetambém chamado "ácido nucleico MADS15" ou "gene MADS15".

O termo "polipeptídeo MADS15" como definido neste lugarse refere a uma proteína que cai no grupo de proteínas MADS box tipo FULcomo delineado por Adam et al.(J. Mol. Evol. 62, 15-31). Proteínas MADSbox tipo FUL são parte da subfamília SQUAMOSA e têm a arquiteturaMIKCc típica: um domínio MADS (M) no término N, seguido por umdomínio interveniente (I) envolvido em dimerização, um domínio dequeratina altamente conservado (K) e um domínio variável (C) no término C,que é responsável por ligação de proteínas em interação ou ativaçãotranscricional (De Bodt et al. Trends in Plant Science 8, 475-483).

Polipeptídeos MADS15 vegetais também podem seridentificados pela presença de certos motivos conservados. A presença destesmotivos conservados pode ser identificada usando métodos para oalinhamento de seqüências para comparação como descrito acima. Emalgumas instâncias, os parâmetros padrão podem ser ajustados para modificara estringência da busca. Por exemplo, usando BLAST, o limiar designificância estatística (chamado valor "esperado") para relatar pareamentoscontra seqüências de banco de dados pode ser aumentado para mostrarpareamentos menos estringentes. Desta maneira, pareamentos curtospraticamente exatos podem ser identificados. Mediante identificação de umpolipeptídeo MADS15 pela presença destes motivos, uma pessoa versada naarte pode facilmente derivar o ácido nucleico correspondente codificando opolipeptídeo compreendendo os motivos relevantes, e usar um comprimentosuficiente de nucleotídeos contíguos dos mesmos para realizar qualquer umou mais dos métodos de silenciamento gênico descritos acima (para a reduçãoou eliminação substancial de expressão de um gene MADS15 endógeno).

Tipicamente, a presença de pelo menos um dos motivos 1 a 4deve ser suficiente para identificar qualquer seqüência de consulta como umMADS15, entretanto, a presença de pelo menos motivos 1 e 2 é preferida. Aseqüência consenso fornecida é baseada nas seqüências de monocotiledôneasdadas na listagem de seqüências. Uma pessoa versada na arte estará bemciente de que a seqüência consenso pode variar de alguma maneira seseqüências adicionais ou diferentes (por exemplo, de plantas dicotiledôneas)forem usadas para comparação.

Motivo 1, localizado no domínio MADS (SEQ ID NO: 48):L(L/V)KKA(H/1S0EIS(VI)L(C/Y)DAE(V/I/L)(A/G)(L/A/V)(I/V)(W)FS(T/P/A/N)KGKLYE(Y/F)(A/S)(T/S)(D/N/E)S(K/C/R/S)M(D/E)(N/I/R/K)IL(E/D)R.

Preferivelmente, este motivo conservado de seqüência 1 tem aseqüência:

LLKKAHEISVLCDAEVA(L/A/V)I(W)FS(T/P)KGKLYEYATDS(C/R)M(D/E)(R/K)ILER,

mais preferivelmente o motivo conservado de seqüência 1 tema seqüência:

LLKKAHEISVLCDAEVAAIVFSPKGKLYEYATDSRMDKILER

Motivo 2, localizado no domínio K (SEQ ID NO: 49):KLK(AyS)(K/R)(V/I)E(A/T/S)(L/I)(Q/N)(K/R/N)(S/C/R)(Q/H)(R/K)HLMGE

Preferivelmente, este motivo conservado de seqüência 2 tem aseqüência:

KLKAK(V/I)E(A/T)(L/I)QK(S/C)(Q/H)(R/K)HLMGEMais preferivelmente, este motivo conservado de seqüência 2tem a seqüência:

KLKAKIETIQKCHKHLMGE

Opcionalmente, o polipeptídeo MADS15 ou seu homólogopode compreender no domínio C motivo 3 e/ou motivo 4:motivo 3 (SEQ ID NO: 50):Q(P/Q/V/A)QTS(S/F)(S/F)(S/F)(S/F)(S/C/F)(F/M)motivo 4 (SEQ ID NO: 51):(G/A/V/L)(L/P)XWMX(S/H)

caracterizado pelo fato de que o primeiro resíduo X em motivo4 pode ser qualquer aminoácido, mas preferivelmente L, P ou H; ecaracterizado pelo fato de que o segundo resíduo X pode ser qualqueraminoácido, mas preferivelmente V ou L.

Alternativamente, o domínio C (começando atrás do domíniode queratina, i.e. em Rl75 em SEQ ID NO: 44) pode ser caracterizado pelaocorrência aumentada de glutamina (normalmente 3,93%, aqui pelo menos8,77% com um máximo de 26,73%), em adição, o conteúdo em alanina,prolina, e/ou serina também pode ser aumentado (acima 7,8%, 4,85% e 6,89%respectivamente).

Alternativamente formulada, uma proteína preferida MADS15útil nos métodos da presente invenção compreende pelo menos um domínioMADS N-terminal correspondendo ao domínio SMART SM00432 (PfamPF00319) seguido por um domínio de Queratina correspondendo à região K-box definida em Pfam como PFO1486, mais preferivelmente, a proteínaMADS15 tem em seu domínio MADS a assinatura conservada de SEQ IDNO: 48 e em seu domínio K a assinatura conservada de SEQ ID NO: 49, maispreferivelmente, a proteína MADS15 tem a seqüência dada em SEQ ID NO: 44.

Exemplos de proteínas úteis nos métodos da invenção e ácidosnucleicos codificando as mesmas são dados abaixo em tabela D de Exemplo 8.

Também úteis nos métodos da invenção são homólogos dequalquer uma das seqüências de aminoácidos dadas em tabela D.

Também úteis nos métodos da invenção são derivados dequalquer um dos polipeptídeos dados em tabela D ou ortólogos ou parálogosde qualquer das SEQ ID NOs mencionadas acima. Um derivado preferido éum derivado de SEQ ID NO: 44. Derivados dos polipeptídeos dados emtabela D são exemplos adicionais que podem ser adequados para uso nosmétodos da invenção. Derivados úteis nos métodos da presente invençãopreferivelmente têm atividade biológica e funcional similar à proteína nãomodificada da qual eles são derivados.

A invenção é ilustrada transformando plantas com a seqüênciade ácidos nucleicos de Oryza sativa representada por SEQ ID NO: 43,codificando a seqüência de polipeptídeos de SEQ ID NO: 44, entretantodesempenho da invenção não é restrito a estas seqüências. Os métodos dainvenção podem ser vantajosamente realizados usando qualquer ácidonucleico codificando uma proteína útil nos métodos da invenção comodefinido neste lugar, incluindo ortólogos e parálogos, tal como qualquer dasseqüências de ácidos nucleicos dadas em tabela D. As seqüências deaminoácidos dadas em tabela D podem ser consideradas como sendoortólogas e parálogas do polipeptídeo MADS15 representado por SEQ IDNO: 44.

Ortólogos e parálogos podem ser facilmente encontradosrealizando uma assim chamada busca blast recíproca. Tipicamente, istoenvolve um primeiro BLAST envolvendo realizar BLAST com umaseqüência de consulta (por exemplo, usando qualquer das seqüências listadasem tabela D) contra qualquer banco de dados de seqüências, tal como o bancode dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usandovalores pré-determinados padrão) geralmente são usados ao iniciar de umaseqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência de proteínas. Os resultadosde BLAST podem ser opcionalmente filtrados. As seqüências decomprimento completo ou dos resultados filtrados ou dos resultados nãofiltrados são então BLASTed de volta (segundo BLAST) contra seqüências doorganismo do qual a seqüência de consulta é derivada (onde a seqüência deconsulta é SEQ ID NO: 43 ou SEQ ID NO: 44, o segundo BLAST deve,portanto ser contra seqüências de Oryza sativa). Os resultados do primeiro esegundo BLAST são então comparados. Um parálogo é identificado se umacerto de alto pontuação do primeiro BLAST é da mesma espécie da qual aseqüência de consulta é derivada, um BLAST de retorno então idealmenteresulta na seqüência de consulta como maior acerto; um ortólogo éidentificado se um acerto de alto pontuação no primeiro BLAST não é damesma espécie que da qual a seqüência de consulta é derivada, epreferivelmente resulta mediante BLAST de retorno na seqüência de consultaestando entre os maiores acertos.

Acertos de alto pontuação são aqueles tendo um baixo valor E.Quanto menor o valor E, mais significante é o pontuação (ou em outraspalavras menor a chance de que o acerto tenha sido encontrado ao acaso).Computação do valor E é bem conhecida na arte. Em adição a valores E,comparações também são pontuadas por identidade percentual. Identidadepercentual se refere ao número de nucleotídeos (ou aminoácidos) idênticosentre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadasao longo de um comprimento particular. No caso de famílias grandes,ClustalW pode ser usado, seguido por uma árvore de agrupamento devizinhos, para ajudar a visualizar agrupamento de genes relacionados e paraidentificar ortólogos e parálogos.

Tabela D dá exemplos de ortólogos e parálogos da proteínaMADS15 representada por SEQ ID NO 44. Ortólogos e parálogos adicionaispodem ser prontamente identificados usando o procedimento de BLASTdescrito acima.

As proteínas da invenção são identificáveis pela presença do(s)domínio(s) conservado(s) MADS e/ou queratina (mostrado em Figura 5).Existem bancos de dados especialistas para a identificação de domínios, porexemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244, InterPro (Mulderet al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher and Bairoch(1994), A generalized profile syntax for biomolecular sequences motifs andits function in automatic sequence interpretation. (In) ISMB-94; Proceedings2nd International Conference on Intelligent Systems for Molecular Biology.Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61,AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137,(2004), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280(2002). Um conjunto de ferramentas para análise in silico de seqüênciasprotéicas está disponível no servidor de proteômica ExPASY (hospedado peloSwiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomicsserver for in-depth protein knowledge and analysis, Nucleic Acids Res.31:3784-3788(2003)).

Domínios também podem ser identificados usando técnicas derotina, tal como por alinhamento de seqüências. Métodos para o alinhamentode seqüências para comparação são bem conhecidos na arte, tais métodosincluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar oalinhamento global (i.e. abrangendo as seqüências completas) de duasseqüências que maximiza o número de pareamentos e minimiza o número delacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10)calcula identidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Biotechnology Information (NCBI). Homólogos podem serprontamente identificados usando, por exemplo, o algoritmo de alinhamentode múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão dealinhamento pareado, e um método de pontuação em porcentagem.Porcentagens globais de similaridade e identidade também podem serdeterminadas usando um dos métodos disponíveis no pacote de aplicativocomputacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul10;4:29. MatGAT: an application that generates similarity/identity matricesusing protein or DNA sequences). Edição manual secundária pode serrealizada para otimizar alinhamento entre motivos conservados, como seriaevidente para uma pessoa versada na arte. Além disso, ao invés de usarseqüências de comprimento completo para a identificação de homólogos,domínios específicos (tal como o domínio MADS ou de queratina, ou um dosmotivos definidos acima) também podem ser usados. Os valores de identidadede seqüência, que são indicados abaixo em Exemplo 10 como umaporcentagem foram determinados ao longo da seqüência inteira de ácidosnucleicos ou de aminoácidos, e/ou ao longo de domínios selecionados oumotivo(s) conservado(s), usando os programas mencionados acima usando osparâmetros padrão.

Além disso, uma proteína MADS15 também pode seridentificável por sua capacidade ou incapacidade de se ligar a DNA ou deinteragir com outras proteínas. Atividade de ligação de DNA e interaçõesproteína-proteína podem ser prontamente determinadas in vitro ou in vivousando técnicas bem conhecidas na arte. Exemplos de ensaios in vitro paraatividade de ligação de DNA incluem: análise de retardo em gel usandodomínios de ligação de DNA MADS-box conhecidos (West et al. (1998) NuclAcid Res 26(23): 5277-87), ou ensaios de um híbrido de levedura. Umexemplo de um ensaio in vitro para interações proteína-proteína é a análise dedois híbridos de levedura (Fields and Song (1989) Nature 340:245-6).Proteínas conhecidas por interagir com OsMADS 15 incluem outras proteínasMADS (tal como aquelas envolvidas no complexo de sinalização deflorescimento), quinases tipo receptor tal uma Clavatal e Clavata2, Erecta,BRIl ou RSK. Detalhes adicionais são fornecidos em Exemplo 13.

Ácidos nucleicos codificando proteínas úteis nos métodos dainvenção não precisam ser ácidos nucleicos de comprimento completo, umavez que desempenho dos métodos da invenção não se fia no uso deseqüências de ácidos nucleicos de comprimento completo. Exemplos deácidos nucleicos adequados para uso para realizar os métodos da invençãoincluem as seqüências de ácidos nucleicos dadas em tabela D, mas não sãolimitados àquelas seqüências. Variantes de ácidos nucleicos também podemser úteis para praticar os métodos da invenção. Exemplos de tais variantes deácidos nucleicos incluem porções de ácidos nucleicos codificando umaproteína útil nos métodos da invenção, ácidos nucleicos hibridizando comácidos nucleicos codificando uma proteína útil nos métodos da invenção,variantes de união de ácidos nucleicos codificando uma proteína útil nosmétodos da invenção, variantes alélicas de ácidos nucleicos codificando umaproteína útil nos métodos da invenção e variantes de ácidos nucleicoscodificando uma proteína útil nos métodos da invenção que são obtidas porembaralhamento gênico. Os termos porção, seqüência de hibridização,variante de processamento, variante alélica e embaralhamento gênico serãoagora descritos.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma porção de qualquer uma dasseqüências de ácidos nucleicos dadas em tabela D, ou uma porção de umácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquerdas seqüências de aminoácidos dadas em tabela D.

Porções úteis nos métodos da invenção, codificam umpolipeptídeo caindo dentro da definição de um ácido nucleico codificandouma proteína útil nos métodos da invenção como definido neste lugar e tendosubstancialmente a mesma atividade biológica que as seqüências deaminoácidos dadas em tabela D. Preferivelmente, a porção é uma porção dequalquer um dos ácidos nucleicos dados em tabela D. A porção é tipicamentede pelo menos 400 nucleotídeos consecutivos de comprimento,preferivelmente pelo menos 600 nucleotídeos consecutivos de comprimento,mais preferivelmente pelo menos 700 nucleotídeos consecutivos decomprimento e mais preferivelmente pelo menos 800 nucleotídeosconsecutivos de comprimento, os nucleotídeos consecutivos sendo dequalquer uma das seqüências de ácidos nucleicos dadas em tabela D. Maispreferivelmente a porção é uma porção do ácido nucleico de SEQ ID NO: 43.

Preferivelmente, a porção codifica uma seqüência de aminoácidoscompreendendo (qualquer um ou mais de) do domínio MADS e de queratinacomo definido neste lugar.

Uma porção de um ácido nucleico codificando uma proteínaMADS15 como definido neste lugar pode ser preparada, por exemplo,fazendo uma ou mais deleções ao ácido nucleico. As porções podem serusadas em forma isolada ou elas podem ser fusionadas a outras seqüências decodificação (ou não codificantes) a fim de, por exemplo, produzir umaproteína que combina diversas atividades. Quando fusionado a outrasseqüências de codificação, o polipeptídeo resultante produzido mediantetradução pode ser maior do que aquele previsto para a porção de proteínaMADS15.

Outra variante de ácido nucleico útil nos métodos da invençãoé um ácido nucleico capaz de hibridizar, em condições de estringênciareduzida, preferivelmente em condições estringentes, com um ácido nucleicocodificando uma proteína MADS15 como definido neste lugar, ou com umaporção como definido neste lugar.

Seqüências de hibridização úteis nos métodos da invenção,codificam um polipeptídeo tendo um domínio MADS e/ou de queratina (vejao alinhamento de Figura 6) e tendo substancialmente a mesma atividadebiológica que a proteína MADS15 representada por qualquer das seqüênciasde aminoácidos dadas em tabela D. A seqüência de hibridização é tipicamentede pelo menos 400 nucleotídeos consecutivos de comprimento,preferivelmente pelo menos 600 nucleotídeos consecutivos de comprimento,mais preferivelmente pelo menos 700 nucleotídeos consecutivos decomprimento e mais preferivelmente pelo menos 800 nucleotídeosconsecutivos de comprimento, os nucleotídeos consecutivos sendo dequalquer uma das seqüências de ácidos nucleicos dadas em tabela D.Preferivelmente, a seqüência de hibridização é uma que é capaz de hibridizarcom qualquer dos ácidos nucleicos dados em tabela D, ou com uma porção dequalquer destas seqüências, uma porção sendo como definido acima. Maispreferivelmente, a seqüência de hibridização é capaz de hibridizar com umácido nucleico como representado por SEQ ID NO: 43 ou com uma porçãodeste. Preferivelmente, a seqüência de hibridização codifica uma seqüência deaminoácidos compreendendo qualquer um ou mais dos motivos ou domínioscomo definidos neste lugar.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta um ácido nucleico capaz de hibridizarcom qualquer um dos ácidos nucleicos dados em tabela D, ou compreendendointroduzir e expressar em uma planta um ácido nucleico capaz de hibridizarcom um ácido nucleico codificando um ortólogo, parálogo ou homólogo dequalquer das seqüências de ácidos nucleicos dadas em tabela D.

Outra variante de ácido nucleico útil nos métodos da invençãoé uma variante de processamento codificando uma proteína MADS15 comodefinido acima.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de processamento dequalquer uma das seqüências de ácidos nucleicos dadas em tabela D, ou umavariante de processamento de um ácido nucleico codificando um ortólogo,parálogo ou homólogo de qualquer das seqüências de aminoácidos dadas emtabela D.

Variantes de união preferidas são variantes de união de umácido nucleico representado por SEQ ID NO: 43 ou uma variante deprocessamento de um ácido nucleico codificando um ortólogo ou parálogo deSEQ ID NO: 44. Preferivelmente, a seqüência de aminoácidos codificada pelavariante de processamento compreende qualquer um ou mais dos motivos oudomínios como definido neste lugar.

Outra variante de ácido nucleico útil para realizar os métodosda invenção é uma variante alélica de um ácido nucleico codificando umaproteína MADS15 como definido acima. As variantes alélicas úteis nosmétodos da presente invenção têm substancialmente a mesma atividadebiológica que a proteína MADS15 de SEQ ID NO: 44.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante alélica de qualquer um dosácidos nucleicos dados em tabela D, ou compreendendo introduzir e expressarem uma planta uma variante alélica de um ácido nucleico codificando umortólogo, parálogo ou homólogo de qualquer das seqüências de aminoácidosdadas em tabela D.

Preferivelmente, a variante alélica é uma variante alélica deSEQ ID NO: 43 ou uma variante alélica de um ácido nucleico codificando umortólogo ou parálogo de SEQ ID NO: 44. Preferivelmente, a seqüência deaminoácidos codificada pela variante alélica compreende qualquer um oumais dos motivos ou domínios como definido neste lugar.

Uma variante de ácido nucleico adicional útil nos métodos dainvenção é uma variante de ácido nucleico obtida por embaralhamentogênico. Embaralhamento gênico ou evolução dirigida também pode ser usadapara gerar variantes de ácidos nucleicos codificando proteínas MADS15como definido acima.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de qualquer uma dasseqüências de ácidos nucleicos dadas em tabela D, ou compreendendointroduzir e expressar em uma planta uma variante de um ácido nucleicocodificando um ortólogo, parálogo ou homólogo de qualquer das seqüênciasde aminoácidos dadas em tabela D, cujo ácido nucleico variante é obtido porembaralhamento gênico.

Preferivelmente, o ácido nucleico variante obtido porembaralhamento gênico codifica uma seqüência de aminoácidoscompreendendo qualquer um ou mais dos motivos ou domínios comodefinido neste lugar.

Além disso, variantes de ácidos nucleicos também podem serobtidas por mutagênese dirigida a sítio. Estão disponíveis diversos métodospara atingir mutagênese dirigida a sítio, o mais comum sendo métodosbaseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).

Ácidos nucleicos codificando proteínas MADS15 podem serderivados de qualquer fonte natural ou artificial. O ácido nucleico pode sermodificado a partir de sua forma nativa em composição e/ou ambientegenômico através de deliberada manipulação humana. Preferivelmente oácido nucleico codificando MADS15 é de uma planta, ainda preferivelmentede uma planta monocotiledônea, mais preferivelmente da família Poaceae,mais preferivelmente o ácido nucleico é de Oryza sativa.

Qualquer referência neste lugar a uma proteína MADS15 éportanto adotada para significar uma proteína MADS15 como definido acima.Qualquer ácido nucleico codificando uma tal proteína MADS15 é adequadopara uso para realizar os métodos da invenção.

A presente invenção também abrange plantas ou partes destas(incluindo sementes) viáveis pelos métodos de acordo com a presenteinvenção. As plantas ou partes destas compreendem um transgene de ácidonucleico codificando uma proteína MADS15 como definido acima.A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de ácidos nucleicosúteis nos métodos de acordo com a invenção, em uma planta. As construçõesgênicas podem ser inseridas em vetores, que podem estar disponíveiscomercialmente, adequados para transformação em plantas e adequados paraexpressão do gene de interesse nas células transformadas. A invenção tambémfornece uso de uma construção gênica como definido neste lugar nos métodosda invenção.

Mais especificamente, a presente invenção fornece umaconstrução compreendendo

(a) ácido nucleico codificando proteína MADS15 comodefinido acima;

(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente

(c) uma seqüência de término de transcrição.

Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeoMADS15 como definido neste lugar. O artesão versado é bem ciente doselementos genéticos que devem estar presentes no vetor a fim de transformarcom sucesso, selecionar e propagar células hospedeiras contendo a seqüênciade interesse. A seqüência de interesse é operacionalmente ligada a uma oumais seqüências de controle (pelo menos a um promotor).

Vantajosamente, qualquer tipo de promotor pode ser usadopara dirigir expressão da seqüência de ácidos nucleicos.

O promotor pode ser um promotor constitutivo;alternativamente, o promotor pode ser um promotor induzível, i.e. tendoinício de transcrição induzido ou aumentado em resposta a um promotorquimicamente induzível ou um induzível por estresse, ou um promotorinduzido por patógeno.Adicionalmente ou alternativamente, o promotor pode ser umpromotor órgão específico ou tecido específico, ou o promotor pode ser umpromotor ubíquo, ou o promotor pode ser regulado por desenvolvimento.Além disso, o promotor pode ser órgão específico ou tecido específico oucélula específico.

Preferivelmente, o ácido nucleico MADS15 ou variante deste éoperacionalmente ligado a um promotor constitutivo. Um promotorconstitutivo preferido é um que também é substancialmente expressoubiquamente. Ainda preferivelmente o promotor é derivado de uma planta,mais preferivelmente uma planta monocotiledônea. Mais preferido é uso deum promotor GOS2 (por exemplo de arroz, SEQ ID NO: 47 ou SEQ ID NO:108). Deve ser claro que a aplicabilidade da presente invenção não é restritaao ácido nucleico MADS15 representado por SEQ ID NO: 43, nem é aaplicabilidade da invenção restrita a expressão de um ácido nucleicoMADS15 quando dirigida por um promotor GOS2. Exemplos de outrospromotores constitutivos ou promotores funcionalmente equivalentes quetambém podem ser usados para dirigir expressão de um ácido nucleicoMADS15 são mostrados na seção de definições.

Opcionalmente, uma ou mais seqüências terminadoras podemser usadas na construção introduzida em uma planta. Elementos reguladoresadicionais podem incluir acentuadores transcricionais assim comotraducionais. Aqueles versados na arte estarão cientes de seqüênciasterminadoras e acentuadoras que podem ser adequadas para uso para realizara invenção. Tais seqüências devem ser conhecidas ou podem ser prontamenteobtidas por uma pessoa versada na arte.

Uma seqüência de íntron também pode ser adicionada à região5' não traduzida (UTR) ou na seqüência de codificação para aumentar aquantidade da mensagem madura que se acumula no citosol.

Outras seqüências de controle (além de promotor, acentuador,silenciador, seqüências de íntrons, regiões 3'UTR e/ou 5'UTR) podem serproteína e/ou agentes estabilizantes de RNA. Tais seqüências devem serconhecidas ou podem ser prontamente obtidas por uma pessoa versada naarte.

As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl.

Para a detecção da transferência bem sucedida das seqüênciasde ácidos nucleicos como usado nos métodos da invenção e/ou seleção deplantas transgênicas compreendendo estes ácidos nucleicos, é vantajoso usargenes marcadores (ou genes repórteres). Portanto, a construção genética podeopcionalmente compreender um gene marcador selecionável.

A invenção também fornece um método para a produção deplantas transgênicas tendo características de produção melhoradas em relaçãoa plantas de controle, compreendendo introdução e expressão em uma plantade qualquer ácido nucleico codificando uma proteína MADS15 comodefinido acima.

Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada, cujométodo compreende:

(i) introduzir e expressar em uma planta ou célula vegetal umácido nucleico MADS15 ou variante deste; e

Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira. Para selecionar plantas transformadas, omaterial vegetal obtido na transformação é, como uma regra, sujeito acondições seletivas de forma que plantas transformadas podem serdistinguidas de plantas não transformadas. Por exemplo, as sementes obtidasda maneira descrita acima podem ser plantadas e, depois de um períodoinicial de crescimento, sujeitas a uma seleção adequada por pulverização.

Uma possibilidade adicional consiste em cultivar as sementes, se apropriadodepois de esterilização, em placas de ágar usando um agente de seleçãoadequado de forma que apenas as sementes transformadas podem crescer atéplantas. Alternativamente, as plantas transformadas são tríadas para apresença de um marcador selecionável tal como aqueles descritos acima.

Seguindo transferência de DNA e regeneração, plantasputativamente transformadas também podem ser avaliadas, por exemplousando análise Southern, para a presença do gene de interesse, número decópias e/ou organização genômica. Alternativamente ou adicionalmente,níveis de expressão do DNA recentemente introduzido podem sermonitorados usando análise Northern e/ou Western, ambas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.

As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada e transformanteshomozigotos de segunda geração (ou T2) selecionados, e as plantas T2 podemser então adicionalmente propagadas através de técnicas clássicas demelhoramento.

Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos detecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).

A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estendeadicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordocom a invenção.

A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando uma proteína MADS15 como definidoacima. Células hospedeiras preferidas de acordo com a invenção são célulasde planta.

A invenção também se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, raízes, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.

De acordo com uma característica preferida da invenção, aexpressão modulada é expressão aumentada.

Como mencionado acima, um método preferido para modular(preferivelmente, aumentar) expressão de um ácido nucleico codificando umaproteína MADS15 é introduzir e expressar em uma planta um ácido nucleicocodificando uma proteína MADS15; entretanto os efeitos de realizar ométodo, i.e. melhorar características de produção também podem seratingidos usando outras técnicas bem conhecidas. Uma descrição de algumasdestas técnicas irá agora se seguir.

Uma tal técnica é identificação por ativação de T-DNA. Asplantas transgênicas resultantes mostram fenótipos dominantes devido àexpressão modificada de genes próximos ao promotor introduzido.

Os efeitos da invenção também podem ser reproduzidosusando a técnica de TILLING (Lesões Locais Induzidas Dirigidas emGenomas), ou por recombinação homóloga.

Referência neste lugar a características de produçãomelhoradas é adotada para significar um aumento em biomassa (peso) de umaou mais partes de uma planta, o que pode incluir partes (aptas para corte)acima do solo e/ou partes (aptas para corte) abaixo do solo.

Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas estabelecidas por hectare ou acre, um aumento no número de espigaspor planta, um aumento no número de fileiras, número de sementes porfileira, peso de semente, peso de mil sementes, comprimento/diâmetro deespiga, aumento na taxa de enchimento de grãos (que é o número de grãoscheios dividido pelo número total de grãos e multiplicado por 100), entreoutros. Adotando arroz como um exemplo, um aumento de produção pode sermanifestado como um aumento em um ou mais dos seguintes: número deplantas por hectare ou acre, número de panículas por planta, número deespiguilhas por panícula, número de flores (floretes) por panícula (que éexpresso como uma proporção do número de grãos cheios pelo número depanículas primárias), aumento na taxa de enchimento de grãos (que é onúmero de grãos cheios dividido pelo número total de grãos e multiplicadopor 100), aumento em peso de mil sementes, entre outros.

Em uma forma de realização particular, tais partes aptas paracorte são raízes, e desempenho dos métodos da invenção resulta em plantastendo crescimento aumentado de raízes em relação ao crescimento de raízesde plantas de controle adequadas. Desenvolvimento de raiz é um determinanteessencial de crescimento vegetal e produção de cultura uma vez que a raiz é oprincipal canal para extrair nutrientes do ambiente.

Produção aumentada de raízes pode por exemplo sermanifestada como um de mais dos seguintes: a) quantidade aumentada debiomassa de raiz (através do que uma discriminação entre raízes espessas eraízes delgadas pode ser feita definindo um certo limiar), b) diâmetro médiode raiz aumentado, c) biomassa total de raiz aumentada, e d) proporçãobiomassa de raízes/biomassa de parte aérea aumentada. Para o propósito destainvenção, deve ser entendido que o termo 'crescimento de raiz abrange todosos aspectos de crescimento das diferentes partes que constituem o sistemaradicular em diferentes estágios de seu desenvolvimento, tanto em plantasmonocotiledôneas como dicotiledôneas. Deve ser entendido que crescimentoacentuado da raiz pode resultar de crescimento acentuado de uma ou mais desuas partes incluindo a raiz primária, raízes laterais, raízes adventícias, etc.todas as quais caem dentro do escopo desta invenção.

Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas de controle em um estágiocorrespondente em seu ciclo de vida. A taxa de crescimento aumentada podeser específica para uma ou mais partes de uma planta (incluindo sementes), oupode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxade crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo devida de uma planta pode ser adotado para significar o tempo necessário paracrescer de semente madura seca até o estágio onde a planta produziu sementesmaduras secas, similar ao material inicial. Este ciclo de vida pode serinfluenciado por fatores tal como vigor precoce, taxa de crescimento, índicerelativo ao verde, tempo de florescimento e velocidade de maturação desementes. O aumento em taxa de crescimento pode ocorrer em um ou maisestágios no ciclo de vida de uma planta ou durante substancialmente o ciclode vida inteiro de planta. Taxa de crescimento aumentada durante os estágiosiniciais no ciclo de vida de uma planta pode permitir vigor melhorado. Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível (um efeito similar pode ser obtidocom tempo de florescimento adiantado). Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contrapartestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.

De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle. Portanto, deacordo com a presente invenção, é fornecido um método para aumentar a taxade crescimento de plantas, cujo método compreende modular expressão,preferivelmente aumentar expressão, em uma planta de um ácido nucleicocodificando uma proteína MADS15 como definido neste lugar.

Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.

Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.

Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeoMADS15.

Desempenho dos métodos da invenção gera plantas crescidasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15. Deficiência de nutrientes poderesultar de uma carência ou excesso de nutrientes tal como nitrogênio,fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio,magnésio, manganês, ferro e boro, entre outros.

Em uma forma de realização preferida da invenção, o aumentoem produção e/ou taxa de crescimento ocorre de acordo com os métodos dapresente invenção em condições de não estresse.

Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.

Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas include cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia.

A presente invenção também abrange uso de ácidos nucleicoscodificando a proteína MADS15 descrita neste lugar e uso destas proteínasMADS15 para melhorar características de produção em plantas.

Ácidos nucleicos codificando a proteína MADS15 descritaneste lugar, ou as próprias proteínas MADS15, podem encontrar uso emprogramas de melhoramento nos quais é identificado um marcador de DNAque pode ser geneticamente ligado a um gene codificando MADS15. Osácidos nucleicos/genes, ou as próprias proteínas MADS15 podem ser usadospara definir um marcador molecular. Este marcador de DNA ou proteína podeentão ser usado em programas de melhoramento para selecionar plantas tendocaracterísticas de produção melhoradas como definido acima nos métodos dainvenção.

Variantes alélicas de um gene/ácido nucleico codificandoproteína MADS15 também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.

Ácidos nucleicos codificando proteínas MADS15 tambémpodem ser usados como sondas para mapear geneticamente e fisicamente osgenes dos quais elas são uma parte de, e como marcadores para característicasligadas a tais genes. Tal informação pode ser útil em melhoramento vegetal afim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidosnucleicos codificando proteína MADS15 requer apenas uma seqüência deácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidosnucleicos codificando proteína MADS15 podem ser usados como marcadoresde polimorfismo de comprimento de fragmento de restrição (RFLP). Southernblots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, ALaboratory Manual) de DNA genômico vegetal digerido por restrição podemser sondados com os ácidos nucleicos codificando proteína MADS15. Opadrão de bandeamento resultante pode então ser sujeito a análises genéticasusando programas computacionais tal como MapMaker (Lander et al. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, osácidos nucleicos podem ser usados para sondar Southern blots contendoDNAs genômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando proteína MADS15 no mapagenético previamente obtido usando esta população (Botstein et al. (1980)Am. J. Hum. Genet. 32:314-331).

As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).

Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestrais docruzamento de mapeamento na região correspondendo à atual seqüência deácidos nucleicos. Isto, entretanto, geralmente não é necessário para métodosde mapeamento.

Os métodos de acordo com a presente invenção resultam emplantas tendo características de produção melhoradas, como descrito acima.Estas características também podem ser combinadas com outrascaracterísticas economicamente vantajosas, tal como característicasacentuadoras de produção adicionais, tolerância a outros estresses abióticos ebióticos, características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.

Descrição detalhada de MADS15 abaixo

Foi agora surpreendentemente descoberto que diminuir o nívele/ou atividade de um polipeptídeo MADS15 endógeno gera plantas tendocaracterísticas de produção melhoradas, em particular produção aumentadaem relação a plantas tipo selvagem correspondentes. A presente invençãoportanto fornece métodos para estimular características de produção,particularmente para aumentar produção de uma planta em relação a plantasde controle, compreendendo diminuir o nível e/ou atividade de umpolipeptídeo MADS15 endógeno. Referência neste lugar a "plantas decontrole" é adotada para significar plantas tipo selvagem correspondentes nasquais não existe nenhuma redução em atividade do polipeptídeo MADS15endógeno.

Vantajosamente, desempenho dos métodos de acordo com apresente invenção resulta em plantas tendo produção aumentada,particularmente produção aumentada de sementes e/ou biomassa aumentada,em relação a plantas tipo selvagem correspondentes.

O termo "rendimento aumentado" como definido neste lugar éadotado para significar um aumento em biomassa (peso) de uma ou maispartes de uma planta, o que pode incluir partes (aptas para corte) acima dosolo e/ou partes (aptas para corte) abaixo do solo.

Em particular, tais partes aptas para corte incluem biomassavegetativa e/ou sementes, e desempenho dos métodos da invenção resulta emplantas tendo produção aumentada (em biomassa vegetativa e/ou semente) emrelação à produção de plantas de controle.

O aumento em produção de sementes também pode sermanifestado como um aumento em tamanho de semente e/ou volume desemente. Isto pode aumentar a quantidade, ou mudar a composição de,substâncias na semente, tal como óleos, proteínas e carboidratos.

De acordo com uma característica preferida, desempenho dosmétodos da invenção resulta em plantas tendo produção aumentada,particularmente biomassa e/ou produção de sementes aumentada. Portanto, deacordo com a presente invenção, é fornecido um método para aumentarprodução vegetal, cujo método compreende diminuir o nível de atividade deum polipeptídeo MADS15 ou um homólogo deste, preferivelmentediminuindo expressão de um gene MADS15 ou um homólogo deste.

Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Plantas tendo uma taxa de crescimento aumentada podem terum ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotadopara significar o tempo necessário para crescer de semente madura seca até oestágio onde a planta produziu sementes maduras secas, similar ao materialinicial. Este ciclo de vida pode ser influenciado por fatores tal como vigorprecoce, taxa de crescimento, tempo de florescimento e velocidade dematuração de sementes. Um aumento em taxa de crescimento pode ocorrerem um ou mais estágios no ciclo de vida de uma planta ou durantesubstancialmente o ciclo de vida inteiro de planta. Taxa de crescimentoaumentada durante os estágios iniciais no ciclo de vida de uma planta podepermitir vigor melhorado. O aumento em taxa de crescimento pode alterar ociclo de colheita de uma planta permitindo que plantas sejam semeadas maistarde e/ou colhidas mais cedo do que de outra maneira seria possível (umefeito similar pode ser obtido com tempo de florescimento adiantado). Se ataxa de crescimento é suficientemente aumentada, ela pode permitirsemeadura adicional de sementes da mesma espécie de planta (por exemplosemeadura e colheita de plantas de arroz seguido por semeadura e colheita deplantas de arroz adicionais todas dentro de um período de cultivoconvencional). Similarmente, se a taxa de crescimento é suficientementeaumentada, ela pode permitir semeadura adicional de sementes de espéciesvegetais diferentes (por exemplo a semeadura e colheita de plantas de milhoseguido por, por exemplo, a semeadura e colheita opcional de soja, batata ouqualquer outra planta adequada). Tempos de colheita adicionais do mesmorizoma no caso de algumas plantas de cultura também podem ser possíveis.

Alterar o ciclo de colheita de uma planta pode levar a um aumento emprodução anual de biomassa por acre (devido a um aumento no número devezes (digamos que em um ano) que qualquer planta particular pode sercultivada e colhida). Um aumento em taxa de crescimento também podepermitir o cultivo de plantas transgênicas em uma área geográfica mais amplado que suas contrapartes tipo selvagem, uma vez que as limitações territoriaispara cultivar uma cultura freqüentemente são determinadas por condiçõesambientais adversas ou no momento de plantio (ciclo precoce) ou nomomento de colheita (ciclo tardio). Tais condições adversas podem serevitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode serdeterminada derivando vários parâmetros de curvas de crescimento, taisparâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% deseu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% deseu tamanho máximo), entre outros.

Desempenho dos métodos da invenção gera plantas tendo umataxa de crescimento aumentada. Portanto, de acordo com a presente invenção,é fornecido um método para aumentar a taxa de crescimento de plantas emrelação a plantas de controle, cujo método compreende preferencialmentereduzir o nível e/ou atividade de expressão de um gene MADS15 endógenoem uma planta.

Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.

Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende reduzirexpressão de um gene MADS15 endógeno em uma planta.

Desempenho dos métodos da invenção gera plantas crescidasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende diminuir expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15. Deficiência de nutrientes poderesultar de uma carência ou excesso de nutrientes tal como nitrogênio,fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio,magnésio, manganês, ferro e boro, entre outros.

Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.

Referência neste lugar a uma "diminuição" em nível de umaproteína MADS15 endógena em uma planta é adotada para significar umaredução na concentração da proteína ou eliminação substancial de umaproteína MADS15 endógena em relação a níveis de proteína MADS15endógena encontrados em plantas tipo selvagem correspondentes. Estaredução ou eliminação substancial pode resultar em atividade reduzida ousubstancialmente abolida de proteína MADS15 em uma planta.

Referência neste lugar a uma "diminuição" em atividade deuma proteína MADS15 endógena em uma planta é adotada para significaruma redução em atividade de proteína MADS15 ou eliminação substancial deatividade de uma proteína MADS15 endógena em relação a níveis deatividade de proteína MADS15 endógena encontrados em plantas tiposelvagem.

Preferivelmente, a redução em nível e/ou atividade de proteínaMADS15 endógena é obtida diminuindo a expressão do gene MADS15endógeno.

Referência neste lugar a um gene MADS15 "endógeno" não serefere apenas a genes MADS15 como encontrados em uma planta em suaforma natural (i.e., sem haver qualquer intervenção humana), mas também serefere a genes MADS15 isolados subseqüentemente introduzidos em umaplanta. Por exemplo, uma planta transgênica contendo um transgeneMADS15 pode confrontar uma redução ou eliminação substancial daexpressão de transgene MADS15 e/ou reduzida ou eliminação substancial deexpressão de um gene MADS15 endógeno.

Esta redução (ou eliminação substancial) de expressão de geneMADS15 endógeno pode ser atingida usando qualquer um ou mais dediversos métodos de silenciamento gênico bem conhecidos. "Silenciamentogênico" ou "diminuição" de expressão, como usado neste lugar, se refere auma redução ou à eliminação substancial expressão de gene MADS15 e/ouníveis de polipeptídeo MADS15 e/ou atividade de polipeptídeo MADS15.

Um tal método para redução ou eliminação substancial deexpressão de gene MADS15 endógeno é diminuição mediada por RNA deexpressão de gene (silenciamento de RNA). Silenciamento neste caso édesencadeado em uma planta por uma molécula de RNA de dupla dita(dsRNA) que é substancialmente homóloga a um gene MADS15 alvo. EstedsRNA é adicionalmente processado pela planta em cerca de 21 a cerca de 26nucleotídeos chamados RNAs curtos de interferência (siRNAs). Os siRNAssão incorporados em um complexo de silenciamento induzido por RNA(RISC) que cliva o mRNA de um gene MADS15 alvo, com isso reduzindo ousubstancialmente eliminando o número de mRNAs de MADS15 a seremtraduzidos em uma proteína MADS15.

Um exemplo de um método de silenciamento de RNA envolvea introdução de seqüências de codificação ou partes destas em uma orientaçãosentido em uma planta. O gene adicional, ou parte deste, irá silenciar um geneMADS15 endógeno, gerando um fenômeno conhecido como co-supressão. Aredução de expressão de gene MADS15 será mais pronunciada se diversascópias adicionais são introduzidas na planta, pois existe uma correlaçãopositiva entre altos níveis de transcrito e o desencadeamento de co-supressão.Outro exemplo de um método de silenciamento de RNAenvolve o uso de seqüências de ácidos nucleicos MADS15 antisentido.

O ácido nucleico antisentido pode ser produzidobiologicamente usando um vetor de expressão no qual um ácido nucleico foisubclonado em uma orientação antisentido (i.e., RNA transcrito a partir doácido nucleico inserido será de uma orientação antisentido para um ácidonucleico alvo de interesse, adicionalmente descrito na subseção seguinte).Preferivelmente, produção de ácidos nucleicos antisentido em plantas ocorrepor meio de um transgene estavelmente integrado compreendendo umpromotor operável para expressão constitutiva em plantas, umoligonucleotídeo antisentido, e um terminador.

Um método preferido para redução ou eliminação substancialde expressão de gene MADS15 endógeno através de silenciamento de RNA éusar um vetor de expressão no qual um gene MADS15 ou fragmento deste foiclonado como uma repetição invertida (em parte ou completamente), separadopor um espaçador (DNA não codificante).

Em ainda outra forma de realização, a redução ou eliminaçãosubstancial de expressão endógena de MADS15 pode ser obtida usandoribozimas. Por exemplo, um derivado de um RNA de Tetrahymena L-19 IVSpode ser construído no qual a seqüência de nucleotídeos do sítio ativo écomplementar à seqüência de nucleotídeos a ser clivada em um mRNAcodificando MADS15.

Silenciamento gênico também pode ser atingido pormutagênese por inserção ou se existe uma mutação no gene MADS15endógeno e/ou uma mutação no gene MADS15 isolado subseqüentementeintroduzida em uma planta. A redução ou eliminação substancial de atividadede proteína MADS15 pode ser causada por um MADS15 não funcional. Porexemplo, MADS15 se liga a várias proteínas de interação; uma ou maismutação(ões) e/ou truncamento(s) dentro do MADS box de um MADS15portanto pode sustentar uma proteína MADS15 que ainda é capaz de se ligar aproteínas de interação mas que não pode exibir sua função normal como fatorde transcrição.

Uma abordagem adicional para silenciamento gênico édirecionar seqüências de nucleotídeos complementares à região reguladora dogene MADS15 (e.g., o promotor e/ou acentuadores de MADSl5) para formarestruturas de tripla hélice que previnem transcrição do gene MADS15 emcélulas alvo.

Ainda outra abordagem para silenciamento gênico é descritapor Hiratsu et al. (Plant J. 34, 733-739, 2003). Este método não depende dehomologia de seqüência com o gene visado mas envolve o uso de um domíniode seqüência de repressão em fusões de gene transcricional, e foi usado paramodificar características de interesse agronômico (Fujita et al., Plant Cell 17,3470-3488, 2005 e Mitsuda at al., Plant Cell 17, 2993-3006, 2005).Tipicamente, uma fusão quimérica de nucleotídeos é feita entre um genecodificando uma proteína capaz de influenciar positivamente a expressão dogene visado (tal como um ativador de transcrição), e um fragmento denucleotídeo codificando um domínio de repressão. Mediante expressão dafusão gênica quimérica, a expressão do gene visado é reprimida, normalmentede uma maneira negativa dominante. Domínios de repressão são bemconhecidos na arte, por exemplo o motivo EAR presente em alguns AP2 efator de transcrição dedo de Zinco. Métodos baseados em domínios derepressão são bem adequados para superar redundância gênica para o genevisado nas espécies vegetais de escolha.

São descritos acima exemplos de vários métodos parasilenciamento gênico (para a redução ou eliminação substancial de expressãode gene MADS15 endógeno. Os métodos da invenção se fiam na redução deexpressão de um gene MADS15 endógeno em uma planta. Uma pessoaversada na arte deve ser prontamente capaz de adaptar os métodosmencionados acima para silenciamento de forma a atingir silenciamentogênico em uma planta inteira ou em partes desta através do uso de umpromotor apropriado, por exemplo.

Deve ser observado que a essência da presente invenção residenos resultados vantajosos e surpreendentes encontrados com redução oueliminação substancial de expressão de gene MADS15 endógeno em umaplanta, e não é limitada a qualquer método particular para tal redução oueliminação substancial de atividade de proteína MADS15 endógena. Aatividade de um polipeptídeo MADS15 também pode ser diminuída oueliminada introduzindo uma modificação genética (preferivelmente no locusde um gene MADS15). O locus de um gene como definido neste lugar éadotado para significar uma região genômica, que inclui o gene de interesse e10 kb antes ou depois da região de codificação.

A modificação genética pode ser introduzida, por exemplo, porqualquer um (ou mais) dos seguintes métodos: inativação de T-DNA,TILLING, mutagênese dirigida a sítio, evolução dirigida, recombinaçãohomóloga. Seguindo introdução da modificação genética, segue uma etapa deselecionar para atividade diminuída de um polipeptídeo MADS15, cujadiminuição em atividade gera plantas tendo produção aumentada.

Identificação por inativação de T-DNA envolve inserção deum T-DNA, na região genômica do gene de interesse ou 10 kb antes oudepois da região de codificação de um gene em uma configuração tal que o T-DNA inibe expressão do gene visado. Tipicamente, regulação de expressão dogene visado por seu promotor natural é interrompida. O T-DNA éaleatoriamente inserido no genoma vegetal, por exemplo, através de infecçãopor Agrobacterium e leva a expressão diminuída de genes perto do T-DNAinserido. As plantas transgênicas resultantes mostram fenótipos devidos aexpressão inibida de genes perto do T-DNA introduzido.

Uma modificação genética também pode ser introduzida nolocus de um gene MADS15 usando a técnica de TILLING (Lesões LocaisInduzidas Dirigidas em Genomas).

Mutagênese dirigida a sítio e mutagênese aleatória podem serusadas para gerar variantes de ácidos nucleicos MADSl5. Estão disponíveisdiversos métodos para atingir mutagênese dirigida a sítio, o mais comumsendo métodos baseados em PCR (current protocols in molecular biology.Wiley Eds.)·

Evolução dirigida também pode ser usada para gerar variantesde ácidos nucleicos MADSl5. Isto consiste de repetições de embaralhamentode DNA seguido por triagem e/ou seleção apropriada para gerar variantes deácidos nucleicos MADS15 ou variantes destes codificando polipeptídeosMADS15 tendo uma atividade biológica modificada (aqui diminuída ouabolida) (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).

Ativação de T-DNA, TILLING, mutagênese dirigida a sítio eevolução dirigida são exemplos de tecnologias que possibilitam a geração denovos alelos e variantes de MADSl5.

Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga. O ácido nucleico a ser direcionado pode serum alelo codificando uma proteína inativa ou uma proteína com atividadediminuída, usada para substituir o gene endógeno ou pode ser introduzido emadição ao gene endógeno, e precisa ser direcionado para o locus do geneMADS15.

Outros métodos, tal como o uso de anticorpos dirigidos para oMADS15 endógeno para inibir sua função in planta, ou interferência na viade sinalização na qual MADS15 está envolvido, serão bem conhecidos poralguém versado. Alternativamente, um programa de triagem pode serestabelecido para identificar variantes naturais de um gene MADS15, cujasvariantes têm atividade reduzida de MADS15, ou nenhuma atividade deMADS15. Tais variantes naturais também podem ser usadas nos métodos dapresente invenção.

Para desempenho ótimo, as técnicas de silenciamento gênicousadas para a redução ou eliminação substancial de expressão de geneMADS15 endógeno requerem o uso de seqüências de ácidos nucleicosMADS15 de plantas monocotiledôneas para transformação em plantasmonocotiledôneas. Preferivelmente, um ácido nucleico MADS15 de qualquerdada espécie vegetal é introduzido naquela mesma espécie. Por exemplo, umácido nucleico MADS15 de arroz (seja ele uma seqüência de MADSl5 decomprimento completo ou um fragmento) é transformado em uma planta dearroz. O ácido nucleico MADS15 não precisa ser introduzido na mesmavariedade vegetal.

Referência neste lugar a um "gene MADS15" ou um "ácidonucleico MADS75" é adotada para significar uma forma polimérica de umdesoxirribonucleotídeo ou um polímero de ribonucleotídeo de qualquercomprimento, ou de fita dupla ou simples, ou análogos destes, que têm ascaracterísticas essenciais de um ribonucleotídeo natural na medida em queeles podem hibridizar com ácidos nucleicos de uma maneira similar apolinucleotídeos naturalmente ocorrentes. Um "gene MADSl5" ou um "ácidonucleico MADS15" se refere a um comprimento suficiente de nucleotídeossubstancialmente contíguos de um gene codificando MADS15 para realizarsilenciamento gênico; isto pode ser tão pouco quanto 20 ou menosnucleotídeos. Um gene codificando uma proteína (funcional) não é umrequerimento para os vários métodos discutidos acima para a redução oueliminação substancial de expressão de um gene MADS15 endógeno.

Os métodos da invenção podem ser realizados usando umcomprimento suficiente de nucleotídeos substancialmente contíguos de umgene/ácido nucleico MADS15, que pode consistir de 20 ou menosnucleotídeos, que podem ser de qualquer parte do gene/ácido nucleicoMADSl 5, tal como a extremidade 5' da região de codificação que é bemconservada entre a família de gene MADSl 5, ou codificando um dos motivosconservados descritos abaixo.

Genes MADS15 são bem conhecidos na arte e úteis nosmétodos da invenção são nucleotídeos substancialmente contíguos dogene/ácido nucleico MADSl5 vegetal descrito em Moon et al. (Plant Physiol.120, 1193-1204, 1999).

Outros genes/seqüências de ácidos nucleicos de MADS15também podem ser usados nos métodos da invenção, e podem serprontamente identificados por uma pessoa versada na arte. PolipeptídeosMADS15 podem ser identificados pela presença de uma ou mais de diversascaracterísticas bem conhecidas (veja abaixo). Mediante identificação de umpolipeptídeo MADS15, uma pessoa versada na arte pode facilmente derivar,usando técnicas de rotina, a seqüência de ácidos nucleicos de codificaçãocorrespondente e usar um comprimento suficiente de nucleotídeos contíguosdos mesmos para realizar qualquer um ou mais dos métodos de silenciamentogênico descritos acima.

O termo "polipeptídeo MADS15 ou homólogo deste" comodefinido neste lugar se refere a uma proteína que cai no grupo de proteínasMADS box tipo FUL como delineado por Adam et al.(J. Mol. Evol. 62, 15-31). Proteínas MADS box tipo FUL são parte da subfamília SQUAMOSA etêm a arquitetura MIKCc típica: um domínio MADS (M) no término N,seguido por um domínio interveniente (I) envolvido em dimerização, umdomínio de queratina altamente conservado (K) e um domínio variável (C) notérmino C, que é responsável por ligação de proteínas em interação ouativação transcricional (De Bodt et al. Trends in Plant Science 8, 475-483).

Polipeptídeos MADS15 vegetais também podem seridentificados pela presença de certos motivos conservados. A presença destesmotivos conservados pode ser identificada usando métodos para oalinhamento de seqüências para comparação como descrito acima. Emalgumas instâncias, os parâmetros padrão podem ser ajustados para modificara estringência da busca. Por exemplo usando BLAST, o limiar designificância estatística (chamado valor esperado") para relatar pareamentoscontra seqüências de banco de dados pode ser aumentado para mostrarpareamentos menos estringentes. Desta maneira, pareamentos curtospraticamente exatos podem ser identificados. Mediante identificação de umpolipeptídeo MADS15 pela presença destes motivos, uma pessoa versada naarte pode facilmente derivar o ácido nucleico correspondente codificando opolipeptídeo compreendendo os motivos relevantes, e usar um comprimentosuficiente de nucleotídeos contíguos dos mesmos para realizar qualquer umou mais dos métodos de silenciamento gênico descritos acima (para a reduçãoou eliminação substancial de expressão um gene MADS15 endógeno).

Tipicamente, a presença de pelo menos um dos motivos 1 a 4deve ser suficiente para identificar qualquer seqüência de consulta como umMADS15, entretanto a presença de pelo menos motivos 1 e 2 é preferida. Aseqüência consenso fornecida é baseada nas seqüências de monocotiledôneasdadas na listagem de seqüências. Uma pessoa versada na arte estará bemciente de que a seqüência consenso pode variar de alguma maneira seseqüências adicionais ou diferentes (por exemplo de seqüências dedicotiledôneas) forem usadas para comparação.

Motivo 1, localizado no domínio MADS (SEQ ID NO: 114):

L(LA^)KKA(H/N)EIS(VI)L(C/Y)DAE(V/I/L)(A/G)(L/AAA)(I/V)(I/V)FS(T/P/Ay^)KGKLYE(Y/F)(A/S)(T/S)(D/N/E)S(K/C/R/S)M(D/E)(>í/I/R/K)IL(E/D)R.

Preferivelmente, este motivo conservado de seqüência 1 tem aseqüência:

LLKKAHEISVLCDAEVA(L/AA^)I(W)FS(T/P)KGKLYEYATDS(C/R)M(D/E)(R/K)ILER,mais preferivelmente o motivo conservado de seqüência 1 tema seqüência:

LLKKAHEISVLCDAEVAAIVFSPKGKLYEYATDSRMDKILER

Motivo 2, localizado no domínio K (SEQ ID NO: 115):

KLK(A/S)(K/R)(V/I)E(A/T/S)(L/I)(Q/N)(K/R/N)(S/C/R)(Q/H)(R/K)HLMGE

Preferivelmente, este motivo conservado de seqüência 2 tem aseqüência:

KLKAK(V/I)E(A/T)(L/I)QK(S/C)(Q/H)(R/K)HLMGE

Mais preferivelmente, este motivo conservado de seqüência 2tem a seqüência:

KLK^KIETIQKCHKHLMGE

Opcionalmente, o polipeptídeo MADS15 ou seu homólogopode compreender no domínio C motivo 3 e/ou motivo 4:

motivo 3 (SEQ ID NO: 116):

Q(P/Q/V/A)QTS(S/F)(S/F)(S/F)(S/F)(S/C/F)(F/M)motivo 4 (SEQ ID NO: 117):

(G/A/V/L)(L/P)XWMX(S/H)

Alternativamente, o domínio C (começando atrás do domíniode queratina, i.e. em Rl 75 em SEQ ID NO: 110) pode ser caracterizado pelaocorrência aumentada de glutamina (normalmente 3,93%, aqui pelo menos8,77% com um máximo de 26,73%), em adição, o conteúdo em alanina,prolina, e/ou serina também pode ser aumentado (acima 7,8%, 4,85% e 6,89%respectivamente).Alternativamente formulada, uma proteína MADS15 preferidaútil nos métodos da presente invenção compreende pelo menos um domínioMADS N-terminal correspondendo ao domínio SMART SM00432 (PfamPF00319) seguido por um domínio de Queratina correspondendo à região K-box definida em Pfam como PFO1486, mais preferivelmente, a proteínaMADS15 tem em seu domínio MADS a assinatura conservada de SEQ IDNO: 114 e em seu domínio K a assinatura conservada de SEQ ID NO: 115,mais preferivelmente, a proteína MADS15 tem a seqüência dados em SEQ IDNO: 110.

Homólogos, como definido acima, podem ser prontamenteidentificados usando técnicas de rotina bem conhecidas na arte, tal como poralinhamento de seqüências; homólogos de OsMADS 15 podem ter sidonomeados diferentemente em várias espécies de plantas, portanto os nomes degene/proteína não devem ser usados para identificar ortólogos ou parálogos.Métodos para o alinhamento de seqüências para comparação são bemconhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA eTFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol48: 443-453) para encontrar o alinhamento de duas seqüências completas quemaximiza o número de pareamentos e minimiza o número de lacunas. Oalgoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calculaidentidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Bioteclinology Information. Seqüências homólogas podem serprontamente identificadas usando, por exemplo, o algoritmo de alinhamentode múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão dealinhamento pareado, e um método de pontuação em porcentagem. Ediçãomanual secundária pode ser realizada para otimizar alinhamento entremotivos conservados (veja abaixo), como seria evidente para uma pessoaversada na arte.

Os vários domínios estruturais em uma proteína MADS15podem ser identificados usando bancos de dados especializados e.g. SMART(Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic etal. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003)Nucl. Acids. Res. 31, 315-318;), Prosite (Bucher and Bairoeh (1994), Ageneralized profile syntax for biomolecular sequences motifs and its funetionin automatic sequence interpretation. (In) ISMB-94; Proceedings 2ndInternational Conferenee on Intelligent Systems for Molecular Biology.10 Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61,AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137,(2004)) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280(2002)).

Além disso, uma proteína MADS15 também pode seridentificável por sua capacidade de se ligar a DNA e de interagir com outrasproteínas. Atividade de ligação de DNA e interações proteína-proteína podemser prontamente determinadas in vitro ou in vivo usando técnicas bemconhecidas na arte. Exemplos de ensaios in vitro para atividade de ligação deDNA incluem: análise de retardo em gel usando domínios de ligação de DNAMADS-box conhecidos (West et al. (1998) Nucl Acid Res 26(23): 5277-87),ou ensaios de um híbrido de levedura. Um exemplo de um ensaio in vitro parainterações proteína-proteína é a análise de dois híbridos de levedura (Fieldsand Song (1989) Nature 340:245-6). Proteínas conhecidas por interagir comOsMADS 15 incluem outras proteínas MADS (tal como aquelas envolvidas nocomplexo de sinalização de florescimento), quinases tipo receptor tal umaClavatal e Clavata2, Erecta, BRIl ou RSK.

Portanto mediante identificação de um polipeptídeo MADS15usando uma ou diversas das características descritas acima, uma pessoaversada na arte pode facilmente derivar o ácido nucleico correspondentecodificando o polipeptídeo, e usar um comprimento suficiente de nucleotídeossubstancialmente contíguos do mesmo para realizar qualquer um ou mais dosmétodos de silenciamento gênico descritos acima (para a redução oueliminação substancial de expressão de um gene MADS15 endógeno).

Preferido para uso nos métodos da invenção é umcomprimento suficiente de nucleotídeos substancialmente contíguos de SEQID NO: 109 {OsMADS15), ou o uso de um comprimento suficiente denucleotídeos substancialmente contíguos de uma seqüência de ácidosnucleicos codificando um ortólogo ou parálogo de OsMADS 15 (SEQ ID NO:109). Exemplos de tais ortólogos e parálogos de OsMADS 15 são fornecidosem Tabela D abaixo. Homólogos próximos de OsMADS 15 são as proteínasrepresentadas por SEQ ID NO: 147, 149, 151, 153, 155, 157, 159, 161, 163,165, 167, 169, 171 e 173.

Ortólogos em, por exemplo, espécies de plantasmonocotiledôneas podem ser facilmente encontrados realizando uma assimchamada busca blast recíproca. Isto pode ser feito por um primeiro blastenvolvendo realizar BLAST com uma seqüência de consulta (por exemplo,SEQ ID NO: 109 ou SEQ ID NO: 110) contra qualquer banco de dados deseqüências, tal como o banco de dados publicamente disponível de NCBI.BLASTN ou TBLASTX (usando valores pré-determinados padrão) podem serusados ao iniciar de uma seqüência de nucleotídeos e BLASTP ou TBLASTN(usando valores pré-determinados padrão) podem ser usados ao iniciar de umaseqüência de proteínas. Os resultados de BLAST podem ser opcionalmentefiltrados. As seqüências de comprimento completo ou dos resultados filtradosou dos resultados não filtrados são então BLASTed de volta (segundoBLAST) contra seqüências do organismo do qual a seqüência de consulta éderivada (onde a seqüência de consulta é SEQ ID NO: 109 ou SEQ ID NO:IlOo segundo BLAST deve portanto ser contra seqüências de arroz). Osresultados do primeiro e segundo BLAST são então comparados. Umparálogo é identificado se um acerto de alto pontuação do primeiro BLAST éda mesma espécie da qual a seqüência de consulta é derivada; um ortólogo éidentificado se um acerto de alto pontuação não é da mesma espécie da qual aseqüência de consulta é derivada. Acertos de alto pontuação são aqueles tendoum baixo valor E. Quanto menor o valor E, mais significante é o pontuação(ou em outras palavras menor a chance de que o acerto tenha sido encontradoao acaso). Computação do valor E é bem conhecida na arte. No caso defamílias grandes, ClustalW pode ser usado, seguido por uma árvore deagrupamento de vizinhos, para ajudar a visualizar agrupamento de genesrelacionados e para identificar ortólogos e parálogos.

A fonte dos nucleotídeos substancialmente contíguos de umgene/ácido nucleico MADS15 pode ser qualquer fonte vegetal ou fonteartificial. Para desempenho ótimo, as técnicas de silenciamento gênico usadaspara a redução ou eliminação substancial de expressão de gene MADS15endógeno requerem o uso de seqüências de MADSl 5 de plantasmonocotiledôneas para transformação em plantas monocotiledôneas.Preferivelmente, seqüências de MADSl 5 da família Poaceae sãotransformadas em plantas da família Poaceae. Ainda preferivelmente, umácido nucleico MADS15 de arroz (seja ele uma seqüência de MADSl5 decomprimento completo ou um fragmento) é transformado em uma planta dearroz. O ácido nucleico MADS15 não precisa ser introduzido na mesmavariedade vegetal. Mais preferivelmente, o ácido nucleico MADS15 de arroz éde um comprimento suficiente de nucleotídeos substancialmente contíguos deSEQ ID NO: 109 (OsMADS 15) ou um comprimento suficiente denucleotídeos substancialmente contíguos de uma seqüência de ácidosnucleicos codificando um ortólogo ou parálogo de OsMADS15 (SEQ ID NO:110). Como mencionado acima, uma pessoa versada na arte deve estar bemciente do que iria constituir um comprimento suficiente de nucleotídeossubstancialmente contíguos para realizar qualquer dos métodos desilenciamento gênico definidos acima, isto pode ser tão pouco quanto 20 oumenos nucleotídeos substancialmente contíguos em alguns casos.

A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de nucleotídeos úteisnos métodos de acordo com a invenção.

Portanto, é fornecido uma construção gênica compreendendouma ou mais seqüências de controle capazes de dirigir expressão de umaseqüência de ácidos nucleicos de MADS15 sentido e/ou antisentido em umaplanta de forma a silenciar um gene MADS15 endógeno na planta; eopcionalmente uma seqüência de término de transcrição. Preferivelmente, aseqüência de controle é um promotor constitutivo e ubíquo.

Uma construção preferida para silenciamento gênico é umacompreendendo uma repetição invertida de um gene MADS15 ou fragmentodeste, preferivelmente capaz de formar uma estrutura em forma de grampo,cuja repetição invertida está sob o controle de um promotor constitutivo.

Portanto, a invenção fornece uma construção compreendendo:

(a) um ácido nucleico MADS15 capaz de formar umaestrutura em forma de grampo;

(c) uma seqüência de término de transcrição.

Construções úteis nos métodos de acordo com a presente

invenção podem ser criadas usando tecnologia de DNA recombinante bemconhecida por pessoas versadas na arte. As construções gênicas podem serinseridas em vetores, que podem estar disponíveis comercialmente, adequadospara transformação em plantas e adequados para expressão do gene deinteresse nas células transformadas. A invenção portanto fornece uso de umaconstrução gênica como definido acima nos métodos da invenção.

A seqüência de interesse é operacionalmente ligada a uma oumais seqüências de controle (pelo menos a um promotor) capazes deaumentar expressão em uma planta.

Vantajosamente, qualquer tipo de promotor pode ser usadopara dirigir expressão da seqüência de ácidos nucleicos. O promotor pode serum promotor induzível, i.e. tendo início de transcrição induzido ouaumentado em resposta a um estímulo evolutivo, químico, ambiental oufísico. Adicionalmente ou alternativamente, o promotor pode ser um promotorpreferido por tecido ou preferido por célula, i.e. um que é capaz depreferencialmente iniciar transcrição em certos tecidos, tal como as folhas,raízes, tecido de semente etc, ou mesmo em células específicas. Promotorescapazes de iniciar transcrição em certos tecidos ou células apenas sãoreferidos neste lugar como "tecido específicos", respectivamente "célulaespecíficos".

Preferivelmente, o ácido nucleico MADS15 ou variantefuncional deste é operacionalmente ligado a um promotor constitutivo.Preferivelmente o promotor é um promotor ubíquo e é expressopredominantemente ao longo da planta. Preferivelmente, o promotorconstitutivo capaz de expressar preferencialmente o ácido nucleico ao longoda planta tem um perfil de expressão comparável um promotor GOS2. Maispreferivelmente, o promotor constitutivo tem o mesmo perfil de expressãoque o promotor GOS2 de arroz, mais preferivelmente, o promotor capaz deexpressar preferencialmente o ácido nucleico ao longo da planta é o promotorGOS2 de arroz (SEQ ID NO: 113 ou SEQ ID NO: 174). Deve ser claro que aaplicabilidade da presente invenção não é restrita ao ácido nucleico MADS15representado por SEQ ID NO: 109, nem é a aplicabilidade da invençãorestrita a expressão de um ácido nucleico MADS15 quando dirigida por umpromotor GOS2. Um promotor constitutivo alternativo que é útil nos métodosda presente invenção é o grupo de promotor de proteína de alta mobilidade(PR00170, SEQ ID NO: 40 em Patente Internacional 2004070039).Exemplos de outros promotores constitutivos que também podem ser usadospara dirigir expressão de um ácido nucleico MADS15 são mostrados na seçãode definições.

Opcionalmente, uma ou mais seqüências terminadoras tambémpodem ser usadas na construção introduzida em uma planta. Elementosreguladores adicionais podem incluir acentuadores transcricionais assim comotraducionais. Aqueles versados na arte estarão cientes de seqüênciasterminadoras e acentuadoras que podem ser adequadas para uso para realizara invenção. Tais seqüências devem ser conhecidas ou podem ser prontamenteobtidas por uma pessoa versada na arte.

As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl. A construção genética pode opcionalmentecompreender um gene marcador selecionável.

A presente invenção também abrange plantas incluindo partesvegetais viáveis pelos métodos de acordo com a presente invenção tendoprodução aumentada em relação a plantas de controle e que têm expressãoreduzida ou substancialmente eliminada de um gene MADS15 endógeno.

A invenção além disso fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, cujas plantas transgênicas têm expressão reduzida ousubstancialmente eliminada de um gene MADS15 endógeno.

Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada desementes cujo método compreende:introduzir e expressar em uma planta, parte vegetal oucélula vegetal uma construção gênica compreendendo uma ou maisseqüências de controle capazes de preferencialmente dirigir expressão de umaseqüência de ácidos nucleicos de MADS15 com repetição invertida em umaplanta de forma a silenciar um gene MADS15 endógeno na planta; e

cultivar a planta, parte vegetal ou célula vegetal emcondições que promovem crescimento e desenvolvimento vegetal.

Preferivelmente, a construção introduzida em uma planta éuma compreendendo uma repetição invertida (em parte ou completa) de umgene MADS15 ou fragmento deste, preferivelmente capaz de formar umaestrutura em forma de grampo.

De acordo com uma característica preferida da presenteinvenção, a construção é introduzida em uma planta por transformação.

Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira.

As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.

A invenção também se estende a partes aptas para corte deuma planta tal como sementes e produtos derivados, preferivelmentediretamente derivados, de uma parte apta para corte de uma tal planta, talcomo péletes ou pós secos, óleo, gordura, ácidos graxos, amido ou proteínas.

A presente invenção também abrange uso de ácidos nucleicosMADS15 para a redução ou eliminação substancial de expressão de geneMADS15 endógeno em uma planta para aumentar produção de sementes deplanta como definido acima.

Variantes alélicas de um gene/ácido nucleico codificandoproteína MADS15 também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.

Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.

Os métodos de acordo com a presente invenção resultam emplantas tendo características de produção melhoradas, como descrito acima.

Estas características também podem ser combinadas com outrascaracterísticas economicamente vantajosas, tal como característicasacentuadoras de produção adicionais, tolerância a outros estresses abióticos ebióticos, características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.

Descrição detalhada de PLT

De acordo com a presente invenção, é fornecido um métodopara aumentar produção vegetal em relação a plantas de controle,compreendendo aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT.

O termo "produção aumentada" como definido neste lugar éadotada para significar um aumento em biomassa (peso) de uma ou maispartes de uma planta, o que pode incluir partes (aptas para corte) acima dosolo e/ou partes (aptas para corte) abaixo do solo.

De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo produçãoaumentada de sementes em relação a plantas de controle. Portanto de acordocom a presente invenção, é fornecido um método para aumentar produção desementes em plantas em relação à produção de sementes de plantas decontrole, o método compreendendo aumentar expressão em uma planta de umácido nucleico codificando um polipeptídeo de fator de transcrição PLT.

Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Um planta tendo uma taxa de crescimento aumentada podeainda exibir florescimento precoce. O aumento em taxa de crescimento podeocorrer em um ou mais estágios no ciclo de vida de uma planta ou durantesubstancialmente o ciclo de vida inteiro de planta. Taxa de crescimentoaumentada durante os estágios iniciais no ciclo de vida de uma planta podepermitir vigor melhorado (vigor aumentado de plântula em emergência). Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível. Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contrapartestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.

Desempenho dos métodos da invenção gera plantas tendo umataxa de crescimento aumentada. Portanto, de acordo com a presente invenção,é fornecido um método para aumentar a taxa de crescimento de plantas, cujométodo compreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT.

Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda característicasde produção melhoradas em relação a plantas de controle cultivadas emcondições comparáveis. Portanto, de acordo com a presente invenção, éfornecido um método para melhorar características de produção, em particularpara aumentar produção, em plantas cultivadas em condições de não estresseou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeode fator de transcrição PLT.

Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.

Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Exemplos de plantas de cultura típicas cultivadas para produção de óleoincluem soja, girassol, algodão, canola, amendoim ou palma. Exemplos deplantas de cultura típicas cultivadas para produção de amido incluem arroz,trigo, cevada, milho ou batata. Ainda preferivelmente, a planta é uma plantamonocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereaisincluem arroz, milho, trigo, cevada, milheto, centeio, triticale, sorgo e aveia.

O termo "polipeptídeo de fator de transcrição PLT" comodefinido neste lugar se refere a qualquer polipeptídeo compreendendo emordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90%, 95%,96%, 97%, 98% ou 99% de identidade de seqüência com o domínio AP2representado por SEQ ID NO: 191.

Preferivelmente o polipeptídeo de fator de transcrição PLT deescolha é um polipeptídeo de fator de transcrição PLT que em seu ambientegenético natural é essencialmente expresso nas raízes (partes abaixo do solo)da planta.

Ainda preferivelmente, o polipeptídeo de fator de transcriçãoPLT compreende ou um motivo mas preferivelmente tanto o motivo 1 comorepresentado por SEQ ID NO: 192 PK(V/L)(A/E)DFLG como o motivo 2como representado por SEQ ID NO: 209: (V/L)FX(M/V)WN(D/E),caracterizado pelo fato de que X pode ser qualquer aminoácido;preferivelmente motivo 2 tem a seqüência de SEQ ID NO: 193(V/L)F(T/S/N)(M/V)WN(D/E).

Exemplos de polipeptídeos de fator de transcrição PLTcompreendendo (i) em ordem crescente de preferência pelo menos 70%, 75%,80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüênciacom o domínio AP2 representado por SEQ ID NO: 191 são proteínasrepresentadas pelas seqüências dadas em Tabela I na seção de exemplos.

Exemplos preferidos são representados por SEQ ID NO: 176 e SEQ ED NO:178.

O domínio AP2 em um polipeptídeo de fator de transcriçãoPLT pode ser identificado usando bancos de dados especializados e.g.SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864;

Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al.,(2003) Nucl. Acids. Res. 31,315-318), Prosite (Bucher and Bairoch (1994), Ageneralized profile syntax for biomolecular sequences motifs and its funetionin automatic sequence interpretation. (In) ISMB-94; Proceedings 2ndInternational Conference on Intelligent Systems for Molecular Biology.

Altman R, Brutlag D., Karp P., Lathrop R, Searls D., Eds., pp53-61,AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137,

(2004)) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280(2002)). O domínio AP2 de um fator de transcrição PLT compreende duasrepetições Rl e R2, cada de cerca de 68 aminoácidos e separadas por umaregião ligante (Figura 13).

O domínio AP2 como representado por SEQ ID NO: 191 podeser identificado usando métodos para o alinhamento de seqüências paracomparação como descrito acima. Em algumas instâncias, os parâmetrospadrão podem ser ajustados para modificar a estringência da busca. Porexemplo usando BLAST, o limiar de significância estatística (chamado valoresperado") para relatar pareamentos contra seqüências de banco de dadospode ser aumentado para mostrar pareamentos menos estringentes. Destamaneira, pareamentos curtos praticamente exatos podem ser identificados,incluindo motivo 1 como representado por SEQ ID NO: 192 e motivo 2 comorepresentado por SEQ ID NO: 209, preferivelmente como representado porSEQ ID NO: 193.

Homólogos de um polipeptídeo de fator de transcrição PLTtambém podem ser usados para realizar os métodos de invenção. Homólogos(ou proteínas homólogas) podem ser prontamente identificados usandotécnicas de rotina bem conhecidas na arte, tal como por alinhamento deseqüências. Métodos para o alinhamento de seqüências para comparação sãobem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST,FASTA e TFASTA. GAP usa o algoritmo de Needleman and Wunsch ((1970)J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüênciascompletas que maximiza o número de pareamentos e minimiza o número delacunas. O algoritmo BLAST (Altschul et ai. (1990) J Mol Biol 215: 403-10)calcula identidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Biotechnology Information. Homólogos podem ser prontamenteidentificados usando, por exemplo, o algoritmo de alinhamento de múltiplasseqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamentopareado, e um método de pontuação em porcentagem. Edição manualsecundária pode ser realizada para otimizar alinhamento entre motivosconservados, como seria evidente para uma pessoa versada na arte.

Homólogos também incluem ortólogos e parálogos. Ortólogose parálogos podem ser facilmente encontrados realizando uma assim chamadarealizar BLAST com uma seqüência de consulta (por exemplo, SEQ ID NO:175, SEQ ID NO: 176, SEQ ID NO: 177 ou SEQ ID NO: 178) contraqualquer banco de dados de seqüências, tal como o banco de dadospublicamente disponível de NCBI. BLASTN ou TBLASTX (usando valorespré-determinados padrão) podem ser usados ao iniciar de uma seqüência denucleotídeos e BLASTP ou TBLASTN (usando valores pré-determinadospadrão) podem ser usados ao iniciar de uma seqüência de proteínas. Osresultados de BLAST podem ser opcionalmente filtrados. As seqüências decomprimento completo ou dos resultados filtrados ou dos resultados nãofiltrados são então BLASTed de volta (segundo BLAST) contra seqüências doorganismo do qual a seqüência de consulta é derivada (onde a seqüência deconsulta é SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 177 ou SEQ IDNO: 178, o segundo BLAST deve portanto ser contra seqüências deArabidopsis thaliana). Os resultados do primeiro e segundo BLAST são entãocomparados. Um parálogo é identificado se um acerto de alto pontuação doprimeiro BLAST é da mesma espécie da qual a seqüência de consulta éderivada; um ortólogo é identificado se um acerto de alto pontuação não é damesma espécie da qual a seqüência de consulta é derivada. Acertos de altopontuação são aqueles tendo um baixo valor E. Quanto menor o valor E, maissignificante é o pontuação (ou em outras palavras menor a chance de que oacerto tenha sido encontrado ao acaso). Computação do valor E é bemconhecida na arte. No caso de famílias grandes, ClustalW pode ser usado,seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizaragrupamento de genes relacionados e para identificar ortólogos e parálogos.

Em adição a valores E, comparações também são pontuadas por identidadepercentual. Identidade percentual se refere ao número de nucleotídeos (ouaminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (oupolipeptídeos) comparadas ao longo de um comprimento particular.Homólogos de polipeptídeo de fator de transcrição PLT têm em ordemcrescente de preferência pelo menos 25%, 30%, 40%, 50%, 60%, 70%, 80%,85%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais identidade ou similaridadede seqüência (identidade funcional) com um polipeptídeo de fator detranscrição PLT não modificado como representado por SEQ ID NO: 176 ouSEQ ID NO: 178. Identidade percentual entre homólogos de polipeptídeo defator de transcrição PLT fora do domínio AP2 pelo que dizem é baixa.Preferivelmente5 homólogos de polipeptídeo de fator de transcrição PLTcompreendem um domínio AP2 com em ordem crescente de preferência pelomenos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% deidentidade de seqüência com o domínio AP2 representado por SEQ ID NO:191. Ainda preferivelmente, homólogos de polipeptídeo de fator detranscrição PLT são como representados por SEQ ID NO: 180, SEQ ED NO:182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ED NO: 200e SEQ ID NO: 202.

O polipeptídeo PLT pode ser um derivado de SEQ ED NO: 176ou SEQ ID NO: 178. "Derivados" incluem peptídeos, oligopeptídeos,polipeptídeos que podem, comparados com a seqüência de aminoácidos daforma naturalmente ocorrente da proteína, tal como aquela apresentada emSEQ ID NO: 176 ou SEQ ID NO: 178, compreender substituições deaminoácidos com resíduos de aminoácidos não naturalmente ocorrentes, ouadições de resíduos de aminoácidos não naturalmente ocorrentes. Derivadosde SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186,SEQ ID NO: 188, SEQ ID NO: 200 e SEQ ID NO: 202 são exemplosadicionais que podem ser adequados para uso nos métodos da invençãocontanto que eles tenham atividade biológica igual ou similar.

Além disso, polipeptídeos de fator de transcrição PLT (pelomenos em sua forma nativa) tipicamente têm atividade de ligação de DNA eum domínio de ativação. Uma pessoa versada na arte pode facilmentedeterminar a presença de um domínio de ativação e atividade de ligação deDNA usando técnicas e procedimentos de rotina. Proteínas interagindo compolipeptídeos de fator de transcrição PLT (como, por exemplo, em complexostranscricionais) podem ser facilmente identificadas usando técnicas padrãopor uma pessoa versada na arte.

Exemplos de ácidos nucleicos codificando polipeptídeos defator de transcrição PLT incluem mas não são limitados àqueles representadospor qualquer um de: SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179,SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187,SEQ ID NO: 199 e SEQ ID NO: 201. Variantes de ácidos nucleicoscodificando polipeptídeos de fator de transcrição PLT podem ser adequadaspara uso nos métodos da invenção contanto que elas tenham atividadebiológica igual ou similar. Variantes adequadas incluem porções de ácidosnucleicos codificando polipeptídeos de fator de transcrição PLT e/ou ácidosnucleicos capazes de hibridizar com ácidos nucleicos/genes codificandopolipeptídeos de fator de transcrição PLT. Variantes adicionais incluemvariantes de união e variantes alélicas de ácidos nucleicos codificandopolipeptídeos de fator de transcrição PLT.

O termo "porção" como definido neste lugar se refere a umpedaço de DNA codificando um polipeptídeo compreendendo em ordemcrescente de preferência pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%,97%, 98% ou 99% de identidade de seqüência com o domínio AP2representado por SEQ ID NO: 191. A porção pode compreenderadicionalmente ou um motivo mas preferivelmente tanto motivo 1 comorepresentado por SEQ ID NO: 192 e/ou motivo 2 como representado por SEQID NO: 209; preferivelmente, motivo 2 tem as seqüências como representadopor SEQ ID NO: 193.

Uma porção pode ser preparada, por exemplo, fazendo uma oumais deleções a um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT. As porções podem ser usadas em forma isolada ou elaspodem ser fusionadas a outras seqüências de codificação (ou não codificantes)a fim de, por exemplo, produzir uma proteína que combina diversasatividades. Quando fusionado a outras seqüências de codificação, opolipeptídeo resultante produzido mediante tradução pode ser maior do queaquele previsto para a porção de fator de transcrição PLT. Preferivelmente, aporção codifica para um polipeptídeo com substancialmente a mesmaatividade biológica que os polipeptídeos de fator de transcrição PLT de SEQID NO: 176 e SEQ ID NO: 178.

Preferivelmente, a porção é uma porção de um ácido nucleicocomo representado por qualquer uma das seqüências listadas em Tabela I dosExemplos. Mais preferivelmente a porção é uma porção de um ácido nucleicocomo representado por SEQ ID NO: 175 e SEQ ID NO: 177.

Outra variante de um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT5 útil nos métodos da presenteinvenção, é um ácido nucleico capaz de hibridizar em condições deestringência reduzida, preferivelmente em condições estringentes, com umasonda derivada do ácido nucleico como definido acima, cuja seqüência dehibridização codifica um polipeptídeo compreendendo em ordem crescente depreferência pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou99% de identidade de seqüência com o domínio AP2 representado por SEQID NO: 191. A seqüência de hibridização pode compreender adicionalmenteou um motivo mas preferivelmente tanto motivo 1 como representado porSEQ ID NO: 192 e/ou motivo 2 como representado por SEQ ID NO: 209,preferivelmente como representado por SEQ ID NO: 193.

Preferivelmente, a seqüência de hibridização é uma que écapaz de hibridizar com um ácido nucleico como representado por (ou comsondas derivadas de) qualquer uma das seqüências listadas em Tabela I dosExemplos, ou com uma porção de qualquer das Seqüências mencionadasacima (a seqüência alvo). Mais preferivelmente a seqüência de hibridização écapaz de hibridizar com SEQ ID NO: 175 ou com SEQ ID NO: 177 (ou comsondas derivadas desta). Sondas geralmente são de menos do que 1000 bp decomprimento, preferivelmente menos do que 500 bp de comprimento.Comumente, comprimentos de sondas para hibridizações DNA-DNA talcomo Southern blotting, variam entre 100 e 500 bp, ao passo que a regiãohibridizante em sondas para hibridizações DNA-DNA tal como emamplificação por PCR geralmente são menores do que 50 mas maiores do quenucleotídeos.

O polipeptídeo de fator de transcrição PLT pode ser codificadopor uma variante de processamento. O termo "variante de processamento"como usado neste lugar abrange variantes de uma seqüência de ácidosnucleicos na qual íntrons e/ou éxons selecionados foram cortados,substituídos, deslocados ou adicionados, ou na qual íntrons foram encurtadosou alongados. Tais variantes serão umas nas quais a atividade biológicasubstancial da proteína é mantida, o que pode ser atingido retendoseletivamente segmentos funcionais da proteína. Tais variantes de uniãopodem ser encontradas na natureza ou podem ser feitas pelo homem. Métodospara fazer tais variantes de união são bem conhecidos na arte.

Variantes de união preferidas são variantes de união do ácidonucleico codificando um polipeptídeo de fator de transcrição PLTcompreendendo em ordem crescente de preferência pelo menos 70%, 75%,80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüênciacom o domínio AP2 representado por SEQ ID NO: 191. Variantes de uniãopodem compreender adicionalmente ou um motivo mas preferivelmente tantomotivo 1 como representado por SEQ ID NO: 192 e/ou motivo 2 comorepresentado por SEQ ID NO: 209, preferivelmente como representado por

SEQ ID NO: 193.

Variantes de união adicionalmente preferidas de ácidosnucleicos codificando polipeptídeos de fator de transcrição PLTcompreendendo características como definidas acima são variantes de uniãode um ácido nucleico como representado por qualquer uma das seqüênciaslistadas em Tabela I dos Exemplos. Mais preferido é uma variante deprocessamento de uma seqüência de ácidos nucleicos como representada porSEQ ID NO: 175 e SEQ ID NO: 177.O polipeptídeo de fator de transcrição PLT também pode sercodificado por uma variante alélica de um ácido nucleico codificando umpolipeptídeo compreendendo em ordem crescente de preferência pelo menos70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade deseqüência com o domínio AP2 representado por SEQ ID NO: 191. A variantealélica pode compreender adicionalmente ou um motivo mas preferivelmentetanto motivo 1 como representado por SEQ ED NO: 192 e/ou motivo 2 comorepresentado por SEQ ID NO: 209, preferivelmente como representado porSEQ ID NO: 193.

Variantes alélicas preferidas de ácidos nucleicos codificandopolipeptídeos de fator de transcrição PLT compreendendo característicascomo definidas acima são variantes de união de um ácido nucleico comorepresentado por qualquer uma das seqüências listadas em Tabela I dosExemplos. Mais preferido é uma variante alélica de uma seqüência de ácidosnucleicos como representada por SEQ ID NO: 175 e SEQ ID NO: 177.

O aumento em expressão de um ácido nucleico codificandoum polipeptídeo de fator de transcrição PLT leva a níveis aumentados depolipeptídeo ou mRNA correspondente, o que pode se igualar a atividadeaumentada do polipeptídeo de fator de transcrição PLT; ou a atividadetambém pode ser aumentada quando não há nenhuma mudança em níveis depolipeptídeo, ou mesmo quando há uma redução em níveis de polipeptídeo.Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo sãoalteradas, por exemplo, fazendo versões mutantes que são mais ativas do queo polipeptídeo tipo selvagem.

Evolução dirigida (ou embaralhamento gênico) pode ser usadapara gerar variantes de ácidos nucleicos codificando polipeptídeos de fator detranscrição PLT. Isto consiste de repetições de embaralhamento de DNAseguido por triagem e/ou seleção apropriada para gerar variantes de ácidosnucleicos ou porções destes codificando polipeptídeos de fator de transcriçãoPLT ou homólogos ou porções destes tendo uma atividade biológicamodificada (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).

Mutagênese dirigida a sítio pode ser usada para gerar variantesde ácidos nucleicos codificando polipeptídeos de fator de transcrição PLT.Estão disponíveis diversos métodos para atingir mutagênese dirigida a sítio, omais comum sendo métodos baseados em PCR (current protocols inmolecular biology. Wiley Eds.).

Evolução dirigida e mutagênese dirigida a sítio são exemplosde tecnologias que possibilitam a geração de variantes de ácidos nucleicoscodificando polipeptídeos de fator de transcrição PLT com atividademodificada úteis para realizar os métodos da invenção.

Ácidos nucleicos codificando polipeptídeos de fator detranscrição PLT podem ser derivados de qualquer fonte natural ou artificial. Oácido nucleico pode ser modificado a partir de sua forma nativa emcomposição e/ou ambiente genômico através de deliberada manipulaçãohumana. Preferivelmente o ácido nucleico de fator de transcrição PLT é deuma planta, preferivelmente de uma planta dicotiledônea, aindapreferivelmente da família Brassicaceae, mais preferivelmente do gêneroArabidopsis, mais preferivelmente o ácido nucleico é de Arabidopsisthaliana.

Os métodos da invenção se fiam em expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcrição PLTem uma planta. O ácido nucleico pode ser um ácido nucleico de comprimentocompleto ou pode ser uma porção ou uma seqüência de hibridização ou outravariante de ácido nucleico como definido acima.

Os métodos da invenção se fiam em expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcrição PLTem uma planta.A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão em uma planta das seqüências deácidos nucleicos úteis nos métodos de acordo com a invenção.

Portanto, é fornecida uma construção gênica compreendendo:(i) Um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT como definido acima;

(ii) Uma ou mais seqüências de controle, das quais pelo menosuma é um promotor constitutivo de meia força.

Construções úteis nos métodos de acordo com a presenteinvenção podem ser construídas usando tecnologia de DNA recombinantebem conhecida por pessoas versadas na arte. As construções gênicas podemser inseridas em vetores, que podem estar disponíveis comercialmente,adequados para transformação em plantas e adequados para expressão dogene de interesse nas células transformadas. A invenção portanto fornece uso de uma construção gênica como definido acima nos métodos da invenção.

Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeode fator de transcrição PLT). O artesão versado é bem ciente dos elementosgenéticos que devem estar presentes no vetor a fim de transformar comsucesso, selecionar e propagar células hospedeiras contendo a seqüência deinteresse. A seqüência de interesse é operacionalmente ligada a uma ou maisseqüências de controle (pelo menos a um promotor).

O ácido nucleico codificando um polipeptídeo de fator detranscrição PLT ou variante deste é operacionalmente ligado a um promotorconstitutivo, preferivelmente um promotor constitutivo de meia força. Umpromotor constitutivo é transcricionalmente ativo durante a maioria, mas nãonecessariamente todas, fases de seu crescimento e desenvolvimento e ésubstancialmente ubiquamente expresso em níveis moderados. Força depromotor e/ou padrão de expressão podem ser analisados como descrito naseção de definições. A força de promotor e/ou padrão de expressão podem serpor exemplo comparados com aqueles de um promotor de referência preferidopor parte aérea bem caracterizado, tal como o promotor Cab27 (expressãofraca, GenBank AP004700) ou o promotor putativo de protoclorofilidaredutase (expressão forte, GenBank AL606456). Preferivelmente o promotorusado nos métodos da presente invenção é derivado de uma planta, aindapreferivelmente uma planta monocotiledônea. Mais preferido é uso de umpromotor GOS2 (de arroz) (SEQ ID NO: 194 ou alternativamente SEQ IDNO: 210). Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico representado por SEQ ID NO: 175 ou SEQ ID NO:177, nem é a aplicabilidade da invenção restrita a expressão de um ácidonucleico codificando um polipeptídeo de fator de transcrição PLT quandodirigida por um promotor GOS2. Exemplos de outros promotoresconstitutivos que também podem ser usados para dirigir expressão de umácido nucleico codificando um polipeptídeo de fator de transcrição PLT sãomostrados na seção de definições.

Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta. Elementos reguladores adicionais podem incluiracentuadores transcricionais assim como traducionais. Aqueles versados naarte estarão cientes de seqüências terminadoras e acentuadoras que podem seradequadas para uso para realizar a invenção. Outras seqüências de controle(além de promotor, acentuador, silenciador, seqüências de íntrons, regiões3'UTR e/ou 5'UTR) podem ser proteína e/ou agentes estabilizantes de RNA.Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas poruma pessoa versada na arte.

A presente invenção também abrange plantas viáveis pelosmétodos de acordo com a presente invenção. A presente invenção portantofornece plantas, partes vegetais ou células de planta destas viáveis pelométodo de acordo com a presente invenção, cujas plantas ou partes ou célulasdestas compreendem um transgene de ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT sob o controle de um promotorconstitutivo, preferivelmente um promotor constitutivo não viral.

A invenção também fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, compreendendo introdução e expressão preferencial de um ácidonucleico codificando um polipeptídeo de fator de transcrição PLT em umaplanta.

(i) introduzir e expressar um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT em uma planta; e

O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira. Seguindo transferência de DNA eregeneração, plantas putativamente transformadas podem ser avaliadas, porexemplo usando análise Southern, para a presença do gene de interesse,número de cópias e/ou organização genômica. Alternativamente ouadicionalmente, níveis de expressão do DNA recentemente introduzidopodem ser monitorados usando análise Northern e/ou Western, ou PCRquantitativo, todas as técnicas sendo bem conhecidas por pessoas tendohabitual verso na arte.

A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um polipeptídeo de fator de transcriçãoPLT. Células hospedeiras preferidas de acordo com a invenção são células deplanta.

A invenção além disso se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.

A presente invenção também abrange uso de ácidos nucleicoscodificando polipeptídeos de fator de transcrição PLT e uso de polipeptídeosde fator de transcrição PLT para aumentar produção vegetal como definidoacima nos métodos da invenção.

A expressão aumentada de um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT pode ser realizada introduzindo umamodificação genética (preferivelmente no locus de um gene de fator detranscrição PLT). O locus de um gene como definido neste lugar é adotadopara significar uma região genômica, que inclui o gene de interesse e IOKBantes ou depois da região de codificação.

A modificação genética pode ser introduzida por métodosalternativos como aquele descrito acima, por exemplo, por qualquer um (oumais) dos seguintes: ativação de T-DNA, TILLING e recombinaçãohomóloga. Seguindo introdução da modificação genética, segue uma etapaopcional de selecionar para expressão aumentada de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT3 cuja expressãoaumentada gera plantas tendo produção aumentada.

Identificação por ativação de T-DNA resulta em plantastransgênicas que mostram fenótipos dominantes devido a expressãomodificada de genes próximos ao promotor introduzido. O promotor a serintroduzido um promotor constitutivo de meio força capaz de aumentarexpressão do ácido nucleico codificando um polipeptídeo de fator detranscrição PLT em uma planta.

Uma modificação genética também pode ser introduzida nolocus de um gene codificando um polipeptídeo de fator de transcrição PLTusando a técnica de TILLING (Lesões Locais Induzidas Dirigidas emGenomas).

Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga. O ácido nucleico a ser introduzido (quepode ser um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT ou variante deste como definido acima) é direcionado para olocus de um gene PLT. O ácido nucleico a ser direcionado pode ser um alelomelhorado usado para substituir o gene endógeno ou pode ser introduzido emadição ao gene endógeno.

Ativação de T-DNA, TILLING e recombinação homóloga sãoexemplos de tecnologias que possibilitam a geração de modificaçõesgenéticas compreendendo aumentar expressão de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT em plantas.

Ácidos nucleicos codificando polipeptídeos de fator detranscrição PLT, ou polipeptídeos de fator de transcrição PLT, podemencontrar uso em programas de melhoramento nos quais é identificado ummarcador de DNA que pode ser geneticamente ligado a um gene de fator detranscrição PLT. Os ácidos nucleicos/genes, ou os polipeptídeos de fator detranscrição PLT podem ser usados para definir um marcador molecular. Estemarcador de DNA ou proteína pode então ser usado em programas demelhoramento para selecionar plantas tendo produção aumentada comodefinido acima nos métodos da invenção.

Variantes alélicas de um ácido nucleico/gene de fator detranscrição PLT também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.

Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.

Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.

Um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT também pode ser usado como sondas para mapeargeneticamente e fisicamente os genes dos quais elas são uma parte de, e comomarcadores para características ligadas a tais genes. Tal informação pode serútil em melhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos de fator de transcrição PLT requerapenas uma seqüência de ácidos nucleicos de pelo menos 15 nucleotídeos decomprimento. Os ácidos nucleicos de fator de transcrição PLT podem serusados como marcadores de polimorfismo de comprimento de fragmento derestrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T(1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetaldigerido por restrição podem ser sondados com os ácidos nucleicos de fatorde transcrição PLT. O padrão de bandeamento resultante pode então sersujeito a análises genéticas usando programas computacionais tal comoMapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir ummapa genético. Em adição, os ácidos nucleicos podem ser usados para sondarSouthern blots contendo DNAs genômicos tratados com endonuclease derestrição de um conjunto de indivíduos representando ancestral e progênie deum cruzamento genético definido. Segregação dos polimorfismos de DNA éobservada e usada para calcular a posição do ácido nucleico de fator detranscrição PLT no mapa genético previamente obtido usando esta população(Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).

Descrição detalhada de bHLHSurpreendentemente, foi descoberto agora que modularexpressão em uma planta de um ácido nucleico codificando uma classeparticular de fator de transcrição bHLH gera plantas tendo características deprodução melhoradas em relação a plantas de controle. A classe particular defator de transcrição bHLH adequada para melhorar características deprodução em plantas é descrita em detalhe abaixo.

A presente invenção fornece um método para melhorarcaracterísticas de produção em plantas em relação a plantas de controle,compreendendo modular expressão em uma planta de um ácido nucleicocodificando uma classe particular de fator de transcrição bHLH.

Um método preferido para modular (preferivelmente,aumentar) expressão de um ácido nucleico codificando um fator detranscrição bHLH é introduzir e expressar em uma planta um ácido nucleicocodificando uma classe particular de fator de transcrição bHLH comoadicionalmente definido abaixo.

O ácido nucleico a ser introduzido em uma planta (e portantoútil para realizar os métodos da invenção) é qualquer ácido nucleicocodificando o tipo de fator de transcrição bHLH que será agora descrito. Umfator de transcrição bHLH como definido neste lugar se refere a umpolipeptídeo representado por qualquer um de SEQ ID NO 213, SEQ ID NO215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297,SEQ ID NO: 299 e SEQ ID NO: 301. A invenção é ilustrada transformandoplantas com as seqüências de Oryza sativa representadas por SEQ ID NO:212, codificando o polipeptídeo de SEQ ID NO: 213. SEQ ID NO: 215 deOryza sativa (codificado por SEQ ID NO: 214) e SEQ ID NO: 217 de Oryzasativa (codificado por SEQ ID NO: 216) são parálogos do polipeptídeo deSEQ ID NO: 213. SEQ ID NO: 219 de Arabidopsis thaliana (codificado porSEQ ID NO: 218) e SEQ ID NO: 225 de Arabidopsis thaliana (codificado porSEQ ID NO: 224) são ortólogos do polipeptídeo de SEQ ID NO: 213. SEQID NO: 221 de Arabidopsis thaliana (codificado por SEQ ID NO: 220) e SEQID NO: 223 de Arabidopsis thaliana (codificado por SEQ ID NO: 222) sãovariantes de SEQ ID NO: 218 e SEQ ID NO: 219.

Ortólogos e parálogos podem ser facilmente encontradosrealizando uma assim chamada busca blast recíproca. Tipicamente istoenvolve um primeiro BLAST envolvendo realizar BLAST com umaseqüência de consulta (por exemplo, SEQ ID NO: 212, SEQ ID NO: 213,SEQ ID NO: 214, SEQ ID NO: 215, SEQ LD NO: 216, SEQ ID NO: 217,SEQ ID NO: 218, SEQ ID NO: 219, SEQ ID NO: 224 ou SEQ ID NO: 225)contra qualquer banco de dados de seqüências, tal como o banco de dadospublicamente disponível de NCBI. BLASTN ou TBLASTX (usando valorespré-determinados padrão) geralmente são usados ao iniciar de uma seqüênciade nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinadospadrão) ao iniciar de uma seqüência de proteínas. Os resultados de BLASTpodem ser opcionalmente filtrados. As seqüências de comprimento completoou dos resultados filtrados ou dos resultados não filtrados são então BLASTedde volta (segundo BLAST) contra seqüências do organismo do qual aseqüência de consulta é derivada (onde a seqüência de consulta é SEQ IDNO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ IDNO: 216 ou SEQ ID NO: 217, o segundo BLAST deve portanto ser contraseqüências de Oryza; onde a seqüência de consulta é SEQ ID NO: 218, SEQID NO: 219, SEQ ID NO: 224 ou SEQ ID NO: 225, o segundo BLAST deveportanto ser contra seqüências de Arabidopsis). Os resultados do primeiro esegundo BLAST são então comparados. Um parálogo é identificado se umacerto de alto pontuação do primeiro BLAST é da mesma espécie da qual aseqüência de consulta é derivada, um BLAST de retorno então idealmenteresulta na seqüência de consulta como maior acerto; um ortólogo éidentificado se um acerto de alto pontuação no primeiro BLAST não é damesma espécie que da qual a seqüência de consulta é derivada, epreferivelmente resulta mediante BLAST de retorno na seqüência de consultaestando entre os maiores acertos.

Acertos de alto pontuação são aqueles tendo um baixo valor E.Quanto menor o valor E, mais significante é o pontuação (ou em outraspalavras menor a chance de que o acerto tenha sido encontrado ao acaso).Computação do valor E é bem conhecida na arte. Em adição a E-values,comparações também são pontuadas por identidade percentual. Identidadepercentual se refere ao número de nucleotídeos (ou aminoácidos) idênticosentre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadasao longo de um comprimento particular. Preferivelmente o pontuação é maiordo que 50, mais preferivelmente maior do que 100; e preferivelmente o valor

E é menor do que e-5, mais preferivelmente menos do que e-6. Um exemplodetalhando a identificação de ortólogos e parálogos é dado em Exemplo 31 eExemplo 30 respectivamente neste lugar. No caso de famílias grandes,ClustalW pode ser usado, seguido por uma árvore de agrupamento devizinhos, para ajudar a visualizar agrupamento de genes relacionados e paraidentificar ortólogos e parálogos.

Exemplos de ortólogos obtidos pelo procedimento de BLASTmencionado acima são SEQ ID NO: 227 de Medicago truncatula (codificadopor SEQ ID NO: 226) e SEQ ID NO: 229 de Hordeum vulgare (codificadopor SEQ ID NO: 228). Ortólogos e parálogos adicionais podem serprontamente identificados usando o procedimento de BLAST descrito acima eseguindo o procedimento dado na seção de exemplos.

As proteínas representadas por SEQ ID NO: 297, 299 e 301eram até agora desconhecidas. Portanto, a invenção também fornece fatoresde transcrição bHLH até agora desconhecidos e ácidos nucleicos codificandofator de transcrição bHLH.

De acordo com uma forma de realização adicional da presenteinvenção, portanto é fornecida uma molécula isolada de ácido nucleicocompreendendo:

(i) um ácido nucleico representado por qualquer um de SEQID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;

(ii) o complemento de um ácido nucleico representado porqualquer um de SEQ ID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;

(iii)um ácido nucleico codificando um fator de transcriçãobHLH tendo (a) em ordem crescente de preferência, pelo menos 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou maisidentidade de seqüência com a seqüência de aminoácidos representada porqualquer uma de SEQ ID NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301, e(b) um domínio bHLH.

De acordo com uma forma de realização adicional da presenteinvenção, também é fornecido um polipeptídeo isolado compreendendo:

(i) uma seqüência de aminoácidos representada por qualqueruma de SEQ ID NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301;

(ii) uma seqüência de aminoácidos tendo (a) em ordemcrescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%,85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais identidade de seqüência comqualquer uma das seqüências de aminoácidos representadas por SEQ ID NO:297, SEQ ID NO: 299 e SEQ ID NO: 301, e (b) um domínio bHLH.;

(iii) derivados de qualquer das seqüências de aminoácidosdadas em (i) ou (ii) acima.

Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO221, SEQ ID NO 223, SEQ ID NO 225, SEQ ID NO: 227, SEQ ID NO: 229,SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, todoscompreendem um domínio bHLH.

Domínios bHLH são bem conhecidos na arte e podem serprontamente identificados por pessoas versadas na arte. A família é definidapor um domínio de assinatura bHLH, que consiste de 60 ou mais aminoácidoscom duas regiões funcionalmente distintas. Uma região básica, localizada naextremidade N-terminal do domínio, está envolvida em ligação de DNA econsiste de 15 ou mais aminoácidos com um número alto de resíduos básicos.Uma região HLH, na extremidade C-terminal, funciona como um domínio dedimerização e compreende principalmente resíduos hidrofóbicos que formamduas hélices alifáticas separadas por uma região de alça de seqüência ecomprimento variáveis.

Um domínio bHLH pode ser identificado usando métodos parao alinhamento de seqüências para comparação. Em algumas instâncias,parâmetros padrão podem ser ajustados para modificar a estringência dabusca. Por exemplo usando BLAST, o limiar de significância estatística(chamado valor E) para relatar pareamentos contra seqüências de banco dedados pode ser aumentado para mostrar pareamentos menos estringentes.Desta maneira, pareamentos curtos praticamente exatos podem seridentificados.

Métodos para o alinhamento de seqüências para comparaçãosão bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST,FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) JMol Biol 48: 443-453) para encontrar o alinhamento global (ao longo de todaa seqüência) de duas seqüências que maximiza o número de pareamentos eminimiza o número de lacunas. O algoritmo BLAST (Altschul et ai. (1990) JMol Biol 215: 403-10) calcula identidade de seqüência percentual e realizauma análise estatística da similaridade entre as duas seqüências. O aplicativocomputacional para realizar análise BLAST está publicamente disponívelatravés do National Centre for Biotechnology Information (NCBI).Homólogos podem ser prontamente identificados usando, por exemplo, oalgoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83),com os parâmetros padrão de alinhamento pareado, e um método depontuação em porcentagem. Edição manual secundária pode ser realizadapara otimizar alinhamento entre motivos conservados, como seria evidentepara uma pessoa versada na arte.

Também existem bancos de dados especialistas para aidentificação de domínios. O domínio bHLH em um fator de transcriçãobHLH pode ser identificado usando, por exemplo, SMART (Schultz et al.(1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002)Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids.Res. 31,315-318), Prosite (Bucher and Bairoch (1994), A generalized profilesyntax for biomolecular sequences motifs and its funetion in automaticsequence interpretation. (In) ISMB-94; Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology. Altman R., BrutlagD., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park;Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)) ou Pfam (Bateman etal., Nucleic Acids Research 30(1): 276-280 (2002)). A estrutura de domínioHLH no banco de dados InterPro é designada IPROO1092 e IPROl 1598;PFOOO10 no banco de dados Pfam; SM00353 no banco de dados SMART ePS50888 no banco de dados PROSITE. Além disso, o alinhamento mostradoem Figura 18 destaca o domínio bHLH de fator de transcrição bHLHs útil nosmétodos da invenção.

Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, tipicamenteexibem considerável divergência de seqüências fora do domínio bHLHconservado.

Figura 19a é uma matriz mostrando as similaridades eidentidades gerais (em negrito) das proteínas tipo bHLH descritas acima.Mesmo embora as identidades pareçam ser relativamente baixas,polipeptídeos tendo identidade de seqüência caindo dentro das variaçõesmostradas na matriz podem ser adotados como sendo ortólogos ou parálogosde qualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219 ou SEQ LD NO 225; isto pode ser confirmado pelo procedimento deblast recíproco descrito acima. Tipicamente, ácidos nucleicos codificandofatores de transcrição bHLH úteis nos métodos da invenção têm, em ordemcrescente de preferência, pelo menos 13%, 15%, 20%, 25%, 30%, 35%, 40%,45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou maisidentidade de seqüência com os fatores de transcrição bHLH representadospor qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217,SEQ ID NO: 219 ou SEQ ID NO 225.

A matriz mostrada em Figura 19b mostra similaridades eidentidades (em negrito) ao longo do domínio bHLH, onde certamente osvalores são maiores do que quando considerando proteínas de comprimentocompleto. Tipicamente, ácidos nucleicos codificando fatores de transcriçãobHLH úteis nos métodos da invenção têm domínios bHLH tendo, em ordemcrescente de preferência, pelo menos 25%, 30%, 35%, 40%, 45%, 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou mais identidade de seqüênciacom o domínio bHLH de qualquer um dos polipeptídeos representados porqualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219 ou SEQ ID NO 225.

Um padrão de aminoácidos, denominado uma configuração 5-9-13, pode ser encontrado em três posições dentro da região básica dodomínio bHLH (veja Fig. 4 de Heim et al., 2003 (Mol. Biol. Evol. 20(5):735-747) e Figura 18 neste lugar onde três setas apontando para cima mostram aconfiguração). Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ouparálogos de qualquer das SEQ ED NOs mencionadas acima, compreendempreferivelmente uma configuração K/R ER5 mais preferivelmente umaconfiguração RER5 dentro do domínio bHLH, tipicamente dentro da regiãobásica do domínio. A presença desta configuração não é um pré-requisito pararealizar os métodos da invenção, portanto alguma variação na configuraçãoK/R ER é aceitável. Polipeptídeos bHLH de Arabidopsis foram agrupados emdoze subfamílias de acordo com similaridades estruturais (veja Fig. 4 de Heimet al., 2003). Membros de grupo IX constituem polipeptídeos bHLH tendouma configuração RER. Além disso, um membro de Grupo VI compreendeuma configuração RER.

Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, também podemcompreender (em adição a um domínio bHLH e opcionalmente um motivoK/R ER 5-9-13, preferivelmente um motivo RER) um domínio designadoPFB26111 (veja banco de dados Pfam). O domínio também é indicado emFigura 18.

Tipicamente, ácidos nucleicos codificando fatores detranscrição bHLH (como definido acima) tendo um domínio bHLH e tendo,em ordem crescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%,75%, 80%, 85%, 90%, 95% ou mais identidade de seqüência com o domínioPFB26111 (veja Figura 18) de qualquer um dos polipeptídeos representadospor qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217,SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, ouSEQ ID NO: 301 são úteis nos métodos da invenção.

Ácidos nucleicos codificando os polipeptídeos representadospor qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217,SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQID NO: 301, ou ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima, não precisam ser ácidos nucleicos de comprimentocompleto, uma vez que desempenho dos métodos da invenção não se fia nouso de seqüências de ácidos nucleicos de comprimento completo. Exemplosde ácidos nucleicos adequados para uso para realizar os métodos da invençãoincluem mas não são limitados àqueles representados por qualquer um de:SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218,SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226,SEQ ID NO: 228, SEQ ID NO: 296, SEQ ID NO: 298, e SEQ ID NO: 300.Variantes de ácidos nucleicos também podem ser úteis para praticar osmétodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluemporções de ácidos nucleicos codificando um fator de transcrição bHLH comodefinido neste lugar, variantes de união de ácidos nucleicos codificando umfator de transcrição bHLH como definido neste lugar, variantes alélicas deácidos nucleicos codificando um fator de transcrição bHLH como definidoneste lugar e variantes de ácidos nucleicos codificando um fator detranscrição bHLH como definido neste lugar que são obtidas porembaralhamento gênico. Os termos porção, variante de processamento,variante alélica e embaralhamento gênico serão agora descritos.

Uma porção de um ácido nucleico codificando um fator detranscrição bHLH como definido neste lugar pode ser preparada, porexemplo, fazendo uma ou mais deleções ao ácido nucleico. As porções podemser usadas em forma isolada ou elas podem ser fusionadas a outras seqüênciasde codificação (ou não codificantes) a fim de, por exemplo, produzir umaproteína que combina diversas atividades. Quando fusionado a outrasseqüências de codificação, o polipeptídeo resultante produzido mediantetradução pode ser maior do que aquele previsto para a porção de fator detranscrição bHLH.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma porção de um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer de SEQID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ IDNO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, ou umaporção de um ácido nucleico codificando ortólogos, parálogos ou homólogosde qualquer das SEQ ID NOs mencionadas acima.

Porções úteis nos métodos da invenção, codificam umpolipeptídeo tendo um domínio bHLH (como descrito acima) e tendosubstancialmente a mesma atividade biológica que o fator de transcriçãobHLH representado por qualquer de SEQ ID NO 213, SEQ ID NO 215, SEQID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ IDNO: 299, SEQ ID NO: 301, ou ortólogos ou parálogos de qualquer das SEQID NOs mencionadas acima. A porção é tipicamente de pelo menos 150nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 300nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos400 nucleotídeos consecutivos de comprimento e mais preferivelmente pelomenos 500 nucleotídeos consecutivos de comprimento. Preferivelmente, aporção é uma porção de um ácido nucleico como representado por qualquerum de SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO:218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO:226, SEQ ID NO: 228, SEQ ID NO: 296, SEQ ID NO: 298, e SEQ ID NO:300. Mais preferivelmente a porção é uma porção de um ácido nucleico comorepresentado por SEQ ID NO: 212.

Outra variante de ácido nucleico útil nos métodos da invenção,é um ácido nucleico capaz de hibridizar em condições de estringênciareduzida, preferivelmente em condições estringentes, com um ácido nucleicocodificando um fator de transcrição bHLH como definido neste lugar, ou comuma porção como definido neste lugar.Seqüências de hibridização úteis nos métodos da invenção,codificam um polipeptídeo tendo um domínio bHLH (como descrito acima) etendo substancialmente a mesma atividade biológica que o fator detranscrição bHLH representado por qualquer de SEQ ID NO 213, SEQ ED NO215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ED NO 225, SEQ ID NO: 297,SEQ ID NO: 299, SEQ ID NO: 301 ou tendo substancialmente a mesmaatividade biológica que ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima. A seqüência de hibridização é tipicamente de pelo menos150 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos300 nucleotídeos consecutivos de comprimento, mais preferivelmente pelomenos 400 nucleotídeos consecutivos de comprimento e mais preferivelmentepelo menos 500 nucleotídeos consecutivos de comprimento. Preferivelmente,a seqüência de hibridização é uma que é capaz de hibridizar com qualquer dosácidos nucleicos representados por SEQ ID NO: 212, SEQ ID NO: 214, SEQID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ IDNO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 296, SEQ IDNO: 298, e SEQ ID NO: 300 ou com uma porção de qualquer das Seqüênciasmencionadas acima, uma porção sendo como definido acima. Maispreferivelmente a seqüência de hibridização é capaz de hibridizar com umácido nucleico como representado por SEQ ID NO: 212, ou com porçõesdeste.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta um ácido nucleico capaz de hibridizarcom um ácido nucleico codificando um fator de transcrição bHLHrepresentado por qualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO:217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299,SEQ ID NO: 301, ou compreendendo introduzir e expressar em uma plantaum ácido nucleico capaz de hibridizar com um ácido nucleico codificando umortólogo, parálogo ou homólogo de qualquer das SEQ ID NOs mencionadasacima.

Outra variante de ácido nucleico útil nos métodos da invençãoé uma variante de processamento codificando um fator de transcrição bHLHcomo definido acima.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de processamento de umácido nucleico codificando um fator de transcrição bHLH representado porqualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, and SEQ IDNO: 301, ou uma variante de processamento de um ácido nucleicocodificando um ortólogo, parálogo ou homólogo de qualquer das SEQ IDNOs mencionadas acima.

Variantes de união preferidas são variantes de união de umácido nucleico codificando fator de transcrição bHLH representado porqualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, e SEQ IDNO: 301, ou variantes de união codificando ortólogos ou parálogos dequalquer das SEQ ID NOs mencionadas acima. Ademais preferidas sãovariantes de união de ácidos nucleicos representados por qualquer um de SEQID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ IDNO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ IDNO: 228, SEQ ID NO: 296, SEQ ID NO: 298, e SEQ ID NO: 300. Maispreferido é uma variante de processamento de um ácido nucleico comorepresentado por SEQ ID NO: 212.

Outra variante de ácido nucleico útil para realizar os métodosda invenção é uma variante alélica de um ácido nucleico codificando um fatorde transcrição bHLH como definido acima.De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante alélica de um ácidonucleico codificando um fator de transcrição bHLH representado por qualquerde SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, e SEQ ID NO: 301, oucompreendendo introduzir e expressar em uma planta uma variante alélica deum ácido nucleico codificando um ortólogo, parálogo ou homólogo dequalquer das SEQ ID NOs mencionadas acima.

A variante alélica pode ser uma variante alélica de um ácidonucleico codificando um fator de transcrição bHLH representado por qualquerde SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, e SEQ ID NO: 301, ouuma variante alélica de um ácido nucleico codificando ortólogos ou parálogosde qualquer das SEQ ID NOs mencionadas acima. Ademais preferidas sãovariantes alélicas de ácidos nucleicos representados por qualquer um de SEQID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ IDNO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226 e SEQ IDNO: 228, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300. Maispreferido é uma variante alélica de um ácido nucleico como representado porSEQ ID NO: 212.

Uma variante de ácido nucleico adicional útil nos métodos dainvenção é uma variante de ácido nucleico obtida por embaralhamentogênico. Embaralhamento gênico ou evolução dirigida também pode ser usadapara gerar variantes de ácidos nucleicos codificando fatores de transcriçãobHLH como definido acima.

De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer de SEQID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ IDNO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ e ID NO: 301, oucompreendendo introduzir e expressar em uma variante de um ácido nucleicocodificando um ortólogo, parálogo ou homólogo de qualquer das SEQ IDNOs mencionadas acima, cujo ácido nucleico é obtido por embaralhamentogênico.

Também úteis nos métodos da invenção são ácidos nucleicoscodificando homólogos de qualquer um dos aminoácidos representados porSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima.

Também úteis nos métodos da invenção são ácidos nucleicoscodificando derivados de qualquer um dos aminoácidos representados porSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima.Derivados de SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ IDNO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227 e SEQ IDNO: 229, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 sãoexemplos adicionais que podem ser adequados para uso nos métodos dainvenção

Além disso, fatores de transcrição bHLH (pelo menos em suaforma nativa) tipicamente têm atividade de ligação de DNA e um domínio deativação. Uma pessoa versada na arte pode facilmente determinar a presençade um domínio de ativação e atividade de ligação de DNA usandoferramentas e técnicas de rotina.

Ácidos nucleicos codificando fatores de transcrição bHLHpodem ser derivados de qualquer fonte natural ou artificial. O ácido nucleicopode ser modificado a partir de sua forma nativa em composição e/ouambiente genômico através de deliberada manipulação humana.

Preferivelmente o ácido nucleico codificando fator de transcrição bHLH é deuma planta, ainda preferivelmente de uma monocotiledônea, maispreferivelmente da família Poaceae, mais preferivelmente o ácido nucleico éde Oryza sativa.

Qualquer referência neste lugar a um fator de transcriçãobHLH é portanto adotada para significar um fator de transcrição bHLH comodefinido acima. Qualquer ácido nucleico codificando um tal fator detranscrição bHLH é adequado para uso para realizar os métodos da invenção.

A presente invenção também abrange plantas ou partes destas(incluindo células de planta) viáveis pelos métodos de acordo com a presenteinvenção. As plantas ou partes destas compreendem um transgene de ácidonucleico codificando um fator de transcrição bHLH como definido acima.

A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de ácidos nucleicosúteis nos métodos de acordo com a invenção, em uma planta.

Portanto, é fornecida uma construção gênica compreendendo:

(i) Qualquer ácido nucleico codificando um fator detrasncrição tipo bHLH como definido acima;

(ii) Uma ou mais seqüências de controle operacionalmenteligadas ao ácido nucleico de (i).

Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um fator detranscrição tipo bHLH). O artesão versado é bem ciente dos elementosgenéticos que devem estar presentes no vetor a fim de transformar comsucesso, selecionar e propagar células hospedeiras contendo a seqüência deinteresse. A seqüência de interesse é operacionalmente ligada a uma ou maisseqüências de controle (pelo menos a um promotor).

Vantajosamente, qualquer tipo de promotor, quer natural ousintético, pode ser usado para dirigir expressão da seqüência de ácidosnucleicos. O promotor pode ser um promotor induzível, i.e. tendo início detranscrição induzido ou aumentado em resposta a um estímulo evolutivo,químico, ambiental ou físico. O promotor pode ser um promotor tecidoespecífico, i.e. um que é capaz de preferencialmente iniciar transcrição emcertos tecidos, tal como as folhas, raízes, tecido de semente etc.

De acordo com uma característica preferida da invenção, oácido nucleico codificando um fator de transcrição tipo bHLH éoperacionalmente ligado a um promotor constitutivo. Um promotorconstitutivo é transcricionalmente ativo durante a maioria mas nãonecessariamente todas fases de seu crescimento e desenvolvimento e ésubstancialmente ubiquamente expresso. O promotor constitutivo épreferivelmente um promotor GOS2, mais preferivelmente o promotorconstitutivo é um promotor GOS2 de arroz, ainda preferivelmente o promotorconstitutivo é representado pela seqüência de ácidos nucleicossubstancialmente similar a SEQ ID NO: 230 ou SEQ ID NO: 233, maispreferivelmente o promotor constitutivo é como representado por SEQ IDNO: 233.

Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico codificando fator de transcrição bHLH representadopor SEQ ID NO: 212, nem é a aplicabilidade da invenção restrita a expressãode um tal ácido nucleico codificando fator de transcrição bHLH quandodirigida por um promotor GOS2. Exemplos de outros promotoresconstitutivos que também podem ser usados para realizar os métodos dainvenção são mostrados na seção de definições.

As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl. Outras seqüências de controle (além depromotor, acentuador, silenciador, seqüências de íntrons, regiões 3'UTR e/ou5'UTR) podem ser proteína e/ou agentes estabilizantes de RNA. A construçãogenética pode opcionalmente compreender um gene marcador selecionável.

A invenção também fornece um método para a produção deplantas transgênicas tendo características de produção melhoradas em relaçãoa plantas de controle, compreendendo introdução e expressão em uma plantade qualquer ácido nucleico codificando um polipeptídeo de fator detranscrição tipo bHLH como definido acima.

Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo características de produçãomelhoradas, cujo método compreende:

(i) introduzir e expressar um ácido nucleico codificando umfator de transcrição tipo bHLH (como definido neste lugar) em uma célulavegetal; e

A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um fator de transcrição bHLH comodefinido acima. Células hospedeiras preferidas de acordo com a invenção sãocélulas de planta.

A invenção também se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.De acordo com uma característica preferida da invenção, aexpressão modulada é expressão aumentada.

Como mencionado acima, um método preferido para modular(preferivelmente, aumentar) expressão de um ácido nucleico codificando umfator de transcrição bHLH é introduzir e expressar em uma planta um ácidonucleico codificando um fator de transcrição bHLH; entretanto os efeitos derealizar o método, i.e. características de produção melhoradas também podemser atingidas usando outras técnicas bem conhecidas. Uma descrição dealgumas destas técnicas irá agora se seguir.

Uma tal técnica é identificação por ativação de T-DNA. Asplantas transgênicas resultantes mostram fenótipos dominantes devido aexpressão modificada de genes próximos ao promotor introduzido. Os efeitosda invenção também podem ser reproduzidos usando a técnica de TILLING(Lesões Locais Induzidas Dirigidas em Genomas). Os efeitos da invençãotambém podem ser reproduzidos usando recombinação homóloga.

Referência neste lugar ao termo características de produçãomelhoradas é adotada para significar um aumento em biomassa (peso) de umaou mais partes de uma planta, o que pode incluir partes (aptas para corte)acima do solo e/ou partes (aptas para corte) abaixo do solo.

Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento em o númerode plantas estabelecidas por hectare ou acre, um aumento no número deespigas por planta, um aumento no número de fileiras, número de sementespor fileira, peso de semente, peso de mil sementes, comprimento/diâmetro deespiga, aumento na taxa de enchimento de grãos (que é o número de grãoscheios dividido pelo número total de grãos e multiplicado por 100), entreoutros. Adotando arroz como um exemplo, um aumento de produção pode sermanifestado como um aumento em um ou mais dos seguintes: número deplantas por hectare ou acre, número de panículas por planta, número deespiguilhas por panícula, número de flores (floretes) por panícula (que éexpresso como uma proporção do número de grãos cheios pelo número depanículas primárias), aumento na taxa de enchimento de grãos (que é onúmero de grãos cheios dividido pelo número total de grãos e multiplicadopor 100), aumento em peso de mil sementes, entre outros.

Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Uma planta tendo uma taxa de crescimento aumentada podeainda exibir florescimento precoce. O aumento em taxa de crescimento podeocorrer em um ou mais estágios no ciclo de vida de uma planta ou durantesubstancialmente o ciclo de vida inteiro de planta. Taxa de crescimentoaumentada durante os estágios iniciais no ciclo de vida de uma planta podepermitir vigor melhorado (vigor aumentado de plântula em emergência). Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível. Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contrapartestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.

Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et ai. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.

Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um fator detranscrição bHLH.

De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle, particularmentedurante os estágios iniciais de desenvolvimento vegetal (tipicamente trêssemanas após germinação no caso de arroz e milho, mas isto irá variar deespécie para espécie) levando a vigor precoce. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar a taxa decrescimento de plantas, cujo método compreende modular, preferivelmenteaumentar, expressão em uma planta de um ácido nucleico codificando umfator de transcrição bHLH. A presente invenção portanto também fornece ummétodo para obter plantas tendo vigor precoce em relação a plantas decontrole, cujo método compreende modular, preferivelmente aumentar,expressão em uma planta de um ácido nucleico codificando um fator detranscrição bHLH.

Vigor precoce também pode resultar de ou ser manifestadocomo aptidão vegetal aumentada em relação a plantas de controle, porexemplo, devido às plantas serem mais bem adaptadas a seu ambiente (i.e.sendo mais capazes de lidar com vários fatores de estresse abiótico oubiótico). Plantas tendo vigor precoce também mostram melhorestabelecimento da cultura (com a cultura crescendo de maneira uniforme, i.e.com a maioria das plantas atingindo os vários estágios de desenvolvimentosubstancialmente ao mesmo tempo), e mostram melhor crescimento efreqüentemente melhor produção. Vigor precoce pode ser determinadomedindo vários fatores, tal como taxa de crescimento de plântula, peso de milsementes, porcentagem de germinação, porcentagem de emergência, altura deplântula, comprimento de raiz e biomassa de parte aérea e muito mais.

Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.

Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia. Plantas nas quais vigor precoce é uma característica particularmente desejável incluem arroz, milho, trigo,girassol, sorgo.

A presente invenção também abrange uso de ácidos nucleicoscodificando fatores de transcrição bHLH e uso de polipeptídeos de fator detranscrição bHLH para melhorar características de produção.

Ácidos nucleicos codificando polipeptídeos de fator detranscrição bHLH, ou os próprios fatores de transcrição bHLH, podemencontrar uso em programas de melhoramento nos quais é identificado ummarcador de DNA que pode ser geneticamente ligado a um gene codificandofator de transcrição bHLH. Os ácidos nucleicos/genes, ou os próprios fatoresde transcrição bHLH podem ser usados para definir um marcador molecular.Este marcador de DNA ou proteína pode então ser usado em programas demelhoramento para selecionar plantas tendo produção aumentada comodefinido acima nos métodos da invenção.

Variantes alélicas de um ácido nucleico/gene codificando fatorde transcrição bHLH também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.

Um ácido nucleico codificando um fator de transcrição bHLHtambém pode ser usado como sondas para mapear geneticamente efisicamente os genes dos quais elas são uma parte de, e como marcadores paracaracterísticas ligadas a tais genes. Tal informação pode ser útil emmelhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos codificando fator de transcrição bHLHrequer apenas uma seqüência de ácidos nucleicos de pelo menos 15nucleotídeos de comprimento. Os ácidos nucleicos codificando fator detranscrição bHLH podem ser usados como marcadores de polimorfismo decomprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J,Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)de DNA genômico vegetal digerido por restrição podem ser sondados com osácidos nucleicos codificando fator de transcrição bHLH. O padrão debandeamento resultante pode então ser sujeito a análises genéticas usandoprogramas computacionais tal como MapMaker (Lander et ai. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, osácidos nucleicos podem ser usados para sondar Southern blots contendoDNAs genômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando fator de transcrição bHLHno mapa genético previamente obtido usando esta população (Botstein et al.(1980) Am. J. Hum. Genet. 32:314-331).

Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et ai. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.

Os métodos de acordo com a presente invenção resultam emplantas tendo características melhoradas de produção, como descrito acima.Estas características também podem ser combinadas com outrascaracterísticas economicamente vantajosas, tal como característicasacentuadoras de produção adicionais, tolerância a outros estresses abióticos ebióticos, características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.

Descrição detalhada de SPL15

Surpreendentemente, foi descoberto agora que aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeode fator de transcrição SPL15 gera plantas tendo características de produçãomelhoradas, particularmente produção aumentada, em relação a plantas decontrole. Portanto, a invenção fornece um método para estimularcaracterísticas de produção em particular para aumentar produção em plantasem relação a plantas de controle, compreendendo aumentar expressão em umaplanta de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPLl5.

Um método preferido para aumentar expressão de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15 éintroduzir e expressar em uma planta um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15.

O termo "polipeptídeo fator de transcrição SPLl 5" comodefinido neste lugar se refere a um polipeptídeo compreendendo de N-terminal a C-terminal: (i) Motivo 1 como representado por SEQ ID NO: 276;e (ii) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%,85%, 90%, 95% ou 98% identidade de seqüência com o SPL DBDrepresentado por SEQ ID NO: 277; e (iii) Motivo 2 como representado porSEQ ID NO: 278.

Os aminoácidos mais conservados dentro de Motivo 1 sãoXLXFGXXXYFX, e dentro de Motivo 2 DSXXALSLLSX (onde X é umsubconjunto especificado de aminoácidos diferindo para cada posição, comoapresentado em SEQ ID NO: 276 e SEQ ID NO: 277). Dentro de Motivo 1 eMotivo 2, são permitidas uma ou mais mudança conservativa em qualquerposição, e/ou uma, duas ou três mudança(s) não conservativa(s) em qualquerposição.

Adicionalmente, o polipeptídeo de fator de transcrição SPL15pode compreender qualquer um ou ambos os seguintes: (a) um trecho rico emG/S precedendo o SPL DBD; e (b) o tripeptídeo W(S/T)L na extremidade C-terminal do polipeptídeo.

Um exemplo de um polipeptídeo de fator de transcrição SPL15como definido acima compreendendo de N-terminal a C-terminal: (i) Motivo1 como representado por SEQ ID NO: 276; e (ii) em ordem crescente depreferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% deidentidade de seqüência com o SPL DBD representado por SEQ ID NO: 277;e (iii) Motivo 2 como representado por SEQ ID NO: 278; e adicionalmentecompreendendo: (a) um trecho rico em G/S precedendo o SPL DBD; e (b) otripeptídeo W(S/T)L na extremidade C- do polipeptídeo, é representado comoem SEQ ID NO: 235. Tais exemplos adicionais são representados porqualquer um de SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ IDNO: 251, SEQ ED NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ IDNO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 283, SEQ IDNO: 285, SEQ ID NO: 287 ou ortólogos ou parálogos de qualquer das SEQED NOs mencionadas acima. A invenção é ilustrada transformando plantascom a seqüência de Arabidopsis thaliana representada por SEQ ID NO: 234,codificando o polipeptídeo de SEQ ID NO: 235. SEQ ID NO: 237 deArabidopsis thaliana (codificado por SEQ ED NO: 236) é um parálogo dopolipeptídeo de SEQ ID NO: 235. SEQ ID NO: 239 (codificado por SEQ IDNO: 238, de Aquilegia formosa χ Aquilegia pubescens), SEQ ID NO: 241(codificado por SEQ ID NO: 240, de Gossypium hirsutum), SEQ ID NO: 243(codificado por SEQ ID NO: 242, de Ipomoea nil), SEQ ID NO: 245(codificado por SEQ ID NO: 244, de Lactuca sativa), SEQ ID NO: 247(codificado por SEQ ID NO: 246, de Malus domestica), SEQ ID NO: 249(codificado por SEQ ID NO: 248, de Medieago truneatulà), SEQ ID NO: 251(codificado por SEQ ID NO: 250, de Nicotiana bentamiana), SEQ ID NO:253 (codificado por SEQ ID NO: 252, de Oryza sativa), SEQ ID NO: 255(codificado por SEQ ID NO: 254, de Oryza sativa), SEQ ID NO: 257(codificado por SEQ ID NO: 256, de Solanum tuberosum SEQ ID NO: 259(codificado por SEQ ID NO: 258, de Vitis vinifera), SEQ ID NO: 261(codificado por SEQ ID NO: 260, de Zea mays), SEQ ID NO: 263 (codificadopor SEQ ID NO: 262, Zea mays), SEQ ID NO: 283 (codificado por SEQ IDNO: 282, Brassiea rapa), SEQ ID NO: 285 (codificado por SEQ ID NO: 284,Glyeine max), e SEQ ID NO: 287 (codificado por SEQ ID NO: 286, Populustremuloides) são ortólogos do polipeptídeo de SEQ ID NO: 235.Ortólogos e parálogos podem ser facilmente encontradosrealizando uma assim chamada busca blast recíproca. Isto pode ser feito porum primeiro BLAST envolvendo realizar BLAST com uma seqüência deconsulta (por exemplo, SEQ ID NO: 234 ou SEQ ID NO: 235) contraqualquer banco de dados de seqüências, tal como o banco de dadospublicamente disponível de NCBI. BLASTN ou TBLASTX (usando valorespré-determinados padrão) podem ser usados ao iniciar de uma seqüência denucleotídeos e BLASTP ou TBLASTN (usando valores pré-determinadospadrão) podem ser usados ao iniciar de uma seqüência de polipeptídeos. Osresultados de BLAST podem ser opcionalmente filtrados. As seqüências decomprimento completo ou dos resultados filtrados ou dos resultados nãofiltrados são então BLASTed de volta (segundo BLAST) contra seqüências doorganismo do qual a seqüência de consulta é derivada (onde a seqüência deconsulta é SEQ ID NO: 234 ou SEQ ID NO: 235, o segundo BLAST deveportanto ser contra seqüências de Arabidopsis). Os resultados do primeiro esegundo BLAST são então comparados. Um parálogo é identificado se umacerto de alto pontuação do primeiro BLAST é da mesma espécie da qual aseqüência de consulta é derivada, um BLAST de retorno então idealmenteresulta na seqüência de consulta como maior acerto (além da própria); umortólogo é identificado se um acerto de alto pontuação no primeiro BLASTnão é da mesma espécie que da qual a seqüência de consulta é derivada epreferivelmente resulta mediante BLAST de retorno na seqüência de consultaentre os maiores acertos. Acertos de alto pontuação são aqueles tendo umbaixo valor E. Quanto menor o valor E, mais significante é o pontuação (ouem outras palavras menor a chance de que o acerto tenha sido encontrado aoacaso). Computação do valor E é bem conhecida na arte. Em adição a valoresE, comparações também são pontuadas por identidade percentual. Identidadepercentual se refere ao número de nucleotídeos (ou aminoácidos) idênticosentre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadasao longo de um comprimento particular. Um exemplo detalhando aidentificação de ortólogos e parálogos é dado em Exemplo 41. No caso defamílias grandes, ClustalW pode ser usado, seguido por uma árvore deagrupamento de vizinhos, para ajudar a visualizar agrupamento de genesrelacionados e para identificar ortólogos e parálogos. Em Figura 22, parálogose ortólogos do polipeptídeo de fator de transcrição SPL15 se agrupam juntos.

Os polipeptídeos representados por qualquer um de SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ IDNO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ IDNO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ IDNO: 261, SEQ ID NO: 263, SEQ ID NO: 283, SEQ ID NO: 285, SEQ IDNO: 287, ou ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima, todos compreendem um SPL DBD tendo, em ordemcrescente de preferência, pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95%ou 98% de identidade de seqüência com o SPL15 DBD representado por SEQID NO: 277.

DBDs de SPL são bem conhecidos na arte e podem serprontamente identificados por pessoas versadas na arte. Um SPL DBD podeser identificado usando métodos para o alinhamento de seqüências paracomparação. Métodos para o alinhamento de seqüências para comparaçãoincluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmode Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar oalinhamento de duas seqüências completas que maximiza o número depareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschulet ai. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüênciapercentual e realiza uma análise estatística da similaridade entre as duasseqüências. O aplicativo computacional para realizar análise BLAST estápublicamente disponível através do National Centre for BiotechnologyInformation. Homólogos podem ser prontamente identificados usando, porexemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW(versão 1.83) disponível em GenomeNet service no Kyoto UniversityBioinformatics Center, com os parâmetros padrão de alinhamento pareado, eum método de pontuação em porcentagem. Edição manual secundária podeser realizada para otimizar alinhamento entre motivos conservados, comoseria evidente para uma pessoa versada na arte. O alinhamento mostrado emFiguras 23 e 24 destaca o SPL DBD em polipeptídeos de fator de transcriçãoSPLl5. Preferivelmente, polipeptídeos de fator de transcrição SPL15 úteisnos métodos da invenção compreendem um SPL DBD tendo, em ordemcrescente de preferência, pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95%ou 98% de identidade de seqüência com o SPL DBD representado por SEQID NO: 277.

Em algumas instâncias, parâmetros padrão podem serajustados para modificar a estringência da busca. Por exemplo usandoBLAST, o limiar de significância estatística (chamado valor esperado") pararelatar pareamentos contra seqüências de banco de dados pode ser aumentadopara mostrar pareamentos menos estringentes. Desta maneira, pareamentoscurtos praticamente exatos podem ser identificados. Motivo 1 comorepresentado por SEQ ID NO: 276 e Motivo 2 como representado por SEQ IDNO: 278 ambos compreendidos nos polipeptídeos de fator de transcriçãoSPL15 úteis nos métodos da invenção podem ser identificados desta maneira(Figura 24). Dentro de Motivo 1 e Motivo 2, são permitidas uma ou maismudança conservativa em qualquer posição, e/ou uma, duas ou trêsmudança(s) não conservativas em qualquer posição. O tripeptídeo W(S/T)Lna extremidade C-terminal do polipeptídeo pode ser da mesma maneiraidentificado (Figura 24).

Também existem bancos de dados especiais para aidentificação de domínios. O SPL DBD em um polipeptídeo de fator detranscrição SPL15 pode ser identificado usando, por exemplo, SMART(Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic etal. (2002) Nucleie Aeids Res 30, 242-244; hosted by the EMBL atHeidelberg, Germany), InterPro (Mulder et ai, (2003) Nucl. Acids. Res. 31,315-318; hospedado pelo European Bioinformaties Institute (EBI) no ReinoUnido), Prosite (Bucher and Bairoeh (1994), A generalized profile syntax forbiomolecular sequences motifs and its fiinction in automatic sequenceinterpretation. (In) ISMB-94; Proeeedings 2nd International Conferenee onIntelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P.,Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et ai,Nucl. Acids. Res. 32: D134-D137, (2004), The ExPASy proteomies server isprovided as a service to the scientific community (hospedado pelo SwissInstitute of Bioinformatics (SIB) na Suíça) ou Pfam (Bateman et al., NucleicAcids Research 30(1): 276-280 (2002), hospedado pelo Sanger Institute noReino Unido). O SPL DBD no banco de dados InterPro é designadoIPR004333, PF03110 no banco de dados Pfam e PS51141 no banco de dadosPROSITE.

Além disso, a presença de trecho rico em G/S precedendo oSPL DBD também pode ser prontamente identificada (Figura 24).Composição primária de aminoácidos (em %) para determinar se um domíniode polipeptídeo é rico em aminoácidos específicos pode ser calculado usandoprogramas de aplicativos computacionais do servidor ExPASy, em particulara ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: the proteomiesserver for in-depth protein knowledge and analysis. Nucleic Acids Res31:3784-3788). A composição da proteína de interesse pode ser entãocomparada com a composição média de aminoácidos (em %) no banco dedados Swiss-Prot Protein Sequence. Dentro deste banco de dados, o conteúdomédio de Gly (G) e Ser (E) são ambos de 6,9% (indo até 13,8%). Como umexemplo, o trecho rico em G/S precedendo o SPL DBD de SEQ ID NO: 235contém 14,5 % de G e 25,5 % de S (indo até 40%). Como definido nestelugar, um trecho rico em G/S tem um conteúdo combinado de G e S (emtermos %) acima daquele encontrado na composição média de aminoácidos(em termos %) das proteínas no Swiss-Prot Protein Sequence. Tanto G comoS pertencem à categoria de aminoácidos muito pequenos.

O ácido nucleico codificando os polipeptídeos representadospor qualquer um de SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239,SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247,SEQ ID NO: 249, SEQ ED NO: 251, SEQ LD NO: 253, SEQ ID NO: 255,SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263,SEQ ED NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, não precisam serácidos nucleicos de comprimento completo, uma vez que desempenho dosmétodos da invenção não se fia no uso de seqüências de ácidos nucleicos decomprimento completo. Além disso, exemplos de ácidos nucleicos adequadospara uso para realizar os métodos da invenção incluem mas não são limitadosàqueles representados por qualquer um de: SEQ ID NO: 234, SEQ ID NO:236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO:244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO:252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO:260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ ID NO:286. Variantes de ácidos nucleicos também podem ser úteis para praticar osmétodos da invenção. Exemplos de tais variantes incluem porções de ácidosnucleicos, variantes de união, variantes alélicas ou naturalmente ocorrentes ouobtidas por manipulação de DNA.

Uma porção pode ser preparada, por exemplo, fazendo uma oumais deleções a um ácido nucleico codificando um polipeptídeo de fator detranscrição SPL15 como definido acima. As porções podem ser usadas emforma isolada ou elas podem ser fusionadas a outras seqüências decodificação (ou não codificantes) a fim de, por exemplo, produzir umaproteína que combina diversas atividades. Quando fusionado a outrasseqüências de codificação, o polipeptídeo resultante produzido mediantetradução pode ser maior do que aquele previsto para a porção de fator detranscrição SPLl5. Porções úteis nos métodos da invenção, codificam umpolipeptídeo de fator de transcrição SPL15 (como descrito acima) e tendosubstancialmente a mesma atividade biológica que o polipeptídeo de fator detranscrição SPLl5 representado por qualquer um SEQ ED NO: 235, SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ IDNO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ IDNO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ IDNO: 261, SEQ ID NO: 263, SEQ ID NO: 283, SEQ ID NO: 285, SEQ IDNO: 287, ou ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima. Exemplos de porções podem incluir os nucleotídeoscodificando Motivo 1 como representado por SEQ ID NO: 276, em ordemcrescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95%ou 98% de identidade de seqüência com o SPL DBD representado por SEQID NO: 277, e Motivo 2 como representado por SEQ ID NO: 278. Porçõespodem incluir adicionalmente nucleotídeos codificando o trecho rico em G/Sou o tripeptídeo W(S/T)L (mas não necessariamente os nucleotídeoscodificando as seqüências de aminoácidos entre qualquer destes). A porção étipicamente de pelo menos 250 nucleotídeos de comprimento, preferivelmentepelo menos 500 nucleotídeos de comprimento, mais preferivelmente pelomenos 750 nucleotídeos de comprimento e mais preferivelmente pelo menos1000 nucleotídeos de comprimento. Preferivelmente, a porção é uma porçãode um ácido nucleico como representado por qualquer um de SEQ ID NO:234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO:242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO:250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO:258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284e SEQ ID NO: 286. Mais preferivelmente a porção é uma porção de um ácidonucleico como representado por SEQ ID NO: 234.

Outra variante de ácido nucleico útil nos métodos da invenção,é um ácido nucleico capaz de hibridizar em condições de estringênciareduzida, preferivelmente em condições estringentes, com um ácido nucleicocodificando um polipeptídeo de fator de transcrição SPL15 como definidoacima, ou a com uma porção como definido acima.

Seqüências de hibridização úteis nos métodos da invenção,codificam um polipeptídeo compreendendo de N-terminal a C-terminal: (i)Motivo 1 como representado por SEQ ID NO: 276; e (ii) em ordem crescentede preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% deidentidade de seqüência com o SPL DBD representado por SEQ ID NO: 277;e (iii) Motivo 2 como representado por SEQ ID NO: 278, e tendosubstancialmente a mesma atividade biológica que os polipeptídeos de fatorde transcrição SPL15 representados por SEQ ID NO: 235, SEQ ID NO: 237,SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245,SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253,SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261,SEQ ID NO: 263, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima. Aseqüência de hibridização é tipicamente de pelo menos 250 nucleotídeos decomprimento, preferivelmente pelo menos 500 nucleotídeos de comprimento,mais preferivelmente pelo menos 750 nucleotídeos de comprimento e maispreferivelmente pelo menos 1000 nucleotídeos de comprimento.Preferivelmente, a seqüência de hibridização é uma que é capaz de hibridizarcom qualquer dos ácidos nucleicos representados por SEQ ID NO: 234, SEQID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ IDNO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ IDNO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ IDNO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ IDNO: 286, ou com uma porção de qualquer das Seqüências mencionadasacima, uma porção sendo como definido acima. Mais preferivelmente aseqüência de hibridização é capaz de hibridizar com SEQ ID NO: 234, oucom porções deste.

Outra variante de ácido nucleico útil nos métodos da invençãoé uma variante de processamento codificando um polipeptídeo de fator detranscrição SPL15 como definido acima.

Variantes de união preferidas são variantes de união de umácido nucleico codificando polipeptídeo de fator de transcrição SPL15representado por qualquer de SEQ ID NO: 235, SEQ ID NO: 237, SEQ IDNO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ IDNO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ IDNO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ IDNO: 263, SEQ ID NO: 283, SEQ ID NO: 285, ou SEQ ID NO: 287, ouvariantes de união codificando ortólogos ou parálogos de qualquer dosmencionados acima SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238,SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246,SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254,SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262,SEQ ID NO: 282, SEQ ID NO: 284 e SEQ ID NO: 286. Mais preferido é umavariante de processamento de um ácido nucleico como representado por SEQID NO: 234.

Outra variante de ácido nucleico útil para realizar os métodosda invenção é uma variante alélica de um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 como definido acima.

A variante alélica pode ser uma variante alélica de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15representado por qualquer de SEQ ID NO: 235, SEQ ID NO: 237, SEQ IDNO: 239, SEQ ID NO: 241, SEQ ED NO: 243, SEQ ID NO: 245, SEQ IDNO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ IDNO: 255, SEQ ED NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ IDNO: 263, SEQ ID NO: 283, SEQ ED NO: 285, ou SEQ ID NO: 287, ou umavariante alélica de um ácido nucleico codificando ortólogos ou parálogos dequalquer das SEQ ID NOs mencionadas acima. Ademais preferidas sãovariantes alélicas de ácidos nucleicos representados por qualquer um de SEQID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ IDNO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ED NO: 248, SEQ IDNO: 250, SEQ ED NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ IDNO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ IDNO: 284 e SEQ ID NO: 286. Mais preferido é uma variante alélica de umácido nucleico como representado por SEQ ID NO: 234.

Uma variante de ácido nucleico adicional útil nos métodos dainvenção é uma variante de ácido nucleico obtida por embaralhamentogênico. Embaralhamento gênico ou evolução dirigida também pode ser usadapara gerar variantes de ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 como definido acima.

Além disso, variantes de ácidos nucleicos também podem serobtidas por mutagênese dirigida a sítio. Estão disponíveis diversos métodospara atingir mutagênese dirigida a sítio, o mais comum sendo métodosbaseados em PCR (Current Protocols in Molecular Biology. Wiley (Eds)).

Também úteis nos métodos da invenção são ácidos nucleicoscodificando homólogos de qualquer um dos aminoácidos representados porSEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241,SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257,SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 283,SEQ ID NO: 285, SEQ ID NO: 287, ou ortólogos ou parálogos de qualquerdas SEQ ID NOs mencionadas acima.

Também úteis nos métodos da invenção são ácidos nucleicoscodificando derivados de qualquer um dos aminoácidos representados porSEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241,SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257,SEQ ID NO: 259, SEQ ID NO: 261 SEQ ID NO: 263, SEQ ID NO: 283, SEQID NO: 285, SEQ ID NO: 287, ou ortólogos ou parálogos de qualquer dasSEQ ID NOs mencionadas acima. "Derivados" incluem peptídeos,oligopeptídeos, polipeptídeos que podem, comparados com a seqüência deaminoácidos da forma naturalmente ocorrente da proteína, tal como aquelaapresentada em SEQ ID NO: 235, compreender substituições de aminoácidoscom resíduos de aminoácidos não naturalmente ocorrentes, ou adições deresíduos de aminoácidos não naturalmente ocorrentes.

Além disso, polipeptídeos de fator de transcrição SPL15 (pelomenos em sua forma nativa) tipicamente têm atividade de ligação de DNA eum domínio de ativação. Uma pessoa versada na arte pode facilmentedeterminar a presença de um domínio de ativação e atividade de ligação deDNA usando ferramentas e técnicas de rotina.

Ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 podem ser derivados de qualquer fonte natural ou artificial.

O ácido nucleico pode ser modificado a partir de sua forma nativa emcomposição e/ou ambiente genômico através de deliberada manipulaçãohumana. Preferivelmente o ácido nucleico codificando polipeptídeo de fatorde transcrição SPL15 é de uma planta, ainda preferivelmente de umadicotiledônea, mais preferivelmente da família Brassicacea, maispreferivelmente o ácido nucleico é de Arabidopsis thaliana.

Qualquer referência neste lugar a um polipeptídeo de fator detranscrição SPL15 é portanto adotada para significar um peptídeo fator detranscrição SPL15 como definido acima. Qualquer ácido nucleico codificandoum tal polipeptídeo de fator de transcrição SPL15 é adequado para uso pararealizar os métodos da invenção.

Portanto, é fornecida uma construção gênica compreendendo:

(i) Um ácido nucleico codificando um polipeptídeo de fatorde transcrição SPL15 como definido acima;

Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeode fator de transcrição SPLl 5). O artesão versado é bem ciente dos elementosgenéticos que devem estar presentes no vetor a fim de transformar comsucesso, selecionar e propagar células hospedeiras contendo a seqüência deinteresse. A seqüência de interesse é operacionalmente ligado a uma ou maisseqüências de controle (pelo menos a um promotor).

De acordo com a invenção, o ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 é operacionalmente ligado a umpromotor constitutivo. O promotor constitutivo é preferivelmente umpromotor HMGB (grupo B de alta mobilidade), mais preferivelmente opromotor constitutivo é um promotor HMGB de arroz, ainda preferivelmenteo promotor constitutivo é representado pela seqüência de ácidos nucleicossubstancialmente similar a SEQ ID NO: 279, mais preferivelmente opromotor constitutivo é como representado por SEQ ID NO: 279 ou SEQ IDNO: 294.

Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico codificando um polipeptídeo de fator de transcriçãoSPL15 como representado por SEQ ID NO: 234, nem é a aplicabilidade dainvenção restrita a expressão de um tal ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 quando dirigida por um promotorHMGB. Exemplos de outros promotores constitutivos que também podem serusados para realizar os métodos da invenção são mostrados na seção dedefinições.

Elementos reguladores adicionais para aumentar expressão deácidos nucleicos ou genes, ou produtos de gene, podem incluir acentuadorestranscricionais assim como traducionais. Aqueles versados na arte estarãocientes de seqüências terminadoras e acentuadoras que podem ser adequadaspara uso para realizar a invenção. Outras seqüências de controle (além depromotor, acentuador, silenciador, seqüências de íntrons, regiões 3'UTR e/ou5'UTR) podem ser proteína e/ou agentes estabilizantes de RNA. Taisseqüências devem ser conhecidas ou podem ser prontamente obtidas por umapessoa versada na arte. Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta.

Uma seqüência de íntron também pode ser adicionada à região5' não traduzida (UTR) ou à seqüência de codificação da seqüência decodificação parcial para aumentar a quantidade da mensagem madura que seacumula no citosol.

A construção genética pode opcionalmente compreender umgene marcador selecionável.

A invenção também fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, compreendendo introdução e expressão em uma planta de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15 comodefinido acima.

Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada emrelação a plantas de controle, cujo método compreende:

(i) introduzir e expressar um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 em uma célula vegetal; e

A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um polipeptídeo de fator de transcriçãoSPL15 como definido acima. Células hospedeiras preferidas de acordo com ainvenção são células de planta.

A invenção também se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.

Como mencionado acima, um método preferido para aumentarexpressão de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPL15 é introduzir e expressar em uma planta um ácido nucleicocodificando um polipeptídeo de fator de transcrição SPLl5; entretanto osefeitos de realizar o método, i.e. produção crescente, também pode seratingida usando outras técnicas bem conhecidas. Uma descrição de algumasdestas técnicas irá agora se seguir.

Uma tal técnica é identificação por ativação de T-DNA. Asplantas transgênicas resultantes mostram fenótipos dominantes devido aexpressão modificada de genes próximos ao promotor introduzido.

Os efeitos da invenção também podem ser reproduzidosusando a técnica de TILLING (Lesões Locais Induzidas Dirigidas emGenomas).

Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga.

"Rendimento aumentado" como definido neste lugar é adotadapara significar um aumento em biomassa (peso) de uma ou mais partes deuma planta, o que pode incluir partes (aptas para corte) acima do solo e/oupartes (aptas para corte) abaixo do solo.

Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Uma planta tendo uma taxa de crescimento aumentada podeainda exibir florescimento precoce. O aumento em taxa de crescimento podealterar o ciclo de colheita de uma planta permitindo que plantas sejamsemeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seriapossível. Se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes da mesma espécie de planta (porexemplo semeadura e colheita de plantas de arroz seguido por semeadura ecolheita de plantas de arroz adicionais todas dentro de um período de cultivoconvencional). Similarmente, se a taxa de crescimento é suficientementeaumentada, ela pode permitir semeadura adicional de sementes de espéciesvegetais diferentes (por exemplo a semeadura e colheita de plantas de milhoseguido por, por exemplo, a semeadura e colheita opcional de soja, batata ouqualquer outra planta adequada). Tempos de colheita adicionais do mesmorizoma no caso de algumas plantas de cultura também podem ser possíveis.Alterar o ciclo de colheita de uma planta pode levar a um aumento emprodução anual de biomassa por acre (devido a um aumento no número devezes (digamos que em um ano) que qualquer planta particular pode sercultivada e colhida). Um aumento em taxa de crescimento também podepermitir o cultivo de plantas transgênicas em uma área geográfica mais amplado que suas contrapartes tipo selvagem, uma vez que as limitações territoriaispara cultivar uma cultura freqüentemente são determinadas por condiçõesambientais adversas ou no momento de plantio (ciclo precoce) ou nomomento de colheita (ciclo tardio). Tais condições adversas podem serevitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode serdeterminada derivando vários parâmetros de curvas de crescimento, taisparâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% deseu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% deseu tamanho máximo), entre outros.

De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle. Portanto, deacordo com a presente invenção, é fornecido um método para aumentar a taxade crescimento de plantas, cujo método compreende aumentar expressão emuma planta de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPL15

Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeoMADS15.

Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.

A presente invenção também abrange plantas viáveis pelosmétodos de acordo com a presente invenção. A presente invenção portantofornece plantas, partes e células de tais plantas viáveis pelos métodos deacordo com a presente invenção, cujas plantas ou partes ou célulascompreendem um transgene de ácido nucleico codificando um polipeptídeode fator de transcrição SPL15 como definido acima.

A presente invenção também abrange uso de ácidos nucleicoscodificando polipeptídeos de fator de transcrição SPL15 para aumentarprodução em uma planta comparada com produção em uma planta decontrole.

Um tal uso se refere a aumentar produção de plantas, produçãosendo definida como definido acima. Produção pode incluir em particular umou mais dos seguintes: biomassa acima da terra aumentada, númeroaumentado de flores por panícula, produção aumentada de sementes, númerototal aumentado de sementes, número aumentado de sementes cheias, Peso deMil Sementes (TKW) aumentado e índice de colheita aumentado.

Ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 podem encontrar uso em programas de melhoramento nosquais é identificado um marcador de DNA que pode ser geneticamente ligadoa um gene codificando polipeptídeo de fator de transcrição SPLl5. Ácidosnucleicos codificando polipeptídeos de fator de transcrição SPL15 podem serusados para definir um marcador molecular. Este marcador pode então serusado em programas de melhoramento para selecionar plantas tendo produçãoaumentada de sementes. Os ácidos nucleicos codificando polipeptídeos defator de transcrição SPL15 podem ser, por exemplo, um ácido nucleico comorepresentado por qualquer um de SEQ ID NO: 234, SEQ ID NO: 236, SEQID NO: 238, SEQ ED NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ IDNO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ IDNO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ EDNO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ ID NO: 286.

Variantes alélicas de um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 também podem encontrar uso emprogramas de melhoramento auxiliados por marcador. Tais programas demelhoramento algumas vezes requerem introdução de variação alélica portratamento mutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada de sementes. Seleçãotipicamente é realizada monitorando desempenho de crescimento de plantascontendo diferentes variantes alélicas da seqüência em questão, por exemplo,variantes alélicas diferentes de qualquer uma de SEQ ID NO: 234, SEQ IDNO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ IDNO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ IDNO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ IDNO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ IDNO: 286. Desempenho de crescimento pode ser monitorado em uma casa devegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas,nas quais a variante alélica superior foi identificada, com outra planta. Istopode ser usado, por exemplo, para fazer uma combinação de característicasfenotípicas interessantes.

Ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 também podem ser usados como sondas para mapeargeneticamente e fisicamente os genes dos quais elas são uma parte de, e comomarcadores para características ligadas a tais genes. Tal informação pode serútil em melhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 requer apenas uma seqüência de ácidos nucleicos de pelomenos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificandopolipeptídeos de fator de transcrição SPL15 podem ser usados comomarcadores de polimorfismo de comprimento de fragmento de restrição(RFLP). Southern blots (Sambrook J5 Fritsch EF and Maniatis T (1989)Molecular Cloning, A Laboratory Manual) de DNA genômico vegetaldigerido por restrição podem ser sondados com um ácido nucleicocodificando polipeptídeo de fator de transcrição SPLl5. O padrão debandeamento resultante pode então ser sujeito a análises genéticas usandoprogramas computacionais tal como MapMaker (Lander et al. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, oácido nucleico pode ser usado para sondar Southern blots contendo DNAsgenômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando polipeptídeo de fator detranscrição SPL15 no mapa genético previamente obtido usando estapopulação (Botstein et al (1980) Am. J. Hum. Genet. 32: 314-331).

A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley(GENETICS 112 (4): 887-898, 1986). Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas (NIL), e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.

Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et ai. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.

Os métodos de acordo com a presente invenção resultam emplantas tendo produção aumentada, como descrito acima. Estas característicastambém podem ser combinadas com outras características economicamentevantajosas, tal como características de produção melhoradas adicionais,tolerância a outros estresses abióticos e bióticos, características modificandovárias características de arquitetura e/ou características bioquímicas e/oufisiológicas.

Descrição de figuras

A presente invenção será agora descrita com referência àsseguintes figuras nas quais:

Fig. 1 representa a estrutura esquemática do polipeptídeoAtHAL3a compreendendo de término N a término C (i) a hélice de ligação desubstrato (sublinhado simples), (ii) o motivo His de inserção (sublinhadoduplo), (iii) o motivo PXMNXXMW (pontilhado) e (iv) o grampo dereconhecimento de substrato (ondulação). As extremidades N-terminal e C-terminal das proteínas HAL3 são não muito conservadas.

Fig. 2 mostra um vetor binário pEXP::HAL3, para expressãoaumentada em Oryza sativa de um ácido nucleico HAL3 de Arabidopsisthaliana sob o controle de um promotor de beta expansina.

Fig. 3 mostra um alinhamento múltiplo de diversas seqüênciasde HAL3 de Arabidopsis thaliana AtHAL3b (At_NP_973994), Sorghumbicolor (Sb), Arabidopsis thaliana AtHAL3a (Ath0218), Gossipium hirsutum(Cg), Hordeum vulgare (Hv), Oryza sativa (Os), Vitis vinifera (Vv), Glycinemax (Gm), Solanum tuberosum (St), Zea mays (Zm), e Pinus sp (Pg).

Fig. 4 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção: SEQ ID NO: 1 e SEQ ID NO: 2represent a seqüência de ácidos nucleicos e a seqüência de proteínas deAtHABa. SEQ ID NO: 3 e SEQ ID NO: 4 são as seqüências dos iniciadoresdireto e reverso usados para isolar o gene AtHAL3. SEQ ID NO: 5 é aseqüência do promotor de beta expansina usada nos métodos da presenteinvenção. SEQ ID NO: 9 a SEQ ED NO: 42 representam exemplos deDNA/seqüências de proteínas de comprimento completo ou parciais, úteis nosmétodos da invenção ou para isolar seqüências de comprimento completocorrespondentes. Em alguns casos, seqüências foram agrupadas a partir deseqüências EST, com sequenciamento de menos qualidade. Como umaconseqüência, poucas substituições de aminoácidos podem ser esperadas.

Fig. 5 (A) mostra a estrutura de domínio da proteínaMADS15, (B) representa a seqüência de SEQ ID NO: 44 com o domínioMADS em negrito e o domínio de queratina em itálico. Entre o domínioMADS e o de queratina, o domínio interveniente está localizado enquanto odomínio C está localizado C-terminalmente ao domínio de queratina.

Fig. 6 mostra um alinhamento múltiplo de várias proteínasMADS15. Os asteriscos indicam aminoácidos idênticos, as colôniasrepresentam substituições altamente conservativas, os pontos representamsubstituições menos conservadas.

Fig. 7 mostra o vetor binário para expressão aumentada emOryza sativa de um ácido nucleico codificando proteína MADS15 de Oryzasativa sob o controle de um promotor GOS2.

Fig. 8 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção.

Fig. 9 é uma representação esquemática de um polipeptídeoOsMADS 15 de comprimento completo. Os domínios típicos (M, MADS; I,domínio interveniente; K, região K-box de queratina; C, região variável C-terminal) são indicados, as linhas acima e abaixo do diagrama mostram asregiões da proteína envolvidas em ligação de DNA, dimerização e emmultimerização com proteínas de interação.

Fig. 10 mostra o vetor binário pGOS::MADS15hp parasilenciamento de RNA de MADS15 em Oryza sativa, usando uma construçãoem forma de grampo sob o controle de um promotor constitutivo (GOS2).

Fig. 11 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção, ou úteis para isolar taisseqüências. Seqüências podem resultar de associações de EST públicas, comseqüenciamento de menos qualidade. Como uma conseqüência, poucassubstituições de aminoácidos podem ser esperadas. Os códons de início(ATG) e parada delimitam as seqüências de ácidos nucleicos quando estascodificam polipeptídeos MADS15 de comprimento completo. Entretantotanto 5' como 3' UTR também podem ser usadas para a realização dosmétodos da invenção.

Fig. 12 mostra a classificação esquemática dos polipeptídeosde fator de transcrição AP2/ERF de acordo com os domínios presentes: asubfamília AP2 com duas repetições AP2 e a subfamília ERP com apenasuma repetição AP2. A subfamília ERP é adicionalmente subdividida emfatores de transcrição compreendendo um domínio B3 em adição à repetiçãoAP2 (chamada RAV), ou não. Os polipeptídeos de fator de transcrição PLTpertencem à subfamília AP2 com duas repetições AP2.

Fig. 13 respresenta uma apresentação esquemática da estruturade polipeptídeo de fator de transcrição PLT. O domínio AP2 compreende asduas repetições AP2 (envolto) separadas por uma região ligante. As posiçõesaproximadas do sinal de localização nuclear (NL S), de motivo 1PK(V/L)(A/E)DFLG e de motivp 2 (V/L)FX(M/V)WN(D/E) são marcadascomo caixas.

Fig. 14 é um alinhamento de seqüências de polipeptídeo defator de transcrição PLT (de Tabela 4), comparado com outros polipeptídeosde fator de transcrição de domínio AP2 (de Tabela 4 abaixo). O sinal delocalização nuclear (NLS), motivo 1 PK(V/L)(A/E)DFLG e motivo 2(V/L)FX(M/V)WN(D/E) são envoltos. Resíduos idênticos estão enegrecidos,resíduos conservativos estão acinzentados.

Tabela 4: Polipeptídeos de fator de transcrição de domínio

AP2 alinhados contra os polipeptídeos de fator de transcrição PLT usadosDara realizar os métodos da invenção.

<table>table see original document page 229</column></row><table>

Fig. 15 é uma fotografia de 40 sementes de uma planta decontrole (esquerda) comparado com 40 sementes de uma planta transgênicacom expressão aumentada de um polipeptídeo de fator de transcrição PLT.

Fig. 16 mostra um vetor binário pGOS2::PLT, para expressãoaumentada em Oryza sativa de um ácido nucleico de fator de transcrição PLTde Oryza sativa sob o controle de um promotor GOS2.

Fig. 17 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção (SEQ ID NO: 175 a SEQ ID NO:188). Seqüências parciais (SEQ ID NO: 189 e SEQ ID NO: 190) úteis paraisolar seqüências de comprimento completo correspondentes também sãoapresentadas.

Fig. 18 mostra um alinhamento de fatores de transcriçãobHLH como definido acima. As seqüências foram alinhadas usando programaAlignX de Vector NTI suite (InforMax, Bethesda, MD). Alinhamentomúltiplo foi feito com uma penalidade de abertura de lacuna de 10 umaextensão de lacuna de 0,01. Edição manual secundária também foi realizadaonde necessário para melhor posicionar algumas regiões conservadas. Odomínio bHLH é indicado dentro da caixa sólida e o domínio PFB26111 éindicado dentro da caixa hachurada. Também indicada pelas três setasapontando para cima é a configuração 5-9-13 (K/R ER). A única setaapontando para baixo indica o local de ácido glutâmico para reconhecimentodo E-BOX.

Fig. 19 mostra uma matriz de similaridade e identidade entrefatores de transcrição bHLH de várias espécies. Identidade percentual émostrada em negrito. Fig. 19a é uma matriz sobre seqüências de comprimentocompleto e Fig. 19b é uma matriz sobre o domínio bHLH apenas. Maisdetalhes são fornecidos em Exemplo 34.

Fig. 20 mostra um vetor binário pGOS2::bHLH, paraexpressão aumentada em Oryza sativa de um ácido nucleico codificando fatorde transcrição bHLH de Oryza sativa sob o controle de um promotor GOS2.

Fig. 21 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção.

Fig. 22 Resultado de árvore de agrupamento de vizinhosdepois de um alinhamento múltiplo de seqüências de todos os polipeptídeosde fator de transcrição SPL de Arabidopsis thaliana e de ortólogos depolipeptídeo de fator de transcrição SPL15 usando CLUSTAL W (1.83) (emGenomeNet service no Kyoto University Bioinformatics Center), e valores depadrão (Blosum 62 como matriz de pontuação, penalidade de abertura delacuna de 10; penalidade de extensão de lacuna de 0,05). Polipeptídeo de fatorde transcrição SPL15 de Arabidopsis thaliana se agrupa com os outrosortólogos e parálogos de polipeptídeo de fator de transcrição SPL15, comomostrado pelos parênteses.

Fig. 23 mostra um alinhamento do domínio de ligação deDNA (DBD) de ortólogos e parálogos de polipeptídeo de fator de transcriçãoSPL15. As seqüências foram alinhadas usando programa AlignX de VectorNTI suite (InforMax, Bethesda, MD). Alinhamento múltiplo foi feito comuma penalidade de abertura de lacuna de 10 uma extensão de lacuna de 0,01.

Os resíduos Cys e His conservados envolvidos em ligação de íon de zincoestão envoltos. O sinal de localização nuclear (NLS) bipartido estásublinhado.

Fig. 24 é um alinhamento de ortólogos e parálogos depolipeptídeo de fator de transcrição SPL15. As seqüências foram alinhadasusando programa AlignX de Vector NTI suite (InforMax, Bethesda, MD).Alinhamento múltiplo foi feito com uma penalidade de abertura de lacuna deuma extensão de lacuna de 0,01. Edição manual secundária também foirealizada onde necessário para melhor posicionar algumas regiõesconservadas. Os três principais domínios caracterizados, de N-terminal a C-terminal, estão envoltos e identificados como Motivo 1, o domínio de ligaçãode DNA de SPL e Motivo 2. Adicionalmente, o trecho rico em G/Sprecedendo o SPL DBD é marcado com Xs e o tripeptídeo W(S/T)L naextremidade C-terminal do polipeptídeo também envolta.

Fig. 25 mostra um vetor binário pHMGB::SPL15, paraexpressão aumentada em Oryza sativa de um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 de Arabidopsis thaliana sob ocontrole de um promotor HMGB.

Fig. 26 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção.

Exemplos

A presente invenção será agora descrita com referência aosseguintes exemplos, que estão como forma de ilustração apenas. Os seguintesexemplos não são pretendidos para definir completamente ou de outramaneira limitar o escopo da invenção.

Manipulação de DNA: a menos que de outra maneiradeterminado, técnicas de DNA recombinante são realizadas de acordo comprotocolos padrão descrito em (Sambrook (2001) Molecular Cloning: alaboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH,New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocolsin Molecular Biology, Current Protocols. Materiais e métodos padrão paratrabalho molecular com plantas são descritos em Plant Molecular BiologyLabfax (1993) por R.D.D. Croy, publicado por BIOS Scientific PublicationsLtd (UK) e Blackwell Scientific Publications (UK).

Exemplo seção A: HAL3

Exemplo 1: Identificação de seqüências relacionadas àseqüência de ácidos nucleicos usada nos métodos da invenção

Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas à seqüência de ácidos nucleicos usada nos métodosda presente invenção foram identificadas entre aquelas mantidas no banco dedados Entrez Nucleotides no National Center for Biotechnology Information(NCBI) usando ferramentas de busca de seqüência de banco de dados, talcomo a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et ai.(1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic AcidsRes. 25:3389-3402). O programa é usado para encontrar regiões desimilaridade local entre seqüências comparando seqüências de ácidosnucleicos ou polipeptídeos com banco de dados de seqüências e calculando asignificância estatística de pareamentos. Por exemplo, o polipeptídeocodificado pelo ácido nucleico da presente invenção foi usado para oalgoritmo TBLASTN, com configurações padrão e o filtro para ignoraracionamento de seqüências de baixa complexidade. O resultado da análise foivisto por comparação pareada, e ranqueado de acordo com o pontuação deprobabilidade (valor E), onde o pontuação reflete a probabilidade de que umalinhamento particular ocorra ao acaso (quanto menor o valor E, maissignificante o acerto). Em adição a valores E, comparações também forampontuadas por identidade percentual. Identidade percentual se refere aonúmero de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüênciasde ácidos nucleicos (ou polipeptídeos) comparadas ao longo de umcomprimento particular. Em algumas instâncias, os parâmetros padrão podemser ajustados para modificar a estringência da busca. Por exemplo o valor Epode ser aumentado para mostrar pareamentos menos estringentes. Destamaneira, pareamentos curtos praticamente exatos podem ser identificados.

Tabela A fornece uma lista de seqüências de ácidos nucleicosrelacionadas à seqüência de ácidos nucleicos usada nos métodos da presenteinvenção.

Tabela A: Exemplos de polipeptídeos HAL3:

<table>table see original document page 233</column></row><table>

Em algumas instâncias, seqüências relacionadas foramexperimentalmente agrupadas e publicamente descritas por instituições depesquisa, tal como The Institute for Genomic Research (TIGR). O banco dedados Eukaryotic Gene Orthologs (EGO) pode ser usado para identificar taisseqüências relacionadas, ou por busca de palavra chave ou usando o algoritmoBLAST com a seqüência de ácidos nucleicos ou polipeptídeos de interesse.

Exemplo 2: Clonagem da seqüência de ácidos nucleicosusada nos métodos da invenção

A seqüência de ácidos nucleicos usada nos métodos dainvenção foi amplificada por PCR usando como modelo uma biblioteca decDNA de plântulas de Arabidopsis thaliana feita sob encomenda (em pCMVSport 6.0; Invitrogen, Paisley, UK). PCR foi realizado usando Hifi Taq DNApolimerase em condições padrão, usando 200 ng de modelo em uma misturade PCR de 50 μΐ. Os iniciadores usados foram prm00957 (SEQ ID NO: 3;sentido, códon de início em negrito:

5' aaaaagcaggctcacaatggagaatgggaaaagagac 3')e prm00958 (SEQ ID NO: 4; reverso, complementar,:5' agaaagctgggttggttttaactagttccaccg 3'),o que inclui os sítios AttB para recombinação Gateway. Ofragmento de PCR amplificado foi purificado também usando métodospadrão. A primeira etapa do procedimento Gateway, a reação BP, foi entãorealizada, durante a qual o fragmento de PCR se recombina in vivo com oplasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway,um "clone de entrada", pHAL3. Plasmídeo pDONR201 foi adquirido a partirde Invitrogen, como parte da tecnologia Gateway®.

Exemplo 3: Construção de Vetor de ExpressãoO clone de entrada pHAL3 foi subseqüentemente usado emuma reação LR com pEXP, um vetor de destinação usado para transformaçãode Oryza sativa. Este vetor contém como elementos funcionais dentro doslimites de T-DNA: um marcador selecionável vegetal; uma gaveta deexpressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor de beta expansina de arroz (SEQID NO: 5) para expressão parte aérea específica foi localizado antes destagaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressãoresultante pEXP::HAL3 (Figura 2) foi transformado em cepa LBA4044 deAgrobacterium e subseqüentemente para plantas de Oryza sativa.

Exemplo 4: Transformação de cultura

As Agrobacterium transformadas contendo os vetores deexpressão foram usadas independentemente para transformar plantas de Oryzasativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbareforam descascadas. Esterilização foi realizada incubando por um minuto emetanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por umalavagem de 15 minutos por 6 vezes com água destilada estéril. As sementesestéreis foram então germinadas em um meio contendo 2,4-D (meio deindução de calo). Depois de incubação no escuro por quatro semanas, calosembriogênicos derivados de escutelo foram excisados e propagados nomesmo meio. Depois de duas semanas, os calos foram multiplicados oupropagados por subcultura no mesmo meio por outras 2 semanas. Pedaços decalo embriogênico foram subcultivados em meio fresco 3 dias antes de co-cultivo (para estimular atividade de divisão celular).

Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.

Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.

Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação. Depois de uma análise dePCR quantitativo para verificar número de cópias do inserto de T-DNA,apenas plantas transgênicas de cópia única que exibem tolerância ao agente deseleção foram mantidas para colheita de semente TI. Sementes foram entãocoletadas três a cinco meses depois de transplante. O método produziutransformantes de locus único em uma taxa de até 50 % (Aldemita andHodges 1996, Chan et al. 1993, Hiei et al. 1994).

Transformação de milho

Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al 88 (University of Minnesota) ou híbridos com A188 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25°C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de trigo

Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.

Transformação de soja

Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.

Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de colza/canola

Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188).

A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobaeterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobaeterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.

Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2SO4, e 100 μm de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobaeterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Exemplo 5: Procedimento de avaliação

5.1 Configuração de avaliação

Aproximadamente 30 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.

Quatro eventos Tl foram adicionalmente avaliados na geraçãoT2 seguindo o mesmo procedimento de avaliação que para a geração Tl mascom mais indivíduos por evento. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.

5.2 Análise estatística: teste t e teste F

Uma ANOVA de dois fatores (análises de variância) foi usadacomo modelo estatístico para a avaliação geral de características fenotípicasvegetais. Um teste F foi realizado em todos os parâmetros medidos de todasas plantas de todos os eventos transformadas com o gene da presenteinvenção. O teste F foi realizado para verificar por um efeito do gene sobretodos os eventos de transformação e para verificar por um efeito geral dogene, também conhecido como um "efeito gênico global". O limiar parasignificância para um verdadeiro efeito gênico global foi ajustado em umnível de probabilidade de 5% para o teste F. Um valor significante de teste Faponta para um efeito gênico, significando que não é apenas a mera presençaou a posição do gene que está causando as diferenças em fenótipo.

Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sãoas plantas tratadas da mesma maneira que a planta transgênica, mas das quaiso transgene foi segregado. Plantas nulas também podem ser descritas como asplantas transformadas negativas homozigotas. O limiar para significância parao teste t é ajustado em 10% de nível de probabilidade. Os resultados paraalguns eventos podem estar acima ou abaixo deste limiar. Isto é baseado nahipótese de que um gene pode apenas ter um efeito em certas posições nogenoma, e que a ocorrência deste efeito dependente de posição não éincomum. Este tipo de efeito gênico é também chamado neste lugar um"efeito de cepa do gene". O valor de ρ é obtido comparando o valor de t coma distribuição de t ou alternativamente, comparando o valor de F com adistribuição de F. O valor de ρ então gera a probabilidade de que a hipótesenula (i.e., que não existe nenhum efeito do transgene) esteja correta.

Exemplo 6: Resultados de avaliação

As panículas primárias maduras foram coletadas, contadas,ensacadas, etiquetadas com código de barras e então secas por três dias emum forno a 37°C. As panículas foram então trilhadas e todas as sementesforam coletadas e contadas. As cascas cheias foram separadas daquelas vaziasusando um dispositivo que sopra ar. As cascas vazias foram descartadas e afração remanescente foi contada novamente. As cascas cheias foram pesadasem uma balança analítica. O número de grãos cheios foi determinadocontando o número de cascas cheias que permaneceram depois da etapa deseparação. A produção total de sementes (peso total de semente) foi medidapesando todas as cascas cheias coletadas de uma planta. Número total desementes por planta foi medido contando o número de cascas coletadas deuma planta. O índice de colheita (HI) na presente invenção é definido como aproporção entre a produção total de sementes e a parte aérea (mm2),multiplicada por um fator IO6. O número total de flores por panícula comodefinido na presente invenção é a proporção entre o número total de sementese o número de panículas primárias maduras. A taxa de enchimento de grãoscomo definida na presente invenção é a proporção (expressa como uma %) donúmero de grãos cheios sobre o número total de sementes (ou floretes).

Como apresentado em Tabela B, a produção de sementes,número de grãos cheios e índice de colheita são aumentados nas plantastransgênicas preferencialmente expressando um ácido nucleico codificandoum polipeptídeo HAL3 na parte aérea, comparado com plantas de controle.

Tabela B mostra o aumento médio de produção (peso total desemente), aumento em número de grãos cheios e aumento de índice decolheita em porcento, calculados a partir dos eventos transgênicoscomparados com plantas de controle, na geração Tl

Tabela B

<table>table see original document page 242</column></row><table>

Exemplo 7: Resultados de avaliação de vigor precoce

Vigor precoce foi determinado contando o número total depixels de partes aéreas vegetais discriminadas do fundo. Foi tirada a médiadeste valor para as fotos tiradas no mesmo momento de ângulos diferentes efoi convertido para um valor de superfície física expresso em mm quadradospor calibração. Os resultados descritos abaixo são para plantas três semanasapós germinação.

Vigor precoce vegetal (se determinado por área aérea) foi vistoem seis de sete eventos da geração TI, com um aumento geral em área aéreapara plântulas transgênicas de 27% comparado com plantas de controle.Quatro destes eventos Tl foram adicionalmente avaliados na geração T2, etodos estes quatro eventos geraram um aumento em área aérea para plântulastransgênicas comparado com plantas de controle, com um aumento geral emárea aérea para plântulas transgênicas de 33% comparado com plantas decontrole. Os resultados também mostraram ser estatisticamente significantescom o valor de ρ do teste F sendo menor do que 0,0001 (geração T2)indicando que o efeito observado provavelmente é deivo ao transgene aoinvés da posição do gene ou um efeito de cepa, veja tabela C.

Tabela C

<table>table see original document page 243</column></row><table>

Exemplo Seção B: MADS15 aumentado

Exemplo 8: Identificação de seqüências relacionadas a SEQID NO: 43 e SEQID NO: 44

Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas a SEQ ID NO: 43 e/ou seqüências protéicasrelacionadas a SEQ LD NO: 44 foram identificadas entre aquelas mantidas nobanco de dados Entrez Nucleotides no National Center for BiotechnologyInformation (NCBI) usando ferramentas de busca de seqüência de banco dedados, tal como a Ferramenta Básica de Alinhamento Local (BLAST)(Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997)Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrarregiões de similaridade local entre seqüências comparando seqüências deácidos nucleicos ou polipeptídeos com banco de dados de seqüências ecalculando a significância estatística de identidades. O polipeptídeocodificado por SEQ ID NO: 43 foi usado para o algoritmo TBLASTN, comconfigurações padrão e o filtro para ignorar contrapeso de seqüências de baixacomplexidade. O resultado da análise foi visto por comparação pareada, eranqueado de acordo com o pontuação de probabilidade (valor E), onde opontuação reflete a probabilidade de que um alinhamento particular ocorra aoacaso (quanto menor o valor E, mais significante o acerto). Em adição avalores E, comparações também foram pontuadas por identidade percentual.Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos)idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos)comparadas ao longo de um comprimento particular. Em algumas instâncias,os parâmetros padrão podem ser ajustados para modificar a estringência dabusca.

Em adição às seqüências de ácidos nucleicos disponíveispublicamente disponíveis em NCBI, bancos de dados particulares deseqüências também são procurados seguindo o mesmo procedimento quedescrito acima.

Tabela D fornece uma lista de seqüências de ácidos nucleicose de proteínas relacionadas à seqüência de ácidos nucleicos comorepresentada por SEQ ID NO: 43 e à seqüência de proteínas representada porSEQ ID NO: 44.Tabela D: Seqüências de ácidos nucleicos relacionadas àseqüência de ácidos nucleicos (SEQ ID NO: 43) úteis nos métodos dapresente invenção, e os polipeptídeos deduzidos correspondentes.

<table>table see original document page 245</column></row><table>

Exemplo 9: Alinhamento de seqüências de polipeptídeosrelevantes

AlignX do Vetor NTI (Invitrogen) é baseado no popularalgoritmo de Clustal de alinhamento progressivo (Thompson et ai. (1997)Nucleic Aeids Res 25:4876-4882; Chenna et al. (2003). Nueleie Aeids Res31:3497-3500). Uma árvore filogenétiea pode ser construída usando umalgoritmo de agrupamento de vizinhos. Valores padrão são para a penalidadede abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 ea matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados).

O resultado do alinhamento múltiplo de seqüências usandopolipeptídeos relevantes para identificar aqueles úteis para realizar osmétodos da invenção é mostrado em Figura 6.

Exemplo 10: Cálculo de identidade percentual global entreseqüências de polipeptídeos de úteis para realizar os métodos da invenção

Porcentagens globais de similaridade e identidade entreseqüências de polipeptídeos de comprimento completo úteis para realizar osmétodos da invenção foram determinadas usando um dos métodos disponíveisna arte, o aplicativo computacional MatGAT (Ferramenta de AlinhamentoGlobal de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an applicationthat generates similarity/identity matrices using protein or DNA sequences.Campanella JJ5 Bitincka L, Smalley J; aplicativo computacional hospedadopor Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes desimilaridade/identidade para seqüências de DNA ou proteína sem precisar depré-alinhamento dos dados. O programa realiza uma série de alinhamentospareados usando o algoritmo de alinhamento global de Myers e Miller (comuma penalidade de abertura de lacuna de 12, e uma penalidade de extensão delacuna de 2), calcula similaridade e identidade usando por exemplo Blosum62 (para polipeptídeos), e então coloca os resultados em uma matriz dedistância. Similaridade de seqüências é mostrada na metade de baixo da linhadivisora e identidade de seqüência é mostrada na metade de cima da linhadivisora diagonal.Parâmetros usados na comparação foram:

Matriz de pontuação: Blosum62

PrimeiraLacuna: 12

Lacuna de extensão: 2

Resultados da análise de aplicativo computacional sãomostrados em Tabela E para a similaridade e identidade global nocomprimento completo das seqüências de polipeptídeos (excluindo asseqüências de polipeptídeos parciais). Identidade percentual é dada acima dadiagonal e similaridade percentual é dada abaixo da diagonal.

A identidade percentual entre as seqüências de polipeptídeosde úteis para realizar os métodos da invenção pode ser tão baixa quanto 40 %de identidade de aminoácidos comparada com SEQ ID NO: 44.

Tabela E: Resultados de MatGAT para similaridade eidentidade global no comprimento completo das seqüências de polipeptídeos.

<table>table see original document page 247</column></row><table><table>table see original document page 248</column></row><table>

Exemplo 11: Identificação de domínios compreendidos emseqüências de polipeptídeos de úteis para realizar os métodos da invenção

O banco de dados Integrated Resource of Protein Families,Domains and Sites (InterPro) é uma interface integrada para os bancos dedados de assinatura comumente usados para buscas baseadas em texto eseqüência. O banco de dados InterPro combina estes bancos de dados, queusam diferentes metodologias e graus variados de informação biológica sobreproteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos dedados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL5 PRINTS,ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no EuropeanBioinformatics Institute no Reino Unido.

Os resultados da varredura de InterPro da seqüência depolipeptídeos como representada por SEQ ID NO: 44 são apresentados emTabela F.Tabela F: Resultados de varredura de InterPro da seqüênciade polipeptídeos como representada por SEQ ID NO: 44

Banco de dados Número de acesso Nome de acessoPRINTS PR00404 MAD S DOMA INPFAM PF00319 SRF-TFSMART SM00432 MADSPROFILE PS50066 MADS BOX 2SUPERF AMILY SSF55455 SRF-IikePFAM PFO1486 K-boxSUPERF AMILY SSF46589 tRNA-binding armPANTHER PTHRl 1945 MADS BOX PROTEINPANTHER PTHRl 1945:SF19 MADS BOX PROTEIN

Exemplo 12: Previsão de topologia das seqüências depolipeptídeos de úteis para realizar os métodos da invenção (localizaçãosubcelular, transmembrana...)

TargetP 1.1 prevê a localização subcelular de proteínaseucariotas. A designação de localização é baseada na presença prevista dequalquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto(cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal devia secretora (SP). Pontuaçãos nos quais a previsão final está baseada não sãoprobabilidades realmente, e eles não necessariamente adicionam a uma.Entretanto, a localização com o maior pontuação é a mais provável de acordocom TargetP, e a relação entre os pontuaçãos (a classe de confiança) pode seruma indicação de quão certa é a previsão. A classe de confiança (RC) varia de1 a 5, onde 1 indica a previsão mais forte. TargetP é mantido no servidor daTechnical University of Denmark.

Para as seqüências previstas conterem uma pré-seqüência N-terminal um sítio de clivagem potencial também pode ser previsto.

Diversos parâmetros foram selecionados, tal como grupo deorganismo (não vegetal ou vegetal), conjuntos de atalhos (nenhum, conjuntopré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e ocálculo de previsão de sítios de clivagem (sim ou não).

Os resultados de análise TargetP 1.1 da seqüência depolipeptídeos como representada por SEQ ID NO: 44 são apresentados emTabela G. O grupo de organismo "vegetal" foi selecionado, nenhum atalhodefinido, e o comprimento previsto do peptídeo de trânsito requisitado. Alocalização subcelular da seqüência de polipeptídeos como representada porSEQ ID NO: 44 pode ser o citoplasma ou núcleo, nenhum peptídeo de trânsitoé previsto.

Tabela G: Análise TargetP 1.1 da seqüência de polipeptídeoscomo representada por SEQ ID NO: 44

<table>table see original document page 250</column></row><table>

Muitos outros algoritmos podem ser usados para realizar taisanálises, incluindo:

· ChloroP 1.1 hospedado no servidor da TechnicalUniversityofDenmark;

• Protein Prowler Subcellular Localisation Predictor versão1.2 hospedado no servidor do Institute for Molecular Bioscience, Universityof Queensland, Brisbane, Austrália;

· PENCE Proteome Analyst PA-GOSUB 2.5 hospedado noservidor da University of Alberta, Edmonton, Alberta, Canadá;

• TMHMM, hospedado no servidor da Technical Universityof Denmark

Exemplo 13: Ensaio relacionado às seqüências depolipeptídeos de úteis para realizar os métodos da invençãoLim et al. (PMB 44, 513-527, 2000) descrevem dois ensaiospara medir interações proteína-proteína que podem ser aplicados a MADS15.No ensaio de dois híbridos de levedura, uma forma truncada de MADSl(compreendendo o MADS Box completo, o domínio IeK mas carecendo daparte C-terminal do domínio C) foi usada como isca para testar interação comMADS15. No ensaio de precipitação in vitro, GST e proteínas MADSlfusionadas a GST foram produzidas e imobilizadas em glutationa Sepharose4B. O GST/GST-MADS1 ligado em resina foi misturado com proteínasMADS15 marcadas com S ou fragmentos destas. Depois de lavagem, asproteínas de interação foram eluídas e analisadas por SDS-PAGE. Umapessoa versada na arte irá perceber que a proteína MADS15 pode ser usadacomo isca na triagem de dois híbridos ou pode ser imobilizada em resina deglutationa também. Além disso, uma proteína MADS15, quando usada deacordo com os métodos da presente invenção, irá resultar em produçãoaumentada de raízes em arroz, medida como uma proporção aumentada debiomassa de raiz sobre biomassa de parte aérea.

Exemplo 14: Clonagem de seqüência de ácidos nucleicoscomo representada por SEQID NO: 43

O gene MADS15 de Oryza sativa foi amplificado por PCRusando como modelo uma biblioteca de cDNA de plântula de Oryza sativa(Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído deplântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio deinserto do banco foi 1,5 kb e o número original de clones foi da ordem de 1,59χ 10 cfu. Título original foi determinado como sendo 9,6 χ 10 cfü/ml depoisde primeira amplificação de 6 χ IO11 cfu/ml. Depois de extração deplasmídeo, 200 ng de modelo foi usado em uma mistura de PCR de 50 μΐ.Iniciadores prm06892 (SEQ ID NO: 45; sentido, códon de início em negrito,sítio AttBl em itálico: S^ggggacaagtttgtacaaaaaagcaggcttaaaeaatgggcgggggaaggt-3') e prm06893 (SEQ ID NO: 46; reverso, complementar,sítio AttB2 em itálico: 5'-ggggaccactttgtacaagaaagctgggtttggccga.cga.cgacg3iC-3'), o que inclui os sítiosAttB para recombinação Gateway, foram usados para amplificação por PCR.PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão.Um fragmento de PCR de cerca de 915 bp foi amplificado e purificadotambém usando métodos padrão. A primeira etapa do procedimento Gateway,a reação BP, foi então realizada, durante a qual o fragmento de PCR serecombina in vivo com o plasmídeo pDC)NR201 para produzir, de acordocom a terminologia Gateway, um "clone de entrada", pMADS15. PlasmídeopDC)NR201 foi adquirido a partir de Invitrogen, como parte da tecnologiaGateway®.

Exemplo 15: Construção de vetor de expressão usando aseqüência de ácidos nucleicos as representados por SEQID NO: 43

O clone de entrada pMADS15 foi subseqüentemente usado emuma reação LR com pGOS2, um vetor de destinação usado paratransformação de Oryza sativa. Este vetor contém como elementos funcionaisdentro dos limites de T-DNA: um marcador selecionável vegetal; uma gavetade expressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 108,alternativamente, SEQ ID NO: 47 é igualmente útil) para expressãoconstitutiva foi localizado antes desta gaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressãoresultante pGOS2::MADS15 (Figura 7) foi transformado em cepa LBA4044de Agrobacterium de acordo com métodos bem conhecidos na arte.

Exemplo 16: Transformação de planta

Transformação de arroz

A Agrobacterium contendo o vetor de expressão foi usada paratransformar plantas de Oryza sativa. Sementes maduras secas da cultivarjaponesa de arroz Nipponbare foram descascadas. Esterilização foi realizadaincubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2%de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com águadestilada estéril. As sementes estéreis foram então germinadas em um meiocontendo 2,4-D (meio de indução de calo). Depois de incubação no escuro porquatro semanas, calos embriogênicos derivados de escutelo foram excisados epropagados no mesmo meio. Depois de duas semanas, os calos forammultiplicados ou propagados por subcultura no mesmo meio por outras 2semanas. Pedaços de calo embriogênico foram subcultivados em meio fresco3 dias antes de co-cultivo (para estimular atividade de divisão celular).

Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD60o) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.

Transformação de milho

Transformação de milho {Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al 88 (University of Minnesota) ou híbridos com Al 88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de trigo

Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25°C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25°C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.

Transformação de soja

Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de colza/canola

A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.

Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 1OO μιτι de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobaeterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Exemplo 17: Procedimento de avaliação fenotípica

17.1 Configuração de avaliação

Aproximadamente 35 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Seis eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.

As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.

17.2 Análise estastística: teste F

Uma ANOVA de dois fatores (análises de variância) foi usadacomo um modelo estatístico para a avaliação geral de característicasfenotípicas vegetais. Um teste F foi realizado em todos os parâmetrosmedidos de todas as plantas de todos os eventos transformadas com o gene dapresente invenção. O teste F foi realizado para verificar por um efeito do genesobre todos os eventos de transformação e para verificar por um efeito geraldo gene, também conhecido como efeito gênico global. O limiar parasignificância para um verdadeiro efeito gênico global é ajustado em 5% denível de probabilidade para o teste F. Um valor significante de teste F apontapara um efeito gênico, significando que não é apenas a mera presença ou aposição do gene que está causando as diferenças em fenótipo.

17.3 Parâmetros medidos

Do estágio de semeadura até o estágio de maturidade asplantas foram passadas diversas vezes através de uma gabinete de imagemdigital. Em cada momento imagens digitais (2048x1536 pixels, 16 milhões decores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.

A parte aérea de planta (ou biomassa de folhas) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A parte aérea é a áreamedida no momento no qual a planta atingiu sua biomassa de folhas máxima.O vigor precoce é a área aérea de planta (plântula) três semanas apósgerminação. Aumento em biomassa de raiz é expresso como um aumento embiomassa total de raiz (medida como biomassa máxima de raízes observadadurante o tempo de vida de uma planta); ou como um aumento no índiceraiz/parte aérea (medido como a proporção entre biomassa de raiz e biomassade parte aérea no período de crescimento ativo de raiz e parte aérea).

Exemplo 18: Resultados da avaliação fenotípica das plantastransgênicas

Mediante análise das plantas como descrito acima, osrequerentes encontraram que plantas transformadas com a construção de geneMADS15 tiveram uma maior produção de raízes, expressa como índiceraiz/parte aérea, comparada com plantas carecendo do transgene MADSl 5. Oaumento foi de 9,4% (valor de ρ 0,0207) em Tl e 25,7% (valor de ρ 0,002)em T2. Os valores de ρ mostram que os aumentos foram significantes.

Exemplo seção C: MADS15 diminuído

Veja também Exemplos 8 a 13 para a identificação ecaracterização de seqüência relacionadas a MADS15.

Exemplo 19: Clonagem gênica

O gene MADS15 de Oryza sativa foi amplificado por PCRusando como modelo uma biblioteca de cDNA de plântula de Oryza sativa(Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído deplântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio deinserto do banco foi de 1,5 kb e o número original de clones foi da ordem de1,59 χ IO7 cfii. Título original foi determinado como sendo 9,6 χ IO5 cfu/mldepois de primeira amplificação de 6 χ IO11 cfu/ml. Depois de extração deplasmídeo, 200 ng de modelo foi usado em uma mistura de PCR de 50 μΐ.Iniciadores prm06892 (SEQ ID NO: 111; sentido, códon de início em negrito,sítio AttBl em itálico: '-ggggacaagtttgtacaaaaaagcaggcttaaacaatgggcgggggaaggt-3') e prm06893 (SEQ ID NO: 112; reverso, complementar, sítioAttB2 em itálico:

5' -ggggaccactttgtacaagaaagctgggttíggccgacgacgacgac-3'), oque inclui os sítios AttB para recombinação Gateway, foram usados paraamplificação por PCR. PCR foi realizado usando Hifi Taq DNA polimeraseem condições padrão. Um fragmento de PCR de cerca de 915 bp foiamplificado e purificado também usando métodos padrão. O fragmento dePCR foi subseqüentemente usado para a preparação de uma construção emforma de grampo, usando técnicas conhecidas na arte. A primeira etapa doprocedimento Gateway, a reação BP, foi então realizada, durante a qual aconstrução em forma de grampo se recombina in vivo com o plasmídeopDONR201 para produzir, de acordo com a terminologia Gateway, um "clonede entrada", pMADS15hp. Plasmídeo pDONR201 foi adquirido a partir deInvitrogen, como parte da tecnologia Gateway®.

Exemplo 20: Construção de Vetor

O clone de entrada pMADS15hp foi subseqüentemente usadoem uma reação LR com p01519, um vetor de destinação para a construçãocom repetição invertida. Este vetor contém como elementos funcionais dentrodos limites de T-DNA: um marcador selecionável vegetal; uma gaveta deexpressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR de forma que a seqüência de interesse do clone deentrada é integrada como uma repetição invertida. Um promotor GOS2 dearroz (SEQ ID NO: 174, alternativamente, SEQ ID NO: 113 é igualmenteútil) para expressão constitutiva foi localizado antes desta gaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressãoresultante com a repetição invertida, Figura 10) foi transformado em cepaLBA4044 de Agrobacterium e subseqüentemente para plantas de Oryzasativa.

Exemplo 21: Transformação de planta

Transformação de arroz

Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 250C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.

Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação. Depois de uma análise dePCR quantitativo para verificar número de cópias do inserto de T-DNA,apenas plantas transgênicas de cópia única que exibem tolerância ao agente deseleção foram mantidas para colheita de semente TL Sementes foram entãocoletadas três a cinco meses depois de transplante. O método produziutransformantes de locus único em uma taxa de até 50 % (Aldemita andHodges 1996, Chan et ai 1993, Hiei et al. 1994).

Transformação de milho

Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al88 (University of Minnesota) ou híbridos com Al88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.

Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).

As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de trigoTransformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.

Transformação de soja

Transformação de colza/canola

Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 100 |im de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Exemplo 22: Métodos de avaliação de plantas transformadascom a repetição invertida de MADS15 sob controle do promotor GOS2 dearroz

Aproximadamente 15 a 20 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Oito eventos para a construção de repetição invertidados quais a progênie Tl segregou 3:1 para presença/ausência do transgene,foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas Tlcontendo o transgene (hetero e homozigotos) e aproximadamente 10 plântulasTl carecendo do transgene (nulizigotos) foram selecionadas monitorandoexpressão de marcador visual. As plantas Tl selecionadas foram transferidaspara uma casa de vegetação. Cada planta recebeu um código de barrasexclusivo para se ligar inequivocamente os dados de fenotipagem para aplanta correspondente. As plantas Tl selecionadas forma cultivadas em soloem potes de diâmetro de 10 cm nas seguintes configurações ambientais:fotoperíodo= 11,5 h, intensidade diurna= 30.000 Iux ou mais, temperaturadiurna= 28°C ou mais, temperatura noturna = 22°C, umidade relativo = 60-70%. Plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.

A parte aérea de planta (ou biomassa de folhas) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A Areamax é a áreaaérea no momento no qual a planta atingiu sua biomassa de folhas máxima.

As panículas primárias maduras foram coletadas, ensacadas,etiquetadas com código de barras e então secas por três dias no forno a 37°C.

As panículas foram então trilhadas e todas as sementes coletadas. As cascascheias foram separadas daquelas vazias usando um dispositivo que sopra ar.Depois de separação, ambos os lotes de sementes foram então contadosusando uma máquina de contagem disponível comercialmente. As cascasvazias foram descartadas. As cascas cheias foram pesadas em uma balançaanalítica e a área seccional cruzada das sementes foi medida usandoimageamento digital. Este procedimento resultou no estabelecimento dosseguintes parâmetros relacionados a sementes:

As flores por panícula é um parâmetro estimando o númeromédio de floretes por panícula em uma planta, derivado do número desementes total dividido pelo número de primeiras panículas. A panícula maisalta e todas as panículas que se sobrepõe com a panícula mais alta quandoalinhadas verticalmente, foram consideradas as primeiras panículas e foramcontadas manualmente. O número de grãos cheios foi determinado contando onúmero de cascas cheias que permaneceram depois da etapa de separação. Aprodução total de sementes (peso total de semente) foi medida pesando todasas cascas cheias coletadas de uma planta. Número total de sementes porplanta foi medido contando o número de cascas coletadas de uma planta ecorresponde ao número de floretes por planta. Estes parâmetros foramderivados de uma maneira automatizada a partir das imagens digitais usandoaplicativo computacional de análise de imagem e foram analisadosestatisticamente. Parâmetros individuais de sementes (incluindo largura,comprimento, área, peso) foram medidos usando um dispositivo feito sobencomenda consistindo de dois componentes principais, um dispositivo depesagem e imageamento, acoplado a aplicativo computacional para análise deimagem.Uma ANOVA de dois fatores (análises de variância) corrigidapara o modelo não equilibrado foi usada como modelo estatístico para aavaliação geral de características fenotípicas vegetais. Um teste F foirealizado em todos os parâmetros medidos de todas as plantas de todos oseventos transformadas com aquele gene. O teste F foi realizado para verificarpor um efeito do gene sobre todos os eventos de transformação e paraverificar por um efeito geral do gene, também chamado neste lugar "efeitogênico global". Se o valor do teste F mostra que os dados são significantes,então foi concluído que houve um efeito "gênico", significando que não foiapenas presença ou a posição do gene que estava causando o efeito. O limiarpara significância para um verdadeiro efeito gênico global foi ajustado em umnível de probabilidade de 5% para o teste F.

Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sereferem a plantas tratadas da mesma maneira que a planta transgênica, masdas quais o transgene foi segregado. Plantas nulas também podem serdescritas como as plantas transformadas negativas homozigotas. O limiar parasignificância para o teste t foi ajustado em um nível de probabilidade de 10%.

Os resultados para alguns eventos podem estar acima ou abaixo deste limiar.Isto é baseado na hipótese de que um gene pode apenas ter um efeito emcertas posições no genoma, e que a ocorrência deste efeito dependente deposição não é incomum. Este tipo de efeito gênico é também chamado nestelugar de um "efeito de cepa do gene". O valor de ρ foi obtido comparando ovalor de t com a distribuição de t ou alternativamente, comparando o valor deF com a distribuição de F. O valor de ρ então gera a probabilidade de que ahipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.

Exemplo 23: mensuração de parâmetros relacionados àprodução para os transformantes de construção com repetição invertida:

Mediante análise das sementes como descrito acima, osrequerentes encontraram que plantas transformadas com a construção emforma de grampo de gene MADS15 tinham uma maior produção de sementes,expressa como número de grãos cheios, peso total de sementes, número totalde sementes, e flores por panícula, comparadas com plantas carecendo dotransgene MADSl 5, ao passo que as plantas transformadas com a construçãode gene MADS15 sentido mostraram efeitos opostos. Os valores de ρ mostramque os aumentos foram significantes.

Os resultados obtidos para plantas na geração Tl estãoresumidos em Tabela H, os quais representam os valores médios para todas aslinhagens testadas:

Tabela H:

<table>table see original document page 270</column></row><table>

Exemplo Seção D: PLT

Exemplo 24: Identificação de seqüências relacionadas a aseqüência de ácidos nucleicos usada nos métodos da invenção

Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas a a seqüência de ácidos nucleicos usada nos métodosda presente invenção foram identificadas entre aquelas mantidas no banco dedados Entrez Nucleotides no National Center for Biotechnology Information(NCBI) usando ferramentas de busca de seqüência de banco de dados, talcomo a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al.(1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res.25:3389-3402). O programa é usado para encontrar regiões de similaridadelocal entre seqüências comparando seqüências de ácidos nucleicos oupolipeptídeos com banco de dados de seqüências e calculando a significânciaestatística de identidades. Por exemplo, o polipeptídeo codificado pelo ácidonucleico da presente invenção foi usado para o algoritmo TBLASTN, comconfigurações padrão e o filtro para ignorar contrapeso de seqüências de baixacomplexidade. O resultado da análise foi visto por comparação pareada, eranqueado de acordo com o pontuação de probabilidade (valor E), onde opontuação reflete a probabilidade de que um alinhamento particular ocorra aoacaso (quanto menor o valor E, mais significante o acerto). Em adição avalores E, comparações também foram pontuadas por identidade percentual.

Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos)idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos)comparadas ao longo de um comprimento particular. Em algumas instâncias,os parâmetros padrão podem ser ajustados para modificar a estringência dabusca. Por exemplo o valor E pode ser aumentado para mostrar pareamentosmenos estringentes. Desta maneira, pareamentos curtos praticamente exatospodem ser identificados.

A Tabela I abaixo fornece uma lista de seqüências de ácidosnucleicos relacionadas à seqüência de ácidos nucleicos usada nos métodos dapresente invenção.

Tabela I: seqüências de ácidos nucleicos relacionadas àseqüência de ácidos nucleicos usada nos métodos da presente invenção

<table>table see original document page 271</column></row><table><table>table see original document page 272</column></row><table>

Em algumas instâncias, seqüências relacionadas foramexperimentalmente agrupadas e publicamente descritas por instituições depesquisa, tal como The Institute for Genomic Research (TIGR). O banco dedados Eukaryotic Gene Orthologs (EGO) pode ser usado para identificar tais- 5 seqüências relacionadas, ou por busca de palavra chave ou usando o algoritmoBLAST com a seqüência de ácidos nucleicos ou polipeptídeos de interesse.

Exemplo 25: Clonagem das seqüências de ácidos nucleicosusadas nos métodos da invenção

As seqüências de ácidos nucleicos usadas nos métodos dainvenção foram amplificadas por PCR usando como modelo uma bibliotecade cDNA de Arabidopsis thaliana feita sob encomenda começando do RNAextraído de diferentes tecidos (em pCMV Sport 6.0; Invitrogen, Paisley, UK).PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão,usando 200 ng de modelo em uma mistura de PCR de 50 μΐ. Os iniciadoresusados para amplificar SEQ ID NO: 175 (PLTl) foram prm08180 (SEQ IDNO: 195; sentido, códon de início em negrito, sítio AttBl em itálico: 5'GGGGACAAGTTTGTA

CAAAAAAGCAGGCTTAAACAATGATCAATCCACACGGTG 3') eprm08181 (SEQ ID NO: 196; reverso, complementar, sítio AttB2 em itálico:5' GGGGA CCA CTTTGTA CAA GAAA GCTGGG7TCCTTGTTTACTCATTCCACA 3'), o que inclui os sítios AttBpara recombinação Gateway. Os iniciadores usados para amplificar SEQ IDNO: 177 (PLT2) foram prm08182 (SEQ ID NO: 197; sentido, códon de inícioem negrito, sítio AttBl em itálico: 5'GGGGA CAA GTTTGTA CAA AAAA GCA GGCTTAAA CA ATG AATTCTAAC AACTGGCTC 3') e prm08183 (SEQ ID NO: 198; reverso, complementar, sítioAttB2 em itálico: 5'GGGGA CCA CTTTGTA CAA GAAA GC7GGG7TC ATCTTTTATTC ATTCC ACA 3'),

Os fragmentos de PCR amplificados foram purificadostambém usando métodos padrão. A primeira etapa do procedimento Gateway,a reação BP, foi então realizada, durante a qual o fragmento de PCR serecombina in vivo com o plasmídeo pDONR2()l para produzir, de acordocom a terminologia Gateway, um "clone de entrada", pPLTl para SEQ IDNO: 175 e pPLT2 para SEQ ID NO: 177. Plasmídeo pDONR2()l foiadquirido a partir de Invitrogen, como parte da tecnologia Gateway®.

Exemplo 26: Construção de Vetor de Expressão

Os clones de entrada pPLTl e pPLT2 foram subseqüentementeusados em uma reação LR com vetores de destinação usados paratransformação de Oryza sativa. Um primeiro vetor contém como elementosfuncionais dentro dos limites de T-DNA: um marcador selecionável vegetal;uma gaveta de expressão de marcador rastreável; e uma gaveta Gatewaypretendida para recombinação in vivo LR com a seqüência de ácidosnucleicos de interesse já clonada no clone de entrada. Um promotorconstitutivo de arroz, um promotor GOS2 (SEQ ID NO: 210, alternativamenteSEQ ID NO: 194 é igualmente útil) foi localizado antes desta gavetaGateway.

Um segundo vetor contém os mesmos elementos funcionaisdentro dos limites de T-DNA: um marcador selecionável vegetal; uma gavetade expressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor de arroz para expressão emmeristemas, um promotor MT (SEQ ID NO: 211) (PR00126) foi localizadoantes desta gaveta Gateway.

Depois da etapa de recombinação LR5 os vetores de expressãoresultantes, pGOS2::PLTl, pGOS2; PLT2, pMT::PLTl e pMT::PLT2 (Figura16 mostra a construção com o promotor GOS2) foram independentementetransformados em cepa LBA4044 de Agrobacterium e subseqüentemente paraplantas de Oryza sativa. Plantas de arroz transformadas foram deixadascrescendo e foram entào examinadas para os parâmetros descritos abaixo.

Exemplo 27: Transformação de cultura

Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD600) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.

Aproximadamente 35 transformantes TO de arrozindependentes foram gerados para uma construção. Os transformantesprimários foram transferidos de uma câmara de cultura de tecido para umacasa de vegetação. Depois de uma análise de PCR quantitativo para verificarnúmero de cópias do inserto de T-DNA, apenas plantas transgênicas de cópiaúnica que exibem tolerância ao agente de seleção foram mantidas paracolheita de semente TI. Sementes foram então coletadas três a cinco mesesdepois de transplante. O método produziu transformantes de locus único emuma taxa de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei etal. 1994).

Transformação de milho

Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural A188 (University of Minnesota) ou híbridos com A188 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de trigo

Transformação de soja

Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.

Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.

Transformação de colza/canola

A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.

Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.

Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2SO4, e 100 |im de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Exemplo 28: Procedimento de avaliação fenotípica

28.1 Configuração de avaliação

Avaliação em condições normais de cultivo

Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação para cultivo e colheita desemente TI. Seis eventos, dos quais a progênie Tl segregou 3:1 parapresença/ausência do transgene, foram retidos. Para cada um destes eventos,aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.

Avaliação em condições de disponibilidade reduzida denitrogênioAs plantas de arroz foram cultivadas em terra para vaso comoem condições normais exceto para a solução nutritiva. Os potes forammolhados de transplante até maturação com uma solução nutritiva específicacontendo teor reduzido de N nitrogênio (N), normalmente entre 7 a 8 vezesmenos. O resto do cultivo (maturação vegetal, coleta de sementes) foi omesmo que para plantas não cultivadas sob estresse abiótico.

28.2 Análise estastística: teste F

Uma ANOVA de dois fatores (análises de variância) foi usadacomo um modelo estatístico para a avaliação geral de característicasfenotípicas vegetais. Um teste F foi realizado em todos os parâmetrosmedidos de todas as plantas de todos os eventos transformadas com o gene dapresente invenção. O teste F foi realizado para verificar por um efeito do genesobre todos os eventos de transformação e para verificar por um efeito geraldo gene, também conhecido como efeito gênico global. O limiar parasignificância para um verdadeiro efeito gênico global foi ajustado em umnível de probabilidade de 5% para o teste F. Um valor significante de teste Faponta para um efeito gênico, significando que não é apenas a mera presençaou posição do gene que está causando as diferenças em fenótipo.

28.3 Parâmetros medidos

Mensuração de parâmetro relacionado a biomassa

A área aérea de planta (ou biomassa de folhas, areamax) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.

Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A parte aérea é a áreamedida no momento no qual a planta atingiu sua biomassa de folhas máxima.

O vigor precoce é a área aérea de planta (plântula) três semanas apósgerminação. Aumento em biomassa de raiz é expresso como um aumento embiomassa total de raiz (medida como biomassa máxima de raízes observadadurante o tempo de vida de uma planta); ou como um aumento no índiceraiz/parte aérea (medido como a proporção entre massa radicular e massa departe aérea no período de crescimento ativo de raiz e parte aérea).

Mensurações de parâmetros relacionados a semente

As panículas primárias maduras foram coletadas, contadas,ensacadas, etiquetadas com código de barras e então secas por três dias emum forno a 37°C. As panículas foram então trilhadas e todas as sementesforam coletadas e contadas. As cascas cheias foram separadas daquelas vaziasusando um dispositivo que sopra ar. As cascas vazias foram descartadas e afração remanescente foi contada novamente. As cascas cheias foram pesadasem uma balança analítica. O número de grãos cheios foi determinadocontando o número de cascas cheias que permaneceram depois da etapa deseparação. A produção total de sementes foi medida pesando todas as cascascheias coletadas de uma planta. Número total de sementes por planta foimedido contando o número de cascas coletadas de uma planta. Peso de milsementes (TKW) é extrapolado a partir do número de grãos cheios contados eseu peso total. O índice de colheita (HI) na presente invenção é definido comoa proporção entre a produção total de sementes e a parte aérea (mm2),multiplicada por um fator IO6. O número total de flores por panícula comodefinido na presente invenção é a proporção entre o número total de sementese o número de panículas primárias maduras. A taxa de enchimento de grãoscomo definida na presente invenção é a proporção (expressa como uma %) donúmero de grãos cheios sobre o número total de sementes (ou floretes).

Exemplo 29: Resultados da avaliação fenotípica das plantastransgênicas

29.1 Resultados da avaliação fenotípica das plantastransgênicas cultivadas em condições normais de cultivo, expressando ouseqüência de ácidos nucleicos PLTl ou PLT2 sob o controle de um promotorconstitutivo

Os resultados da mensuração de TKW das sementes Tl deplantas de arroz transgênicas PLTl e PLT2 cultivadas em condições normaisde cultivo, são mostrados em Tabela J, em valores absolutos (média doseventos) e como uma porcentagem comparada a plantas tipo selvagem. Umaumento substancial em TKW é observado para as sementes transgênicascontendo qualquer construção, comparado com sementes tipo selvagem.Tabela J: Resultados de mensurações de TKW das sementesTl de Plantas transgênicas PLTl e PLT2 cultivadas em condições normais decultivo.

<table>table see original document page 283</column></row><table>

Parâmetros individuais de sementes (incluindo largura,comprimento, área, peso) foram medidos usando um dispositivo feito sobencomenda consistindo de dois componentes principais, um dispositivo depesagem e imageamento, acoplado a aplicativo computacional para análise deimagem.

Os resultados de mensuração de área de semente ecomprimento de semente das sementes Tl de plantas de arroz transgênicasPLTl e PLT2 são mostrados em Tabela K em valores absolutos (média doseventos) e como uma porcentagem comparada a plantas tipo selvagem. Umclaro aumento tanto em área de semente como comprimento de semente éobservado para as sementes transgênicas contendo qualquer construção,comparado com sementes tipo selvagem.

Tabela K: Resultados de mensurações de área de semente ecomprimento de semente das sementes Tl de plantas transgênicas PLTl ePLT2 cultivadas em condições normais de cultivo.

<table>table see original document page 283</column></row><table>

Largura de semente não foi significantemente afetada nassementes Tl das plantas transgênicas PLT e PLT2 (dados não mostrados).

29.2 Resultados da avaliação fenotípica das plantastransgênicas cultivadas em condições de disponibilidade reduzida denitrogênio, expressando ou seqüência de ácidos nucleicos PLTl ou PLT2 sobo controle de um promotor constitutivo

Os resultados da mensuração de TKW das sementes Tl deplantas de arroz transgênicas PLTl e PLT2 cultivadas em condições dedisponibilidade reduzida de nitrogênio, são mostradas em Tabela L, emvalores absolutos (média dos eventos) e como uma porcentagem comparada aplantas tipo selvagem. Um aumento substancial em TKW é observado para assementes transgênicas contendo qualquer construção, comparado comsementes tipo selvagem.

Tabela L: Resultados de mensurações de TKW das sementes

Tl de plantas transgênicas PLTl e PLT2 cultivadas em condições dedisponibilidade reduzida de nitrogênio.

<table>table see original document page 284</column></row><table>

29.3 Resultados da avaliação fenotípica das plantastransgênicas cultivadas em condições normais de cultivo, expressandoseqüência de ácidos nucleicos de PLT2 sob o controle de um promotormeristema específico

Os resultados de mensuração de TKW das sementes Tl deplantas de arroz cultivadas transgênicas PLT2 em condições normais decultivo, expressando seqüência de ácidos nucleicos de PLT2 sob o controle deum promotor meristema específico, são mostrados em Tabela M, em valoresabsolutos (média dos eventos) e como uma porcentagem comparada a plantastipo selvagem. Um aumento substancial em TKW é observado para assementes transgênicas contendo a construção, comparado com sementes tiposelvagem.Tabela Μ: Resultados de mensurações de TKW das sementesTl de plantas transgênicas PLT2 cultivadas em condições normais de cultivo,expressando seqüência de ácidos nucleicos de PLT2 sob o controle de umpromotor meristema específico.

<table>table see original document page 285</column></row><table>

Exemplo Seção E: bHLH

Exemplo 30: Identificação de parálogos do bHLH de SEQID NO: 213 em arroz

SEQID 2 foi usado para procurar por parálogos no genoma dearroz usando um algoritmo BLASTP usado para realizar buscas desimilaridade de uma seqüência de proteínas de consulta com uma dadaseqüência de proteínas de banco de dados. A seqüência de proteínas de bancode dados procurada correspondeu ao proteoma de arroz do instituto MIPS, obanco de dados de Oryza sativa de MIPS (MOsDB)5 compreendendo 59.712seqüências; 27.051.637 letras totais. Resultados foram ranqueados de acordocom maior similaridade se determinada a partir do maior pontuação e menorvalor e. Acertos identificando parálogos de seqüências de proteínas de bHLHcom SEQID NO: 2 tiveram um pontuação de pelo menos 50 e um valor emenor do que e-05. Alinhamentos pareados entre a seqüência de consulta e osparálogos identificados de novo são mostrados abaixo.

Consulta: SEQID 2Menor soma

Alta Probabilidade

Seqüências produzindo Pares de Segmentos de Alta pontuação: Pontuação P(N) N

9629.m00093|proteína Domínio de ligação de DNA hélice-alça-hélice, 1132 1.3e-l 15 1

9629.m00090|proteína Domínio de ligação de DNA hélice-alça-hélice, 305 5.7e-28 1

9630.mO 1262|proteína Domínio de ligação de DNA hélice-alça-hélice, 189 1.1 e-15 1

9629.m07159|proteína Domínio de ligação de DNA hélice-alça-hélice, 112 3.4e-05 1

>9629.m00093lproteína Domínio de ligação de DNA hélice-alça-hélice, putativo

Comprimento = 225Pontuação = 1132 (403,5 bits), Esperado = 1.3e-115, P = 1.3e-115Identidades = 224/224 (100%), Positivos = 224/224 (100%)

Consulta: 1 MKSRKNSTTSIKAAGSCHTSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLS 60

MKSRKNSTTSTXAAGSCHTSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLSSujeito: 1 MKSRKNSTTSTKAAGSCHTSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLS 60Consulta: 61 SLIPAAAPRRHHHHYSTSSSSSPPSSTTCEAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ 120

SLIP AAAPRRHHHHYSTS S S S SPP S STKE A VTQLDHLEQ AAA YIKQLKGRIDELKKRKQQSujeito: 61 SLlPAAAPRRHHHHYSTSSSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ 120Consulta: 121 AAALTTSTSNGGGGGMPWEVRCQDGTLDVWVSEAIREERERAVRLHEVIGVLEEEGAE 180

AAALTTSTSNGGGGGMPWEVRCQDGTLDVVWSEAIREERERAVRLHEVIGVLEEEGAESujeito: 121 AAALTTSTSNGGGGGMPWEVRCQDGTLDVVWSEAIREERERAVRLHEVIGVLEEEGAE 180Consulta: 181 WNASFS WGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQY 224

WNASFSWGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQYSujeito: 181 WNASFSWGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQY 224>9629.m000901proteina Domínio de ligação de DNA hélice-alça-hélice, putativo

Comprimento = 363Pontuação = 305 (112,4 bits), Esperado = 5.7e-28, P = 5.7e-28Identidades = 87/230 (37%), Positivos = 126/230 (54%)

Consulta: 19 TSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLSSLIPAAAPRRHHHHYSTS 78TSSSG G +++++ ERK++E+ RR MKGLC+KL+SLIP +HS

Sujeito: 18 TSSSGSGASS—TAAAAAAERKEMERRRRQDMKGLCVKLASLIP-----KEHCSMSKM 68

Consulta: 79 SSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ----------------AA 122

++S TQL L-H-AAAYIK+LK R+DEL ++ AA

Sujeito: 69 QAASR--------TQLGSLDEAAAYIKKLKERVDELHHKRSMMSITSSRCRSGGGGGPAA 120

Consulta: 123 ALTTSTSNGGGGGMPWEVRCQDGTLDWWSEAIRE------------ERERAVRLHEV 170

A STS GGGG ++ VV V + -H-E R V+ H+VSujeito: 121 AAGQSTSGGGGGEEEEEDMTRTT AAAA VVE VRQHVQEGSLISLDVVLICSAARP VKFHDV 180Consulta: 171 IGVLEEEGAEVVNASFSVVGDKIFYTLHSQALCSRIGLDASRVSHRLRNL 220I VLEEEGA-h-H-A+FS+ +YT++S+A SRIG-H-ASR+S RLR LSujeito: 181 ITVLEEEGADIISANFSLAAHNFYYTIYSRAFSSRJGIEASRISERLRAL 230>9630.m01262lproteína Domínio de ligação de DNA hélice-alça-hélice, putativo

Comprimento = 211Pontuação = 189 (71,6 bits), Esperado = l.le-15, P = 1.1 e-15Identidades = 66/214 (30%), Positivos = 102/214 (47%)

Consulta: 21 SSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLSSLIPAAAPRRHH-HHYSTSS 79S+GGGGGGG K +RK E+ RR M L L SL+ +A P + +S S+

Sujeito: 7 SAGGGGGGG--------KPDRKTTERIRREQMNKLYSHLDSLVRSAPPTVNSEPSHSNSN 58

Consulta: 80 SSSPPSSTK------EAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ—AAALTTSTSN 130

S + A T+ D L AA YI+Q + R+D L+++K++ +S+S+Sujeito: 59 SKYHQRKLRILGGAAAATTRPDRLGVAAEYIRQTQERVDMLREKKRELTGGGGGGSSSSS 118Consulta: 131 GGGGGM—PWE VRCQDGTLD V V WSEAIREERERA VRLHE VIGVLEEEGAE WNASFS 187

GG PVEV+ L++ + A+ H + +E+G+VNAFSSujeito: 119 GAGAATAAAPEVEVQHLGSGLHAILFTGAPPTD—GASFHRAVRAVEDAGGQVQNAHFS 175Consulta: 188 WGDKIFYTLHSQALCSRIGLDASRVSHRLRNLL 221

VGK YT+H+ G++ RV RL+ +Sujeito: 176 VAGAKAVYTIHAMIGDGYGGIE—RVVQRLKEAI 207

Exemplo 31: Identificação de ortólogos do bHLH de SEQIDNO: 213 em Arabidopsis thaliana

SEQID 2 foi usado para procurar por ortólogos no genoma deArabidopsis usando um algoritmo BLASTP usado para realizar uma busca desimilaridade de uma seqüência de proteínas de consulta com uma dadaseqüência de proteínas de banco de dados. A seqüência de proteínas de bancode dados procurada correspondeu ao proteoma de Arabidopsis do institutoMIPS, o banco de dados de Arabidopsis thaliana de MIPS (MAtDB)compreendendo 26.735 seqüências; 11.317.104 letras totais. Resultados foramranqueados de acordo com maior similaridade se determinada a partir domaior pontuação e menor valor e. Acertos identificando ortólogos deseqüências de proteínas bHLH com SEQID2 tiveram um pontuação de pelomenos 50 e um valor e menor do que e-05. Alinhamentos pareados entre aseqüência de consulta e the de novo identified orthologue são mostradosabaixo.

Consulta: SEQID 2

Database: /home/data/blast/orgs_sets/arabi

26.735 Seqüências; 11.317.104 letras totais.

Menor soma

Alta Probabilidade

Pontuação P(N) N180 4.5e-15 1149 8.7e-12 1118 2.0e-06 1105 1.5e-05 1110 1. 5e-05 1

Seqüências produzindo Pares de Segmentos de Alta pontuação:Atlgl0585 proteína desconhecidaAt4g20970 proteína hipotéticaAt4g25410 proteína putativa

At5g51780 fator de transcrição bHLH putativo (bHLH036)At5g51790 proteína putativa>Atlgl0585 proteína desconhecida

Comprimento = 122Pontuação = 180 (68,4 bits), Esperado = 4.5e-15, P = 4.5e-15Identidades = 38/119 (31%), Positivos = 72/119 (60%)

Consulta: 106 QLKGRIDELKKRKQQAAALTTSTSNGGGGGMPWEVRCQDGTLDWWSEAIREERERAV 165QLK ++ LK++K+ G +P + +R +D T+++ +++++RV

Sujeito: 3 QLKENVNYLKEKKRTLLQGELGNLYEGSFLLPKLSIRSRDSTIEMNLIMD-LNMKR---V 58

Consulta: 166 RLHEVIGVLEEEGAEWNASFSWGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQY 224

LHE++ + EEEGA+V++A+ + D+ YT+ +QA+ SRIG+D SR+ R+R ++ YSujeito: 59 MLHELVSIFEEEGAQVMSANLQNLNDRTTYTIIAQAIISRIGIDPSRIEERVRKIIYGY 117>At4g20970 proteína hipotética

Comprimento = 167Pontuação = 149 (57,5 bits), Esperado = 8.7e-12, P = 8.7e-12Identidades = 49/171 (28%), Positivos = 86/171 (50%)

Consulta: 33 SSSSSKMERKDVEKNRRLHMKGLCLKLSSLIPAAAPRRHHHHYSTSSSSSPPSSTKEAVT 92+ S ++RK VEKNRR+ MK L +L SL+P HH ST + P EA

Sujeito: 8 TGQSRSVDRKTVEKNRRMQMKSLYSELISLLP--------HHSSTEPLTLP-DQLDEAAN 58

Consulta: 93 QLDHLEQAAAYIKQLKGRI---DELKKRKQQ-AAALTTSTSNGGGGGMPWEVRCQDGTL 148

+L+ ++ K + L+K ++++++S +P +E++ + G++Sujeito: 59 YIKKLQVNVEKKRERKRNLVATTTLEKLNSVGSSSVSSSVDVSVPRKLPKIEIQ-ETGSI 117Consulta: 14 9 DVVVVSEAIREERERAVRLHEVIGVLEEE-GAEWNASFSVVGDKIFYTLH 198

+ + ++ E E+I VL EE GAE+ +A +S+V D +F+TLHSujeito: 118 FHIFLVTSL----EHKFMFCEIIRVLTEELGAEITHAGYSIVDDAVFHTLH 164

Exemplo 32: Identificação de um bHLH de Medicagotruncatula

A questão a ser discutida foi se a seqüência de consulta (SEQID NO: 227 de Medicago truncatula) era um polipeptídeo bHLH de acordocom a definição aplicada neste lugar. SEQ ID 227 foi comparada com o bancode dados de proteoma de Arabidopsis do MIPS institute.

Comparação foi realizada usando o algoritmo BLASTP

2.0MP-WashU, que realiza buscas de similaridade de uma seqüência deproteínas de consulta com uma dada seqüência de proteínas de banco dedados. (Referência: Gish, W. (1996-2002)). Os parâmetros usados nacomparação foram valor 10 Pontuação de remoção (S2): 56

A seqüência de proteínas de banco de dados procuradacorrespondeu ao proteoma de Arabidopsis do MIPS institute compreendendo26.735 seqüências (Banco de dados: /home/data/blast/orgs_sets/arabi 26.735seqüências; 11.317.104 letras totais). Resultados foram ranqueados de acordocom maior similaridade se determinada a partir do maior pontuação e menorvalor e. O primeiro Acerto identificado (sublinhado no alinhamento)correspondeu a SEQ ID NO: 225 (At4g20970) indicando que a seqüência éum polipeptídeo bHLH de acordo com a definição aplicada neste lugar.

Alinhamentos pareados entre a seqüência de consulta de Medicago e oprimeiro acerto correspondendo ao bHLH identificado de novo são mostradosabaixo.

BLASTP 2.OMP-WashU [09-Sep-2002] [decunix4.0-ev56-I32LPF64 2002-09-09ΊΊ7:45:09]

Consulta= SEQ ID NO: 227(140 letras)

Banco de dados: /home/data/blast/orgs_sets/arabi26.735 Seqüências; 11.317.104 letras totais.

Buscando____10____20____ 30. . . .40____50____60____7 0____ 80---- 90----100% feito

Menor somaAlta Probabilidade

Seqüências produzindo Pares de Segmentos de Alto pontuação: Pontuação P(N) N

At4g20970 proteína hipotética_248 2.8e-22 1

At5g51780 fator de transcrição bHLH putativo (bHLH036) 103 6.5e-07 1

Atlgl0585 proteína desconhecida 100 1.4e-06 1

At4g25400 fator de transcrição bHLH putativo (bHLH118) 99 7.3e-06 1

>At4g20970 proteína hipotética

Comprimento = 167Pontuação = 248 (92,4 bits), Esperado = 2.8e-22, P = 2.8e-22Identidades = 52/123 (42%), Positivos = 82/123 (66%)

Consulta: 7 EAISVPDQLKEATNYIKKLQINLEKMKEKKNFLLG---IQRPN------VNLNRNQKMGL 57

E +++PDQL EA NYIKKLQ+N+EK +E+K L+ +++ N V+ + + +Sujeito: 45 EPLTLPDQLDEAANYIKKLQVNVEKKRERKRNLVATTTLEKLNSVGSSSVSSSVDVSVPR 104Consulta: 58 KSPKIKIQQIGLVLEWLITGLESQFLFSETFRVLHEE-GVDIVNASYKVNEDSVFHSIH 116

K PKI+IQ+ G + + L+T LE +F+F E RVL EE G +1 +A Y + +D+VFH++HSujeito: 105 KLPKIEIQETGSIFHIFLVTSLEHKFMFCEIIRVLTEELGAEITHAGYSIVDDAVFHTLH 164Consulta: 117 CQV 119C+V

Sujeito: 165 CKV 167

Exemplo 33: Identificação de seqüências relacionadas àseqüência de ácidos nucleicos usada nos métodos da invenção

Seqüências de bHLH, quer nucleotídeo (cDNA decomprimento completo, ESTs ou genômico) ou proteína (polipeptídeos decomprimento completo ou parcial), foram usadas para identificar outrasSeqüências de nucleotídeos ou proteínas de bHLH entre aquelas mantidas nobanco de dados Entrez Nucleotides no National Center for BiotechnologyInformation (NCBI) usando ferramentas de busca de seqüência de banco dedados, tal como a Ferramenta Básica de Alinhamento Local (BLAST)(Altschul et ai. (1990) J. Mol. Biol. 215:403-410; e Altschul et ai. (1997)Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrarregiões de similaridade local entre seqüências comparando seqüências deácidos nucleicos ou polipeptídeos com banco de dados de seqüências ecalculando a significância estatística de identidades. Por exemplo, opolipeptídeo codificado por SEQ ID NO: 213 foi usado como consulta para aseqüências de banco de dados de seqüências nr (não redundantes: (Bancos dedados: Todas as seqüências de GenBank+EMBL+DDBJ+PDB (mas nãoseqüências de EST, STS, GSS, amostras ambientais ou seqüências HTGS defase 0, 1 ou 2) 3.819.973 seqüências; 16.928.533.343 letras totais) usando oalgoritmo TBLASTN, com configurações padrão e o filtro para ignorarseqüências de baixa complexidade. O resultado da análise (mostrado abaixo)foi visto por comparação pareada, e ranqueado de acordo com o pontuação deprobabilidade (valor E), onde o pontuação reflete a probabilidade de que umalinhamento particular ocorra ao acaso (quanto menor o valor E, maissignificante o acerto). Em adição a valores E, comparações também forampontuadas por identidade percentual. Identidade percentual se refere aonúmero de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüênciasde ácidos nucleicos (ou polipeptídeos) comparadas ao longo de umcomprimento particular.

Acertos no banco de dados identificando proteínas BHLHproduziram um pontuação de pelo menos 50 e um valor e igual a ou menor doque e-05.

Pontuação

Valor E

Seqüências produzindo alinhamentos significantes : (Bits)

giI55765745Iref|NM_183508.2 I Oryza sativa (japonica cultivar-gro 440 le-121

giI42821746IdbjIAK109432.2 I Oryza sativa (japonica cultivar-g 440 le-121

gi I 55769744 IrefIXM_549862.11 Oryza sativa (japonica cultivar-gro 247 le-105

giI58530787IdbjIAP008207.11 Oryza sativa (japonica cultivar-g 263 2e-68

giI17385651IdbjIAP002845.3 I Oryza sativa (japonica cultivar-g 263 2e-68

giI32980356Idbj|AK070332.1| Oryza sativa (japonica cultivar-g 251 9e-65

gi I 34894135Iref|NM_183504.1 I Oryza sativa (japonica cultivar-gro 137 3e-30

gi115293050 IgbIAY050959.11 Arabidopsis thaliana unknown prote 80.1 6e-16

giI79340923Iref|NM_100934.2 I Arabidopsis thaliana transcripti 87.8 2e-15

giI58531195IdbjIAP008214.1 I Oryza sativa (japonica cultivar-g 51.6 4e-13

giI42408246IdbjIAP004557.3 I Oryza sativa (japonica cultivar-g 51.6 4e-13

gi I 42408168IdbjIAP004376.3 I Oryza sativa (japonica cultivar-g 51.6 4e-13

giI22328837|ref|NM_118215.2| Arabidopsis thaliana DNAbinding 78.2 le-12

gi I 7268888IemblAL161554.2IATCHRIV54 Arabidopsis thaliana DNA chr 77.8 2e-12

gi I 5262774IembIAL080282.ilATT13K14 Arabidopsis thaliana DNA c 77.8 2e-12

giI50906596Iref|XM_464787.11 Oryza sativa (japonica cultivar-gro 77.0 3e-12

Exemplo 34: Determinação de similaridade e identidadeglobal entre fatores de transcrição bHLH

Similaridade e identidade percentuais globais entrepolipeptídeos bHLH foi determinada usando o aplicativo computacionalMatGAT (BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an applicationthat generates similarity/identity matrices using protein or DNA sequences.

Campanella JJ, Bitincka L, Smalley J.). Aplicativo computacional MatGATgera matrizes de similaridade/identidade para seqüências de DNA ou proteínasem precisar de pré-alinhamento dos dados. O programa realiza uma série dealinhamentos pareados, calcula similaridade e identidade, e então coloca osresultados em uma matriz de distância.

Parâmetros usados na comparação foram:

Matriz de pontuação: Blosum62

PrimeiraLacuna: 12

Lacuna de extensão: 2

Resultados são mostrados em Figura 19a.

Exemplo 35: Determinação de similaridade e identidadeglobal entre domínios bHLH em polipeptídeos bHLH

Domínios bHLH foram mapeados usando o aplicativocomputacional SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95,5857-5864; Letunic et al. (2006) Nucleic Aeids Res 34, D257-D260).Aplicativo computacional SMART está disponível através de instituto EMBL(European Molecular Biology Laboratory (EMBL).

As seqüências do domínio bHLH usadas são dadas abaixo.Hv_BHLH

KESEKERRKRMKALCEKLASLIPREHCCSTTDTMTQLGSLDVGASYIKKLKERVDE0S_NP_9 0839 3_BHLH

KEME RRRRQ DMKGLCVKLASLIPKEHCSMSKMQAAS RTQLGS LDEAAAYIKKLKERVDEOS_NP_908397.1_BHLH

KDVEKNRRLHMKGLCLKLSSLIPAAAPRRHHHHYSTSSSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGRIDE

Os_XP_4 64787.1_BHLH

KTTERIRREQMNKLYSHLDSLVRSAPPTVNSIPSHSNSNSKYHQRKLRILGGAAAATTRPDRLGVAAEYIRQTQERVDM

ATlG10585_bHLHnlrekdrrmrmkhlfsilsshvsptrklpvphlidqatsymiqlkenvnyAt 4 g2 0 9 7 0_bHLH

KTVEKNRRMQMKSLYSELISLLPHHSSTEPLTLPDQLDEAANYIKKLQVNVEKPorcentagens globais de similaridade e identidade entredomínios bHLH de polipeptídeos bHLH foram determinadas usando oaplicativo computacional e parâmetros descritos em Exemplo 34.

Resultados são mostrados em Figura 19b.

Exemplo 36: Clonagem da seqüência de ácidos nucleicosusada nos métodos da invenção

A seqüência de ácidos nucleicos usada nos métodos dainvenção foi amplificada por PCR usando como modelo uma biblioteca decDNA de plântulas de Oryza sativa feita sob encomenda (em pCMV Sport6.0; Invitrogen, Paisley, UK). PCR foi realizado usando Hifi Taq DNApolimerase em condições padrão, usando 200 ng de modelo em uma misturade PCR de 50 μΐ. Os iniciadores usados foram prm06808 (SEQ ID NO: 231;sentido, códon de início em negrito, sítio AttBl em itálico: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaagagcaggaagaacagc 3') andprm06809 (SEQ ID NO: 232; reverso, complementar, sítio AttB2 em itálico:5' ggggaccactttgtacaagaaagctgggtgcagagtgaaagagtggtgtg 3'), o que inclui ossítios AttB para recombinação Gateway. O fragmento de PCR amplificado foipurificado também usando métodos padrão. A primeira etapa doprocedimento Gateway, a reação BP5 foi então realizada, durante which ofragmento de PCR se recombina in vivo com o plasmídeo pDONR201 paraproduzir, de acordo com a terminologia Gateway, um "clone de entrada",pbHLH. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, comoparte da tecnologia Gateway®.

Exemplo 37: Construção de Vetor de Expressão

O clone de entrada p076 foi subseqüentemente usado em umareação LR com pGOS2, um vetor de destinação usado para transformação deOryza sativa. Este vetor contém como elementos funcionais dentro doslimites de T-DNA: um marcador selecionável vegetal; uma gaveta deexpressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor GOS2 de arroz (SEQ LD NO: 233,alternativamente, SEQ ID NO: 230 é igualmente útil) para expressãoconstitutiva (referência interna PROO129) foi localizado antes desta gaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressãoresultante pGOS2::bHLH (Figura 20) foi transformado em cepa LBA4044 deAgrobacterium e subseqüentemente para plantas de Oryza sativa.

Exemplo 38: Transformação de planta

Transformação de arroz

Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobaeterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.

Aproximadamente 30 transformantes TO de arrozindependentes foram gerados para uma construção. Os transformantesprimários foram transferidos de uma câmara de cultura de tecido para umacasa de vegetação. Depois de uma análise de PCR quantitativo para verificarnúmero de cópias do inserto de T-DNA, apenas plantas transgênicas de cópiaúnica que exibem tolerância ao agente de seleção foram mantidas paracolheita de semente TL Sementes foram então coletadas três a cinco mesesdepois de transplante. O método produziu transformantes de locus único emuma taxa de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei etal. 1994).

Transformação de milho

Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al 88 (University of Minnesota) ou híbridos com Al 88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de trigo

Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 °C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.

Transformação de soja

Transformação de colza/eanola

Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobaeterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.

Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 100 μτη de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Exemplo 39: Procedimento de avaliação39.1 Configuração de avaliação

39.2 Análise estastística: teste t e teste F

Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sereferem a plantas tratadas da mesma maneira que a planta transgênica, masdas quais o transgene foi segregado. Plantas nulas também podem serdescritas como as plantas transformadas negativas homozigotas. O limiar parasignificância para o teste t foi ajustado em um nível de probabilidade de 10%.Os resultados para alguns eventos podem estar acima ou abaixo deste limiar.Isto é baseado na hipótese de que um gene pode apenas ter um efeito emcertas posições no genoma, e que a ocorrência deste efeito dependente deposição não é incomum. Este tipo de efeito gênico é também chamado nestelugar de um "efeito de cepa do gene". O valor de ρ foi obtido comparando ovalor de t com a distribuição de t ou alternativamente, comparando o valor deF com a distribuição de F. O valor de ρ então gera a probabilidade de que ahipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.

Exemplo 40: Resultados de avaliação

Vigor precoce (se determinado por área aérea) foi visto emseis de sete eventos da geração TI, com um aumento geral em área aérea paraplântulas transgênicas de 22% comparado com plantas de controle. Quatrodestes eventos Tl foram adicionalmente avaliados na geração T2, e todosestes quatro eventos geraram um aumento em área aérea para plântulastransgênicas comparado com plantas de controle, com um aumento geral emárea aérea para plântulas transgênicas de 13% comparado com plantas decontrole. Os resultados também mostraram ser estatisticamente significantescom o valor de ρ do teste F sendo 0,0007 (geração T2) indicando que o efeitoobservado provavelmente é deivo ao transgene ao invés da posição do geneou um efeito de cepa.

Exemplo Seção F: SPL15

Exemplo 41: Identificação de seqüências relacionadas àseqüência de ácidos nucleicos usada nos métodos da invenção

Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas à seqüência de ácidos nucleicos usada nos métodosda presente invenção foram identificadas entre aquelas mantidas no banco dedados Entrez Nucleotides no National Center for Biotechnology Informationusando ferramentas de busca de seqüência de banco de dados, tal como aFerramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J.Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res.25:3389-3402). O programa é usado para encontrar regiões de similaridadelocal entre seqüências comparando seqüências de ácidos nucleicos oupolipeptídeos com banco de dados de seqüências e calculando a significânciaestatística de identidades. O polipeptídeo codificado pelo ácido nucleico dapresente invenção foi usado para o algoritmo TBLASTN, com configuraçõespadrão e o filtro para ignorar contrapeso de seqüências de baixacomplexidade. O resultado da análise foi visto por comparação pareada, eranqueado de acordo com o pontuação de probabilidade (valor E), onde opontuação reflete a probabilidade de que um alinhamento particular ocorra aoacaso (quanto menor o valor E, mais significante o acerto). Em adição avalores E, comparações também foram pontuadas por identidade percentual.

Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos)idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos)comparadas ao longo de um comprimento particular. Em algumas instâncias,os parâmetros padrão podem ser ajustados para modificar a estringência dabusca

A Tabela N abaixo fornece uma Iist de seqüências de ácidosnucleicos relacionadas à seqüência de ácidos nucleicos usada nos métodos dapresente invenção.

Tabela N: seqüências de ácidos nucleicos relacionadas àseqüência de ácidos nucleicos (SEQ ID NO: 234) usada nos métodos dapresente invenção, e os polipeptídeos deduzidos correspondentes

<table>table see original document page 303</column></row><table><table>table see original document page 304</column></row><table><table>table see original document page 305</column></row><table>

Exemplo 42: Determinação de similaridade e identidadeglobal entre fatores de transcrição SPLl 5, e seus SPL DBD.

Porcentagens globais de similaridade e identidade entre fatoresde transcrição SPL15 foram determinadas usando um dos métodosdisponíveis na arte, o aplicativo computacional MatGAT (Ferramenta deAlinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT:an application that generates similarity/identity matrices using protein orDNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativocomputacional hospedado por Ledion Bitincka). Aplicativo computacionalMatGAT gera matrizes de similaridade/identidade para seqüências de DNAou proteína sem precisar de pré-alinhamento dos dados. O programa realizauma série de alinhamentos pareados usando o algoritmo de alinhamentoglobal de Myers e Miller (com uma penalidade de abertura de lacuna de 12, euma penalidade de extensão de lacuna de 2), calcula similaridade e identidadeusando por exemplo Blosum 62 (para polipeptídeos), e então coloca osresultados em uma matriz de distância. Similaridade de seqüências é mostradana metade de baixo da linha divisora e identidade de seqüência é mostrada nametade de cima da linha divisora diagonal. A seqüência de SEQ ID NO: 235 éindicada como número 5 na matriz.

Parâmetros usados na comparação foram:

Matriz de pontuação: Blosum62

PrimeiraLacuna: 12

Lacuna de extensão: 2

Resultados da análise de aplicativo computacional sãomostrados em Tabela O para a similaridade e identidade global sobre ocomprimento completo dos polipeptídeos de fator de transcrição SPLl5.Identidade percentual é dada acima da diagonal e similaridade percentual édada abaixo da diagonal. Identidade percentual entre os parálogos e ortólogosde fator de transcrição SPL15 varia entre 30 e 70%, refletindo a conservaçãorelativamente baixa de identidade de seqüência entre eles fora do SPL DBD.

Tabela O: Resultados de MatGAT para similaridade eidentidade global sobre o comprimento completo dos polipeptídeos de fatorde transcrição SPL15.

<table>table see original document page 306</column></row><table>

Resultados da análise de aplicativo computacional sãomostrados em Tabela P para a similaridade e identidade global sobre o SPLDBD dos polipeptídeos de fator de transcrição SPL15. Identidade percentual édada acima da diagonal e similaridade percentual é dada abaixo da diagonal.

Identidade percentual entre o SPL DBD de parálogos e ortólogos de fator detranscrição SPL15 varia entre 70% e 100%.Tabela Ρ: Resultados de MatGAT para similaridade eidentidade global sobre o SPL DBD dos polipeptídeos de fator de transcriçãoSPL15.

<table>table see original document page 307</column></row><table>

Exemplo 43: Clonagem da seqüência de ácidos nucleicosusada nos métodos da invenção

Manipulação de DNA: a menos que de outra maneiradeterminado, técnicas de DNA recombinante são realizadas de acordo comprotocolos padrão descrito em (Sambrook (2001) Molecular Cloning: alaboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH,New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocolsin Molecular Biology, Current Protocols. Materiais e métodos padrão paratrabalho molecular com plantas são descritos em Plant Molecular BiologyLabfase (1993) por R.D.D. Croy, publicado por BIOS Scientific PublicationsLtd (UK) e Blackwell Scientific Publications (UK).

A seqüência de ácidos nucleicos usada nos métodos dainvenção foi amplificada por PCR usando como modelo uma biblioteca decDNA de tecidos misturados de Arabidopsis thaliana feita sob encomenda(em pCMV Sport 6.0; Invitrogen, Paisley, UK). PCR foi realizado usandoHifi Taq DNA polimerase em condições padrão, usando 200 ng de modeloem uma mistura de PCR de 50 μΐ. Os iniciadores usados foram prm07277(SEQ ID NO: 280; sentido, códon de início em negrito, sítio AttBl em letrasminúsculas: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaATGGAGTTGTTAATGTGTTCG3') e prm07278 (SEQ ID NO: 281; reverso, complementar, sítio AttB2 emletras minúsculas: 5'ggggaccactttgtacaagaaagctgggtTGATGAAGATCTTAAAAGGTGA 3'), oque inclui os sítios AttB para recombinação Gateway. O fragmento de PCRamplificado foi purificado também usando métodos padrão. A primeira etapado procedimento Gateway, a reação BP5 foi então realizada, durante a qual ofragmento de PCR se recombina in vivo com o plasmídeo pDONR201 paraproduzir, de acordo com a terminologia Gateway, um "clone de entrada",pSPL15. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, comoparte da tecnologia Gateway®.

Exemplo 44: Construção de Vetor de Expressão

O clone de entrada ρ 13075 foi subseqüentemente usado emuma reação LR com p06659, um vetor de destinação usado paratransformação de Oryza sativa. Este vetor contém como elementos funcionaisdentro dos limites de T-DNA: um marcador selecionável vegetal; uma gavetade expressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor HMGB de arroz (SEQ ID NO:294) para expressão constitutiva foi localizado antes desta gaveta Gateway.Alternativamente, o promotor HMGB representado por SEQ ID NO: 46 éigualmente útil. Uma construção similar foi feita com a seqüência decodificação de SPL15 sob controle do promotor constitutivo GOS2 (SEQ IDNO: 295).

Depois da etapa de recombinação LR, o vetor de expressãoresultante pHMGB::SPL15 (Figura 26), ou pGOS2::SPL15, foi transformadoem cepa LBA4044 de Agrobacterium e subseqüentemente para plantas deOryza sativa,.

Exemplo 45: Transformação de planta

Transformação de arroz

Cepa LBA4404 de Agrobaeterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.

Aproximadamente 35 transformantes TO de arrozindependentes foram gerados para uma construção. Os transformantesprimários foram transferidos de uma câmara de cultura de tecido para umacasa de vegetação. Depois de uma análise de PCR quantitativo para verificarnúmero de cópias do inserto de T-DNA, apenas plantas transgênicas de cópiaúnica que exibem tolerância ao agente de seleção foram mantidas paracolheita de semente TI. Sementes foram então coletadas três a cinco mesesdepois de transplante. O método produziu transformantes de locus único emuma taxa de até 50 % (Aldemita and Hodges 1996, Chan et ai. 1993, Hiei etai 1994).

Transformação de milho

Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 °C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Transformação de trigo

Transformação de soja

Transformação de colza/canola

Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobaeterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.

Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 100 μηι de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.

Exemplo 46: Procedimento de avaliação

46.1 Configuração de avaliação

Aproximadamente 35 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.

Cinco eventos Tl foram adicionalmente avaliados na geraçãoT2 seguindo o mesmo procedimento de avaliação que para a geração Tl mascom mais indivíduos por evento. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.

O vigor precoce é a área aérea de planta (plântula) trêssemanas após germinação. Aumento em biomassa de raiz é expresso comoum aumento em biomassa total de raiz (medida como biomassa máxima deraízes observada durante o tempo de vida de uma planta); ou como umaumento no índice raiz/parte aérea (medido como a proporção entre massaradicular e massa de parte aérea no período de crescimento ativo de raiz eparte aérea).

46.2 Análise estastística: teste F

Exemplo 4 7: Resultados de avaliação

A parte aérea de planta (ou biomassa de folhas) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.

Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A área aérea é omomento no qual a planta atingiu sua biomassa máxima de folhas.

Como apresentado em Tabelas Q a W, a biomassa aérea, onúmero de flores por panícula, a produção de sementes, o número total desementes, o número de grãos cheios, o peso de mil sementes (TKW) e índicede Colheita são aumentados nas plantas transgênicas com expressãoaumentada de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPLl5, comparados com plantas de controle adequadas.

Resultados das gerações Tl e T2 são mostrados.

Tabela Q mostra o número de eventos transgênicos com umaumento em biomassa aérea, a porcentagem deste aumento, assim como arelevância estatística deste aumento de acordo com o teste F.

Tabela Q: Número de eventos transgênicos com um aumentoem biomassa aérea, a porcentagem do aumento, e valor de P do teste F emgeração Tl e T2 de arroz transgênico com expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15.

<table>table see original document page 317</column></row><table>

Tabela R mostra o número de eventos transgênicos com umaumento em o número total de flores por panícula, a porcentagem desteaumento, assim como a relevância estatística deste aumento de acordo com oteste F.Tabela R: Número de eventos transgênicos com um aumentoem flores por panícula, a porcentagem do aumento, e valor de P do teste F emgeração Tl e T2 de arroz transgênico com expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15.

<table>table see original document page 318</column></row><table>

Tabela S mostra o número de eventos transgênicos com umaumento em produção total de sementes (peso total de semente), aporcentagem deste aumento, assim como a relevância estatística desteaumento de acordo com o teste F.

Tabela S: Número de eventos transgênicos com um aumentoem produção de sementes, a porcentagem do aumento, e valor de P do teste Fem geração Tl e T2 de arroz transgênico com expressão aumentada de umácido nucleico codificando um polipeptídeo de fator de transcrição SPL15.

<table>table see original document page 318</column></row><table>

Tabela T mostra o número de eventos transgênicos com umaumento no número total de sementes, a porcentagem deste aumento, assimcomo a relevância estatística deste aumento de acordo com o teste F.

Tabela T: Número de eventos transgênicos com um aumentoem número total de sementes, a porcentagem do aumento, e valor de P doteste F em geração Tl e T2 de arroz transgênico com expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcriçãoSPL15.

<table>table see original document page 318</column></row><table>

Tabela U mostra o número de eventos transgênicos com umaumento no número de grãos cheios, a porcentagem deste aumento, assimcomo a relevância estatística deste aumento de acordo com o teste F.

Tabela U: Número de eventos transgênicos com um aumentoem número de grãos cheios, a porcentagem do aumento, e valor de P do testeF em geração Tl e T2 de arroz transgênico com expressão aumentada de umácido nucleico codificando um polipeptídeo de fator de transcrição SPL15.

Número de grãos cheios Número de eventos mostrando um aumento % de Diferença Valor de P de teste FGeração Tl 6 de 7 14 0,0031Geração T2 4 de 5 19 0,0003

Tabela V mostra o número de eventos transgênicos com umaumento no índice de Colheita, a porcentagem deste aumento, assim como arelevância estatística deste aumento de acordo com o teste F.

Tabela V Número de eventos transgênicos com um aumentoem índice de Colheita, a porcentagem do aumento, e valor de P do teste F emgeração Tl e T2 de arroz transgênico com expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPLl5.índice de Col íeita

Tabela W mostra o número de eventos transgênicos com umaumento no peso de mil sementes (TKW), a porcentagem deste aumento,assim como a relevância estatística deste aumento de acordo com o teste F.

Tabela W: Número de eventos transgênicos com um aumentoem peso de mil sementes (TKW), a porcentagem do aumento, e valor de P doteste F em geração Tl e T2 de arroz transgênico com expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcriçãoSPL15.

Peso de mil sementes Número de eventos mostrando um aumento % de Diferença Valor de P de teste FGeração Tl 4 de 7 2 0,0041Geração T2 4 de 5 1 0,0259Exemplo 48: Resultados da avaliação fenotípica das plantastransgênicas expressando SEQID NO: 234 sob o controle de um promotorconstitutivo

Os resultados da avaliação de plantas transgênicas de arrozexpressando a seqüência de ácidos nucleicos útil para realizar os métodos dainvenção, sob o controle do promotor constitutivo GOS2, são apresentadosem Tabela X. A diferença percentual entre os transgênicos e os nulizigotoscorrespondentes também é mostrada.

As plantas transgênicas expressando a seqüência de ácidosnucleicos útil para realizar os métodos da invenção, têm vigor precoceaumentado e TKW aumentado comparadas com as plantas de controle (nestecaso, os nulizigotos).

Tabela X: Resultados da avaliação de plantas transgênicas dearroz de geração Tl expressando a seqüência de ácidos nucleicos útil pararealizar os métodos da invenção, sob o controle de um promotor constitutivoGOS2 forte.

<table>table see original document page 320</column></row><table>LISTAGEM DE SEOÜENCIAS

<110> CropDesign N.V.

<120> Plantas tendo características relacionadas a rendimento melhoradase um método para fazer as mesmas

<130> PF58328<160> 301

<170> PatentIn versão 3.3<210> 1<211> 630<212> DNA

<213> Arabidopsis thaliana<400> 1

atggagaatg ggaaaagaga cagacaagac atggaagtga ataccacacc gaggaagcct 60

cgtgtactac tcgctgcaag tggaagcgtc gctgctatca aattcggcaa tctctgccat 120tgcttcaccg aatgggcaga agtcagagcc gtcgttacga aatcatctct acatttcctc 180gataaactct ctctcccaca agaagtgact ctgtatactg atgaagatga atggtctagc 240tggaacaaga tcggtgatcc tgtccttcac atcgagctta gacgttgggc tgatgtttta 300gtcattgctc ctttgtctgc taacacctta ggcaagattg ctggtgggct ttgtgataat 360cttctgactt gcattatacg agcttgggac tataccaaac cactgtttgt tgctccagct 420atgaatactt tgatgtggaa caatcctttc actgaaaggc atcttttgtc tcttgatgaa 480ctgggaatca cacttattcc tcctatcaag aagagacttg cctgtggaga ctacggtaat 540ggagctatgg ctgagccctc tcttatctat tccactgtca gactcttctg ggagtctcag 600gctcatcagc aaaccggtgg aactagttaa 630

<210> 2

<211> 209

<212> PRT

<213> Arabidopsis thaliana

<400> 2

Met Glu Asn Gly Lys Arg Asp Arg Gln Asp Met Glu Val Asn Thr Thr1 5 10 15

Pro Arg Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala Ala

20 25 30

Ile Lys Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu Val

35 40 45

Arg Ala Val Val Thr Lys Ser Ser Leu His Phe Leu Asp Lys Leu Ser

50 55 60

Leu Pro Gln Glu Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser Ser65 70 75 80

Trp Asn Lys Ile Gly Asp Pro Val Leu His Ile Glu Leu Arg Arg Trp

85 90 95

Ala Asp Val Leu Val Ile Ala Pro Leu Ser Ala Asn Thr Leu Gly Lys

100 105 110

Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Ile Arg Ala

115 120 125

Trp Asp Tyr Thr Lys Pro Leu Phe Val Ala Pro Ala Met Asn Thr Leu

130 135 140

Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu Leu Ser Leu Asp Glu145 150 155 160

Leu Gly Ile Thr Leu Ile Pro Pro Ile Lys Lys Arg Leu Ala Cys Gly

165 170 175

Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile Tyr Ser Thr

180 185 190

Val Arg Leu Phe Trp Glu Ser Gln Ala His Gln Gln Thr Gly Gly Thr195 200 205

Ser

<210> 3<211> 37<212> DNA

<213> Seqüência artificial<220><223> iniciador: prm00957<400> 3

aaaaagcagg ctcacaatgg agaatgggaa aagagac<210> 4<211> 33<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: prm00958<400> 4

agaaagctgg gttggtttta actagttcca ccg<210> 5<211> 1243<212> DNA

<213> Oryza sativa<400> 5

aaaaccaccg agggacctga tctgcaccgg ttttgatagtgttttccgat cgagggacga aaatcggatt cggtgtaaagttattccgga gcatgattgg gaagggagga cataaggcccgtccagatct ccagatcact cagcaggatc ggccgcgttcttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgccgcacgccgcc gccgccgacc cggctctgcg tttgcaccgcatagatagct actactctct ccgtttcaca atgtaaatcaatattgatgt taatgaatat agacatatat atctatttagatgtaggaaa tgctagaatg acttacattg tgaattgtgatggatggatg caggatcatg aaagaattaa tgcaagatcgttactaattg cgctgcatat atgcatgaca gcctgcatgcccattaggaa gtaaccttgt cattacttat accagtactatcatgagcaa atctacaaaa ctggaaagca ataaggaatacattaatcac caaatatttc gccttctcca gcagaatatatgtacacact gacagtgtac gcataaacgc agcagccagcgcacactggc cttccatctc aggctagctt tctcagccacgcgcgcgcac aggcacaaat tacgtacaaa acgcatgaccgaatcgctcc cgcgcgcggc ggcggcgcgc acgtacgaatccacgacacg atcgcgcgcg acgccggcga caccggccatccgactataa atacgtaggc atctgcttga tcttgtcatcaggaaaaaaa aacaaaacac accaagccaa ataaaagcga<210> 6<211> 34<212> PRT

<213> Seqüência artificial<220>

<223> motivo conservado 1<220>

<221> VARIANTE<222> (1)..(1)<223> /substituir = "Arg"<220>

<221> VARIANTE

<222> (4) . . (4)

<223> /substituir = "lie"

<220>

<221> VARIANTE

<222> (9)..(9)

<223> /substituir = "Thr"

<220>

<221> VARIANTE

<222> (14)..(14)

<223> /substituir = "Ser"

<220>

<221> VARIANTE<222> (15)..(15)

<223> /substituir = "Met" /substituir = "Val'

37

33

tgagggaccc gttgtgtctg 60ttaagggacc tcagatgaac 120atgtcgcatg tgtttggacg 180gcgtagcacc cgcggtttga 240gtagcttccg ccggaagcga 300cttgcacgcg atacatcggg 360ttctactatt ttccacattc 420attcattaac atcaatatga 480aatggacgaa gtacctacga 540tatctgccgc atgcaaaatc 600gggcgtgtaa gcgtgttcat 660catactatat agtattgatt 720cgggactgga aaagactcaa 780tatctctcca tcttgatcac 840ttaactgtcg tctcaccgtc 900ccatcgtaca tgtcaactcg 960aaatcaaaac caccggagaa 1020gcacgcacgc acgcccaacc 1080ccacccgcgc cctcacctcg 1140catctcacca ccaaaaaaaa 1200caa 1243<220><221><222><223><220><221><222>

VARIANTE(18)..(18)/substituir

"Glu" /substituir = "Ala" /substituir = "Ser"

VARIANTE(21)..(21)<223> /substituir = "Vai"<220>

VARIANTE(22) . . (22)/substituir

<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222>

VARIANTE(23)..(23)/substituir

VARIANTE

(25)..(25)/substituir

VARIANTE

(26) . . (26)/substituir

"Arg" /substituir = "Gly"

= "Ser" /substituir = "lie"

= "Ser"

VARIANTE(29) . . (29)<223> /substituir<220>

VARIANTE(31)..(31)/substituir

<221><222><223><220><221><222><223><400>

VARIANTE(34)..(34)/substituir6

= "Asp"

"Asp"

= "Lys"

= "Ala"

Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala Ala Ile Lys15 10 15

Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu Val Arg Ala20 25 30

Val Val

<210> 7<211> 98<212> PRT

<213> Seqüência artificial<220>

<223> motivo conservado 2<220>

<221> VARIANTE<222> (8)..(8)<223> /substituir<220>

<221> VARIANTE<222> (12)..(12)<223> /substituir = "lie"<220>

<221> VARIANTE

<222> (13)..(13)

<223> /substituir = "Met"

<220>

<221> VARIANTE

"Lys" /substituir = "Gln"<222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223>

(14) .. (14)/substituir

VARIANTE(24) . . (24)/substituir

VARIANTE(30)..(30)/substituir

VARIANTE

(38) . . (38)

/substituir

VARIANTE

(39)..(39)/substituir

VARIANTE(44) . . (44)/substituir

= "lie"

= "Ala"

= "Met"

= "Vai"

"Vai"

= "Phe"

VARIANTE(45)..(45)/substituir/substituir ="Lys "

<220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220>

= "Ser" /substituir = "Asn" /substituir

"Asp"

VARIANTE(48) . . (48)/substituir

VARIANTE(50)..(50)/substituir

VARIANTE(57)..(57)/substituir

VARIANTE(60)..(60)/substituir

VARIANTE

(65)..(65)

/substituir

VARIANTE

(66)..(66)/substituir

VARIANTE(68) . . (68)/substituir

= "Phe" /substituir = "Met" /substituir = "lie"

= "Ala"

= "Phe"

= "Ser"

"Ser" /substituir = "Gln" /substituir = "Ala"

"Lys"

"Phe" /substituir = "He"

<221> INSEGURO<222> (69)..(70)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>

<221> VARIANTE<222> (71)..(71)

<223> /substituir = "lie" /substituir = "Met"<220>

<221> VARIANTE<222> (72)..(72)

<223> /substituir = "Asn" /substituir = "Ser"<220>

<221> VARIANTE<222> (73)..(73)

<223> /substituir = "Leu" /substituir = "Gln"<220>

<221> VARIANTE

<222> (74) .. (74)

<223> /substituir = "Met"

<220>

<221> VARIANTE

<222> (76)..(76)

<223> /substituir = "Vai"

<220>

<221> VARIANTE<222> (77)..(77)

<223> /substituir = "Ser" /substituir = "Ala" /substituir = "lie"<220>

<221> VARIANTE

<222> (79)..(79)

<223> /substituir = "Vai"

<220>

<221> VARIANTE<222> (82) .. (82)

<223> /substituir = "Vai" /substituir = "Thr"<220>

<221> VARIANTE<222> (83)..(83)

<223> /substituir = "Thr" /substituir = "Ser"<220>

<221> VARIANTE<222> (85)..(85)

<223> /substituir = "Thr" /substituir = "Lys"<220>

<221> VARIANTE<222> (91)..(91)<223> /substituir = "His"<220>

<221> VARIANTE<222> (93)..(93)<223> /substituir = "Thr"<220>

<221> VARIANTE<222> (97)..(97)<223> /substituir = "Ser"<400> 7

Val Leu His Ile Glu Leu Arg1 5

Pro Leu Ser Ala Asn Thr Leu20

Asn Leu Leu Thr Cys Ile Ile35

Phe Val Ala Pro Ala Met Asn

50 55

Glu Arg His Leu Xaa Xaa Leu65 70

Pro Ile Lys Lys Arg Leu Ala85

Arg Trp Ala10

Gly Lys Ile25

Arg Ala Trp40

Thr Leu Met

Asp Glu Leu

Cys Gly Asp90

Asp Val Leu

Ala Gly Gly

Asp Tyr Thr45

Trp Asn Asn60

Gly Ile Thr75

Tyr Gly Asn

Val Ile Ala15

Leu Cys Asp30

Lys Pro Leu

Pro Phe Thr

Leu Ile Pro80

Gly Ala Met95Ala Glu

<210> 8<211> 171<212> PRT

<213> Arabidopsis thaliana<400> 8

Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala

1 5 10

Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu

20 25

Val Val Thr Lys Ser Ser Leu His Phe Leu Asp Lys Leu

35 40 45

Gln Glu Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser

50 55 60

Lys Ile Gly Asp Pro Val Leu His Ile Glu Leu Arg Arg65 70 75

Val Leu Val Ile Ala Pro Leu Ser Ala Asn Thr Leu Gly

85 90

Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Ile Arg

100 105

Tyr Thr Lys Pro Leu Phe Val Ala Pro Ala-Met Asn Thr115 120 125

Asn Asn Pro Phe Thr Glu Arg His Leu Leu Ser Leu Asp

130 135 140

Ile Thr Leu Ile Pro Pro Ile Lys Lys Arg Leu Ala Cys145 150 155

Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile165 170

<210> 9<211> 606<212> DNA

<213> Arabidopsis thaliana<400> 9

atgaatatgg aagtggatac agtaacaagg aagcctcgtaagtgtggctt caattaagtt cagtaatctc tgccattgttaaagccgtcg cttcaaaatc atctctcaat ttcgttgatagtgactctct atacagatga agatgaatgg tctagctggacttcatatcg agctcagacg ctgggctgat gttatgatcaacattagcca agattgctgg tgggttatgt gataatctattgggattata gcaaaccgtt gtttgttgca ccggcgatgacctttcacag aacggcacct tgtcttgctt gatgaacttgatcaagaaga aactggcctg tggagactac ggtaatggcgatttattcca ctgttagact gttctgggag tcacaagctcagttga<210> 10<211> 201<212> PRT

<213> Arabidopsis thaliana<4 00> 10

Met Asn Met Glu Val Asp Thr Val Thr Arg Lys Pro Arg

1 5 10 Ala Ala Ser Gly Ser Val Ala Ser Ile Lys Phe Ser Asn

20 25

Cys Phe Ser Glu Trp Ala Glu Val Lys Ala Val Ala Ser

35 40 45

Leu Asn Phe Val Asp Lys Pro Ser Leu Pro Gln Asn Val

50 55 60

Thr Asp Glu Asp Glu Trp Ser Ser Trp Asn Lys Ile Gly65 70 75

Leu His Ile Glu Leu Arg Arg Trp Ala Asp Val Met Ile

85 90

Leu Ser Ala Asn Thr Leu Ala Lys Ile Ala Gly Gly Leu

Ala Ile Lys1 5

Val Arg Ala30

Ser Leu Pro

Ser Trp Asn

Trp Ala Asp80*

Lys Ile Ala95

Ala Trp Asp110

Leu Met Trp

Glu Leu Gly

Gly Asp Tyr160

tcttactagctctcagaatgaaccttctctacaagattggttgctccttttgacatgtatacactttgatgaatcaccctcaatggctgagtaaacaaag

tgcaagtggaggctgaagtcacctcagaattgatcccgttgtctgctaacagtaagagcagtggaacaataattcctcccgccttctctgagatggaacc

Ile Leu Leu1 5

Leu Cys His30

Lys Ser Ser

Thr Leu Tyr

Asp Pro Val80

Ile Ala Pro95

Cys Asp Asn

60120180240300360420480540600606105

Ile Val Arg Ala Trp Asp Tyr120

Val Ala Pro Ala Met Asn Thr Leu Met Trp Asn

100

Leu Leu Thr Cys115

130

135

Arg His Leu Val Leu Leu Asp Glu Leu Gly Ile145 150 155

Ile Lys Lys Lys Leu Ala Cys Gly Asp Tyr Gly

165 170

Glu Pro Ser Leu Ile Tyr Ser Thr Val Arg Leu

180 185

Ala Arg Lys Gln Arg Asp Gly Thr Ser195 200

<210> 11

<211> 1128

<212> DNA

<213> Oryza sativa

<4 00> 11

caaccaaagt ccaaaggcta ttctgaaccg aagtcctcccccgtcgcggc accctcctcc gccgccggat ctccaccggatcctcccccg gatcttcacc gccggtgaag tactgaggtgacaagaaacc ttgggattgg atttccctca tcctagcaaactctggaagc gtcgctgcta taaaatttga gagcctttgcagaagtcaga gccgtcgcca ccaaggcttc attacatttttagcaatatt attctttaca ctgatgatga tgaatggtcttgaagttttg cacattgaac tgcgaaaatg ggcagatatcagctaatacc ctagctaaga ttgctggtgg tttatgtgacgagagcatgg gactacagca aaccactctt tgttgccccagaacaacccg ttcaccagtc gtcatcttga gacaatcaacccctcccatt accaaaaggc tggcctgtgg tgattatggtttctgtgatc gattccaccg tcaggcttgc ttgcaagagattcacctgtg gttcctgccg gcagaaacct cccatctagctcaagattaa actctggacc tagttttcta tggtaaagagaatgttaagt gatgtctatg tcggccaaca tagcacctttctattagtga tatggtagga cgtggagatt ggagaaaggcgttgcttttc caaatttctt gtgacataat gctaaggtgctagcactatt tttttctgca aatgtttgca aagactcgtg<210> 12<211> 220<212> PRT

<213> Oryza sativa<4 00> 12

Met Thr Thr Ser Glu Ser Val Gln Glu Thr Leu1 5

110

Ser Lys Pro Leu Phe125

Asn Pro Phe Thr Glu140

Thr Leu Ile Pro Pro160

Asn Gly Ala Met Ala175

Phe Trp Glu Ser Gln190

acaccaaaacgtacggcgccatgactacatcctcgggtcccgtagcttctattgatagaaacctggaagaatggtgattgaacctcttgagctatgaacactgctaggtaaatggtgcaacagccacttatgatgcggcatacttcgtgtattggccagttattgtcccatgatgaatatatggaatc

ttcgaggccc

ggccaccccc

cagagtcagt

tccttgctgc

cggaatgggc

cgtctctgcc

agatagggga

cgccattatc

catgcatagt

ccttcatgtg■

tatctttggt

tggctgagcc

atacaaatag

actattctgt

cacaaaatga

tgttgtacta

gcactttaat

gttcatgttg

Gly Leu

His Pro Ser Lys Pro Arg Val Leu Leu Ala Ala Ser Gly

10

20

25

Ala Ile Lys Phe Glu Ser Leu Cys Arg Ser Phe

35

IO

Val Arg Ala Val Ala Thr Lys Ala Ser Leu His

50

55

Ser Leu Pro Ser Asn Ile Ile Leu Tyr Thr Asp

65 70 75

Thr Trp Lys Lys Ile Gly Asp Glu Val Leu His

85 90

Trp Ala Asp Ile Met Val Ile Ala Pro Leu Ser

100 105

Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu

115 120

Ala Trp Asp Tyr Ser Lys Pro Leu Phe Val Ala

130 135

Phe Met Trp Asn Asn Pro Phe Thr Ser Arg His

145 150 155

Leu Leu Gly Ile Ser Leu Val Pro Pro Ile Thr Lys Arg

Ser Glu

45Phe Ile60

Asp Asp

Ile Glu

Ala Asn

Thr Cys125Pro Ala140

Leu Glu

Asp Phe Pro15

Ser Val Ala30

Trp Ala Glu

Asp Arg Thr

Glu Trp Ser80

Leu Arg Lys95

Thr Leu Ala110

Ile Val Arg

Met Asn Thr

Thr Ile Asn160

Leu Ala Cys

60120180240300360420480540600660720780840900960102010801128165 170

Gly Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro

180 185

Thr Val Arg Leu Ala Cys Lys Arg Gln Pro Leu

195 200

Pro Val Val Pro Ala Gly Arg Asn Leu Pro Ser

210 215

<210> 13<211> 1164<212> DNA<213> Triti<400> 13gcacgagcagtccagttgaggtggtgcactgccgctataagtggccaccactttacactgatcgagctgcgctaagatcgtacagcaaacacggagcggcaaaaggctggacttccgtgacctgtcagtataggaatttgtagtgtttgttcctccctgcatgctacaatatagcttcctgaagtgtccactgtcctaaa<210> 14<211> 220<212> PRT<213> Triti<400> 14Met Ala Thr1

Gln Pro Ser

175

Ser Val Ile Asp Ser190

Asn Thr Asn Ser Ser205

Ser220

ccgcggagcccggttcaagcactcacaaccaatttgagagcgccatccttatgacgatgaggaaatgggcccggtgggttcgctctttgtatcttcacaccctgtggcgaggctcgcgtgataaccggccttttatatgcgtgtattgaatcagtaattaattgtttgttccctgcccaggcaaacttttaaaaaaaaaa

gccagagacaagagctgatgtagtaggccccctttgccgtgcacttcgttatggtctaccagacgttatgatgcgacaactgccccagccaatcaaccaattacgggaaccaagacgcaaatctagctgaagtgtgcatcattgggggggtgagtctatttgtgtgtgtgccagtaatgactactaccct

gacgctgccggctacatcagcgggtcctccagcttctctggatagatcattggaagaagagtgatcgctcctcttgacctatgaacacgtctgggcatagggcgcaatggccgcacgatgtgcagcagtttggagtgttgaaaggctgttcagtttgtaatgggagttggtagtgattatttgatattcc

ccgtcggccgagccagtacattgctgcttcagtgggcggactctaccaagtaggagatgacattgtcagcgcatcgtgagtaatgtggaaccttgatcccccgaaacctccgagcagttcggccacttgataacagatttgtcacaggatttgtcggtggggagtgctgctcagtttgtatggtacaaat

tcctccgcccagagagtttgaggaagtgtatgtccgagcttggcatcgttagtcttacacaaataccctgagcgtgggaccaacccattccccagttaccgcagatccatactcgcgggtttgtcaagcttttttccaacaacaataactgagtacaatttgccacagaggttgtcagtggttggaacga

Ala

Val

Ser

65

Thr

Trp

Lys

Ala

Leu145Gln

Gly

Ser

Ile Lys35

Arg Ala50

Leu Pro

Trp Lys

Ala Asp

Ile Ala115Trp Asp130

Met Trp

Leu Gly

Asp Tyr

Val Arg195

cum aestivum

Ser Glu Pro5

Arg Pro Arg20

Phe Glu Ser

Val Ala Thr

Ser Gly Ile70

Lys Ile Gly85

Val Met Val100

Gly Gly Leu

Tyr Ser Lys

Asn Asn Pro150

Ile Ala Leu

165Gly Asn Gly180

Leu Ala Cys

Val Gln

Val Leu

Leu Cys

40Thr Pro55

Val Leu

Asp Glu

Ile Ala

Cys Asp120Pro Leu135

Phe Thr

Ile Pro

Ala Met

Lys Thr200

Glu Ser Leu10

Leu Ala Ala25

Arg Ser Phe

Ser Leu His

Tyr Thr Asp75

Val Leu His90

Pro Leu Ser105

Asn Leu Leu

Phe Val Ala

Glu Arg His155

Pro Val Thr170

Ala Glu Thr185

Gln Pro His

Val Val

Ser Gly

Ser Glu

45Phe Val60

Asp Asp

Ile Glu

Ala Asn

Thr Cys125Pro Ala140

Leu His

Lys Arg

Ser Gln

Asp Ala205

His Tyr Ser15

Ser Val Ala30

Trp Ala Asp

Asp Arg Ser

Glu Trp Ser80

Leu Arg Lys95

Thr Leu Ala110

Ile Val Arg

Met Asn Thr

Thr Ile Asn160

Leu Ala Cys

175Ile His Thr190

Ser Ser Ser

601201802403003604204805406006607207808409009601020108011401164Leu Ala Gly Pro Val Ser Asn Asn Arg Pro Ser Ser210 215 220

<210> 15<211> 1165<212> DNA<213> Zea mays<4 00> 15

gcacgaggtc agatcgacct ggactttggc ggcagctact tctagaacgc ggcggcacggcagcaagcca gcaaggagaa cgcggcggca cgggcgtgct gctacttctg cttcctctccgacgcttgct gttgagcggt tcaagcagag ctgatggcta catcagagcc agtacaagagagtttggtgg tgcactactc acaacctagt aggccccggg tcctccttgc tgcttcaggaagtgtagccg ctataaaatt tgagagcctt tgccgtagct tctctgagtg ggcggatgtccgagctgtgg ccaccacgcc atccttgcac ttcgttgata gatcatctct accaagtggcatcgttcttt acactgatga cgatgaatgg tctacctgga agaagatagg agatgaagtcttacacatcg agctgcggaa atgggcagac gttatggtga tcgctccatt gtcagcaaataccctggcta agatcgccgg tgggttatgc gacaacctct tgacctgcat cgtgagagcgtgggactaca gcaaaccgct ctttgttgcc ccagccatga acacgttaat gtggaacaacccattcacgg agcggcatct tcacacaatc aaccaactgg gcatagcctt gatccccccagttaccaaaa ggctggcctg tggcgattac gggaacggcg caatggccga aacctcgcagatccatactt ccgtgaggct cgcgtgcaag acgcaaccgc acgatgcgag cagttcactcgcgggtcctg tcagtaataa ccggccatct agctgatgca gcagttggcc acttgattgtcaagcttagg aatttgtttt atatgcagtg tgcatctgga gtgttgtaac agattttttttccaactagt gtttgtgtgt attgaaattg ggggggaaag gctgttgtca caggataacaataacttcct ccctgctcag taattatgag tctattcagt ttgtaattgt cggtgggagtacaattatgc tacaatattg tttgtttgtg tgtgtgtggg agttggggag tgctgctgccacagagatag cttcctccct gcccagccag taatgatagt gattattcag tttgtaaaaaaaaaaaaaaa aaaaaaaaaa aaaaa<210> 16<211> 220<212> PRT<213> Zea mays<4 00> 16

Met Ala Thr Ser Glu Pro Val Gln Glu Ser Leu Va:15 10

Gln Pro Ser Arg Pro Arg Val Leu Leu Ala Ala Se]

20 25

Ala Ile Lys Phe Glu Ser Leu Cys Arg Ser Phe Se:

35 40

Val Arg Ala Val Ala Thr Thr Pro Ser Leu His Phi50 55 60

Ser Leu Pro Ser Gly Ile Val Leu Tyr Thr Asp Asi65 70 75

Thr Trp Lys Lys Ile Gly Asp Glu Val Leu His Ile

85 90

Trp Ala Asp Val Met Val Ile Ala Pro Leu Ser Alc

100 105

Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thi

115 120 125

Ala Trp Asp Tyr Ser Lys Pro Leu Phe Val Ala Pro Ala Met Asn Thr

130 135 140

Leu Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu His Thr Ile Asn145 150 155 160

Gln Leu Gly Ile Ala Leu Ile Pro Pro Val Thr Lys Arg Leu Ala Cys

165 170 175

Gly Asp Tyr Gly Asn Gly Ala Met Ala Glu Thr Ser Gln Ile His Thr

180 185 190

Ser Val Arg Leu Ala Cys Lys Thr Gln Pro His Asp Ala Ser Ser Ser

195 200 205

Leu Ala Gly Pro Val Ser Asn Asn Arg Pro Ser Ser210 215 220

<210> 17<211> 631<212> DNA

Val His Tyr Ser 15 Gly Ser Val Ala 30 Glu Trp Ala Asp45 Val Asp Arg SerAsp Glu Trp Ser 80Glu Leu Arg Lys 95 Asn Thr Leu Ala 110 Cys Ile Val Arg

601201802403003604204805406006607207808409009601020108011401165<213> Picea abies<220>

<221> misc_feature<222> (546)..(546)<223> η é a, c, g, ou t<400> 17

ggacgcgtgg gtactgtact gcatatagaa ctccggcaatgctccactat cagcaaacac gcttgctaag atagcaggtgacttgcataa tacgtgcatg ggactttaac aagcctctctactttcatgt ggaacaaccc atttactcaa cggcatttgggtatcactta tcccccctat aacaaagacg ttagcttgtgatgtcagaac cttcctcaat agatacaact cttaggtttttgaagtatct gatctccctt tctccaattc ttgttatgaaggactgtggt atagactcag attcgtagct gggctagacatggctatgtt aagaaattct gatgataaac aatctcgaacgttccnccat tctggacact tacaagaact gtgtggatacgtcaatctac attgcatatc atctaatttg g<210> 18<211> 120<212> PRT<213> Picea abies<4 00> 18

Gly Arg Val Gly Thr Val Leu His Ile Glu Leu15 10

Ala Met Val Ile Ala Pro Leu Ser Ala Asn Thr

20 25

Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile

35 40

Phe Asn Lys Pro Leu Phe Val Ala Pro Ala Met

50 55

Asn Asn Pro Phe Thr Gln Arg His Leu Asp Ser65 70 75

Val Ser Leu Ile Pro Pro Ile Thr Lys Thr Leu

85 90

Gly Asn Gly Ala Met Ser Glu Pro Ser Ser Ile

100 105

Phe Ser Leu Asp Pro Ser Ile Lys115 120

<210> 19<211> 769<212> DNA

<213> Brassica napus<4 00> 19

gagatctgta agggttttca aaaagagcca tggagaacggtggaagtgca gctctcccct agaaagcccc gcgtactcctccgccatcaa attcggcaac ctctgccact gcttcacagatcgtctcgaa atcgtctctc cacttcctcg acaagctctctctacaccga cgaagacgag tggtcgagct ggaacaagattcgagctcag acgctgggct gacgtcatgg tcatcgctccccaagatagc tggtgggatg tgtgataatc ttctgacttgatagcaaacc gcttttcgtt gcgccggcta tgaatactttcggagaggca tcttttgtcg cttgatgagc ttggaatcacagaggttggc ttgtggtgac tatggtaatg gcgcgatggcccactgttag actcttctgg gagtctcagg ctcatcagcaaccatgatgg ttttgcactt tgcaatggtt ggtcagtgtctgctcgtcct tgtatatgtt aagaacagct gtctgggttg<210> 20<211> 209<212> PRT

<213> Brassica napus<400> 20

Met Glu Asn Gly Lys Arg Asp Arg Glu Asp Met15 10

gggctgatgcgcctatgcgattgtagctccactctatctcgtgattatggcactcgatcctctaacatgcgcatgaacccttatgatttatcctgcttat

tatggtgattcaatctactgtgcaatgaatggagatgggaaaatggtgcattcaattaaattagtactatagctcgtgtgtgtaacatttaagaaaatgt

Arg Gln

Leu Ala

Ile Arg

45Asn Thr60

Ile SerAla CysAsp Thr

Trp Ala Asp15

Lys Ile Ala30

Ala Trp Asp

Phe Met Trp

Glu Met Gly80

Gly Asp Tyr95

Thr Leu Arg110

gaaaagagaccgcagcaaccgtgggcggaatctcccacagcggcgatccctttgtctgcttatcataagagatgtggaactcttattccttgagccgtctaagtggtggaatagattgttatgtctctt

agagaagacaggaagcgtcggtgagagccggaagtgactcgtgcttcacaaacactttaggcttgggattaatccttttaccgatcaagacttatctattactagttaatctgtctgaaa

60120180240300360420480540600631

60120180240300360420480540600660720769

Glu Val Gln Leu Ser15Pro Arg Lys Pro 20 Arg Val Leu Leu Ala 25 Ala Thr Gly Ser Val 30 Ala AlaIle Lys Phe 35 Gly Asn Leu Cys His 40 Cys Phe Thr Glu Trp 45 Ala Glu ValArg Ala 50 Val Val Ser Lys Ser 55 Ser Leu His Phe Leu 60 Asp Lys Leu SerLeu Pro Gln Glu Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser Ser65 70 75 80Trp Asn Lys Ile Gly 85 Asp Pro Val Leu His 90 Ile Glu Leu Arg Arg 95 TrpAla Asp Val Met 100 Val Ile Ala Pro Leu 105 Ser Ala Asn Thr Leu 110 Ala LysIle Ala Gly 115 Gly Met Cys Asp Asn 120 Leu Leu Thr Cys Ile 125 Ile Arg AlaTrp Asp 130 Tyr Ser Lys Pro Leu 135 Phe Val Ala Pro Ala 140 Met Asn Thr LeuMet Trp Asn Asn Pro Phe Thr Glu Arg His Leu Leu Ser Leu Asp Glu145 150 155 160Leu Gly Ile Thr Leu 165 Ile Pro Pro Ile Lys 170 Lys Arg Leu Ala Cys 175 GlyAsp Tyr Gly Asn 180 Gly Ala Met Ala Glu 185 Pro Ser Leu Ile Tyr 190 Ser ThrVal Arg Leu 195 Phe Trp Glu Ser Gln 200 Ala His Gln Gln Ser 205 Gly Gly Thr

Ser

<210> 21

<211><212>

<222>

636DNA

<213> Brassica oleracea var. alboglabra<220>

<221> misc_feature(622)..(622)

c, g, ou t

<223> η é a,<400> 21

gacgcgtggg cggacgcgtg gggggttttc aaaaagagcc atggagaacg

cagagaagac atggaagtgc agctctcccc tagaaagccc cgcgtactcc

cggaagcgtc gccgccatca aattcggcaa cctctgccac tgcttcacag

agtgagagcc gtcgtctcga aatcgtctct ccacttcctc gacaagctct

ggaagtgact ctctacaccg acgaagacga gtggtcgagc tggaacaaga

cgtgcttcac atcgagctca gacgctgggc tgacgtcatg gtcatcgctc

taacacttta gccaagatag ctggtgggat gtgtgataat cttctgactt

agcttgggat tatagcaaac cgcttttcgt tgcgccggct atgaatactt

caatcctttt acggagaggc atcttttgtc gcttgatgag cttggaatca

tccgatcaag aagaggttgg cttgtggtga ctatggtaat ggcgcgatgg

tcttatctat tccactgtta gnctcttctg ggagtc<210> 22

ggaaaagagatcgcagcaacagtgggcggactctcccacatcggcgatccctttgtctgcgtatcataagtgatgtggaactcttattccctgagccgtc

<211><212>

198PRT

alboglabra

<221><222>

<213> Brassica oleracea var.<220>

INSEGURO(194)..(194)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 22

Met Glu Asn Gly Lys Arg Asp Arg Glu Asp Met Glu Val Gln Leu Ser15 10 15

Pro Arg Lys Pro Arg Val Leu Leu Ala Ala Thr Gly Ser Val Ala Ala

20 25 30

Ile Lys Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu Val

35 40 45

Arg Ala Val Val Ser Lys Ser Ser Leu His Phe Leu Asp Lys Leu Ser50 55 60

60120180240300360420480540600636Leu Pro Gln Glu Val Thr Leu Tyr Thr Asp Glu65 70 75

Trp Asn Lys Ile Gly Asp Pro Val Leu His Ile

85 90

Ala Asp Val Met Val Ile Ala Pro Leu Ser Ala

100 105

Ile Ala Gly Gly Met Cys Asp Asn Leu Leu Thr

115

120

Trp Asp Tyr Ser Lys Pro Leu Phe Val Ala Pro

130

135

Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu145 150 155

Leu Gly Ile Thr Leu Ile Pro Pro Ile Lys Lys

165 170

Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser

180 185

Val Xaa Leu Phe Trp Glu195

<210> 23<211> 958<212> DNA

<213> Nicotiana tabacum<400> 23

ggagctgtgt tgccgcagaa ggagcaagaa ttgttggtgcatttaattcc tagcagattt gatttagatt agggtagataccggttcaga ttaacaatgc accgaggaga cctcgcattcgtggctgcta tcaagtttgc cagtctatgc cgttcctttagcggttgcta caaaagcttc tcttcatttc atagacaaagattctttata ctgatgagga tgaatggtca acttggacgacacatcgagc tccggaggtg ggctgatatt atgattattgcttgggaaga ttgctggtgg actatgtgat aacttgttaagactacgata aacccctttt cgtggcacca gcaatgaatattcacagaaa agcaccttat ggcaattgat gagcttgggatcaaagagac tagcctgtgg agattacggg aatggagcaattccaagctg taagactcta ttatgacgca caattacgattgatccacag gtcatgaaat ttcattcatc ggtttgtacattcaggacca ggagcccagc tgtgttattt ttctcctaaatttcttgtgt cctagagcta ctttcaatca aggttcatgtagaatatcac gtaactgctg ttactaatgg atgtgatcat<210> 24<211> 207<212> PRT

<213> Nicotiana tabacum<400> 24

Met Glu Thr Ser Glu Met Glu Pro Val Gln Ile1 5 10

Arg Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser

Asp

Glu

Asn

Cys

Ala140Leu

Arg

Leu

Glu Trp

Leu Arg

Thr Leu110Ile Ile125

Met Asn

Ser Leu

Leu Ala

Ile Tyr190

Ser Ser80Arg Trp95

Ala Lys

Arg Ala

Thr Leu

Asp Glu160Cys Gly175

Ser Thr

ttcaaggatatggagacttctgcttgcagcctgattgggccttcacttccagataggtgacccctttgtccctgcatcgtcattgatgtgtctctctcattggctgaacccaggtggcagagtgatagaattcttcaccttcattttagtgatcatgaac

attggtgttgagagatggaaaagtggaagttgaagttaaaggaagatgtcccgtgtgctaagcaaatacaacgagcatgggaataatccaaccaccagtagtctctgatccaacgtggcggttgttgaaaccctagtatccgataaaatgatgaaaaa

20

25

Phe Ala Ser Leu Cys Arg Ser Phe Thr Asp Trp

35

40

Val Ala Thr Lys Ala Ser Leu His Phe Ile Asp

50

55

Glu Asp Val Ile Leu Tyr Thr Asp Glu Asp Glu

Asn Asn Ala

Val Ala Ala30

Ala Glu Val45

Lys Ala Ser60

Trp Ser Thr

65

70

75

Lys Ile Gly Asp Arg Val Leu His Ile Glu Leu Arg Arg Trp

85

90

Ile Met Ile Ile Ala Pro Leu Ser Ala Asn Thr

100

105

Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile

115

120

Tyr Asp Lys Pro Leu Phe Val Ala Pro Ala Met

130

135

Asn Asn Pro Phe Thr Glu Lys His Leu Met Ala

Leu Gly Lys110

Val Arg Ala125

Asn Thr Leu140

Ile Asp Glu

Pro Arg15

Ile Lys

Lys Ala

Leu Pro

Trp Thr80Ala Asp95

Ile AlaTrp AspMet TrpLeu Gly

60120180240300360420480540600660720780840900958145 150 155 160

Ile Ser Leu Ile Pro Pro Val Ser Lys Arg Leu Ala Cys Gly Asp Tyr

165 170 175

Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile Phe Gln Ala Val Arg

180 185 190

Leu Tyr Tyr Asp Ala Gln Leu Arg Ser Gly Gly Ser Asn Val Ala195 200 205

<210> 25<211> 1016<212> DNA

<213> Solanum tuberosum<400> 25

gaattgatcg gcgccggact tcgatcaccg tcggcgtttc taagccgtcg ccggaactaa 60

gccggagaaa atctcaatca agtgagctaa gcactcggcg tttcaacttc tggttataaa 120tttattaaag cctttgctcc attaggttag gtagatacgg atcctatgac ttcagagatg 180gaaccagttc agattaatgg tgcacctagg agacctcgta ttctgctggc agcaagtgga 240agtgtggctg caattaagtt tgcaaatcta tgtggttgtt tttctgaatg ggcagaagtt 300aaagcagttg caacaaaacc ttctcttcat ttcatagaca aagcttcact tccggaagat 360gccattctat atactgatga ggaggaatgg tccacttgga agaaaattgg tgatagtgtg 420ctacacattg agctccgcag gtgggctgat attatggtta ttgccccttt gtcagcaaac 480acacttggga agattgcagg tggactatgt gataacttgt taacctgcat cgtacgagca 540tgggactaca ataaacccct ttttgtggca ccagccatga atacattgat gtggaataat 600ccattcacag aacgacacct tatggtaatt gatgagcttg gaatctctct cataccacca 660gtttctaaaa gactagcttg tggagattat ggaaacggcg ctatggctga accttctctc 720atctactcaa ctgtaagact cttctatgag tcacggtcac aatcaggtgg catcaacttg 780gcttgatcca cggatcatta aattttattc gtcggtttgt acaagtggta gaaattgttg 840aaattcagga cctggaacag tgttacttag catacaccag ttgtgtttat ttttctcctt 900aattagtgtc atgtttgtat ccaagagctg actttcaatc aagtttcatg ttcattgtag 960tctattgact ctgaatatta tgcaactcta tatagtaccc gctactaatt atgtat 1016

<210> 26<211> 206<212> PRT

<213> Solanum tuberosum<400> 26

Met Thr Ser Glu Met Glu Pro Val Gln Ile Asn Gly Ala Pro Arg Arg1 5 10 15 Pro Arg Ile Leu 20 Leu Ala Ala Ser Gly 25 Ser Val Ala Ala Ile 30 Lys PheAla Asn Leu 35 Cys Gly Cys Phe Ser 40 Glu Trp Ala Glu Val 45 Lys Ala ValAla Thr 50 Lys Pro Ser Leu His 55 Phe Ile Asp Lys Ala 60 Ser Leu Pro GluAsp Ala Ile Leu Tyr Thr Asp Glu Glu Glu Trp Ser Thr Trp Lys Lys65 70 75 80Ile Gly Asp Ser Val 85 Leu His Ile Glu Leu 90 Arg Arg Trp Ala Asp 95 IleMet Val Ile Ala 100 Pro Leu Ser Ala Asn 105 Thr Leu Gly Lys Ile 110 Ala GlyGly Leu Cys 115 Asp Asn Leu Leu Thr 120 Cys Ile Val Arg Ala 125 Trp Asp TyrAsn Lys 130 Pro Leu Phe Val Ala 135 Pro Ala Met Asn Thr 140 Leu Met Trp AsnAsn Pro Phe Thr Glu Arg His Leu Met Val Ile Asp Glu Leu Gly Ile145 150 155 160Ser Leu Ile Pro Pro 165 Val Ser Lys Arg Leu 170 Ala Cys Gly Asp Tyr 175 GlyAsn Gly Ala Met 180 Ala Glu Pro Ser Leu 185 Ile Tyr Ser Thr Val 190 Arg LeuPhe Tyr Glu 195 Ser Arg Ser Gln Ser 200 Gly Gly Ile Asn Leu 205 Ala

<210> 27<211> 967<212> DNA<213> Glycine max<400> 27

ggttgaacag aagagattta ggcagcccga accgacgatg ttgtttttaa ctgacagcag 60

cacaaagcga acactaacac taacgtgaaa cgcgttgcgt tgtcggaaaa tcaccctcac 120

ctgatcactg tggaagtctc taggtgatgg ccggttcaga acctgttagg gcagagggag 180

agactatggc tgtggatgct gccccaagga agccccggat tctacttgct gctagtggga 240

gtgttgctgc tgtcaaattt gcaaatcttt gtcactgttt ctctgaatgg gcagatgtaa 300

gagcagtttc cacaagtgca tctttgcatt tcattgatag agcagcaatg cccaaggatg 360

taattctata cacggatgac aatgaatggt ctagttggaa gaaattaggt gatagcgtgc 420

ttcacattga gcttcgcaaa tgggctgata tcatggtcat cgctccatta tcagcaaaca 480

cccttggcaa gattgctgga gggttgtgtg acaatctact gacatgcatc gttcgagcct 540

gggactacag caagccattc tttgttgcac cagccatgaa cactttgatg tggaacaatc 600

ctttcactga gcggcatttc atctccattg atgagcttgg catttctctc atcccgcctg 660

ttacaaagag gttagcttgt ggggattatg gcaatggtgc catggctgaa ccctctacca 720

tttactcaac tgtaaggctc ttctatgagt caaaggctca gcaaggtaga gctgtggtaa 780

ccttaaggtg aatgaagggg tagtcctacg cccccattca tggtagtcaa tagcactcta 840

tagcaggata acggagcgca gcagccctga gttactatgg aagtcgaaat cgctgagcga 900

ttttcaataa ccgctgtagc ggctgcaata gtggtctaaa tacagctttt cgggtgctac 960

agcgcac 967<210> 28<211> 214

<212> PRT

<213> Glycine max

<400> 28

Met Ala Gly Ser Glu Pro Val Arg Ala Glu Gly Glu Thr Met Ala Val1 5 10 15 Asp Ala Ala Pro Arg Lys Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser 20 25 30 Val Ala Ala Val Lys Phe Ala Asn Leu Cys His Cys Phe Ser Glu Trp 35 40 45 Ala Asp Val Arg Ala Val Ser Thr Ser Ala Ser Leu His Phe Ile Asp 50 55 60 Arg Ala Ala Met Pro Lys Asp Val Ile Leu Tyr Thr Asp Asp Asn Glu65 70 75 80Trp Ser Ser Trp Lys Lys Leu Gly Asp Ser Val Leu His Ile Glu Leu 85 90 95 Arg Lys Trp Ala Asp Ile Met Val Ile Ala Pro Leu Ser Ala Asn Thr 100 105 110 Leu Gly Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile 115 120 125 Val Arg Ala Trp Asp Tyr Ser Lys Pro Phe Phe Val Ala Pro Ala Met 130 135 140 Asn Thr Leu Met Trp Asn Asn Pro Phe Thr Glu Arg His Phe Ile Ser145 150 155 160Ile Asp Glu Leu Gly Ile Ser Leu Ile Pro Pro Val Thr Lys Arg Leu 165 170 175 Ala Cys Gly Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser Thr Ile 180 185 190 Tyr Ser Thr Val Arg Leu Phe Tyr Glu Ser Lys Ala Gln Gln Gly Arg 195 200 205 Ala Val oin Val Thr Leu Arg

<210> 29<211> 1067<212> DNA

<213> Vitis vinifera<400> 29

ttgggagaga tgccacggcc ctcattcgct ctcgatcccc gacctcggct tcactctctc 60

taattttccc gagcaattct ccgagttgag gctgatttga aagttaatga tgatgacata 120tgcagaacct ttgagtccag aagttgatgc gataccagtc aacattgctc ccagaagacc 180ccggattcta cttgctgcta gtgggagtgt agctgctatg aagtttggga atctcgtcca 240ttctttttgt gaatgggcag aagtaagagc agttgtcaca aaggcttctt tacacttcat 300tgatagagca gcactgccta aggatttata tctttacact gatgatgatg aatggtccag 360ttggacaaaa ttaggagaca gtgtgcttca cattgagctc cgcaggtggg ctgatgtcat 420

ggtaatcgcc ccattatcag caaatacact tggcaagatt gccgggggac tgtgtgacaa 480

cctgctgaca tgcattgtgc gagcgtggga ctacagcaag ccaatgtttg ttgcgccagc 540

tatgaacacc ttcatgtgga ccaatccttt cacagaacgc catcttatga caattgatga 600

acttggaatt tctcttattc cacctgtcac taaaaggctg gcttgcggag attatgggac 660

tggtgcaatg gctgaacctt ttctcatcca ctcaaccgta agactcttct tggagacacg 720

ggctcaatca agtagcagta atgtgcagta attgggtatg gttaatctgt ctgttggaga 780

agtcaccaga gagttggctg aaatggcatg ttggaaatgc taaacgtagt tcacttggac 840

cgcattgatt ttgttatgac cgtccattaa acttactacg tcttgtagat tgttggtatc 900

ggtggatttg catatcctgt ttctcaatat ttctagtagc gccttttgaa tgttatgtgc 960

cttgtgtatt aatggtgagg gagaatgtat cagtctccta aatttctcaa tctctgtgta 1020

gacatgcttg atgatacatt cctataaata gactctgatt tctgggc 1067<210> 30<211> 214<212> PRT

<213> Vitis vinifera<400> 30

Met Met Met Thr Tyr Ala Glu Pro Leu Ser Pro Glu Val Asp Ala Ile1 5 10 15 Pro Val Asn Ile Ala Pro Arg Arg Pro Arg Ile Leu Leu Ala Ala Ser 20 25 30 Gly Ser Val Ala Ala Met Lys Phe Gly Asn Leu Val His Ser Phe Cys 35 40 45 Glu Trp Ala Glu Val Arg Ala Val Val Thr Lys Ala Ser Leu His Phe 50 55 60 Ile Asp Arg Ala Ala Leu Pro Lys Asp Leu Tyr Leu Tyr Thr Asp Asp65 70 75 80Asp Glu Trp Ser Ser Trp Thr Lys Leu Gly Asp Ser Val Leu His Ile 85 90 95 Glu Leu Arg Arg Trp Ala Asp Val Met Val Ile Ala Pro Leu Ser Ala 100 105 110 Asn Thr Leu Gly Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr 115 120 125 Cys Ile Val Arg Ala Trp Asp Tyr Ser Lys Pro Met Phe Val Ala Pro 130 135 140 Ala Met Asn Thr Phe Met Trp Thr Asn Pro Phe Thr Glu Arg His Leu145 150 155 160Met Thr Ile Asp Glu Leu Gly Ile Ser Leu Ile Pro Pro Val Thr Lys 165 170 175 Arg Leu Ala Cys Gly Asp Tyr Gly Thr Gly Ala Met Ala Glu Pro Phe 180 185 190 Leu Ile His Ser Thr Val Arg Leu Phe Leu Glu Thr Arg Ala Gln Ser 195 200 205 Ser Ser Ser Asn Val Gln 210 <210> 31 <211> 1081 <212> DNA <213> Hordeum vulgare <400> 31

cggcacgagg ctccccaatt ccctccgccc gcggcgcgcc gctccgggca gcctcggtcg 60

ccgccgccgc cgccgctgcc tccacctacc gccggccgac gacgcccttc gaacctaccg 120

cctccgccgc catcttcaac cgcttatttg cctgcgctcc taccagatcg cctctgagtt 180

gagggctcca agtgaagcag atggctacat cagaaccggt acagcaaagc tgggagctgg 240

aatccagcag gcctcgggtc ctccttgctg cgtcagggag tgtagctgct ataaaattcg 300

agagcctctg ccgtatcttc tccgagtggg cggaagtccg agctgtggcg accaagtcag 360

cattgcactt tgttgacaga tcatctctgc caagcgacgt cgtcctttac actgatgatg 420

atgagtggtc tacctggaca aagataggag acgaggttct gcacatagag ctgcgaaagt 480

gggcagacat catggtgatc gcccccttat cagcaaacac tctggccaag atcgccggcg 540

ggttatgcga caacctcctg acgtgcatta tccgagcgtg ggactacaag aagccgatct 600

tcgccgcgcc agccatgaac accttcatgt ggaacaaccc attcacggcg cgccacatcg 660

agaccatgaa ccaactgggc atctccctgg tcccgcccac cacgaaacgg ctggcctgcg 720

gcgactacgg gaacggcgcg atggctgagc cctcgcagat ccacacgact gtgaggctcg 780cgtgcaagtc gcagacgttt ggcacgggca tttcgcccgc gcacccttcc agcggccacc 84 0ccgtctagcc gatgcggtga tggtcactat gttcaggtgg tctagtactc gaggtttttc 900tatgccgccc acatcatcag ggtttgagaa agtgaagggt atcaccaggt gttctgttca 960tcggtggtgt ctgtattaac cgaagtatcg tacctgtggg atatggatca gcttatttgt 1020tatgtggtag tagacgttag ggcgtagacg tagagattgg ggaattgctg ttgctccagc 10801081

<210> 32<211> 215<212> PRT

<213> Hordeum vulgare<400> 32

Met Ala Thr Ser Glu Pro Val Gln Gln Ser Trp Glu Leu Glu15 10

Arg Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala Ala

20 25 30

Phe Glu Ser Leu Cys Arg Ile Phe Ser Glu Trp Ala Glu Val

35 40 45

Val Ala Thr Lys Ser Ala Leu His Phe Val Asp Arg Ser Ser

50 55 60

Ser Asp Val Val Leu Tyr Thr Asp Asp Asp Glu Trp Ser Thr65 70 75

Lys Ile Gly Asp Glu Val Leu His Ile Glu Leu Arg Lys Trp

85 90

Ile Met Val Ile Ala Pro Leu Ser Ala Asn Thr Leu Ala Lys100 105 110

Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Ile Arg Ala

115 120 125

Tyr Lys Lys Pro Ile Phe Ala Ala Pro Ala Met Asn Thr Phe

130 135 140

Asn Asn Pro Phe Thr Ala Arg His Ile Glu Thr Met Asn Gln145 150 155

Ile Ser Leu Val Pro Pro Thr Thr Lys Arg Leu Ala Cys Gly

165 170

Gly Asn Gly Ala Met Ala Glu Pro Ser Gln Ile His Thr Thr180 185 190

Leu Ala Cys Lys Ser Gln Thr Phe Gly Thr Gly Ile Ser Pro

195 200 205

Pro Ser Ser Gly His Pro Val210 215

<210> 33<211> 1175<212> DNA

<2l3> Gossypium hirsutum<400> 33

cccattgtca cctttagtgc tggtgagcat ttaagagagg gcagagcaac ggaggaaatc 60

cccttttttg tgcagtggaa gtaaaaatta cctaccatta gaaaaggaga aggattggta 120aagtattgca gcgctccgta aaggcatttt ggtatagcaa gtagcagcaa ttcatcaaaa 180ggcagcattt ctttttgcac caggggccct ttaaaaagct caactctcgc gcttctttgc 240gtttcaaatc tctctgcaag tcgcaaggac atctgaagca gaaagcccag attcctctct 300aatcttagat tccagatttg cataggttat ggcgtatcct gagcctcaag gtgcagatag 360ggagatggtt aaggtcaatc ctaccccaag aaaaccccgg gttttactcg ctgccagtgg 420aagtgtagct gccataaagt ttgggaatct ctgccattgt ttctctgaat gggcagaagt 480aaaagcagtt gccacgaaag cttctttgca tttcattgac agagcatcac ttcctaagga 540tctaaagctt tacactgatg aggaggaatg gtctagttgg gggaaaatag gtgacagtgt 600gcttcacatt gagcttcgtc gatgggctga tattatggtc attgccccat tgtcagcaaa 660cacacttggc aagattgctg gaggattatg tgacaatttg ttaacttgtg tcgtacgagc 720atgggactac agcaagccaa tgtttgttgc accagctatg aacactttca tgtggagcaa 780ccctttcaca gaaaagcatc tcatgacaat tgatgagctt ggtatttctc tcatcccccc 840tgtctccaaa agactagctt gtggggacta tggaaacggc gcaatggcag aaccttctct 900aatccactcg actgtaagat tattcttgga gtcacgacct caaccaagtg actgaagatc 960tatttattcg ccatgaatta taaatactat attagttgta tggtagccca gttgactcta 1020ggttgggtgt atgtctatta gctgtctaac aagcttattg tacatttata gttgcatttc 1080cgagtttgct taactttgca tatcatgagg agtggtcttt gaatactgct gaaaatttga 1140

Ser Ser15

Ile Lys

Arg Ala

Leu Pro

Trp Thr80Ala Asp95

Ile Ala

Trp Asp

Met Trp

Leu Gly160Asp Tyr175

Val ArgAla Histcctgtaagc tgatgatact gatgagagtt ggcag<210> 34<211> 208<212> PRT

<213> Gossypium hirsutum<400> 34

1175

Met Ala Tyr Pro Glu Pro Gln Gly Ala Asp Arg Glu Met Val Lys Val1 5 10 15 Asn Pro Thr Pro 20 Arg Lys Pro Arg Val 25 Leu Leu Ala Ala Ser 30 Gly SerVal Ala Ala 35 Ile Lys Phe Gly Asn 40 Leu Cys His Cys Phe 45 Ser Glu TrpAla Glu 50 Val Lys Ala Val Ala 55 Thr Lys Ala Ser Leu 60 His Phe Ile AspArg Ala Ser Leu Pro Lys Asp Leu Lys Leu Tyr Thr Asp Glu Glu Glu65 70 75 80Trp Ser Ser Trp Gly 85 Lys Ile Gly Asp Ser 90 Val Leu His Ile Glu 95 LeuArg Arg Trp Ala 100 Asp Ile Met Val Ile 105 Ala Pro Leu Ser Ala 110 Asn ThrLeu Gly Lys 115 Ile Ala Gly Gly Leu 120 Cys Asp Asn Leu Leu 125 Thr Cys ValVal Arg 130 Ala Trp Asp Tyr Ser 135 Lys Pro Met Phe Val 140 Ala Pro Ala MetAsn Thr Phe Met Trp Ser Asn Pro Phe Thr Glu Lys His Leu Met Thr145 150 155 160Ile Asp Glu Leu Gly 165 Ile Ser Leu Ile Pro 170 Pro Val Ser Lys Arg 175 LeuAla Cys Gly Asp 180 Tyr Gly Asn Gly Ala 185 Met Ala Glu Pro Ser 190 Leu IleHis Ser Thr 195 Val Arg Leu Phe Leu 200 Glu Ser Arg Pro Gln 205 Pro Ser Asp

<210> 35<211> 1119<212> DNA

<213> Sorghum bicolor<400> 35

gcacgagggc tctctccgct cacctccact tccccgcccc

acacgggcgc gcacccgtcc gcctccgact gacccggagcgggagggaga gcccgaaccg cggcggggcg ggagggctccgggccagccg ccccatgggc cggtcgcctg agcgcgctac

ggaaagctga gcgttagcgg agctgatggc tacatcagaggatggactac tcacaaccta gtaagcctcg ggtactccttcgctataaaa tttgagaacc tttgtcgtag tttctctgag

ggccaccgca tcatctttgc actttattga tagatcatct

ttacactgat gatgatgagt ggtctacctg gaagaagata

tgagctgcgt aaatgggcag atattatggt gattgctccg

taagatcgcc ggtgggttat gtgacaacct cttaacatgc

cagcaaaccg ctctttgttg ccccagctat gaacacatta

agagcgtcat cttcaaacga tcaaccaact gggcataatc

aaggttggct tgtggcgatc acgggaatgg tgcaatggct

ttctgtgagg cttgcatgga agacgcaacc acatgatgca

tgtcagtaat aaccgcccat ctagctggtg tttgacctct

tgttttatct gcagtgtgca tcttgatgtt agaaatgttg

tgttttagtg tgtattgtga tgagaatgtg gggaaaggaa

ataaattact gccagctcag tatcgatagt gaggatgag<210> 36<211> 225<212> PRT

<213> Sorghum bicolor<400> 36

Met Ala Thr Ser Glu Pro Val Gln Glu Asn Leu15 10

cgccccggtccgactcgaccttttcgtttggtatcagctcccagtacaaggctgcttcagtgggcggatgcttccaagtgggagatgaagttatcagcaaatcgtgagagatgtggaacattgatcccccgaaacctcgcagcagttcactaattaagagtaccaattttggttgtcagt

tccgtccttgttgttcaggaccccgccggaatcgaccggcagaatttggcgaagtgtagctccgagccgtacattgttctttttacacatataccctggccgtgggactaacccattcaccagttaccaaagatctatacttgtggttcccttaggaattttttaaccagtgtcacggtg

60120180240300360420480540600660720780840900960102010801119

Ala Met Asp Tyr Ser

15Gln Pro Ser Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala

20

25

30

Ala Ile Lys Phe Glu Asn Leu Cys Arg Ser Phe Ser Glu Trp Ala Asp

35

40

45

Val Arg Ala Val Ala Thr Ala Ser Ser Leu His Phe Ile Asp Arg Ser

50

55

60

Ser Leu Pro Ser Asp Ile Val Leu Tyr Thr Asp Asp Asp Glu Trp Ser

65

70

75

80

Thr Trp Lys Lys Ile 85 Gly Asp Glu Val Leu 90 His Ile Glu Leu Arg 95 LysTrp Ala Asp Ile 100 Met Val Ile Ala Pro 105 Leu Ser Ala Asn Thr 110 Leu AlaLys Ile Ala 115 Gly Gly Leu Cys Asp 120 Asn Leu Leu Thr Cys 125 Ile Val ArgAla Trp 130 Asp Tyr Ser Lys Pro 135 Leu Phe Val Ala Pro 140 Ala Met Asn ThrLeu Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu Gln Thr Ile Asn145 150 155 160Gln Leu Gly Ile Ile 165 Leu Ile Pro Pro Val 170 Thr Lys Arg Leu Ala 175 CysGly Asp His Gly 180 Asn Gly Ala Met Ala 185 Glu Thr Ser Gln Ile 190 Tyr ThrSer Val Arg 195 Leu Ala Trp Lys Thr 200 Gln Pro His Asp Ala 205 Ser Ser SerLeu Val 210 Val Pro Val Ser Asn 215 Asn Arg Pro Ser Ser 220 Trp Cys Leu Thr

Ser225

<210> 37<211> 975<212> DNA

<213> Lycopersicon esculentum<400> 37

ctacaattga tcggcgccgg actttgatca ccgtcggcgt ttctaagccg ttgccggact 60

atgccggagc aaatctcaat caagtgagct aaccactctg tgtttcaact tctggttata 120aattttttaa agcctttgct ccgttaggtt aggtagatac ggatcctatg acttcagaga 180tggaaccagt tcagattaat ggtgcaccta ggagacctcg tattctgctg gcagcaagtg 240gaagtgtggc ttcaattaag tttgctaatc tatgtcgttg tttttctgaa tgggcagaag 300ttaaagcagt tgcaacgaaa ccttctcttc atttcataga caaagcttcg cttccggaag 360atgtcattct ttatactgat gaggaggaat ggtccacttg gtgcagattg gtgatagtgt 420gctacacatt gagctccgca gatgggctga tattatggtt attgcccctt tgtcagcaaa 480cacacttggg aagattgcag gtggactatg tgataacttg ttaacctgca tcgtacgagc 540atgggactac aataaacccc tttttgtggc accagccatg aatacattga tgtggaataa 600tccattcaca gaacgacacc ttatggtaat tgatgagctt ggaatctctc tcataccccc 660agtttcaaaa agactagcat gtggagatta tggaaatggc gctatggctg aaccttctct 720catttactca actgtaagac tcttttatga gtcacggtca caatcaggtg gcatcaactt 780ggcttgattc gcagatcatt aaattttatt catcggtttg tacaagtggt aaaaattgtt 840gaaattcagg acctggaaca gtgttactta gcatacacca gttgggttta tttttctcct 900aaattcttca cctctttaac ttgtgtcatg tttgtatcca agcggtaact ttcaatcaag 960tttcatgttc attgt 975

<210> 38<211> 206<212> PRT

<213> Lycopersicon esculentum<220>

<221> INSEGURO<222> (74)..(74)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 38

Met Thr Ser Glu Met Glu Pro Val Gln Ile Asn Gly Ala Pro Arg Arg1 5 10 15

Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser Val Ala Ser Ile Lys Phe20 25 30Ala Asn Leu Cys35

Ala Thr Lys Pro50

Asp Val Ile Leu65

Ile Gly Asp Ser

Met Val Ile Ala100

Gly Leu Cys Asp115

Asn Lys Pro Leu130

Asn Pro Phe Thr145

Ser Leu Ile Pro

Asn Gly Ala Met180

Phe Tyr Glu Ser195

<210> 39<211> 1395<212> DNA<213> Arabidopsis thaliana<400> 39

atggcgaaaa cagctcttac tcctcccgcg tctggttccg aagttccaag atccggtaca 60

cctggagatg cgtctggcaa caaacctcaa acggatgcca ccggcgtctc agctactgat 120actgcttctc agaaacgcgg tcgtggtcga ccgccaaagg ctaaatctga ctcttcccaa 180atcggtgccg tttctgcgaa ggcgagtact aaaccaagtg gtcgtccgaa aagaaacgta 240gctcaggctg ttccttctac gtctgtggcg gcggctgtga agaaacgtgg tagggcaaag 300aggtcgactg taacggcggc tgtggttact actgctactg gagagggttc tagaaaacga 360gggaggccaa agaaagatga cgtggcggct gcaactgttc cagcagaaac tgtggtggct 420ccagctaaga gacgtggaag gaaacctact gtcgaagtag ctgcacagcc tgtgcgcagg 480actaggaagg tattcgggtt ttctatgcat gaacaaaaga gcacttcagt ggcaccggta 540gctgcaaacg tcggagatct caagaaaaga accgcactct tacaaaagaa agtgaaggaa 600gctgcagcta agttgaaaca agcagtaaca gcaattgacg aggtccagaa gttagcggat 660ggaatattga ccagcgatga cgtcgacttc tctgttttgt tttcaaactt aaagaccctc 720gcggcatttg atttcgattt ccgattaggg ttcctcgcag atcctccttc ctcggctata 780gagaagaaga tgaatatgga agtggataca gtaacaagga agcctcgtat cttactagct 840gcaagtggaa gtgtggcttc aattaagttc agtaatctct gccattgttt ctcagaatgg 900gctgaagtca aagccgtcgc ttcaaaatca tctctcaatt tcgttgataa accttctcta 960cctcagaatg tgactctcta tacagatgaa gatgaatggt ctagctggaa caagattggt 1020gatcccgttc ttcatatcga gctcagacgc tgggctgatg ttatgatcat tgctcctttg 1080tctgctaaca cattagccaa gattgctggt gggttatgtg ataatctatt gacatgtata 1140gtaagagcat gggattatag caaaccgttg tttgttgcac cggcgatgaa cactttgatg 1200tggaacaatc ctttcacaga acggcacctt gtcttgcttg atgaacttgg aatcacccta 1260attcctccca tcaagaagaa actggcctgt ggagactacg gtaatggcgc aatggctgag 1320ccttctctga tttattccac tgttagactg ttctgggagt cacaagctcg taaacaaaga 1380gatggaacca gttga 1395

<210> 40<211> 464<212> PRT

<213> Arabidopsis thaliana<400> 40

Met Ala Lys Thr Ala Leu Thr Pro Pro Ala Ser Gly Ser Glu Val Pro15 10 15

Arg Ser Gly Thr Pro Gly Asp Ala Ser Gly Asn Lys Pro Gln Thr Asp

20 25 30

Ala Thr Gly Val Ser Ala Thr Asp Thr Ala Ser Gln Lys Arg Gly Arg

35 40 45

Gly Arg Pro Pro Lys Ala Lys Ser Asp Ser Ser Gln Ile Gly Ala Val

Arg Cys

Ser Leu

Tyr Thr

70Val Leu85

Pro Leu

Asn Leu

Phe Val

Glu Arg150Pro Val165

Ala Glu

Phe

His

55

Asp

His

Ser

Leu

Ala135His

SerProArg Ser Gln

Ser Glu40

Phe Ile

Glu Glu

Ile Glu

Ala Asn105Thr Cys120

Pro Ala

Leu Met

Lys Arg

Ser Leu185Ser Gly200

Trp Ala GluAspXaa

Leu

90

Thr

Ile

Met

Val

Leu170Ile

Gly

Lys Ala60

Met Val75

Arg Arg

Leu Gly

Val Arg

Asn Thr140Ile Asp155

Ala CysTyr SerIle Asn

Val Lys Ala45

Ser Leu Pro

His Leu Val

Trp Ala Asp95

Lys Ile Ala110Ala Trp Asp125

Leu Met Trp

Glu Leu Gly

Gly Asp Tyr175

Thr Val Arg

190Leu Ala205

Val

Glu

Gln80Ile

Gly

Tyr

Asn

Ile160Gly

Leu50 55 60 Ser Ala Lys Ala Ser Thr Lys Pro Ser Gly Arg Pro Lys Arg Asn Val65 70 75 80Ala Gln Ala Val Pro Ser Thr Ser Val Ala Ala Ala Val Lys Lys Arg 85 90 95 Gly Arg Ala Lys Arg Ser Thr Val Thr Ala Ala Val Val Thr Thr Ala 100 105 110 Thr Gly Glu Gly Ser Arg Lys Arg Gly Arg Pro Lys Lys Asp Asp Val 115 120 125 Ala Ala Ala Thr Val Pro Ala Glu Thr Val Val Ala Pro Ala Lys Arg 130 135 140 Arg Gly Arg Lys Pro Thr Val Glu Val Ala Ala Gln Pro Val Arg Arg145 150 155 160Thr Arg Lys Val Phe Gly Phe Ser Met His Glu Gln Lys Ser Thr Ser 165 170 175 Val Ala Pro Val Ala Ala Asn Val Gly Asp Leu Lys Lys Arg Thr Ala 180 185 190 Leu Leu Gln Lys Lys Val Lys Glu Ala Ala Ala Lys Leu Lys Gln Ala 195 200 205 Val Thr Ala Ile Asp Glu Val Gln Lys Leu Ala Asp Gly Ile Leu Thr 210 215 220 Ser Asp Asp Val Asp Phe Ser Val Leu Phe Ser Asn Leu Lys Thr Leu225 230 235 240Ala Ala Phe Asp Phe Asp Phe Arg Leu Gly Phe Leu Ala Asp Pro Pro 245 250 255 Ser Ser Ala Ile Glu Lys Lys Met Asn Met Glu Val Asp Thr Val Thr 260 265 270 Arg Lys Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser Val Ala Ser Ile 275 280 285 Lys Phe Ser Asn Leu Cys His Cys Phe Ser Glu Trp Ala Glu Val Lys 290 295 300 Ala Val Ala Ser Lys Ser Ser Leu Asn Phe Val Asp Lys Pro Ser Leu305 310 315 320Pro Gln Asn Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser Ser Trp 325 330 335 Asn Lys Ile Gly Asp Pro Val Leu His Ile Glu Leu Arg Arg Trp Ala 340 345 350 Asp Val Met Ile Ile Ala Pro Leu Ser Ala Asn Thr Leu Ala Lys Ile 355 360 365 Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Val Arg Ala Trp 370 375 380 Asp Tyr Ser Lys Pro Leu Phe Val Ala Pro Ala Met Asn Thr Leu Met385 390 395 400Trp Asn Asn Pro Phe Thr Glu Arg His Leu Val Leu Leu Asp Glu Leu 405 410 415 Gly Ile Thr Leu Ile Pro Pro Ile Lys Lys Lys Leu Ala Cys Gly Asp 420 425 430 Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile Tyr Ser Thr Val 435 440 445 Arg Leu Phe Trp Glu Ser Gln Ala Arg Lys Gln Arg Asp Gly Thr Ser 450 455 460

<210> 41<211> 1182<212> DNA<213> Pinus sp.<400> 41

atattgaaac tcatttttaa acacttattc tgcactataa gaagcagcag gcccccagaa 60

atatgagctt catacacaca acgggggagt aatcagcacc atcaaagggg ggatttgcgg 120caattgtgag atcaagtgga ggaagctgga atagatctaa atctaggccc ttgaggagaa 180tgctctccta atggtggttt taaaaatcaa tactctagtg caaaacatgg atgcaacaaa 240ttctcaacct gatgaacctg gaagggatgc taattcatct cagaaaccac gaatcattct 300agcagccagc gggagtgtgg cagcaataaa atttggaatt cttgcccatt gtctatgtca 360atgggcagaa gtcaaagcag tggtcacaaa atctgctttg catttcattg acaagatgtc 420tcttccggct aatgttaagc tctacactga tgaaaatgaaaggtgatact gtactgcata tagaactccg gcaatgggctactctcagca aacacgcttg ctaagatagc aggtggcctacatagtacgt gcatgggact ttaacaagcc tctctttgtacatgtggaac aatccattta ctcaacggca tttggactcaacttatcccc ccaataacaa agaagttagc ttgtggtgattgaaccttct acgatagata caactcttag gttttcactttgtctgatgt cccgttcaac aattcttgtt atgaatctaaatggtataga cccagatagt gtttcttggt agctgggttatgtgtggtga agttaagttc tgatgataaa caatcatgaattgctcattt attctggaca cttacaagaa ctgtgtggatgtgtcaaact actatgcaaa tcatctaatt tggaacttgactttattttc ttccctgtga taattattaa tctctatgat<210> 42<211> 215<212> PRT<213> Pinus sp.<400> 42

Met Val Val Leu Lys Ile Asn Thr Leu Val Gln1 5 10

Asn Ser Gln Pro Asp Glu Pro Gly Arg Asp Ala

20 25

Pro Arg Ile Ile Leu Ala Ala Ser Gly Ser Val

35 40

Gly Ile Leu Ala His Cys Leu Cys Gln Trp Ala

50 55

Val Thr Lys Ser Ala Leu His Phe Ile Asp Lys65 70 75

Asn Val Lys Leu Tyr Thr Asp Glu Asn Glu Trp

tggtctagctgatgctatggtgcgacaatcgctcctgcaaatctcagagctatggaaatggatccttcaacatgcttagtgacagcatgacttgtgatttactcctgctttgatgtaaga

tg

ggagcaaaattgattgctcctacttacttgtgaatacttttcggactatcgtgcaatggcttgtatgaagacaatggactactcagcttgtatgtaacatataagagaatggagtatgca

85

90

Ile Gly Asp Thr Val Leu His Ile Glu Leu Arg

100 105

Met Val Ile Ala Pro Leu Ser Ala Asn Thr Leu

115 120

Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Val

130 135

Asn Lys Pro Leu Phe Val Ala Pro Ala Met Asn145 150 155

Asn Pro Phe Thr Gln Arg His Leu Asp Ser Ile

165 170

Ser Leu Ile Pro Pro Ile Thr Lys Lys Leu Ala

180 185

Asn Gly Ala Met Ala Glu Pro Ser Thr Ile Asp

195 200

Ser Leu Asp Pro Ser Ile Val210 215

<210> 43<211> 804<212> DNA<213> Oryza sativa<400> 43

atggggcggg ggaaggtgca gctgaagcgg atagagaacattctccaaga ggaggaatgg attgctgaag aaggcgcacggccgaggtcg ccgccatcgt cttctccccc aagggcaagctccaggatgg acaaaatcct tgaacgttat gagcgctattatttcagctg aatccgagag tgagggaaat tggtgccatgaagattgaga ccatacaaaa atgtcacaaa cacctcatggaatctcaaag aactccaaca gctagagcag cagctggagatcaagaaaga gccaccttat gcttgagtcc atttccgagcctgcaggagg agaacaaggc tctgcagaag gaactggtggggccagcagc aagtagggca gtgggaccaa acccaggtccccccaagccc agacaagctc ctcctcctcc tccatgctgaccaccacaaa atatctgcta cccgccggtg atgatgggcg

Asn Met

Asn Ser

Ala Ala

45Glu Val60

Met Ser

Ser Ser

Gln Trp

Ala Lys125Arg Ala140

Thr Phe

Ser Glu

Cys Gly

Thr Thr205

Asp

Ser

30

Ile

Lys

Leu

Trp

Ala110Ile

Trp

Met

Leu

Asp190Leu

Ala Thr15

Gln Lys

Lys Phe

Ala Val

Pro Ala80Ser Lys95

Asp Ala

Ala Gly

Asp Phe

Trp Asn160Gly Leu175

Tyr GlyArg Phe

agatcaacagagatctccgttctacgagtacatatgctgaaatacaggaagagaggatctgttcattgaatgcagaaaaaagaggcagaaaggcccaggcgggatcagcaagagaaatga

gcaggtgacgcctctgcgaccgccactgacaaaggctcttacttaaggcaagaatccctggcacataataggagaggtcagaatgtgaggccaagcccaaggcacttctttgcggcggcg

4805406006607207808409009601020108011401182

60120180240300360420480540600660720gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg 780atgctgagcc acctcaatgc ttaa 804

<210> 44<211> 267

<212> PRT <213> Oryza sativa <400> 44 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Ala Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Ile Ser Arg Lys Ser 130 135 140 His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln Trp Asp Gln Thr Gln 180 185 190 Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala Gln Thr Ser Ser Ser 195 200 205 Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu Leu Pro Pro Gln Asn 210 215 220 Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg Asn Asp Ala Ala Ala225 230 235 240Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln Leu Arg Ile Gly Gly 245 250 255 Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala 260 265 <210> 45 <211> 52

<212> DNA

<213> Seqüência artificial<220>

<223> iniciador<400> 45

ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg gcgggggaag gt 52

<210> 46<211> 47<212> DNA

<213> Seqüência artificial<220>

<223> iniciador<400> 46

ggggaccact ttgtacaaga aagctgggtt tggccgacga cgacgac 47

<210> 47

<211> 2193

<212> DNA

<213> Oryza sativa

<400> 47

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgccatccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctacatttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatatatctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactcaaaaaatctt tctagctgaa ctcaatgggt aaagagagag attttttttaatgaagatat tctgaacgta ttggcaaaga tttaaacata taattatatattgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatccttagtaatta aagacaattg acttattttt attatttatc ttttttcgatgtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctccttcaactagca acacatctct aatatcactc gcctatttaa tacatttaggtgaattcaag cactccacca tcaccagacc acttttaata atatctaaaaaattttacag aatagcatga aaagtatgaa acgaactatt taggtttttcaaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcacacagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacggatccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggagaaccaagcat cctcctcctc ccatctataa attcctcccc ccttttccccggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagccgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctccacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattgtgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgattgatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttgaggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtacgattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgatttaataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcgactatcctttg tttattccct attgaacaaa aataatccaa ctttgaagacatgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggcacagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaacctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatctctttctggtt cagttcaatg aattgattgc tacaaataat gcttttataggctgtagttc agttaatagg taatacccct atagtttagt caggagaagatttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagtattatttttt ttattagctc tcaccccttc attattctga gctgaaagtctgtcctcaat tttgttttca aattcacatc gattatctat gcattatcctcctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaagagctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttttggtgtagct tgccactttc accagcaaag ttc<210> 48<211> 42<212> PRT

<213> Seqüência artificial<220>

<223> Seqüência artificial<220>

<221> VARIANTE<222> (2)..(2)<223> /substituir = "Vai"<220>

<221> VARIANTE

<222> (6)..(6)

<223> /substituir = "Asn"

<220>

<221> VARIANTE

<222> (ΙΟ)-.(ΙΟ)

<223> /substituir = "He"

<220>

<221> VARIANTE<222> (12)..(12)<223> /substituir = "Tyr"<220>

<221> VARIANTE<222> (16)..(16)

<223> /substituir = "lie" /substituir = "Leu"<220>

aagaaaaact 120ctagtttcgt 180cgttcacatc 240ttcttgaata 300aaaaaataga 360attttatagt 420caatttttat 480tagatgcaag 540caatacacgt 600tagcaatatc 660tacaaaaaat 720acatacaaaa 780acaggcaaca 840ggacagcaag 900aggcaaagaa 960tctctatata 1020agaagccgag 1080ttccctcctc 1140ttctaggttg 1200cctgttcttg 1260ttagtagtat 1320ggaatcttgc 1380tgcttggtgt 1440tttgacgaag 1500ggtcccgttg 1560ttgtttagat 1620caggggattc 1680taaaaagtca 1740cgttatccta 1800acttatccga 1860attcatttgg 1920tggcatgaac 1980cttgtatcta 2040aaatttatga 2100gtgcagttct 2160 2193<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><4 00>

VARIANTE

(17)..(17)/substituir

VARIANTE

(18)..(18)

/substituir

VARIANTE

(19)··(19)/substituir

VARIANTE

(20)..(20)/substituir

VARIANTE(23)..(23)/substituir

VARIANTE

(30)..(30)/substituir

VARIANTE

(31)..(31)/substituir

VARIANTE

(32)..(32)/substituir

VARIANTE

(33)..(33)/substituir

VARIANTE(35)..(35)/substituir

VARIANTE

(37)..(37)

/substituir

VARIANTE

(38) . . (38)

/substituir

VARIANTE(41)..(41)/substituir48

= "Gly"

"Ala" /substituir = "Vai"

= "Vai"

= "Pro" /substituir = "Ala" /substituir = "Asn"

= "Phe"

"Ser"

= "Asn" /substituir = "Glu"

= "Cys" /substituir = "Arg" /substituir = "Ser"

= "Glu"

"lie" /substituir = "Arg" /substituir = "Lys"

= "Glu"

Leu1

Ala

Leu Lys Lys

Leu Ile Ile20

Asp Ser Lys Met35

<210> 49<211> 19<212> PRT<213> Seqüência<220>

Ala His Glu Ile Ser Val Leu Cys Asp Ala Glu Val5 10 15

Phe Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

25 30

Asp Asn Ile Leu Glu Arg40

artificial<223> Seqüência artificial<220>

<221> VARIANTE

<222> (4)..(4)

<223> /substituir = "Ser"

<220>

<221> VARIANTE

<222> (5)..(5)

<223> /substituir = "Arg"

<220>

<221> VARIANTE

<222> (6)..(6)

<223> /substituir = "lie"

<220>

<221> VARIANTE<222> (8)..(8)

<223> /substituir = "Thr" /substituir = "Ser"<220>

<221> VARIANTE

<222> (9)..(9)

<223> /substituir = "lie"

<220>

<221> VARIANTE<222> (10)..(10)<223> /substituir = "Asn"<220>

<221> VARIANTE<222> (11)..(11)

<223> /substituir = "Arg" /substituir = "Asn"<220>

<221> VARIANTE<222> (12)..(12)

<223> /substituir = "Cys" /substituir = "Arg"<220>

<221> VARIANTE

<222> (13)..(13)

<223> /substituir = "His"

<220>

<221> VARIANTE<222> (14) . . (14)<223> /substituir = "Lys"<400> 49

Lys -Leu Lys Ala Lys Val Glu Ala Leu Gln Lys Ser Gln Arg His Leu15 10 15

Met Gly Glu

<210> 50<211> 11<212> PRT

<213> Seqüência artificial<220>

<223> Seqüência artificial<220>

<221> VARIANTE<222> (2)..(2)

<223> /substituir = "Gln" /substituir = "Vai" /substituir = "Ala"<220>

<221> VARIANTE

<222> (6)..(6)

<223> /substituir = "Phe"

<220>

<221> VARIANTE<222> (7)..(7)<223> /substituir = "Phe"<220>

<221> VARIANTE

<222> (8)..(8)

<223> /substituir = "Phe"

<220>

<221> VARIANTE

<222> (9)..(9)

<223> /substituir = "Phe"

<220>

<221> VARIANTE<222> (10)..(10)

<223> /substituir = "Cys" /substituir = "Phe"<220>

<221> VARIANTE<222> (11)..(11)<223> /substituir = "Met"<400> 50

Gln Pro Gln Thr Ser Ser Ser Ser Ser Ser Phe15 10

<210> 51<211> 7<212> PRT

<213> Seqüência artificial<220>

<223> Seqüência artificial<220>

<221> VARIANTE<222> (1) . . (1)

<223> /substituir = "Ala" /substituir = "Vai" /substituir = "Leu"<220>

<221> VARIANTE

<222> (2)..(2)

<223> /substituir = "Pro"

<220>

<221> INSEGURO<222> (3)..(3)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural, preferably

Leu, Pro ou His

<220>

<221> INSEGURO<222> (3)..(3)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural, preferably

Leu, Pro ou His

<220>

<221> INSEGURO<222> (6)..(6)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural, preferably

Leu, Pro ou His

<220>

<221> VARIANTE<222> (7) .. (7)<223> /substituir = "His"<400> 51

Gly Leu Xaa Trp Met Xaa Ser

1 5

<210> 52

<211> 735

<212> DNA

<213> Hordeum vulgare<400> 52

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg ccaggtcacc 60

ttctccaagc gccgctcggg gctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gccgaggtcg gcctcatcat cttctccacc aagggaaagc tctacgagtt ctccaccgag 180tcatgtatgg acaaaattct tgaacggtat gagcgctact cttatgcaga aaaggttctc 240gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga caatacagaa atgtcaaaag catctcatgg gagaggatct tgaatctttg 360aatctcaagg agttgcagca actggagcag cagctggaaa gctcactgaa acatatcaga 420gccaggaaga accaacttat gcacgaatcc atttctgagc ttcagaagaa ggagaggtca 480ctgcaggagg agaataaagt tctccagaag gaacttgtgg agaagcagaa ggcccaggcg 540gcgcagcaag atcaaactca gcctcaaacc agctcttctt cttcttcctt catgatgagg 600gatgctcccc ctgtcgcaga taccagcaat cacccagcgg cggcaggcga gagggcagag 660gatgtggcag tgcagcctca ggtcccactc cggacggcgc ttccactgtg gatggtgagc 720cacatcaacg gctga 735

<210> 53<211> 244<212> PRT

<213> Hordeum vulgare<400> 53

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala

20 25 30

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80

Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ala Arg Lys Asn

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln

165 170 175

Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser

180 185 190

Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Val Ala Asp Thr

195 200 205

Ser Asn His Pro Ala Ala Ala Gly Glu Arg Ala Glu Asp Val Ala Val

210 215 220

Gln Pro Gln Val Pro Leu Arg Thr Ala Leu Pro Leu Trp Met Val Ser225 230 235 240

His Ile Asn Gly

<210> 54<211> 1196<212> DNA

<213> Hordeum vulgare<400> 54

ctctcccctc ccacttcacc caaccacctg acagccatgg ctccgccacc tcgcctccgc 60

ccgcgcctct gagagtagcc gtcgcggtcg ctcgctcgct cgctcgctgc tgccggtgtt 120

ggcccggtcc tcgagcggag atggggcgca ggaaggtgca gctgaagcgg atcgagaaca 180

agatcaaccg ccaggtcacc ttctccaagc gccgctcggg gctgctcaag aaggcgcacg 240

agatctccgt gctctacgac gccgaggtcg gcctcatcat cttctccacc aagggaaagc 300

tctacgagtt ctccaccgag tcatgtatgg acaaaattct tgaacggtat gagcgctact 360

cttatgcaga aaaggttctc gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg 420

aatataggaa actgaaggcg aaggttgaga caatacagaa atgtcaaaag catctcatgg 480

gagaggatct tgaatctttg aatctcaagg agttgcagca actggagcag cagctggaaa 540

gctcactgaa acatatcaga gccaggaaga accaacttat gcacgaatcc atttctgagc 600ttcagaagaa ggagaggtca ctgcaggagg agaataaagt tctccagaagagaagcagaa ggcccaggcg gcgcagcaag atcaaactca gcctcaaacccttcttcctt catgatgagg gatgctcccc ctgtcgcaga taccagcaatcggcaggcga gagggcagag gatgtggcag tgcagcctca ggtcccactcttccactgtg gatggtgagc cacatcaacg gctgaagggc ttccagcccactattcagta cgagtaacaa gttgcagcgg ccagcctggt gtatcatgcgtgctaacccc atggagggga gaggaaaaga aatcagagta aagcagcaaggtgtatattt cacttcgtcc acctcagttt cctttccacc tgggctgagaagtaatctac catgtaattt atatgtagca tgagtgacga attttcaacttccgttgctc ctgggtgttg tttctgtgaa ttaacctatc gaatatgagc<210> 55<211> 244<212> PRT

<213> Hordeum vulgare<400> 55

Met Gly Arg Arg Lys Val Gln Leu Lys Arg Ile Glu Asn1 5 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu

20 25

His Glu Ile Ser Val Leu Tyr Asp Ala Glu Val Gly Leu

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75

Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His

85 90

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ala

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val

165 170

Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln

180 185

Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Val195 200 205

Ser Asn His Pro Ala Ala Ala Gly Glu Arg Ala Glu Asp

210 215 220

Gln Pro Gln Val Pro Leu Arg Thr Ala Leu Pro Leu Trp225 230 235

His Ile Asn Gly

gaacttgtggagctcttcttcacccagcggcggacggcgctgtaagcgtagttgcgaacactgcaggaattggctgtacgttcgatgatagttgtg

Lys Ile Asn15

Lys Lys Ala30

Ile Ile Phe

Cys Met Asp

Lys Val Leu80

Glu Tyr Arg95

Lys His Leu110

Gln Gln Leu

Arg Lys Asn

Glu Arg Ser160

Glu Lys Gln175

Thr Ser Ser190

Ala Asp Thr

Val Ala Val

Met Val Ser240

6607207808409009601020108011401196

<210> 56<211> 1161<212> DNA<213> Trit<400> 56ggcacgagctcggcacgagcaccggcaggtccgtgctctgagttctccaccagaaaaggtggaaactgaaatcttgaatctgaaacatatagaaggagagagaaggccca

icum aestivum

ctctctctctggagatgggggaccttctcccgacgccgagcgagtcatgttctcgtttcaggcgaaggtttttgaatctccagatccagggtcactgcagggcggcgcaa

ctctctctctcgcgggaaggaagcgccgctgtcggcctcaatggacaaaaagtgaatctggagacaatacaaggagttgcaagaaccaacgaggagaatacaagatcaga

ctctctctcttgcagctgaacggggctgcttcatcttctcttcttgaacgaaattcagggagaaatgtcaagcaactggattatgcacgaaagttctccactcagcctca

ctctctcctcgcggatcgagcaagaaggcgcaccaagggagtatgagcgcaaactggtgtaaagcatctggcagcagctgatccatttctgaaggaactcaacaagctct

gtgccgaattaacaagatcacacgagatctaagctctacgtactcttatgcacgaatataatgggagagggaaagctcacgagcttcagagtcgagaagctcttcttctt

60120180240300360420480540600660ccttcatgat gagggatgct ccccctgccg cagctaccag cattcatcca gcggcggcag 720gcgagagggc aggggatgcg gcagtgcagc cgcaggcccc accccggacg gggcttccac 780tgtggatggt gagccacatc aacggctgaa gggcttccag cccatataag cgtactattc 840agtagagagt aacaagttgc accggccagt ctggtgtatg ttgcggttgc tagcacgcct 900gaccccttgg aggggaaagg aaaagaaatc agagtaaagt agcaagctgc agcgatgtgt 960atatttcact ttgtccaccc cagtttccct cccagctggg ctcaatttac catgtaatct 1020atatgtagct tgagtgatga attttcaagt ttccatgata cccgtctcta gtgggatgtt 1080gtttatgtga attaacctat caaatatgag cattgtgtat attgtgattc ttgaaaataa 1140ataaatcagg atctttgtct t 1161

<210> 57<211> 244<212> PRT

<213> Triticum aestivum<400> 57

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn15 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala

20 25 30

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80

Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Asn

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln

165 170 175

Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser

180 185 190

Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala Ala Ala Thr

195 200 205

Ser Ile His Pro Ala Ala Ala Gly Glu Arg Ala Gly Asp Ala Ala Val

210 215 220

Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp Met Val Ser225 230 235 240

His Ile Asn Gly

<210> 58<211> 1210<212> DNA

<213> Triticum aestivum<400> 58

tccctctcct ccctctcttc cgcctcaccc aaccacctga cagccatggc tccgcccccc 60

cgcccccgcc tgcgcctgtc ggagtagccg tcgcggtctg ccggtgttgg aggcttgggg 120

tgtagggttg gccccgttct ccagcggaga tggggcgcgg gaaggtgcag ctgaagcgga 180

tcgagaacaa gatcaaccgg caggtgacct tctccaagcg ccgctcgggg ctgctcaaga 240

aggcgcacga gatctccgtg ctctgcgacg ccgaggtcgg cctcatcatc ttctccacca 300

agggaaagct ctacgagttc tccaccgagt catgtatgga caaaattctt gaacggtatg 360

agcgctactc ttatgcagaa aaggttctcg tttcaagtga atctgaaatt cagggaaact 420

ggtgtcacga atataggaaa ctgaaggcga aggttgagac aatacagaaa tgtcaaaagc 480

atctgatggg agaggatctt gaatctttga atctcaagga gttgcagcaa ctggagcagc 540

agctggaaag ctcactgaaa catatcagat ccaggaagaa ccaacttatg cacgaatcca 600

tttctgagct tcagaagaag gagaggtcac tgcaggagga gaataaagtt ctccagaagg 660

aactcgtcga gaagcagaag gcccaggcgg cgcaacaaga tcagactcag cctcaaacaa 720gctcttcttc ttcttccttc atgatgaggg atgctccccc tgccgcaact accagcattc 780

atccagcggc atcaggagag agggcagagg atgcggcagt gcagccgcag gccccacccc 840

ggacggggct tccactgtgg atggttagcc acatcaacgg ctgaagggct tccagcccat 900

ataagcgtac tattcagtag agagtaacaa gttgcaccgg ccagcctggt gtatgttgcg 960

gttgctagca tgcctgaccc cttggagggg aaaggaaaag aaatcagagt aaagtagcaa 1020

gctgcagtga tgtgtatatt tcactttgtc cacctcagtt tccctcccag ctgggctcaa 1080

tttaccatgt aatctatatg tagcttgagt gatgaatttt caagtttcca tgatacccgt 1140

ctcgagcggg tgttgtttat gtgaattaac ctatcaaata tgagcattgt gtaaaaaaaa 1200

aaaaaaaaaa 1210<210> 59<211> 244

<212> PRT <213> Triticum ,aestivum <400> 59 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu . Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Asn 130 135 140 Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser 180 185 190 Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala Ala Thr Thr 195 200 205 Ser Ile His Pro Ala Ala Ser Gly Glu Arg Ala Glu Asp Ala Ala Val 210 215 220 Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp Met Val Ser225 230 235 240His Ile Asn Gly

<210> 60<211> 735<212> DNA

<213> Triticum monococcum<400> 60

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgacc 60

ttctccaagc gccgctcggg gcttctcaag aaggcgcacg agatctccgt gctctgcgac 120

gccgaggtcg gcctcatcat cttctccacc aagggaaagc tctacgagtt ctccaccgag 180

tcatgtatgg acaaaattct tgaacggtat gagcgctatt cttatgcaga aaaggttctc 240

gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg aatataggaa actgaaggcg 300

aaggttgaga caatacagaa atgtcaaaaa catctcatgg gagaggatct tgaatctttg 360

aatctcaagg agttgcagca actggagcag cagctggaaa gctcactgaa acatatcaga 420

tccaggaaga accaacttat gcacgaatcc atttctgagc tgcagaagaa ggagaggtca 480

ctgcaggagg agaataaagt tctccagaag gaactcgtgg agaagcagaa ggcccatgcg 540

gcgcagcaag atcaaactca gcctcaaacc agctcttctt cttcttcctt catgctgagg 600

gatgctcccc ctgccgcaaa taccagcatt catccagcgg cggcaggcga gagggcagag 660

gatgcggcag tgcagccgca ggccccaccc cggacggggc ttccaccgtg gatggtgagc 720cacatcaacg ggtga<210> 61<211> 244<212> PRT

<213> Triticum monococcum<400> 61

Met Gly Arg Gly Lys Val Gln Leu1 5

Arg Gln Val Thr Phe Ser Lys Arg20

His Glu Ile Ser Val Leu Cys Asp

35 40

Ser Thr Lys Gly Lys Leu Tyr Glu

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg65 70

Val Ser Ser Glu Ser Glu Ile Gln85

Lys Leu Lys Ala Lys Val Glu Thr100

Met Gly Glu Asp Leu Glu Ser Leu115 120

Glu Gln Gln Leu Glu Ser Ser Leu

130 135

Gln Leu Met His Glu Ser Ile Ser145 150

Leu Gln Glu Glu Asn Lys Val Leu165

Lys Ala His Ala Ala Gln Gln Asp180

Ser Ser Ser Ser Phe Met Leu Arg195 200

Ser Ile His Pro Ala Ala Ala Gly

210 215

Gln Pro Gln Ala Pro Pro Arg Thr225 230

His Ile Asn Gly

735

Lys Arg Ile Glu Asn Lys Ile Asn 10 15 Arg Ser Gly Leu Leu Lys Lys Ala25 30 Ala Glu Val Gly Leu Δ R Ile Ile PhePhe Ser Thr Glu 4 D Ser Cys Met Asp 60 Tyr Ser Tyr Ala Glu Lys Val Leu 75 80Gly Asn Trp Cys His Glu Tyr Arg 90 95 Ile Gln Lys Cys Gln Lys His Leu105 110 Asn Leu Lys Glu Leu Gln Gln Leu 125 Lys His Ile Arg Ser Arg Lys Asn 140 Glu Leu Gln Lys Lys Glu Arg Ser 155 160Gln Lys Glu Leu Val Glu Lys Gln 170 175 Gln Thr Gln Pro Gln Thr Ser Ser185 190 Asp Ala Pro Pro Ala Ala Asn Thr 205 Glu Arg Ala Glu Asp Ala Ala Val 220 Gly Leu Pro Pro Trp Met Val Ser 235 240

<210> 62<211> 735<212> DNA<213> Triti<400> 62atggggcgggttctccaagcgccgaggtcgtcatgtatgggtttcaagtgaaggttgagaaatctcaaggtccaggaagactgcaggagggcgcagcaaggatgctccccgatgcggcagcacatcaacg<210> 63<211> 244<212> PRT<213> Triti<400> 63Met Gly Arg1

cum aestivum

ggaaggtgcagccgctcggggcctcatcatacaaaattctaatctgaaatcaatacagaaagttgcagcaaccaacttatagaataaagtatcaaactcactgccgcaaatgcagccgcaggtga

gctgaagcgggcttctcaagcttctccacctgaacggtattcagggaaacatgtcaaaagactggagcaggcacgaatcctctccagaaggcctcaaacctaccagcattggccccaccc

atcgagaacaaaggcgcacgaagggaaagcgagcgctatttggtgtcacgcatctcatggcagctggaaaatttctgagcgaactcgtggagctcttcatcatccagcggcggacggggc

agatcaaccgagatctccgttctacgagttcttatgcagaaatataggaagagaggatctgctcactgaattcagaagaaagaagcagaacttcttccttcaacaggcgattccaccgtg

gcaggtgaccgctctgcgacctccaccgagaaaggttctcactgaaggcgtgaatctttgacatatcagaggagaggtcaggcccatgcgcatgctgagggagggcagaggatggtgagc

cum aestivum

Gly Lys Val Gln Leu Lys Arg Ile5 10

60120180240300360420480540600660720735

Glu Asn Lys Ile Asn15His Ile Asn Gly<210> 64<211> 738<212> DNA

<213> Lolium perenne<400> 64

atggggcgcg gcaaggtgca gctcaagcgg atcgagaacattctccaagc gccgctcggg gctgctcaag aaggcgcacggccgaggtcg ggctcatcat cttctccacc aagggaaagctcatgtatgg acaaaattct tgagcggtat gagcgctactatttcaaccg aatctgaaat tcagggaaac tggtgtcatgaaggttgaga caatacagag atgtcaaaag catctaatggaatctcaagg agttgcagca actagagcag cagctggaaagccagaaaga accagcttat gcacgaatcc atatctgagcctgcaggagg agaataaaat tctccagaag gaactcatagcagcaagcgc agtgggagca aactcagccc caaaccagctatgggggaag ctaccccagc aacaaattgc agtaatccccgcagaggatg cgacggggca gccttcagct cgcacggtgccacatcaaca atggctga<210> 65<211> 245<212> PRT

<213> Lolium perenne<400> 65

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly

Ser Gly Leu Leu Lys Lys Ala 30 Glu Val Gly Leu δ ^ Ile Ile PheSer Thr Glu *± 3 Ser Cys Met Asp 60 Ser Tyr Ala Glu Lys Val Leu 75 80Asn Trp Cys His Glu Tyr Arg90 95 Gln Lys Cys Gln Lys His Leu 110 Leu Lys Glu Leu Gln Gln Leu 125 His Ile Arg Ser Arg Lys Asn 140 Leu Gln Lys Lys Glu Arg Ser 155 160Lys Glu Leu Val Glu Lys Gln170 175 Thr Gln Pro Gln Thr Ser Ser 190 Ala Pro Pro Ala Ala Asn Thr 205 Arg Ala Glu Asp Ala Ala Val 220 Leu Pro Pro Trp Met Val Ser 235 240

agatcaaccgagatctccgttctacgagttcctatgcagaaatataggaagagaggatctgttcactgaattcaaaagaaagaagcagaacttcctcctccagcagcggcttccaccatg

ccaggtcaccgctctgcgaccgcaaccgacgaaagtgctcactgaaggcgtgaatcattgacatattagaggagaggtcaggcccacacgctcctttatgcagcgacagagatggtgagt

20

25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35

40

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr

50

55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr

65

70

75

Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp

Glu Asn Lys Ile Asn15

Leu Leu Lys Lys Ala30

Gly Leu Ile Ile Phe45

Asp Ser Cys Met Asp60

Ala Glu Lys Val Leu80

Cys His Glu Tyr Arg

6012018024030036042048054060066072073885 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ala Arg Lys Asn

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln

165 170 175

Lys Ala His Thr Gln Gln Ala Gln Trp Glu Gln Thr Gln Pro Gln Thr

180 185 190

Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr

195 200 205

Asn Cys Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala

210 215 220

Thr Gly Gln Pro Ser Ala Arg Thr Val Leu Pro Pro Trp Met Val Ser225 230 235 240

His Ile Asn Asn Gly245

<210> 66<211> 738<212> DNA

<213> Lolium temulentum<400> 66

atggggcgcg gcaaggtgca gctcaagcgg atcgagaaca agatcaaccg ccaggtcacc 60

ttctccaagc gccgctcagg cctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gcagaggtcg ggctcatcat cttctccacc aagggaaagc tctacgagtt cgccaccgac 180tcatgtatgg acaaaattct tgagcggtat gagcgctact cctatgcaga gaaagtgctc 240atttcaactg aatctgaaat tcagggaaac tggtgtcatg aatataggaa actgaaggcg 300aaggttgaga caatacagag atgtcaaaag catctaatgg gagaggatct tgaatcattg 360aatctcaagg agttgcagca actagagcag cagctggaaa gttcactgaa acatattaga 420tccagaaaga gccagcttat gcacgaatcc atatctgagc ttcaaaagaa ggagaggtca 480ctgcaagagg agaataaaat tctccagaag gaactcatag agaagcagaa ggcccacacg 540cagcaagcgc agttggagca aactcagccc caaaccagct cttcctcctc ctcctttatg 600atgggggaag ctaccccagc aacaaatcgc agtaatcccc cagcagcggc cagcgacaga 660gcagaggatg cgacggggca gcctccagct cgcacggtgc ttccaccatg gatggtgagt 720cacctcaaca atggctga 738

<210> 67<211> 245<212> PRT

<213> Lolium temulentum<400> 67

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala

20 25 30

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr Asp Ser Cys Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80

Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln

165 170 175

Lys Ala His Thr Gln Gln Ala Gln Leu Glu Gln Thr Gln Pro Gln Thr

180 185 190

Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr

195 · 200 205

Asn Arg Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala

210 215 220

Thr Gly Gln Pro Pro Ala Arg Thr Val Leu Pro Pro Trp Met Val Ser225 230 235 240

His Leu Asn Asn Gly245

<210> 68<211> 738<212> DNA<213> Zea mays<400> 68

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg ccaggtgacc 60

ttctccaagc gccgctcggg gctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gccgaggtcg cgctcatcat cttctccacc aaagggaagc tctacgagta ttccaccgat 180tcatgtatgg acaaaattct tgaccggtac gagcgctact cctatgcaga aaaggttctt 240atttcagcag aatctgaaac tcagggcaat tggtgccacg agtatagaaa actaaaggcg 300aaggtcgaga caatacaaaa atgtcaaaag cacctcatgg gagaggatct tgaaacgttg 360aatctcaaag agcttcagca actagagcag cagctggaga gttcactgaa acatatcaga 420accaggaaga accaacttat gctcgagtca atttcggagc tccaacggaa ggagaagtcg 480ctgcaggagg agaacaaggt tctgcagaag gagctcgcgg agaagcagaa agcccagcgg 540aagcaagtgc aatggggcca aacccaacag cagaccagtt cgtcttcctc gtgcttcgtg 600ataagggaag ctgccccaac aacaaatatc agcatttttc ctgtggcagc aggcgggagg 660ttggtggaag gtgcagcagc gcagccacag gctcgcgttg gactaccacc atggatgctt 720agccacctga gcagctga 738

<210> 69<211> 245<212> PRT<213> Zea mays<400> 69

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ser Thr Asp Ser Cys Met Asp 50 55 60 Lys Ile Leu Asp Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Thr Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Thr Arg Lys Asn 130 135 140 Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Ala Glu Lys Gln 165 170 175 Lys Ala Gln Arg Lys Gln Val Gln Trp Gly Gln Thr Gln Gln Gln Thr 180 185 190 Ser Ser Ser Ser Ser Cys Phe Val Ile Arg Glu Ala Ala Pro Thr Thr 195 200 205 Asn Ile Ser Ile Phe Pro Val Ala Ala Gly Gly Arg Leu Val Glu Gly210 215

Ala Ala Ala Gln Pro Gln Ala Arg Val Gly Leu225 230 235

Ser His Leu Ser Ser245

<210> 70<211> 738<212> DNA<213> Zea mays<400> 70

atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccgctcggg gctactcaag aaggcgcacggccgaggtcg cgctcatcat cttctccacc aagggcaagctcatgtatgg acaaaattct tgaacggtat gagcgctactatttccgcag aatatgaaac tcagggcaat tggtgccatgaaggtcgaga caatacagaa atgtcaaaag cacctcatggaatctcaaag agcttcagca actagagcag cagctggagaacaaggaaga gccagcttat ggtcgagtca atttcagcgcctgcaggagg agaacaaggt tctgcagaag gagctcgcggcagcaagtgc aacgggacca aactcaacag cagaccagttttaagggaag ctgccccaac aacaaatgtc agcatcttccgtggtggaag gggcagcagc gcagccgcag gctcgcgttgagccatctga gctgctga<210> 71<211> 245<212> PRT<213> Zea mays<400> 71

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Thr Lys Gly Lys. Leu Tyr Glu Tyr Ser Thr

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Ile Ser Ala Glu Tyr Glu Thr Gln Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys

100 105

Met Gly Glu Asp Leu Glu Thr Leu Asn Leu Lys

115 120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130 135

Gln Leu Met Val Glu Ser Ile Ser Ala Leu Gln145 150 155

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu

165 170

Lys Asp Gln Arg Gln Gln Val Gln Arg Asp Gln

180 185

Ser Ser Ser Ser Thr Ser Phe Met Leu Arg Glu

195 200

Asn Val Ser Ile Phe Pro Val Ala Ala Gly Gly

210 215

Ala Ala Ala Gln Pro Gln Ala Arg Val Gly Leu225 230 235

Ser His Leu Ser Cys245

<210> 72<211> 762<212> DNA

220

Pro Pro Trp Met Leu240

agatcaaccgagatctccgttctacgagtacctatgcagaaatatagaaagagaggatctgttcactgaatccaacggaaagaagcagaacgtcttccacctgtggcagcgactgccacc

ccaggtgacagctctgcgacctctaccgataaaggttctcactaaaggcgtgaaactttgacatatcagaggagaagtcaagaccagcgggtccttcatgaggcgggaggatggatgctt

Glu Asn

Leu Leu

Ala Leu

45Asp Ser60

Ala Glu

Cys His

Cys Gln

Glu Leu125Arg Thr140

Arg Lys

Leu Ala

Thr Gln

Ala Ala205Arg Val220

Pro Pro

Lys Ile

15Lys Lys30

Ile Ile

Cys Met

Lys Val

Glu Tyr

95Lys His110

Gln Gln

Arg Lys

Glu Lys

Glu Lys175Gln Gln190

Pro ThrVal GluTrp Met

Asn

Ala

Phe

Asp

Leu80Arg

Leu

Ser

Ser160Gln

Thr

Gly

Leu240

60120180240300360420480540600660720738<213> Oryza sativa<400> 72

atggggcggg gcaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgaccttctccaagc gcaggtcggg gctgctcaag aaggcgaatg agatctccgt gctctgcgacgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagta cgccaccgactcatgtatgg acaaaatcct tgaacgttat gagcgctact cctatgcaga aaaggtccttatttcagctg aatctgacac tcagggcaac tggtgccacg aatataggaa actgaaggctaaggttgaga caatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttgaatctcaaag agctgcagca gctggagcag cagctggaaa attcgttgaa acatatcagatccagaaaga gccaactaat gctcgagtcc attaacgagc ttcaacggaa ggaaaagtcactgcaggagg agaataaggt cctacagaaa gaaaaccctt gctccttcct acagctggtggagaagcaga aagtccagaa gcaacaagtg caatgggacc agacacaacc tcaaacaagttcctcatcat cctccttcat gatgagggaa gcccttccaa caactaatat cagtaactaccctgcagcag ctggcgaaag gatagaggat gtagcagcag ggcagccaca gcatgttcgcattgggctgc caccatggat gctgagccac atcaacggct aa<210> 73<211> 253<212> PRT

<213> Oryza sativa<400> 73

Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn5 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu

Met1

20

25

Asn Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35

40

Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

50

55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr

65

70

75

Ile Ser Ala Glu Ser Asp Thr Gln Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys

115 120

Glu Gln Gln Leu Glu Asn Ser Leu Lys His Ile

130 135

Gln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln145 150 155

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu

165 170

Leu Gln Leu Val Glu Lys Gln Lys Val Gln Lys

180 185

Asp Gln Thr Gln Pro Gln Thr Ser Ser Ser Ser

195 200

Arg Glu Ala Leu Pro Thr Thr Asn Ile Ser Asn

210 215

Gly Glu Arg Ile Glu Asp Val Ala Ala Gly Gln225 230 235

Ile Gly Leu Pro Pro Trp Met Leu Ser His Ile245 250

<210> 74

<211> 741

<212> DNA

<213> Oryza sativa

<400> 74

atggggcggg gcaaggtgca gctgaagcgg atcgagaacattctccaagc gcaggtcaaa actgctcaag aaggcgaatggccgaggtcg cgctcatcat cttctccacc aagggcaagctcatgtatgg acaaaatcct tgaacgttat gagcgctactatttcagctg aatctgacac tcagggcaac tggtgccacgaaggttgaga caatacagaa atgtcaaaag cacctcatgg

Ala Leu45

Asp Ser60

Ala Glu

Cys His

Cys Gln

Glu Leu125Arg Ser140

Arg Lys

Asn Pro

Gln Gln

Ser Ser205Tyr Pro220

Pro GlnAsn Gly

Lys

30

Ile

Cys

Lys

Glu

Lys110Gln

Arg

Glu

Cys

Val190Phe

Ala

His

Ile Asn15

Lys Ala

Ile Phe

Met Asp

Val Leu80Tyr Arg95

His Leu

Gln Leu

Lys Ser

Lys Ser160Ser Phe175

Gln Trp

Met Met

Ala Ala

Val Arg240

agatcaaccgagatctccgttctacgagtacctatgcagaaatataggaagagaggatct

gcaggtgaccgctctgcgaccgccaccgacaaaggtccttactgaaggcttgaatctttg

60120180240300360420480540600660720762

60120180240300360aatctcaaag agctgcagca gctggagcag cagctggaaatccagaaaga gccaactaat gctcgagtcc attaacgagcctgcaggagg agaataaggt cctacagaaa gaactggtggcaacaagtgc aatgggacca gacacaacct caaacaagttatgagggaag cccttccaac aactaatatc agtaactaccatagaggatg tagcagcagg gcagccacag catgaacgcactgagccaca tcaacggcta a<210> 75<211> 246<212> PRT

attcgttgaattcaacggaaagaagcagaacctcatcatcctgcagcagcttgggctgcc

acatatcagaggaaaagtcaagtccagaagctccttcatgtggcgaaaggaccatggatg

420480540600660720741

<400> 75 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Lys Leu Leu Lys Lys Ala 20 25 30 Asn Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser Asp Thr Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Asn Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 Gln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Lys Val Gln Lys Gln Gln Val Gln Trp Asp Gln Thr Gln Pro Gln Thr 180 185 190 Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr 195 200 205 Asn Ile Ser Asn Tyr Pro Ala Ala Ala Gly Glu Arg Ile Glu Asp Val 210 215 220 Ala Ala Gly Gln Pro Gln His Glu Arg Ile Gly Leu Pro Pro Trp Met

225

235

230

Leu Ser His Ile Asn Gly245

<210> 76<211> 735<212> DNA

<213> Dendrocalamus latiflorus<400> 76

atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccggtcggg gctgctcaag aaggcgcatggccgaggtcg gccttatcat cttctccacc aagggcaagctcatgtatgg acaaaattct tgaacggtac gagcgttactatttcagccg aatctgaaac tcagggcaac tggtgtcacgaaggttgaga cgatacagaa atgtcaaaag cacctcatggaatctcaagg agctgcagca actcgagcag cagctggaaatccagaaaga gccagcttat gctcgagtcc atttccgagcctgcaggagg agaacaaggt tctgcagaag gaactcgtggcggttagtgc aatgggacca aactcagccg caaactagttatgagggaag ctctcccaac aacaaatatc agtatttacggcagaggacg cagcagggca gcctcagatt cacattgggccacatcaacg gctaa<210> 77

240

agatcaaccgagatctccgttctacgagtacctatgcagaaatataggaagagaggatccgttcagtgaattcaaaagaaagaagcagcacctcttcctcctgcggcagctgccgccatg

gcaagtgactcctctgcgaccgccaccgacaaaggttcttactgaaggcgtgaatctttgacatatcagaggagaagtcaggtccataaagtccttcatgcggcgagagggatggtgagc

60120180240300360420480540600660720735<211> 244<212> PRT

<213> Dendrocalamus<400> 77

Iatiflorus

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Pro Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Val Lys His Ile Arg Ser Arg Lys Ser 130 135 140 Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Gln Val His Lys Arg Leu Val Gln Trp Asp Gln Thr Gln Pro Gln Thr 180 185 190 Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr 195 200 205 Asn Ile Ser Ile Tyr Ala Ala Ala Ala Gly Glu Arg Ala Glu Asp Ala 210 215 220 Ala Gly Gln Pro Gln Ile His Ile Gly Leu Pro Pro Trp Met Val Ser225 230 235 240His Ile Asn Gly

<210> 78<211> 735<212> DNA

<213> Dendrocalamus Iatiflorus<400> 78

atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccggtcggg gctgctcaag aaggcgcatggccgaggtcg gccttatcat cttctccacc aagggcaagctcatgtatgg acaaaattct tgaacggtac gagcgttactatttcagccg aatctgaaac tcagggcaac tggtgtcacgaaggttgaga cgatacagaa atgtcaaaag cacctcatggaatctcaagg agctgcagca actcgagcag cagctggaaatccagaaaga gccagcttat gctcgagtcc atttccgagcctgcaggagg agaacaaggt tctgcagaag gaactcgtggcggttagtgc aatgggacca aactcagccg caaactagttatgagggaag ctctcccaac aacaaatatc agtatttacggcagaggacg cagcagggca gcctcagatt cacattgggccacatcaacg gctaa<210> 79<211> 244<212> PRT

<213> Dendrocalamus Iatiflorus<400> 79

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly20 25

agatcaaccgagatctccgttctacgagtacctatgcagaaatataggaagagaggatctgttcagtgaattcaaaagaaagaagcagca

CCtCttCCtC

ctgcggcagctgccgccatg

Glu Asn Lys Ile Asn15

Leu Leu Lys Lys Ala30

60120180240300360420480540600660720735His Glu Ile Ser35

Ser Thr Lys Gly50

Lys Ile Leu Glu65

Ile Ser Ala Glu

Lys Leu Lys Ala100

Met Gly Glu Asp115

Glu Gln Gln Leu130

Gln Leu Met Leu145

Leu Gln Glu Glu

Gln Val His Lys180

Ser Ser Ser Ser195

Asn Ile Ser Ile210

Ala Gly Gln Pro225

His Ile Asn Gly

80

Val Leu CysLysArg

40

Ser

85

Lys

Leu

Glu

Asn165Arg

Ser

Tyr

Gln

Leu Tyr

55Tyr Glu70

Glu Thr

Val Glu

Glu Ser

Ser Ser135Ser Ile150

Lys Val

Leu Val

Ser Phe

Ala Ala215Ile His230

120

200

Ala Glu Val Gly Leu 45 Ile Ile PheTyr Ala Thr Asp 60 Ser Cys Met AspTyr Ser Tyr 75 Ala Glu Lys Val Leu 80Gly Asn 90 Trp Cys His Glu Tyr 95 ArgIle Gln Lys Cys Gln Lys His Leu105 110 Asn Leu Lys Glu Leu 125 Gln Gln LeuLys His Ile Arg 140 Ser Arg Lys SerGlu Leu Gln 155 Lys Lys Glu Lys Ser 160Gln Lys 170 Glu Leu Val Glu Lys 175 GlnTrp Asp Gln Thr Gln Pro Gln Thr185 190 Met Arg Glu Ala Leu 205 Pro Thr ThrAla Gly Glu Arg 220 Ala Glu Asp AlaGly Leu Pro 235 Pro Trp Met Val Ser 240

<210><211> 813<212> DNA<213> Zea mays<400> 80

atggggcgcg gcaaggtgca gctgaagcgg atagagaacattctccaagc gccggaacgg gctgctgaag aaggcgcacggccgaggtcg ccgtcatcgt cttctccccc aagggcaagctcccgcatgg acaaaattct agaacgttat gagcgatattatttcagctg aatctgaaag tgagggaaat tggtgccacgaaaattgaga ccatacaaag atgccacaag cacctgatggaatccaaaag agctccaaca actagagcag cagctggagatcaagaaaga gccaccttat ggccgagtca atttctgagcctgcaggagg agaacaagat tctacagaag gaactttcagagccggcagc agcagcagca gcaggtgcag tgggaccagcacaagctcat cgtcttcttc cttcatgatg aggcaggatccaaaacatct gcttcccgcc gttgagcatc ggagagagaggcgcagcagc agctgcctcc tccggggcag gcgcaaccacccgccatgga tgctgagcca cctcaatgca taa<210> 81<211> 270<212> PRT<213> Zea mays<400> 81

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly

agataaaccgagatctccgttctacgagtacctatgctgaaatacaggaagagaggatctgctcactgaatacagaagaaagaggcagaaagacacaggtagcagggactgcgaagaggtagctccgcat

gcaggtgacccctctgcgaccgcctccgacaaaggctcttactgaaggccagagtctttggcacatcagaggagaggtcaggcggtcgctccaggtccaggccacctccaggctgcggcgcgcaggtctg

20

25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35

40

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Ser

50

55

Lys

65

Ile

Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr

70 75

Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp

Glu Asn Lys Ile Asn1 5

Leu Leu Lys Lys Ala30

Ala Val Ile Val Phe45

Asp Ser Arg Met Asp60

Ala Glu Lys Ala Leu80

Cys His Glu Tyr Arg

6012018024030036042048054060066072078081385 90 95

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Arg Cys His Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser

130 135 140

His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ser Glu Arg Gln

165 170 175

Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln Gln Val Gln Trp Asp

180 185 190

Gln Gln Thr Gln Val Gln Val Gln Thr Ser Ser Ser Ser Ser Ser Phe

195 200 205

Met Met Arg Gln Asp Gln Gln Gly Leu Pro Pro Pro Gln Asn Ile Cys

210 215 220

Phe Pro Pro Leu Ser Ile Gly Glu Arg Gly Glu Glu Val Ala Ala Ala225 230 235 240

Ala Gln Gln Gln Leu Pro Pro Pro Gly Gln Ala Gln Pro Gln Leu Arg

245 250 255

Ile Ala Gly Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265 270

<210> 82<211> 689<212> DNA

<213> Sorghum bicolor<400> 82

gcaaggtgca gctcaagcgg atagagaaca agataaaccg gcaggtgacc ttctccaagc 60

gccgcaacgg gctgctcaag aaggcgcacg agatctccgt cctctgcgac gccgaggtcg 120ccgtcatcgt cttctccccc aagggcaagc tctatgagta cgccaccgac tcccgcatgg 180acaaaattct cgaacgttat gagcgatatt cctatgctga aaaggctctt atttcagctg 240aatctgaaag tgagggaaac tggtgccacg aatacaggaa actgaaggcc aaaattgaga 300ccattcaaaa atgccacaag cacctgatgg gagaggatct agagtctttg aatcccaaag 360agctccaaca actagagcag cagctggaga gctcactgaa gcacatcaga tcaagaaaga 420gccaccttat ggctgagtct atttctgaac tacagaagaa ggagaggtca ctgcaggagg 480agaacaaggc tctacagaag gaacttgcgg agaggcagaa ggcggccgcg agcaggcagc 540agcagcaagg tgcagtggga ccagcagaca cagacccagg cccagacaag ctcatcatcg 600tcctccttca tgatgaggca ggatcagcag ggtctgccgc ctccacaaaa catatgcttc 660ccgccgctga taatcggaga gagaggtga 689

<210> 83<211> 228<212> PRT

<213> Sorghum bicolor<400> 83

Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn Arg Gln Val Thr15 10 15

Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala His Glu Ile Ser

20 25 30

Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe Ser Pro Lys Gly

35 40 45

Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp Lys Ile Leu Glu

50 55 60

Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Ile Ser Ala Glu65 70 75 80

Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg Lys Leu Lys Ala

85 90 95

Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu Met Gly Glu Asp

100 105 110

Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu

115 120 125

Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser His Leu Met Ala130 135 140Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg145 150 155

Asn Lys Ala Leu Gln Lys Glu Leu Ala Glu Arg

165 170

Ser Arg Gln Gln Gln Gln Gly Ala Val Gly Pro

180 185

Gly Pro Asp Lys Leu Ile Ile Val Leu Leu His

195 200

Ala Gly Ser Ala Ala Ser Thr Lys His Met Leu

210 215

Arg Arg Glu Arg225

<210> 84<211> 822<212> DNA<213> Zea mays<400> 84

atggggcgcg gcaaggtaca gctgaagcgg atagagaacattctccaagc gccggaacgg cctgctcaag aaggcgcacggccgaggtcg ccgtcatcgt cttctccccc aagggcaagctcccgcatgg acaaaattct tgaacgctat gagcgatattatttcagctg aatctgaaag tgagggaaat tggtgccacgaaaattgaga ccatacaaaa atgccacaag cacctgatggaatcccaaag agctccagca actagagcag cagctggatatcaaggaaga gccaccttat ggccgagtct atttctgagcctgcaggagg agaacaaggc tctgcagaag gaacttgcggagccggcagc agcagcaaca gcagcaggtg cagtgggacccagacaagct catcatcgtc ctccttcatg atgaggcaggccacacaaca tctgcttccc gccgttgaca atgggagatagcggcggcgg cgcagcagca gcagccactg ccggggcagggcaggtctgc caccatggat gctgagccac ctcaatgcat<210> 85<211> 273<212> PRT<213> Zea mays<400> 85

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys

115 120

Glu Gln Gln Leu Asp Ser Ser Leu Lys His Ile

130 135

His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln145 150 155

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu

165 170

Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln

180 185

Asp Gln Gln Thr His Ala Gln Ala Gln Thr Ser

195 200

Phe Met Met Arg Gln Asp Gln Gln Gly Leu Pro

Ser Leu Gln Glu Glu160

Gln Lys Ala Ala Ala175

Ala Asp Thr Asp Pro190

Asp Glu Ala Gly Ser205

Pro Ala Ala Asp Asn220

agataaaccgagatctccgttctacgagtacctatgctgaaatacaggaagagaggatctgctcactgaatacagaagaaagaggcagaaagcagacacaatcagcaggggaggtgaagacgcaaccgcaaa

gcaggtgacccctctgcgatcgccaccgacaaaggctcttactgaaggccagagtctttggcacatcagaggagaggtcaggccgtcgcgtgcccaggccactgccgcctgctggctgcggctccgcatc

Glu Asn

Leu Leu

Ala Val45

Asp Ser60

Ala Glu

Cys His

Glu Leu125Arg Ser140

Lys Lys

Leu Ala

Gln Gln

Ser Ser205Pro Pro

Lys Ile

15Lys Lys30

Ile Val

Arg Met

Lys Ala

Glu Tyr

95Lys His110

Gln Gln

Arg Lys

Glu Arg

Glu Arg175Val Gln190

Ser Ser

Asn

Ala

Phe

Asp

Leu80Arg

Leu

Ser

Ser160Gln

60120180240300360420480540600660720780822

TrpSerHis Asn Ile210 215

Cys Phe Pro Pro Leu Thr Met Gly Asp Arg Gly225 230 235

Ala Ala Ala Ala Gln Gln Gln Gln Pro Leu Pro

245 250

Gln Leu Arg Ile Ala Gly Leu Pro Pro Trp Met260 265

Ala

220

Glu Glu Leu Ala Ala240

Gly Gln Ala Gln Pro255

Leu Ser His Leu Asn270

<210> 86<211> 786<212> DNA

<213> Lolium temulentum<400> 86

atgggtcgcg gcaaggtgca gctgaagcgg atagagaaca agataaaccgttctccaagc gccgcaacgg gctactcaag aaggcgcacg agatctccgtgccgaggtcg ccgtcgtcgt cttctccccg aaagggaagc tctatgagtatccagcatgg acaaaattct tgaacgttat gaacgctact cttatgctgaatttcagctg aatctgaaag tgagggaaat tggtgccatg aatacaggaaaagattgaga ctatacaaaa atgtcacaag cacctcatgg gggaggatctaacctgaaag agctccaaca actagagcag cagctggaga gttcattgaatcgagaaaga gccaccttat gatggagtcc atttctgagc tacagaagaactccaggagg agaacaaggc tctacagaag gaactggtgg agaggcagaacagcagcagc aagagcagtg ggaccgtcag acccaaacac aacaagcccacaggcccaga cgagctcatc atcttcctcc ttcatgatga gggatcagcacaacaaaaca tctgttaccc gctggtgaca atgggtggag aggctgtggcgggcagcagg ggcagcttcg catcggaggc ctgccaccat ggatgctgaggcttga<210> 87<211> 261<212> PRT

<213> Lolium temulentum<400> 87

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val

35 40 45

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75

Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His

85 90

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His

100 105

Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys Glu Leu115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser

130 135 140

His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val

165 170

Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp Asp Arg

180 185

Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln Thr Ser195 200 205

Ser Ser Phe Met Met Arg Asp Gln Gln Ala His Ala Gln

210 215 220

Cys Tyr Pro Leu Val Thr Met Gly Gly Glu Ala Val Ala225 230 235

tcaggtgacacctctgcgaccgccactgacaaaggctttggctgaaggcgggagtgtctagcacatcagaggagcggtcaggcggccaggaaaccaacctggcccatgctcgcggcgccaccacctcaac

Lys Ile Asn15

Lys Lys Ala30

Val Val Phe

Ser Met Asp

Lys Ala Leu80

Glu Tyr Arg95

Lys His Leu110

Gln Gln Leu

Arg Lys Ser

Glu Arg Ser160

Glu Arg Gln175

Gln Thr Gln190

Ser Ser Ser

Gln Asn Ile

Ala Ala Pro240

60120180240300360420480540600660720780786Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu

245 250

Ser His Leu Asn Ala260

<210> 88<211> 786<212> DNA

<213> Lolium perenne<400> 88

atgggtcgcg gcaaggtgca gctgaagcgg atagagaacattctccaagc gccgcaacgg gctactcaag aaggcgcacggccgaggtcg ccgtcgtcgt cttctccccg aaagggaagctccagcatgg acaaaattct tgaacgttat gaacgctactatttcagctg aatctgaaag tgagggaaat tggtgccatgaagattgaga ctatacaaaa atgtcacaag cacctcatggaacctgaaag agctccaaca actagagcag cagctggagatcgagaaaga gccaccttat gatggagtcc atttctgagcctccaggagg agaacaaggc tctacagaag gaactggtggcagcagcagc aagagcagtg ggaccgtcag acccaaacaccaggcccaga cgagctcatc atcttcctcc ttcatgatgacaacaaaaca tctgttaccc gccggtgaca atgggtggaggggcagcagg ggcagcttcg catcggaggc ctgccaccatgcttga<210> 89<211> 261<212> PRT

<213> Lolium perenne<400> 89

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys

100 105

Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys

115 120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130 135

His Leu Met Met Glu Ser Ile Ser Glu Leu Gln145 150 155

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu

165 170

Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp

180 185

Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln

195 200

Ser Ser Phe Met Met Arg Asp Gln Gln Ala His

210 215

Cys Tyr Pro Pro Val Thr Met Gly Gly Glu Ala225 230 235

Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu

245 250

Ser His Leu Asn Ala260

<210> 90

Pro Pro Trp Met Leu255

agataaaccg tcaggtgacc 60agatctccgt cctctgcgac 120tctatgagta cgccactgac 180cttatgctga aaaggctttg 240aatacaggaa actgaaggcg 300gggaggatct ggagtgtcta 360gttcattgaa gcacatcaga 420tacagaagaa ggagcggtca 480agaggcagaa ggcggccagg 540aacaagccca aaaccaacct 600gggatcagca ggcccatgct 660aggctgtggc cgcggcgcca 720ggatgctgag ccacctcaac 780 786

Glu Asn Lys

Leu Leu Lys30

Ala Val Val45

Asp Ser Ser60

Ala Glu Lys

Cys His Glu

Cys His Lys110

Glu Leu Gln125

Arg Ser Arg140

Lys Lys Glu

Leu Val Glu

Asp Arg Gln190

Thr Ser Ser

205Ala Gln Gln220

Val Ala AlaPro Pro Trp

Ile Asn15

Lys Ala

Val Phe

Met Asp

Ala Leu80

Tyr Arg95

His Leu

Gln Leu

Lys Ser

Arg Ser160Arg Gln175

Thr Gln

Ser Ser

Asn Ile

Ala Pro240Met Leu255<211> 831<212> DNA

<213> Hordeum vulgare<400> 90

atgggtcgcg gtaaggtgca gctgaagcgg atagagaacattctccaagc gccgcaacgg gctcctgaag aaggcgcacggcagaggtcg ccgtcatcgt cttctccccc aaaggcaagctccagcatgg acaaaattct tgaacgttat gagcgctactatttcagctg aatctgaaag tgaggggaat tggtgtcatgaagattgaga ccatacagaa gtgtcacaag cacctcatggaacctcaaag aactccaaca actggagcag cagctggagatcgagaaaga gccatcttat gatggagtcc atttctgagcctgcaggagg agaacaaggc cctacagaag gaactggtggaggcagcagc agctgcagca gcagcaacaa caacaacaaacagacccaaa cccataccca tactcaaaac cagccccaagtcctctttca tgatgaggga tcagcaggcc catgcccctcccaccggtga cgatgggtgg ggaggcgacg gcggcggcggcagcttcgca tatgcctacc gccatggatg ctgagccacc<210> 91<211> 276<212> PRT

<213> Hordeum vulgare<400> 91

agataaatcgagatctccgttctatgagtacttatgctgaaatacaggaagagaggatctgttcattgaatacagaagaaagaggcagaatgcaatgggacccagactagaacagaacatcggcgccggatcaacgcttg

gcaggtgacccctctgtgaccgccaccgacaaaggctcttacttaaggcgggattctctggcacatcagaggagaggtcaggcggccagcgcaccaagccctcatcatctttgtagctacgcagcaggcta

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Ser Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Asp Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Ala Ala Ser Arg Gln Gln Gln Leu Gln Gln Gln Gln Gln Gln Gln 180 185 190 Gln Met Gln Trp Glu His Gln Ala Gln Thr Gln Thr His Thr His Thr 195 200 205 Gln Asn Gln Pro Gln Ala Gln Thr Ser Ser Ser Ser Ser Ser Phe Met 210 215 220 Met Arg Asp Gln Gln Ala His Ala Pro Gln Gln Asn Ile Cys Ser Tyr225 230 235 240Pro Pro Val Thr Met Gly Gly Glu Ala Thr Ala Ala Ala Ala Ala Pro 245 250 255 Glu Gln Gln Ala Gln Leu Arg Ile Cys Leu Pro Pro Trp Met Leu Ser 260 265 270 His Leu Asn Ala

60120180240300360420480540600660720780831

<210><211><212>

275

92

804

DNA

<213> Oryza sativa<400> 92

atggggcggg ggaaggtgca gctgaagcgg atagagaactttctccaaga ggaggaatgg attgctgaag aaggcgcacggccgaggtcg ccgccatcgt cttctccccc aagggcaagctccaggatgg acaaaatcct tgaacgttat gagcgctattatttcagctg aatctgagag tgagggaaat tggtgccatgaagattgaga ccatacaaaa atgtcacaaa cacctcatggaatctcaaag aactccaaca gctagagcag cagctggagatcaagaaaga gccaccttat gcttgagtcc atttccgagcctgcaggagg agaacaaggc tctgcagaag gaactggtggggccagcagc aagtagggca gtgggaccaa acccaggtccccccaagccc agacaagctt cttcttcttc ttcatgctgatcaccacaaa atatctgcta cccgccggtg atgatgggcccggcggcggt ggcggcccaa ggccaggtgc aacttccgcaatgctgagca ccttcaaggc ttaa<210> 93<211> 267<212> PRT<213> Oryza sativa<400> 93

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp

cgatgaaccgagatctccgttctacgagtacatatgctgaaatacaggaagagaggatctgttcattgaatgcagaaaaaagaggcagaaaggcccaggcgggatcagcaagagaaatgattggaggctt

gcaggtgacgcctctgcgaccgccactgacaaaggctcttgcttaaggcaagaatccctggcacataagaggagaggtcagaatgtgaggccaagcccaaggcacttctttgcggcggcgtccgccatgg

Glu Asn Ser

Leu Leu Lys30

Ala Ala Ile45

Ser Arg

Met Asn15

Lys AlaVal PheMet Asp

50

55

60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Ser Glu Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Ile Glu Thr Ile 105 Gln Lys Cys His Lys 110 His LeuMet Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115

120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130

135

His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln

Arg140Lys

125

Ser Arg Lys Ser

145

150

155

165

170

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu

TrpGln

Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln

180 185

Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala

195 200

Phe Phe Phe Met Leu Arg Asp Gln Gln Ala Leu

210 215

Ile Cys Tyr Pro Pro Val Met Met Gly Gln Arg225 230 235

Arg Arg Arg Trp Arg Pro Lys Ala Arg Cys Asn

245 250

Phe Pro Pro Trp Met Leu Ser Thr Phe Lys Ala260 265

<210> 94

<211> 804

<212> DNA

<213> Oryza sativa

<400> 94

atggggcggg ggaaggtgca gctgaagcgg atagagaacattctccaaga ggaggaatgg attgctgaag aaggcgcacggccgaggtcg ccgccatcgt cttctccccc aagggcaagctccaggatgg acaaaatcct tgaacgttat gagcgctatt

Leu220Asn

Phe

Lys Glu

Val Glu

Asp Gln190Thr Ser205

Ser ProAsp AlaArg Ile

Arg Ser160Arg Gln175

Thr Gln

Phe Phe

Gln Asn

Ala Ala240Gly Gly255

agatcaacag gcaggtgacgagatctccgt cctctgcgactctacgagta cgccactgaccatatgctga aaaggctctt

60120180240300360420480540600660720780804

60120180240atttcagctg aatccgagag tgagggaaat tggtgccatg aatacaggaa acttaaggca

aagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatca tgaatccctg

aatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataata

tcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca

ctgcaggagg agaacaaggc tctgcagaag gaactggtgg agaggcagaa gaatgtgagg

ggccagcagc aagtagggca gtgggaccaa acccaggtcc aggcccaggc ccaagcccaa

ccccaagccc agacaagctc ctcctcctcc tccatgctga gggatcagca ggcacttctt

ccaccacaaa atatctgcta cccgccggtg atgatgggcg agagaaatga tgcggcggcg

gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg

atgctgagcc acctcaatgc ttaa<210> 95<211> 267<212> PRT

<213> Oryza sativa<400> 95

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Asn Gly Leu Leu Lys 30 Lys AlaHis Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Ala Ala 45 Ile Val PheSer Pro 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Arg Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Ser Glu Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Ile Glu Thr Ile 105 Gln Lys Cys His Lys 110 His LeuMet Gly Glu Asp His Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115

120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130

135

His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln145 150 155

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu

165 170

Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln

180 185

Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala

195 200

Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu

210 215

Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg225 230 235

Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln

245 250

Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265

<210> 96<211> 668<212> DNA

<213> Tradescantia virginiana<400> 96

gggctggtga agaaggctca tgagatctcd atkytrtgtgattttctcta ctaaaggcaa actatacgag tatgccactgcttgaacgct atgaacgtta ctcatatgct gagaaggcttttacagggaa attggtgcca agagtatgtt aaacttaaggaaaagccaaa ggcatcttat gggagagcaa ctagaagcgtcaactagagc atcaacttga aggttctttg aggcttgtcaatgttggact ccatttccga acttcagagg aaggaaaagtaacctagaga aggagatttt ggagaagcag aaagaaaaggtgggaacagc agaatcagcc actacaaagc actaattcgc

125

Ile Ser Arg Lys Ser140

Lys Lys

Leu Val

Trp Asp

Gln Thr205Leu Pro220

Asn AspLeu Arg

Glu Arg Ser160

Glu Arg Gln175

Gln Thr Gln190

Ser Ser Ser

Pro Gln Asn

Ala Ala Ala240

Ile Gly Gly255

atgcygaggtattccaaaattaacttcatcctaaggttgatggatctcaaggtcaagaaactctggaagactctggcacactccaaggcc

tgcgcttattggaaaatatcagatcctgaaggccttacatagaattgcaggactcaaatggcaaaacaagccaagctcaccttcgtgatt

300360420480540600660720780804

60120180240300360420480540gcagaaactc atccaacact aaacattgga aatttccaag gtagaacaaa taccgtccat 600gcagaagaaa gtctgcagcg tcagatgagg atcagcagca gcctactgcc mycmtggatg 660mttcacma 668

<210> 97<211> 222<212> PRT

<213> Tradescantia virginiana<220>

<221> VARIANTE<222> (11) .. (11)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>

<221> VARIANTE<222> (218)..(218)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>

<221> VARIANTE<222> (221)..(221)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 97

Gly Leu Val Lys Lys Ala His Glu Ile Ser Xaa Leu Cys Asp Ala Glu15 10 15

Val Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala

20 25 30

Thr Asp Ser Lys Met Glu Asn Ile Leu Glu Arg Tyr Glu Arg Tyr Ser

35 40 45

Tyr Ala Glu Lys Ala Leu Thr Ser Ser Asp Pro Glu Leu Gln Gly Asn

50 55 60

Trp Cys Gln Glu Tyr Val Lys Leu Lys Ala Lys Val Glu Ala Leu His65 70 75 80

Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu Glu Ala Leu Asp Leu

85 90 95

Lys Glu Leu Gln Gln Leu Glu His Gln Leu Glu Gly Ser Leu Arg Leu

100 105 110

Val Arg Ser Arg Lys Thr Gln Met Met Leu Asp Ser Ile Ser Glu Leu

115 120 125

Gln Arg Lys Glu Lys Ser Leu Glu Glu Gln Asn Lys Asn Leu Glu Lys

130 135 140

Glu Ile Leu Glu Lys Gln Lys Glu Lys Ala Leu Ala His Gln Ala His145 150 155 160

Trp Glu Gln Gln Asn Gln Pro Leu Gln Ser Thr Asn Ser Pro Pro Arg

165 170 175

Pro Phe Val Ile Ala Glu Thr His Pro Thr Leu Asn Ile Gly Asn Phe

180 185 190

Gln Gly Arg Thr Asn Thr Val His Ala Glu Glu Ser Leu Gln Arg Gln

195 200 205

Met Arg Ile Ser Ser Ser Leu Leu Pro Xaa Trp Met Xaa His

210 215 220

<210> 98<211> 723<212> DNA

<213> Tradescantia virginiana<400> 98

gtgcagctga aacggatgga gaacaagatt aacaggcagg tgacgttttc taaacgtcga 60

ggagggctgc tgaagaaagc tcatgagatc tctattctat gtgatgctga gattgctctt 120attattttct ctactaaagg gaagctctat gagtatgcca ccaattccaa aatggacaat 180attcttgaac gctatgagcg ttactcatat gctgaaaagg ctctaacttc atcagatcct 240gatatacagg gaaattggtg ccaagagtat gctaaactta agtctaaggt tgaggcttta 300tgtaaaagcc aaaggcatct tatgggagag cagcttgaaa cattgaatct caaagaattg 360cagcaactag agcaacagct cgaaggttct ctaaagcatg tcaggtcaag aaagactcaa 420gttatgctgg actctatttc tgaacttcag aggaaggaaa agtcactaga ggagcaaaac 480aagaacctag agaaggagat tttggagaag cagaaaatca aggctcttgc acagcaggct 540cactgggaac accagaatca accagcacca aggggttcac ctcctaggcc atttgtgatt 600gcagagtctc atccgacact aaatattgga catttccaag gcaggacaaa tgcagtcgaa 660gcagaagaaa atcagcagcc tcakatgaga atttgcagta gcctcctgcc cccctggatg 720ctt 723

<210> 99<211> 241<212> PRT

<213> Tradescantia virginiana<220>

<221> INSEGURO<222> (228)..(228)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 99

Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn Arg Gln Val Thr Phe1 5 10 15 Ser Lys Arg Arg Gly Gly Leu Leu Lys Lys Ala His Glu Ile Ser Ile 20 25 30 Leu Cys Asp Ala Glu Ile Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys 35 40 45 Leu Tyr Glu Tyr Ala Thr Asn Ser . Lys Met Asp Asn Ile Leu Glu Arg 50 55 60 Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Thr Ser Ser Asp Pro65 70 75 80Asp Ile Gln Gly Asn Trp Cys Gln Glu Tyr Ala Lys Leu Lys Ser Lys 85 90 95 Val Glu Ala Leu Cys Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu 100 105 110 Glu Thr Leu Asn Leu Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu Glu 115 120 125 Gly Ser Leu Lys His Val Arg Ser Arg Lys Thr Gln Val Met Leu Asp 130 135 140 Ser Ile Ser Glu Leu Gln Arg Lys Glu Lys Ser Leu Glu Glu Gln Asn145 150 155 160Lys Asn Leu Glu Lys Glu Ile Leu Glu Lys Gln Lys Ile Lys Ala Leu 165 170 175 Ala Gln Gln Ala His Trp Glu His Gln Asn Gln Pro Ala Pro Arg Gly

180 185 190

Ser Pro Pro Arg Pro Phe Val Ile Ala Glu Ser His Pro Thr Leu Asn

195 200 205

Ile Gly His Phe Gln Gly Arg Thr Asn Ala Val Glu Ala Glu Glu Asn

210 215 220

Gln Gln Pro Xaa Met Arg Ile Cys Ser Ser Leu Leu Pro Pro Trp Met225 230 235 240

Leu

<210> 100<211> 599<212> DNA

<213> Tradescantia virginiana<4 00> 100

gggctkgtga agaaagctca tgagatctcg gtactttgtg atgctgagct tgctcttatt 60

atcttctctc ccaaaggcaa gctctatgag tatgccaccg attccaaaat ggaaattatt 120cttgaacgct atgaacgtta cacctacgct gaaaaagctt taattgcatc agatcctgat 180gtacagggaa actggtgtca tgagtacatt aagcttaaag ctaaatttga ggccttgaat 240aaaagccaga ggcatcttat gggagaacaa ctagatacgt tgaaccaaaa ggaattgctg 300caactagaga ctaagcttga aggttctctg aaaaacgtca ggtcaagaaa gactcaactt 360atgttggatt ccatttctga gcttcaagaa aagggaaagt cactccagga gcaaaacacc 420tgcctagaaa aggagatttt gggaaaacag aaagacaagg ctcccaaaca gcatgttcag 480tgggaaaaac agaatcaacc accacctacc tcttctgcgc caatgccatt cctcattggt 540gatattcacc caacccctaa tatcagaaat ttccaaggca gaacagtagc tgatgcaga 599

<210> 101<211> 199<212> PRT

<213> Tradescantia virginiana<400> 101

Gly Leu Val Lys Lys Ala His Glu Ile Ser Val Leu Cys Asp Ala Glu1 5 10 15 Leu Ala Leu Ile Ile Phe Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala 20 25 30 Thr Asp Ser Lys Met Glu Ile Ile Leu Glu Arg Tyr Glu Arg Tyr Thr 35 40 45 Tyr Ala Glu Lys Ala Leu Ile Ala Ser Asp Pro Asp Val Gln Gly Asn 50 55 60 Trp Cys His Glu Tyr Ile Lys Leu Lys Ala Lys Phe Glu Ala Leu Asn65 70 75 80Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu Asp Thr Leu Asn Gln 85 90 95 Lys Glu Leu Leu Gln Leu Glu Thr Lys Leu Glu Gly Ser Leu Lys Asn 100 105 110 Val Arg Ser Arg Lys Thr Gln Leu Met Leu Asp Ser Ile Ser Glu Leu 115 120 125 Gln Glu Lys Gly Lys Ser Leu Gln Glu Gln Asn Thr Cys Leu Glu Lys 130 135 140 Glu Ile Leu Gly Lys Gln Lys Asp Lys Ala Pro Lys Gln His Val Gln145 150 155 160Trp Glu Lys Gln Asn Gln Pro Pro Pro Thr Ser Ser Ala Pro Met Pro 165 170 175 Phe Leu Ile Gly Asp Ile His Pro Thr Pro Asn Ile Arg Asn Phe Gln 180 185 190 Gly Arg Thr Val Ala Asp Ala 195 <210> 102 <211> 753

<212> DNA

<213> Elaeis guineensis<4 00> 102

atggggagag ggagggtgca gctgaggcgg atcgagaaca agataaaccg gcaggtgacg 60

ttctcgaagc gccggtcggg gctcctgaag aaagcccacg agatctccgt cctctgcgac 120

gccgaggtcg ccctcatcat cttctcgacc aagggcaagc tctacgagta cgccaccgac 180

tcctgcatgg aaaggattct tgaacgctat gaacgttaca cctatgcaga aaaagcacta 240

atttcatctg gacccgaatt gcagggtaac tggtgccatg aatttggcaa actcaaagct 300

aaggttgagg ctttacaaaa aagccaaagg catctcatgg gtgagcaact tgagcccttg 360

aatctcaaag aactccagca actagagcaa cagcttgaaa gttctttaaa gcatataaga 420

accagaaagt gccaactcat gtttgaatcc atctctgagc ttcaaaaaaa ggaaaagtca 480

ctgcaggagc agaacaagat gctggagaag gagctcatgg agaagcagaa ggtgaaggca 54 0

ctaaaccagc aggcaccttg ggagcagcaa ggcccgccgc agacaagctc atcatcccca 600

acctccttcc tgatcggaga ctctctcccc accctgaata ttgggacata ccaatgtagc 660

ggaaatgaac atggggagga agcagcacaa ccccaggttc gtataggaaa cagcctgtta 720

ccaccttgga tgcttagcca cttgaacggg tag 753<210> 103

<211> 250 <212> PRT <213> Elaeis guineensis <4 00> 103 Met Gly Arg Gly Arg Val Gln Leu Arg Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Glu50 55 60 Arg Ile Leu Glu Arg Tyr Glu Arg Tyr Thr Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ser Gly Pro Glu Leu Gln Gly Asn Trp Cys His Glu Phe Gly 85 90 95 Lys Leu Lys Ala Lys Val Glu Ala Leu Gln Lys Ser Gln Arg His Leu100 105 110

Met Gly Glu Gln Leu Glu Pro Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Thr Arg Lys Cys

130 135 140

Gln Leu Met Phe Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Lys Ser145 150 155 160

Leu Gln Glu Gln Asn Lys Met Leu Glu Lys Glu Leu Met Glu Lys Gln

165 170 175

Lys Val Lys Ala Leu Asn Gln Gln Ala Pro Trp Glu Gln Gln Gly Pro

180 185 190

Pro Gln Thr Ser Ser Ser Ser Pro Thr Ser Phe Leu Ile Gly Asp Ser

195 200 205

Leu Pro Thr Leu Asn Ile Gly Thr Tyr Gln Cys Ser Gly Asn Glu His

210 215 220

Gly Glu Glu Ala Ala Gln Pro Gln Val Arg Ile Gly Asn Ser Leu Leu225 230 235 240

Pro Pro Trp Met Leu Ser His Leu Asn Gly245 250

<210> 104<211> 699<212> DNA<213> Allium sp.<4 00> 104

gtgcaattga agaggatgga aaacaagatt aatagacaag tgaccttctc aaaaagaaga 60

aatggtttgt tgaagaaagc tcatgagatt tcwgtgcttt gtgatgcaga agttgcactt 120attgttttct ctgctaaagg aaaactctat gaatattcaa ctgattcaag tatggaaaaa 180attctggaga ggtatgaacg ttattgcttt gcggagaaat catcaacaat gagtgacatt 240gactcccagg aggattggag ccttgaatat cacaaactga aggctaaggt tgagagttta 300aacaacaggc aaaggcatct tatgggagag caacttgaat ctctgagtct tcgagaaatt 360ggacagcttg agcaacaact tgagaattct ctcaaaactg ttcggacgcg caagagccaa 420gaattgttaa gttctatttc agagcttcag gacaaggaga aaactttgcg agatgagaac 480aaagctttag aaaatgagct tatgaaaagg gccagggcaa aagctattct ggaacaacaa 540gcacgatgga agcatcataa tcataaacaa caggataatc ttcataatcc aaatatcaac 600attggaaatt accaaacaag gaacaatgag ggaggagttg agccagcaac ggatgttcaa 660gtacgtgttg ttagaaattt gttgccccac tggatgctt 699

<210> 105<211> 233<212> PRT<213> Allium sp.<4 00> 105

Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn Arg Gln Val Thr Phe15 10 15

Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala His Glu Ile Ser Val

20 25 30

Leu Cys Asp Ala Glu Val Ala Leu Ile Val Phe Ser Ala Lys Gly Lys

35 40 45

Leu Tyr Glu Tyr Ser Thr Asp Ser Ser Met Glu Lys Ile Leu Glu Arg

50 55 60

Tyr Glu Arg Tyr Cys Phe Ala Glu Lys Ser Ser Thr Met Ser Asp Ile65 70 75 80

Asp Ser Gln Glu Asp Trp Ser Leu Glu Tyr His Lys Leu Lys Ala Lys

85 90 95

Val Glu Ser Leu Asn Asn Arg Gln Arg His Leu Met Gly Glu Gln Leu

100 105 110

Glu Ser Leu Ser Leu Arg Glu Ile Gly Gln Leu Glu Gln Gln Leu Glu

115 120 125

Asn Ser Leu Lys Thr Val Arg Thr Arg Lys Ser Gln Glu Leu Leu Ser

130 135 140

Ser Ile Ser Glu Leu Gln Asp Lys Glu Lys Thr Leu Arg Asp Glu Asn145 150 155 160

Lys Ala Leu Glu Asn Glu Leu Met Lys Arg Ala Arg Ala Lys Ala Ile165 170 175Leu Glu Gln Gln Ala Arg Trp Lys His His Asn

180 185

Asn Leu His Asn Pro Asn Ile Asn Ile Gly Asn

195 200

Asn Glu Gly Gly Val Glu Pro Ala Thr Asp Val

210 215

Arg Asn Leu Leu Pro His Trp Met Leu225 230

<210> 106<211> 744<212> DNA

<213> Dendrobium grex Madame Thong-IN<4 00> 106

atgggtcgtg gcagggtgca gctgaagcga atcgagaatattctcgaagc ggagatctgg tttgcttaag aaggcgcacggctgaagttg ctctgatcgt tttttccaat aagggaaagctccagcatgg agaaaattct tgaacggtat gagcgttattttttccaatg aggccaaccc ccaggctgat tggcgccttgagggttgaaa gcttacagaa gagccaaagg caccttatggagcattaaag aactccaacg tctagagcaa cagcttgaaatccagaaaga cacagctcat actacattca atttccgagcttgctggagc aaaacaagac cttagagaag gagattatagttggtgcagc atgccccatg ggagaagcaa aaccagtccccctgtgattt cggattctgt cccaactccc accagcagaagaagaagaat cacctcagcc acagttaaga gtaagcaacactcagtcata tgaatggaca ataa<210> 107<211> 247<212> PRT

<213> Dendrobium grex Madame Thong-IN<4 00> 107

Met Gly Arg Gly Arg Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Asn Lys Gly Lys Leu Tyr Glu Tyr Ser Thr

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Phe Ser Asn Glu Ala Asn Pro Gln Ala Asp Trp

85 90

Lys Leu Lys Ala Arg Val Glu Ser Leu Gln Lys

100 105

Met Gly Glu Gln Leu Asp Ser Leu Ser Ile Lys

115 120

Glu Gln Gln Leu Glu Ser Ser Leu Lys Phe Ile

130 135

Gln Leu Ile Leu His Ser Ile Ser Glu Leu Gln145 150 155

Leu Leu Glu Gln Asn Lys Thr Leu Glu Lys Glu

165 170

Lys Ala Lys Ala Leu Val Gln His Ala Pro Trp

180 185

Ser Gln Tyr Ser Ser Ala Leu Pro Pro Val Ile

195 200

Thr Pro Thr Ser Arg Thr Phe Gln Ala Arg Ala

210 215

Pro Gln Pro Gln Leu Arg Val Ser Asn Thr Leu225 230 235

Leu Ser His Met Asn Gly Gln245

His Lys Gln 190 Gln AspTyr Gln 205 Thr Arg AsnGln Val Arg Val Val220

aaataaaccgagatctccgttttatgagtacatatgctgaaatataataagggagcaactgttccttgaatacaaaagatctaaagagaaaatatagctccgtttcaagcctctgctgcc

gcaggtgacggctctgtgacttccaccgataagagcattaactgaaggcatgactccttggtttatacgaggaaaaaataagccaaagcttgcactcccgcagagccaatcccatggatg

Glu Asn Lys

Leu Leu Lys30

Ala Leu Ile45

Asp Ser Ser60

Ala Glu Arg

Arg Leu Glu

Ser Gln Arg110

Glu Leu Gln125

Arg Ser Arg140

Lys Met Glu

Ile Ile Ala

Glu Lys Gln190

Ser Asp Ser

205Asn Glu Glu220

Leu Pro Pro

Ile Asn15

Lys Ala

Val Phe

Met Glu

Ala Leu80Tyr Asn95

His Leu

Arg Leu

Lys Thr

Lys Ile160Lys Glu175

Asn Gln

Val Pro

Glu Ser

Trp Met240

60120180240300360420480540600660720744<210> 108

<211> 2194

<212> DNA

<213> Oryza sativa

<400> 108

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata àtatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140

acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200

tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260

tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320

atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380

gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440

gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500

gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560

gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620

tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680

ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740

actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800

agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860

atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920

gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980

ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040

acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100

aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160

ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 109<211> 804<212> DNA<213> Oryza sativa<400> 109

atggggcggg ggaaggtgca gctgaagcgg atagagaaca agatcaacag gcaggtgacg 60

ttctccaaga ggaggaatgg attgctgaag aaggcgcacg agatctccgt cctctgcgac 120

gccgaggtcg ccgccatcgt cttctccccc aagggcaagc tctacgagta cgccactgac 180

tccaggatgg acaaaatcct tgaacgttat gagcgctatt catatgctga aaaggctctt 240

atttcagctg aatccgagag tgagggaaat tggtgccatg aatacaggaa acttaaggca 300

aagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatct agaatccctg 360

aatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataata 420

tcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca 480

ctgcaggagg agaacaaggc tctgcagaag gaactggtgg agaggcagaa gaatgtgagg 540

ggccagcagc aagtagggca gtgggaccaa acccaggtcc aggcccaggc ccaagcccaa 600

ccccaagccc agacaagctc ctcctcctcc tccatgctga gggatcagca ggcacttctt 660

ccaccacaaa atatctgcta cccgccggtg atgatgggcg agagaaatga tgcggcggcg 720

gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg 780

atgctgagcc acctcaatgc ttaa 804<210> 110<211> 267<212> PRT

<213> Oryza sativa<400> 110

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala

20 25 30

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Ala Ile Val Phe

35 40 45

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80

Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Ile Ser Arg Lys Ser

130 135 140

His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln

165 170 175

Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln Trp Asp Gln Thr Gln

180 185 190

Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala Gln Thr Ser Ser Ser

195 200 205

Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu Leu Pro Pro Gln Asn

210 215 220

Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg Asn Asp Ala Ala Ala225 230 235 240

Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln Leu Arg Ile Gly Gly

245 250 255

Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265

<210> 111<211> 52<212> DNA

<213> Seqüência artificial<220>

<223> iniciador<4 00> 111 '

ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg gcgggggaag gt 52

<210> 112<211> 47<212> DNA

<213> Seqüência artificial<220>

<223> iniciador<4 00> 112

ggggaccact ttgtacaaga aagctgggtt tggccgacga cgacgac 47

<210> 113

<211> 2193

<212> DNA

<213> Oryza sativa

<4 00> 113

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300<210> 114<211> 42<212> PRT

<213> Seqüência artificial<220>

<223> Seqüência artificial<220>

<221> VARIANTE<222> (2)..(2)<223> /substituir = "Vai"<220>

<221> VARIANTE

<222> (6)..(6)

<223> /substituir = "Asn"

<220>

<221> VARIANTE<222> (10)..(10)<223> /substituir = "He"<220>

<221> VARIANTE<222> (12) .. (12)<223> /substituir = "Tyr"<220>

<221> VARIANTE<222> (16)..(16)

<223> /substituir = "lie" /substituir = "Leu"<220>

<221> VARIANTE

<222> (17)..(17)

<223> /substituir = "Gly"

<220>

aaaaaatcttatgaagatatttgtgcattcttagtaattagtacttacgctcaactagcatgaattcaagaattttacagaaaaaaagaaacagagtggctccgcaacaaaaccaagcatggaggcatcccgaccgccttcacctcctcctgtagtacgggatttgggatggttttcaatgattttgtgaaataaaagtactatcctttgatgagattgaacagtagtcccctgttcttcctttctggttgctgtagttctttctgatctattatttttttgtcctcaatcctgtagaagagctgtaatctggtgtagct

tctagctgaatctgaacgtagtcatatcgcaagacaattgacacactttgacacatctctcactccaccaaatagcatgattttgctcgttgcccacagaccttttaacacctcctcctcaagccaagaacttcgatccatcacagggtagcgttgatgtagaggggttccgtctggagagtaccttttgcggttgtttgtttattccctatgattgattccatcacgaacgatttgcttcagttcaatgagttaataggccatttttaattattagctctttgttttcatttctttttggggatagttatgccactttc

ctcaatgggt

ttggcaaaga

acatcattaa

acttattttt

tgctcatgtg

aatatcactc

tcaccagacc

aaagtatgaa

gcgcgagcgc

acaacccaca

gcaggctttg

ccatctataa

gagggagagc

tatcttccgg

tgtgcccttc

taggaaaggg

ttgatgttgc

gctctatgga

tttgaggtaa

gtcctcgatt

attgaacaaa

cttaagcctg

attcatggaa

tagtcccaga

aattgattgc

taatacccct

ttatatgaaa.

tcaccccttc

aattcacatc

gttattcctt

tactgcttgt

accagcaaag

aaagagagag attttttttatttaaacata taattatata

ggacatgtctattatttatccatgtgtgaggcctatttaaacttttaataacgaactattcaatctcccaaaaaacgatgcggccaggagattcctccccaccaaggacatcgagttcttggttgttcttgatctgtatcatgttatcggaatgaaatggaatcagagcactggtagtgaaataatccaatccaaaatttacagttataaattttttttctacaaataatatagtttagttgaactgtagattattctgagattatctatgactgcttgatcttatgattttc

tactccatccttttttcgattgcacctccttacatttaggatatctaaaataggtttttctattgggcacatctaacggaagaggaggagccttttcccccgcgactagcggtcgatctcggatttattgtgtgatgattttcggtttgatttagggtacccggtgattttgcttctcgactttgaagaccgcagctggctcctcaggaaccaaatatctgcttttatagcaggagaagacataagcagtgctgaaagtcgcattatcctttacagaaagcatttccttt

aaaaaatagaattttatagtcaatttttattagatgcaagcaatacacgttagcaatatctacaaaaaatacatacaaaaacaggcaacaggacagcaagaggcaaagaatctctatataagaagccgagttccctcctcttctaggttgcctgttcttgttagtagtatggaatcttgctgcttggtgttttgacgaagggtcccgttgttgtttagatcaggggattctaaaaagtcacgttatcctaacttatccgaattcatttggtggcatgaaccttgtatctaaaatttatgagtgcagttct<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><4 00>Leu Leu1

Ala Leu Ile

VARIANTE(18)..(18)/substituir

VARIANTE

(19)..(19)/substituir

VARIANTE

(20)..(20)/substituir

VARIANTE(23)..(23)/substituir

VARIANTE

(30)..(30)/substituir

VARIANTE

(31)..(31)/substituir

VARIANTE

(32) . . (32)/substituir

VARIANTE

(33)..(33)/substituir

VARIANTE(35)..(35)/substituir

VARIANTE

(37)..(37)/substituir

VARIANTE

(38) . . (38)/substituir

VARIANTE(41) . . (41)/substituir114

= "Ala" /substituir = "Vai"

"Vai"

= "Vai"

= "Pro" /substituir = "Ala" /substituir = "Asn"

= "Phe"

= "Ser"

"Ser"

"Asn" /substituir = "Glu"

= "Cys /substituir = "Arg" /substituir = "Ser'

= "Glu"

= "lie" /substituir = "Arg" /substituir = "Lys"

= "Asp"

Lys Lys

Ala5

Phe

Ile20

Met Asp

Asp Ser Lys35

<210> 115<211> 19<212> PRT

<213> Seqüência arti<220>

<223> Seqüência arti<220>

<221> VARIANTE<222> (4)..(4)

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

10 15

Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

25 30

Asn Ile Leu Glu Arg40

ficialficial<223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><4 00>

/substituir = "Ser"

VARIANTE

(5)..(5)/substituir

VARIANTE

(6)..(6)

/substituir

VARIANTE(8)..(8)/substituir

VARIANTE

(9)■·(9)

/substituir

VARIANTE

(10) . . (10)/substituir

VARIANTE(H) · ■ (H)/substituir

VARIANTE(12) . . (12)/substituir

VARIANTE

(13)..(13)/substituir

VARIANTE

(14)..(14)/substituir115

= nArg"

= "lie"

"Thr" /substituir = "Ser"

"lie"

= "Asn"

"Arg" /substituir = "Asn"

= "Cys" /substituir = "Arg"

= "His"

= "Lys"

Lys Leu Lys Ala Lys1 5

Met Gly Glu

Val Glu Ala Leu

Gln10

Lys Ser Gln Arg

His15

Leu

<210> 116<211> 11<212> PRT

<213> Seqüência artificial<220>

<223> Seqüência artificial<220>

<221> VARIANTE<222> (2) .. (2)

<223> /substituir = "Gln" /substituir<220>

<221> VARIANTE<222> (6)..(6)<223> /substituir = "Phe"<220>

<221> VARIANTE

<222> (7) . . (7)

<223> /substituir = "Phe"

<220>

<221> VARIANTE<222> (8)..(8)

"Vai" /substituir = "Ala""Phe"

<223> /substituir = "Phe"<220>

<221> VARIANTE<222> (9)..(9)<223> /substituir = "Phe"<220>

<221> VARIANTE<222> (10)..(10)

<223> /substituir = "Cys" /substituir<220>

<221> VARIANTE<222> (11)..(11)<223> /substituir = "Met"<400> 116

Gln Pro Gln Thr Ser Ser Ser Ser Ser Ser Phe1 5 10

<210> 117<211> 7<212> PRT

<213> Seqüência artificial<220>

<223> Seqüência artificial<220>

<221> VARIANTE<222> (1)..(1)

<223> /substituir = "Ala" /substituir = "Vai" /substituir = "Leu"<220>

<221> VARIANTE<222> (2)..(2)<223> /substituir = "Pro"<220>

<221> INSEGURO<222> (3)..(3)

<223> Xaa can be any amino acid, preferably Leu, Phe ou His<220>

<221> INSEGURO<222> (6)..(6)

<223> Xaa can be any naturally occuring amino acid, preferably Val ouLeu

<220>

<221> VARIANTE<222> (7) . . (7)<223> /substituir = "His"<4 00> 117

Gly Leu Xaa Trp Met Xaa Ser1 5

<210> 118<211> 735<212> DNA

<213> Hordeum vulgare<4 00> 118

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg ccaggtcacc 60

<210> 119<211> 244<212> PRT

<213> Hordeum vulgare<4 00> 119

Met Gly Arg Gly Lys1 5

Arg Gln Val Thr Phe20

His Glu Ile Ser Val35

Ser Thr Lys Gly Lys50

Lys Ile Leu Glu Arg65

Val Ser Ser Glu Ser85

Lys Leu Lys Ala Lys100

Met Gly Glu Asp Leu115

Glu Gln Gln Leu Glu130

Gln Leu Met His Glu145

Leu Gln Glu Glu Asn165

Lys Ala Gln Ala Ala180

Ser Ser Ser Ser Phe195

Ser Asn His Pro Ala210

Gln Pro Gln Val Pro225

His Ile Asn Gly

<210> 120<211> 1196<212> DNA<213> Hordeum vulgare<4 00> 120

ctctcccctc ccacttcacc caaccacctg acagccatgg ctccgccacc tcgcctccgc 60

ccgcgcctct gagagtagcc gtcgcggtcg ctcgctcgct cgctcgctgc tgccggtgtt 120

ggcccggtcc tcgagcggag atggggcgca ggaaggtgca gctgaagcgg atcgagaaca 180

agatcaaccg ccaggtcacc ttctccaagc gccgctcggg gctgctcaag aaggcgcacg 240

agatctccgt gctctacgac gccgaggtcg gcctcatcat cttctccacc aagggaaagc 300

tctacgagtt ctccaccgag tcatgtatgg acaaaattct tgaacggtat gagcgctact 360

cttatgcaga aaaggttctc gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg 420

aatataggaa actgaaggcg aaggttgaga caatacagaa atgtcaaaag catctcatgg 480

gagaggatct tgaatctttg aatctcaagg agttgcagca actggagcag cagctggaaa 540

gctcactgaa acatatcaga gccaggaaga accaacttat gcacgaatcc atttctgagc 600

ttcagaagaa ggagaggtca ctgcaggagg agaataaagt tctccagaag gaacttgtgg 660

agaagcagaa ggcccaggcg gcgcagcaag atcaaactca gcctcaaacc agctcttctt 720

cttcttcctt catgatgagg gatgctcccc ctgtcgcaga taccagcaat cacccagcgg 780

cggcaggcga gagggcagag gatgtggcag tgcagcctca ggtcccactc cggacggcgc 840

ttccactgtg gatggtgagc cacatcaacg gctgaagggc ttccagccca tgtaagcgta 900

ctattcagta cgagtaacaa gttgcagcgg ccagcctggt gtatcatgcg gttgcgaaca 960

tgctaacccc atggagggga gaggaaaaga aatcagagta aagcagcaag ctgcaggaat 1020

gtgtatattt cacttcgtcc acctcagttt cctttccacc tgggctgaga tggctgtacg 1080

agtaatctac catgtaattt atatgtagca tgagtgacga attttcaact ttcgatgata 1140

tccgttgctc ctgggtgttg tttctgtgaa ttaacctatc gaatatgagc gttgtg 1196

Val Gln Leu Lys Arg10

Ser Lys Arg Arg Ser25

Leu Cys Asp Ala Glu40

Leu Tyr Glu Phe Ser55

Tyr Glu Arg Tyr Ser70

Glu Ile Gln Gly Asn90

Val Glu Thr Ile Gln105

Glu Ser Leu Asn Leu120

Ser Ser Leu Lys His135

Ser Ile Ser Glu Leu150

Lys Val Leu Gln Lys170

Gln Gln Asp Gln Thr185

Met Met Arg Asp Ala200

Ala Ala Gly Glu Arg215

Leu Arg Thr Ala Leu230

Ile Glu Asn Lys Ile Asn15

Gly Leu Leu Lys Lys Ala30

Val Gly Leu Ile Ile Phe45

Thr Glu Ser Cys Met Asp60

Tyr Ala Glu Lys Val Leu75 80

Trp Cys His Glu Tyr Arg95

Lys Cys Gln Lys His Leu110

Lys Glu Leu Gln Gln Leu125

Ile Arg Ala Arg Lys Asn140

Gln Lys Lys Glu Arg Ser155 160

Glu Leu Val Glu Lys Gln175

Gln Pro Gln Thr Ser Ser190

Pro Pro Val Ala Asp Thr205

Ala Glu Asp Val Ala Val220

Pro Leu Trp Met Val Ser235 240<210> 121<211> 244<212> PRT

<213> Hordeum vulgare<400> 121

Met Gly Arg Arg Lys Val Gln1 5

Arg Gln Val Thr Phe Ser Lys20

His Glu Ile Ser Val Leu Tyr35

Ser Thr Lys Gly Lys Leu Tyr

50 55

Lys Ile Leu Glu Arg Tyr Glu65 70

Val Ser Ser Glu Ser Glu Ile85

Lys Leu Lys Ala Lys Val Glu100

Met Gly Glu Asp Leu Glu Ser115

Glu Gln Gln Leu Glu Ser Ser130 135

Gln Leu Met His Glu Ser Ile145 150

Leu Gln Glu Glu Asn Lys Val165

Lys Ala Gln Ala Ala Gln Gln180

Ser Ser Ser Ser Phe Met Met195

Ser Asn His Pro Ala Ala Ala210 215

Gln Pro Gln Val Pro Leu Arg225 230

His Ile Asn Gly

Leu Lys Arg10

Arg Arg Ser25

Asp Ala Glu40

Glu Phe Ser

Arg Tyr Ser

Gln Gly Asn90

Thr Ile Gln

105Leu Asn Leu120

Leu Lys His

Ser Glu Leu

Leu Gln Lys170

Asp Gln Thr185

Arg Asp Ala200

Gly Glu ArgThr Ala Leu

Ile Glu Asn LysGlyValThr

Tyr

75

Trp

Lys

Ile

Gln155Glu

Gln

Pro

Ala

Pro235

Leu Leu Lys30

Gly Leu Ile45

Glu Ser Cys60

Ala Glu Lys

Cys His Glu

Cys Gln Lys110

Glu Leu Gln125

Arg Ala Arg140

Lys Lys Glu

Leu Val Glu

Pro Gln Thr190

Pro Val Ala

205Glu Asp Val220

Leu Trp Met

Ile Asn15

Lys Ala

Ile Phe

Met Asp

Val Leu80Tyr Arg95

His Leu

Gln Leu

Lys Asn

Arg Ser160Lys Gln175

Ser Ser

Asp Thr

Ala Val

Val Ser240

<210> 122

<211> 1161

<212> DNA

<213> Trit

<4 00> 122

ggcacgagct

cggcacgagc

accggcaggt

ccgtgctctg

agttctccac

cagaaaaggt

ggaaactgaa

atcttgaatc

tgaaacatat

agaaggagag

agaaggccca

ccttcatgat

gcgagagggc

tgtggatggt

agtagagagt

gaccccttgg

atatttcact

atatgtagct

gtttatgtga

ataaatcagg

<210> 123

icum aestivum

ctctctctctggagatgggggaccttctcccgacgccgagcgagtcatgttctcgtttcaggcgaaggtttttgaatctccagatccagggtcactgcagggcggcgcaagagggatgctaggggatgcggagccacatcaacaagttgcaggggaaaggttgtccaccctgagtgatgaattaacctatatctttgtct

ctctctctct ctctctctct

cgcgggaaggaagcgccgctgtcggcctcaatggacaaaaagtgaatctggagacaatacaaggagttgcaagaaccaacgaggagaatacaagatcagaccccctgccggcagtgcagcaacggctgaaaccggccagtaaaagaaatccagtttccctattttcaagtcaaatatgagt

tgcagctgaacggggctgcttcatcttctcttcttgaacgaaattcagggagaaatgtcaagcaactggattatgcacgaaagttctccactcagcctcacagctaccagcgcaggccccgggcttccagctggtgtatgagagtaaagtcccagctgggttccatgatacattgtgtat

ctctctcctcgcggatcgagcaagaaggcgcaccaagggagtatgagcgcaaactggtgtaaagcatctggcagcagctgatccatttctgaaggaactcaacaagctctcattcatccaaccccggacgcccatataagttgcggttgcagcaagctgcctcaatttaccccgtctctaattgtgattc

gtgccgaattaacaagatcacacgagatctaagctctacgtactcttatgcacgaatataatgggagagggaaagctcacgagcttcagagtcgagaagctcttcttcttgcggcggcaggggcttccaccgtactattctagcacgcctagcgatgtgtcatgtaatctgtgggatgttttgaaaataa

601201802403003604204805406006607207808409009601020108011401161<211> 244<212> PRT

<213> Triticum aestivum <400> 123 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Asn 130 135 140 Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser 180 185 190 Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala Ala Ala Thr 195 200 205 Ser Ile His Pro Ala Ala Ala Gly Glu Arg Ala Gly Asp Ala Ala Val 210 215 220 Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp Met Val Ser225 230 235 240His Ile Asn Gly

<210> 124<211> 1210<212> DNA

<213> Triticum aestivum<4 00> 124

tccctctcct ccctctcttc cgcctcaccc aaccacctga cagccatggc tccgcccccc 60

cgcccccgcc tgcgcctgtc ggagtagccg tcgcggtctg ccggtgttgg aggcttgggg 120

tgtagggttg gccccgttct ccagcggaga tggggcgcgg gaaggtgcag ctgaagcgga 180

tcgagaacaa gatcaaccgg caggtgacct tctccaagcg ccgctcgggg ctgctcaaga 240

aggcgcacga gatctccgtg ctctgcgacg ccgaggtcgg cctcatcatc ttctccacca 300

agggaaagct ctacgagttc tccaccgagt catgtatgga caaaattctt gaacggtatg 360

agcgctactc ttatgcagaa aaggttctcg tttcaagtga atctgaaatt cagggaaact 420

ggtgtcacga atataggaaa ctgaaggcga aggttgagac aatacagaaa tgtcaaaagc 480

atctgatggg agaggatctt gaatctttga atctcaagga gttgcagcaa ctggagcagc 540

agctggaaag ctcactgaaa catatcagat ccaggaagaa ccaacttatg cacgaatcca 600

tttctgagct tcagaagaag gagaggtcac tgcaggagga gaataaagtt ctccagaagg 660

aactcgtcga gaagcagaag gcccaggcgg cgcaacaaga tcagactcag cctcaaacaa 720

gctcttcttc ttcttccttc atgatgaggg atgctccccc tgccgcaact accagcattc 780

atccagcggc atcaggagag agggcagagg atgcggcagt gcagccgcag gccccacccc 840

ggacggggct tccactgtgg atggttagcc acatcaacgg ctgaagggct tccagcccat 900

ataagcgtac tattcagtag agagtaacaa gttgcaccgg ccagcctggt gtatgttgcg 960

gttgctagca tgcctgaccc cttggagggg aaaggaaaag aaatcagagt aaagtagcaa 1020

gctgcagtga tgtgtatatt tcactttgtc cacctcagtt tccctcccag ctgggctcaa 1080

tttaccatgt aatctatatg tagcttgagt gatgaatttt caagtttcca tgatacccgt 1140

ctcgagcggg tgttgtttat gtgaattaac ctatcaaata tgagcattgt gtaaaaaaaa 1200

aaaaaaaaaa 1210<210> 125<211> 244<212> PRT

<213> Triticum aestivum<400> 125

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn

1 5 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75

Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His

85 90

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val

165 170

Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln

180 185

Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala195 200 205

Ser Ile His Pro Ala Ala Ser Gly Glu Arg Ala Glu Asp

210 215 220

Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp225 230 235

His Ile Asn Gly

Lys Ile Asn15

Lys Lys Ala30

Ile Ile Phe

Cys Met Asp

Lys Val Leu80

Glu Tyr Arg95

Lys His Leu110

Gln Gln Leu

Arg Lys Asn

Glu Arg Ser160

Glu Lys Gln

175Thr Ser Ser190

Ala Thr Thr

Ala Ala Val

Met Val Ser240

<210> 126<211> 735<212> DNA<213> Triti<4 00> 126atggggcgcgttctccaagcgccgaggtcgtcatgtatgggtttcaagtgaaggttgagaaatctcaaggtccaggaagactgcaggagggcgcagcaaggatgctccccgatgcggcagcacatcaacg<210> 127<211> 244<212> PRT<213> Triti<4 00> 127Met Gly Arg1

Arg Gln Val

cum monococcum

gctgaagcgggcttctcaagcttctccacctgaacggtattcagggaaacatgtcaaaaaactggagcaggcacgaatcctctccagaaggcctcaaacctaccagcattggccccaccc

atcgagaacaaaggcgcacgaagggaaagcgagcgctatttggtgtcacgcatctcatggcagctggaaaatttctgagcgaactcgtggagctcttcttcatccagcggcggacggggc

cum monococcum

Gly Lys Val Gln Leu Lys Arg Ile

5 10

Thr Phe Ser Lys Arg Arg Ser Gly20 25

agatcaaccgagatctccgttctacgagttcttatgcagaaatataggaagagaggatctgctcactgaatgcagaagaaagaagcagaacttcttccttcggcaggcgattccaccgtg

Glu Asn Lys Ile Asn15

Leu Leu Lys Lys Ala30

60120180240300360420480540600660720735His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75

Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His

85 90

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val

165 170

Lys Ala His Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln

180 185

Ser Ser Ser Ser Phe Met Leu Arg Asp Ala Pro Pro Ala195 200 205

Ser Ile His Pro Ala Ala Ala Gly Glu Arg Ala Glu Asp

210 215 220

Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Pro Trp225 230 235

His Ile Asn Gly

Ile Ile Phe

Cys Met Asp

Lys Val Leu80

Glu Tyr Arg95

Lys His Leu110

Gln Gln Leu

Arg Lys Asn

Glu Arg Ser160

Glu Lys Gln

175Thr Ser Ser190

Ala Asn Thr

Ala Ala Val

Met Val Ser240

<210> 128<211> 735<212> DNA

<213> Triticum aestivum<4 00> 128

atggggcggg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccgctcggg gcttctcaag aaggcgcacggccgaggtcg gcctcatcat cttctccacc aagggaaagctcatgtatgg acaaaattct tgaacggtat gagcgctattgtttcaagtg aatctgaaat tcagggaaac tggtgtcacgaaggttgaga caatacagaa atgtcaaaag catctcatggaatctcaagg agttgcagca actggagcag cagctggaaatccaggaaga accaacttat gcacgaatcc atttctgagcctgcaggagg agaataaagt tctccagaag gaactcgtgggcgcagcaag atcaaactca gcctcaaacc agctcttcatgatgctcccc ctgccgcaaa taccagcatt catccagcgggatgcggcag tgcagccgca ggccccaccc cggacggggccacatcaacg ggtga<210> 129<211> 244<212> PRT

<213> Triticum aestivum<400> 129

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp85 90

Glu Asn Lys Ile Asn15

Leu Leu Lys Lys Ala30

Gly Leu Ile Ile Phe45

Glu Ser Cys Met Asp60

Ala Glu Lys Val Leu80

Cys His Glu Tyr Arg95

60120180240300360420480540600660720735Lys Leu Lys

Met Gly Glu115

Glu Gln Gln

130Gln Leu Met145

Leu Gln Glu

Lys Ala His

Ser Ser Ser195

Ser Ile His210Gln Pro Gln225

His Ile Asn

Ala Lys100

Asp Leu

Leu Glu

His Glu

Glu Asn165Ala Ala180

Ser PhePro AlaAla ProGly

Val Glu Thr

Glu Ser Leu120

Ser Ser Leu

135Ser Ile Ser150

Lys Val Leu

Gln Gln Asp

Met Leu Arg200

Ala Thr Gly

215Pro Arg Thr230

Ile Gln Lys105

Asn Leu Lys

Lys His Ile

Glu Leu Gln155

Gln Lys Glu

170Gln Thr Gln185

Asp Ala Pro

Glu Arg Ala

Gly Leu Pro235

Cys Gln

Glu Leu125Arg Ser140

Lys Lys

Leu Val

Pro Gln

Pro Ala205Glu Asp220

Pro Trp

Lys His Leu110

Gln Gln Leu

Arg Lys Asn

Glu Arg Ser160

Glu Lys Gln

175Thr Ser Ser190

Ala Asn Thr

Ala Ala Val

Met Val Ser240

<210> 130<211> 738<212> DNA

<213> Lolium perenne<4 00> 130

atggggcgcg gcaaggtgca gctcaagcgg atcgagaacattctccaagc gccgctcggg gctgctcaag aaggcgcacggccgaggtcg ggctcatcat cttctccacc aagggaaagctcatgtatgg acaaaattct tgagcggtat gagcgctactatttcaaccg aatctgaaat tcagggaaac tggtgtcatgaaggttgaga caatacagag atgtcaaaag catctaatggaatctcaagg agttgcagca actagagcag cagctggaaagccagaaaga accagcttat gcacgaatcc atatctgagcctgcaggagg agaataaaat tctccagaag gaactcatagcagcaagcgc agtgggagca aactcagccc caaaccagctatgggggaag ctaccccagc aacaaattgc agtaatccccgcagaggatg cgacggggca gccttcagct cgcacggtgccacatcaaca atggctga<210> 131<211> 245<212> PRT

<213> Lolium perenne<400> 131

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr

50 55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys

115 120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130 135

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln145 150 155

Glu Asn

Leu Leu

Gly Leu

45Asp Ser60

Ala Glu

Cys His

Cys Gln

Glu Leu125Arg Ala140

Lys Lys

Lys Ile

15Lys Lys30

Ile Ile

Cys Met

Lys Val

Glu Tyr

95Lys His110

Gln GlnArg LysGlu Arg

Asn

Ala

Phe

Asp

Leu80Arg

Leu

Asn

Ser160

60120180240300360420480540600660720738Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln

165 170 175

Lys Ala His Thr Gln Gln Ala Gln Trp Glu Gln Thr Gln Pro Gln Thr

180 185 190

Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr

195 200 205

Asn Cys Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala

210 215 220

Thr Gly Gln Pro Ser Ala Arg Thr Val Leu Pro Pro Trp Met Val Ser225 230 235 240

His Ile Asn Asn Gly245

<210> 132<211> 738<212> DNA

<213> Lolium temulentum<4 00> 132

atggggcgcg gcaaggtgca gctcaagcgg atcgagaaca agatcaaccg ccaggtcacc 60

ttctccaagc gccgctcagg cctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gcagaggtcg ggctcatcat cttctçcacc aagggaaagc tctacgagtt cgccaccgac 180tcatgtatgg acaaaattct tgagcggtat gagcgctact cctatgcaga gaaagtgctc 240atttcaactg aatctgaaat tcagggaaac tggtgtcatg aatataggaa actgaaggcg 300aaggttgaga caatacagag atgtcaaaag catctaatgg gagaggatct tgaatcattg 360aatctcaagg agttgcagca actagagcag cagctggaaa gttcactgaa acatattaga 420tccagaaaga gccagcttat gcacgaatcc atatctgagc ttcaaaagaa ggagaggtca 480ctgcaagagg agaataaaat tctccagaag gaactcatag agaagcagaa ggcccacacg 540cagcaagcgc agttggagca aactcagccc caaaccagct cttcctcctc ctcctttatg 600atgggggaag ctaccccagc aacaaatcgc agtaatcccc cagcagcggc cagcgacaga 660gcagaggatg cgacggggca gcctccagct cgcacggtgc ttccaccatg gatggtgagt 720cacctcaaca atggctga 738

<210> 133<211> 245<212> PRT

<213> Lolium temulentum<4 00> 133

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn15 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala

20 25 30

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr Asp Ser Cys Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80

Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser

130 135 140

Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln

165 170 175

Lys Ala His Thr Gln Gln Ala Gln Leu Glu Gln Thr Gln Pro Gln Thr

180 185 190

Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr

195 200 205

Asn Arg Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala210 215 220Thr Gly Gln Pro Pro Ala Arg Thr Val Leu Pro225 230 235

His Leu Asn Asn Gly245

<210> 134<211> 738<212> DNA<213> Zea mays<400> 134

atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccgctcggg gctgctcaag aaggcgcacggccgaggtcg cgctcatcat cttctccacc aaagggaagctcatgtatgg acaaaattct tgaccggtac gagcgctactatttcagcag aatctgaaac tcagggcaat tggtgccacgaaggtcgaga caatacaaaa atgtcaaaag cacctcatggaatctcaaag agcttcagca actagagcag cagctggagaaccaggaaga accaacttat gctcgagtca atttcggagcctgcaggagg agaacaaggt tctgcagaag gagctcgcggaagcaagtgc aatggggcca aacccaacag cagaccagttataagggaag ctgccccaac aacaaatatc agcatttttcttggtggaag gtgcagcagc gcagccacag gctcgcgttgagccacctga gcagctga

<210> 135

<211> 245

<212> PRT

<213> Zea mays

<400> 135

Pro Trp Met Val Ser240

agatcaaccgagatctccgttctacgagtacctatgcagaagtatagaaagagaggatctgttcactgaatccaacggaaagaagcagaacgtcttcctcctgtggcagcgactaccacc

ccaggtgaccgctctgcgacttccaccgataaaggttcttactaaaggcgtgaaacgttgacatatcagaggagaagtcgagcccagcgggtgcttcgtgaggcgggaggatggatgctt

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly 20 25 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val 35 40 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ser Thr 50 55 Lys Ile Leu Asp Arg Tyr Glu Arg Tyr Ser Tyr65 70 75Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp 85 90 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys 100 105 Met Gly Glu Asp Leu Glu Thr Leu Asn Leu Lys 115 120 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile 130 135 Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln145 150 155Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu 165 170 Lys Ala Gln Arg Lys Gln Val Gln Trp Gly Gln 180 185 Ser Ser Ser Ser Ser Cys Phe Val Ile Arg Glu

195 200

Asn Ile Ser Ile Phe Pro Val Ala Ala Gly Gly

210 215

Ala Ala Ala Gln Pro Gln Ala Arg Val Gly Leu225 230 235

Ser His Leu Ser Ser245

<210> 136<211> 738<212> DNA<213> Zea mays

Glu Asn

Leu Leu

Ala Leu45

Asp Ser60

Ala Glu

Cys His

Cys Gln

Glu Leu125Arg Thr140

Arg Lys

Leu Ala

Thr Gln

Ala Ala205Arg Leu220

Pro Pro

Lys Ile Asn15

Lys Lys Ala30

Ile Ile Phe

Cys Met Asp

Lys Val Leu80

Glu Tyr Arg95

Lys His Leu110

Gln Gln Leu

Arg Lys Asn

Glu Lys Ser160

Glu Lys Gln

175Gln Gln Thr190

Pro Thr Thr

Val Glu Gly

Trp Met Leu240

60120180240300360420480540600660720738<400> 136

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccgttctccaagc gccgctcggg gctactcaag aaggcgcacg agatctccgtgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagtatcatgtatgg acaaaattct tgaacggtat gagcgctact cctatgcagaatttccgcag aatatgaaac tcagggcaat tggtgccatg aatatagaaaaaggtcgaga caatacagaa atgtcaaaag cacctcatgg gagaggatctaatctcaaag agcttcagca actagagcag cagctggaga gttcactgaaacaaggaaga gccagcttat ggtcgagtca atttcagcgc tccaacggaactgcaggagg agaacaaggt tctgcagaag gagctcgcgg agaagcagaacagcaagtgc aacgggacca aactcaacag cagaccagtt cgtcttccacttaagggaag ctgccccaac aacaaatgtc agcatcttcc ctgtggcagcgtggtggaag gggcagcagc gcagccgcag gctcgcgttg gactgccaccagccatctga gctgctga<210> 137<211> 245<212> PRT<213> Zea mays<400> 137

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn1 5 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

40

35

Ala Leu45

Lys Ile

15Lys Lys30

Ile Ile

AsnAla

Phe

Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ser Thr Asp Ser Cys Met Asp

50

55

60

Leu80Arg

Leu

Ser

Ser160Gln

Thr

Gly

Leu240

<211> 762<212> DNA

<213> Oryza sativa<4 00> 138

atggggcggg gcaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgaccttctccaagc gcaggtcggg gctgctcaag aaggcgaatg agatctccgt gctctgcgacgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagta cgccaccgactcatgtatgg acaaaatcct tgaacgttat gagcgctact cctatgcaga aaaggtccttatttcagctg aatctgacac tcagggcaac tggtgccacg aatataggaa actgaaggctaaggttgaga caatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttgaatctcaaag agctgcagca gctggagcag cagctggaaa attcgttgaa acatatcaga

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val65 70 75 Ile Ser Ala Glu Tyr 85 Glu Thr Gln Gly Asn 90 Trp Cys His Glu Tyr 95Lys Leu Lys Ala 100 Lys Val Glu Thr Ile 105 Gln Lys Cys Gln Lys 110 HisMet Gly Glu 115 Asp Leu Glu Thr Leu 120 Asn Leu Lys Glu Leu 125 Gln GlnGlu Gln 130 Gln Leu Glu Ser Ser 135 Leu Lys His Ile Arg 140 Thr Arg LysGln Leu Met Val Glu Ser Ile Ser Ala Leu Gln Arg Lys Glu Lys145 150 155 Leu Gln Glu Glu Asn 165 Lys Val Leu Gln Lys 170 Glu Leu Ala Glu Lys 175Lys Asp Gln Arg 180 Gln Gln Val Gln Arg 185 Asp Gln Thr Gln Gln 190 GlnSer Ser Ser 195 Ser Thr Ser Phe Met 200 Leu Arg Glu Ala Ala 205 Pro ThrAsn Val 210 Ser Ile Phe Pro Val 215 Ala Ala Gly Gly Arg 220 Val Val GluAla Ala Ala Gln Pro Gln Ala Arg Val Gly Leu Pro Pro Trp Met225 230 235 Ser His Leu Ser Cys 245 <210> 138

60120180240300360420480540600660720738

60120180240300360420tccagaaaga gccaactaat gctcgagtcc attaacgagc ttcaacggaa ggaaaagtca

ctgcaggagg agaataaggt cctacagaaa gaaaaccctt gctccttcct acagctggtg

gagaagcaga aagtccagaa gcaacaagtg caatgggacc agacacaacc tcaaacaagt

tcctcatcat cctccttcat gatgagggaa gcccttccaa caactaatat cagtaactac

cctgcagcag ctggcgaaag gatagaggat gtagcagcag ggcagccaca gcatgttcgc

attgggctgc caccatggat gctgagccac atcaacggct aa<210> 139<211> 253<212> PRT

<213> Oryza sativa <4 00> 139 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Ser Gly Leu Leu Lys 30 Lys AlaAsn Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Ala Leu 45 Ile Ile PheSer Thr 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Cys Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser 85 Asp Thr Gln Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Val Glu Thr Ile 105 Gln Lys Cys Gln Lys 110 His LeuMet Gly Glu 115 Asp Leu Glu Ser Leu 120 Asn Leu Lys Glu Leu 125 Gln Gln LeuGlu Gln 130 Gln Leu Glu Asn Ser 135 Leu Lys His Ile Arg 140 Ser Arg Lys SerGln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn 165 Lys Val Leu Gln Lys 170 Glu Asn Pro Cys Ser 175 PheLeu Gln Leu Val 180 Glu Lys Gln Lys Val 185 Gln Lys Gln Gln Val 190 Gln TrpAsp Gln Thr 195 Gln Pro Gln Thr Ser 200 Ser Ser Ser Ser Ser 205 Phe Met MetArg Glu 210 Ala Leu Pro Thr Thr 215 Asn Ile Ser Asn Tyr 220 Pro Ala Ala AlaGly Glu Arg Ile Glu Asp Val Ala Ala Gly Gln Pro Gln His Val Arg225 230 235 240Ile Gly Leu Pro Pro 245 Trp Met Leu Ser His 250 Ile Asn Gly

<210> 140

<211> 741

<212> DNA

<213> Oryza sativa

<400> 140

atggggcggg gcaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgaccttctccaagc gcaggtcaaa actgctcaag aaggcgaatg agatctccgt gctctgcgacgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagta cgccaccgactcatgtatgg acaaaatcct tgaacgttat gagcgctact cctatgcaga aaaggtccttatttcagctg aatctgacac tcagggcaac tggtgccacg aatataggaa actgaaggctaaggttgaga caatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttgaatctcaaag agctgcagca gctggagcag cagctggaaa attcgttgaa acatatcagatccagaaaga gccaactaat gctcgagtcc attaacgagc ttcaacggaa ggaaaagtcactgcaggagg agaataaggt cctacagaaa gaactggtgg agaagcagaa agtccagaagcaacaagtgc aatgggacca gacacaacct caaacaagtt cctcatcatc ctccttcatgatgagggaag cccttccaac aactaatatc agtaactacc ctgcagcagc tggcgaaaggatagaggatg tagcagcagg gcagccacag catgaacgca ttgggctgcc accatggatgctgagccaca tcaacggcta a<210> 141<211> 246

480540600660720762

60120180240300360420480540600660720741<212> PRT

<213> Oryza sativa<4 00> 141

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Lys Leu Leu Lys Lys Ala

20 25 30

Asn Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe

35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80

Ile Ser Ala Glu Ser Asp Thr Gln Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Asn Ser Leu Lys His Ile Arg Ser Arg Lys Ser

130 135 140

Gln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln

165 170 175

Lys Val Gln Lys Gln Gln Val Gln Trp Asp Gln Thr Gln Pro Gln Thr

180 185 190

Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr

195 200 205

Asn Ile Ser Asn Tyr Pro Ala Ala Ala Gly Glu Arg Ile Glu Asp Val

210 215 220

Ala Ala Gly Gln Pro Gln His Glu Arg Ile Gly Leu Pro Pro Trp Met225 230 235 240

Leu Ser His Ile Asn Gly245

<210> 142<211> 735<212> DNA

<213> Dendrocalamus Iatiflorus<4 00> 142

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaagtgact 60

ttctccaagc gccggtcggg gctgctcaag aaggcgcatg agatctccgt cctctgcgac 120gccgaggtcg gccttatcat cttctccacc aagggcaagc tctacgagta cgccaccgac 180tcatgtatgg acaaaattct tgaacggtac gagcgttact cctatgcaga aaaggttctt 240atttcagccg aatctgaaac tcagggcaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga cgatacagaa atgtcaaaag cacctcatgg gagaggatcc tgaatctttg 360aatctcaagg agctgcagca actcgagcag cagctggaaa gttcagtgaa acatatcaga 420tccagaaaga gccagcttat gctcgagtcc atttccgagc ttcaaaagaa ggagaagtca 480ctgcaggagg agaacaaggt tctgcagaag gaactcgtgg agaagcagca ggtccataaa 540cggttagtgc aatgggacca aactcagccg caaactagtt cctcttcctc gtccttcatg 600atgagggaag ctctcccaac aacaaatatc agtatttacg ctgcggcagc cggcgagagg 660gcagaggacg cagcagggca gcctcagatt cacattgggc tgccgccatg gatggtgagc 720cacatcaacg gctaa 735

<210> 143<211> 244<212> PRT

<213> Dendrocalamus latiflorus<4 00> 143

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn15 10 15

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala

20 25 30

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe35 40 45

Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp

50 55 60

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80

Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp Cys His Glu Tyr Arg

85 90 95

Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu

100 105 110

Met Gly Glu Asp Pro Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu

115 120 125

Glu Gln Gln Leu Glu Ser Ser Val Lys His Ile Arg Ser Arg Lys Ser

130 135 140

Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Lys Ser145 150 155 160

Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln

165 170 175

Gln Val His Lys Arg Leu Val Gln Trp Asp Gln Thr Gln Pro Gln Thr

180 185 190

Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr

195 200 205

Asn Ile Ser Ile Tyr Ala Ala Ala Ala Gly Glu Arg Ala Glu Asp Ala

210 215 220

Ala Gly Gln Pro Gln Ile His Ile Gly Leu Pro Pro Trp Met Val Ser225 230 235 240

His Ile Asn Gly

<210> 144<211> 735<212> DNA

<213> Dendrocalamus latiflorus<4 00> 144

atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaagtgact 60

ttctccaagc gccggtcggg gctgctcaag aaggcgcatg agatctccgt cctctgcgac 120gccgaggtcg gccttatcat cttctccacc aagggcaagc tctacgagta cgccaccgac 180tcatgtatgg acaaaattct tgaacggtac gagcgttact cctatgcaga aaaggttctt 240atttcagccg aatctgaaac tcagggcaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga cgatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttg 360aatctcaagg agctgcagca actcgagcag cagctggaaa gttcagtgaa acatatcaga 420tccagaaaga gccagcttat gctcgagtcc atttccgagc ttcaaaagaa ggagaagtca 480ctgcaggagg agaacaaggt tctgcagaag gaactcgtgg agaagcagca ggtccataaa 540cggttagtgc aatgggacca aactcagccg caaactagtt cctcttcctc gtccttcatg 600atgagggaag ctctcccaac aacaaatatc agtatttacg ctgcggcagc cggcgagagg 660gcagaggacg cagcagggca gcctcagatt cacattgggc tgccgccatg gatggtgagc 720cacatcaacg gctaa 735

<210> 145<211> 244<212> PRT

<213> Dendrocalamus latiflorus<4 00> 145

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Ser Gly Leu Leu Lys 30 Lys AlaHis Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Gly Leu 45 Ile Ile PheSer Thr 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Cys Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Thr Gln Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His LeuMet

Glu

Gln145Leu

Gln

Ser

Asn

Ala225His

Gly

Gln130Leu

Gln

Val

Ser

Ile210Gly

Ile

100Glu Asp Leu115

Gln Leu Glu

Met Leu Glu

Glu Glu Asn165

His Lys Arg180Ser Ser Ser195

Ser Ile TyrGln Pro GlnAsn Gly

Glu Ser

Ser Ser135Ser Ile150

Lys Val

Leu Val

Ser Phe

Ala Ala215Ile His230

105

Leu Asn Leu120

Val Lys His

Ser Glu Leu

Leu Gln Lys170

Gln Trp Asp185

Met Met Arg200

Ala Ala GlyIle Gly Leu

Lys Glu

Ile Arg140Gln Lys155

Glu Leu

Gln Thr

Glu Ala

Glu Arg220Pro Pro235

110Leu Gln125

Ser Arg

Lys Glu

Val Glu

Gln Pro190Leu Pro205

Ala GluTrp Met

Gln Leu

Lys Ser

Lys Ser160Lys Gln175

Gln Thr

Thr Thr

Asp Ala

Val Ser240

<210> 146<211> 813<212> DNA<213> Zea mays<4 00> 146

atggggcgcg gcaaggtgca gctgaagcgg atagagaaca agataaaccg gcaggtgacc 60

ttctccaagc gccggaacgg gctgctgaag aaggcgcacg agatctccgt cctctgcgac 120gccgaggtcg ccgtcatcgt cttctccccc aagggcaagc tctacgagta cgcctccgac 180tcccgcatgg acaaaattct agaacgttat gagcgatatt cctatgctga aaaggctctt 240atttcagctg aatctgaaag tgagggaaat tggtgccacg aatacaggaa actgaaggcc 300aaaattgaga ccatacaaag atgccacaag cacctgatgg gagaggatct agagtctttg 360aatccaaaag agctccaaca actagagcag cagctggaga gctcactgaa gcacatcaga 420tcaagaaaga gccaccttat ggccgagtca atttctgagc tacagaagaa ggagaggtca 480ctgcaggagg agaacaagat tctacagaag gaactttcag agaggcagaa ggcggtcgct 540agccggcagc agcagcagca gcaggtgcag tgggaccagc agacacaggt ccaggtccag 600acaagctcat cgtcttcttc cttcatgatg aggcaggatc agcagggact gccacctcca 660caaaacatct gcttcccgcc gttgagcatc ggagagagag gcgaagaggt ggctgcggcg 720gcgcagcagc agctgcctcc tccggggcag gcgcaaccac agctccgcat cgcaggtctg 780ccgccatgga tgctgagcca cctcaatgca taa 813

<210> 147<211> 270<212> PRT<213> Zea mays<4 00> 147

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile

Glu Asn

Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu

10

20

25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35

40

Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Ser

50

55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr

65 70 75

Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Arg

100 105

Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys

115

120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130

135

His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln

Ala Val45

Asp Ser60

Ala Glu

Cys His

Glu Leu125Arg Ser140

Lys Lys

145

150

155

Lys Ile Asn15

Lys Lys Ala30

Ile Val Phe

Arg Met Asp

Lys Ala Leu80

Glu Tyr Arg95

Lys His Leu110

Gln Gln Leu

Arg Lys Ser

Glu Arg Ser160Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ser Glu Arg Gln

165 170 175

Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln Gln Val Gln Trp Asp

180 185 190

Gln Gln Thr Gln Val Gln Val Gln Thr Ser Ser Ser Ser Ser Ser Phe

195 200 205

Met Met Arg Gln Asp Gln Gln Gly Leu Pro Pro Pro Gln Asn Ile Cys

210 215 220

Phe Pro Pro Leu Ser Ile Gly Glu Arg Gly Glu Glu Val Ala Ala Ala225 230 235 240

Ala Gln Gln Gln Leu Pro Pro Pro Gly Gln Ala Gln Pro Gln Leu Arg

245 250 255

Ile Ala Gly Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265 270

<210> 148<211> 689<212> DNA

<213> Sorghum bicolor<4 00> 148

gcaaggtgca gctcaagcgg atagagaaca agataaaccg gcaggtgacc ttctccaagc 60

<210> 149<211> 228<212> PRT

<213> Sorghum bicolor<4 00> 149

Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn Arg Gln Val Thr15 10 15

Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala His Glu Ile Ser

20 25 30

Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe Ser Pro Lys Gly

35 40 45

Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp Lys Ile Leu Glu

50 55 60

Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Ile Ser Ala Glu65 70 75 80

Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg Lys Leu Lys Ala

85 90 95

Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu Met Gly Glu Asp

100 105 110

Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu

115 120 125

Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser His Leu Met Ala

130 135 140

Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser Leu Gln Glu Glu145 150 155 160

Asn Lys Ala Leu Gln Lys Glu Leu Ala Glu Arg Gln Lys Ala Ala Ala

165 170 175

Ser Arg Gln Gln Gln Gln Gly Ala Val Gly Pro Ala Asp Thr Asp Pro

180 185 190

Gly Pro Asp Lys Leu Ile Ile Val Leu Leu His Asp Glu Ala Gly Ser

195 200 205

Ala Gly Ser Ala Ala Ser Thr Lys His Met Leu Pro Ala Ala Asp Asn210 215 220

Arg Arg Glu Arg225

<210> 150<211> 822<212> DNA<213> Zea mays<400> 150

atggggcgcg gcaaggtaca gctgaagcgg atagagaaca agataaaccg gcaggtgacc 60

ttctccaagc gccggaacgg cctgctcaag aaggcgcacg agatctccgt cctctgcgat 120gccgaggtcg ccgtcatcgt cttctccccc aagggcaagc tctacgagta cgccaccgac 180tcccgcatgg acaaaattct tgaacgctat gagcgatatt cctatgctga aaaggctctt 240atttcagctg aatctgaaag tgagggaaat tggtgccacg aatacaggaa actgaaggcc 300aaaattgaga ccatacaaaa atgccacaag cacctgatgg gagaggatct agagtctttg 360aatcccaaag agctccagca actagagcag cagctggata gctcactgaa gcacatcaga 420tcaaggaaga gccaccttat ggccgagtct atttctgagc tacagaagaa ggagaggtca 480ctgcaggagg agaacaaggc tctgcagaag gaacttgcgg agaggcagaa ggccgtcgcg 54 0agccggcagc agcagcaaca gcagcaggtg cagtgggacc agcagacaca tgcccaggcc 600cagacaagct catcatcgtc ctccttcatg atgaggcagg atcagcaggg actgccgcct 660ccacacaaca tctgcttccc gccgttgaca atgggagata gaggtgaaga gctggctgcg 720gcggcggcgg cgcagcagca gcagccactg ccggggcagg cgcaaccgca gctccgcatc 780gcaggtctgc caccatggat gctgagccac ctcaatgcat aa 822

<210> 151<211> 273<212> PRT

<213> Zea mays <4 00> 151 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Asp Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Ala Glu Arg Gln 165 170 175 Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln Gln Gln Val Gln Trp 180 185 190 Asp Gln Gln Thr His Ala Gln Ala Gln Thr Ser Ser Ser Ser Ser Ser 195 200 205 Phe Met Met Arg Gln Asp Gln Gln Gly Leu Pro Pro Pro His Asn Ile 210 215 220 Cys Phe Pro Pro Leu Thr Met Gly Asp Arg Gly Glu Glu Leu Ala Ala225 230 235 240Ala Ala Ala Ala Gln Gln Gln Gln Pro Leu Pro Gly Gln Ala Gln Pro 245 250 255 Gln Leu Arg Ile Ala Gly Leu Pro Pro Trp Met Leu Ser His Leu Asn 260 265 270 Ala<210> 152<211> 786<212> DNA

<213> Lolium temulentum<400> 152

atgggtcgcg gcaaggtgca gctgaagcgg atagagaaca agataaaccg tcaggtgaca 60

ttctccaagc gccgcaacgg gctactcaag aaggcgcacg agatctccgt cctctgcgac 120gccgaggtcg ccgtcgtcgt cttctccccg aaagggaagc tctatgagta cgccactgac 180tccagcatgg acaaaattct tgaacgttat gaacgctact cttatgctga aaaggctttg 240atttcagctg aatctgaaag tgagggaaat tggtgccatg aatacaggaa gctgaaggcg 300aagattgaga ctatacaaaa atgtcacaag cacctcatgg gggaggatct ggagtgtcta 360aacctgaaag agctccaaca actagagcag cagctggaga gttcattgaa gcacatcaga 420tcgagaaaga gccaccttat gatggagtcc atttctgagc tacagaagaa ggagcggtca 480ctccaggagg agaacaaggc tctacagaag gaactggtgg agaggcagaa ggcggccagg 54 0cagcagcagc aagagcagtg ggaccgtcag acccaaacac aacaagccca aaaccaacct 600caggcccaga cgagctcatc atcttcctcc ttcatgatga gggatcagca ggcccatgct 660caacaaaaca tctgttaccc gctggtgaca atgggtggag aggctgtggc cgcggcgcca 720gggcagcagg ggcagcttcg catcggaggc ctgccaccat ggatgctgag ccacctcaac 780gcttga 786

<210> 153<211> 261<212> PRT

<213> Lolium temulentum <4 00> 153 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Val Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Ser Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp Asp Arg Gln Thr Gln 180 185 190 Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln Thr Ser Ser Ser Ser 195 200 205 Ser Ser Phe Met Met Arg Asp Gln Gln Ala His Ala Gln Gln Asn Ile 210 215 220 Cys Tyr Pro Leu Val Thr Met Gly Gly Glu Ala Val Ala Ala Ala Pro225 230 235 240Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu Pro Pro Trp Met Leu 245 250 255 Ser His Leu Asn Ala 260 <210> 154

<211> 786<212> DNA

<213> Lolium perenne<4 00> 154atgggtcgcg gcaaggtgca gctgaagcgg atagagaaca

ttctccaagc gccgcaacgg gctactcaag aaggcgcacg

gccgaggtcg ccgtcgtcgt cttctccccg aaagggaagc

tccagcatgg acaaaattct tgaacgttat gaacgctact

atttcagctg aatctgaaag tgagggaaat tggtgccatg

aagattgaga ctatacaaaa atgtcacaag cacctcatgg

aacctgaaag agctccaaca actagagcag cagctggaga

tcgagaaaga gccaccttat gatggagtcc atttctgagc

ctccaggagg agaacaaggc tctacagaag gaactggtgg

cagcagcagc aagagcagtg ggaccgtcag acccaaacac

caggcccaga cgagctcatc atcttcctcc ttcatgatga

caacaaaaca tctgttaccc gccggtgaca atgggtggag

gggcagcagg ggcagcttcg catcggaggc ctgccaccatgcttga<210> 155<211> 261<212> PRT

<213> Lolium perenne<4 00> 155

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile

15 10Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly

20 25His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

agataaaccgagatctccgttctatgagtacttatgctgaaatacaggaagggaggatctgttcattgaatacagaagaaagaggcagaaaacaagcccagggatcagcaaggctgtggcggatgctgag

tcaggtgacccctctgcgaccgccactgacaaaggctttgactgaaggcgggagtgtctagcacatcagaggagcggtcaggcggccaggaaaccaacctggcccatgctcgcggcgccaccacctcaac

50

55

Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75

Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys

100 105

Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys

115 120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130 135

His Leu Met Met Glu Ser Ile Ser Glu Leu Gln145 150 155

Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu

165 170

Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp

180 185

Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln

195 200

Ser Ser Phe Met Met Arg Asp Gln Gln Ala His

210 215

Cys Tyr Pro Pro Val Thr Met Gly Gly Glu Ala225 230 235

Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu

245 250

Ser His Leu Asn Ala260

<210> 156<211> 831<212> DNA

<213> Hordeum vulgare<4 00> 156

atgggtcgcg gtaaggtgca gctgaagcgg atagagaacattctccaagc gccgcaacgg gctcctgaag aaggcgcacggcagaggtcg ccgtcatcgt cttctccccc aaaggcaagctccagcatgg acaaaattct tgaacgttat gagcgctactatttcagctg aatctgaaag tgaggggaat tggtgtcatg

Glu Asn

Leu Leu

Ala Val45

Asp Ser60

Ala Glu

Cys His

Glu Leu125Arg Ser140

Lys Lys

Leu Val

Asp Arg

Thr Ser205Ala Gln220

Val AlaPro Pro

Lys Ile

15Lys Lys30

Val Val

Ser Met

Lys Ala

Glu Tyr

95Lys His110

Gln Gln

Arg Lys

Glu Arg

Glu Arg175Gln Thr190

Ser Ser

Gln Asn

Ala Ala

Trp Met255

Asn

Ala

Phe

Asp

Leu80Arg

Leu

Ser

Ser160Gln

Gln

Ser

Ile

Pro240Leu

60120180240300360420480540600660720780786

agataaatcgagatctccgttctatgagtacttatgctgaaatacaggaa

gcaggtgacccctctgtgaccgccaccgacaaaggctcttacttaaggcg

60120180240300aagattgaga ccatacagaa gtgtcacaag cacctcatgg gagaggatct ggattctctgaacctcaaag aactccaaca actggagcag cagctggaga gttcattgaa gcacatcagatcgagaaaga gccatcttat gatggagtcc atttctgagc tacagaagaa ggagaggtcactgcaggagg agaacaaggc cctacagaag gaactggtgg agaggcagaa ggcggccagcaggcagcagc agctgcagca gcagcaacaa caacaacaaa tgcaatggga gcaccaagcccagacccaaa cccataccca tactcaaaac cagccccaag cccagactag ctcatcatcttcctctttca tgatgaggga tcagcaggcc catgcccctc aacagaacat ttgtagctacccaccggtga cgatgggtgg ggaggcgacg gcggcggcgg cggcgccgga gcagcaggctcagcttcgca tatgcctacc gccatggatg ctgagccacc tcaacgcttg a<210> 15.7<211> 276<212> PRT

<213> Hordeum vulgare<400> 157

275<210> 158<211> 804<212> DNA<213> Oryza sativa<4 00> 158

atggggcggg ggaaggtgca gctgaagcgg atagagaact cgatgaaccg gcaggtgacgttctccaaga ggaggaatgg attgctgaag aaggcgcacg agatctccgt cctctgcgacgccgaggtcg ccgccatcgt cttctccccc aagggcaagc tctacgagta cgccactgactccaggatgg acaaaatcct tgaacgttat gagcgctatt catatgctga aaaggctcttatttcagctg aatctgagag tgagggaaat tggtgccatg aatacaggaa gcttaaggcaaagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatct agaatccctgaatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataagatcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca

360420480540600660720780831

60120180240300360420480ctgcaggagg agaacaaggc tctgcagaag gaactggtggggccagcagc aagtagggca gtgggaccaa acccaggtccccccaagccc agacaagctt cttcttcttc ttcatgctgatcaccacaaa atatctgcta cccgccggtg atgatgggcccggcggcggt ggcggcccaa ggccaggtgc aacttccgcaatgctgagca ccttcaaggc ttaa<210> 159<211> 267<212> PRT

<213> Oryza sativa<400> 159

agaggcagaaaggcccaggcgggatcagcaagagaaatgattggaggctt

gaatgtgaggccaagcccaaggcacttctttgcggcggcgtccgccatgg

Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Ser Met Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Asn Gly Leu Leu Lys 30 Lys AlaHis Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Ala Ala 45 Ile Val PheSer Pro 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Arg Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Ser Glu Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Ile Glu Thr Ile 105 Gln Lys Cys His Lys 110 His LeuMet Gly Glu 115 Asp Leu Glu Ser Leu 120 Asn Leu Lys Glu Leu 125 Gln Gln LeuGlu Gln 130 Gln Leu Glu Ser Ser 135 Leu Lys His Ile Arg 140 Ser Arg Lys SerHis Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn 165 Lys Ala Leu Gln Lys 170 Glu Leu Val Glu Arg 175 GlnLys Asn Val Arg 180 Gly Gln Gln Gln Val 185 Gly Gln Trp Asp Gln 190 Thr GlnVal Gln Ala 195 Gln Ala Gln Ala Gln 200 Pro Gln Ala Gln Thr 205 Ser Phe PhePhe Phe 210 Phe Met Leu Arg Asp 215 Gln Gln Ala Leu Leu 220 Ser Pro Gln AsnIle Cys Tyr Pro Pro Val Met Met Gly Gln Arg Asn Asp Ala Ala Ala225 230 235 240Arg Arg Arg Trp Arg 245 Pro Lys Ala Arg Cys 250 Asn Phe Arg Ile Gly 255 GlyPhe Pro Pro Trp 260 Met Leu Ser Thr Phe 265 Lys Ala

<210> 160

<211> 804

<212> DNA

<213> Oryza sativa

<4 00> 160

atggggcggg ggaaggtgca gctgaagcgg atagagaaca agatcaacag gcaggtgacg

ttctccaaga ggaggaatgg attgctgaag aaggcgcacg agatctccgt cctctgcgac

gccgaggtcg ccgccatcgt cttctccccc aagggcaagc tctacgagta cgccactgac

tccaggatgg acaaaatcct tgaacgttat gagcgctatt catatgctga aaaggctctt

atttcagctg aatccgagag tgagggaaat tggtgccatg aatacaggaa acttaaggca

aagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatca tgaatccctg

aatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataata

tcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca

ctgcaggagg agaacaaggc tctgcagaag gaactggtgg agaggcagaa gaatgtgagg

ggccagcagc aagtagggca gtgggaccaa acccaggtcc aggcccaggc ccaagcccaa

ccccaagccc agacaagctc ctcctcctcc tccatgctga gggatcagca ggcacttctt

ccaccacaaa atatctgcta cccgccggtg atgatgggcg agagaaatga tgcggcggcg

gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg

540600660720780804

60120180240300360420480540600660720780atgctgagcc acctcaatgc ttaa<210> 161<211> 267<212> PRT

804

<213> Oryza sativa <400> 161 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly 20 25 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val 35 40 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr 50 55 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp 85 90 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys 100 105 Met Gly Glu Asp His Glu Ser Leu Asn Leu Lys 115 120 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile 130 135 His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln145 150 155Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu 165 170 Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln 180 185 Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala

Glu Asn LysLeuAla

Asp60Ala

Cys

Glu

Ile140Lys

Leu

Trp

Gln

Leu Lys

30Ala Ile45

Ser Arg

195

200

Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu Leu210 215 220

Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg Asn225 230 235

Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln Leu

245 250

Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265

<210> 162<211> 668<212> DNA

<213> Tradescantia virginiana<4 00> 162

gggctggtga agaaggctca tgagatctcd atkytrtgtgattttctcta ctaaaggcaa actatacgag tatgccactgcttgaacgct atgaacgtta ctcatatgct gagaaggcttttacagggaa attggtgcca agagtatgtt aaacttaaggaaaagccaaa ggcatcttat gggagagcaa ctagaagcgtcaactagagc atcaacttga aggttctttg aggcttgtcaatgttggact ccatttccga acttcagagg aaggaaaagtaacctagaga aggagatttt ggagaagcag aaagaaaaggtgggaacagc agaatcagcc actacaaagc actaattcgcgcagaaactc atccaacact aaacattgga aatttccaaggcagaagaaa gtctgcagcg tcagatgagg atcagcagcamttcacma<210> 163<211> 222<212> PRT

<213> Tradescantia virginiana<220>

<221> INSEGURO

Glu Lys

His Glu

His Lys110Leu Gln125

Ser Arg

Lys Glu

Val Glu

Asp Gln190Thr Ser205

Pro ProAsp AlaArg Ile

Ile Asn15

Lys Ala

Val Phe

Met Asp

Ala Leu80Tyr Arg95

His Leu

Gln Leu

Lys Ser

Arg Ser160Arg Gln175

Thr Gln

Ser Ser

Gln Asn

Ala Ala240Gly Gly255

atgcygaggtattccaaaattaacttcatcctaaggttgatggatctcaaggtcaagaaactctggaagactctggcacactccaaggccgtagaacaaagcctactgcc

tgcgcttattggaaaatatcagatcctgaaggccttacatagaattgcaggactcaaatggcaaaacaagccaagctcaccttcgtgatttaccgtccatmycmtggatg

60120180240300360420480540600660668<222> (11) .. (11)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>

<221> INSEGURO<222> (218) .. (218)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>

<221> INSEGURO<222> (221)..(221)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<4 00> 163

Gly Leu Val Lys Lys Ala His Glu Ile Ser Xaa Leu Cys Asp Ala Glu15 10 15

Val Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala

20 25 30 Thr Asp Ser 35 Lys Met Glu Asn Ile 40 Leu Glu Arg Tyr Glu 45 Arg Tyr SerTyr Ala 50 Glu Lys Ala Leu Thr 55 Ser Ser Asp Pro Glu 60 Leu Gln Gly AsnTrp Cys Gln Glu Tyr Val Lys Leu Lys Ala Lys Val Glu Ala Leu His65 70 75 80Lys Ser Gln Arg His 85 Leu Met Gly Glu Gln 90 Leu Glu Ala Leu Asp 95 LeuLys Glu Leu Gln 100 Gln Leu Glu His Gln 105 Leu Glu Gly Ser Leu 110 Arg LeuVal Arg Ser 115 Arg Lys Thr Gln Met 120 Met Leu Asp Ser Ile 125 Ser Glu LeuGln Arg 130 Lys Glu Lys Ser Leu 135 Glu Glu Gln Asn Lys 140 Asn Leu Glu LysGlu Ile Leu Glu Lys Gln Lys Glu Lys Ala Leu Ala His Gln Ala His145 150 155 160Trp Glu Gln Gln Asn 165 Gln Pro Leu Gln Ser 170 Thr Asn Ser Pro Pro 175 ArgPro Phe Val Ile 180 Ala Glu Thr His Pro 185 Thr Leu Asn Ile Gly 190 Asn PheGln Gly Arg 195 Thr Asn Thr Val His 200 Ala Glu Glu Ser Leu 205 Gln Arg Gln

Met Arg Ile Ser Ser Ser Leu Leu Pro Xaa Trp Met Xaa His

215

220

210<210> 164<211> 723<212> DNA

<213> Tradescantia virginiana<4 00> 164

gtgcagctga aacggatgga gaacaagatt aacaggcagg tgacgttttc taaacgtcga 60

<210> 165<211> 241<212> PRT

<213> Tradescantia virginiana<220>

<221> INSEGURO<222> (228) . . (228)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<4 00> 165

Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn Arg Gln Val Thr Phe1 5 10 15 Ser Lys Arg Arg Gly Gly Leu Leu Lys Lys Ala His Glu Ile Ser Ile 20 25 30 Leu Cys Asp Ala Glu Ile Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys 35 40 45 Leu Tyr Glu Tyr Ala Thr Asn Ser Lys Met Asp Asn Ile Leu Glu Arg 50 55 60 Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Thr Ser Ser Asp Pro65 70 75 80Asp Ile Gln Gly Asn Trp Cys Gln Glu Tyr Ala Lys Leu Lys Ser Lys 85 90 95 Val Glu Ala Leu Cys Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu 100 105 110 Glu Thr Leu Asn Leu Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu Glu 115 120 125 Gly Ser Leu Lys His Val Arg Ser Arg Lys Thr Gln Val Met Leu Asp 130 135 140 Ser Ile Ser Glu Leu Gln Arg Lys Glu Lys Ser Leu Glu Glu Gln Asn145 150 155 160Lys Asn Leu Glu Lys Glu Ile Leu Glu Lys Gln Lys Ile Lys Ala Leu 165 170 175 Ala Gln Gln Ala His Trp Glu His Gln Asn Gln Pro Ala Pro Arg Gly 180 185 190 Ser Pro Pro Arg Pro Phe Val Ile Ala Glu Ser His Pro Thr Leu Asn 195 200 205 Ile Gly His Phe Gln Gly Arg Thr Asn Ala Val Glu Ala Glu Glu Asn 210 215 220 Gln Gln Pro Xaa Met Arg Ile Cys Ser Ser Leu Leu Pro Pro Trp Met225 230 235 240

Leu<210> 166<211> 599<212> DNA

<213> Tradescantia virginiana<4 00> 166

gggctkgtga agaaagctca tgagatctcg gtactttgtg atgctgagct tgctcttatt 60

<210> 167<211> 199<212> PRT

<213> Tradescantia virginiana<4 00> 167

Gly 1 Leu Val Lys Lys 5 Ala His Glu Ile Ser 10 Val Leu Cys Asp Ala 15 GluLeu Ala Leu Ile 20 Ile Phe Ser Pro Lys 25 Gly Lys Leu Tyr Glu 30 Tyr AlaThr Asp Ser 35 Lys Met Glu Ile Ile 40 Leu Glu Arg Tyr Glu 45 Arg Tyr ThrTyr Ala 50 Glu Lys Ala Leu Ile 55 Ala Ser Asp Pro Asp 60 Val Gln Gly AsnTrp Cys His Glu Tyr Ile Lys Leu Lys Ala Lys Phe Glu Ala Leu Asn65 70 75

Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu

85 90

Lys Glu Leu Leu Gln Leu Glu Thr Lys Leu Glu

100 105

Val Arg Ser Arg Lys Thr Gln Leu Met Leu Asp

115 120

Gln Glu Lys Gly Lys Ser Leu Gln Glu Gln Asn

130 135

Glu Ile Leu Gly Lys Gln Lys Asp Lys Ala Pro145 150 155

Trp Glu Lys Gln Asn Gln Pro Pro Pro Thr Ser

165 170

Phe Leu Ile Gly Asp Ile His Pro Thr Pro Asn

180 185

Gly Arg Thr Val Ala Asp Ala

195<210> 168<211> 753<212> DNA

<213> Elaeis guineensis<400> 168

atggggagag ggagggtgca gctgaggcgg atcgagaacattctcgaagc gccggtcggg gctcctgaag aaagcccacggccgaggtcg ccctcatcat cttctcgacc aagggcaagctcctgcatgg aaaggattct tgaacgctat gaacgttacaatttcatctg gacccgaatt gcagggtaac tggtgccatgaaggttgagg ctttacaaaa aagccaaagg catctcatggaatctcaaag aactccagca actagagcaa cagcttgaaaaccagaaagt gccaactcat gtttgaatcc atctctgagcctgcaggagc agaacaagat gctggagaag gagctcatggctaaaccagc aggcaccttg ggagcagcaa ggcccgccgcacctccttcc tgatcggaga ctctctcccc accctgaataggaaatgaac atggggagga agcagcacaa ccccaggttcccaccttgga tgcttagcca cttgaacggg tag<210> 169<211> 250<212> PRT

<213> Elaeis guineensis<4 00> 169

Met Gly Arg Gly Arg Val Gln Leu Arg Arg Ile15 10

Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly

20 25

His Glu Ile Ser Val Leu Cys Asp Ala Glu Val

35 40

Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr

50 55

Arg Ile Leu Glu Arg Tyr Glu Arg Tyr Thr Tyr65 70 75

Ile Ser Ser Gly Pro Glu Leu Gln Gly Asn Trp

85 90

Lys Leu Lys Ala Lys Val Glu Ala Leu Gln Lys

100 105

Met Gly Glu Gln Leu Glu Pro Leu Asn Leu Lys

115 120

Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile

130 135

Gln Leu Met Phe Glu Ser Ile Ser Glu Leu Gln145 150 155

Leu Gln Glu Gln Asn Lys Met Leu Glu Lys Glu

165 170

Lys Val Lys Ala Leu Asn Gln Gln Ala Pro Trp

Asp Thr LeuGlySer

Thr140Lys

Ser

Ile

Ser Leu110Ile Ser125

Cys Leu

Gln His

Ala Pro

Arg Asn190

Asn

95

Lys

Glu

Val

Met175Phe

80Gln

Asn

Leu

Lys

Gln160Pro

Gln

agataaaccgagatctccgttctacgagtacctatgcagaaatttggcaagtgagcaactgttctttaaattcaaaaaaaagaagcagaaagacaagctcttgggacatagtataggaaa

gcaggtgacgcctctgcgaccgccaccgacaaaagcactaactcaaagcttgagcccttggcatataagaggaaaagtcaggtgaaggcaatcatccccaccaatgtagccagcctgtta

Glu Asn

Leu Leu

Ala Leu45

Asp Ser60

Ala Glu

Cys His

Ser Gln

Glu Leu125Arg Thr140

Lys LysLeu MetGlu Gln

Lys Ile Asn15

Lys Lys Ala30

Ile Ile Phe

Cys Met Glu

Lys Ala Leu80

Glu Phe Gly95

Arg His Leu110

Gln Gln Leu

Arg Lys Cys

Glu Lys Ser160

Glu Lys Gln175

Gln Gly Pro

60120180240300360420480540600660720753180 185

Pro Gln Thr Ser Ser Ser Ser Pro Thr Ser Phe

195 200

Leu Pro Thr Leu Asn Ile Gly Thr Tyr Gln Cys

210 215

Gly Glu Glu Ala Ala Gln Pro Gln Val Arg Ile225 230 235

Pro Pro Trp Met Leu Ser His Leu Asn Gly245 250

<210> 170<211> 699<212> DNA<213> Allium sp.<4 00> 170

gtgcaattga agaggatgga aaacaagatt aatagacaagaatggtttgt tgaagaaagc tcatgagatt tcwgtgctttattgttttct ctgctaaagg aaaactctat gaatattcaaattctggaga ggtatgaacg ttattgcttt gcggagaaatgactcccagg aggattggag ccttgaatat cacaaactgaaacaacaggc aaaggcatct tatgggagag caacttgaatggacagcttg agcaacaact tgagaattct ctcaaaactggaattgttaa gttctatttc agagcttcag gacaaggagaaaagctttag aaaatgagct tatgaaaagg gccagggcaagcacgatgga agcatcataa tcataaacaa caggataatcattggaaatt accaaacaag gaacaatgag ggaggagttggtacgtgttg ttagaaattt gttgccccac tggatgctt<210> 171<211> 233<212> PRT<213> Allium sp.<4 00> 171

Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn1 5 10

Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala

20 25

Leu Cys Asp Ala Glu Val Ala Leu Ile Val Phe

35 40

Leu Tyr Glu Tyr Ser Thr Asp Ser Ser Met Glu

50 55

Tyr Glu Arg Tyr Cys Phe Ala Glu Lys Ser Ser65 70 75

Asp Ser Gln Glu Asp Trp Ser Leu Glu Tyr His

85 90

Val Glu Ser Leu Asn Asn Arg Gln Arg His Leu

100 105

Glu Ser Leu Ser Leu Arg Glu Ile Gly Gln Leu

115 120

Asn Ser Leu Lys Thr Val Arg Thr Arg Lys Ser

130 135

Ser Ile Ser Glu Leu Gln Asp Lys Glu Lys Thr145 150 155

Lys Ala Leu Glu Asn Glu Leu Met Lys Arg Ala

165 170

Leu Glu Gln Gln Ala Arg Trp Lys His His Asn

180 185

Asn Leu His Asn Pro Asn Ile Asn Ile Gly Asn

195 200

Asn Glu Gly Gly Val Glu Pro Ala Thr Asp Val

210 215

Arg Asn Leu Leu Pro His Trp Met Leu225 230

<210> 172<211> 744

190

Leu Ile Gly Asp Ser205

Ser Gly Asn Glu His220

Gly Asn Ser Leu Leu240

tgaccttctcgtgatgcagactgattcaagcatcaacaataggctaaggtctctgagtctttcggacgcgaaactttgcgaagctattctttcataatccagccagcaac

aaaaagaagaagttgcactttatggaaaaagagtgacatttgagagtttatcgagaaattcaagagccaaagatgagaacggaacaacaaaaatatcaacggatgttcaa

Arg

His

Ser

Lys60Thr

Lys

Met

Glu

Gln140Leu

Arg

His

Tyr

Gln220

Gln

Glu

Ala

45

Ile

Met

Leu

Gly

Gln125Glu

Arg

Ala

Lys

Gln205Val

Val

Ile

30

Lys

Leu

Ser

Lys

Glu110Gln

Leu

Asp

Lys

Gln190Thr

Arg

Thr Phe15

Ser Val

Gly Lys

Glu Arg

Asp Ile80Ala Lys95

Gln Leu

Leu Glu

Leu Ser

Glu Asn160Ala Ile175

Gln AspArg AsnVal Val

60120180240300360420480540600660699<212> DNA

<213> Dendrobium grex Madame Thong-IN<400> 172

atgggtcgtg gcagggtgca gctgaagcga atcgagaatattctcgaagc ggagatctgg tttgcttaag aaggcgcacggctgaagttg ctctgatcgt tttttccaat aagggaaagctccagcatgg agaaaattct tgaacggtat gagcgttattttttccaatg aggccaaccc ccaggctgat tggcgccttgagggttgaaa gcttacagaa gagccaaagg caccttatggagcattaaag aactccaacg tctagagcaa cagcttgaaatccagaaaga cacagctcat actacattca atttccgagcttgctggagc aaaacaagac cttagagaag gagattatagttggtgcagc atgccccatg ggagaagcaa aaccagtccccctgtgattt cggattctgt cccaactccc accagcagaagaagaagaat cacctcagcc acagttaaga gtaagcaacactcagtcata tgaatggaca ataa<210> 173<211> 247<212> PRT

<213> Dendrobium grex Madame Thong-IN<4 00> 173

Met Gly Arg Gly Arg Val Gln Leu Lys Arg Ile

25

1 5 Arg Gln Val Thr Phe Ser 20 His Glu Ile Ser Val Leu 35 Ser Asn Lys Gly Lys Leu 50 Lys Ile Leu Glu Arg Tyr65 70Phe Ser Asn Glu Ala Asn 85 Lys Leu Lys Ala Arg Val 100 Met Gly Glu Gln Leu Asp 115 Glu Gln Gln Leu Glu Ser 130 Gln Leu Ile Leu His Ser145 150Leu Leu Glu Gln Asn Lys 165 Lys Ala Lys Ala Leu Val 180 Ser Gln Tyr Ser Ser Ala 195 Thr Pro Thr Ser Arg Thr

55

105

120

135

185

200

210

215

Pro Gln Pro Gln Leu Arg Val Ser Asn Thr Leu

225

230

[N Arg Ile Glu Asn Lys Ile Asn10 15 Ser Gly Leu Leu Lys Lys Ala 30 Glu Val Ala Leu Ile Val Phe 45 Ser Thr Asp Ser Ser Met Glu 60 Ser Tyr Ala Glu Arg Ala Leu 75 80Asp Trp Arg Leu Glu Tyr Asn90 95 Gln Lys Ser Gln Arg His Leu 110 Ile Lys Glu Leu Gln Arg Leu 125 Phe Ile Arg Ser Arg Lys Thr 140 Leu Gln Lys Met Glu Lys Ile 155 160Lys Glu Ile Ile Ala Lys Glu170 175 Pro Trp Glu Lys Gln Asn Gln 190 Val Ile Ser Asp Ser Val Pro 205 Arg Ala Asn Glu Glu Glu Ser 220 Thr Leu Leu Pro Pro Trp Met 235 240

Leu Ser His Met Asn Gly Gln245

<210> 174

<211> 2194

<212> DNA

<213> Oryza sativa

<4 00> 174

aatccgaaaa gtttctgcac cgttttcacc ccctaactaaaaatataaaa tgagacctta tatatgtagc gctgataactcatccaccta ctttagtggc aatcgggcta aataaaaaagtttccttagt aattaagtgg gaaaatgaaa tcattattgctctgtcatga agttaaatta ttcgaggtag ccataattgt

caatatagggagaactatgcagtcgctacattagaatatacatcaaactc

aacgtgtgctaagaaaaactctagtttcgtcgttcacatcttcttgaata

60120180240300360420480540600660720744

60120180240300aaaaaatctt tctagctgaa ctcaatgggtatgaagatat tctgaacgta ttggcaaagattgtgcattc gtcatatcgc acatcattaattagtaatta aagacaattg acttatttttgtacttacgc acacactttg tgctcatgtgtcaactagca acacatctct aatatcactctgaattcaag cactccacca tcaccagaccaattttacag aatagcatga aaagtatgaaaaaaaaagaa ttttgctcgt gcgcgagcgcacagagtggc tgcccacaga acaacccacatccgcaacaa ccttttaaca gcaggctttgaaccaagcat cctccttctc ccatctataaggaggcatcc aagccaagaa gagggagagccgaccgcctt ctcgatccat atcttccggtacctcctcct cacagggtat gtgcctcccttgtgtagtac gggcgttgat gttaggaaagtggatttggg atagaggggt tcttgatgttatggttttca atcgtctgga gagctctatggcgattttgt gagtaccttt tgtttgaggtgtaataaagt acggttgttt ggtcctcgátgctatccttt gtttattccc tattgaacaagatgagattg aatgattgat tcttaagccttacagtagtc cccatcacga aattcatggaccctgttctt ccgatttgct ttagtcccagactttctggt tcagttcaat gaattgattgagctgtagtt cagttaatag gtaataccccatttctgatc tccattttta attatatgaagattattttt tttattagct ctcaccccttctgtcctcaa ttttgttttc aaattcacatacctgtagaa gtttcttttt ggttattcctaagctgtaat cgggatagtt atactgcttgttggtgtagc ttgccacttt caccagcaaa<210> 175<211> 1725<212> DNA

<213> Arabidopsis thaliana<400> 175

atgaattcta acaactggct tggctttcctcatgaataca accttggctt ggtcagcgactggaatatga tcaatccaca cggtggaggagccgattttc tcggtgtgag caaaccggacaacgactcag actactactt ccataccaatgtcgttgtag cagcttgtga ctccaatactgagagtgctc acaatctaca gtcacttactgttgtagaca aagcttcacc atccgagaccgccgttgttg agacggccac gccaagacgtatctatcgtg gtgtcacaag acatcgatggaatagttgta gaagggaagg ccagtctagggataaagaag ataaagcagc aagatcatattcaactacta ctaatttccc cattacaaacatgacgaggc aagagttcgt ggctgccattgcttcgatgt atcgaggagt tacaaggcacggccgagtcg ccgggaacaa agacctctacgcagaagctt acgatatagc tgcaataaaggagatcaacc ggtacgacgt gaaagccattggcgcagcta aacggctcaa agaagctcaagagatgatag cccttggttc aagtttccagtccacctcat caagacttca gcttcaacctccttttctat ctcttcagaa caatgacatctcctcctctt ttaatcacca tagctatatcaacaattact tgcagcaaca gtcgagccagcatagcaatc cggctctgct tcatggacttaacaatggag gctctagtgg gagctacaac

aaagagagag attttttttatttaaacata taattatata

ggacatgtctattatttatccatgtgtgaggcctatttaaacttttaataacgaactattcaatctcccaaaaaacgatgcggccaggagattcctccccaccaaggacacgagttcttgtcggttgttcgggatctgtagcatgttatcgaaatgaaataaaatcagagtctggtagtgaaataatccagtccaaaattaacagttataaattttttttctacaaataatatagtttagatgaactgtacattattctgcgattatctatgactgcttgttcttatgatgttc

tactccatccttttttcgattgcacctccttacatttaggatatctaaaataggtttttctattgggcacatctaacggaagaggaggagccttttcccccgcgactagcgtcgatctctttggatttattctgtgatgaggttcggtttggtttagggacaccggtgatatgcttctcgactttgaagatcgcagctggatcctcaggacccaaatatctgcttttatatcaggagaaggcataagcagagctgaaagttgcattatccattacagaaatcatttcctt

aaaaaatagaattttatagtcaatttttattagatgcaagcaatacacgttagcaatatctacaaaaaatacatacaaaaacaggcaacaggacagcaagaggcaaagaatctctatataagaagccgagtccctcctcctgttctaggtttcctgttctgattagtagttcggaatctttttgcttggtatttgacgaacggtcccgttcttgtttagaacaggggattttaaaaagtcgcgttatcctaacttatccgtattcatttgctggcatgaatcttgtatctgaaatttatgtgtgcagttc

ctttcaccga acaactcttccatatggaca acccttttcaggagatgaag gaggagaggtgaaaaccaat ccaaccacctagcttgatgc ctagcgtccacctaacaaca gtagctatcattgtccatgg ggaccaccgcaccggggata acgctagcgggcattggaca ctttcggacaactggtcgat atgaggctcaaaaggaagac aagtttacttgatctagctg cacttaagtatacgagaaag aagtagaggaagaaggaaaa gtagtggattcaccaacatg gaagatggcattgggaactt ttagcactgatttagaggac ttaatgcagtctagagagta gcactcttccgctcttgagt cttcaaggaatacggtggtg gctcgagcactaccctctaa gcattcaacatctcattaca acaacaacaacagacacaac ttcatctccaaactctcagc agctctacaagtctctacct ctatcgttgaactgcagcat ttcttgggaa

tttgcctcctaacacaagagtccaaaagtgagtagcttacatcaaacgattgagcttcaatggtaataattggagcactaacgaacctcgtctatgggatgggtggatatctggggtcccaatgaagcacttcgagaggcagcaaggatcggaagaagcagaccaacttccatcggaggaacgcgaggcgaggctctggcaccattagagtgctcacgatccaacagacctgcgtatcttcaacaataatccacggtatt

360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001860192019802040210021602194

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560ggtattgggt ccagctcgac tgttggatcg accgaggagt ttccaaccgt taaaacagat 1620tacgatatgc cttccagtga tggaaccgga gggtatagtg gttggaccag tgagtctgtt 1680caggggtcaa accctggtgg tgttttcact atgtggaatg agtaa 1725

<210> 176<211> 574<212> PRT

<213> Arabidopsis thaliana<400> 176

Met Asn Ser Asn Asn Trp Leu Gly Phe Pro Leu Ser Pro Asn Asn Ser1 5 10 15 Ser Leu Pro Pro His Glu Tyr Asn Leu Gly Leu Val Ser Asp His Met 20 25 30 Asp Asn Pro Phe Gln Thr Gln Glu Trp Asn Met Ile Asn Pro His Gly 35 40 45 Gly Gly Gly Asp Glu Gly Gly Glu Val Pro Lys Val Ala Asp Phe Leu 50 55 60 Gly Val Ser Lys Pro Asp Glu Asn Gln Ser Asn His Leu Val Ala Tyr65 70 75 80Asn Asp Ser Asp Tyr Tyr Phe His Thr Asn Ser Leu Met Pro Ser Val 85 90 95 Gln Ser Asn Asp Val Val Val Ala Ala Cys Asp Ser Asn Thr Pro Asn 100 105 110 Asn Ser Ser Tyr His Glu Leu Gln Glu Ser Ala His Asn Leu Gln Ser 115 120 125 Leu Thr Leu Ser Met Gly Thr Thr Ala Gly Asn Asn Val Val Asp Lys 130 135 140 Ala Ser Pro Ser Glu Thr Thr Gly Asp Asn Ala Ser Gly Gly Ala Leu145 150 155 160Ala Val Val Glu Thr Ala Thr Pro Arg Arg Ala Leu Asp Thr Phe Gly 165 170 175 Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly 180 185 190 Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln 195 200 205 Ser Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Asp 210 215 220 Lys Ala Ala Arg Ser Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Pro225 230 235 240Ser Thr Thr Thr Asn Phe Pro Ile Thr Asn Tyr Glu Lys Glu Val Glu 245 250 255 Glu Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg 260 265 270 Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr 275 280 285 Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala 290 295 300 Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala305 310 315 320Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala 325 330 335 Val Thr Asn Phe Glu Ile Asn Arg Tyr Asp Val Lys Ala Ile Leu Glu 340 345 350 Ser Ser Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu 355 360 365 Ala Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Ala Glu Met Ile Ala 370 375 380 Leu Gly Ser Ser Phe Gln Tyr Gly Gly Gly Ser Ser Thr Gly Ser Gly385 390 395 400Ser Thr Ser Ser Arg Leu Gln Leu Gln Pro Tyr Pro Leu Ser Ile Gln 405 410 415 Gln Pro Leu Glu Pro Phe Leu Ser Leu Gln Asn Asn Asp Ile Ser His 420 425 430 Tyr Asn Asn Asn Asn Ala His Asp Ser Ser Ser Phe Asn His His Ser435

450

455

465

470

485

490

500

505

515

520

530

535

445 Gln Thr Asn Asn Tyr Leu 460 Leu Tyr Asn Ala Tyr Leu475 480Val Ser Thr Ser Ile Val 495 Gly Ser Tyr Asn Thr Ala 510 Gly Ser Ser Ser Thr Val 525 Thr Asp Tyr Asp Met Pro 540 Trp Thr Ser Glu Ser Val

545

550

555

560

Gln Gly Ser Asn Pro Gly Gly Val Phe Thr Met Trp Asn Glu

565

570

<210> 177<211> 1707<212> DNA

<213> Arabidopsis thaliana<400> 177

atgaattcta acaactggct cgcgttccct ctatcaccaa ctcactcttccacattcact cttcacaaaa ttctcatttc aatctaggttaacccttttc aaaaccaagg atggaatatg atcaatccacggagaggttc caaaagtggc tgatttctta ggagtgagcagatcacaacc tcgtacctta taacgacatt catcaaaccacaaaccaata gcttgttacc tacagtcgtc acttgtgcctgagcttcaag agagtgcaca caatttgcaa tctctcactcgctgccgctg cagaagtcgc cactgtgaaa gcctcgccggagtagcagca ctaccaacac aagcggagga gccatcgttg

ttggaaactt ttggacaacg aacctctatc tatcgtggagggtagatatg aagctcatct ttgggataat agctgtagaaggaagacaag tctacttagg tgggtatgac aaagaagagactagctgcac ttaaatattg gggtccctct actactaccagagaaggaag tagaggagat gaaaaacatg acgagacaagaggaagagta gcggattctc gcgtggtgca tccatgtatccaacatggaa gatggcaagc aaggatcggc cgagttgctgggaacattca gcacggagga agaagcagca gaagcttatgcgaggtctaa acgcggttac aaactttgag ataaatcggtgagagcaaca cacttcctat aggaggtggt gcggctaaacctagaatcat caagaaaacg agaggaaatg atagccctcgggtgcagcga gcggctcgag ctctgttgct tccagctctacctctaagca ttcaacaacc ttttgagcat cttcatcatccagaacaaca acgatatctc tcagtatcat gattcctttacatcttcacc aacaacaaac caacaattac ttgcagtctttacaatgctt atcttcagag taaccctggt ctgcttcatgaacacttcag ggtttcttgg aaacaatggg attggtattgtcatcggctg aggaagagtt tccagccgtg aaagtcgattggagctacag ggtatggagg atggaatagt ggagagtctgggtgttttca cgatgtggaa tgaataa<210> 178<211> 568<212> PRT

<213> Arabidopsis thaliana<4 00> 178

Met Asn Ser Asn Asn Trp Leu Ala Phe Pro Leu15 10

Ser Leu Pro Pro His Ile His Ser Ser Gln Asn

20 25

Gly Leu Val Asn Asp Asn Ile Asp Asn Pro Phe

35 40

Asn Met Ile Asn Pro His Gly Gly Gly Gly Glu

tggtcaacgaatggtggaggaatcgggggaacgcctccgactaatgctcctctctatgggctgagactagaggctacaccttacaagacagagaaggacaaagcagccagactttccgatagtttgtggcgtggagtaacgaaacaaagaacatagctgcatgatgtgaaggctcaaagagatcaaatttggcttcagctatcagcctttgttacattcactagtcacacgatttgtctcggtcaagctcacgatatgccctcaaggatc

tttgccgcctcaatatcgaccggcgaaggttcatcacaccctactacttttaataattataagtactggatgccgataatgagacggacttagatggaccatcaaggaaaagcatatgataactaactacttctataagaaaggcatcattctctacttggataaagtttagccatcctgagctcaagctccatcaatattcaaccttacacttactctagacgcagcttttcacagctctgataataactaccgttggatccttccggtgaatccagga

Ser Pro Thr His Ser15

Ser His Phe Asn Leu30

Gln Asn Gln Gly Trp45

Gly Gly Glu Val Pro

60120180240' 300360420480540600660720780840900960102010801140120012601320138014401500156016201680170750 55 60

Lys Val Ala Asp Phe Leu Gly Val Ser Lys Ser Gly Asp His His Thr65 70 75 80

Asp His Asn Leu Val Pro Tyr Asn Asp Ile His Gln Thr Asn Ala Ser

85 90 95

Asp Tyr Tyr Phe Gln Thr Asn Ser Leu Leu Pro Thr Val Val Thr Cys

100 105 110

Ala Ser Asn Ala Pro Asn Asn Tyr Glu Leu Gln Glu Ser Ala His Asn

115 120 125

Leu Gln Ser Leu Thr Leu Ser Met Gly Ser Thr Gly Ala Ala Ala Ala

130 135 140

Glu Val Ala Thr Val Lys Ala Ser Pro Ala Glu Thr Ser Ala Asp Asn145 150 155 160

Ser Ser Ser Thr Thr Asn Thr Ser Gly Gly Ala Ile Val Glu Ala Thr

165 170 175

Pro Arg Arg Thr Leu Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg

180 185 190

Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp

195 200 205

Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val

210 215 220

Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp225 230 235 240

Leu Ala Ala Leu Lys Tyr Trp Gly Pro Ser Thr Thr Thr Asn Phe Pro

245 250 255

Ile Thr Asn Tyr Glu Lys Glu Val Glu Glu Met Lys Asn Met Thr Arg

260 265 270

Gln Glu Phe Val Ala Ser Ile Arg Arg Lys Ser Ser Gly Phe Ser Arg

275 280 285

Gly Ala Ser Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg

290 295 300

Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu305 310 315 320

Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala

325 330 335

Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile Asn

340 345 350

Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser Asn Thr Leu Pro Ile Gly

355 360 365

Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala Gln Ala Leu Glu Ser Ser

370 375 380

Arg Lys Arg Glu Glu Met Ile Ala Leu Gly Ser Asn Phe His Gln Tyr385 390 395 400

Gly Ala Ala Ser Gly Ser Ser Ser Val Ala Ser Ser Ser Arg Leu Gln

405 410 415

Leu Gln Pro Tyr Pro Leu Ser Ile Gln Gln Pro Phe Glu His Leu His

420 425 430

His His Gln Pro Leu Leu Thr Leu Gln Asn Asn Asn Asp Ile Ser Gln

435 440 445

Tyr His Asp Ser Phe Ser Tyr Ile Gln Thr Gln Leu His Leu His Gln

450 455 460

Gln Gln Thr Asn Asn Tyr Leu Gln Ser Ser Ser His Thr Ser Gln Leu465 470 475 480

Tyr Asn Ala Tyr Leu Gln Ser Asn Pro Gly Leu Leu His Gly Phe Val

485 490 495

Ser Asp Asn Asn Asn Thr Ser Gly Phe Leu Gly Asn Asn Gly Ile Gly

500 505 510

Ile Gly Ser Ser Ser Thr Val Gly Ser Ser Ala Glu Glu Glu Phe Pro

515 520 525

Ala Val Lys Val Asp Tyr Asp Met Pro Pro Ser Gly Gly Ala Thr Gly

530 535 540

Tyr Gly Gly Trp Asn Ser Gly Glu Ser Ala Gln Gly Ser Asn Pro Gly545 550 555 560Gly Val Phe Thr Met Trp Asn Glu565

<210> 179<211> 1662<212> DNA<213> Glycine max<400> 179

atgaacaaca actggctttc gttccctctt tctcctactcgatcttcaag caactcaata tcatcaattt tcccttgggtaaccctttcc aaaatcatga ttggaatctg attaacacccaaagtggctg attttctagg agtgagcaag tctgaaaatcaacgaaattc attcaaatga ttcagattat ctgttcacaacaaaaccctg tgttggacac acctagcaat gagtatcaagcaatcattga cattatccat gggaagtggt aaggattcaaaatagcacaa acactactgt tgaagttgca cctagaagaaagaacatcca tatatcgtgg agtaactcga catagatggactttgggata atagctgtag aagggaaggc caatcaagaaggtggatatg ataaagaaga gaaagcagct agagcttatgtgggggacat ccaccactac caactttcca attagcaactatgaaacaca tgacgagaca agaatttgtt gccgccattatccaggggtg catcaatgta tcgtggagtt acaaggcatcgcaaggattg gcagagttgc aggaaacaaa gatctttactgaagaggctg cagaagcata cgacatagca gcgataaagtacaaactttg acatgagccg ctacgacgtg aaagccattcataggaggag gcgctgcaaa gcgtctgaaa gaagctcaagcgcgaagaga tgattgcact aggctcatct tccacgttcctcttctaggc ttcacgctta ccctctaatg cagcaccacccctctgctaa ctcttcaaaa ccacgacata agttcttctccctttgcãtc atcagggtta catccaaacg cagcttcagttcttcttata gctttcagaa taatgctcag ttctacaatggcattgcttc agggaatgat gaacatgggg tcttcttcttaataataata gtaacaataa taataataat gttggtgggtatggcttcga atgcaacggc ggggaacacg gtggggacagaaggtggact atgacatgcc ggctggaggt tacggtggctcagacgtcaa atggtggggt gttcacaatg tggaatgatt<210> 180<211> 553<212> PRT<213> Glycine max<4 00> 180

Leu Pro Ala His Asp Leu Gln Ala Thr Gln Tyr

attcttcctttagtgaacgaatagtagcaaagtcagacctacaacagtctaaaatgctaacatgtgaaacctttggatacctggaaggtaaaggacgccaatttagctgcatgagaaggagaaggaaaagaccaacacggtgggaacttttcagaggtctttgaaagcaactctagaatcaatacggaacaccagttcgaacttctctcatgcaccagcagttaccttcacttcctcatcttgtgggaagcggaggagttggtcggcggcaa

accagctcatgaacatggatcgaaattccatgcagccttaggtgcctatgtagtaatttgcagtggtgaaattcgggcagtgaagctcatagtttatttgactgaagtacattggatgaacagtggtttcaagatggcaacagtactgagcaacgctgtccactctcccattcgagaaaactcagcaagcgcaacctcaaccagcaagacgagtggcgctgaaccacccttgtgttggagtgggtttggtagggctggtgggactccatg

20

25

Gly Leu Val Asn Glu Asn Met Asp Asn Pro Phe

35

40

Asn Leu Ile Asn Thr His Ser Ser Asn Glu Ile

50

55

Phe65

Leu Gly Val Ser Lys Ser Glu Asn Gln Ser70

Asn Glu Ile His Ser Asn Asp Ser Asp Tyr Leu85

Leu Val Pro Met Gln Asn Pro Val Leu Asp Thr

100

105

Gln Glu Asn Ala Asn Ser Asn Leu Gln Ser Leu

115

120

Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly

130

135

Thr Thr Val Glu Val Ala Pro Arg Arg Thr Leu

145

150

Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His165

Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg

Leu Ser Pro Thr His Ser Ser10 15 Gln Tyr His Gln Phe Ser Leu 30 Pro Phe Gln Asn His Asp Trp 45 Glu Ile Pro Lys Val Ala Asp 60 Gln Ser Asp Leu Ala Ala Leu 75 80Tyr Leu Phe Thr Asn Asn Ser90 95 Asp Thr Pro Ser Asn Glu Tyr 110 Ser Leu Thr Leu Ser Met Gly 125 Ser Gly Glu Asn Ser Thr Asn 140 Thr Leu Asp Thr Phe Gly Gln 155 160Arg His Arg Trp Thr Gly Arg170 175 Cys Arg Arg Glu Gly Gln Ser

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201662180 185 190 Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys 195 200 205 Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser 210 215 220 Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Leu Asp Glu225 230 235 240Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg Lys 245 250 255 Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg 260 265 270 His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly 275 280 285 Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala 290 295 300 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser 325 330 335 Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala 340 345 350 Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Glu Met Ile Ala Leu Gly 355 360 365 Ser Ser Ser Thr Phe Gln Tyr Gly Thr Ser Ala Ser Ser Ser Arg Leu 370 375 380 His Ala Tyr Pro Leu Met Gln His His His Gln Phe Glu Gln Pro Gln385 390 395 400Pro Leu Leu Thr Leu Gln Asn His Asp Ile Ser Ser Ser His Phe Ser 405 410 415 His Gln Gln Asp Pro Leu His His Gln Gly Tyr Ile Gln Thr Gln Leu 420 425 430 Gln Leu His Gln Gln Ser Gly Ala Ser Ser Tyr Ser Phe Gln Asn Asn 435 440 445 Ala Gln Phe Tyr Asn Gly Tyr Leu Gln Asn His Pro Ala Leu Leu Gln 450 455 460 Gly Met Met Asn Met Gly Ser Ser Ser Ser Ser Ser Ser Val Leu Glu465 470 475 480Asn Asn Asn Ser Asn Asn Asn Asn Asn Asn Val Gly Gly Phe Val Gly 485 490 495 Ser Gly Phe Gly Met Ala Ser Asn Ala Thr Ala Gly Asn Thr Val Gly 500 505 510 Thr Ala Glu Glu Leu Gly Leu Val Lys Val Asp Tyr Asp Met Pro Ala 515 520 525 Gly Gly Tyr Gly Gly Trp Ser Ala Ala Asp Ser Met Gln Thr Ser Asn 530 535 540 Gly Gly Val Phe Thr Met Trp Asn Asp 545 550

<210> 181<211> 1674<212> DNA<213> Glycine max<4 00> 181

atgaacaaca actggctttc gttccctctt tctcctactc attcttcctt accagctcat 60

gatcttcaag caactcaata tcatcaattt tcccttgggt tagtgaacga gaacatggat 120

aaccctttcc aaaatcatga ttggaatctg attaacaccc atagtagcaa cgaaattcca 180

aaagtggctg attttctagg agtgagcaag tctgaaaatc agtcagacct tgcagcctta 240

aacgaaattc attcaaatga ttcagattat ctgttcacaa acaacagtct ggtgcctatg 300

caaaaccctg tgttggacac acctagcaat gagtatcaag aaaatgctaa tagtaatttg 360

caatcattga cattatccat gggaagtggt aaggattcaa catgtgaaac cagtggtgaa 420

aatagcacaa acactactgt tgaagttgca cctagaagaa ctttggatac attcgggcag 480

agaacatcca tatatcgtgg agtaactcga catagatgga ctggaaggta tgaagctcat 540

ctttgggata atagctgtag aagggaaggc caatcaagaa aaggacgcca agtttatttg 600

ggtggatatg ataaagaaga gaaagcagct agggcttatg atttagctgc actgaagtac 660tgggggacat ccaccactac caactttcca attagtaact atgagaagga attggatgaa 720

atgaaacaca tgacgcgaca agaatttgtt gctgccatta gaaggaaaag cagtggtttc 780

tccaggggtg catcaatgta tcgtggagtt acaaggcatc accaacacgg aagatggcaa 840

gcaagaattg gcagagttgc aggaaacaaa gatctttact tgggaacttt cagtactgaa 900

gaagaggctg ctgaagcata cgacatagct gcgataaagt tcagaggtct caacgctgtc 960

acaaactttg acatgagccg ctacgacgtg aaagccatcc ttgaaagcaa cactctccca 1020

ataggaggag gagctgcaaa gcgtctgaaa gaagctcaag ctctagaatc ttcgagaaag 1080

cgcgaagaga tgattgcact aggatcatcc acattccaat atggaaccac aagctctaat 1140

tctaggctac atgcttaccc tctaatgcag caccaccacc agtttgaaca acctcaacct 1200

ctgctaactt tgcaaaacca tgatatcagt tctcacttct ctcaccagca agaccctttg 1260

catcagggtt acatccaaac gcagcttcag ttgcaccagc agcagagtgg tggttcttct 1320

tcttatagct ttcagaataa taatataaat aatgctcagt tctataatgg ttataatctt 1380

cagaaccacc ctgcattgct tcagggaatg attaacatgg ggtcttcatc ttcttcatct 1440

gtgttggaga ataataatag taccaataat aatgttggtg ggtttgtggg aagtgggttt 1500

ggtatggctt ctaatgcaac gtcggggaac acggtgggga cggcggagga gctagggctg 1560

gtgaaggtgg actatgacat gccgactggt ggttacggtg gatggtcggc ggcggcggcg 1620

gcggagtcca tgcagacgtc gaatagtggg gtgttcacaa tgtggaatga ctga 1674<210> 182<211> 557<212> PRT<213> Glycine max<4 00> 182

Met Asn Asn Asn Trp Leu Ser Phe Pro Leu Ser Pro Thr His Ser Ser1 5 10 15 Leu Pro Ala His Asp Leu Gln Ala Thr Gln Tyr His Gln Phe Ser Leu 20 25 30 Gly Leu Val Asn Glu Asn Met Asp Asn Pro Phe Gln Asn His Asp Trp 35 40 45 Asn Leu Ile Asn Thr His Ser Ser Asn Glu Ile Pro Lys Val Ala Asp 50 55 60 Phe Leu Gly Val Ser Lys Ser Glu Asn Gln Ser Asp Leu Ala Ala Leu65 70 75 80Asn Glu Ile His Ser Asn Asp Ser Asp Tyr Leu Phe Thr Asn Asn Ser 85 90 95 Leu Val Pro Met Gln Asn Pro Val Leu Asp Thr Pro Ser Asn Glu Tyr 100 105 110 Gln Glu Asn Ala Asn Ser Asn Leu Gln Ser Leu Thr Leu Ser Met Gly 115 120 125 Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly Glu Asn Ser Thr Asn 130 135 140 Thr Thr Val Glu Val Ala Pro Arg Arg Thr Leu Asp Thr Phe Gly Gln145 150 155 160Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg 165 170 175 Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser 180 185 190 Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys 195 200 205 Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser 210 215 220 Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Leu Asp Glu225 230 235 240Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg Lys 245 250 255 Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg 260 265 270 His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly 275 280 285 Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala 290 295 300 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser325 330

Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys

340 345

Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Glu

355 360

Ser Ser Thr Phe Gln Tyr Gly Thr Thr Ser Ser

370

375

Ala Tyr Pro Leu Met Gln His His His Gln Phe385 390 395

Leu Leu Thr Leu Gln Asn His Asp Ile Ser Ser

405 410

Gln Asp Pro Leu His Gln Gly Tyr Ile Gln Thr

420 425

Gln Gln Gln Ser Gly Gly Ser Ser Ser Tyr Ser

435 440

Ile Asn Asn Ala Gln Phe Tyr Asn Gly Tyr Asn

450 455

Ala Leu Leu Gln Gly Met Ile Asn Met Gly Ser465 470 475

Val Leu Glu Asn Asn Asn Ser Thr Asn Asn Asn

485 490

Gly Ser Gly Phe Gly Met Ala Ser Asn Ala Thr

500 505

Gly Thr Ala Glu Glu Leu Gly Leu Val Lys Val

515 520

Thr Gly Gly Tyr Gly Gly Trp Ser Ala Ala Ala

530 535

Gln Thr Ser Asn Ser Gly Val Phe Thr Met Trp545 550 555

<210> 183<211> 1632<212> DNA

<213> Medicago trunculata<400> 183

atgaacaata actggctttc attccctctc tcaccttctcgatcttcaag caactcaata tcatcacttt cctcttggataaccctttcc aaaatcatga ttggaatctg atgaacacacaaggttgcgg attttctcgg tgtatgcaag tctgaaaatcaacgaaattc aatctaatga ttcagattat ctgtttacaaatgcaaaacc aaatggttac aacatgcacc aatgagtatcaatttgcagt ctttgacatt atccatggga agtggtaaagggtgaaaata gtacaaacac tgttgaagtt gctgttcctaggacaaagaa cttcgatata tcgcggtgta acaaaacatagctcaccttt gggataacag ctgtagaagg gaaggtcagtggatatgata aagaagagaa agctgctagg tcttatgattgggacatcca ccactaccaa ctttccagtt agcaactatgaagcacatga caagacaaga atttgttgcc tctattagaaaggggtgcat caatgtaccg tggagttaca aggcatcaccaggattggca gagttgcagg aaataaagat ctatacttgggaggctgcag aagcatacga catagcagca ataaaattcaaactttgaca tgactcgtta cgacgtgaaa gccattctcgggaggaggag ctgcaaaaag actaaaagaa gcacaagctcgaagaaatgc ttgcacttaa ctcatcatct ttccaatatgactagactcc aaccctaccc tctcatgcaa tatcatcaccttgctaacat tacaaaacaa ccatgaaagc ttgaattctcggtggtggtt atttccaaac acagcttgag ttgtgtcaaccagaatagta acataggttc attctacaat ggttattatccagatgaata atataggatc ttcttcttca tcttcggtgatctagtggga tttatagtaa tagtggaggg ttaattagtagtgccggtta aggttgatta tgacatgcaa ggtgatggaagcggcaggag agaacatgca gactgctgat ttgtttacaaagagagaatt ag<210> 184

Arg

Met

Asn380Glu

His

Gln

Phe

Leu460Ser

Val

Ser

Asp

Ala540Asn

Leu Lys350Ile Ala365

Ser Arg

Gln Pro

Phe Ser

Leu Gln430Gln Asn445

Gln Asn

Ser Ser

Gly Gly

Gly Asn510Tyr Asp525

Ala GluAsp

335

Glu Ala

Leu Gly

Leu His

Gln Pro400His Gln415

Leu His

Asn Asn

His Pro

Ser Ser480Phe Val495

Thr ValMet ProSer Met

attcttcctttagtcaatgaacaacagcaaactcagatctataacaatacaagaaaaggcattcaacatgaaagaacttcgatggactggcgagaaaaggtagctgcactagaaggaaatggaaaagcagaacatggaaggaactttcaggaggactcaaaaagcaacactagaaacttcgaacatcaagaatttgaacaaacaattctcaacaaaaccaagaatcatcctgggaaataaataatgctgtgtggttttggtgtggaatga

accttctaatcaacatggaatgaagttccatgctacaccgtctcatgccatagtaatagttgaaactagtagagacatttaaggtatgaaccgccaaggttaagtactggagatgaaatgcggtttctctatggcaagcacactgaagaacgctgtaacaactgccaattgagaaaacgcctctagtaacacctcaaccatcaacaccaaacaaccatcttggtttgttttggtggtggttgaggaatttcggctggtcgctatgagaca

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201632<211> 557<212> PRT

<213> Medicago trunculata<400> 184

Met Asn Asn Asn Trp Leu Ser Phe Pro Leu Ser Pro Thr His Ser Ser1 5 10 15

Leu Pro Ala His Asp Leu Gln Ala Thr Gln Tyr His Gln Phe Ser Leu

20 25 30

Gly Leu Val Asn Glu Asn Met Asp Asn Pro Phe Gln Asn His Asp Trp

35 40 45

Asn Leu Ile Asn Thr His Ser Ser Asn Glu Ile Pro Lys Val Ala Asp

50 55 60

Phe Leu Gly Val Ser Lys Ser Glu Asn Gln Ser Asp Leu Ala Ala Leu65 70 75 80

Asn Glu Ile His Ser Asn Asp Ser Asp Tyr Leu Phe Thr Asn Asn Ser

85 90 95

Leu Val Pro Met Gln Asn Pro Val Leu Asp Thr Pro Ser Asn Glu Tyr

100 105 110

Gln Glu Asn Ala Asn Ser Asn Leu Gln Ser Leu Thr Leu Ser Met Gly

115 120 125

Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly Glu Asn Ser Thr Asn

130 135 140

Thr Thr Val Glu Val Ala Pro Arg Arg Thr Leu Asp Thr Phe Gly Gln145 150 155 160

Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg

165 170 175

Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser

180 185 190

Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys

195 200 205

Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser

210 215 220

Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Leu Asp Glu225 230 235 240

Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg Lys

245 250 255

Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg

260 265 270

His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly

275 280 285

Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala

290 295 300

Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320

Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser

325 330 335

Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala

340 345 350

Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Glu Met Ile Ala Leu Gly

355 360 365

Ser Ser Thr Phe Gln Tyr Gly Thr Thr Ser Ser Asn Ser Arg Leu His

370 375 380

Ala Tyr Pro Leu Met Gln His His His Gln Phe Glu Gln Pro Gln Pro385 390 395 400

Leu Leu Thr Leu Gln Asn His Asp Ile Ser Ser His Phe Ser His Gln

405 410 415

Gln Asp Pro Leu His Gln Gly Tyr Ile Gln Thr Gln Leu Gln Leu His

420 425 430

Gln Gln Gln Ser Gly Gly Ser Ser Ser Tyr Ser Phe Gln Asn Asn Asn

435 440 445

Ile Asn Asn Ala Gln Phe Tyr Asn Gly Tyr Asn Leu Gln Asn His Pro

450 455 460

Ala Leu Leu Gln Gly Met Ile Asn Met Gly Ser Ser Ser Ser Ser Ser465 470 475

Val Leu Glu Asn Asn Asn Ser Thr Asn Asn Asn

485 490

Gly Ser Gly Phe Gly Met Ala Ser Asn Ala Thr

500 505

Gly Thr Ala Glu Glu Leu Gly Leu Val Lys Val

515 520

Thr Gly Gly Tyr Gly Gly Trp Ser Ala Ala Ala

530 535

Gln Thr Ser Asn Ser Gly Val Phe Thr Met Trp545 550 555

<210> 185<211> 2079<212> DNA<213> Oryza sativa<400> 185

atggccacca tgaacaactg gctggccttc tccctctccctctcagacca actccactct catctccgcc gccgccaccatccaccggcg acgtctgctt caacatcccc caagattggatcggcgctcg tcgccgagcc gaagctggag gacttcctcgcagcagcatc atcacggcgg caagggcggc gtgatcccgagcgagctccg gcagcagcgt cggctacctg taccctcctcttcgccgact ccgtcatggt ggccacctcc tcgcccgtcgggcggcggca tggtgagcgc cgccgccgcc gcggcggccactgtccatga tcaagaactg gctccggagc cagccggcgctctctgtcca tgaacatggc ggggacgacg acggcgcaggctcgccggcg caggggagcg aggccggacg acgcccgcgtgcgcacggag cgacgacggc gacgatggct ggtggtcgcaagcggcagcg ccggcgccgt ggttgccgtc ggctcggagtgtggaggccg gcgcggcggc ggcggcggcg aggaagtccgacatcgatct accgcggcgt gacaaggcat agatggacagtgggacaaca gctgcagaag agagggccaa actcgcaaggaaagaggaaa aagctgctag agcttatgat ttggctgctcacgacgacaa attttccggt aaataactat gaaaaggagcacaaggcagg agttcgtagc ctctttgaga aggaagagcatccatttacc gtggagtaac taggcatcac cagcatgggaagagttgcag ggaacaagga cctctacttg ggcaccttcagaggcgtacg acatcgcggc gatcaagttc cgggggctcaatgagccgct acgacgtcaa gagcatcctc gacagcgctggccaagcgcc tcaaggacgc cgaggccgcc gccgcctacgcacctcggcg gcgacggcgc ctacgccgcg cattacggccgccgcctggc cgaccatcgc gttccaggcg gcggcggcgcctttaccacc cgtacgcgca gccgctgcgt gggtggtgcagtgatcgcgg cggcgcacag cctgcaggat ctccaccaccgccgcgcatg acttcttctc gcaggcgatg cagcagcagcaacgcgtcgc tcgagcacag caccggctcc aactccgtcgggcggaggcg gcggctacat catggcgccg atgagcgccggtggcgagca gccacgatca cggcggcgac ggcgggaagcagctacctcg tcggcgcaga cgcctacggc ggcggcggcggcgatgacgc cggcgtcggc gccggccgcc acgagcagcacatggcgcac agctcttcag cgtctggaac gacacataa<210> 186<211> 692<212> PRT

<213> Oryza sativa<4 00> 186

Met Ala Thr Met Asn Asn Trp Leu Ala Phe Ser15 10

Gln Leu Pro Pro Ser Gln Thr Asn Ser Thr Leu

20 25

Thr Thr Thr Thr Ala Gly Asp Ser Ser Thr Gly

35 40

Ile Pro Gln Asp Trp Ser Met Arg Gly Ser Glu

480

Val Gly Gly Phe Val495

Ser Gly Asn Thr Val510

Asp Tyr Asp Met Pro525

Ala Ala Glu Ser Met540

Asn Asp

cgcaggatcaccaccaccgcgcatgagggggcggcatctcgcagcgccgccaagctcatctcgcccacgagtggcaacggcgcagccggcgcggcggcgccagagagcctaggagattaacaggcggcagtcgacacgttggaggtatgagtcgtcaaggtcaaatactgtggaggagatgtggtttctcgatggcaagcgcacgcaggaacgccgtcacccctccccgtacgtcggccgaccaccaccacgccgccgcaagcaggagcatcaacctcggacggcctcggtctacaacggtgtcggccacaggtgcagatccgggaggatgcgacatgac

gctcccgccgcggcgactccatcggagctccttctcggagcgcttgctacctcgctccagcggcgtcagccggcattggcgcaggcgctgcatggcgctcgtccacgtcgcgaggaaggccggcgccgtgcggccagagaggctcatctttggttatgacgggcccgacggaagcacatgcagaggtgcaaaggataggaggaggcggcgcaacttcgaccggcaccgcccatcgcctcgctcggccgcccgccgccgggggaccacgcccgccgccgcccagcatcgaccgacaatggcggccaccgcgggggtacgacgccatcctggcggagtctgc

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801740180018601920198020402079

Leu Ser Pro Gln Asp15

Ile Ser Ala Ala Ala30

Asp Val Cys Phe Asn45

Leu Ser Ala Leu Val50 55 60

Ala Glu Pro Lys Leu Glu Asp Phe Leu Gly Gly Ile Ser Phe Ser Glu65 70 75 80

Gln Gln His His His Gly Gly Lys Gly Gly Val Ile Pro Ser Ser Ala

85 90 95

Ala Ala Cys Tyr Ala Ser Ser Gly Ser Ser Val Gly Tyr Leu Tyr Pro

100 105 110

Pro Pro Ser Ser Ser Ser Leu Gln Phe Ala Asp Ser Val Met Val Ala

115 120 125

Thr Ser Ser Pro Val Val Ala His Asp Gly Val Ser Gly Gly Gly Met

130 135 140

Val Ser Ala Ala Ala Ala Ala Ala Ala Ser Gly Asn Gly Gly Ile Gly145 150 155 160

Leu Ser Met Ile Lys Asn Trp Leu Arg Ser Gln Pro Ala Pro Gln Pro

165 170 175

Ala Gln Ala Leu Ser Leu Ser Met Asn Met Ala Gly Thr Thr Thr Ala

180 185 190

Gln Gly Gly Gly Ala Met Ala Leu Leu Ala Gly Ala Gly Glu Arg Gly

195 200 205

Arg Thr Thr Pro Ala Ser Glu Ser Leu Ser Thr Ser Ala His Gly Ala

210 215 220

Thr Thr Ala Thr Met Ala Gly Gly Arg Lys Glu Ile Asn Glu Glu Gly225 230 235 240

Ser Gly Ser Ala Gly Ala Val Val Ala Val Gly Ser Glu Ser Gly Gly

245 250 255

Ser Gly Ala Val Val Glu Ala Gly Ala Ala Ala Ala Ala Ala Arg Lys

260 265 270

Ser Val Asp Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr

275 280 285

Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser

290 295 300

Cys Arg Arg Glu Gly Gln Thr Arg Lys Gly Arg Gln Gly Gly Tyr Asp305 310 315 320

Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr

325 330 335

Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Asn Asn Tyr Glu Lys

340 345 350

Glu Leu Glu Glu Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ser

355 360 365

Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg

370 375 380

Gly Val Thr Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly385 390 395 400

Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Gln

405 410 415

Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly

420 425 430

Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ser

435 440 445

Ile Leu Asp Ser Ala Ala Leu Pro Val Gly Thr Ala Ala Lys Arg Leu

450 455 460

Lys Asp Ala Glu Ala Ala Ala Ala Tyr Asp Val Gly Arg Ile Ala Ser465 470 475 480

His Leu Gly Gly Asp Gly Ala Tyr Ala Ala His Tyr Gly His His His

485 490 495

His Ser Ala Ala Ala Ala Trp Pro Thr Ile Ala Phe Gln Ala Ala Ala

500 505 510

Ala Pro Pro Pro His Ala Ala Gly Leu Tyr His Pro Tyr Ala Gln Pro

515 520 525

Leu Arg Gly Trp Cys Lys Gln Glu Gln Asp His Ala Val Ile Ala Ala

530 535 540

Ala His Ser Leu Gln Asp Leu His His Leu Asn Leu Gly Ala Ala Ala545 550 555 560Ala Ala His Asp Phe Phe Ser Gln Ala Met Gln

565 570

Gly Ser Ile Asp Asn Ala Ser Leu Glu His Ser

580 585

Val Val Tyr Asn Gly Asp Asn Gly Gly Gly Gly

595 600

Ala Pro Met Ser Ala Val Ser Ala Thr Ala Thr

610 615

His Asp His Gly Gly Asp Gly Gly Lys Gln Val625 630 635

Ser Tyr Leu Val Gly Ala Asp Ala Tyr Gly Gly

645 650

Met Pro Ser Trp Ala Met Thr Pro Ala Ser Ala

660 665

Ser Ser Asp Met Thr Gly Val Cys His Gly Ala

675 680

Trp Asn Asp Thr

690<210> 187<211> 2133<212> DNA<213> Zea mays<4 00> 187

atggccactg tgaacaactg gctcgctttc tccctctccccagacgacgg actccacact catctcggcc gccaccgccgtgcttcaaca tcccccaaga ttggagcatg aggggatcaggagccgaagc tggaggactt cctcggcggc atctccttctaactgcaaca tgatacccag cactagcagc acagtttgctaccggctacc atcaccagct gtaccaccag cccaccagcttccgtaatgg tggcctcctc ggccggtgtc cacgacggcggccgctaacg gtgtcgctgg cgctgccagt gccaacggcgattaagaact ggctgcggag ccaaccggcg cccatgcagcggcgcgcagg ggctctcttt gtccatgaac atggcggggaatgccacttc tcgctggaga gcgcgcacgg gcgcccgagaggtggagccg tcgtcgtcac ggcgccgaag gaggatagcggctctagtag ccgtgagcac ggacacgggt ggcagcggcggcaaggaaga cggtggacac gttcgggcag cgcacgtcgacatagatgga ctgggagata tgaggcacat ctttgggatacaaactcgta agggtcgtca agtctattta ggtggctatgagggcttatg atcttgctgc tctgaagtac tggggtgccagtgagtaact acgaaaagga gctcgaggac atgaagcacagcgtctctga gaaggaagag cagtggtttc tccagaggtgactaggcatc accaacatgg aagatggcaa gcacggattggatctttact tgggcacctt cagcacccag gaggaggcaggcgatcaagt tccgcggcct caacgccgtc accaacttcgaagagcatcc tggacagcag cgccctcccc atcggcagcggccgaggccg cagcgtccgc gcagcaccac cacgccggcgcgcatcgcct cgcagctcgg cgacggcgga gccctggcggcacggcgccg cctggccgac catcgcgttc cagccgggcgcacccgtacg cgcagcagcc aatgcgcggc ggcgggtggtgcggtgatcg cggccgcgca cagcctgcag gacctccaccggcgcgcacg actttttctc ggcagggcag caggccgccgggtagcatcg acagtgcgtc gctcgagcac agcaccggctggcggggtcg gcgacagcaa cggcgccagc gccgtcggcgatgccgatga gcgctgccgg agcaaccact acatcggcaacatgcacggg cctacgacga agccaagcag gctgctcagagtgaacgcgg agaacaatgg tggcggaagg atgtctgcatgccgcggcgg cagcagcaag cagcaacgac aacatggccggcgcagctct tcagtgtctg gaacgacact taa<210> 188<211> 710<212> PRT<213> Zea mays

Gln Gln His

Thr Gly Ser590

Gly Gly Tyr605

Ala Val Ala620

Gln Met Gly

Gly Gly Ala

Pro Ala Ala670

Gln Leu Phe685

Gly Leu575

Asn Ser

Ile Met

Ser Ser

Tyr Asp640Gly Arg655

Thr SerSer Val

cgcaggagct gccgccctcc 60accatgtctc cggcgatgtc 120agctttcggc gctcgtcgcg 180ccgagcagca tcacaaggcc 240acgcgagctc aggtgctagc 300cagcgctcca cttcgcggac 360gtgccatgct cagcgcggcc 420gcggcatcgg gctgtccatg 480cgagggtggc ggcggctgag 540cgacccaagg cgctgctggc 600gtgtatcgac gtcagcacag 660gtggcagcgg tgttgccggc 720gcgcgtcggc tgacaacacg 780tttaccgtgg cgtgacaagg 840acagttgcag aagggaaggg 900ataaagagga gaaagctgct 960caacaacaac aaattttcca 1020tgacaaggca ggagtttgta 1080catccattta caggggagtg 1140gacgagttgc agggaacaag 1200cggaggcgta cgacatcgcg 1260acatgagccg ctacgacgtg 1320ccgccaagcg cctcaaggag 1380tggtgagcta cgacgtcggc 1440cggcgtacgg cgcgcactac 1500ccgccagcac aggcctgtac 1560gcaagcagga gcaggaccac 1620acctgaacct gggcgcggcc 1680ccgctgcgat gcacggcctg 1740ccaactccgt cgtctacaac 1800gcagtggcgg tggctacatg 1860tggtgagcca cgagcaggtg 1920tggggtacga gagctacctg 1980gggggactgt cgtgtctgca 2040ccgacgtcgg ccatggcggc 2100 2133<400> 188

Met Ala Thr Val Asn Asn Trp Leu Ala Phe Ser Leu Ser Pro Gln Glu1 5 10 15

Leu Pro Pro Ser Gln Thr Thr Asp Ser Thr Leu Ile Ser Ala Ala Thr

20 25 30

Ala Asp His Val Ser Gly Asp Val Cys Phe Asn Ile Pro Gln Asp Trp

35 40 45

Ser Met Arg Gly Ser Glu Leu Ser Ala Leu Val Ala Glu Pro Lys Leu

50 55 60

Glu Asp Phe Leu Gly Gly Ile Ser Phe Ser Glu Gln His His Lys Ala65 70 75 80

Asn Cys Asn Met Ile Pro Ser Thr Ser Ser Thr Val Cys Tyr Ala Ser

85 90 95

Ser Gly Ala Ser Thr Gly Tyr His His Gln Leu Tyr His Gln Pro Thr

100 105 110

Ser Ser Ala Leu His Phe Ala Asp Ser Val Met Val Ala Ser Ser Ala

115 120 125

Gly Val His Asp Gly Gly Ala Met Leu Ser Ala Ala Ala Ala Asn Gly

130 135 140

Val Ala Gly Ala Ala Ser Ala Asn Gly Gly Gly Ile Gly Leu Ser Met145 150 155 160

Ile.. Lys Asn Trp Leu Arg Ser Gln Pro Ala Pro Met Gln Pro Arg Val

165 170 175

Ala Ala Ala Glu Gly Ala Gln Gly Leu Ser Leu Ser Met Asn Met Ala

180 185 190

Gly Thr Thr Gln Gly Ala Ala Gly Met Pro Leu Leu Ala Gly Glu Arg

195 200 205

Ala Arg Ala Pro Glu Ser Val Ser Thr Ser Ala Gln Gly Gly Ala Val

210 215 220

Val Val Thr Ala Pro Lys Glu Asp Ser Gly Gly Ser Gly Val Ala Gly225 230 235 240

Ala Leu Val Ala Val Ser Thr Asp Thr Gly Gly Ser Gly Gly Ala Ser

245 250 255

Ala Asp Asn Thr Ala Arg Lys Thr Val Asp Thr Phe Gly Gln Arg Thr

260 265 270

Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu

275 280 285

Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Thr Arg Lys

290 295 300

Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala305 310 315 320

Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Ala Thr Thr Thr

325 330 335

Thr Asn Phe Pro Val Ser Asn Tyr Glu Lys Glu Leu Glu Asp Met Lys

340 345 350

His Met Thr Arg Gln Glu Phe Val Ala Ser Leu Arg Arg Lys Ser Ser

355 360 365

Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His

370 375 380

Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys385 390 395 400

Asp Leu Tyr Leu Gly Thr Phe Ser Thr Gln Glu Glu Ala Ala Glu Ala

405 410 415

Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn

420 425 430

Phe Asp Met Ser Arg Tyr Asp Val Lys Ser Ile Leu Asp Ser Ser Ala

435 440 445

Leu Pro Ile Gly Ser Ala Ala Lys Arg Leu Lys Glu Ala Glu Ala Ala

450 455 460

Ala Ser Ala Gln His His His Ala Gly Val Val Ser Tyr Asp Val Gly465 470 475 480

Arg Ile Ala Ser Gln Leu Gly Asp Gly Gly Ala Leu Ala Ala Ala Tyr485 490 495Gly Ala His Tyr His Gly Ala Ala Trp Pro Thr

500 505

Gly Ala Ala Ser Thr Gly Leu Tyr His Pro Tyr

515 520

Arg Gly Gly Gly Trp Cys Lys Gln Glu Gln Asp

530 535

Ala Ala His Ser Leu Gln Asp Leu His His Leu545 550 555

Gly Ala His Asp Phe Phe Ser Ala Gly Gln Gln

565 570

Met His Gly Leu Gly Ser Ile Asp Ser Ala Ser

580 585

Gly Ser Asn Ser Val Val Tyr Asn Gly Gly Val

595 600

Ala Ser Ala Val Gly Gly Ser Gly Gly Gly Tyr

610 615

Ala Ala Gly Ala Thr Thr Thr Ser Ala Met Val625 630 635

His Ala Arg Ala Tyr Asp Glu Ala Lys Gln Ala

645 650

Glu Ser Tyr Leu Val Asn Ala Glu Asn Asn Gly

660 665

Ala Trp Gly Thr Val Val Ser Ala Ala Ala Ala

675 680

Asn Asp Asn Met Ala Ala Asp Val Gly His Gly

690 695

Ser Val Trp Asn Asp Thr705 710

<210> 189<211> 1374<212> DNA

<213> Lotus corniculatus<4 00> 189

agatctctct ctgcagtgca caatccagtg gtaagcacatcaagaaaatg gtaatggtaa tttgcaatcg ttgacattattcaacatgtg aaaccagtgg tgacactagt accaacactaaccttggaga catttgggca aagaacatct atatatcgagaccggaaggt atgaagctca cctttgggac aatagctgtaaaaggtcgcc aaggtggata tgataaagaa gacaaagcaggcccttaagt actgggggac atccactact accaactttcgaagtggatg acatgaagca tatgacaaga caagaatttgagcagtggtt tctcgagggg tgcttcaatg tatcgtggaggggaggtggc aagcaaggat tggaagagtt gcaggaaacattcggtactg aggaagaggc ggcagaagct tacgacatagcttaacgcca tcaccaactt tgacatgaac cgttacgatgaacaccctcc caatcggagg aggagcttca aaaaggctaatcttcaagaa aacgtgaaga tcagatgatt gcactcggctattgcaaccc catcaagctc tacaaggcca caaccttacccacaatcagt ttgaacaaca gcctcaacca tttctaaccttctcaatact cccatcatca gcaggaccct tcgtttcagccttcagttgc agttgaatca acacggtggt ggtggttctacctcatcaga acagtgagtt ctataatggt ggaaattattatgatgatga acaatagtat ggggtcttgt tcttcatcgtaatgctgctg ctggtggggc ttcttttgtg ggtcccgcagaaggttgatt atgacatgga tgctgctgct ggcggtggttgagtccatgc acacgtcggc ggctggtggt ttgtttacta<210> 190<211> 457<212> PRT

<213> Lotus corniculatus<400> 190

Arg Ser Leu Ser Ala Val His Asn Pro Val Val1 5 10

Ile

Ala

His540Asn

Ala

Leu

Gly

Met620Ser

Ala

Gly

Ala

Gly700

Ala Phe510Gln Gln525

Ala Val

Leu Gly

Ala Ala

Glu His590Asp Ser605

Met Pro

His Glu

Gln Met

Gly Arg670Ala Ala685

Ala Gln

Gln Pro

Pro Met

Ile Ala

Ala Ala560Ala Ala575

Ser Thr

Asn Gly

Met Ser

Gln Val640Gly Tyr655

Met SerSer SerLeu Phe

gtagtaatggccatgggaagtcgaagctgtgtgtaacaaggaagggaaggctagggcctacggttagcaatggcttccatttacaaggcaaagatctttactgcgataaatgaaagccataagaaactcacaacatttcacgctaaaccttacaaaaccaagagttacatgttatgctcaaccttcagaactgtgttggacggaggaactatggtggttgtgtggaatga

taatgagtcttggtaaggatgcctagaagaacatagatggacagtcaaggtgatttagctctatgagaagtagaaggaaatcatcaacatcttgggaactgttcagaggctctagagagcagctctggaatcaatacggaaatgcatcattgacattaattcaaacacagagaaacagctccttcagggagaatgatcattgggttggttgtcagcggcggtga

601201802403003604204805406006607207808409009601020108011401200126013201374

Ser Thr Cys Ser Asn1 5Gly Asn Glu Ser Gln Glu Asn Gly Asn Gly Asn Leu Gln Ser Leu Thr

20 25 30

Leu Ser Met Gly Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly Asp

35 40 45

Thr Ser Thr Asn Thr Ile Glu Ala Val Pro Arg Arg Thr Leu Glu Thr

50 55 60

Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp65 70 75 80

Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu

85 90 95

Gly Gln Ser Arg Lys Gly Arg Gln Gly Gly Tyr Asp Lys Glu Asp Lys100 105 110

Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser 115 120 125 Thr Thr Thr Asn Phe Pro Val Ser Asn Tyr Glu Lys Glu Val Asp Asp 130 135 140 Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ser Ile Arg Arg Lys145 150 155 160Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg 165 170 175 His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly 180 185 190 Asn Lys Asp Leu Tyr Leu Gly Thr Phe Gly Thr Glu Glu Glu Ala Ala 195 200 205 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Ile 210 215 220 Thr Asn Phe Asp Met Asn Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser225 230 235 240Asn Thr Leu Pro Ile Gly Gly Gly Ala Ser Lys Arg Leu Lys Glu Thr 245 250 255 Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Asp Gln Met Ile Ala Leu 260 265 270 Gly Ser Thr Phe His Gln Tyr Gly Ile Ala Thr Pro Ser Ser Ser Thr 275 280 285 Arg Pro Gln Pro Tyr Pro Leu Asn Leu Met His His His Asn Gln Phe 290 295 300 Glu Gln Gln Pro Gln Pro Phe Leu Thr Leu Gln Asn His Asp Ile Asn305 310 315 320Ser Gln Tyr Ser His His Gln Gln Asp Pro Ser Phe Gln Gln Ser Tyr 325 330 335 Ile Gln Thr Gln Leu Gln Leu Gln Leu Asn Gln His Gly Gly Gly Gly 340 345 350 Ser Ser Tyr Ala Gln Glu Thr Ala Pro His Gln Asn Ser Glu Phe Tyr 355 360 365 Asn Gly Gly Asn Tyr Tyr Leu Gln Asn Leu Gln Gly Met Met Met Asn 370 375 380 Asn Ser Met Gly Ser Cys Ser Ser Ser Ser Val Leu Glu Asn Asp His385 390 395 400Asn Ala Ala Ala Gly Gly Ala Ser Phe Val Gly Pro Ala Ala Glu Glu 405 410 415 Leu Gly Leu Val Lys Val Asp Tyr Asp Met Asp Ala Ala Ala Gly Gly 420 425 430 Gly Tyr Gly Gly Trp Ser Ala Ala Glu Ser Met His Thr Ser Ala Ala 435 440 445 Gly Gly Leu Phe Thr Met Trp Asn Glu 450 455

<210> 191

<211> 202<212> PRT

<213> Seqüência artificial<220>

<223> Domínio AP2 de Arath_PLTl e Arath_PLT2<220><221> VARIANTE

<222> (4)..(4)

<223> /substituir = "Thr"

<220>

<221> VARIANTE<222> (6)..(6)<223> /substituir = "Glu"<220>

<221> VARIANTE

<222> (57)..(57)

<223> /substituir = "Glu"

<220>

<221> VARIANTE

<222> (62)..(62)

<223> /substituir = "Ala"

<220>

<221> VARIANTE

<222> (93)..(93)

<223> /substituir = "Asn"

<220>

<221> VARIANTE<222> (102)..(102)<223> /substituir = "Ser"<220>

<221> VARIANTE<222> (187)..(187)<223> /substituir = "Asn"<4 00> 191

Pro Arg Arg Ala Leu Asp Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg15 10 15

Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp

20 25 30

Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val

35 40 45

Tyr Leu Gly Gly Tyr Asp Lys Glu Asp Lys Ala Ala Arg Ser Tyr Asp

50 55 60

Leu Ala Ala Leu Lys Tyr Trp Gly Pro Ser Thr Thr Thr Asn Phe Pro65 70 75 80

Ile Thr Asn Tyr Glu Lys Glu Val Glu Glu Met Lys His Met Thr Arg

85 90 95

Gln Glu Phe Val Ala Ala Ile Arg Arg Lys Ser Ser Gly Phe Ser Arg

100 105 110

Gly Ala Ser Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg

115 120 125

Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu

130 135 140

Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala145 150 155 160

Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile Asn

165 170 175

Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser Ser Thr Leu Pro Ile Gly

180 185 190

Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala

195 200

<210> 192<211> 8<212> PRT

<213> Seqüência artificial<220>

<223> motivo 1<220>

<221> VARIANTE<222> (3)..(3)<223> /substituir = "Leu"<220>

<221> VARIANTE<222> (4) . . (4)<223> /substituir = "Glu"<4 00> 192

Pro Lys Val Ala Asp Phe Leu Gly

1 5

<210> 193

<211> 7

<212> PRT

<213> Seqüência artificial<220>

<223> motivo 2<220>

<221> VARIANTE

<222> (1)..(1)

<223> /substituir = "Leu"

<220>

<221> VARIANTE<222> (3)..(3)<223> /substituir = "Ser"<220>

<221> VARIANTE<222> (4)..(4)<223> /substituir = "Vai"<220>

<221> VARIANTE<222> (7)..(7)<223> /substituir = "Glu"<4 00> 193

Val Phe Thr Met Trp Asn Asp

1 5

<210> 194

<211> 2193

<212> DNA

<213> Oryza sativa

<4 00> 194

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160tggtgtagct tgccactttc accagcaaag ttc 2193

<210> 195<211> 54<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: PRM08180<4 00> 195

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgat caatccacac ggtg 54

<210> 196<211> 50<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: PRM08181<4 00> 196

ggggaccact ttgtacaaga aagctgggtt ccttgtttac tcattccaca 50

<210> 197<211> 56<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: PRM08182<400> 197

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa ttctaacaac tggctc 56

<210> 198<211> 50<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: PRM08183<4 00> 198

ggggaccact ttgtacaaga aagctgggtt catcttttat tcattccaca 50

<210> 199<211> 1638<212> DNA

<213> Populus tremuloides<4 00> 199

atgaattcta acaactggct ttcatttcct ctttctccta ctcatccttc cttgcctgct 60

catctacatg catcccaccc tcatcaattc tctctagggt tagtcaatga taatatggaa 120aacccatttc aaactcaaga gtggagtctt cttaacactc atcaaggcaa caatgaagtg 180ccaaaggttg cagactttct tggtgtgagc aaatctgaga atcaatcaga tcttgtagcc 240ttcaatgaaa ttcaagctaa tgaatctgac tatctctttt caaacaatag tctagtacca 300gtccaaaatg ctgttgtagg cgccaataat acctttgagt ttcaagaaaa tgctagcaat 360ttgcagtcat taacattgtc tatgggcagt gctagtggta aaggttctac atgtgaaccc 420agtggggata atagcactaa tactgttgaa gctgctgcac caagaagaac tttggataca 480tttgggcaaa gaacatccat atatcgtggt gtaacaaggc atcgatggac aggaaggtat 540gaagctcatt tatgggataa tagttgcaga agagaaggtc aatctaggaa aggaagacag 600ggtggctatg acaaagaaga aaaggcagct agggcttatg atcttgctgc acttaagtac 660tggggaacat ccaccactac caattttcca atcagcaact acgagaaaga aatagaggaa 720atgaagcaca tgaccaggca agaatttgtg gcctccatta gaaggaagag tagtggcttc 780tctaggggtg catccatgta tcgtggagtt acaaggcatc accagcatgg tagatggcaa 840gcaaggatag gcagagttgc aggaaacaaa gatctctact tgggaacttt tagcactgag 900gaggaggctg cagaagctta tgacatagca gcaataaagt ttagagggct taatgcagtg 960actaactttg acatgaatcg atatgatgtg aagagcattc ttgaaagcaa tactttgcca 1020attggaggag gggcagccaa acggctaaag gaggctcaag caattgaatc atcacgaaaa 1080agagaagaaa tgattgctct tggctcaagt tttccatatg gatcaacttc aagctctagc 1140aggctacaag cttaccctct aatgcagaca ccatttgagc aacctcaacc tttacttact 1200ctacaaaatc aagacatttc tcagtacact caggattcct catcattcca ccaaaatttc 1260cttcaaacac agcttcattt gcaccagcaa tctacagggt ctaatttcct gcataaccaa 1320tcaaaccaaa accctcaata ttacaatagt tatatccaaa acaatccagc tttacttcat 1380ggattgtgga acatgggttc ttcatcatct gtaatggaga ataatggaag ttctagtggg 1440agctatagta ctggaggtta tctgggaaat gggctgggaa tggcttccaa ttcaacaggg 1500tctaatgcag .taggatcagc cgaggaactt gcacttgtca aagttgatta tgatatgcct 1560tctagtggct atggaagctg gtctggggac tcagtccagg gatccaatcc aggtgttttc 1620actatgtgga atgagtga 1638

<210> 200<211> 545<212> PRT

<213> Populus tremuloides<400> 200

Met Asn Ser Asn Asn Trp Leu Ser Phe Pro Leu Ser Pro Thr His Pro15 10 15

Ser Leu Pro Ala His Leu His Ala Ser His Pro His Gln Phe Ser Leu

20 25 30

Gly Leu Val Asn Asp Asn Met Glu Asn Pro Phe Gln Thr Gln Glu Trp

35 40 45

Ser Leu Leu Asn Thr His Gln Gly Asn Asn Glu Val Pro Lys Val Ala

50 55 60

Asp Phe Leu Gly Val Ser Lys Ser Glu Asn Gln Ser Asp Leu Val Ala65 70 75 80

Phe Asn Glu Ile Gln Ala. Asn Glu Ser Asp Tyr Leu Phe Ser Asn Asn

85 90 95

Ser Leu Val Pro Val Gln Asn Ala Val Val Gly Ala Asn Asn Thr Phe

100 105 110

Glu Phe Gln Glu Asn Ala Ser Asn Leu Gln Ser Leu Thr Leu Ser Met

115 120 125

Gly Ser Ala Ser Gly Lys Gly Ser Thr Cys Glu Pro Ser Gly Asp Asn

130 135 140

Ser Thr Asn Thr Val Glu Ala Ala Ala Pro Arg Arg Thr Leu Asp Thr145 150 155 160

Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp

165 170 175

Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu

180 185 190

Gly Gln Ser Arg Lys Gly Arg Gln Gly Gly Tyr Asp Lys Glu Glu Lys

195 200 205

Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser

210 215 220

Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Ile Glu Glu225 230 235 240

Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ser Ile Arg Arg Lys

245 250 255

Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg

260 265 270

His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly

275 280 285

Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala

290 295 300

Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320

Thr Asn Phe Asp Met Asn Arg Tyr Asp Val Lys Ser Ile Leu Glu Ser

325 330 335

Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala340 345 350Gln Ala Ile Glu Ser Ser Arg Lys Arg Glu Glu

355 360

Ser Ser Phe Pro Tyr Gly Ser Thr Ser Ser Ser

370 375

Tyr Pro Leu Met Gln Thr Pro Phe Glu Gln Pro385 390 395

Leu Gln Asn Gln Asp Ile Ser Gln Tyr Thr Gln

405 410

His Gln Asn Phe Leu Gln Thr Gln Leu His Leu

425

Met

Ser380Gln

AspHis

Gly Ser Asn Phe Leu His Asn Gln Ser Asn Gln Asn

420

435

440

Asn Ser Tyr Ile Gln Asn Asn Pro Ala Leu Leu

450

455

Met Gly Ser Ser Ser Ser Val Met Glu Asn Asn465 470 475

Ser Tyr Ser Thr Gly Gly Tyr Leu Gly Asn Gly

485 490

Asn Ser Thr Gly Ser Asn Ala Val Gly Ser Ala

500 505

Val Lys Val Asp Tyr Asp Met Pro Ser Ser Gly

515 520

Gly Asp Ser Val Gln Gly Ser Asn Pro Gly Val530 535

Glu545<210> 201<211> 1515<212> DNA

<213> Populus tremuloides<400> 201

atgttttttt ttttgtttcc tttagagtgg agtcttcttagtgccaaagg ttgcagattt tcttggtgta agtaaatctggccttcaatg aaattcaagc cagtgattct gagtatctctccggtccaaa atgctgtggt agccgccagt actaactacgaatttgcagt cattaacatt gtctatgggc agtgctagtgaccagtggtg ataatagtac taattctgtc gaagctgctgacatttggtc aaagaacatc catctatcgt ggtgtaacaatatgaagctc atttatggga taatagttgc agaagagaagcaaggtggct atgacaaaga agacaaggct gctagggctttactggggaa catcgaccac taccaatttt cctatcagcagacatgaaga acatgaccag acaagaattt gtggcctccattctctaggg gtgcatccat gtatcgtgga gtcacaaggccaagcaagaa ttggtagagt tgcaggaaac aaagatctctgaggaggagg ctgcagaagc ttatgacata gcagcaataagtgactaatt ttgacatgaa tcgatatgat gtgaaaagcaccaattggag gaggggcagc caaaaggcta aaggaggctcaaacgagaag aaatgattgc tcttggatca agttatccatagtcgacaac aagcttactc tctaatgcag aaaccatttgactctacaaa atcaagacat ttctcagtac actcaagattcttcaaacac agcttcattt gcaccagcta tctgcagggtcaatcaagcc aaaatcctca gtattacaac agctatatcccatggattgt ggaacatggg ttcttcatca tctctaatgggggagttata gtactgtcgg ttatctggga aatgggttgggggtctaatg cagtagctga ggaacttcca cttgttaagaggtggctatg gaagttggtc tggggaatca gttcagggatatgtggaatg agtga<210> 202<211> 504<212> PRT

<213> Populus tremuloides<400> 202

Met Phe Phe Phe Leu Phe Pro Leu Glu Trp Ser

His460Gly

Leu

Glu

Tyr

Phe540

Ile365Arg

Pro

Ser

Gln

Pro445Gly

Ser

Gly

Glu

Gly525Thr

Ala Leu

Leu Gln

Leu Leu

Ser Ser415'Gln Ser430

Gln Tyr

Leu Trp

Ser Ser

Met Ala495Leu Ala510

Ser Trp

Gly

Ala

Thr400Phe

Thr

Tyr

Asn

Gly480Ser

LeuSerMet Trp Asn

acactcaaggagaatcaatctttcaagcaaaatttcaagagtaagggttcctccaagaagggcatcgatggtcaatccagatgatcttgcactatgagaattagaaggaaatcaccaacaacttgggaacagtttagaggttcttgagagaagcaatcgaatggatcaacagcaacctcacttcatttcactaatttcctaaaacaatccagaataatgggaatggctactagattatgaccaacccagg

caacaatgaaagatctcgtatagtctgttgaaatcctagctaaatgtgaagactttggatgacaggaagggaaaggaagatgcacttaagagaactagaggagtagtggctggaagatggttttagcactgcttaatgcacaatagtttgatcgtcacaattcaagctctacctttacttgcaaaattacgcataataaccactttgcttcagttctagtcaattcaacatatgccttcttgtttttaca

601201802403003604204805406006607207808409009601020108011401200126013201380144015001515

Leu Leu Asn Thr Gln1 5 10 15

Gly Asn Asn Glu Val Pro Lys Val Ala Asp Phe Leu Gly Val Ser Lys

20 25 30

Ser Glu Asn Gln Ser Asp Leu Val Ala Phe Asn Glu Ile Gln Ala Ser

35 40 45

Asp Ser Glu Tyr Leu Phe Ser Ser Asn Ser Leu Leu Pro Val Gln Asn

50 55 60

Ala Val Val Ala Ala Ser Thr Asn Tyr Glu Phe Gln Glu Asn Pro Ser65 70 75 80

Asn Leu Gln Ser Leu Thr Leu Ser Met Gly Ser Ala Ser Gly Lys Gly

85 90 95

Ser Lys Cys Glu Thr Ser Gly Asp Asn Ser Thr Asn Ser Val Glu Ala

100 105 110

Ala Ala Pro Arg Arg Thr Leu Asp Thr Phe Gly Gln Arg Thr Ser Ile

115 120 125

Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His

130 135 140

Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg145 150 155 160

Gln Gly Gly Tyr Asp Lys Glu Asp Lys Ala Ala Arg Ala Tyr Asp Leu

165 170 175

Ala Ala Leu Lys Tyr Trp Gly Thr Ser Thr Thr Thr Asn Phe Pro Ile

180 185 190

Ser Asn Tyr Glu Lys Glu Leu Glu Asp Met Lys Asn Met Thr Arg Gln

195 200 205

Glu Phe Val Ala Ser Ile Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly

210 215 220

Ala Ser Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp225 230 235 240

Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly

245 250 255

Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala

260 265 270

Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Met Asn Arg

275 280 285

Tyr Asp Val Lys Ser Ile Leu Glu Ser Asn Ser Leu Pro Ile Gly Gly

290 295 300

Gly Ala Ala Lys Arg Leu Lys Glu Ala Gln Ala Ile Glu Ser Ser Gln305 310 315 320

Lys Arg Glu Glu Met Ile Ala Leu Gly Ser Ser Tyr Pro Tyr Gly Ser

325 330 335

Thr Ser Ser Ser Ser Arg Gln Gln Ala Tyr Ser Leu Met Gln Lys Pro

340 345 350

Phe Glu Gln Pro Gln Pro Leu Leu Thr Leu Gln Asn Gln Asp Ile Ser

355 360 365

Gln Tyr Thr Gln Asp Ser Ser Phe Gln Gln Asn Tyr Leu Gln Thr Gln

370 375 380

Leu His Leu His Gln Leu Ser Ala Gly Ser Asn Phe Leu His Asn Asn385 390 395 400

Gln Ser Ser Gln Asn Pro Gln Tyr Tyr Asn Ser Tyr Ile Gln Asn Asn

405 410 415

Pro Thr Leu Leu His Gly Leu Trp Asn Met Gly Ser Ser Ser Ser Leu

420 425 430

Met Glu Asn Asn Gly Ser Ser Ser Gly Ser Tyr Ser Thr Val Gly Tyr

435 440 445

Leu Gly Asn Gly Leu Gly Met Ala Thr Asn Ser Thr Gly Ser Asn Ala

450 455 460

Val Ala Glu Glu Leu Pro Leu Val Lys Ile Asp Tyr Asp Met Pro Ser465 470 475 480

Gly Gly Tyr Gly Ser Trp Ser Gly Glu Ser Val Gln Gly Ser Asn Pro

485 490 495

Gly Val Phe Thr Met Trp Asn Glu500<210> 203<211> 785<212> DNA

<213> Vitis vinifera<400> 203

tcttgataaa tcccaaaact gactgtgtag gtactgagga ggaagctgca gaagcctatg 60

atattgcagc aataaagttc agaggcctta atgcagtgac caactttgac atgaatcgat 120acgatgtgaa gagcattctt gaaagcaaca ctcttccgat aggtggggga gcggccaagc 180ggctaaagga ggctcaagca attgaatcat caagaaaacg ggaagaaatg atagccctag 240gttcaagttt ccaatatggg agctcgagct ctagcaggtt acagacatat cctctaatgc 300agcagcagtt tgagcaacct cagcctttac taacattaca gaaccaagaa ccattactaa 360ctttgcaaaa ccctgaaatt tctcagtacc cccaagactc ccagtttcac caaaactaca 420tccaaactca gttgcagttg caccagcaat ctgggtcgta cctgaaccat tcaagccaaa 480gtcctcagtt ctacaacagt tacctccaca acaacccggc tcttcttcat gggctgatga 540gtatgggctc ttcttcatct gtcatggaga ataatgggag ttctagtggg agttacaatg 600gaggmtactt caataatgga cttggggttg cttcgaattc tacggtggct agtgcagtag 660gatcagcaga ggagcttccc ctcatcaagg ttgattacga tatgccggcc gcaggctatg 720gcagctggtc aggtgactca gttcagggac agaatgctgg agtttttaca atgtggaatg 780actga 785

<210> 204<211> 260<212> PRT

<213> Vitis vinifera<400> 204

Leu Ile Asn Pro Lys Thr Asp Cys Val Gly Thr Glu Glu Glu Ala Ala1 5 10 15 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val 20 25 30 Thr Asn Phe Asp Met Asn Arg Tyr Asp Val Lys Ser Ile Leu Glu Ser 35 40 45 Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala 50 55 60 Gln Ala Ile Glu Ser Ser Arg Lys Arg Glu Glu Met Ile Ala Leu Gly65 70 75 80Ser Ser Phe Gln Tyr Gly Ser Ser Ser Ser Ser Arg Leu Gln Thr Tyr 85 90 95 Pro Leu Met Gln Gln Gln Phe Glu Gln Pro Gln Pro Leu Leu Thr Leu 100 105 110 Gln Asn Gln Glu Pro Leu Leu Thr Leu Gln Asn Pro Glu Ile Ser Gln 115 120 125 Tyr Pro Gln Asp Ser Gln Phe His Gln Asn Tyr Ile Gln Thr Gln Leu 130 135 140 Gln Leu His Gln Gln Ser Gly Ser Tyr Leu Asn His Ser Ser Gln Ser145 150 155 160Pro Gln Phe Tyr Asn Ser Tyr Leu His Asn Asn Pro Ala Leu Leu His 165 170 175 Gly Leu Met Ser Met Gly Ser Ser Ser Ser Val Met Glu Asn Asn Gly 180 185 190 Ser Ser Ser Gly Ser Tyr Asn Gly Gly Tyr Phe Asn Asn Gly Leu Gly 195 200 205 Val Ala Ser Asn Ser Thr Val Ala Ser Ala Val Gly Ser Ala Glu Glu 210 215 220 Leu Pro Leu Ile Lys Val Asp Tyr Asp Met Pro Ala Ala Gly Tyr Gly225 230 235 240Ser Trp Ser Gly Asp Ser Val Gln Gly Gln Asn Ala Gly Val Phe Thr

245

Met Trp Asn Asp260

<210> 205<211> 150<212> DNA

<213> brassica napus<400> 205

250

255ggaacatcgg ccgaggaaga gtttcccacg gttaaagttg attacgatat gcctccttta 60

ggtggagcca cagggtgtga acgatggact aatggagaga atggtcaggg gtcaaatcca 120ggaggtgtct tcacaatgtg gaatgaataa 150

<210> 206<211> 49<212> PRT

<213> Brassica napus<400> 206

Gly Thr Ser Ala Glu Glu Glu Phe Pro Thr Val Lys Val Asp Tyr Asp1 5 10 15 Met Pro Pro Leu 20 Gly Gly Ala Thr Gly 25 Cys Glu Arg Trp Thr 30 Asn GlyGlu Asn Gly Gln Gly Ser Asn Pro Gly Gly Val Phe Thr Met Trp Asn

35 40 45

Glu

<210> 207<211> 162<212> DNA

<213> Phaseolus coccineus<400> 207

tcgaatgcat cgtcgggtaa tgcggtgggc acggcggagg aacttggatt ggtgaaagttgactatgaca tgccggccgg aggttacggt ggttggtcgg cggcggcggc ggaatccatgcagacgtcaa atggtggggt gttcacaatg tggaatgagt ga<210> 208<211> 53<212> PRT

<213> Phaseolus coccineus<400> 208

Ser Asn Ala Ser Ser Gly Asn Ala Val Gly Thr Ala Glu Glu Leu Gly15 10 15

Leu Val Lys Val Asp Tyr Asp Met Pro Ala Gly Gly Tyr Gly Gly Trp

20 25 30

Ser Ala Ala Ala Ala Glu Ser Met Gln Thr Ser Asn Gly Gly Val Phe

35 40 45

Thr Met Trp Asn Glu50

<210> 209<211> 7<212> PRT

<213> Seqüência artificial<220>

<223> Motivo 2<220>

<221> VARIANTE

<222> (1)..(1)

<223> /substituir = "Leu"

<220>

60120162

<221><222>

INSEGURO(3) . . (3)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>

<221> VARIANTE

<222> (4) .. (4)

<223> /substituir = "Vai"

<220>

<221> VARIANTE<222> (7) . . (7)<223> /substituir = "Glu"<400> 209

Val Phe Xaa Met Trp Asn Asp1 5

<210> 210<211> 2194<212> DNA<213> Oryza sativa<400> 210

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140

acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200

tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260

tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320

atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380

gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440

gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500

gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560

gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620

tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680

ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740

actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800

agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860

atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920

gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980

ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040

acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100

aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160

ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 211<211> 1245<212> DNA<213> Oryza sativa<400> 211

cttgttgttg atctgtgccc ccaagaagaa taacactcta ctcttacttg ttggaaaaaa 60

atagtattag caaccacgca tatgcaaatt ttaatgcagt aataataaga gatggatcga 120

tcgttttcca gctcttgtat atgtgactgg ccctgcttta tgtgtgtagt gttaatttca 180

gctttagcag tacgtgatta gtgatggaca ataattgtcg cagacgtatc tatcaattgc 240

tcctgttgtg tgatgcttta actgttggaa tcaaagttgc gttgcctttg ttgttatgag 300

gaggaatata tatgttgggg caggaaaaga atggaggaga gatcgttctc catatcctta 360

tcatcggcct cgtcactgct cgcagtttaa ctttttggtg atgcgagcga tggtcagcca 420

tatatatact cccatgctgc atgctagtaa tcaatatacg ccttgtaaaa gtaaacgatc 480

gtctagtaat tgcaatatca taggggtagc cattgacaga gatctacata gatagagggg 540

gaacaagaat tgacactcca cagatgctcc actcattcac ctttactaat ttatatcttt 600

tgatgtttga tcgatcgatc gatccgtccg tcggtgtctc gacgaataaa aactgcaaat 660

cgaactgtat gtatataata tagcgtcgta aattaaatta aattaaatcg aactgaatac 720

tacatgtcga agcaagaatt agttcaacta aaagatttag tttttccggt tgcaatatct 780

gtgaaattaa ttgaagaaat taagaagaaa actggagaga tatatatatg gatgagacaa 840

aatgagataa gacgcatgat ggtccctcgg atgatgtcgt ccgttcctta tttccattcc 900

atggcagctg ctatcgctat ctagtgcgcg cggcatctcc aatcccatcc attctagtgg 960

tcgatctagc tactactgag tattgttttt tcttcttttt actactgttg attattctgc 1020aactgcagtt agatgcttgc tactcctaca tcgatctctc

cattcactac tgatgatccg tgggtgtagt gtgggtggct

ttgccattgc tcctcaggcc agcaactgag aagctccata

gccgacaagg ccagagaagg aagaagaagc tctcatcatc

<210> 212

<211> 675

<212> DNA

<213> Oryza sativa

<400> 212

atgaagagca ggaagaacag cacgacgagc acaaaagcagagcagcggag gaggaggagg cggcggcaac tgctatagcacgcaaggatg tggagaagaa tcggcgcctc cacatgaaggtccctcatcc ccgccgccgc tccccgccgc catcaccacctcatcgccgc cctcctccac caaggaggct gtgacgcagcgcggcgtaca tcaagcagct caaggggagg atcgacgagcgcggcggcac tcaccaccag caccagcaat ggcggcggcggtgcggtgcc aggatgggac gctggacgtg gtggtggtgaagggagaggg cggtgcggct gcacgaggtg atcggcgtgcgtggtgaacg ccagcttctc cgtcgtcggc gacaagatctgcgctctgct ccaggatcgg cctcgacgcc tccagggtctctcctccaat attaa<210> 213<211> 224<212> PRT

<213> Oryza sativa<400> 213

tcgcgcgggc gtatgcattgataaataggg cagggtgcggcaagtaagca gcagctagttatcac

caggcagctggcagcagtaggtctctgcctactactccactggatcaccttgaagaagaggcgggatgccgcgaggcgattggaggaagatctacactctcccacaggct

ccacaccagccaagatggagcaagctctccctcctcctccggagcaggcggaagcagcagggtggtggagcagggaggagaggcgcggagccactcccaggcgcaacctc

Met Lys Ser Arg Lys Asn Ser Thr Thr Ser Thr Lys Ala Ala Gly Ser1 5 10 15 Cys His Thr Ser 20 Ser Ser Gly Gly Gly 25 Gly Gly Gly Gly Asn 30 Cys TyrSer Ser Ser 35 Ser Ser Lys Met Glu 40 Arg Lys Asp Val Glu 45 Lys Asn ArgArg Leu 50 His Met Lys Gly Leu 55 Cys Leu Lys Leu Ser 60 Ser Leu Ile ProAla Ala Ala Pro Arg Arg His His His His Tyr Ser Thr Ser Ser Ser65 70 75 80Ser Ser Pro Pro Ser 85 Ser Thr Lys Glu Ala 90 Val Thr Gln Leu Asp 95 HisLeu Glu Gln Ala 100 Ala Ala Tyr Ile Lys 105 Gln Leu Lys Gly Arg 110 Ile AspGlu Leu Lys 115 Lys Arg Lys Gln Gln 120 Ala Ala Ala Leu Thr 125 Thr Ser ThrSer Asn 130 Gly Gly Gly Gly Gly 135 Met Pro Val Val Glu 140 Val Arg Cys GlnAsp Gly Thr Leu Asp Val Val Val Val Ser Glu Ala Ile Arg Glu Glu

145

150

155

Arg Glu Arg Ala Val Arg Leu His Glu Val Ile Gly Val

Val Val

165

170

Glu Gly Ala Glu Val Val Asn Ala Ser Phe Ser

180

185

Ile Phe Tyr Thr Leu His Ser Gln Ala Leu Cys

195

200

Asp Ala Ser Arg Val Ser His Arg Leu Arg Asn

210 215

<210> 214<211> 696<212> DNA<213> Oryza sativa<400> 214

atggatcagg agaaggcgga cggcggcggc aggaggaggaagcggcagcg gcgcgagcag cacggcggcg gcggcggcggcgcaggaggc ggcaggacat gaagggcctc tgcgtcaagcgaacactgct ccatgtccaa gatgcaggcg gcgtctagga

160

Leu Glu Glu175

Gly Asp Lys190

Ser Arg Ile Gly Leu205

Leu Leu Leu Gln Tyr220

ggagcagggc gacgagtagccggagaggaa ggagatggagtcgcctctct catccccaaacccagctggg cagcctggac

1080114012001245

60120180240300360420480540600660675

60120180240gaagcggcgg cctacatcaa gaagctcaag gaaagggtggagcatgatga gtatcacatc atcgcgctgc cgctcaggaggctgctggcc agtcgacgag cggcggcggc ggcggggaagaggacgacgg cggcggcggc ggtggtggag gtgcggcagcatcagcttgg acgtggtgct gatctgcagc gcagcgaggcatcaccgtcc tcgaggaaga aggcgccgac atcatctccgcacaatttct actacaccat ctactccagg gcctttagcttcgaggattt ctgagagact acgggcattg gtatga<210> 215<211> 231<212> PRT

<213> Oryza sativa<400> 215

Met Asp Gln Glu Lys Ala Asp Gly Gly Gly Arg1 5 10

Ala Thr Ser Ser Ser Gly Ser Gly Ala Ser Ser

20 25

Ala Ala Glu Arg Lys Glu Met Glu Arg Arg Arg

acgagctgcagaggaggaggaagaagaagaacgtgcaggacggtcaagttccaacttctccaagaattgg

ccacaagaggaccagctgctagatatgacgggggtcgctgccacgacgtccctcgccgcccatagaggct

35

40

Gly Leu Cys Val Lys Leu Ala Ser Leu Ile Pro

50

55

Met Ser Lys Met Gln Ala Ala Ser Arg Thr Gln

Arg Arg Arg

Thr Ala Ala30

Arg Gln Asp45

Lys Glu His60

Leu Gly Ser

65

70

75

Glu Ala Ala Ala Tyr Ile Lys Lys Leu Lys Glu Arg Val Asp

85

90

His His Lys Arg Ser Met Met Ser Ile Thr Ser

100

105

Gly Gly Gly Gly Gly Pro Ala Ala Ala Ala Gly

115 120

Gly Gly Gly Gly Glu Glu Glu Glu Glu Asp Met

130 135

Ala Ala Ala Val Val Glu Val Arg Gln His Val145 150 155

Ile Ser Leu Asp Val Val Leu Ile Cys Ser Ala

165 170

Phe His Asp Val Ile Thr Val Leu Glu Glu Glu

180 185

Ser Ala Asn Phe Ser Leu Ala Ala His Asn Phe

195 200

Ser Arg Ala Phe Ser Ser Arg Ile Gly Ile Glu

210 215

Glu Arg Leu Arg Ala Leu Val225 230

<210> 216<211> 633<212> DNA<213> Oryza sativa<400> 216

atggagatcc cgccgccgtc agctggtggc ggaggcggcgacgacggagc gcatccgccg cgagcagatg aacaagctctgtccgctccg ctccccccac agttaattcc attccttcactaccatcaaa gaaaattacg gattctcggt ggggcggcggaggttggggg tggcggcgga gtacataagg cagacgcagggagaagaaga gggagctcac cggcggcggc ggcggcggctggggcggcca cggccgccgc gccggaggtg gaggtgcagcgccatcctct tcaccggcgc gccgcccacc gacggcgcctgccgtcgagg acgccggcgg ccaggtgcag aacgcgcactgccgtctaca ccatccacgc catgattgga gatggatatgcagagattaa aggaagcaat acggagcaac taa<210> 217<211> 210<212> PRT

<213> Oryza sativa

Ser Arg Cys110

Gln Ser Thr

125Thr Arg Thr140

Gln Glu Gly

Ala Arg Pro

Gly Ala Asp190

Tyr Tyr Thr

205Ala Ser Arg220

Ser Arg15

Ala Ala

Met Lys

Cys Ser

Leu Asp80Glu Leu95

Arg Ser

Ser Gly

Thr Ala

Ser Leu160Val Lys175

Ile IleIle TyrIle Ser

gcggcaagcc cgaccggaagactcccacct cgactccctcattcaaattc aaattcaaaa

cggcgacgacagagggtggacctcgtcgtcacctggggtcccttccaccgtctccgtcgcgaggcattga

gaggccggaccatgctgagggtccggcgcccggcctgcaccgccgtccgccggcgccaaggagggtggtg

300360420480540600660696

60120180240300360420480540600633<400> 217

Met Glu Ile Pro Pro Pro Ser Ala Gly Gly Gly Gly Gly Gly Gly Lys1 5 10 15

Pro Asp Arg Lys Thr Thr Glu Arg Ile Arg Arg Glu Gln Met Asn Lys

20 25 30

Leu Tyr Ser His Leu Asp Ser Leu Val Arg Ser Ala Pro Pro Thr Val

35 40 45

Asn Ser Ile Pro Ser His Ser Asn Ser Asn Ser Lys Tyr His Gln Arg

50 55 60

Lys Leu Arg Ile Leu Gly Gly Ala Ala Ala Ala Thr Thr Arg Pro Asp65 70 75 80

Arg Leu Gly Val Ala Ala Glu Tyr Ile Arg Gln Thr Gln Glu Arg Val

85 90 95

Asp Met Leu Arg Glu Lys Lys Arg Glu Leu Thr Gly Gly Gly Gly Gly

100 105 110

Gly Ser Ser Ser Ser Ser Gly Ala Gly Ala Ala Thr Ala Ala Ala Pro

115 120 125

Glu Val Glu Val Gln His Leu Gly Ser Gly Leu His Ala Ile Leu Phe

130 135 140

Thr Gly Ala Pro Pro Thr Asp Gly Ala Ser Phe His Arg Ala Val Arg145 150 155 160

Ala Val Glu Asp Ala Gly Gly Gln Val Gln Asn Ala His Phe Ser Val

165 170 175

Ala Gly Ala Lys Ala Val Tyr Thr Ile His Ala Met Ile Gly Asp Gly

180 185 190

Tyr Gly Gly Ile Glu Arg Val Val Gln Arg Leu Lys Glu Ala Ile Arg195 200 205

Ser Asn210<210> 218<211> 546<212> DNA

<213> Arabidopsis thaliana<400> 218

atggggagag caagagaaat aggagaagga aactcatcgt cgttaaggga acaacgaaac 60

ctcagagaga aggatcgaag gatgcgcatg aaacatctct tctctatact ttcttctcat 120gtttctccca ctcgcaagtt accagtgcct caccttatag atcaagcgac atcatacatg 180atccaattga aagagaatgt aaattatttg aaagagaaga aaaggacatt gttacaagga 240gaactcggga atctctacga agggtcgttt cttctaccca aactcagtat tcgttcgcgg 300gattcgacca tagaaatgaa tctgatcatg gatctaaaca tgaaaagagt aatgttacac 360gagcttgtga gtatttttga agaagaagga gctcaagtaa tgagtgctaa tcttcagaac 420ttgaatgata ggaccactta cacaatcata gcccaggcta tcattagtcg gattggcatt 480gatccatcaa ggatagaaga gagagtacgg aaaatcatct atggatatat atattttgaa 540gcatga 54 6

<210> 219<211> 188<212> PRT

<213> Arabidopsis thaliana<400> 219

Met Gly Arg Ala Arg Glu Ile Gly Glu Gly Asn Ser Ser Ser Leu Arg15 10 15

Glu Gln Arg Asn Leu Arg Glu Lys Asp Arg Arg Met Arg Met Lys His

20 25 30

Leu Phe Ser Ile Leu Ser Ser His Val Ser Pro Thr Arg Lys Leu Pro

35 40 45

Val Pro His Leu Ile Asp Gln Ala Thr Ser Tyr Met Ile Gln Leu Lys

50 55 60

Glu Asn Val Asn Tyr Leu Lys Glu Lys Lys Arg Thr Leu Leu Gln Gly65 70 75 80

Glu Leu Gly Asn Leu Tyr Glu Gly Ser Phe Leu Leu Pro Lys Leu Ser

85 90 95

Ile Arg Ser Arg Asp Ser Thr Ile Glu Met Asn Leu Ile Met Asp Leu100 105 110Asn Met Lys 115 Arg Val Met Leu His 120 Glu Leu Val Ser Ile 125 Phe Glu GluGlu Gly 130 Ala Gln Val Met Ser 135 Ala Asn Leu Gln Asn 140 Leu Asn Asp ArgThr Thr Tyr Thr Ile Ile Ala Gln Val Pro His Pro His Ala Tyr Ala145 150 155 160Ile Ile Ser Arg Ile 165 Gly Ile Asp Pro Ser 170 Arg Ile Glu Glu Arg 175 ValArg Lys Ile Ile 180 Tyr Gly Tyr Ile Tyr 185 Phe Glu Ala

<210> 220<211> 525<212> DNA

<213> Arabidopsis thaliana<400> 220

atggaaagag cgagagaaat aggagaagga agcgcatcgt cattacggga acaacgaaac 60

ctcagagaga aagaacgacg aatgcgcatg aaacatctct tctccatact ctcttctcat 120gtttctccca ctcgtaggtt gccagtgcct caacttatag atcaagcggt atcatacatg 180atccaactga aagagaaggt aaactatttg aatgagatga aaaggagaat gttaggagga 240gaagtcaaaa atcgctctga agggtcgtct cttctgccaa aactcagtat tcgttcactg 300gattcgatca tagaaatgaa tctggttatg gatctaaaca tgaaaggagt aatgttacac 360aagcttgtga gtgtttttga agaagaagga gctcaagtga tgagtgctaa tcttcagaac 420ttgaatgata ggacctttta tacaatcata gcccaggcta tcatatgtcg gatcgggatt 480gatccatcaa ggatagaaga gagattaagg gatataatct catga 525

<210> 221<211> 174<212> PRT

<213> Arabidopsis thaliana<400> 221

Met Glu Arg Ala Arg Glu Ile Gly Glu Gly Ser Ala Ser Ser Leu Arg1 5 10 15 Glu Gln Arg Asn 20 Leu Arg Glu Lys Glu 25 Arg Arg Met Arg Met 30 Lys HisLeu Phe Ser 35 Ile Leu Ser Ser His 40 Val Ser Pro Thr Arg 45 Arg Leu ProVal Pro 50 Gln Leu Ile Asp Gln 55 Ala Val Ser Tyr Met 60 Ile Gln Leu LysGlu Lys Val Asn Tyr Leu Asn Glu Met Lys Arg Arg Met Leu Gly Gly65 70 75 80Glu Val Lys Asn Arg 85 Ser Glu Gly Ser Ser 90 Leu Leu Pro Lys Leu 95 SerIle Arg Ser Leu 100 Asp Ser Ile Ile Glu 105 Met Asn Leu Val Met 110 Asp LeuAsn Met Lys 115 Gly Val Met Leu His 120 Lys Leu Val Ser Val 125 Phe Glu GluGlu Gly 130 Ala Gln Val Met Ser 135 Ala Asn Leu Gln Asn 140 Leu Asn Asp ArgThr Phe Tyr Thr Ile Ile Ala Gln Ala Ile Ile Cys Arg Ile Gly Ile145 150 155 160Asp Pro Ser Arg Ile 165 Glu Glu Arg Leu Arg 170 Asp Ile Ile Ser

<210> 222<211> 369<212> DNA

<213> Arabidopsis thaliana<400> 222

atgatccaat tgaaagagaa tgtaaattat ttgaaagaga agaaaaggac attgttacaa 60

ggagaactcg ggaatctcta cgaagggtcg tttcttctac ccaaactcag tattcgttcg 120cgggattcga ccatagaaat gaatctgatc atggatctaa acatgaaaag agtaatgtta 180cacgagcttg tgagtatttt tgaagaagaa ggagctcaag taatgagtgc taatcttcag 240aacttgaatg ataggaccac ttacacaatc atagcccagg ctatcattag tcggattggc 300attgatccat caaggataga agagagagta cggaaaatca tctatggata tatatatttt 360gaagcatga 369<210> 223<211> 122<212> PRT

<213> Arabidopsis thaliana<400> 223

Met Ile Gln Leu Lys Glu Asn Val Asn Tyr Leu Lys Glu1 5 10

Thr Leu Leu Gln Gly Glu Leu Gly Asn Leu Tyr Glu Gly

20 25

Leu Pro Lys Leu Ser Ile Arg Ser Arg Asp Ser Thr Ile

35 40 45

Leu Ile Met Asp Leu Asn Met Lys Arg Val Met Leu His

50 55 60

Ser Ile Phe Glu Glu Glu Gly Ala Gln Val Met Ser Ala65 70 75

Asn Leu Asn Asp Arg Thr Thr Tyr Thr Ile Ile Ala Gln

85 90

Ser Arg Ile Gly Ile Asp Pro Ser Arg Ile Glu Glu Arg

100 105

Ile Ile Tyr Gly Tyr Ile Tyr Phe Glu Ala

115 120

<210> 224<211> 573<212> DNA

<213> Arabidopsis thaliana<400> 224

atggagccga gccattcaaa cacaggtcaa tcaagatctg tagatcgcaaaaaaatagaa ggatgcaaat gaagtctctc tactcagaac tcatctctctcattcttcta cggagccttt aacactacct gatcagctag atgaagctgcaagaagctac aagtgaacgt ggagaaaaag agagaaagga aaaggaacctacaactttgg agaaactgaa ttccgtcgga tcttcatcgg tttcgtcgagtccgtgccaa gaaagctgcc aaaaatcgag attcaagaaa ctggttccattttcttgtga caagcttgga acacaagttt atgttttgtg agatcattcggaggaattag gagctgagat cactcatgct ggatactcca ttgttgatgacacacccttc actgcaaggt ggaagaacac gattatggag ctaggagtcaagactggaga agattgtgaa cagtgttcac taa<210> 225<211> 190<212> PRT

<213> Arabidopsis thaliana<400> 225

Met Glu Pro Ser His Ser Asn Thr Gly Gln Ser Arg Ser15 10

Lys Thr Val Glu Lys Asn Arg Arg Met Gln Met Lys Ser

20 25

Glu Leu Ile Ser Leu Leu Pro His His Ser Ser Thr Glu

35 40 45

Leu Pro Asp Gln Leu Asp Glu Ala Ala Asn Tyr Ile Lys

50 55 60

Val Asn Val Glu Lys Lys Arg Glu Arg Lys Arg Asn Leu65 70 75

Thr Thr Leu Glu Lys Leu Asn Ser Val Gly Ser Ser Ser

85 90

Ser Val Asp Val Ser Val Pro Arg Lys Leu Pro Lys Ile

100 105

Glu Thr Gly Ser Ile Phe His Ile Phe Leu Val Thr Ser115 120 125

Lys Phe Met Phe Cys Glu Ile Ile Arg Val Leu Thr Glu

130 135 140

Ala Glu Ile Thr His Ala Gly Tyr Ser Ile Val Asp Asp145 150 155

His Thr Leu His Cys Lys Val Glu Glu His Asp Tyr Gly165 170

Lys Lys Arg15

Ser Phe Leu30

Glu Met Asn

Glu Leu Val

Asn Leu Gln80

Ala Ile Ile95

Val Arg Lys110

aacggttgagtcttcctcataaactacatccgttgcgactcgtcgatgtcttttcacatctgttctcacctgctgtcttcaattcctgaa

60120180240300360420480540573

Val Asp Arg15

Leu Tyr Ser30

Pro Leu Thr

Lys Leu Gln

Val Ala Thr80

Val Ser Ser95

Glu Ile Gln110

Leu Glu His

Glu Leu Gly

Ala Val Phe160

Ala Arg Ser175Gln Ile Pro Glu Arg Leu Glu Lys Ile Val Asn Ser Val His180 185 190

<210> 226<211> 423<212> DNA

<213> Medicago truncatula<400> 226

atgacatctc taacaaagga ggcgatttca gtgccggatc agctaaagga agcaacaaac 60

tacataaaga aattgcagat caacctggag aaaatgaagg aaaagaagaa ttttctacta 120ggaattcaaa ggccaaatgt gaatttgaat agaaaccaga agatgggatt aaagtctcca 180aaaattaaga tacaacaaat tggtttagtc ttagaggttg ttctaataac tggattggag 240tctcagtttt tgttcagcga aacctttcga gttcttcatg aagaaggagt tgatattgtt 300aatgctagtt ataaggtcaa tgaagattct gttttccatt caatacactg ccaggtagga 360gaatttggca atgaagctgc aagaatatct gagagattga agaagtttat gcaagactat 420tag 423

<210> 227<211> 140<212> PRT

<213> Medicago truncatula<400> 227

Met Thr Ser Leu Thr Lys Glu Ala Ile Ser Val Pro Asp Gln Leu Lys1 5 10 15

Glu Ala Thr Asn 20 Tyr Ile Lys Lys Leu 25 Gln Ile Asn Leu Glu 30 Lys MetLys Glu Lys 35 Lys Asn Phe Leu Leu 40 Gly Ile Gln Arg Pro 45 Asn Val AsnLeu Asn 50 Arg Asn Gln Lys Met 55 Gly Leu Lys Ser Pro 60 Lys Ile Lys IleGln Gln Ile Gly Leu Val Leu Glu Val Val Leu Ile Thr Gly Leu Glu65 70 75 80Ser Gln Phe Leu Phe 85 Ser Glu Thr Phe Arg 90 Val Leu His Glu Glu 95 GlyVal Asp Ile Val 100 Asn Ala Ser Tyr Lys 105 Val Asn Glu Asp Ser 110 Val PheHis Ser Ile 115 His Cys Gln Val Gly 120 Glu Phe Gly Asn Glu 125 Ala Ala ArgIle Ser 130 Glu Arg Leu Lys Lys 135 Phe Met Gln Asp Tyr 140 <210> 228

<211> 882<212> DNA

<213> Hordeum vulgare<400> 228

atgaatgcct gcgctctgaa ctcgatggag ccggtgaagg cgaagccggc gaggggcggg 60

aagaggagca gggagagcgg cggcacggcg gtggtgctgc tggagaagaa ggagtcggag 120aaggagagga ggaagcgcat gaaggcgctc tgcgagaagc tcgcatccct catcccaagg 180gaacactgct gctccaccac tgatacaatg acccagctag gcagcctgga tgtgggggca 240tcgtatatca agaagctgaa ggagagggtc gatgagctac aacgtaggat gacctctgcg 300cagaccttgg ataccttcag aggagacact agcatcccaa cgcccactac caccactacc 360acgaaaagcg ttgtagggtc gctggaagaa gagaaagctc gggaggcatc ggcacccgta 420ttgcaggtgc ggcaacacga cgattcaagc atggaggtga gattgatatg ctgcatgaag 480aggccgatca agctccatga ggtgatcacc atccatgagg aagaaggtgc tgagatcatc 540aacgccaatc actctgttgc tggccaaaaa atgttctaca ctatacactc tcgggcctct 600agctcgagaa ttggcataga tgttccaagg gtttctgaac gactgcgagc attgctccaa 660ctttattcgc atgaaaatca ggcaccgtcg tgcatgcaca acaatcaagt cctcaggtac 720aatgatgggg ccaacgcgac tcctcccaag gagctcgtcg gcaacaatga tataggtgga 780accaacaagg tggcaaacca cgagtgtgag tcttgggttg agcaagacca agtgatgtgg 840agttccctgc ttgcgtcaat atcaccagag ttgctcgagt ag 882

<210> 229

<211> 293

<212> PRT

<213> Hordeum vulgare

<400> 229Met Asn Ala Cys Ala Leu Asn Ser Met Glu Pro Val Lys Ala Lys Pro1 5 10 15 Ala Arg Gly Gly Lys Arg Ser Arg Glu Ser Gly Gly Thr Ala Val Val 20 25 30 Leu Leu Glu Lys Lys Glu Ser Glu Lys Glu Arg Arg Lys Arg Met Lys 35 40 45 Ala Leu Cys Glu Lys Leu Ala Ser Leu Ile Pro Arg Glu His Cys Cys 50 55 60 Ser Thr Thr Asp Thr Met Thr Gln Leu Gly Ser Leu Asp Val Gly Ala65 70 75 80Ser Tyr Ile Lys Lys Leu Lys Glu Arg Val Asp Glu Leu Gln Arg Arg 85 90 95 Met Thr Ser Ala Gln Thr Leu Asp Thr Phe Arg Gly Asp Thr Ser Ile 100 105 110 Pro Thr Pro Thr Thr Thr Thr Thr Thr Lys Ser Val Val Gly Ser Leu 115 120 125 Glu Glu Glu Lys Ala Arg Glu Ala Ser Ala Pro Val Leu Gln Val Arg 130 135 140 Gln His Asp Asp Ser Ser Met Glu Val Arg Leu Ile Cys Cys Met Lys145 150 155 160Arg Pro Ile Lys Leu His Glu Val Ile Thr Ile His Glu Glu Glu Gly 165 170 175 Ala Glu Ile Ile Asn Ala Asn His Ser Val Ala Gly Gln Lys Met Phe 180 185 190 Tyr Thr Ile His Ser Arg Ala Ser Ser Ser Arg Ile Gly Ile Asp Val 195 200 205 Pro Arg Val Ser Glu Arg Leu Arg Ala Leu Leu Gln Leu Tyr Ser His 210 215 220 Glu Asn Gln Ala Pro Ser Cys Met His Asn Asn Gln Val Leu Arg Tyr225 230 235 240Asn Asp Gly Ala Asn Ala Thr Pro Pro Lys Glu Leu Val Gly Asn Asn 245 250 255 Asp Ile Gly Gly Thr Asn Lys Val Ala Asn His Glu Cys Glu Ser Trp 260 265 270 Val Glu Gln Asp Gln Val Met Trp Ser Ser Leu Leu Ala Ser Ile Ser

275 280

Pro Glu Leu Leu Glu

290<210> 230<211> 2193<212> DNA

<213> Oryza sativa<400> 230

aatccgaaaa gtttctgcac cgttttcacc ccctaactaaaaatataaaa tgagacctta tatatgtagc gctgataactcatccaccta ctttagtggc aatcgggcta aataaaaaagtttccttagt aattaagtgg gaaaatgaaa tcattattgctctgtcatga agttaaatta ttcgaggtag ccataattgtaaaaaatctt tctagctgaa ctcaatgggt aaagagagagatgaagatat tctgaacgta ttggcaaaga tttaaacatattgtgcattc gtcatatcgc acatcattaa ggacatgtctttagtaatta aagacaattg acttattttt attatttatcgtacttacgc acacactttg tgctcatgtg catgtgtgagtcaactagca acacatctct aatatcactc gcctatttaatgaattcaag cactccacca tcaccagacc acttttaataaattttacag aatagcatga aaagtatgaa acgaactattaaaaaaagaa ttttgctcgt gcgcgagcgc caatctcccaacagagtggc tgcccacaga acaacccaca aaaaacgatgtccgcaacaa ccttttaaca gcaggctttg cggccaggagaaccaagcat cctcctcctc ccatctataa attcctccccggaggcatcc aagccaagaa gagggagagc accaaggacacgaccgcctt cttcgatcca tatcttccgg tcgagttcttcacctcctcc tcacagggta tgtgcccttc ggttgttctt

285

caatatagggagaactatgcagtcgctacattagaatatacatcaaactcattttttttataattatatatactccatccttttttcgattgcacctccttacatttaggatatctaaaataggtttttctattgggcacatctaacggaagaggaggagccttttcccccgcgactagcggtcgatctcggatttattg

aacgtgtgctaagaaaaactctagtttcgtcgttcacatcttcttgaataaaaaaatagaattttatagtcaatttttattagatgcaagcaatacacgttagcaatatctacaaaaaatacatacaaaaacaggcaacaggacagcaagaggcaaagaatctctatataagaagccgagttccctcctcttctaggttg

601201802403003604204805406006607207808409009601020108011401200aaacaatgaa gagcaggaag aacagc

cagagtgaaa gagtggtgtg

56

tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260

gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320

ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380

gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440

aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500

ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560

atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620

acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680

cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740

ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800

gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860

tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920

attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980

tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040

cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100

agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160

tggtgtagct tgccactttc accagcaaag ttc 2193<210> 231<211> 56<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: prm06808<400> 231

ggggacaagt ttgtacaaaa aagcaggctt<210> 232<211> 50<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: prm06809<400> 232

ggggaccact ttgtacaaga aagctgggtg<210> 233<211> 2194<212> DNA<213> Oryza sativa<400> 233

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140

acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200

tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260

tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320

atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380

gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440

gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500

50gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560

gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620

tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680

ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740

actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800

agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860

atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920

gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980

ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040

acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100

aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160

ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 234<211> 1065<212> DNA

<213> Arabidopsis thaliana<400> 234

atggagttgt taatgtgttc gggtcaggcc gagtcaggtg gttcctcttc caccgagtct 60

tcttcactca gtggtggact caggtttggt cagaagatct acttcgagga tggatccgga 120

tccagaagca agaaccgggt caataccgtt egtaagtcgt ctaccacggc gaggtgccaa 180

gtggaaggtt gtagaatgga tctaagcaat gttaaagctt attactcgag acacaaagtt 240

tgttgcattc actctaaatc atctaaagtc attgtctctg gtcttcatca aaggttttgt 300

caacaatgta gcaggtttca ccagctttct gagtttgact tggagaaaag aagttgtcgc 360

agaagactcg cttgtcataa cgaacgacga agaaaaccac aacccacaac ggctcttttc 420

acttctcatt actctcgaat cgctccatct ctttacggaa accccaatgc tgcaatgatt 480

aaaagcgttt tgggagatcc tactgcgtgg tcaaccgcaa gatcagtgat gcagcggcct 540

ggaccgtggc agattaatcc agttagggaa acccatccac acatgaatgt tttatcacat 600

ggaagctcaa gctttactac atgtccagag atgataaaca acaatagcac agattcaagc 660

tgtgctctct ctcttctgtc aaactcatac ccaattcatc agcagcaact tcagacacca 720

acaaatacat ggcgaccatc ttctggtttc gactcgatga tctcattctc cgataaggtt 780

acaatggctc agccaccgcc catttcaacc catcagccgc ccatctcaac acatcagcag 840

tacctcagcc aaacttggga agtcatcgcg ggcgaaaaga gcaattcaca ttatatgtct 900

cctgtgagtc aaatctcgga gccagcagat ttccagataa gcaatggcac cacaatgggt 960

ggatttgagc tgtatcttca tcagcaggtt ctgaagcaat acatggaacc cgagaacaca 1020

agagcttatg actcctctcc tcaacatttc aattggtctc tttga 1065<210> 235<211> 354<212> PRT

<213> Arabidopsis thaliana<400> 235

Met Glu Leu Leu Met Cys Ser Gly Gln Ala Glu Ser Gly Gly Ser Ser1 5 10 15 Ser Thr Glu Ser Ser Ser Leu Ser Gly Gly Leu Arg Phe Gly Gln Lys 20 25 30 Ile Tyr Phe Glu Asp Gly Ser Gly Ser Arg Ser Lys Asn Arg Val Asn 35 40 45 Thr Val Arg Lys Ser Ser Thr Thr Ala Arg Cys Gln Val Glu Gly Cys 50 55 60 Arg Met Asp Leu Ser Asn Val Lys Ala Tyr Tyr Ser Arg His Lys Val65 70 75 80Cys Cys Ile His Ser Lys Ser Ser Lys Val Ile Val Ser Gly Leu His 85 90 95 Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Ser Glu Phe 100 105 110 Asp Leu Glu Lys Arg Ser Cys Arg Arg Arg Leu Ala Cys His Asn Glu 115 120 125 Arg Arg Arg Lys Pro Gln Pro Thr Thr Ala Leu Phe Thr Ser His Tyr 130 135 140 Ser Arg Ile Ala Pro Ser Leu Tyr Gly Asn Pro Asn Ala Ala Met Ile145 150 155 160Lys Ser Val Leu Gly Asp Pro Thr Ala Trp Ser Thr Ala Arg Ser Val 165 170 175 Met Gln Arg Pro Gly Pro Trp Gln Ile Asn Pro Val Arg Glu Thr His180 185 190

Pro His Met Asn Val Leu Ser His Gly Ser Ser Ser Phe Thr Thr Cys

195 200 205

Pro Glu Met Ile Asn Asn Asn Ser Thr Asp Ser Ser Cys Ala Leu Ser

210 215 220

Leu Leu Ser Asn Ser Tyr Pro Ile His Gln Gln Gln Leu Gln Thr Pro225 230 235 240

Thr Asn Thr Trp Arg Pro Ser Ser Gly Phe Asp Ser Met Ile Ser Phe

245 250 255

Ser Asp Lys Val Thr Met Ala Gln Pro Pro Pro Ile Ser Thr His Gln

260 265 270

Pro Pro Ile Ser Thr His Gln Gln Tyr Leu Ser Gln Thr Trp Glu Val

275 280 285

Ile Ala Gly Glu Lys Ser Asn Ser His Tyr Met Ser Pro Val Ser Gln

290 295 300

Ile Ser Glu Pro Ala Asp Phe Gln Ile Ser Asn Gly Thr Thr Met Gly305 310 315 320

Gly Phe Glu Leu Tyr Leu His Gln Gln Val Leu Lys Gln Tyr Met Glu

325 330 335

Pro Glu Asn Thr Arg Ala Tyr Asp Ser Ser Pro Gln His Phe Asn Trp340 345 350

Ser Leu

<210> 236<211> 1128<212> DNA

<213> Arabidopsis thaliana<400> 236

atggagatgg gttccaactctcctccactg agtcatcctcgaggacggtg gtggtggatccgtggaggcg ggtcgggtcaatggatctaa ccaatgcaaaaaaacaccta aagtcactgttttcatcagc ttccggaattcataatgagc gacgaaggaagggaggatcg caccttcgctgggaaccaag agataggatgccagtgtcgt caccgtcatgggtggaggag ggacaagcttaagggaattg gcgactcaaagacaacaaca acaacaacaatcaggttttg gcccgatgaccagtatctga acccgccttgaatttaggtc gatacaccgagagttcgagt tatctgatcaacaagggctt atgactcttc<210> 237<211> 375<212> PRT<213> Arabidopsis thaliana<400> 237

Met Glu Met Gly Ser Asn Ser Gly Pro Gly His Gly Pro Gly Gln Ala1 5 10 15 Glu Ser Gly Gly 20 Ser Ser Thr Glu Ser 25 Ser Ser Phe Ser Gly 30 Gly LeuMet Phe Gly 35 Gln Lys Ile Tyr Phe 40 Glu Asp Gly Gly Gly 45 Gly Ser GlySer Ser 50 Ser Ser Gly Gly Arg 55 Ser Asn Arg Arg Val 60 Arg Gly Gly GlySer Gly Gln Ser Gly Gln Ile Pro Arg Cys Gln Val Glu Gly Cys Gly65 70 75 80Met Asp Leu Thr Asn Ala Lys Gly Tyr Tyr Ser Arg His Arg Val Cys

gggtccgggttttcagtggacgggtcttctgtcgggtcagaggttattacggctggtatctgacctagaggccacagcctttacgaaaatgccaagttcagcagatcaatctcatctccactgtgctctccaacaacaacggttacaatgggtattcaaggccagataatccatcatcaattctcaccat

catggtccgggggctcatgttcctcaggtgataccaaggttcgagacaccgaacagaggtaaaaggagttgcgtctctctggtgatgctgagaacattggccaatgaatggagattatggtctcttctgtaacaacaacagctcaaccacgacaatgatatgtcagataaagtaggagacaccaactggt

gtcaggcagattggccagaagtcgttcaaagccaagtggagagtttgtggtttgtcaacagccgcaggagctgtgttagcgaatgaatggatacaagagttatttagtcaacactaaactcaaatccacaacaatacatgcacctgcaccatgatatgtcgtagtggcacagtacatggaccctctga

gtcgggtggtgatctacttccagacgtgtcaggttgtgggagtgcactctgtgcagcaggactcgctggtttctcgttacaagctttcttgatgaggcggaggttcagttagagagctactcaaccacatgcgagcttcttagccagcattcctgttttgggcaatgggtagatgagaac

6012018024030036042048054060066072078084090096010201080112885 90 95

Gly Val His Ser Lys Thr Pro Lys Val Thr Val Ala Gly Ile Glu Gln

100 105 110

Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Pro Glu Phe Asp

115 120 125

Leu Glu Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg

130 135 140

Arg Arg Lys Pro Gln Pro Ala Ser Leu Ser Val Leu Ala Ser Arg Tyr145 150 155 160

Gly Arg Ile Ala Pro Ser Leu Tyr Glu Asn Gly Asp Ala Gly Met Asn

165 170 175

Gly Ser Phe Leu Gly Asn Gln Glu Ile Gly Trp Pro Ser Ser Arg Thr

180 185 190

Leu Asp Thr Arg Val Met Arg Arg Pro Val Ser Ser Pro Ser Trp Gln

195

200

205

Ile Asn Pro Met Asn Val Phe Ser Gln Gly Ser Val Gly Gly Gly Gly

210

215

220

Thr Ser Phe Ser Ser Pro Glu Ile Met Asp Thr Lys Leu Glu Ser Tyr

225

230

235 240

Lys Gly Ile Gly Asp Ser Asn Cys Ala Leu Ser Leu Leu Ser Asn Pro

245 250 255

His Gln Pro His Asp Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn

260 265 270

Asn Asn Asn Thr Trp Arg Ala Ser Ser Gly Phe Gly Pro Met Thr Val

275 280 285

Thr Met Ala Gln Pro Pro Pro Ala Pro Ser Gln His Gln Tyr Leu Asn

290

295

300

Pro Pro Trp Val Phe Lys Asp Asn Asp Asn Asp Met Ser Pro Val Leu

305

310

315

320

Asn Leu Gly Arg Tyr Thr Glu Pro Asp Asn Cys Gln Ile Ser Ser Gly

325

330

335

Thr Ala Met Gly Glu Phe Glu Leu Ser Asp His His His Gln Ser Arg

340 345 350

Arg Gln Tyr Met Glu Asp Glu Asn Thr Arg Ala Tyr Asp Ser Ser Ser

355 360 365His His Thr Asn Trp Ser Leu

370 375<210> 238<211> 1149<212> DNA

<213> Aquilegia formosa χ Aquilegia pubescens<400> 238

atggaaatgg gttccagctc tttcgctggt ggtgggggta agggtgcttc tggttcatct 60

gattcttcac tgaatggttt gaaatttggg aagaaaatct actttgaaga tgtgggtatt 120

ggagttttag gcaagtcaag tgttgggtct ccgtcaattt tggtttctga agctcggttg 180

ccaccggctt cgtcggtgaa gaagggtaga ggggttttgc aaggacaacc acctagatgt 240

tctgttgaag gttgtaagct tgatcttact gatgctaagc cttattactc aaggcacaaa 300

gtctgtggta tgcactctaa atctcctaaa gtaattgttg gtggtttgga gcagaggttt 360

tgccagcagt gtagcagatt tcatctactc tgtgaatttg accaaggcaa gcgaagctgt 420

cgtagacgtc tagctggcca caatgagcgt cgaagaaaac cacaacctgg atcaatattt 480

tcaccgcgct atggtcgtgt gtcaccatct ttccaagaaa atagcaccag aggaggaggt 540

tttctaatgg acttcacagc gtacccaagg ctggcaggaa gggatgcatg gcaaacagta 600

aaagccggca attgggcaga tggaaaccaa acctctccta ttaagaagct tctcccacat 660

caatggcaag gcaattcaga gaatcctcct cctattgtct attctcaggc acctcacccg 720

tatctgcaag gtgtggctag tggatcaatt ttttccagta caagaatacc ttcagccgag 780

tgttttgctg gtgtctctga ctccagctgt gctctctctc ttctgtcaaa tcaaccatgg 840

aaccccagaa accagacttc cgatttggag gtgaataaca tagtgaacgg tgaaggggta 900

tccatggcaa gatctatagc acctcatagt gctgtagtca ccaacttcac gaacaacaca 960

tggaatttta agggcaacag tgaagttagt ggcagttccc atgaaattcc acgtcaggtg 1020

tcgcagccag tcaccaatca tttctccagt gagctcgatc tagctcagca ggggaacagg 1080

cagtacatgg agatccggca ttcaagggat tttggttctt ccactcacca gatgcactgg 1140tctctttga 1149<210> 239<211> 382<212> PRT

<213> Aquilegia formosa χ Aquilegia pubescens<400> 239

Met Glu Met Gly Ser Ser Ser Phe Ala Gly Gly Gly Gly Lys Gly Ala1 5 10 15

Ser Gly Ser Ser Asp Ser Ser Leu Asn Gly Leu Lys Phe Gly Lys Lys

20 25 30

Ile Tyr Phe Glu Asp Val Gly Ile Gly Val Leu Gly Lys Ser Ser Val

35 40 45

Gly Ser Pro Ser Ile Leu Val Ser Glu Ala Arg Leu Pro Pro Ala Ser

50 55 60

Ser Val Lys Lys Gly Arg Gly Val Leu Gln Gly Gln Pro Pro Arg Cys65 70 75 80

Ser Val Glu Gly Cys Lys Leu Asp Leu Thr Asp Ala Lys Pro Tyr Tyr

85 90 95

Ser Arg His Lys Val Cys Gly Met His Ser Lys Ser Pro Lys Val Ile

100 105 110

Val Gly Gly Leu Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His

115 120 125

Leu Leu Cys Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu

130 135 140

Ala Gly His Asn Glu Arg Arg Arg Lys Pro Gln Pro Gly Ser Ile Phe145 150 155 160

Ser Pro Arg Tyr Gly Arg Val Ser Pro Ser Phe Gln Glu Asn Ser Thr

165 170 175

Arg Gly Gly Gly Phe Leu Met Asp Phe Thr Ala Tyr Pro Arg Leu Ala

180 185 190

Gly Arg Asp Ala Trp Gln Thr Val Lys Ala Gly Asn Trp Ala Asp Gly

195 200 205

Asn Gln Thr Ser Pro Ile Lys Lys Leu Leu Pro His Gln Trp Gln Gly

210 215 220

Asn Ser Glu Asn Pro Pro Pro Ile Val Tyr Ser Gln Ala Pro His Pro225 230 235 240

Tyr Leu Gln Gly Val Ala Ser Gly Ser Ile Phe Ser Ser Thr Arg Ile

245 250 255

Pro Ser Ala Glu Cys Phe Ala Gly Val Ser Asp Ser Ser Cys Ala Leu

260 265 270

Ser Leu Leu Ser Asn Gln Pro Trp Asn Pro Arg Asn Gln Thr Ser Asp

275 280 285

Leu Glu Val Asn Asn Ile Val Asn Gly Glu Gly Val Ser Met Ala Arg

290 295 300

Ser Ile Ala Pro His Ser Ala Val Val Thr Asn Phe Thr Asn Asn Thr305 310 315 320

Trp Asn Phe Lys Gly Asn Ser Glu Val Ser Gly Ser Ser His Glu Ile

325 330 335

Pro Arg Gln Val Ser Gln Pro Val Thr Asn His Phe Ser Ser Glu Leu

340 345 350

Asp Leu Ala Gln Gln Gly Asn Arg Gln Tyr Met Glu Ile Arg His Ser

355 360 365

Arg Asp Phe Gly Ser Ser Thr His Gln Met His Trp Ser Leu

370 375 380

<210> 240<211> 1170<212> DNA

<213> Gossypium hirsutum<400> 240

atggaaatgg gttcgggctc tttgactgag tcgggcggtt ctcccaccaa ctcttccgcc 60

gagtcactca acggcttgaa gttcggtaaa aagatctact ttgaggatac agccgctgtc 120gccgccgccg ctggtggtaa aagtgttggt ggtggtgcaa acatagggac tccatccaag 180tccggtccag catcttcaag cttagccggg tcgtgtagga aagccagggt tgatggaatg 240gcgcaagggg ttctgccttc taggtgtcaa gtagaagggt gtaaagtgga tctgagtgat 300gctaaggctt actattcaag gcataaggtt tgttgtatgc actctaagtc atctaaagtc 360Gly Gly Ser

Phe Gly Lys30

Ala Gly Gly45

Ser Gly

attgttgctg gtctcgagca aagattttgt cagcagtgta gcagatttca tcagctttctgaatttgaca aagggaaacg gagttgtcgt agacggcttg caggtcacaa tgagcgacgcaggaaaccac cacctggatc attattttcc tctccttatg gccggctttc ttcctctattattgaaaatg gcagtagagg tggaagcttt atagtggatt tctcagcata cccaaggctttcaggaaggg atgcatggcc agcagctcga tcgttagaat gcataactgg aaatcgaagcacagccactg gaagctcatt ttcacatcca cggcaaaaca actccagcaa acctcctcatgaccatttct tgcaaggttc accatgtggg actagtttct ccagcactgg aatttctccaggagaatgct tcacagggtc tggtgactca agctgtgctc tctctcttct gtcaaatcaaccgtggggct ccaggaacca ggctttgaat ttttctgtaa atggcgtgat aagtactgaagggtcctctg cggcacaacc aacaacgctt catggtgcag ttgtgaaccc ttattcaaatgcctctttgg atttcaatgg cagtgacact gttcgcagtt ctcacaagat gctgccacacctagatttgg gtcaaatccc agaccctgtt aactgtcaat tctctagtga ccttgagttgtctcaacaaa gctggaggtc atatatcgaa catgagcagt ccggggcagc ctatgacgactccatgcagc atatccactg gacgctctaa<210> 241<211> 389<212> PRT

<213> Gossypium hirsutum<400> 241

Met Glu Met Gly Ser Gly Ser Leu Thr Glu Ser1 5 10

Asn Ser Ser Ala Glu Ser Leu Asn Gly Leu Lys

20 25

Tyr Phe Glu Asp Thr Ala Ala Val Ala Ala Ala

35 40

Val Gly Gly Gly Ala Asn Ile Gly Thr Pro Ser Lys

50 55 60

Ser Ser Ser Leu Ala Gly Ser Cys Arg Lys Ala Arg Val Asp65 70 75

Ala Gln Gly Val Leu Pro Ser Arg Cys Gln Val Glu Gly Cys

85 90

Asp Leu Ser Asp Ala Lys Ala Tyr Tyr Ser Arg His Lys Val100 105 110

Met His Ser Lys Ser Ser Lys Val Ile Val Ala Gly Leu Glu

115 120 125

Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Ser Glu Phe

130 135 140

Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu145 150 155

Arg Lys Pro Pro Pro Gly Ser Leu Phe Ser Ser Pro Tyr Gly

165 170

Ser Ser Ser Ile Ile Glu Asn Gly Ser Arg Gly Gly Ser Phe180 185 190

Asp Phe Ser Ala Tyr Pro Arg Leu Ser Gly Arg Asp Ala Trp

195 200 205

Ala Arg Ser Leu Glu Cys Ile Thr Gly Asn Arg Ser Thr Ala

210 215 220

Ser Ser Phe Ser His Pro Arg Gln Asn Asn Ser Ser Lys Pro225 230 235

Asp His Phe Leu Gln Gly Ser Pro Cys Gly Thr Ser Phe Ser

245 250

Gly Ile Ser Pro Gly Glu Cys Phe Thr Gly Ser Gly Asp Ser260 265 270

Ala Leu Ser Leu Leu Ser Asn Gln Pro Trp Gly Ser Arg Asn

275 280 285

Leu Asn Phe Ser Val Asn Gly Val Ile Ser Thr Glu Gly Ser

290 295 300

Ala Gln Pro Thr Thr Leu His Gly Ala Val Val Asn Pro Tyr305 310 315

Ala Ser Leu Asp Phe Asn Gly Ser Asp Thr Val Arg Ser Ser

325 330

Met Leu Pro His Leu Asp Leu Gly Gln Ile Pro Asp Pro Val340 345 350

Pro Thr1 5

Lys Ile

Lys Ser

Pro Ala

Gly Met80Lys Val95

Cys Cys

Gln Arg

Asp Lys

Arg Arg160Arg Leu175

Ile Val

Pro Ala

Thr Gly

Pro His240Ser Thr255

Ser Cys

Gln Ala

Ser Ala

Ser Asn320His Lys335

Asn Cys

4204805406006607207808409009601020108011401170Gln Phe Ser Ser Asp Leu355

Ile Glu His Glu Gln Ser370

Ile His Trp Thr Leu385

<210> 242<211> 1017<212> DNA<213> Ipomoea nil<400> 242

atggaactgg gttcttcttc ttcttctacc tctacctccg ccgactcctc atccgacggc 60ttgaagttcg gcaaaaaagt ctactttgaa gatgcgggtg gtgggagtgg tgggtcgtcg 120ctgccggcca agagagggag gagcgcggtg gcgcaaggcg gacagccacc caggtgccag 180gtggaagggt gcaaggcaga tctgagtgaa tttaaggctt attactcaaa gcataaagtt 240tgtggtatgc actccaagtc tcctaaggtc attgtttctg ggcttgaaca gagattctgc 300cagcagtgca gcaggtttca tcaattgagt gaatttgatc aagtaaaaag gagctgccgt 360aggcgtttgg ctggtcataa tgagcgtcgt aggaagcccc cacttggatc catattgtcc 420acacattatg ggactctttc ttcttcaatg tttggaaaca atggccactt tgtgatggat 480ttcgcctcat acccatatcc gggtggtaag ggctcatggc ggccaagtac caatggcgtg 540gggaactttc ttcaacaacc atggcagaga aactctgaag atcccccacc caagcttctt 600ttgctaggtt cggatgctgc tgctagggct acttatccca gtccttgtgg agaatacttc 660aatggggtct cggattccac ccgtgctctc tctcttctgt caaactcaaa tcagccctgg 720ggctcgagaa accaacaacc ctctggtctc ggggttaata gcttacttaa cactgatgga 780acgcttgctg ttcatccatc cggttcccat gctgccgtta tcaatgaatt ttcttcaagt 840ccatggggtt ttaaaggcaa tcaagccact accagctcag ataagatcct tcctgatagt 900cactattctg gtgagctcga gatgatggct catcaacaaa ctggacgagc atacatggga 960atggagtact cgacgggtta tgattcttct gtccagaatg tgcactggac tctctga 1017

<210> 243<211> 338<212> PRT<213> Ipomoea nil<400> 243

Met Glu Leu Gly Ser Ser1 5

Ser Ser Asp Gly Leu Lys20

Gly Gly Gly Ser Gly Gly35

Ala Val Ala Gln Gly Gly50

Lys Ala Asp Leu Ser Glu65 70

Cys Gly Met His Ser Lys85

Gln Arg Phe Cys Gln Gln100

Asp Gln Val Lys Arg Ser115

Arg Arg Arg Lys Pro Pro130

Thr Leu Ser Ser Ser Met145 150

Phe Ala Ser Tyr Pro Tyr165

Thr Asn Gly Val Gly Asn180

Glu Asp Pro Pro Pro Lys195

Arg Ala Thr Tyr Pro Ser210

Asp Ser Thr Arg Ala Leu225 230

Glu Leu Ser Gln Gln Ser Trp Arg Ser Tyr

360 365

Gly Ala Ala Tyr Asp Asp Ser Met Gln His375 380

Ser Ser Ser Thr Ser10

Phe Gly Lys Lys Val25

Ser Ser Leu Pro Ala40

Gln Pro Pro Arg Cys55

Phe Lys Ala Tyr Tyr75

Ser Pro Lys Val Ile90

Cys Ser Arg Phe His105

Cys Arg Arg Arg Leu120

Leu Gly Ser Ile Leu135

Phe Gly Asn Asn Gly155

Pro Gly Gly Lys Gly170

Phe Leu Gln Gln Pro185

Leu Leu Leu Leu Gly200

Pro Cys Gly Glu Tyr215

Ser Leu Leu Ser Asn235

Thr Ser Ala Asp Ser15

Tyr Phe Glu Asp Ala30

Lys Arg Gly Arg Ser45

Gln Val Glu Gly Cys60

Ser Lys His Lys Val80

Val Ser Gly Leu Glu95

Gln Leu Ser Glu Phe110

Ala Gly His Asn Glu125

Ser Thr His Tyr Gly140

His Phe Val Met Asp160

Ser Trp Arg Pro Ser175

Trp Gln Arg Asn Ser190

Ser Asp Ala Ala Ala205

Phe Asn Gly Val Ser220

Ser Asn Gln Pro Trp240Gly Ser Arg Asn Gln Gln Pro Ser Gly Leu Gly Val Asn Ser Leu Leu

245 250 255

Asn Thr Asp Gly Thr Leu Ala Val His Pro Ser Gly Ser His Ala Ala

260 265 270

Val Ile Asn Glu Phe Ser Ser Ser Pro Trp Gly Phe Lys Gly Asn Gln

275 280 285

Ala Thr Thr Ser Ser Asp Lys Ile Leu Pro Asp Ser His Tyr Ser Gly

290 295 300

Glu Leu Glu Met Met Ala His Gln Gln Thr Gly Arg Ala Tyr Met Gly305 310 315 320

Met Glu Tyr Ser Thr Gly Tyr Asp Ser Ser Val Gln Asn Val His Trp325 330 335

Thr Leu

<210> 244<211> 1035<212> DNA

<213> Lactuca sativa<400> 244

atggagatgg gtggttcgag tggttcttcg gagtcgcaacttcgggaaag aaatctattt tgaggatgtg ggagttggaggggttgtctc cggcgagcgg cggcgatgct gctggagggcgctggtgggg tggtgagtgg ttttggacaa cagcaaccactgtaatctgg atctgagtga tgctaaaagt tactattcaacattcgaaaa cggctaaggt cattgttaat ggccttgaacagcaggttcc atcaactacc agagtttgac cagggaaaaagctgggcaca atgaacgtag aagaaagcca tctctgctattcctcctcaa tctttgaaaa caatgggaat tctggaggcttgctcaagag gaaggattca gtggccagga acaagggcggatcgacctcc caattgccgg agaaaagttc ccaccgcttcaatccacctc cttatgttcc accaggaggg tgttttaatgtgtgctctct ctcttctgtc aaatcactca tctggctcaagagtactata tcaaccctga agctggtgca tatgtgcaccggaaccggag ctgggttcgg aaccatggtt gaggtcaccgacccatgatg cccatttggg tttgggtcac gtcccacagtgaggttggac ttggtccaca tggtggggga aggcgatatggactggtcac tttga<210> 245<211> 344<212> PRT

<213> Lactuca sativa<400> 245

Met Glu Met Gly Gly Ser Ser Gly Ser Ser Glu1 5 10

Ile Gly Leu Gln Phe Gly Lys Glu Ile Tyr Phe

20 25

Gly Ala Gln Val Lys Ser Asp Asp Gly Leu Ser

35 40

Asp Ala Ala Gly Gly Pro Gln Lys Lys Gly Arg

50 55

Val Ser Gly Phe Gly Gln Gln Gln Pro Pro Arg

tgctcaaaatctcaggttaacgcagaagaacgaggtgtcaggcacaaagtagagattctggaagctgcagccactcgctattctaatggacaccaccgcccatggcaaaggagtccatgaggaaccaatcagcttcatcaccactggctgctggtggtggactcatctgt

tggtttgcaaatccgatgatagggagaactggtggaaggtttgtggtgctccaacagtgcgagacgattgtggaactgtccttttcgtcatcgagccgcccaacctggatggactccaaccctgagccataccaacaaccggtatacgagctactctggttgaccacatt

Ser

Glu

Pro

Thr60Cys

65

70

Cys Asn Leu Asp Leu Ser Asp Ala Lys Ser

75Tyr

85

90

Tyr

Val Cys Gly Ala His Ser Lys Thr Ala Lys Val Ile

100 105

Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His

115

120

Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg

130 135

Glu Arg Arg Arg Lys Pro Ser Leu Leu Ser Thr145 150 155

Ser Ser Ser Ile Phe Glu Asn Asn Gly Asn Ser

Leu140Arg

Gly

Gln Leu Leu Lys 15 Asp Val Gly Val 30 Ala Ser Gly Gly45 Ala Gly Gly ValGln Val Glu Gly 80Ser Arg His Lys 95 Val Asn Gly Leu 110 Gln Leu Pro Glu125 Ala Gly His AsnTyr Gly Thr Val 160Gly Phe Leu Met

6012018024030036042048054060066072078084090096010201035165 170

Asp Phe Ser Ser Cys Ser Arg Gly Arg Ile Gln

180 185

Ala Ala Pro Pro Pro Arg Ala Ala Ile Asp Leu

195 200

Lys Phe Pro Pro Leu Pro Trp Gln Ser Asn Leu

210 215

Tyr Val Pro Pro Gly Gly Cys Phe Asn Gly Val225 230 235

Cys Ala Leu Ser Leu Leu Ser Asn His Ser Ser

245 250

Ser Leu Ser His Glu Tyr Tyr Ile Asn Pro Glu

260 265

His Gln Leu His Gln Pro Thr Thr Gly Thr Gly275 280

Val Glu Val Thr Ala Thr Gly Trp Val Tyr290 295

Leu Gly Leu Gly His Val Pro Gln Ser Gly310

Met

His305

Trp Pro

Pro Ile205Asp Asn220

His Glu

Gly Ser

Ala Gly

Ala Gly285Glu Thr300

Gly Gly

315

Glu Val Gly Leu Gly Pro His Gly Gly Gly Arg Arg Tyr

325

330

175Gly Thr190

Ala Gly

Pro Pro

Asp Ser

Arg Asn255Ala Tyr270

Phe Gly

His Asp

Tyr Ser

Asp Ser335

Arg

Glu

Pro

Asn240Gln

Val

Thr

Ala

Gly320Ser

Val Asp His Ile Asp Trp Ser Leu340

<210> 246<211> 1137<212> DNA

<213> Malus domestica<400> 246

atggaaatgg gctcgagttc taagaccgag tcagcgagctaactcctccg ctgagtcact caacggcttg aaattcggccgggggttttg gagctctgca caaatcatca tgcgggtctgggggctacgc cgccaaagaa gcaaaggggc ggcggaaattcaggtggagg gctgcgaggt agatctgagt ggtgccaaaggtctgtggct tgcactctaa aactcccact gtcattgttgtgccaacagt gtagcaggtt tcatttactt, cctgaatttgcgtagacgct tggctgggca taatgagcgt cgtagaaaactctacgcgtg gcagactttc ttcgtctctc tacgaaaacactgatggact tcactgcata cccaaggttt tctgggagggtctgagcgag cacctgttaa tcaaaatgcc aatgacgcagtggcagagca actctgatat ttctacatcc ggcttttaccactagttatc ctggtcctgg aattcctcca ggagaatgtgagctgtgctc tctctcttct gtcaaatcag ccatggggctgctgggatga attccttgat gaacactcaa ggggtacctgtctgcaacct ccaatcactt tccgaccact tcgtggggttagcagctcac acgggatgct tccagatctg ggtctcggtcagtcagtact ctggtgtgct ggagctgtct caacagggtactcggacaca ccaggggcta tgactccacc agtcagcaga<210> 247<211> 378<212> PRT

<213> Malus domestica<400> 247

Met Glu Met Gly Ser Ser Ser Lys Thr Glu Ser1 5 10

Ser Ser Pro Pro Asn Ser Ser Ala Glu Ser Leu

cttcctcctcggaaaatctactgctgggtctgggtcagcccttactattcctggtcttgaatcaaggaaacacctccagggcagcagaatatacatggacggaagtttcttacaaggttctcacagtagtctcgaaaccgtggctcaacctcaaaggaaaaaatctcgcaggaggcagcatgcactggtc

ttcgccgcccctttgaggatttcctccgccgccgcggtgtcaggcacaaaacagaggtttacgtagttgtatccatactgtggaagctttaacaagaaccacaacagccgagcaggcgggcactgactcaagtattgggtagtccctcattgaaaatggtgccgcttagcacacatggaaactttaa

20

25

Gly Arg Lys Ile Tyr Phe Glu Asp 35 40Ser Ser Cys Gly Ser Ala Ala Gly 50 55 Pro Lys Lys Gln Arg Gly Gly Gly65 70 Gln Val Glu Gly Cys Glu Val Asp

75

Ala Ser Ser Ser Ser15

Asn Gly Leu Lys Phe30

Gly Ala Leu His Lys45

Ala Gly Ala Thr Pro60

Gln Pro Pro Arg Cys80

Ala Lys Ala Tyr Tyr

6012018024030036042048054060066072078084090096010201080113785 90 95 Ser Arg His Lys 100 Val Cys Gly Leu His 105 Ser Lys Thr Pro Thr 110 Val IleVal Ala Gly 115 Leu Glu Gln Arg Phe 120 Cys Gln Gln Cys Ser 125 Arg Phe HisLeu Leu 130 Pro Glu Phe Asp Gln 135 Gly Lys Arg Ser Cys 140 Arg Arg Arg LeuAla Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Ser Ile Leu145 150 155 160Ser Thr Arg Gly Arg 165 Leu Ser Ser Ser Leu 170 Tyr Glu Asn Ser Ser 175 ArgIle Gly Ser Phe 180 Leu Met Asp Phe Thr 185 Ala Tyr Pro Arg Phe 190 Ser GlyArg Asp Thr 195 Trp Thr Thr Arg Thr 200 Ser Glu Arg Ala Pro 205 Val Asn GlnAsn Ala 210 Asn Asp Ala Gly Lys 215 Phe Leu Gln Gln Pro 220 Trp Gln Ser AsnSer Asp Ile Ser Thr Ser Gly Phe Tyr Leu Gln Gly Ser Ala Gly Gly225 230 235 240Thr Ser Tyr Pro Gly 245 Pro Gly Ile Pro Pro 250 Gly Glu Cys Val Thr 255 ValVal Thr Asp Ser 260 Ser Cys Ala Leu Ser 265 Leu Leu Ser Asn Gln 270 Pro TrpGly Ser Arg 275 Asn Arg Val Leu Gly 280 Ala Gly Met Asn Ser 285 Leu Met AsnThr Gln 290 Gly Val Pro Val Ala 295 Gln Pro Val Pro His 300 Ser Ala Thr SerAsn His Phe Pro Thr Thr Ser Trp Gly Phe Lys Gly Asn Glu Asn Gly305 310 315 320Ser Ser Ser His Gly 325 Met Leu Pro Asp Leu 330 Gly Leu Gly Gln Ile 335 SerGln Pro Leu Ser 340 Ser Gln Tyr Ser Gly 345 Val Leu Glu Leu Ser 350 Gln GlnGly Arg Arg 355 Gln Gln His Met Glu 360 Leu Gly His Thr Arg 365 Gly Tyr Asp

Ser Thr Ser Gln Gln Met His Trp Ser Leu

370 375<210> 248<211> 1014<212> DNA

<213> Medicago trunculata<400> 248

atggattcag gaggcaactc ttcttcagaa gagtcctcac ttaatggctt gaaatttggc 60

caacgaatct atttcgaaga tacagctctt actgctgctt ctgctgctgc tgctagtact 120

accattgctg ctggttctcc ttcttcttct ggttcaaaga aaggaagagg tgggtcagtt 180caacattctc aaccacctag gtgtcaagtt gaaggatgta aactagatct gactgatgct 240

aaagcttact attctagaca caaagtttgt agcatgcact ctaaatcccc tactgttact 300

gtttctggtc ttcaacaaag gttttgtcaa caatgtagca gatttcatca gcttgctgag 360

tttgatcaag gaaaaagaag ttgtcggaga cgactagctg gtcataatga gcgtcgcaga 420

aagcccccac ccagctctct cttaacctca cgttttgcca ggctttcttc gtctgttttt 480

ggtaacagcg acagaggtgg cagctttttg atggaatttg cttcaaatcc gaaacatagt 540

ctgaggaatt cacccggaaa tcaaaccaca gcaatcggtt ggccttggcc ggggaacacg 600

gagtcgccat ctagcaacct tttcttgcaa ggttcggtgg gtgggacaag cttccctggt 660

gccaggcatc ctcccgagga aacttacact ggagtcacag attcaaactg tgctctctct 720

cttctgtcaa atcaaacatg gggttctcaa aacacagaac caagtcctgg attgaataac 780

atgctgaatt tcaacgggac acccatgaca caacttggta catcttctca tggtgtagcc 840

atgcatcaaa ttccaaacaa ttacgaggtt gtccctgatc ttggtcgggg tcacattttg 900

catcctcttg gtagccaaca ctctggcgag cttgatctgt tgcagcaggg aaggaggcat 960

tatatggatg tagaacattc cagggcctat gaatcttctc agtggtcact gtaa 1014<210> 249<211> 337<212> PRT

<213> Medicago trunculata<400> 249 Met Asp Ser Gly Gly Asn Ser Ser Ser Glu Glu Ser Ser Leu Asn Gly1 5 10 15 Leu Lys Phe Gly Gln Arg Ile Tyr Phe Glu Asp Thr Ala Leu Thr Ala 20 25 30 Ala Ser Ala Ala Ala Ala Ser Thr Thr Ile Ala Ala Gly Ser Pro Ser 35 40 45 Ser Ser Gly Ser Lys Lys Gly Arg Gly Gly Ser Val Gln His Ser Gln 50 55 60 Pro Pro Arg Cys Gln Val Glu Gly Cys Lys Leu Asp Leu Thr Asp Ala65 70 75 80Lys Ala Tyr Tyr Ser Arg His Lys Val Cys Ser Met His Ser Lys Ser 85 90 95 Pro Thr Val Thr Val Ser Gly Leu Gln Gln Arg Phe Cys Gln Gln Cys 100 105 110 Ser Arg Phe His Gln Leu Ala Glu Phe Asp Gln Gly Lys Arg Ser Cys 115 120 125 Arg Arg Arg Leu Ala Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro 130 135 140 Ser Ser Leu Leu Thr Ser Arg Phe Ala Arg Leu Ser Ser Ser Val Phe145 150 155 160Gly Asn Ser Asp Arg Gly Gly Ser Phe Leu Met Glu Phe Ala Ser Asn 165 170 175 Pro Lys His Ser Leu Arg Asn Ser Pro Gly Asn Gln Thr Thr Ala Ile 180 185 190 Gly Trp Pro Trp Pro Gly Asn Thr Glu Ser Pro Ser Ser Asn Leu Phe 195 200 205 Leu Gln Gly Ser Val Gly Gly Thr Ser Phe Pro Gly Ala Arg His Pro 210 215 220 Pro Glu Glu Thr Tyr Thr Gly Val Thr Asp Ser Asn Cys Ala Leu Ser225 230 235 240Leu Leu Ser Asn Gln Thr Trp Gly Ser Gln Asn Thr Glu Pro Ser Pro 245 250 255 Gly Leu Asn Asn Met Leu Asn Phe Asn Gly Thr Pro Met Thr Gln Leu 260 265 270 Gly Thr Ser Ser His Gly Val Ala Met His Gln Ile Pro Asn Asn Tyr 275 280 285 Glu Val Val Pro Asp Leu Gly Arg Gly His Ile Leu His Pro Leu Gly 290 295 300 Ser Gln His Ser Gly Glu Leu Asp Leu Leu Gln Gln Gly Arg Arg His305 310 315 320Tyr Met Asp Val Glu His Ser Arg Ala Tyr Glu Ser Ser Gln Trp Ser 325 330 335 Leu

<210> 250<211> 1143<212> DNA

<213> Nicotiana bentamiana<400> 250

atggaacttc tggcttctgc ttcttcttct acttctacta attctacttc ccctgactct 60

cctcccaaca ctttaaaatt tggtcaaaaa atctactttg agcatgttgg acttcagcac 120

ctcaaatcag caactgggtc gtcgtcgtca tcgccgccgg tcatcggaac tccggcgccg 180

gcgatgtcca agaaaggaag agggggtggt gtagttcaag gtcggcaacc acctaggtgt 240

caagttgaag ggtgtgaagc agatctgagt gatgttaagg cttactattc aaggcacaaa 300

gtctgtgcta cacattctaa gtctcctgtg gtcattgttg ctggtcttga acaaagattt 360

tgtcaacagt gtagcaggtt tcatcggttg ccagaatttg accaagggaa acgcagttgc 420

cgcaggcgcc tagcaggcca taatgagcgt cggaggaaac ctccacctgg atctcttttg 480

tctaatcgct atggaagtct ttcttcatca atatttgaaa acaatggcag atctggaagt 540

tttctggttg acttcactgc atatccgaat ctcactggag gtgcatggcc aaatactaga 600

tcatctgatc gaggatggga taatcaatcc actgcgtcag ggaagcttct ccaaagtcat 660

tggctgaaca gttctgaaaa tccgacatcc gaccttgttc tgcaaggttc agttgctagg 720

ggtgccaatt attctggtcc tggtattatt ccttccggaa actgcttctc tggagtctca 780gattccaatg gtgctctctc tcttctgtca aatgagccat ggggctcgag gaaccaatcctctagcctcg gggttaacgg cttggtcaac actgatggcg gacataccgt tcacccatcgggttcccatg ctgctcctgt caatcactac tcaggccctc tatggggatt taaaggaaatgaagctagta gcagttcaca tgcaatacct cctgatctcg ggctgggtca catttctcaacatgctgtca atcagtactc tggtgagcct gggatggctc agcacagtgg aagacagtacatgggactgg agcattcaaa gggttataat tcttctgttc agaatgtgca ctggacactttga

<210> 251<211> 380<212> PRT

<213> Nicotiana bentamiana<400> 251

Met Glu Leu Leu Ala Ser Ala Ser Ser Ser Thr Ser Thr Asn Ser Thr1 5 10 15 Ser Pro Asp Ser Pro Pro Asn Thr Leu Lys Phe Gly Gln Lys Ile Tyr 20 25 30 Phe Glu His Val Gly Leu Gln His Leu Lys Ser Ala Thr Gly Ser Ser 35 40 45 Ser Ser Ser Pro Pro Val Ile Gly Thr Pro Ala Pro Ala Met Ser Lys 50 55 60 Lys Gly Arg Gly Gly Gly Val Val Gln Gly Arg Gln Pro Pro Arg Cys65 70 75 80Gln Val Glu Gly Cys Glu Ala Asp Leu Ser Asp Val Lys Ala Tyr Tyr 85 90 95 Ser Arg His Lys Val Cys Ala Thr His Ser Lys Ser Pro Val Val Ile 100 105 110 Val Ala Gly Leu Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His 115 120 125 Arg Leu Pro Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu 130 135 140 Ala Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Ser Leu Leu145 150 155 160Ser Asn Arg Tyr Gly Ser Leu Ser Ser Ser Ile Phe Glu Asn Asn Gly 165 170 175 Arg Ser Gly Ser Phe Leu Val Asp Phe Thr Ala Tyr Pro Asn Leu Thr 180 185 190 Gly Gly Ala Trp Pro Asn Thr Arg Ser Ser Asp Arg Gly Trp Asp Asn 195 200 205 Gln Ser Thr Ala Ser Gly Lys Leu Leu Gln Ser His Trp Leu Asn Ser 210 215 220 Ser Glu Asn Pro Thr Ser Asp Leu Val Leu Gln Gly Ser Val Ala Arg225 230 235 240Gly Ala Asn Tyr Ser Gly Pro Gly Ile Ile Pro Ser Gly Asn Cys Phe 245 250 255 Ser Gly Val Ser Asp Ser Asn Gly Ala Leu Ser Leu Leu Ser Asn Glu 260 265 270 Pro Trp Gly Ser Arg Asn Gln Ser Ser Ser Leu Gly Val Asn Gly Leu 275 280 285 Val Asn Thr Asp Gly Gly His Thr Val His Pro Ser Gly Ser His Ala 290 295 300 Ala Pro Val Asn His Tyr Ser Gly Pro Leu Trp Gly Phe Lys Gly Asn305 310 315 320Glu Ala Ser Ser Ser Ser His Ala Ile Pro Pro Asp Leu Gly Leu Gly 325 330 335 His Ile Ser Gln His Ala Val Asn Gln Tyr Ser Gly Glu Pro Gly Met 340 345 350 Ala Gln His Ser Gly Arg Gln Tyr Met Gly Leu Glu His Ser Lys Gly 355 360 365 Tyr Asn Ser Ser Val Gln Asn Val His Trp Thr Leu 370 375 380 <210> 252 <211> 1254

<212> DNA<213> Oryza sativa<400> 252

atggagatgg ccagtggagg aggcgccgcc gccgccgccg gcggcggagt aggcggcagc 60

ggcggcggtg gtggtggagg ggacgagcac cgccagctgc acggtctcaa gttcggcaag 120

aagatctact tcgaggacgc cgccgcggca gcaggcggcg gcggcactgg cagtggcagt 180

ggcagcgcga gcgccgcgcc gccgtcctcg tcttccaagg cggcgggtgg tggacgcggc 24 0

ggagggggca agaacaaggg gaagggcgtg gccgcggcgg cgccaccgcc gccgccgccg 300

ccgccgcggt gccaggtgga ggggtgcggc gcggatctga gcgggatcaa gaactactac 360

tgccgccaca aggtgtgctt catgcattcc aaggctcccc gcgtcgtcgt cgccggcctc 420

gagcagcgct tctgccagca gtgcagcagg ttccacctgc tgcctgaatt tgaccaagga 480

aaacgcagct gccgcagacg ccttgcaggt cataatgagc gccggaggag gccgcaaacc 540

cctttggcat cacgctacgg tcgactagct gcatctgttg gtgagcatcg caggttcaga 600

agctttacgt tggatttctc ctacccaagg gttccaagca gcgtaaggaa tgcatggcca 660

gcaattcaac caggcgatcg gatctccggt ggtatccagt ggcacaggaa cgtagctcct 720

catggtcact ctagtgcagt ggcgggatat ggtgccaaca catacagcgg ccaaggtagc 780

tcttcttcag ggccaccggt gttcgctggc ccaaatctcc ctccaggtgg atgtctcgca 840

ggggtcggtg ccgccaccga ctcgagctgt gctctctctc ttctgtcaac ccagccatgg 900

gatactacta cccacagtgc cgctgccagc cacaaccagg ctgcagccat gtccactacc 960

accagctttg atggcaatcc tgtggcaccc tccgccatgg cgggtagcta catggcacca 1020

agcccctgga caggttctcg gggccàtgag ggtggtggtc ggagcgtggc gcaccagcta 1080

ccacatgaag tctcacttga tgaggtgcac cctggtccta gccatcatgc ccacttctcc 1140

ggtgagcttg agcttgctct gcaggggaac ggtccagccc cagcaccacg catcgatcct 1200

gggtccggca gcaccttcga ccaaaccagc aacacgatgg attggtctct gtag 1254<210> 253<211> 417<212> PRT

<213> Oryza sativa<400> 253

Met Glu Met Ala Ser Gly Gly Gly Ala Ala Ala Ala Ala Gly Gly Gly1 5 10 15 Val Gly Gly Ser Gly Gly Gly Gly Gly Gly Gly Asp Glu His Arg Gln 20 25 30 Leu His Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu Asp Ala Ala 35 40 45 Ala Ala Ala Gly Gly Gly Gly Thr Gly Ser Gly Ser Gly Ser Ala Ser 50 55 60 Ala Ala Pro Pro Ser Ser Ser Ser Lys Ala Ala Gly Gly Gly Arg Gly65 70 75 80Gly Gly Gly Lys Asn Lys Gly Lys Gly Val Ala Ala Ala Ala Pro Pro 85 90 95 Pro Pro Pro Pro Pro Pro Arg Cys Gln Val Glu Gly Cys Gly Ala Asp 100 105 110 Leu Ser Gly Ile Lys Asn Tyr Tyr Cys Arg His Lys Val Cys Phe Met 115 120 125 His Ser Lys Ala Pro Arg Val Val Val Ala Gly Leu Glu Gln Arg Phe 130 135 140 Cys Gln Gln Cys Ser Arg Phe His Leu Leu Pro Glu Phe Asp Gln Gly145 150 155 160Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg Arg Arg 165 170 175 Arg Pro Gln Thr Pro Leu Ala Ser Arg Tyr Gly Arg Leu Ala Ala Ser 180 185 190 Val Gly Glu His Arg Arg Phe Arg Ser Phe Thr Leu Asp Phe Ser Tyr 195 200 205 Pro Arg Val Pro Ser Ser Val Arg Asn Ala Trp Pro Ala Ile Gln Pro 210 215 220 Gly Asp Arg Ile Ser Gly Gly Ile Gln Trp His Arg Asn Val Ala Pro225 230 235 240His Gly His Ser Ser Ala Val Ala Gly Tyr Gly Ala Asn Thr Tyr Ser 245 250 255 Gly Gln Gly Ser Ser Ser Ser Gly Pro Pro Val Phe Ala Gly Pro Asn 260 265 270 Leu Pro Pro Gly Gly Cys Leu Ala Gly Val Gly Ala Ala Thr Asp Ser275

280

290

295

305

310

325

330

Tyr Met Ala Pro Ser Pro Trp Thr Gly Ser Arg

340

345

Gly Arg Ser Val Ala His Gln Leu Pro His Glu

355

360

370

375

385

390

285Pro Trp Asp 300 Ala Ala Met315 Ser Ala MetArg Gly HisGlu Val Ser 365Phe Ser Gly 380 Ala Pro Arg395 Asn Thr Met

410

405Leu

<210> 254<211> 1182<212> DNA<213> Oryza sativa<400> 254

atggcgaccg gcggcagcgg cggcggcggc ggaggtggaggggctcaagt tcggcaagaa gatctacttc gagcaggacggcggcggtgg agtcgtcgtc gacgtcgtcg ggcggaggcggcggcggcgg cggcgccccc gccgccgctg ccgccgaggtgtggatctga gcggcgtcaa gccgtactac tgccgccacaaaggagccca tcgtcgtcgt cgccggcctc gagcagcgctttccaccaat tacctgaatt tgatcaagaa aaaaaaagctcacaatgaac gccggaggaa gccgacacct ggacctctttgctgcatcct ttcatgaaga gccaggcagg tccagaagctccaagggttc caagcagtgt gagggatgcg tggcctgctatccggttcaa tccagtggca agggggccat gaactccatcggatacagtg atcaccatgc gttcagcagc catggtggctctccaccacc cagcctttga gctcacctca ggtggatgtctccagctgtg ctctctctct tctgtcaact cagccatgggagccacaacc ggtccccgcc aatgtcgtca acggccagcgccggtgtcgc cctcggtcat ggcaagcaac tacatggcggtccagccggg gccatgacgg cgccaggaac gtgcacctgcctgaacgagg tccctccggg ctctgtccac cacggccattgcactgcagg gaggtgcccc gtccaaccgg ccggaagccggccttcagcc actccaccaa tgccatgaac tggtctctgt<210> 255<211> 393<212> PRT

<213> Oryza sativa<400> 255

Met Ala Thr Gly Gly Ser Gly Gly Gly Gly Gly1 5

Thr Thr Thr

Ser Thr Thr320

Ala Gly Ser

335Glu Gly Gly350

Leu Asp Glu

Glu Leu Glu

Ile Asp Pro400

Asp Trp Ser415

gtggtggtgacggcggcgtcgcaagaaggggccaggtggaaggtgtgctatctgccaacagccgcagacgcttctcgctattgtggtagattcagcccagctcaccgcagcagcggctggtcgcgggagtatactacccaccttcggaggcgagccccggcgccaccgcatctccggcgaagcatggctcag

cgatgtccacggcgtcggcggaagggcgtggggttgcggccatgcacgccgtgcagcaggccttgcaggttggccggctttttctcataccgatcgcatgcgcagttgcgggcaccaatgcgccaccgacaagcaccagccggcaacaacctggaacagccggggttgtggctcgagctccggcagcggc

10

Gly

Asp Asp Val His Gly Leu Lys Phe Gly Lys Lys Ile

20 25

Asp Ala Ala Ala Ser Ala Ser Ala Ala Ala Val Glu

35

40

Gly

Tyr

Ser45

Gly

Phe

30

Ser

Gly Gly15

Glu GlnSer Thr

Ser Ser Gly Gly Gly Gly Lys Lys Gly Lys Gly Val Ala Ala Ala Ala 50 55 60 Ala Pro Pro Pro Pro Leu Pro Pro Arg Cys Gln Val Glu Gly Cys Gly65 70 75 80Val Asp Leu Ser Gly Val Lys Pro Tyr Tyr Cys Arg His Lys Val Cys 85 90 95 Tyr Met His Ala Lys Glu Pro Ile Val Val Val Ala Gly Leu Glu Gln 100 105 110 Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Pro Glu Phe Asp

601201802403003604204805406006607207808409009601020108011401182115

120

125

Gln Glu Lys Lys Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg 130 135 140 Arg Arg Lys Pro Thr Pro Gly Pro Leu Ser Ser Arg Tyr Gly Arg Leu145 150 155 160Ala Ala Ser Phe His Glu Glu Pro Gly Arg Ser Arg Ser Phe Val Val 165 170 175 Asp Phe Ser Tyr Pro Arg Val Pro Ser Ser Val Arg Asp Ala Trp Pro 180 185 190 Ala Ile Gln Pro Ser Asp Arg Met Ser Gly Ser Ile Gln Trp Gln Gly 195 200 205 Gly His Glu Leu His Pro His Arg Ser Ala Val Ala Gly Tyr Ser Asp 210 215 220 His His Ala Phe Ser Ser His Gly Gly Ser Ala Ala Gly Ala Pro Met225 230 235 240Leu His His Pro Ala Phe Glu Leu Thr Ser Gly Gly Cys Leu Ala Gly 245 250 255 Val Ala Thr Asp Ser Ser Cys Ala Leu Ser Leu Leu Ser Thr Gln Pro 260 265 270 Trp Asp Thr Thr Gln Ser Thr Ser Ser His Asn Arg Ser Pro Pro Met 275 280 285 Ser Ser Thr Ala Ser Ala Phe Gly Gly Gly Asn Asn Pro Val Ser Pro 290 295 300 Ser Val Met Ala Ser Asn Tyr Met Ala Ala Ser Pro Gly Trp Asn Ser305 310 315 320Ser Ser Arg Gly His Asp Gly Ala Arg Asn Val His Leu Pro Pro Pro 325 330 335 His Gly Val Val Leu Asn Glu Val Pro Pro Gly Ser Val His His Gly 340 345 350 His Phe Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly Gly Ala Pro Ser 355 360 365 Asn Arg Pro Glu Ala Glu His Gly Ser Gly Ser Gly Ala Phe Ser His

370

375

380

Ser Thr Asn Ala Met Asn Trp Ser Leu

385 390

<210> 256

<211> 1119

<212> DNA

<213> Solanum tuberosum<400> 256

atggaactgg gttcagtttc ttcttctggtttgaagtttg gtaagaaaat ctactttggaggaagtgggt cgtcgccggt gaccggagataagaggggga ggggtgggtt ggtgcagggttgtcaggcag atctgagtga tgctaaggctcactctaagt ctcctactgt tgttgttgctagcaggttcc atcaattaac tgaattcgacgcatgccata atgagcgtcg taggaagcctgggaatcttt cttcatcaat atttgaaaatgacttcagct cacaccaaaa tgtcaatgatcaaggatggg atcatcaatc atcagggaaggaaaatgctg ccagtgagct tgttttgcaagttccttctg gagactattt tcctggagtctcaaatcggt cctggggatc aaggaatcgacacattgatg gggtacacac cattcaacctttctcaagcc cttcattgag ttttaaaggacctcctgatc tcggtttggg tcaaatgttacttgggatgg ctcagcatgg tgatggacgatatcatcctt ctgttcagaa tgtgcactgg<210> 257<211> 372<212> PRT

<213> Solanum tuberosum

aattcaagctaatgtgggtggggaacatgcggtcatccactactattcaaggtcttgaaccaggggaaaaccatctggataatagcagcaagttcatggcttccttcaacggttcagctatcagattcaatctccaagtctcaggttctcaatgaagctacaagcttctgcaatacatggactctttga

catctgattcttggagttcacaccggctccctaggtgtcaggcataaagtagaggttttgggagttgccgctcttttctcgatccggaagcaaatactcggtccttggctccaggaccaggtggtgctctttggggttaaatggtgcaccgcagcagttcataatccataaactggacca

tttgaatggtggtcaagaatggcgacgactagttgaaggtttgtggtatgccaacagtgtcaggagactgtacacactacctttctggtcagcatctgaagaataactctttatcctagtctctcttctgcagccaagtttaccaatcacacatgagatgctgtggcgaggtccaagggt

60120180240300360420480540600660720780840900960102010801119<400> 257

Met Glu Leu Gly Ser Val Ser Ser Ser Gly Asn Ser Ser Ser Ser Asp15 10 15

Ser Leu Asn Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Gly Asn Val

20 25 30

Gly Val Gly Val Gln Val Lys Asn Gly Ser Gly Ser Ser Pro Val Thr

35 40 45

Gly Asp Gly Asn Met Pro Pro Ala Pro Ala Thr Thr Lys Arg Gly Arg

50 55 60

Gly Gly Leu Val Gln Gly Gly His Pro Pro Arg Cys Gln Val Glu Gly65 70 75 80

Cys Gln Ala Asp Leu Ser Asp Ala Lys Ala Tyr Tyr Ser Arg His Lys

85 90 95

Val Cys Gly Met His Ser Lys Ser Pro Thr Val Val Val Ala Gly Leu

100 105 110

Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Thr Glu

115 120 125

Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Cys His Asn

130 135 140

Glu Arg Arg Arg Lys Pro Pro Ser Gly Ser Leu Phe Ser Thr His Tyr145 150 155 160

Gly Asn Leu Ser Ser Ser Ile Phe Glu Asn Asn Ser Ser Arg Ser Gly

165 170 175

Ser Phe Leu Val Asp Phe Ser Ser His Gln Asn Val Asn Asp Ser Ser

180 185 190

Trp Pro Asn Thr Arg Ala Ser Glu Gln Gly Trp Asp His Gln Ser Ser

195 200 205

Gly Lys Phe Leu Gln Arg Pro Trp Leu Asn Asn Ser Glu Asn Ala Ala

210 215 220

Ser Glu Leu Val Leu Gln Gly Ser Ala Thr Arg Thr Ser Tyr Pro Ser225 230 235 240

Val Pro Ser Gly Asp Tyr Phe Pro Gly Val Ser Asp Ser Ser Gly Ala

245 250 255

Leu Ser Leu Leu Ser Asn Arg Ser Trp Gly Ser Arg Asn Arg Ser Pro

260 265 270

Ser Leu Gly Val Asn Ser Gln Val His Ile Asp Gly Val His Thr Ile

275 280 285

Gln Pro Ser Gly Ser His Gly Ala Pro Thr Asn His Phe Ser Ser Pro

290 295 300

Ser Leu Ser Phe Lys Gly Asn Glu Ala Ser Ser Ser Ser His Glu Met305 310 315 320

Pro Pro Asp Leu Gly Leu Gly Gln Met Leu Gln Ala Ser Asp Asn Pro

325 330 335

Tyr Cys Gly Glu Leu Gly Met Ala Gln His Gly Asp Gly Arg Gln Tyr

340 345 350

Met Glu Leu Asp Gln Ser Lys Gly Tyr His Pro Ser Val Gln Asn Val

355 360 365

His Trp Thr Leu

370<210> 258<211> 1140<212> DNA

<213> Vitis vinifera<400> 258

atggaaaggg gttcgagctc tttgaccgtt tccagctctt cggccaactc gtctgagtcg 60ctcaacgggt tgaaatttgg gcagaagata tattttgaag atttgggcgt tggagctccg 120gccaaatcgg gaaccggctc ctcctcctcc tcctctgccg ccggctccgg tggtcgccca 180cctccggcgc cgccaaagaa ggtaagaggt agtggggttg ttcagggagg ccaaccaccg 240aggtgtcaag ttgaagggtg taaactagat ctgagtgatg ccaaagctta ctattcaagg 300cataaagtgt gtggtatgca ttcgaagtct ccaacggtca ttgttgcggg ccttgagcag 360aggttttgcc agcagtgtag cagatttcat cagcttgccg aatttgacca aggaaaacga 420agttgtcgta ggcgcctggc tggtcataat gagcgtcgca ggaagccacc acctggatct 480ttattgtcct cacgctatgg gcgactttct tcatccattt ttgaaaacag cagcagggtg 540ggaggaggct ttctgatgga ctttgctgca tacccaaggc atcccgagag ggatacttgg 600ccaactacaa gagcatctga tcgggtacct ggaaatcaaa ccactgcgat gggaaggttt 660cttccacatc catggcagag caactctgag aatcctctct ttctgcaagg ttcagccggc 720gggaccagct ttcatggtcc tggaattcct tcaggagaat gtttcacagg ggcctccgac 780tcaagctgtg ctctctctct tctgtcaaat cagccatgga gctccaggaa tcgagcatct 840ggtcttggag caaacagctt catgaatcct gaaggggcat ccatggcgca acccacagct 900cctcatagtg cagctatcaa tcacttccca agcacctcgt gggatttcaa gggcaatgaa 960ggtagtagca gttcgcagga gatgccacct gatcttggtc ttggtcaaat ttcacagcct 1020attaatagcc agttctcagg tgggggcgag ttgccccaac agagtggaag gcaatacatg 1080gaactcgagc actccagggc ttatgacact tccactcagc agatgcactg gtcactttag 1140<210> 259<211> 379<212> PRT<213> Vitis vinifera<400> 259

Met Glu Arg Gly Ser Ser Ser Leu Thr Val Ser Ser Ser Ser Ala Asn15 10 15

Ser Ser Glu Ser Leu Asn Gly Leu Lys Phe Gly Gln Lys Ile Tyr Phe

20 25 30

Glu Asp Leu Gly Val Gly Ala Pro Ala Lys Ser Gly Thr Gly Ser Ser

35 40 45

Ser Ser Ser Ser Ala Ala Gly Ser Gly Gly Arg Pro Pro Pro Ala Pro

50 55 60

Pro Lys Lys Val Arg Gly Ser Gly Val Val Gln Gly Gly Gln Pro Pro65 70 75 80

Arg Cys Gln Val Glu Gly Cys Lys Leu Asp Leu Ser Asp Ala Lys Ala

85 90 95

Tyr Tyr Ser Arg His Lys Val Cys Gly Met His Ser Lys Ser Pro Thr

100 105 110

Val Ile Val Ala Gly Leu Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg

115 120 125

Phe His Gln Leu Ala Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg

130 135 140

Arg Leu Ala Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Ser145 150 155 160

Leu Leu Ser Ser Arg Tyr Gly Arg Leu Ser Ser Ser Ile Phe Glu Asn

165 170 175

Ser Ser Arg Val Gly Gly Gly Phe Leu Met Asp Phe Ala Ala Tyr Pro

180 185 190

Arg His Pro Glu Arg Asp Thr Trp Pro Thr Thr Arg Ala Ser Asp Arg

195 200 205

Val Pro Gly Asn Gln Thr Thr Ala Met Gly Arg Phe Leu Pro His Pro

210 215 220

Trp Gln Ser Asn Ser Glu Asn Pro Leu Phe Leu Gln Gly Ser Ala Gly225 230 235 240

Gly Thr Ser Phe His Gly Pro Gly Ile Pro Ser Gly Glu Cys Phe Thr

245 250 255

Gly Ala Ser Asp Ser Ser Cys Ala Leu Ser Leu Leu Ser Asn Gln Pro

260 265 270

Trp Ser Ser Arg Asn Arg Ala Ser Gly Leu Gly Ala Asn Ser Phe Met

275 280 285

Asn Pro Glu Gly Ala Ser Met Ala Gln Pro Thr Ala Pro His Ser Ala

290 295 300

Ala Ile Asn His Phe Pro Ser Thr Ser Trp Asp Phe Lys Gly Asn Glu305 310 315 320

Gly Ser Ser Ser Ser Gln Glu Met Pro Pro Asp Leu Gly Leu Gly Gln

325 330 335

Ile Ser Gln Pro Ile Asn Ser Gln Phe Ser Gly Gly Gly Glu Leu Pro

340 345 350

Gln Gln Ser Gly Arg Gln Tyr Met Glu Leu Glu His Ser Arg Ala Tyr

355 360 365

Asp Thr Ser Thr Gln Gln Met His Trp Ser Leu370 375<210> 260<211> 1209<212> DNA<213> Zea mays<400> 260

atggagtccg gcggtggcgg ggacgaccagtacttcgagg acgccgccgg ctccagcagcgcgcctccag cgacgcagca gccgtcgccgggcggcagga ggggcagggc cgcggccggcgcgcgctgcc aggtcgacgg ctgcaacgtttgccgccaca aggtgtgcaa aatgcactccgagcagcgct tctgccagca gtgcagcaggaagaagagct gccgcaaacg cctcgcaggcggaccccttg cgtcacgata cggccgtcacagaagcttca tgctggattt ctcgtacccgcccgcggtga gggccggtgg tgaaagggtggatcctcgtc accaccaagg cgcggtcgcgggtagctcgt cgtcggcgag gccgccggtgtgccttgcag gagtccccgc ggactccagctgggatgctg cccacagcca cagccacagcggcagccctg tggcgccctc cctcatggcgaccgagaccg actcctgggg ccacgaaggcgacgtccccc tcggcgaggt gcactccggcgagctcgagc tcgccctgca gggaaacaggccgcgcaata atcagggctc cgcgggcacgtcgctctag<210> 261<211> 402<212> PRT<213> Zea mays<400> 261

Met Glu Ser Gly Gly Gly Gly Asp Asp Gln Leu His Gly Leu Lys Phe

1 5 10 15 Gly Lys Lys Ile 20 Tyr Phe Glu Asp Ala 25 Ala Gly Ser Ser Ser 30 Gly SerSer Ser Gly 35 Gly Gly Ser Ala Pro 40 Ala Pro Pro Ala Thr 45 Gln Gln ProSer Pro Pro Ala Ala Ser Pro Arg Ala Pro Ala Gly Gly Gly Arg Arg 50 55 60 Gly Arg Ala Ala Ala Gly Gly Ala Gly Pro Ser Thr Ala Pro Ala Pro65 70 75 80Ala Arg Cys Gln Val 85 Asp Gly Cys Asn Val 90 Asp Leu Thr Asp Val 95 LysPro Ala Tyr Tyr 100 Cys Arg His Lys Val 105 Cys Lys Met His Ser 110 Lys GluPro Arg Val 115 Leu Val Asn Gly Leu 120 Glu Gln Arg Phe Cys 125 Gln Gln CysSer Arg 130 Phe His Gln Leu Pro 135 Glu Phe Asp Gln Leu 140 Lys Lys Ser CysArg Lys Arg Leu Ala Gly His Asn Glu Arg Arg Arg Arg Pro Pro Pro145 150 155 160Gly Pro Leu Ala Ser 165 Arg Tyr Gly Arg His 170 Ala Ala Ser Leu Gly 175 GluPro Gly Arg Leu 180 Arg Ser Phe Met Leu 185 Asp Phe Ser Tyr Pro 190 Arg ValSer Ser Ala 195 Met Arg Gly Gly Phe 200 Pro Ala Val Arg Ala 205 Gly Gly GluArg Val 210 Pro Gly Gly Ile Gln 215 Trp Gln Ala Gly Leu 220 Asp Pro Arg HisHis Gln Gly Ala Val Ala Gly Tyr Gly Ala His Tyr Gly Ser Glu Gly225 230 235 240Gly Ser Ser Ser Ser 245 Ala Arg Pro Pro Val 250 Phe Pro Gly Pro Glu 255 Leu

ctgcacggcc tcaagttcgg caagaagatc 60ggcagcagca gcggcggtgg cagcgcgccc 120ccggccgctt cgcctagggc cccggccggc 180ggcgcgggcc cctcgacggc gcccgcgccc 240gacctcaccg acgtcaagcc cgcctactac 300aaggagcccc gcgtcctcgt caacggcctc 360ttccaccagc tgcctgaatt cgaccagcta 420cacaacgagc gccggaggag gccgccgcct 480gctgcgtcgc tcggcgagcc cggcaggctc 540agggtctcaa gcgccatgag gggtgggttt 600cctggcggga tccagtggca agcgggcttg 660ggatacggcg cccactatgg gagcgagggt 720ttccctggcc cggagctgcc cccaggtgga 780tgtgctctct ctcttctgtc aactcagcca 840cacgctgcgc caacagcggg tttcgacggc 900gcgagtagct acatcgcgcc gagcccctgg 960gggcggagcg tgcctcagct gccacctgac 1020tcgagcagcc accacggcca gttctcaggt 1080ccagcgccag ggtcggcggc accgccagcg 1140ttcgaccagg ctggcaacac gatggactgg 1200 1209Pro Pro Gly Gly Cys Leu Ala Gly Val Pro Ala Asp Ser Ser Cys Ala

260 265 270

Leu Ser Leu Leu Ser Thr Gln Pro Trp Asp Ala Ala His Ser His Ser

275 280 285

His Ser His Ala Ala Pro Thr Ala Gly Phe Asp Gly Gly Ser Pro Val

290 295 300

Ala Pro Ser Leu Met Ala Ala Ser Ser Tyr Ile Ala Pro Ser Pro Trp305 310 315 320

Thr Glu Thr Asp Ser Trp Gly His Glu Gly Gly Arg Ser Val Pro Gln

325 330 335

Leu Pro Pro Asp Asp Val Pro Leu Gly Glu Val His Ser Gly Ser Ser

340 345 350

Ser His His Gly Gln Phe Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly

355 360 365

Asn Arg Pro Ala Pro Gly Ser Ala Ala Pro Pro Ala Pro Arg Asn Asn

370 375 380

Gln Gly Ser Ala Gly Thr Phe Asp Gln Ala Gly Asn Thr Met Asp Trp385 390 395 400

Ser Leu

<210> 262<211> 1137<212> DNA<213> Zea mays<400> 262

atggcgaccg gcggcggcag cagcaggagc gacgacgtgc gcgggctcaa gtttggcaag 60aagatctact tcgagcagga cggcgggagc gggagcgggg cgggggcggt gggcggcagg 120aaggggaagg gcgtggccac cggtggcgcg aggccggcgt ccgccgcctc cgcagcccag 180ccgccgaggt gccaggtgga cgggtgcggc gtggatctga gcgccgtcaa gcagtactac 240tgccggcaca aggtgtgcaa catgcactcc aaggagccgc gcgtcttcgt cgccggcatc 300gagcagcgct tctgccaaca gtgcagcagg ttccaccagc tacatgaatt tgaccaaggg 360aaacgtagct gccgccgccg cctcatcggt cacaacgagc gccggaggaa gccaccacct 420ggacctctca cttcacgata tggccggctc gctgcatcac ttcaagagcc tggcaggttc 480agaagcttcc tgctcgactt ctcgtaccca agggttccaa gcagcgtgag ggatgcgtgg 54 0ccaggaatcc agcacggtgg cgacaggatg ctgggcaccg tccagtggca tgggcaccaa 600gaacctcctc acccacaccg cagtgcagct gctggctatg gcaaccatgc tgcatacaac 660tgccatggcg gcttggtagc aggcggggcc ccaatgctct cctctgccgc ctttgagctc 720ccgcctggcg gatgtgtcgc gggagttgcc gccgactcca gctgtgctct ctctcttctg 780tcaactcagc catgggacac gacctcccac gaccaccggt ccccagcaat gcccgcggcc 840ggcgccttcg acggcacccc ggtggcgccg tccgtcatgg cgagcagcta cgcggcgtcg 900agcgcctgga cgggctcgcg ggaccccgct gccgacggcg ccaggaacgc gcagcgtctc 960gacgatgctc tgcacctggt ccacccaggc tccgcggcgg tccacttctc cggcgagctc 1020gagctcgccc tgcagggaag cggcgggccg ccacacctgc cgcgcgtcga ccatggcggc 1080tccggcggcg gcaccttcaa ccattccacc accagcgcga tgaactggtc cctgtag 1137

<210> 263<211> 378<212> PRT<213> Zea mays<400> 263

Met Ala Thr Gly Gly Gly Ser Ser1 5

Lys Phe Gly Lys Lys Ile Tyr Phe20

Gly Ala Gly Ala Val Gly Gly Arg

35 40

Gly Ala Arg Pro Ala Ser Ala Ala

50 55

Gln Val Asp Gly Cys Gly Val Asp65 70

Cys Arg His Lys Val Cys Asn Met85

Val Ala Gly Ile Glu Gln Arg Phe100

Arg Ser Asp Asp Val Arg Gly Leu

10 15

Glu Gln Asp Gly Gly Ser Gly Ser25 30

Lys Gly Lys Gly Val Ala Thr Gly45

Ser Ala Ala Gln Pro Pro Arg Cys60

Leu Ser Ala Val Lys Gln Tyr Tyr

75 80

His Ser Lys Glu Pro Arg Val Phe

90 95

Cys Gln Gln Cys Ser Arg Phe His105 110Gln Leu His Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu

115 120 125

Ile Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Pro Leu Thr

130 135 140

Ser Arg Tyr Gly Arg Leu Ala Ala Ser Leu Gln Glu Pro Gly Arg Phe145 150 155 160

Arg Ser Phe Leu Leu Asp Phe Ser Tyr Pro Arg Val Pro Ser Ser Val

165 170 175

Arg Asp Ala Trp Pro Gly Ile Gln His Gly Gly Asp Arg Met Leu Gly

180 185 190

Thr Val Gln Trp His Gly His Gln Glu Pro Pro His Pro His Arg Ser

195 200 205

Ala Ala Ala Gly Tyr Gly Asn His Ala Ala Tyr Asn Cys His Gly Gly

210 215 220

Leu Val Ala Gly Gly Ala Pro Met Leu Ser Ser Ala Ala Phe Glu Leu225 230 235 240

Pro Pro Gly Gly Cys Val Ala Gly Val Ala Ala Asp Ser Ser Cys Ala

245 250 255

Leu Ser Leu Leu Ser Thr Gln Pro Trp Asp Thr Thr Ser His Asp His

260 265 270

Arg Ser Pro Ala Met Pro Ala Ala Gly Ala Phe Asp Gly Thr Pro Val

275 280 285

Ala Pro Ser Val Met Ala Ser Ser Tyr Ala Ala Ser Ser Ala Trp Thr

290 295 300

Gly Ser Arg Asp Pro Ala Ala Asp Gly Ala Arg Asn Ala Gln Arg Leu305 310 315 320

Asp Asp Ala Leu His Leu Val His Pro Gly Ser Ala Ala Val His Phe

325 330 335

Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly Ser Gly Gly Pro Pro His

340 345 350

Leu Pro Arg Val Asp His Gly Gly Ser Gly Gly Gly Thr Phe Asn His

355 360 365

Ser Thr Thr Ser Ala Met Asn Trp Ser Leu

370 375

<210> 264<211> 403<212> DNA

<213> Sorghum propinquum<400> 264

atggagtccg gtggcgccag tggcggcggc ggcggggacg accagctgca cggcctcaag 60ttcggcaaga agatctactt cgaggacgcc gccgcggtcg gctccagcag cggtggcggt 120ggcggtggca gtggcagtgc tagcgcgacc cccgcgcctc cagcgacgca gcagccgtcc 180ccgccgcagg ccgcttcgcc cagggcagcc agcggcggcg gcggcaggag gggcagggcc 240gcgggcggcc cctccccggc gcccgcgccc gcgcgctgcc aggtcgacgg ctgcaacgtg 300gacctcaccg acgtcaagcc ctactactgc cgccacaagg tctgcaaaat gcactccaag 360gagccccgcg tcgtcgtcaa cggcctcgag cagcgcttct gcc 403

<210> 265<211> 134<212> PRT

<213> Sorghum propinquum<400> 265

Met Glu Ser Gly Gly Ala Ser Gly Gly Gly Gly Gly Asp Asp Gln Leu15 10 15

His Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu Asp Ala Ala Ala

20 25 30

Val Gly Ser Ser Ser Gly Gly Gly Gly Gly Gly Ser Gly Ser Ala Ser

35 40 45

Ala Thr Pro Ala Pro Pro Ala Thr Gln Gln Pro Ser Pro Pro Gln Ala

50 55 60

Ala Ser Pro Arg Ala Ala Ser Gly Gly Gly Gly Arg Arg Gly Arg Ala65 70 75 80

Ala Gly Gly Pro Ser Pro Ala Pro Ala Pro Ala Arg Cys Gln Val Asp85 90 95Gly Cys Asn Val Asp Leu Thr Asp Val Lys Pro

100 105

Lys Val Cys Lys Met His Ser Lys Glu Pro Arg

115 120

Leu Glu Gln Arg Phe Cys

130<210> 266<211> 732<212> DNA<213> Allium cepa<400> 266

atggaaatgg gttcgagctc tgagccaatt tctgactctcgaaaaaattt actttgaaga ttccactacc agtactgcaagctgctcctc ccaaaaaggg aaaatcttta gcttcttcgtcagcaacaaa taagcatacc tagatgccag gttgaaggatgctaaagcct attactgcag gcataaggtt tgcggagttcgtggttgctg gaattgaaca gaggttttgt cagcagtgcagaatttgacc aaggaaaaag aagctgccgc agacgcctagagaaagccgc ctccaggccc ttcccgttat ggaaggatgtagtaacagat tcagaggatt cctgatggac ttcagttaccccaggagatc atctatggcc tagactgtcc aacattccatactgcatcta acattcatgt tgctcaaccg tacatgcatggagcttccac acaggaatac atggtctggc gtctgcgactctgtcactca ac<210> 267<211> 244<212> PRT<213> Allium cepa<400> 267

Met Glu Met Gly Ser Ser Ser Glu Pro Ile Ser1 5 10

Tyr Tyr Cys Arg His110

Val Val Val Asn Gly125

tcgatgggct cacattcggcgtactactag caatacaattccactaatat caactctaat

gcaaagttgaattcaaaatcgcaggttccactggacacaacatcatctgtcgaggcccatcatacccagccaatgaatcatgagctgtgc

tttgactggaaccaaaagttccagttgcaatgagcgtcgtctatgatggcacagcctcctaaacccaaacctacagttcctctctctctt

Asp Ser

Leu Thr Phe Gly Glu Lys Ile Tyr Phe Glu Asp Ser Thr

20

25

Ala Ser Thr Thr Ser Asn Thr Ile Ala Ala Pro

35

40

Ser Leu Ala Ser Ser Ser Thr Asn Ile Asn Ser

50

55

Ser Ile Pro Arg Cys Gln Val Glu Gly Cys Lys

Pro Lys45

Asn Gln60

Val Asp

65

70

75

Ala Lys Ala Tyr Tyr Cys Arg His Lys Val Cys Gly Val

85 90

Ser Pro Lys Val Val Val Ala Gly Ile Glu Gln Arg Phe

100

105

Cys Ser Arg Phe His Gln Leu Gln Glu Phe Asp

115

120

Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg

130

135

Pro Gly Pro Ser Arg Tyr Gly Arg Met Ser Ser

145

150

155

Ser Asn Arg Phe Arg Gly Phe Leu Met Asp Phe

165 170

Ile Gln Pro Pro Pro Gly Asp His Leu Trp Pro

180 185

Pro Ser Tyr Pro Ala Asn Pro Asn Thr Ala Ser

195 200

Gln Pro Tyr Met His Ala Met Asn His Tyr Ser

210 215

Arg Asn Thr Trp Ser Gly Val Cys Asp Leu Ser225 230 235

Leu Ser Leu Asn

Gln Gly125Arg Arg140

Ser Val

Ser Tyr

Arg Leu

Asn Ile205Ser Glu220

Cys Ala

Leu Asp Gly15

Thr Ser Thr30

Lys Gly Lys

Gln Gln Ile

Leu Thr Gly80

His Ser Lys95

Cys Gln Gln110

Lys Arg Ser

Lys Pro Pro

Tyr Asp Gly160

Pro Arg Pro175

Ser Asn Ile190

His Val Ala

Leu Pro His

Leu Ser Leu240

60120180240300360420480540600660720732

<210> 268<211> 969<212> DNA

<213> Antirrhinum majus<400> 268

tcagctgctg gtggagcaga ggaatctctc aatgggttga agtttggcaa gaaaatatac 60

tttgaggagg ctaaggcaaa gaaagggaag agtaccggtg gggtggttag gtgccaggtg 120

gaggggtgtg aggtagatct gagtgatgct aaggcttact atttgagaca caaagtttgt 180

agtatgcatt caaagtctcc aaaggtcatt gttgctggaa tagaacaaag gttttgccag 240

cagtgcagca ggttccatca attgcctgaa tttgaccaag gaaaacggag ttgccgcaga 300

cgccttgcag gccacaacga acgtcggagg aagccatctc caggatctat gatgtctcct 360

tactatggaa gtctttctcc aaccttattt gataaccaaa atagaactgg aggctttttg 420

atggacttca gcacttaccc aaatctcgct gggaaagatt catggccaaa tacaataccc 480

gaacgaggat tgggaggtcc agcaagtcca tggcagagcg acatgcaaaa tcctgtacct 540

gagtttttgc gaggtacaac aaataggcca agtttttctg gtcttggagt atcttccgaa 600

gaatgtttta gcggagtctc taattccagc actgctctct ctcttctgtc aaatcagtcc 660

tggggctcca gaaactcgaa caattttctt ggtaccaatg gaaacgggcc aaccatagtt 720

cagccgtcta ttaaccctgg tgccacaatt ggacagttta cctgtccctc ttggggtttt 780

ggaggcaacc cagctgataa cacctcccat gatatgcctc ccaatctgaa tttaggacaa 840

ttttctcact ccagtaacag tcactatact ggagagcctg gggtagtcca actgagccac 900

ggacaattcc aggacctcga tcactcaaga ggctatgatt cttccgttca ggacatgcat 960

tggtcactt 969<210> 269<211> 323<212> PRT

<213> Antirrhinum majus<400> 269

20

25

35

40

50

55

65

70

85

100

105

115

120

130

135

145

150

165

Asn Pro Val Pro Glu Phe Leu Arg Gly Thr Thr

180

185

Ser Gly Leu Gly Val Ser Ser Glu Glu Cys Phe

195

200

Ser Ser Thr Ala Leu Ser Leu Leu Ser Asn Gln

210

215

Asn Ser Asn Asn Phe Leu Gly Thr Asn Gly Asn

225

230

Gln Pro Ser Ile Asn Pro Gly Ala Thr Ile Gly245

260

265

275

280

290

295

Leu Asn Gly Leu Lys Phe Gly10 15 Ala Lys Lys Gly Lys Ser Thr 30 Gly Cys Glu Val â R Asp Leu SerLys Val Cys Ί -J Ser Met His Ser 60 Ile Glu Gln Arg Phe Cys Gln 75 80Glu Phe Asp Gln Gly Lys Arg90 95 Asn Glu Arg Arg Arg Lys Pro 110 Tyr Gly Ser Leu Ser Pro Thr 125 Gly Phe Leu Met Asp Phe Ser 140 Ser Trp Pro Asn Thr Ile Pro 155 160Pro Trp Gln Ser Asp Met Gln170 175 Thr Thr Asn Arg Pro Ser Phe 190 Cys Phe Ser Gly Val Ser Asn 205 Asn Gln Ser Trp Gly Ser Arg 220 Gly Asn Gly Pro Thr Ile Val 235 240Ile Gly Gln Phe Thr Cys Pro250 255 Asp Asn Thr Ser His Asp Met 270 Ser His Ser Ser Asn Ser His 285 Leu Ser His Gly Gln Phe Gln 300Asp Leu Asp His Ser Arg Gly Tyr Asp Ser Ser Val Gln Asp Met His305 310 315 320

Trp Ser Leu

<210> 270<211> 633

<212> DNA

<213> Brassica napus<400> 270

gacttggaga aaagaagttg tagaagacgt ctagcttgtcccccaagcaa caacagcagc tcttttggct tctggttacttacggaagcg ttttgggaga tcctacaacg tggtcaaccgtccgcaccgt gggatagcca tcaactgatg aacgttttgtagtataacat acccagagat ggtgaacaat aatagcacagcttctgtcaa actcaaacac aactcagcag cagcagcagaatggacgcag aaagggttac aatggctaag tcaccgcctgtcgaaacaaa cctgggagtt catgtcaggc gaaaagagcacctgttttgg gactgagaca aatctctgag ccagatgatgaatggcacca caatgggtgg attcgagctg aacctacagctactcttcta ctcaaaattt tacttggcct ctt

<210> 271<211> 211<212> PRT

<213> Brassica napus<400> 271

ataacgaaagctagaatcgccaagatctgtcacagggaagactcaagctgcatcaaccaatttcagtacaattggccttgacctccagttaggagcaggt

aagaagaaagtccatctcttgatgggacggttcaaggttttgctctctcttgcttacttgcaatcagtactgtgtcgtcccctgatgagctctgaggcaa

Asp Leu Glu Lys Arg Ser Cys Arg Arg Arg Leu Ala Cys His Asn Glu1 5 10 15 Arg Arg Arg Lys 20 Pro Gln Ala Thr Thr 25 Ala Ala Leu Leu Ala 30 Ser GlyTyr Ser Arg 35 Ile Ala Pro Ser Leu 40 Tyr Gly Ser Val Leu 45 Gly Asp ProThr Thr 50 Trp Ser Thr Ala Arg 55 Ser Val Met Gly Arg 60 Ser Ala Pro TrpAsp Ser His Gln Leu Met Asn Val Leu Ser Gln Gly Ser Ser Arg Phe65 70 75 80Ser Ile Thr Tyr Pro 85 Glu Met Val Asn Asn 90 Asn Ser Thr Asp Ser 95 SerCys Ala Leu Ser 100 Leu Leu Ser Asn Ser 105 Asn Thr Thr Gln Gln 110 Gln GlnGln Thr Ser 115 Thr Asn Ala Tyr Leu 120 Met Asp Ala Glu Arg 125 Val Thr MetAla Lys 130 Ser Pro Pro Val Ser 135 Val His Asn Gln Tyr 140 Ser Lys Gln ThrTrp Glu Phe Met Ser Gly Glu Lys Ser Asn Trp Pro Cys Val Ser Ser145 150 155 160Pro Val Leu Gly Leu 165 Arg Gln Ile Ser Glu 170 Pro Asp Asp Asp Leu 175 GlnPhe Leu Met Ser 180 Asn Gly Thr Thr Met 185 Gly Gly Phe Glu Leu 190 Asn LeuGln Gln Glu 195 Gln Val Leu Arg Gln 200 Tyr Ser Ser Thr Gln 205 Asn Phe Thr

Trp Pro Leu210<210> 272<211> 852<212> DNA

<213> Saccharum officinarum<400> 272

ctcgtcgtca acggcctcga gcagcgcttc tgccagcagtcctgaatttg accaactaaa gaaaagctgc cgcagacgtccggaggaggc cacctcctgg acctcttgca tcacgatatgggtgagcccg gcaggttccg aagctttatg ttggatttctaccatgaggg atgggtttcc ggcagttcga cctggcgaaa

gcagcaggttttgcaggccagtcgccttgccatacccaaggggtgcctgg

ccaccagctgcaatgaacgctgcatcatttggttccaggctagtatccag

60120180240300360420480540600633

60120180240300tggcaagcgg gcttagatcc tcatcatcat caaagcgcggtcatatggga gccagggtag ctcgtcgtcg tcaaggccacctccccccag gtggatgtct tgcaggagtc ccctcggactctgtcaactc agccatggga tactacccac agcgccggcccctgcaacag caggttttga cggcaaccct gtggcaccctattgcgccaa gcccctggac tgactcccgg ggccatgaagttgccacctg acgtccccct cagcgaggtg cactctggctttctcaggtg agctcgagct tgccctgcag ggaaacaggcgcgccgcgca atgatcaggg ctccacgggc acgttcgacctggtcgctct ag<210> 273<211> 283<212> PRT

<213> Saccharum officinarum<400> 273

Leu Val Val Asn Gly Leu Glu Gln Arg Phe Cys15 10

Phe His Gln Leu Pro Glu Phe Asp Gln Leu Lys

20 25

Arg Leu Ala Gly His Asn Glu Arg Arg Arg Arg

35 40

Leu Ala Ser Arg Tyr Gly Arg Leu Ala Ala Ser

50 55

Arg Phe Arg Ser Phe Met Leu Asp Phe Ser Tyr65 70 75

Thr Met Arg Asp Gly Phe Pro Ala Val Arg Pro

tcgcaggatacggtgttcccctagctgtgcacagccatgcccctcatggcgcgggcggaacaagcagccacagcaccaggagtccggcaa

cggtgcccactggtccagagtctctctctttggatcaatggagtagctaccgtgcctcagtcacggccaggtcagcgccacacaatggac

60

85

90

Gly Ser Ile Gln Trp Gln Ala Gly Leu Asp Pro

100

105

Ala Val Ala Gly Tyr Gly Ala His Ser Tyr Gly

115

120

140

Cys Ala

Ser Ser Ser Arg Pro Pro Val Phe Pro Gly Pro

130 135

Gly Cys Leu Ala Gly Val Pro Ser Asp Ser Ser145 150 155

Leu Ser Thr Gln Pro Trp Asp Thr Thr His Ser Ala Gly

Gly Asn

Gln Cys Ser Arg 15 Ser Cys Arg Arg 30 Pro Pro Gly Pro45 Gly Glu Pro GlyArg Val Pro Gly 80Glu Arg Val Pro 95 His His Gln Ser 110 Gln Gly Ser Ser125 Leu Pro Pro Gly

165

170

Ala Gly Ser Met Pro Ala Thr Ala Gly Phe Asp

180 185

Pro Ser Leu Met Ala Ser Ser Tyr Ile Ala Pro Ser Pro195 200 205

Ser Arg Gly His Glu Gly Gly Arg Asn Val Pro Gln Leu

210 215 220

Val Pro Leu Ser Glu Val His Ser Gly Ser Ser Ser His225 230 235

Phe Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly Asn Arg

245 250

Gly Ser Ala Pro Ala Pro Arg Asn Asp Gln Gly Ser Thr

260 265

Asp Gln Ser Gly Asn Thr Met Asp Trp Ser Leu

275 280

<210> 274<211> 647<212> DNA

<213> Festuca arundinacea<400> 274

ggcacgaggg tggatctgag cggctccaag acctactact gccgccacaaatgcactcca aggcgccccg cgtcgtcgtc gccggcctcg agcagcgctttgcagcaggt tccaccagtt gcctgaattt gacaatggaa aacgcagctgctcgcaggtc acaatgaacg ccgtaggaag ccgcctcctg gccctctggcggccgactcg ctgcatcctt tgaagaaccg ggcaggtaca gaagctttcttcctacccaa gggttccgag cagcgtgcgg gatgcttggc ctgcagttcgcgtatgccca gtgaaatcca gtggcaaggg aacctagacc tgcgtcctca

Leu Ser Leu160

His Ser His

175Pro Val Ala190

Trp Thr Asp

Pro Pro Asp

His Gly Gln240

Pro Ala Pro

255Gly Thr Phe270

ggtctgctccctgccagcagccgcagacgtgtcacgctatgttagatttcaccaggctaccacgggttat

360420480540600660720780840852

60120180240300360420ggcccacatg catatggcag ccacggcttc cccggtccag agctccctcc aggcgggtgt 4 80ctcacagggg tcgccaccga ctccagctgt gctctctctc ttctgtcaac tcagccatgg 540gataccacca cccacggtgc cagccacgac catcggtctg cggccatgtc cgcggccgcg 600ggcttcgacg gcagccctgc ggcagtgtca ccctccatca tggcgag 647

<210> 275<211> 215<212> PRT

<213> Festuca arundinacea<400> 275

Gly Thr Arg Val Asp Leu Ser Gly Ser Lys Thr Tyr Tyr Cys Arg His1 5 10 15 Lys Val Cys Ser 20 Met His Ser Lys Ala 25 Pro Arg Val Val Val 30 Ala GlyLeu Glu Gln 35 Arg Phe Cys Gln Gln 40 Cys Ser Arg Phe His 45 Gln Leu ProGlu Phe 50 Asp Asn Gly Lys Arg 55 Ser Cys Arg Arg Arg 60 Leu Ala Gly HisAsn Glu Arg Arg Arg Lys Pro Pro Pro Gly Pro Leu Ala Ser Arg Tyr65 70 75 80Gly Arg Leu Ala Ala Ser Phe Glu Glu Pro Gly Arg Tyr Arg Ser Phe 85 90 95 Leu Leu Asp Phe 100 Ser Tyr Pro Arg Val 105 Pro Ser Ser Val Arg 110 Asp AlaTrp Pro Ala 115 Val Arg Pro Gly Tyr 120 Arg Met Pro Ser Glu 125 Ile Gln TrpGln Gly 130 Asn Leu Asp Leu Arg 135 Pro His Thr Gly Tyr 140 Gly Pro His AlaTyr Gly Ser His Gly Phe Pro Gly Pro Glu Leu Pro Pro Gly Gly Cys145 150 155 160Leu Thr Gly Val Ala 165 Thr Asp Ser Ser Cys 170 Ala Leu Ser Leu Leu 175 SerThr Gln Pro Trp Asp Thr Thr Thr His Gly Ala Ser His Asp His Arg 180 185 190 Ser Ala Ala 195 Met Ser Ala Ala Ala 200 Gly Phe Asp Gly Ser 205 Pro Ala AlaVal Ser 210 Pro Ser Ile Met Ala 215 <210> 276

<211> 11<212> PRT

<213> Seqüência artificial<220>

<223> motivo 1<220>

<221> VARIANTE<222> (1) .. (1)<223> /substituir = "Thr"<220>

<221> VARIANTE<222> (3)..(3)

<223> /substituir = "Arg" /substituir = "Met" /substituir = "Gln"<220>

<221> VARIANTE<222> (6)..(6)

<223> /substituir = "Gln" /substituir = "Arg"<220>

<221> VARIANTE<222> (7)..(7)

<223> /substituir = "Arg" /substituir = "Glu"<220>

<221> VARIANTE<222> (8) . . (8)<223> /substituir = "Vai""Gly"

<220>

<221> VARIANTE<222> (11)..(11)<223> /substituir<400> 276

Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu15 10

<210><211><212><213><220>

<223> DomínioArath_SPL15<400> 277

Thr Ala Arg Cys Gln Val Glu Gly Cys

277

78

PRT

Seqüência

artificial

SPL de lugação de DNA (DBD) do fator de transcrição de

1

Lys

Ala Tyr

Tyr Ser Arg20

Ile Val Ser

Ser Lys Val35

Ser Arg Phe His Gln Leu50

Arg Arg Arg Leu Ala Cys

70

His Lys Val25

Gly Leu His40

Arg Met Asp Leu10

Cys Cys Ile His

Ser Asn Val15

Ser Lys Ser30

Gln Gln Cys

Gln Arg Phe Cys45

Ser Glu Phe Asp Leu Glu Lys Arg Ser Cys55 60

His Asn Glu Arg Arg Arg Lys Pro75

65

<210> 278<211> 11<212> PRT

<213> Seqüência artificial<220>

<223> motivo 2<220>

VARIANTE(3) . . (3)

/substituir = "Asn" /substituir = "Thr"

VARIANTE(4) . . (4)

/substituir = "Gly" /substituir = "Arg"VARIANTE

(H) · · (H)

/substituir = "Thr"278

Cys Ala Leu Ser Leu Leu Ser Asn5 10

Ser

<221><222><223><220><221><222><223><220><221><222><223><400>Asp Ser1

<210> 279

<211> 1130

<212> DNA

<213> Oryza sativa

<400> 279

catgcggcta atgtagatgc tcactgcgct agtagtaaggtatacaaagc tgtaatactc gtatcagcaa gagagaggcacaggattaga aaaacgggac gacaaatagt aatggaaaaacatggcaata taaatggaga aatcacaaga ggaacagaatgtactcgtac gtaaaaaaaa gaggcgcatt catgtgtggagatttgaaac cactcaaatc caccactgca aaccttcaaatagaaagcac aggtaagaag cacaacgccc tcgctctccagcacctcgcg gatcggtgac gtggcctcgc cccccaaaaaacaccccggg cccacccacc tgtcacgttg gcacatgttgcaaaatatca acgcggcgcg gcccaaaatt tccaaaatccgccgctcttc cacccaggtc cctctcgtaa tccataatggtgtacgtggg cgggttaccc tgggggtgtg ggtggatgac

tactccagta cattatggaa 60cacaagttgt agcagtagca 120caaaaaaaaa caaggaaaca 180ccgggcaata cgctgcgaaa 240cagcgtgcag cagaagcagg 300cgaggccatg gtttgaagca 360ccctcccacc caatcgcgac 420tatcccgcgg cgtgaagctg 480gttatggttc ccggccgcac 540cgcccaagcc cctggcgcgt 600cgtgtgtacc ctcggctggt 660gggtgggccc ggaggaggtc 720cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgcgaaaattcaa attaggaggt ggggggcggg gcccttggagtgcccctgac ttggcttggc tcctcttctt cttatcccttttctctcctc tcctcttctc ttctcttctc tggtggtgtgctccttcctc ctctcctttc ccctcctctc ttcccccctcgactctcccc aggtgaggtg agaccagtct ttttgctcgagcctcgcgcg gatctgaccg cttccctcgc ccttctcgca<210> 280<211> 56<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: prm07277<400> 280

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga<210> 281<211> 51<212> DNA

<213> Seqüência artificial<220>

<223> iniciador: prm07278<400> 281

ggggaccact ttgtacaaga aagctgggtt gatgaagatc<210> 282<211> 1110<212> DNA

<213> Brassica rapa<400> 282

atggataggg gttccaactc gggtcttggt cttggtccagtcatccactg agtcatcctc tttaagtgga gggctcatgtgaggacgctg gaggtggaac cgggtcttct tcctccggcgggaagcgggt cgggtccttc gggtcagata ccaaggtgtcgatctaacca atgcaaaggg ttattacacg aggcatagagacaccaaaag tcattgtcgc tggtatagaa caaaggttttcatcagcttc cggaatttga cctagagaaa aggagttgccaatgagagac gaaggaagcc acagcctgcg tctctatctgaggatcactc cttctctata cggaaatggt gaaactacaatcccaagaaa tgggttggaa tagtgcaaga acgttggataccgtcgtggc agatcaatcc tatgaatgtg tttagtcatgggaggaggga taagcttctc atctccagag attatggacaggaattggca gcgactcaaa ctgtgctctc tctcttctgtgacaacaaca acagcaacaa cacatggaga acttcttcggacaatggctc agccaccacc tgcacctagc cagcagcatcgtattcaagg acgatgataa tagctgtccg aatgatatgtcggttcaccg agacagagat aagcggtgga acgactttggcatcatcatc agaataggag gcagtacatg gaaagtgagatcttcacacc ataacaactg gtctctctga<210> 283<211> 369<212> PRT

<213> Brassica rapa<400> 283

Met Asp Arg Gly Ser Asn Ser Gly Leu Gly Leu15 10

Glu Ser Gly Gly Ser Ser Thr Glu Ser Ser Ser

20 25

Met Phe Gly Gln Arg Ile Tyr Phe Glu Asp Ala

35 40

Ser Ser Ser Ser Gly Gly Ser Asn Arg Arg Val

50 55

Gly Pro Ser Gly Gln Ile Pro Arg Cys Gln Val65 70 75

Asp Leu Thr Asn Ala Lys Gly Tyr Tyr Thr Arg

gaaaaggaggaataagcggagtcctcgcaaggtgtgtccctcacaagagattcgacgcgcggattcagcc

cgatcggtacatcgcagataccccgcttcctgtctcccctgagagcgccactttcacgcc

gttgttaatg tgttcg

ttaaaaggtg a

gccagacagattggccagagggtcaaacagaagtggaaggtttgtggaatgtcaacagtggtaggagacttgttgtcttctgaatgggagcaagagtgatgatcagtaagctaaaccagacaaacccacagttttggtccagtatctgaactcctgttttgtgagttcgaacacaagggc

gtcgggtggtgatctacttcaagggtacgtttgtggaatggcactctaaacagcaggtttcgctggtcattcgttatgggctttcttggtgagacggccatggaggaggagagctacaagtcagccacatgatgacggttcccgccttgggaatcttggtgttatctgacttatggctct

Gly Pro Gly Gln Thr15

Leu Ser Gly Gly Leu30

Gly Gly Gly Thr Gly45

Arg Gly Ser Gly Ser60

Glu Gly Cys Gly Met80

His Arg Val Cys Gly

780840900960102010801130

56

51

60120180240300360420480540600660720780840900960102010801110Met His Ser Lys100

Phe Cys Gln Gln115

Glu Lys Arg Ser130

Arg Lys Pro Gln145

Arg Ile Thr Pro

Ser Phe Leu Gly180

Asp Thr Arg Val195

Asn Val Phe Ser210

Ser Phe Ser Ser225

Gly Ile Gly Ser

His Gln Pro His260

Ser Gly Phe Gly275

Pro Ser Gln Gln290

Asp Asp Asn Ser305

Arg Phe Thr Glu

Glu Leu Ser Asp340

Glu Asn Thr Arg355

Leu

85

Thr Pro Lys Val

Cys Ser Arg Phe120

Cys Arg Arg Arg135

Pro Ala Ser Leu150

Ser Leu Tyr Gly165

Ser Gln Glu Met

Met Arg Arg Pro200

His Gly Ser Val215

Pro Glu Ile Met230

Asp Ser Asn Cys245

Asp Asn Asn Asn

Pro Met Thr Val280

His Gln Tyr Leu295

Cys Pro Asn Asp310

Thr Glu Ile Ser325

His His His Gln

Ala Tyr Gly Ser360

90

Ile Val Ala Gly105

His Gln Leu Pro

Leu Ala Gly His140

Ser Val Leu Ser155

Asn Gly Glu Thr170

Gly Trp Asn Ser185

Pro Ser Trp Gln

Ser Gly Gly Gly220

Asp Thr Lys Pro235

Ala Leu Ser Leu250

Ser Asn Asn Thr265

Thr Met Ala Gln

Asn Pro Pro Trp300

Met Ser Pro Val315

Gly Gly Thr Thr330

Asn Arg Arg Gln345

Ser Ser His His

95

Ile Glu Gln Arg110

Glu Phe Asp Leu125

Asn Glu Arg Arg

Ser Arg Tyr Gly160

Thr Met Asn Gly175

Ala Arg Thr Leu190

Ile Asn Pro Met205

Gly Gly Gly Ile

Glu Ser Tyr Lys240

Leu Ser Asn Pro255

Trp Arg Thr Ser270

Pro Pro Pro Ala285

Val Phe Lys Asp

Leu Asn Leu Gly320

Leu Gly Glu Phe335

Tyr Met Glu Ser350

Asn Asn Trp Ser365

<210> 284

<211> 1080

<212> DNA

<213> Glyc

<400> 284

atggcttcag

aaaatctatt

tcttcttctt

tctgttcaac

gatgcaaaag

gtcattgttg

cctgagtttg

cggagaaagc

gcttttgata

cttagtctga

acctccacac

tcggtgggtg

gtcaccgaca

acagcaccaa

cttgctgcat

aagggcattg

atttcacagc

aggcattata

<210> 285

<211> 359

<212> PRT

me max

acgccaaactttgaggatgtctgctgctaccagctcaacccttactattcctggtcttcaatcaaggaaaccccaacaagatagtggcaggaaattcactttagctggaaggacaagcttcgagctgtgcgtcttgggttcatctcatggattctggtaactctcaatagtggatctaga

ctcctcttcttggtcttgcttgttacttcttcccaggtgttagacacaagacaaaggtttaagaagttgcctccctcttaaggtagcaactccaactccttggcaactcacgccagcccgtctctctcttgagtaacatgtgcatcaatcctgttcgcccccaacttcatacagtccagg

gagtccctcaactccagccatcttcttcttcaagttgaaggtctgtggcatgtcaacagtcgtaggcgacacctctcgcttttctgatggagatcatctggagacatcatggacatcctcctgtcaaatcataaatttcacatcaacttc

acggtttgaacctctcttaccaaggaaaggggtgcaaagttgcactctaagtagcaggtttagctggccaatgccagactaattgacttcagctagctccctgaccttttcaggggaaagaaacatggggacgggacacccaaatacctc

gaggtggtcc ctgatctaggggtgagctgg acctgtcccagcatatgaat ctgctcattg

attcggccaattcttcttctaagaggtgggagatctgagtatccccttcatcatcagctttaatgaacgtttcttcgtctatacccaaagtggaaatcaacttgcaaggtttacattgggttctagaaaccttgacacaagtggtttttctctcggtcagacagggcagggtcactttaa

6012018024030036042048054060066072078084090096010201080<213> Glycine max<400> 285

Met Ala Ser Asp Ala Lys Leu Ser Ser Ser Glu Ser Leu Asn Gly Leu1 5 10 15

Lys Phe Gly Gln Lys Ile Tyr Phe Glu Asp Val Gly Leu Ala Thr Pro

20 25 30

Ala Thr Ser Leu Thr Ser Ser Ser Ser Ser Ser Ser Ala Ala Thr Val

35 40 45

Thr Ser Ser Ser Ser Ser Arg Lys Gly Arg Gly Gly Ser Val Gln Pro

50 55 60

Ala Gln Pro Pro Arg Cys Gln Val Glu Gly Cys Lys Val Asp Leu Ser65 70 75 80

Asp Ala Lys Ala Tyr Tyr Ser Arg His Lys Val Cys Gly Met His Ser

85 90 95

Lys Ser Pro Ser Val Ile Val Ala Gly Leu Gln Gln Arg Phe Cys Gln

100 105 110

Gln Cys Ser Arg Phe His Gln Leu Pro Glu Phe Asp Gln Gly Lys Arg

115 120 125

Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg Arg Arg Lys Pro

130 135 140

Pro Thr Ser Ser Leu Leu Thr Ser Arg Tyr Ala Arg Leu Ser Ser Ser145 150 155 160

Ala Phe Asp Asn Ser Gly Arg Gly Ser Asn Phe Leu Met Glu Leu Thr

165 170 175

Ser Tyr Pro Lys Leu Ser Leu Arg Asn Ser Leu Pro Thr Pro Arg Ser

180 185 190

Ser Glu Leu Ala Pro Gly Asn Gln Thr Ser Thr Leu Ser Trp Asn Gly

195 200 205

Asn Ser Glu Thr Ser Ser Asp Leu Phe Leu Gln Gly Ser Val Gly Gly

210 215 220

Thr Ser Phe Ala Ser Pro Gly His Pro Pro Gly Glu Ser Tyr Ile Gly225 230 235 240

Val Thr Asp Thr Ser Cys Ala Leu Ser Leu Leu Ser Asn Gln Thr Trp

245 250 255

Gly Ser Arg Asn Thr Ala Pro Ser Leu Gly Leu Ser Asn Met Ile Asn

260 265 270

Phe Asn Gly Thr Pro Leu Thr Gln Leu Ala Ala Ser Ser His Gly Ala

275 280 285

Ser Ile His Gln Leu Pro Asn Thr Ser Trp Phe Phe Lys Gly Ile Asp

290 295 300

Ser Gly Asn Cys Ser Pro Glu Val Val Pro Asp Leu Gly Leu Gly Gln305 310 315 320

Ile Ser Gln Pro Leu Asn Ser Gln Leu His Gly Glu Leu Asp Leu Ser

325 330 335

Gln Gln Gly Arg Arg His Tyr Met Asp Leu Glu Gln Ser Arg Ala Tyr

340 345 350

Glu Ser Ala His Trp Ser Leu

355<210> 286<211> 1128<212> DNA

<213> Populus tremuloides<400> 286

atggaaatgg attcaggctc cctaaccgag tcagctactt ccaatgcaac ttctccgcca 60

gctgagtctg ttaatggatt gaaatttggt aagaagattt actttgagga tcacgtgggg 120gtcggtgctc cggctaagag cggaactggg tcatcctcat ccggttccgg gtcagggtca 180tctaggaagg ctcaaggtgg acagcaccag cagccaccaa ggtgtcaagt tgaagggtgc 240aaagtagatc tgagtgatgc taagacttac tattcaaggc acaaagtttg tagtatgcac 300tccaagtctc ctagagttat tgttgctggt ttggtgcaaa gattttgcca gcaatgtagc 360agatttcatc tacttcctga atttgaccaa ggaaaacgaa gttgccgcag gcgcctagct 420ggccataatg agcgacggag gaagccacca tctggatcgg tgttgtccgc tcgccatggc 480cgattctctc cctctttgtt tgataatagc agcagagctg gaggccttct tgtggacttt 540agtgcatatc caaggcatac tgggagagat ggatggcctg cagcaaggtc ttctgagctt 600acccccggga atgatactgc tgccacagga aggtctatat ctcatatgtg gcagataagc 660tcccagaatc ctccatccaa cctttgcttg caaggctcaa ctggcgggac tggccttttc 720agttcaggaa ttcctccggg agaatgcttc acaggagttg ctgtttcaga ctcgagctgt 780gctctctctc ttctgtcaaa tcaaccatgg ggctccacaa accgagcatc aagtcttgcg 840gtgaatgact tgtttagtgc cgaagaggca cccgtggttc aatcaacagc tcaccatggt 900gcggctgtca atcagtatcc aatcccttgg agcttcaaga gcaatgaagg aagtaacagt 960tcacatgaga tgtgccctga tctaggtctg ggtcaaattt caatgcctct caacagtcaa 1020cttgctggtc agctcgagca gtctcaacag aataggaggc aatacatgga cctcgagcat 1080tccagggctt atgactcttc aacccagcac atccactggt cactttaa 1128

<210> 287<211> 375<212> PRT

<213> Populus tremuloides<400> 287

Met Glu Met Asp Ser Gly Ser Leu Thr Glu Ser Ala Thr Ser Asn Ala1 5 10 15

Thr Ser Pro Pro Ala Glu Ser Val Asn Gly Leu Lys Phe Gly Lys Lys

20 25 30

Ile Tyr Phe Glu Asp His Val Gly Val Gly Ala Pro Ala Lys Ser Gly

35 40 45

Thr Gly Ser Ser Ser Ser Gly Ser Gly Ser Gly Ser Ser Arg Lys Ala

50 55 60

Gln Gly Gly Gln His Gln Gln Pro Pro Arg Cys Gln Val Glu Gly Cys65 70 75 80

Lys Val Asp Leu Ser Asp Ala Lys Thr Tyr Tyr Ser Arg His Lys Val

85 90 95

Cys Ser Met His Ser Lys Ser Pro Arg Val Ile Val Ala Gly Leu Val

100 105 110

Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His Leu Leu Pro Glu Phe

115 120 125

Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu

130 135 140

Arg Arg Arg Lys Pro Pro Ser Gly Ser Val Leu Ser Ala Arg His Gly145 150 155 160

Arg Phe Ser Pro Ser Leu Phe Asp Asn Ser Ser Arg Ala Gly Gly Leu

165 170 175

Leu Val Asp Phe Ser Ala Tyr Pro Arg His Thr Gly Arg Asp Gly Trp

180 185 190

Pro Ala Ala Arg Ser Ser Glu Leu Thr Pro Gly Asn Asp Thr Ala Ala

195 200 205

Thr Gly Arg Ser Ile Ser His Met Trp Gln Ile Ser Ser Gln Asn Pro

210 215 220

Pro Ser Asn Leu Cys Leu Gln Gly Ser Thr Gly Gly Thr Gly Leu Phe225 230 235 240

Ser Ser Gly Ile Pro Pro Gly Glu Cys Phe Thr Gly Val Ala Val Ser

245 250 255

Asp Ser Ser Cys Ala Leu Ser Leu Leu Ser Asn Gln Pro Trp Gly Ser

260 265 270

Thr Asn Arg Ala Ser Ser Leu Ala Val Asn Asp Leu Phe Ser Ala Glu

275 280 285

Glu Ala Pro Val Val Gln Ser Thr Ala His His Gly Ala Ala Val Asn

290 295 300

Gln Tyr Pro Ile Pro Trp Ser Phe Lys Ser Asn Glu Gly Ser Asn Ser305 310 315 320

Ser His Glu Met Cys Pro Asp Leu Gly Leu Gly Gln Ile Ser Met Pro

325 330 335

Leu Asn Ser Gln Leu Ala Gly Gln Leu Glu Gln Ser Gln Gln Asn Arg

340 345 350

Arg Gln Tyr Met Asp Leu Glu His Ser Arg Ala Tyr Asp Ser Ser Thr

355 360 365

Gln His Ile His Trp Ser Leu370 375

<210> 288<211> 1059<212> DNA

<213> Citrus Clementina<400> 288

atggaactgg gttcagacta tttggctgaa tcaggtggtg gctccggctc cggctcaggc 60

tccggcttat catccgctga gccatcactt aatggtttga agtttggcaa aaaaatctat 120

tttgaggatg tcggtactgc cggagctcca tttccaggat ctgggtcatc atctgggtcc 180

gggtcagggt caggttcagg gtcagggagg aaggtgaggg gtgttggcgg tggtatggtt 240

actagtgggc agcagccacc aaggtgccaa gtggaggggt gtaaagttga tctgagtgat 300

gccaaagctt actattcaag gcacaaagtt tgtggcatgc attcaaagtc tcctgttgtc 360

actgttgccg gccttgagca gaggttttgc cagcaatgta gcagatttca tcagcttccg 420

gagtttgacc aaggaaaacg aagttgccgc aggcgcctgg caggccataa tgagcgccgg 480

aggaagccaa cttctggacc atttttgggc actcgttatg gcaggctctc ttcctctgtc 540

attgagaaca gcagccaagg tggaggattt ctgatcgact tcagtgcata tcagatggtt 600

ggtgggaggg atggatggcc agtgacaagt gtctccaagc aggtatctgg aaatcaaacc 660

actgtcacag caaggcatct tcctcagcca ctatggcaaa accactctca ggatcctcca 720

cctgatcgtt accttcagtg ttcaacagct gggactggtt tctctggtcc tggaattcct 780

tgtggaggat gcttcacagg agttgctgac tcaaactgtg ctctctctct tctgtcaaat 840

caaccatggg gctctaagaa cccgacaccg ggtcatggag tgggtgactt aatgcatgcc 900

cataccaaat ccgtcactca accagtatcg ccccatggag cagctattaa tcaatatcca 960

aacatgtcat ggggggttca agggcaatgc aacctggtag cagttccaca ccaaatggcc 1020

ccccaaatgg ggtttgggtt caacattccg gcccattaa 1059

<210> 289<211> 352<212> PRT

<213> Citrus Clementina<400> 289

Met Glu Leu Gly Ser Asp Tyr Leu Ala Glu Ser1 5

Gly Gly

Ser Gly Ser Gly Ser Gly Leu Ser Ser Ala Glu Pro Ser

10

20

25

Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu Asp

35 40 Ala Pro Phe Pro Gly Ser Gly Ser Ser Ser Gly 50 55 Gly Ser Gly Ser Gly Arg Lys Val Arg Gly Val65 70 75Thr Ser Gly Gln Gln Pro Pro Arg Cys Gln Val 85 90 Asp Leu Ser Asp Ala Lys Ala Tyr Tyr Ser Arg 100 105 Met His Ser Lys Ser Pro Val Val Thr Val Ala 115 120 Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu 130 135 Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly145 150 155Arg Lys Pro Thr Ser Gly Pro Phe Leu Gly Thr 165 170 Ser Ser Ser Val Ile Glu Asn Ser Ser Gln Gly 180 185 Asp Phe Ser Ala Tyr Gln Met Val Gly Gly Arg 195 200 Thr Ser Val Ser Lys Gln Val Ser Gly Asn Gln 210 215 Arg His Leu Pro Gln Pro Leu Trp Gln Asn His225 230 235Pro Asp Arg Tyr Leu Gln Cys Ser Thr Ala Gly 245 250 Pro Gly Ile Pro Cys Gly Gly Cys Phe Thr Gly 260 265 Cys Ala Leu Ser Leu Leu Ser Asn Gln Pro Trp 275 280

Val Gly

45Ser Gly60

Gly Gly

Glu Gly

His Lys

Gly Leu125Pro Glu140

His Asn

Arg Tyr

Gly Gly

Asp Gly205Thr Thr220

Ser Gln

Thr Gly

Val Ala

Gly Ser285

Gly Ser Gly15

Leu Asn Gly30

Thr Ala Gly

Ser Gly Ser

Gly Met Val80

Cys Lys Val95

Val Cys Gly110

Glu Gln Arg

Phe Asp Gln

Glu Arg Arg160

Gly Arg Leu

175Phe Leu Ile190

Trp Pro Val

Val Thr Ala

Asp Pro Pro240

Phe Ser Gly

255Asp Ser Asn270

Lys Asn ProThr Pro Gly His Gly Val Gly Asp Leu Met His

290 295

Val Thr Gln Pro Val Ser Pro His Gly Ala Ala305 310 315

Asn Met Ser Trp Gly Val Gln Gly Gln Cys Asn

325 330

His Gln Met Ala Pro Gln Met Gly Phe Gly Phe340 345

<210> 290<211> 565<212> DNA

<213> Beta vulgaris<400> 290

atggatacgg gttcaaatta tccgaccgtt aaggggtcatgggttgtcgg attctttaaa tgggctgaaa tttgggcaaaggtggtgttg gaacttccgg caagtcttcc gtcgccggaaagggccggaa aaggggtggt gcaaagtggg caaccaccaaaagatagatc ttagtgatgc taaaacttat tattctaggctctaaatctt ctgttgttat tgttgctggt cttgagcaacagatttcatc ggcttcctga gtttgaccaa gggaaacgaaggtcataatg agcgtcgaag aaaaccacca cctgggtcttcgtctctctt catccctttt tggtgataac accggcggaattctcttcgt atccacggca ttctg<210> 291<211> 188<212> PRT

<213> Beta vulgaris<400> 291

Met Asp Thr Gly Ser Asn Tyr Pro Thr Val Lys15 10

Ser Ser Ser Ser Gly Leu Ser Asp Ser Leu Asn

20 25

Gln Lys Ile Tyr Phe Glu Asp Val Gly Gly Val

35 40

Ser Ser Val Ala Gly Ser Gly Gly Ala Pro Ala

50 55

Gly Val Val Gln Ser Gly Gln Pro Pro Arg Cys65 70 75

Lys Ile Asp Leu Ser Asp Ala Lys Thr Tyr Tyr

Ala His Thr Lys Ser300

Ile Asn Gln Tyr Pro320

Leu Val Ala Val Pro335

Asn Ile Pro Ala His350

catcaacctcaaatatacttgtggtggtgcggtgtcaagtataaagtttggtttttgccagttgtcgcagtgttatcatcgtggtggatt

ttcatcatcttgaagatgtgtccggcgaaaagaagggtgttggtatgcacgcagtgcagcacgccttgctacgtttgggacttattggac

85

90

Cys Gly Met His Ser Lys Ser Ser Val Val Ile

100

105

Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His

115 120

Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu

130 135

Arg Arg Arg Lys Pro Pro Pro Gly Ser Leu Leu145 150 155

Arg Leu Ser Ser Ser Leu Phe Gly Asp Asn Thr

165 170

Phe Leu Leu Asp Phe Ser Ser Tyr Pro Arg His180 185

<210> 292<211> 536<212> DNA

<213> Hevea brasiliensis<400> 292

atggaaatgg gttcgggctc tttgacagag tcaggtacctgctgagtcaa taaatgggtt gaaatttggc caaaaaatctaagactccgg ccaaatctgc acccgggtct tcatcttccgaaggttcacg gtgggcagca gcagcagcca cccaggtgtcgatctgagtg atgctaaggc ttattattcg aggcacaaagtctcctaagg tcattgttgc tggtttggag caaagatttt

Gly Ser Ser Ser Thr 15 Gly Leu Lys Phe Gly 30 Gly Thr Ser Gly Lys 45 Lys Arg Ala Gly Lys60 Gln Val Glu Gly Cys 80Ser Arg His Lys Val 95 Val Ala Gly Leu Glu 110 Arg Leu Pro Glu Phe 125 Ala Gly His Asn Glu140 Ser Ser Arg Leu Gly 160Gly Gly Ser Gly Gly 175 Ser

60120180240300360420480540565

ccaacgccac ttctccacct 60attttgagaa tgcgggggct 120ggtccggggc cccgtccagg 180aagttgaggg atgtaaagtg 240tttgtggtat gcactctaag 300gccagcagtg tagtagattt 360catcagcttc ctgaatttga ccaaggaaaa cgaagttgccaatgaacggc ggaggaagcc accaactgga tcagtgctgtttttcaacaa tttttgataa cagcagccga gctgggggca<210> 293<211> 177<212> PRT

<213> Hevea brasiliensis<400> 293

gcagacgcct agctggtcat 420catctcgcta taacagactt 480ttcttgtgga tttcag 536

20

25

35

40

50

55

65

70

85

100

105

115

120

130

135

145

Asp

150

165

Glu Ser Gly Thr Ser Asn Ala10 15 Gly Leu Lys Phe Gly Gln Lys 30 Thr Pro Ala Lys Ser Ala Pro 45 Pro Ser Arg Lys Val His Gly 60 Gln Val Glu Gly Cys Lys Val 75 80Ser Arg His Lys Val Cys Gly90 95 Val Ala Gly Leu Glu Gln Arg 110 Gln Leu Pro Glu Phe Asp Gln 125 Ala Gly His Asn Glu Arg Arg 140 Ser Ser Arg Tyr Asn Arg Leu 155 160Arg Ala Gly Gly Ile Leu Val170 175

<210> 294

<211> 1130

<212> DNA

<213> Oryza sativa

<400> 294

catgcggcta atgtagatgc tcactgcgcttatacaaagc tgtaatactc gtatcagcaacaggattaga aaaacgggac gacaaatagtcatggcaata taaatggaga aatcacaagagtactcgtac gtaaaaaaaa gaggcgcattgatttgaaac cactcaaatc caccactgcatagaaagcac aggtaagaag cacaacgcccgcacctcgcg gatcggtgac gtggcctcgcacaccccggg cccacccacc tgtcacgttgcaaaatatca acgcggcgcg gcccaaaattgccgctcttc cacccaggtc cctctcgtaatgtacgtggg cgggttaccc tgggggtgtgcggccccgcg cgtcatcgcg gggcggggtggaaaattcaa attaggaggt ggggggcgggtgcccctgac ttggcttggc tcctcttcttttctctcctc tcctcttctc ttctcttctcctccttcctc ctctcctttc ccctcctctcgactctcccc aggtgaggtg agaccagtctgcctcgcgcg gatctgaccg cttccctcgg<210> 295<211> 2194<212> DNA

<213> Oryza sativa<400> 295

aatccgaaaa gtttctgcac cgttttcaccaaatataaaa tgagacctta tatatgtagc

agtagtaagggagagaggcaaatggaaaaaggaacagaatcatgtgtggaaaccttcaaatcgctctccacccccaaaaagcacatgttgtccaaaatcctccataatggggtggatgactagcgggtgcgcccttggagcttatccctttggtggtgtgttcccccctcttttgctcgaccttctcgca

tactccagtacacaagttgtcaaaaaaaaaccgggcaatacagcgtgcagcgaggccatgccctcccacctatcccgcgggttatggttccgcccaagcccgtgtgtaccgggtgggcccgaaaaggaggaataagcggagtcctcgcaaggtgtgtccctcacaagagattcgacgcgcggattcagcc

cattatggaaagcagtagcacaaggaaacacgctgcgaaacagaagcagggtttgaagcacaatcgcgaccgtgaagctgccggccgcaccctggcgcgtctcggctggtggaggaggtccgatcggtacatcgcagataccccgcttcctgtctcccctgagagcgccactttcacgcc

60120180240300360420480540600660720780840900960102010801130

ccctaactaa caatataggg aacgtgtgctgctgataact agaactatgc aagaaaaact

60120catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140

acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200

tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260

tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320

atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380

gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440

gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500

gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560

gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620

tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680

ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740

actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800

agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860

atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920

gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980

ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040

acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100

aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160

ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 296<211> 1149<212> DNA<213> Zea mays<220>

<221> misc_feature<222> (157)..(157)<223> η é a, c, g, ou t<220>

<221> misc_feature<222> (894)..(894)<223> η é a, c, g, ou t<220>

<221> misc_feature<222> (954)..(954)<223> η é a, c, g, ou t<400> 296

atgcacaact gcaaagaaac cagcaagaat gcgccggcgg tttatagttc cccgctactg 60

caccgctctc tgctgcaggc tgcagctttg actaccaact catacagtac tagtactata 120

ctagagtact actacgccat tagcacggtg gttgcantag gccgtggtct ggaggtctct 180

ctcagctcag acgaggatcg tcggagcaag cagcagcgcg tgcagcctct gggagaccct 240

ggcggcgtcg acgccgatcc tggggctgag cgcctgcgag tggacggtgt agaatatctt 300

gtccccgatg acggagaagc tggcgctgac cacctcggcg ccctcctgct ccagcacggt 360

gatgacctcg tgcagcttga agggcctggc ggcctcgctg atgagcacca cgtccagcgt 420

cccgtcctgg caccgcacct cgatgaccgg catgcgcacg cctccgccgc cgccggtgga 480

cccggccgcc gccgttgcag cctccgtggc cgcgccgccg ccgttgcagc agcccgcctt 540

ccgctgcttc agcgcctcga tccgctcctt gagctgcttg atgtacgccg ccgcgctgtc 600

cagctggtcc agctgcgtca ccgcgtcctg cttgttgccg ggattggagg acaccgccgc 660cgacgcggcg tcggagagga gggaggcgtg cgtggcggcg gcggcggcgg cgggagggat 720gagggaggag agcttgaggc agaggccctt catgtgcagc ctccggttct tctccacgtc 780cttcctctcc agcttgcacc ccccgccgct gctgtgcgcg ttcctctccc ccgcggcgca 840ggcgcccgag ctgcccccgc tgctctgcct ccggctcttc atctcgatcg accngaccgg 900tctgcagatc tctccttggc tgttctcgtc gctgctcctg ccgggcgtga agcngcgcag 960cctttggttg ggacttggga gggacaagtt gcaacagcac ccacgggcca cggcacggag 1020ggggcgaaag gcaaggaggc caggacaaga cgagagaaat acaggccggg ggagatggct 1080ccgtggcgcg tacgtgtgtc tacctgcatg ttggttgatc cgattgcatc tgctgtaacc 1140atatattaa 1149

<210> 297<211> 382<212> PRT<213> Zea mays<220>

<221> INSEGURO<222> (53)..(53)

<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 297

Met His Asn Cys Lys Glu Thr Ser Lys Asn Ala Pro Ala Val Tyr Ser15 10 15

Ser Pro Leu Leu His Arg Ser Leu Leu Gln Ala Ala Ala Leu Thr Thr

20 25 30

Asn Ser Tyr Ser Thr Ser Thr Ile Leu Glu Tyr Tyr Tyr Ala Ile Ser

35 40 45

Thr Val Val Ala Xaa Gly Arg Gly Leu Glu Val Ser Leu Ser Ser Asp

50 55 60

Glu Asp Arg Arg Ser Lys Gln Gln Arg Val Gln Pro Leu Gly Asp Pro65 70 75 80

Gly Gly Val Asp Ala Asp Pro Gly Ala Glu Arg Leu Arg Val Asp Gly

85 90 95

Val Glu Tyr Leu Val Pro Asp Asp Gly Glu Ala Gly Ala Asp His Leu

100 105 110

Gly Ala Leu Leu Leu Gln His Gly Asp Asp Leu Val Gln Leu Glu Gly

115 120 125

Pro Gly Gly Leu Ala Asp Glu His His Val Gln Arg Pro Val Leu Ala

130 135 140

Pro His Leu Asp Asp Arg His Ala His Ala Ser Ala Ala Ala Gly Gly145 150 155 160

Pro Gly Arg Arg Arg Cys Ser Leu Arg Gly Arg Ala Ala Ala Val Ala

165 170 175

Ala Ala Arg Leu Pro Leu Leu Gln Arg Leu Asp Pro Leu Leu Glu Leu

180 185 190

Leu Asp Val Arg Arg Arg Ala Val Gln Leu Val Gln Leu Arg His Arg

195 200 205

Val Leu Leu Val Ala Gly Ile Gly Gly His Arg Arg Arg Arg Gly Val

210 215 220

Gly Glu Glu Gly Gly Val Arg Gly Gly Gly Gly Gly Gly Gly Arg Asp225 230 235 240

Glu Gly Gly Glu Leu Glu Ala Glu Ala Leu His Val Gln Pro Pro Val

245 250 255

Leu Leu His Val Leu Pro Leu Gln Leu Ala Pro Pro Ala Ala Ala Val

260 265 270

Arg Val Pro Leu Pro Arg Gly Ala Gly Ala Arg Ala Ala Pro Ala Ala

275 280 285

Leu Pro Pro Ala Leu His Leu Asp Arg Pro Asp Arg Ser Ala Asp Leu

290 295 300

Ser Leu Ala Val Leu Val Ala Ala Pro Ala Gly Arg Glu Ala Ala Gln305 310 315 320

Pro Leu Val Gly Thr Trp Glu Gly Gln Val Ala Thr Ala Pro Thr Gly

325 330 335

His Gly Thr Glu Gly Ala Lys Gly Lys Glu Ala Arg Thr Arg Arg Glu

340 345 350

Lys Tyr Arg Pro Gly Glu Met Ala Pro Trp Arg Val Arg Val Ser Thr355 360 365

Cys Met Leu Val Asp Pro Ile Ala Ser Ala Val Thr Ile Tyr

370 375 380

<210> 298<211> 660<212> DNA<213> Zea mays<400> 298

atggagatga gagcgaagaa gagcagcaga agcagcacga gcaacaccagacgaccacgg cggtggagag gaaggagatc gagaggagga ggaggcagcactctgcgcca agctcgcctc cctcatcccg aaagaacact actcctccaaacccagctgg gtagcctaga cgaggcagcc acgtacataa agagactcaagaggagctgc ggcacaagag cgcctctgca cggctcttgg ccgctggcagcgaggcggag gaggaggagg cgcctccaca tcgtcggcag cgacgaccacggcgcaggat catctgaaga agccggccgg cgggaggacg acatgccgccgaggttcggc agcacaatga cgggtcaagc ctggacgtgg tgctcatcagcgacccttca agctgcacga ggtggtcacc gtgctggagg aagaaggcgcaacgccaacc tctccgtcgc cggcaccaaa atcttctaca ccatccactgtgcccaagaa tcggtataga tgtttcaaga gtttctgaaa gattaagagc<210> 299<211> 219<212> PRT<213> Zea mays<400> 299

Met Glu Met Arg Ala Lys Lys Ser Ser Arg Ser

cggcagcacggatgaagagcggatgctatgggagagggtgtggcacgagaggcgagcggtggcggtggtacagcgcggcgcgagaccgaccaaggcctttattgggatga

Ser Thr

Ser Gly Ser Thr Thr Thr Thr Ala Val Glu Arg Lys Glu

10

20

25

Arg Arg Arg Gln Gln Met Lys Ser Leu Cys Ala

35

40

Ile Pro Lys Glu His Tyr Ser Ser Lys Asp Ala

50

55

Ser Leu Asp Glu Ala Ala Thr Tyr Ile Lys Arg

Lys Leu

45Met Thr60

Leu Lys

65

70

75

Glu Glu Leu Arg His Lys Ser Ala Ser Ala Arg Leu Leu

Ala Ser

85

90

Ser Gly Thr Arg Arg Gly Gly Gly Gly Gly Gly

100 105

Ala Ala Thr Thr Thr Ala Ser Gly Gly Ala Gly Ser Ser115 120 125

Gly Arg Arg Glu Asp Asp Met Pro Pro Ala Val Val Glu

130 135 140

His Asn Asp Gly Ser Ser Leu Asp Val Val Leu Ile Ser145 150 155

Arg Pro Phe Lys Leu His Glu Val Val Thr Val Leu Glu

165 170

Ala Glu Thr Asp Asn Ala Asn Leu Ser Val Ala Gly Thr

180 185

Tyr Thr Ile His Cys Lys Ala Phe Cys Pro Arg Ile Gly195 200 205

Ser Arg Val Ser Glu Arg Leu Arg Ala Leu Gly

210 215

<210> 300<211> 669<212> DNA<213> Glycine max<400> 300

atgggtcaac aacaacaggg aagtcaacct tctccaacca aagtcgaaaggagaaaaaca ggagaagcca gatgaagaac ctctattccg aactcaactcacccgtaatc ccaaggaagc gatgtcactg cctgatcaaa tagatgaagcatcaaaagcc tagagacaaa agtgaagctg gagcaggaga agaaagaaagaggaagagaa ctcgtggtgg ctgttcgagt tcttctgaag cacaaggaagccaaatatcc agattcacga aacgggaaat ttgcttgaag tcattctaac

Ser Asn Thr15

Ile Glu Arg30

Ala Ser Leu

Gln Leu Gly

Glu Arg Val80

Ala Ala Gly95

Thr Ser Ser110

Glu Glu Ala

Val Arg Gln

Ser Ala Ala160

Glu Glu Gly175

Lys Ile Phe190

Ile Asp Val

aaagattgtatcttctccctaatcaactatgttaaaggaacctgaaatcgatgtggggtc

60120180240300360420480540600660

60120180240300360gatagccagt tcatgttctg tgaaattatt cgaattttgc atgaagagaa cgtcgaggtc 420

atcaatgcca attcttcaat ggtcggagat ttagtgattc atgttgtgca cggggaggtt 480

gagccatcta tctatcaatt cggagcgacc aaagtgagtg agaagctgaa atggtttatg 540

aacggatcct tcagtgatgt ggaaatggag cctgaattaa tgtggaattt taaaattgat 600

gctactgagc cgtgggggct tctagatgat cttacactgg acaatgtctt accaccaaat 660

actttgtaa 669

<210> 301

<211> 222

<212> PRT

<213> Glycine max

<400> 301

Met Gly Gln Gln Gln Gln Gly Ser Gln Pro Ser Pro Thr Lys Val Glu1 5 10 15

Arg Lys Ile Val Glu Lys Asn Arg Arg Ser Gln Met Lys Asn Leu Tyr

20 25 30

Ser Glu Leu Asn Ser Leu Leu Pro Thr Arg Asn Pro Lys Glu Ala Met

35 40 45

Ser Leu Pro Asp Gln Ile Asp Glu Ala Ile Asn Tyr Ile Lys Ser Leu

50 55 60

Glu Thr Lys Val Lys Leu Glu Gln Glu Lys Lys Glu Arg Leu Lys Glu65 70 75 80

Arg Lys Arg Thr Arg Gly Gly Cys Ser Ser Ser Ser Glu Ala Gln Gly

85 90 95

Ser Leu Lys Ser Pro Asn Ile Gln Ile His Glu Thr Gly Asn Leu Leu

100 105 110

Glu Val Ile Leu Thr Cys Gly Val Asp Ser Gln Phe Met Phe Cys Glu

115 120 125

Ile Ile Arg Ile Leu His Glu Glu Asn Val Glu Val Ile Asn Ala Asn

130 135 140

Ser Ser Met Val Gly Asp Leu Val Ile His Val Val His Gly Glu Val145 150 155 160

Glu Pro Ser Ile Tyr Gln Phe Gly Ala Thr Lys Val Ser Glu Lys Leu

165 170 175

Lys Trp Phe Met Asn Gly Ser Phe Ser Asp Val Glu Met Glu Pro Glu

180 185 190

Leu Met Trp Asn Phe Lys Ile Asp Ala Thr Glu Pro Trp Gly Leu Leu

195 200 205

Asp Asp Leu Thr Leu Asp Asn Val Leu Pro Pro Asn Thr Leu210 215 220

Claims

1. Método para melhorar características relacionadas arendimento em plantas em relação a plantas de controle, caracterizado pelofato de compreender aumentar preferencialmente expressão de um ácidonucleico codificando um polipeptídeo HAL3 no broto de uma planta, eopcionalmente selecionar plantas tendo rendimento aumentado.

2. Método de acordo com a reivindicação 1, caracterizado pelofato de que dita expressão aumentada é efetuada introduzindo umamodificação genética, preferivelmente no locus de um gene codificando umpolipeptídeo HAL3.

3. Método de acordo com a reivindicação 2, caracterizado pelofato de que dita modificação genética é efetuada por qualquer um ou mais de:ativação de T-DNA5 TILLING e recombinação homóloga.

4. Método de acordo com a reivindicação 2, caracterizado pelofato de que dita modificação genética é efetuada por qualquer um ou mais de:ativação de T-DNA, TILLING e recombinação homóloga.

5. Método de acordo com a reivindicação 1, caracterizado pelofato de que dita expressão aumentada é efetuada introduzindo e expressandoem uma planta um ácido nucleico codificando um polipeptídeo HAL3.

6. Método de acordo com a reivindicação 5, caracterizado pelofato de que dito ácido nucleico codificando uma proteína HAL3 érepresentado por qualquer um dos ácidos nucleicos SEQ ID NOs dados emTabela A, ou uma porção destes, ou uma seqüência capaz de hibridizar comqualquer um dos ácidos nucleicos SEQ ID NOs dados em Tabela A.

7. Método de acordo com a reivindicação 5, caracterizado pelofato de que dito ácido nucleico codificando uma proteína HAL3 codifica umortólogo ou parálogo de qualquer dos ácidos nucleicos SEQ ID NOs dados emTabela A.

8. Método de acordo com qualquer das reivindicações 1 a 7,caracterizado pelo fato de que ditas características relacionadas a rendimentomelhoradas compreendem rendimento aumentado e/ou vigor precoce.

9. Método de acordo com a reivindicação 8, caracterizado pelofato de que dito rendimento aumentado é rendimento aumentado de sementes.

10. Método de acordo com a reivindicação 9, caracterizadopelo fato de que dito rendimento aumentado de sementes é uma ou mais de: a)biomassa aumentada de sementes; b) índice de colheita aumentado; e c)número aumentado de sementes (cheias).

11. Método de acordo com a reivindicação 9, caracterizadopelo fato de que dito aumento em rendimento de sementes é de pelo menos 10% em relação a plantas de controle.

12. Método de acordo com qualquer das reivindicações 5 a 11,caracterizado pelo fato de que dito ácido nucleico codificando uma proteínaHAL3 é operavelmente ligado a um promotor específico de broto,preferivelmente a um promotor de beta expansina.

13. Método de acordo com qualquer das reivindicações 5 a 12,caracterizado pelo fato de que dito ácido nucleico codificando uma proteínaHAL3 é de origem vegetal, preferivelmente de uma planta dicotiledônea,ainda preferivelmente da família Brassicaceae, mais preferivelmente dogênero Arabidopsis, mais preferivelmente de Arabidopsis thaliana.

14. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer reivindicação precedente, em que dita planta ou parte da mesmacompreende um ácido nucleico recombinante codificando um polipeptídeoHAL3.

15. Construção, caracterizada pelo fato de compreender:(a) um ácido nucleico codificando um polipeptídeo HAL3;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a) preferencialmente emtecido de broto de uma planta; e opcionalmente(c) uma seqüência de término de transcrição.

16. Construção de acordo com a reivindicação 15,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor específico de broto, preferivelmente um promotor debeta expansina.

17. Uso de uma construção como definida na reivindicação 15ou 16 caracterizado pelo fato de ser para estimular características relacionadasa rendimento em plantas, preferivelmente para aumentar rendimento e/ouvigor, em relação a plantas de controle.

18. Uso de acordo com a reivindicação 17, caracterizado pelofato de que dito rendimento é rendimento aumentado de sementes.

19. Uso de acordo com a reivindicação 17, caracterizado pelofato de que dito vigor é vigor precoce.

20. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com a construção como definida nasreivindicações 15 ou 16.

21. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(i) introduzir e aumentar preferencialmente expressão notecido de broto de uma planta de um ácido nucleico codificando umpolipeptídeo HAL3; e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.

22. Planta transgênica, caracterizada pelo fato tercaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, ditas características relacionadas a rendimento melhoradasresultando de aumento de expressão de um polipeptídeo HAL3preferencialmente no broto.

23. Planta transgênica de acordo com a reivindicação 14, 20 ou-22, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamonocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia.

24. Partes colhiveis de uma planta como definida em qualqueruma das reivindicações 14, 20, 22 ou 23, caracterizadas pelo fato de que ditaspartes colhíveis preferivelmente são sementes.

25. Produtos, caracterizados por serem derivados de umaplanta como definida na reivindicação 23 e/ou de partes colhíveis de umaplanta como definida na reivindicação 24.

26. Uso de um ácido nucleico codificando um polipeptídeoHAL3, cujo ácido nucleico é operavelmente ligado a um promotor específicode broto, caracterizado pelo fato de ser para melhorar característicasrelacionadas a rendimento em plantas.

27. Uso de acordo com a reivindicação 26, caracterizado pelofato de que ditas características relacionadas a rendimento abrangemrendimento de sementes e/ou vigor precoce.

28. Método para melhorar características relacionadas arendimento em plantas, caracterizado pelo fato de compreender modular,preferivelmente aumentar, expressão em uma planta de um ácido nucleicocodificando uma proteína MADS15.

29. Método de acordo com a reivindicação 28, caracterizadopelo fato de que dita proteína MADS15 compreende qualquer um ou mais dosseguintes motivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQID NO: 51.

30. Método de acordo com a reivindicação 28 a 29,caracterizado pelo fato de que dita expressão modulada é efetuada porqualquer um ou mais de identificação por ativação de T-DNA, TILLING,mutagênese dirigida a sítio, evolução dirigida ou recombinação homóloga.

31. Método de acordo com qualquer uma das reivindicações 28 a 29, caracterizado pelo fato de que dita expressão modulada é efetuadaintroduzindo e expressando em uma planta um ácido nucleico codificandoproteína MADS15, e em que a seqüência de aminoácidos de dita proteínaMADS15 compreende qualquer um ou mais dos seguintes motivos: SEQ IDNO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51.

32. Método de acordo com a reivindicação 31, caracterizadopelo fato de que dito ácido nucleico codificando uma proteína MADS15 équalquer um dos ácidos nucleicos SEQ LD NOs dados em Tabela D ou umaporção destes ou uma seqüência capaz de hibridizar com qualquer um dosácidos nucleicos SEQ ID NOs dados em Tabela D.

33. Método de acordo com a reivindicação 31, caracterizadopelo fato de que dito ácido nucleico codificando uma proteína MADS15codifica um ortólogo ou parálogo de qualquer dos ácidos nucleicos SEQ IDNOs dados em Tabela D.

34. Método de acordo com qualquer uma das reivindicações 28 a 33, caracterizado pelo fato de que dita característica relacionada arendimento melhorada é biomassa de raiz.

35. Método de acordo com qualquer das reivindicações 31 a 34, caracterizado pelo fato de que dito ácido nucleico codificando umaproteína MADS15 é operavelmente ligado a um promotor constitutivo,preferivelmente a um promotor GOS2.

36. Método de acordo com qualquer uma das reivindicações 31 a 35, caracterizado pelo fato de que dito ácido nucleico codificando umaproteína MADS15 é de origem vegetal, preferivelmente de uma plantamonocotiledônea, ainda preferivelmente da família Poaceae, maispreferivelmente do gênero Oryza, mais preferivelmente de Oryza sativa.

37. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 28 a 36, em que dita planta ou parte damesma compreende um ácido nucleico recombinante codificando umaproteína MADS15.

38. Construção, caracterizada pelo fato de compreender:(a) ácido nucleico codificando uma proteína MADS15, emque a seqüência de aminoácidos de dita proteína MADS15 compreendequalquer um ou mais dos seguintes motivos: SEQ ID NO: 48, SEQ ID NO:49, SEQ ID NO: 50, SEQ ID NO: 51;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(c) uma seqüência de término de transcrição.

39. Construção de acordo com a reivindicação 38,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor GOS2.

40. Uso de uma construção como definida na reivindicação 38ou 39, caracterizado pelo fato de ser para fazer plantas tendo característicasrelacionadas a rendimento melhoradas, particularmente rendimentoaumentado de raízes, em relação a plantas de controle.

41. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com uma construção como definida nareivindicação 38 ou 39.

42. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(i) introduzir e expressar em uma planta um ácido nucleicocodificando uma proteína MADS15, em que a seqüência de aminoácidos dedita proteína MADS15 compreende qualquer um ou mais dos seguintesmotivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51;e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.

43. Planta transgênica, caracterizada pelo fato de que temrendimento aumentado em relação a plantas de controle, dito rendimentoaumentado resultando de expressão aumentada de um ácido nucleicocodificando uma proteína MADS15, em que a seqüência de aminoácidos dedita proteína MADS15 compreende qualquer um ou mais dos seguintesmotivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51;ou uma célula de planta transgênica derivada de dita planta transgênica.

44. Planta transgênica de acordo com a reivindicação 37, 41 ou43, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamònocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia, ou uma célula de planta transgênica derivadade dita planta transgênica.

45. Partes colhíveis de uma planta como definido nareivindicação 44, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são raízes.

46. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 44 e/ou de partes colhíveis de umaplanta como definida na reivindicação 45.

47. Uso de um ácido nucleico codificando uma proteínaMADS15, caracterizado pelo fato de ser para melhorar característicasrelacionadas a rendimento em plantas, em que a seqüência de aminoácidos dedita proteína MADS15 compreende qualquer um ou mais dos seguintesmotivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51.

48. Uso de acordo com a reivindicação 47, caracterizado pelofato de que dita característica relacionada a rendimento melhorada é biomassaaumentada de raízes em relação a plantas de controle.

49. Método para melhorar características relacionadas arendimento em plantas em relação a plantas de controle adequadas,caracterizado pelo fato de compreender preferencialmente reduzir expressãode um gene MADS15 endógeno em dita planta.

50. Método de acordo com a reivindicação 49, caracterizadopelo fato de que dita proteína MADS15 compreende qualquer um ou mais dosseguintes motivos: SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 116,SEQ ED NO: 117.

51. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada porregulagem negativa mediada por RNA de expressão de gene.

52. Método de acordo com a reivindicação 51, caracterizadopelo fato de que dita regulagem negativa mediada por RNA é efetuada por co-supressão.

53. Método de acordo com a reivindicação 51, caracterizadopelo fato de que dita regulagem negativa mediada por RNA é efetuada poruso de seqüências de ácidos nucleicos anti-sentido de MADS15.

54. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada usando umarepetição invertida de um gene MADS15 ou fragmento deste, preferivelmentecapaz de formar uma estrutura em forma de grampo.

55. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada usandoribozimas com especificidade para um ácido nucleico MADS15.

56. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada pormutagênese por inserção.

57. Método de acordo com qualquer uma das reivindicações-49 a 56, caracterizado pelo fato de que dito gene MADS15 endógeno é umgene MADS15 como encontrado em uma planta em sua forma natural ou éum ácido nucleico MADS15 isolado subseqüentemente introduzido em umaplanta.

58. Método de acordo com a reivindicação 57, caracterizadopelo fato de que dito ácido nucleico MADS15 introduzido é operavelmenteligado a um promotor constitutivo, preferivelmente um promotor GOS2.

59. Método de acordo com a reivindicação 57 ou 58,caracterizado pelo fato de que dito ácido nucleico MADS15 introduzido é deuma fonte vegetal ou fonte artificial, preferivelmente em que plantas sãotransformadas com um ácido nucleico MADS15 homólogo ao gene MADS15endógeno, mais preferivelmente em que seqüências de ácidos nucleicos deMADS15 de plantas monocotiledôneas são usadas para transformação deplantas monocotiledôneas, além de preferivelmente em que seqüências deMADS15 da família Poaceae são usadas para transformação em plantas dafamília Poaceae, mais preferivelmente em que seqüências de ácidos nucleicosde MADS15 de arroz são usadas para transformar plantas de arroz.

60. Método de acordo com a reivindicação 59, caracterizadopelo fato de que dita seqüência de ácidos nucleicos de MADS15 de arrozcompreende um comprimento suficiente de nucleotídeos substancialmentecontíguos de SEQ ID NO: 109 (OsMADS 15) ou compreende umcomprimento suficiente de nucleotídeos substancialmente contíguos de umaseqüência de ácidos nucleicos codificando um ortólogo ou parálogo deOsMADS 15 (SEQ ID NO: 110).

61. Método de acordo com a reivindicação 60, caracterizadopelo fato de que ditos ortólogos ou parálogos de OsMADS 15 sãorepresentados por SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159 eSEQ ID NO: 161.

62. Método de acordo com a reivindicação 60 ou 61,caracterizado pelo fato de que ditos nucleotídeos substancialmente contíguosda seqüência de ácidos nucleicos codificando um ortólogo ou parálogo deOsMADS 15 (SEQ LD NO: 110) são nucleotídeos substancialmente contíguosde seqüências de ácidos nucleicos representados por SEQ ID NO: 146, SEQID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ IDNO: 156, SEQ ID NO: 158 e SEQ ID NO: 160.

63. Método de acordo com qualquer uma das reivindicações 49 a 62, caracterizado pelo fato de que ditas características relacionadas arendimento melhoradas compreende rendimento aumentado, preferivelmenterendimento aumentado de sementes e/ou biomassa aumentada.

64. Método de acordo com a reivindicação 63, caracterizadopelo fato de que dito rendimento aumentado de sementes é selecionada apartir de um ou mais dos seguintes: a) biomassa aumentada de sementes (pesode semente); b) número aumentado de flores por planta; e c) númeroaumentado de sementes (cheias).

65. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 49 a 64, em que dita planta ou parte deplanta compreende um ácido nucleico MADS15 recombinante.

66. Construção, caracterizada pelo fato de compreender:(i) um ácido nucleico MADS15 capaz de silenciar um geneMADS15 endógeno;(ii) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(iii) uma seqüência de término de transcrição.

67. Construção de acordo com a reivindicação 66,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor GOS 2.

68. Uso de uma construção como definida na reivindicação 66ou 67, caracterizado pelo fato de ser para fazer plantas tendo característicasrelacionadas a rendimento melhoradas, particularmente rendimento e/oubiomassa aumentada de sementes, em relação a plantas de controle.

69. Planta, parte de planta ou célula de planta caracterizadapelo fato de ser transformada com a construção como definida nareivindicação 66 ou 67.

70. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(i) introduzir e expressar em uma planta um ácido nucleicoMADS15 capaz de silenciar um gene MADS15 endógeno; e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.

71. Planta transgênica, caracterizada pelo fato de tercaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, ditas características relacionadas a rendimento melhoradasresultando de expressão diminuída de um ácido nucleico codificando umaproteína MADS15, em que a seqüência de aminoácidos de dita proteínaMADS15 compreende qualquer um ou mais dos seguintes motivos: SEQ IDNO: 114, SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117; ou umacélula de planta transgênica derivada de dita planta transgênica.

72. Planta transgênica de acordo com a reivindicação 65, 69 ou 71, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamonocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia, ou uma célula de planta transgênica derivadade dita planta transgênica.

73. Partes colhíveis de uma planta como definida nareivindicação 72, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.

74. Produtos, caracterizados por serem derivados de umaplanta como definida na reivindicação 72 e/ou de partes colhíveis de umaplanta como definida na reivindicação 73.

75. Uso de um ácido nucleico codificando MADS15 paramelhorar características relacionadas a rendimento em plantas, caracterizadopelo fato de que a seqüência de aminoácidos de dita proteína MADS15compreende qualquer um ou mais dos seguintes motivos: SEQ ID NO: 114,SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117.

76. Uso de acordo com a reivindicação 75, caracterizado pelofato de que ditas características relacionadas a rendimento melhoradascompreendem rendimento aumentado de sementes.

77. Método para aumentar rendimento de planta em relação aplantas de controle adequadas, caracterizado pelo fato de compreenderaumentar expressão em uma planta de um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT, e opcionalmente selecionar plantastendo rendimento aumentado.

78. Método para aumentar resistência a estresse abiótico emplantas em relação a plantas de controle, caracterizado pelo fato decompreender aumentar expressão em um a planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT, e opcionalmenteselecionar plantas tendo resistência aumentada a estresse abiótico.

79. Método de acordo com a reivindicação 78, caracterizadopelo fato de que dita resistência aumentada a estresse abiótico é eficiênciaaumentada de absorção de nutrientes, em relação a plantas de controle.

80. Método de acordo com qualquer das reivindicações 77 a-79, caracterizado pelo fato de que dita expressão aumentada é efetuadaintroduzindo e expressando em uma planta, parte de planta ou célula de plantaum ácido nucleico codificando um polipeptídeo de fator de transcrição PLT.

81. Método de acordo com a reivindicação 80, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcrição PLTé qualquer um dos ácidos nucleicos SEQ ID NOs dados em Tabela I ou umaporção destes ou uma seqüência capaz de hibridizar com qualquer um dosácidos nucleicos SEQ ED NOs dados em Tabela I.

82. Método de acordo com a reivindicação 80, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcrição PLTcodifica um ortólogo ou parálogo de qualquer dos ácidos nucleicos SEQ IDNOs dados em Tabela D.

83. Método de acordo com qualquer das reivindicações 77, 80, 81 e 82, caracterizado pelo fato de que dito rendimento aumentado érendimento aumentado de sementes.

84. Método de acordo com a reivindicação 83, caracterizadopelo fato de que dito rendimento de sementes é selecionada a partir de um oumais de: a) biomassa aumentada de sementes; b) número aumentado de florespor planta; c) número aumentado de sementes (cheias); d) taxa aumentada deenchimento de grãos; e) índice de colheita aumentado; f) Peso de MilSementes (TKW) aumentado; g) área de semente aumentada; h) comprimentode semente aumentado; e i) largura de semente aumentada.

85. Método de acordo com qualquer uma das reivindicações 80 a 84,caracterizado pelo fato de que dito ácido nucleico é operavelmenteligado a um promotor constitutivo, preferivelmente um promotor GOS2.

86. Método de acordo com qualquer uma das reivindicações 80 a 84, caracterizado pelo fato de que dito ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT é de origem vegetal, preferivelmentede uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae,mais preferivelmente do gênero Arabidopsis, mais preferivelmente deArabidopsis thaliana.

87. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 77 a 86, em que dita planta ou parte damesma compreende um ácido nucleico codificando um polipeptídeo de fatorde transcrição PLT, cujo ácido nucleico é operavelmente ligado a umpromotor constitutivo.

88. Construção, caracterizada pelo fato de compreender:(i) um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT;(ii) uma ou mais seqüências de controle, capazes de dirigirexpressão da seqüência de ácidos nucleicos of (i); e opcionalmente(iii) uma seqüência de término de transcrição.

89. Construção de acordo com a reivindicação 88,caracterizada pelo fato de que dito promotor constitutivo é um promotor GOS2.

90. Uso de uma construção como definida na reivindicação 88ou 89 caracterizado pelo fato de ser para fazer plantas tendo rendimentoaumentado, particularmente rendimento aumentado de sementes e/ouresistência aumentada a estresse abiótico, em relação a plantas de controle.

91. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com a construção como definida nareivindicação 88 ou 89.

92. Método para a produção de uma planta transgênica tendorendimento aumentado e/ou resistência aumentada a estresse abiótico,caracterizado pelo fato de compreender:(i) introduzir e expressar um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT em uma célula de planta; e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.

93. Planta transgênica, caracterizada pelo fato de terrendimento aumentado e/ou resistência aumentada a estresse abiótico emrelação a plantas de controle, resultando de expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição PLT5 ou célulade planta derivada de dita planta transgênica.

94. Planta transgênica de acordo com a reivindicação 87, 91 ou-93, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamonocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia, ou uma célula de planta transgênica derivadade dita planta transgênica.

95. Partes colhíveis de uma planta como definida nareivindicação 94, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.

96. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 94 e/ou de partes colhíveis de umaplanta como definida na reivindicação 93.

97. Uso de um ácido nucleico codificando um polipeptídeo defator de transcrição PLT, ou uso de um polipeptídeo de fator de transcriçãoPLT, caracterizado pelo fato de ser para aumentar resistência a estresseabiótico e/ou para melhorar rendimento de planta, especialmente rendimentode sementes, em relação a plantas de controle.

98. Método para melhorar características relacionadas arendimento em plantas, caracterizado pelo fato de compreender modularexpressão em uma planta de um ácido nucleico codificando um fator detranscrição bHLH representado por qualquer um de SEQ ID NO 213, SEQ IDNO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO:-297, SEQ ID NO: 299, SEQ ID NO: 301, ou ortólogos ou parálogos dequalquer dos mencionados acima.

99. Método de acordo com a reivindicação 98, caracterizadopelo fato de que dita expressão modulada é efetuada por qualquer um ou maisde identificação por ativação de T-DNA, TILLING, ou recombinaçãohomóloga.

100. Método de acordo com a reivindicação 98, caracterizadopelo fato de que dita expressão modulada é efetuada introduzindo eexpressando em uma planta um ácido nucleico codificando um fator detranscrição bHLH representado por qualquer um de SEQ ID NO 213, SEQ EDNO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO:- 297, SEQ ID NO: 299, SEQ ID NO: 301, ou ortólogos ou parálogos dequalquer das SEQ ID NOs mencionadas acima.

101. Método de acordo com qualquer uma das reivindicações- 98 a 100, caracterizado pelo fato de que dita característica relacionada arendimento melhorada é vigor precoce.

102. Método de acordo com a reivindicação 100, caracterizadopelo fato de que dito ácido nucleico é operavelmente ligado a um promotorconstitutivo, preferivelmente a um promotor GOS2.

103. Método de acordo com qualquer uma das reivindicações- 100 a 102, caracterizado pelo fato de que dito ácido nucleico é uma porção de,ou uma variante alélica de, ou uma variante de união de, ou uma seqüênciacapaz de hibridizar com uma seqüência de ácidos nucleicos de acordo comqualquer um de SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ IDNO: 226 e SEQ ID NO: 228, SEQ ID NO: 296, SEQ ID NO: 298, SEQ IDNO: 300, em que dita porção, variante alélica, variante de união ou seqüênciade hibridização codifica um fator de transcrição bHLH.

104. Método de acordo com qualquer uma das reivindicações- 98 a 103, caracterizado pelo fato de que dito ácido nucleico codificando umfator de transcrição bHLH é de origem vegetal, preferivelmente de uma plantamonocotiledônea, ainda preferivelmente da família Poaceae, maispreferivelmente do gênero Oryza, mais preferivelmente de Oryza sativa.

105. Planta ou parte da mesma incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 98 a 104, em que dita planta ou parte damesma compreende um ácido nucleico codificando um fator de transcriçãobHLH.

106. Polipeptídeo isolado, caracterizado pelo fato decompreender:(i) uma seqüência de aminoácidos representada por qualquerum de SEQ ED NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301;(ii) uma seqüência de aminoácidos tendo (a) em ordemcrescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%,85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais identidade de seqüência comqualquer uma das seqüências de aminoácidos representadas por SEQ ID NO:297, SEQ ID NO: 299 e SEQ ID NO: 301, e (b) um domínio bHLH.;(iii) derivados de qualquer das seqüências de aminoácidosdadas em (i) ou (ii) acima.

107. Molécula isolada de ácido nucleico, caracterizada pelofato de compreender:(i) um ácido nucleico representado por qualquer um de SEQID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;(ii) o complemento de um ácido nucleico representado porqualquer um de SEQ ID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;(iii) um ácido nucleico codificando um fator de transcriçãobHLH tendo (a) em ordem crescente de preferência, pelo menos 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou maisidentidade de seqüência com a seqüência de aminoácidos representada porqualquer uma de SEQ ID NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301, e(b) um domínio bHLH.

108. Construção, caracterizada pelo fato de compreender:(a) ácido nucleico codificando um fator de transcrição bHLHrepresentado por qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ IDNO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO:- 299, SEQ ID NO: 301, ou ortólogos ou parálogos de qualquer das SEQ IDNOs mencionadas acima;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(c) uma seqüência de término de transcrição.

109. Construção de acordo com a reivindicação 108,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor GOS2.

110. Uso de uma construção como definida na reivindicação 108 ou 109, caracterizado pelo fato de ser para fazer plantas tendocaracterísticas relacionadas a rendimento melhoradas, particularmente vigorprecoce, em relação a plantas de controle.

111. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com uma construção como definida nareivindicação 108 ou 109.

112. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(d) introduzir e expressar em uma planta um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer um deSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima; e(e) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.

113. Planta transgênica, caracterizada pelo fato de terrendimento aumentado em relação a plantas de controle, dito rendimentoaumentado resultando de expressão aumentada de um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer um deSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima, ouuma célula de planta transgênica derivada de dita planta transgênica.

114. Planta transgênica de acordo com a reivindicação 105, 111 ou 113, caracterizada pelo fato de que dita planta é uma planta de cultivoou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia, ou uma célula de planta transgênicaderivada de dita planta transgênica.

115. Partes colhíveis de uma planta como definida nareivindicação 114, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.

116. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 114 e/ou de partes colhíveis deuma planta como definida na reivindicação 115.

117. Uso de um ácido nucleico codificando um fator detranscrição bHLH representado por qualquer um de SEQ ID NO 213, SEQ IDNO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO:- 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ou parálogos dequalquer dos mencionados acima, caracterizado pelo fato de ser para melhorarcaracterísticas relacionadas a rendimento em plantas.

118. Uso de acordo com a reivindicação 117, caracterizadopelo fato de que dita característica relacionada a rendimento melhorada évigor precoce.

119. Método para aumentar rendimento em plantas em relaçãoa plantas de controle adequadas, caracterizado pelo fato de compreenderaumentar expressão em uma planta de um ácido nucleico codificando umpolipeptídeo fator de transcrição SPL15, e opcionalmente selecionar plantastendo rendimento aumentado.

120. Método de acordo com a reivindicação 119, caracterizadopelo fato de que dita expressão aumentada é efetuada por qualquer um oumais de: ativação de T-DNA, TILLING, mutagênese dirigida a sítio, evoluçãodirigida e recombinação homóloga.

121. Método de acordo com a reivindicação 119 caracterizadopelo fato de que dita expressão aumentada é efetuada introduzindo eexpressando em uma planta um ácido nucleico codificando um polipeptídeofator de transcrição SPLl5.

122. Método de acordo com a reivindicação 121, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcriçãoSPL15 é qualquer um dos ácidos nucleicos SEQ ID NOs dados em Tabela Nou uma porção destes ou uma seqüência capaz de hibridizar com qualquer umdos ácidos nucleicos SEQ ID NOs dados em Tabela N.

123. Método de acordo com a reivindicação 121, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcriçãoSPL15 codifica um ortólogo ou parálogo de qualquer dos ácidos nucleicosSEQ ID NOs dados em Tabela N.

124. Método de acordo com qualquer uma das reivindicações119 a 123, caracterizado pelo fato de que dito rendimento aumentado érendimento aumentado de sementes.

125. Método de acordo com a reivindicação 124, caracterizadopelo fato de que dito rendimento aumentado de sementes compreende um oumais de: a) biomassa acima da terra aumentada b) número aumentado deflores por planta; c) rendimento aumentado de sementes; d) númeroaumentado de sementes (cheias)); e) Peso de Mil Sementes (TKW)aumentado; e f) índice de colheita aumentado.

126. Método de acordo com qualquer uma das reivindicações-121 a 125, caracterizado pelo fato de que dito ácido nucleico é operavelmenteligado a um promotor constitutivo, preferivelmente a um promotor HMGB(grupo B de alta mobilidade) ou um promotor GOS2, ainda preferivelmente aum promotor HMGB de arroz ou um promotor GOS2 de arroz.

127. Método de acordo com qualquer uma das reivindicações-121a 126, caracterizado pelo fato de que dito ácido nucleico codificando umpolipeptídeo fator de transcrição SPL15 é de origem vegetal, preferivelmentede uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae,mais preferivelmente de Arabidopsis thaliana.

128. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 119 a 127, em que dita planta ou parte damesma compreende um ácido nucleico recombinante codificando um fator detranscrição SPL15.

129. Construção, caracterizada pelo fato de compreender:(a) um ácido nucleico codificando um polipeptídeo fator detranscrição SPL15;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(c) uma seqüência de término de transcrição.

130. Construção de acordo com a reivindicação 129,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor HMGB ouum promotor GOS2.

131. Uso de uma construção como definida na reivindicação-129 ou 130, caracterizado pelo fato de ser para fazer plantas tendo rendimentoaumentada, em relação a plantas de controle.

132. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com uma construção como definida nareivindicação 129 ou 130.

133. Método para a produção de uma planta transgênica tendorendimento aumentado em relação a plantas de controle, caracterizado pelofato de compreender:(f) introduzir e expressar um ácido nucleico codificando umpolipeptídeo fator de transcrição SPL15 em uma célula de planta; e(g) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.

134. Planta transgênica, caracterizada pelo fato de terrendimento aumentado em relação a plantas de controle, dito rendimentoaumentado resultando de expressão aumentada de um ácido nucleicocodificando um fator de transcrição SPLl 5.

135. Planta transgênica de acordo com a reivindicação 128,132 ou 134, caracterizada pelo fato de que dita planta é uma planta de cultivoou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia, ou uma célula de planta transgênicaderivada de dita planta transgênica.

136. Partes colhíveis de uma planta como definida nareivindicação 135, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.

137. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 135 e/ou de partes colhíveis deuma planta como definida na reivindicação 136.

138. Uso de um ácido nucleico codificando um polipeptídeofator de transcrição SPLl 5, caracterizado pelo fato de ser para aumentarrendimento em uma planta em relação a plantas de controle.

139. Uso de acordo com a reivindicação 138, caracterizado pelofato de que dito rendimento aumentado é rendimento aumentado de sementes.