BRPI0709258A2 - métodos para melhorar caracterìsticas relacionadas a rendimento em plantas, para a produção de uma planta transgênica, para aumentar rendimento de planta em relação a plantas de controle adequadas e para aumentar resistência a estresse abiótico em plantas em relação a plantas de controle, planta ou parte da mesma, construção, uso de uma construção, planta, parte de planta ou célula de planta, planta transgênica, partes colhìveis de uma planta, produtos, usos de um ácido nucleico, polipeptìdeo isolado, e, molécula isolada de ácido nucleico - Google Patents
métodos para melhorar caracterìsticas relacionadas a rendimento em plantas, para a produção de uma planta transgênica, para aumentar rendimento de planta em relação a plantas de controle adequadas e para aumentar resistência a estresse abiótico em plantas em relação a plantas de controle, planta ou parte da mesma, construção, uso de uma construção, planta, parte de planta ou célula de planta, planta transgênica, partes colhìveis de uma planta, produtos, usos de um ácido nucleico, polipeptìdeo isolado, e, molécula isolada de ácido nucleico Download PDFInfo
- Publication number
- BRPI0709258A2 BRPI0709258A2 BRPI0709258-0A BRPI0709258A BRPI0709258A2 BR PI0709258 A2 BRPI0709258 A2 BR PI0709258A2 BR PI0709258 A BRPI0709258 A BR PI0709258A BR PI0709258 A2 BRPI0709258 A2 BR PI0709258A2
- Authority
- BR
- Brazil
- Prior art keywords
- plant
- seq
- nucleic acid
- plants
- increased
- Prior art date
Links
Landscapes
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
MéTODOS PARA MELHORAR CARACTERìSTICAS RELACIONADAS A RENDIMENTO EM PLANTAS, PARA A PRODUçãO DE UMA PLANTA TRANSGêNICA, PARA AUMENTAR RENDIMENTO DE PLANTA EM RELAçãO A PLANTAS DE CONTROLE ADEQUADAS E PARA AUMENTAR RESISTêNCIA A ESTRESSE ABIóTICO EM PLANTAS EM RELAçãO A PLANTAS DE CONTROLE, PLANTA OU PARTE DA MESMA, CONSTRUçãO, USO DE UMA CONSTRUçãO, PLANTA, PARTE DE PLANTA OU CéLULA DE PLANTA, PLANTA TRANSGêNICA, PARTES COLHìVEIS DE UMA PLANTA, PRODUTOS, USOS DE UM áCIDO NUCLEICO, E DE UMA CONSTRUçãO POLIPEPTìDEO ISOLADO, E, MOLéCULA ISOLADA DE áCIDO NUCLEICO. A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar características relacionadas a rendimento em plantas, em particular para aumentar rendimento de planta e/ou vigor precoce, em relação a plantas de controle. Mais especificamente, a presente invenção se relaciona a um método para melhorar características relacionadas a rendimento compreendendo modificar a expressão de um ácido nucleico codificando um polipeptídeo HAL3, polipeptídeo MADS15, polipeptídeo fator de transcrição PLT, fator de transcrição basic/helix-loop-helix (bHLH), ou fator de transcrição SPL15. A invenção também fornece construções úteis nos métodos da invenção.
Description
' "MÉTODOS PARA MELHORAR CARACTERÍSTICASRELACIONADAS A RENDIMENTO EM PLANTAS, PARA APRODUÇÃO DE UMA PLANTA TRANSGÉNICA, PARA AUMENTARRENDIMENTO DE PLANTA EM RELAÇÃO A PLANTAS DECONTROLE ADEQUADAS E PARA AUMENTAR RESISTÊNCIA AESTRESSE ABIÓTICO EM PLANTAS EM RELAÇÃO A PLANTAS DECONTROLE, PLANTA OU PARTE DA MESMA, CONSTRUÇÃO, USODE UMA CONSTRUÇÃO, PLANTA, PARTE DE PLANTA OU CÉLULADE PLANTA, PLANTA TRANSGÉNICA, PARTES COLHÍVEIS DE UMAPLANTA, PRODUTOS, USO DE UM ÁCIDO NUCLEICO,POLIPEPTÍDEO ISOLADO, E, MOLÉCULA ISOLADA DE ÁCIDONUCLEICO"
A presente invenção geralmente se refere ao campo debiologia molecular e se relaciona a um método para melhorar váriascaracterísticas de crescimento vegetal modulando expressão em uma planta deum ácido nucleico codificando uma GRP (Proteína Relacionada aCrescimento). A presente invenção também se relaciona a plantas tendoexpressão modulada de um ácido nucleico codificando uma GRP, cujasplantas têm características de crescimento melhoradas em relação a plantastipo selvagem correspondentes ou outras plantas de controle. A invençãotambém fornece construções úteis nos métodos da invenção.
A sempre crescente população mundial e a oferta minguantede terra arável disponível para agricultura impulsiona pesquisa para aumentara eficiência de agricultura. Meios convencionais para melhoramentosculturais e horticulturais utilizam técnicas de melhoramento seletivo paraidentificar plantas tendo características desejáveis. Entretanto, tais técnicas demelhoramento seletivo têm diversas desvantagens, quer dizer que estastécnicas são tipicamente de trabalho intensivo e resultam em plantas quefreqüentemente contêm componentes genéticos heterogêneos que podem nemsempre resultar na característica desejável sendo passada adiante a partir deplantas parentais. Avanços em biologia molecular permitiram ao ser humanomodificar o germoplasma de animais e plantas. Engenharia genética deplantas exige o isolamento e manipulação de material genético (tipicamentena forma de DNA ou RNA) e a subseqüente introdução de tal materialgenético em uma planta. Tal tecnologia tem a capacidade de gerar culturas ouplantas tendo várias características econômicas, agronômicas ou horticulturaismelhoradas.
Uma característica de particular interesse econômico éprodução aumentada. Produção normalmente é definido como a produçãomensurável de valor econômico de uma cultura. Isto pode ser definido emtermos de quantidade e/ou qualidade. Produção é diretamente dependente dediversos fatores, por exemplo, o número e tamanho dos órgãos, arquiteturavegetal (por exemplo, o número de galhos), produção de sementes,senescência foliar e mais. Desenvolvimento de raiz, absorção de nutrientes,tolerância a estresse e vigor precoce também podem ser fatores importantespara determinar produção. Otimizar os fatores mencionados acima podeportanto contribuir para aumentar produção de cultura.
Produção de sementes é uma característica particularmenteimportante, uma vez que as sementes de muitas plantas são importantes paranutrição humana e animal. Colheitas tal como, milho, arroz, trigo, canola esoja respondem por mais da metade do consumo calórico humano total, queratravés de consumo das próprias sementes ou através de consumo de produtosde carne criados com sementes processadas. Elas também são uma fonte deaçúcares, óleos e muitos tipos de metabólitos usados em processos industriais.Sementes contêm um embrião ( a fonte de novas partes aéreas e raízes) e umendosperma ( a fonte de nutrientes para crescimento de embrião durantegerminação e durante crescimento precoce de plântulas). O desenvolvimentode uma semente envolve muitos genes, e requer a transferência de metabólitosdas raízes, folhas e caules para a semente em desenvolvimento. Oendosperma, em particular, assimila os precursores metabólicos decarboidratos, óleos e proteínas e sintetiza estes em macromoléculas dearmazenamento para preencher o grão.
Outra importante característica para muitas culturas é vigorprecoce. Melhorar vigor precoce é um importante objetivo de programasmodernos de melhoramento de arroz tanto em cultivares de arroz temperadascomo tropicais. Raízes longas são importantes para ancoramento apropriadoao solo em arroz semeado em água. Onde arroz é semeado diretamente emcampos alagados, e onde plantas devem emergir rapidamente através de água,partes aéreas maiores estão associados com vigor. Onde sementeira em sulcosé praticada, mesocótilos e coleóptilos maiores são importantes para boaemergência de plântula. A capacidade de manipular vigor precoce em plantasseria de grande importância em agricultura. Por exemplo, vigor precoce fracotem sido uma limitação para a introdução de híbridos de milho (Zea mays L.)baseados em germoplasma de Cinturão do Milho no Atlântico Europeu.
Uma característica importante adicional é aquela de tolerânciamelhorada a estresse abiótico. Estresse abiótico é uma causa primária deperda de cultura ao redor do mundo, reduzindo produções médias para amaioria das principais cultivares em mais do que 50% (Wang et al., Planta(2003) 218: 1-14). Estresses abióticos podem ser causados por seca,salinidade, extremos de temperatura, toxicidade química e estresse oxidativo.
A capacidade de melhorar tolerância vegetal a estresse abiótico seria degrande vantagem econômica para fazendeiros ao redor do mundo e iriapermitir o cultivo de culturas durante condições adversas e em territórios ondecultivo de culturas pode não ser possível de outra maneira.
Rendimento de colheita portanto pode ser aumentadootimizando um dos fatores mencionados acima.
Dependendo da utilização, a modificação de certascaracterísticas de produção pode ser favorecida sobre outras. Por exemplopara aplicações tal como produção de forragem ou madeira, ou recurso debiocombustível, um aumento nas partes vegetativas de uma planta pode serdesejável, e para aplicações tal como produção de trigo, amido ou óleo, umaumento em parâmetros de semente pode ser particularmente desejável.
Mesmo entre os parâmetros de semente, alguns podem ser favorecidos sobreoutros, dependendo da aplicação. Vários mecanismos podem contribuir paraaumentar produção de sementes, quer isto seja na forma de tamanho desemente aumentado ou número de sementes aumentado.
Uma abordagem para aumentar produção (produção e/oubiomassa de sementes) em plantas pode ser através de modificação dosmecanismos de crescimento inerentes de uma planta, tal como o ciclo celularou várias vias de sinalização envolvidas em crescimento vegetal ou emmecanismos de defesa.
Foi descoberto agora que várias características de crescimentopodem ser melhoradas em plantas modulando expressão em uma planta de umácido nucleico codificando uma GRP (Proteína Relacionada a Crescimento)em uma planta. A GRP pode ser uma das seguintes: um fator de transcriçãoMADS-box (OsMADS15), um fator de transcrição PLT, um fator detranscrição bHLH, um fator de transcrição SPL15, e uma proteína dehalotolerância (HAL3).
INTRODUÇÃO
Proteínas de halotolerância
Muitos processos enzimáticos em uma célula requerem oenvolvimento de Coenzima A (CoA ou CoASH). Coenzima A (CoASH) éuma molécula altamente polar, consistindo de adenosina 3',5'-difosfato ligadaa ácido 4-fosfopantetênico (Vitamina B5) e desde então a β-mercaptoetilamina. O grupo SH livre pode ser esterificado, dependendo doprocesso no qual CoA está envolvida. A via de síntese de CoA foi elucidadaem bactérias, animais e plantas. Em plantas, a conversão do precursor de CoA4'-fosfopantotenoil-cisteína (PPC) em 4'-fosfopanteteína é catalisada pelaflavoproteína 4'-fosfopantotenoil-cisteína descarboxilase (PPCDC ou HAL3,Kupke et al. J. Biol. Chem. 276, 19190-19196, 2001). O gene codificandoproteínas HAL3 pode ser parte de uma família pequena de genes: o genomade Arabidopsis compreende duas isoformas (AtHAL3a e AtHAL3b;Espinoza-Ruiz et al. Plant J. 20, 529-539, 1999), em tabaco 3 genes HAL3estão presentes (Yonamine et al. J. Exp. Bot. 55, 387-395, 2004), embora emarroz HAL3 seja um gene de única cópia. E sugerido que AtHAL3 e outrasproteínas HAL3 funcionem como um trímero, com cada monômero tendo ummononucleotídeo de flavina (FMN) ligado (Albert et al. Structure 8, 961-969,2000). É postulado que o cofator FMN desempenha um papel na reação redoxgerando 4'- fosfopanteteína.
A função molecular de proteínas HAL3 não é completamenteelucidada ainda. As proteínas HAL3 mostram homologia com a proteína SIS2de levedura, que está envolvida em halotolerância (Ferrando et al., Mol. Cell.Biol. 15, 5470-5481). Plantas ou células de planta expressando ectopicamenteHALS mostram tolerância salina, osmótica ou a estresse por lítio melhorada(Espinoza-Ruiz et al., 1999; Yonamine et al., 2004). Superexpressão deHAL3a tabaco em células BY2 de acordo com o relatado causou um aumentoem conteúdo intracelular de prolina, o que pode contribuir para o fenótipotolerante a sal (Yonamine et al., 2004). Além disso, plantas de Arabidopsissuperexpressando AtHALSa apresentaram uma taxa de crescimento maisrápida do que as plantas tipo selvagem (Espinoza-Ruiz et al., 1999). Aproteína AtHAL3b também mostrou interagir com a proteína de ciclo celularCDKBl;1 (Patente Internacional 00/36124), portanto foi postulado queAtHAL3b é útil para conferir tolerância a estresse salino a plantas e paraaumentar a taxa de crescimento de plantas em condições de estresse salino.Surpreendentemente, foi descoberto agora que aumentar preferencialmenteexpressão de um ácido nucleico codificando um polipeptídeo HAL3 emtecidos em expansão gera plantas tendo produção aumentada em relação aplantas de controle, cujo aumento de produção é de pelo menos 10%comparado com as plantas de controle.
Fatores de transcrição
Fatores de transcrição normalmente são definidos comoproteínas que se ligam a um elemento cis-regulador (eg. um acentuador, umacaixa TATA) e que, em associação com RNA polimerase, são capazes deativar e/ou reprimir transcrição. O genoma de Arabidopsis codifica para pelomenos 1533 reguladores transcricionais, que respondem por -5.9% de seunúmero total estimado de genes (Riechmann et aí., 2000 (Science Vol. 290,2105-2109)).
MADS15
Os genes MADS-box constituem uma grande família de genesde reguladores transcricionais eucarióticos envolvidos em diversos aspectosde desenvolvimento de levedura, planta e animal. Genes MADS-boxcodificam um domínio MADS fortemente conservado responsável por ligarDNA a caixas específicas na região reguladora de seus genes alvo. A famíliade genes pode ser dividida em duas linhagens principais, tipo I e tipo II.Genes Tipo II também são chamados de proteínas tipo MIKC5 referindo aosquatro domínios funcionais que eles possuem (Figura 5, (Jack, Plant Mol.Biol. 46,515-520, 2001)):
- MADS para ligação de DNA5 cerca de 60 aminoácidos(altamente conservados) localizado na extremidade N-terminal da proteína;- I para domínio interveniente (menos conservado),envolvido na formação seletiva de dímero MADS;
- K para domínio de queratina (bem conservado)responsável por dimerização;
- C para região C-terminal (variável em seqüência ecomprimento) envolvida em ativação transcricional, ou na formação de umcomplexo multimérico de fator de transcrição.
Mais de 100 genes MADS-box foram identificados emArabidopsis, e foram filogeneticamente classificados em 12 ciados, cadaciado tendo derivações específicas do consenso de MADS (Thiessen et ai. JMol. Evol. 43, 484-516, 1996). OsMADS15 pertence ao ciado SQUA (paraSQUAMOSA, de Antirrhinum majus). Genes do ciado SQUA sãoclassificados como genes de identidade de órgão de função A com referênciaao modelo de especificação de identidade de órgão floral ABC, proposto porCoen e Meyerowitz em 1991 (Nature 353, 31-7). Além de OsMADS15,OsMADS 14, OsMADS18, e OsMADS20 de arroz também são parte do ciadoSQUA.
O ciado SQUA em plantas dicotiledôneas (dicotiledôneas) ésubdividido em dois subgrupos, os subclados APl e o FUL (nos qualOsMADS 15 se agrupa). Estes subclados divergem essencialmente comrespeito aos motivos de aminoácidos específicos localizados no término C desuas respectivas proteínas (Litt and Irish, Genetics 165, 821-833, 2003). Emadição à presença de um motivo de aminoácido APl específico, as proteínasrelacionadas a ciado APl de dicotiledônea normalmente compreendem ummotivo de farnesilação no término C (este motivo é CAAX, onde C é cisteína,A normalmente é um aminoácido alifático, e X é metionina, glutamina,serina, cisteína ou alanina). Em plantas monocotiledôneas(monocotiledôneas), as proteínas de ciado SQUA também são subdivididasem dois grupos principais, que podem ser distinguidos baseados em motivosC-terminais conservados localizados dentro dos últimos 15 aminoácidos dasproteínas: LPPWMLS (por exemplo, OsMADS 15, SEQ ID NO: 117) eLPPWMLR (por exemplo, OsMADS 18). Em contraste com seqüências dedicotiledôneas do ciado SQUA, seqüências de monocotiledôneas do ciadoSQUA não possuem um motivo de farnesilação em seu término C.OsMADS 15 foi postulado funcionar em um complexo comoutras proteínas para controlar formação de órgão. Entretanto, até agoranenhum mutante com um fenótipo visível foi identificado; nenhum dadoexperimental foi apresentado em relação à expressão ectópica ou expressãodiminuída de OsMADSl 5, exceto para os dados apresentados em PatenteInternacional 01/14559 (Patente Européia 1209232, Patente Norte-Americana6.995.302). Nesta descrição, plantas transgênicas de Fagopyrum esculentumexpressando OsMADS15 em direção sentido mostraram ramificaçãoaumentada, ao passo que transgênicas expressando a construção antisentidotiveram crescimento diminuído e ramificação suprimida. Kalanchoèdaigremontiana transformada com a construção sentido teve desenvolvimentofoliar ao redor das raízes, que foi adotado como uma indicação de ramificaçãoaumentada. Os autores determinaram que nenhuma mudança foi observadaem termos de desenvolvimento floral e estrutura destas flores. O ortólogo deOsMADS 15 em Arabidopsis é APETALAI (AP1). Expressão ectópica deAPl resulta em uma diminuição de tempo de florescimento, e APl mutantesexibem florescimento atrasado e têm flores anormais.
PLT
A família de AP2(apetala2)/ERF (fator de ligação de elementoresponsivo a etileno) compreende fatores de transcrição com pelo menos umdomínio de ligação de DNA altamente conservado, o domínio AP2. Odomínio AP2 foi originalmente descrito em APETALA2 (AP2), uma proteínade Arabidopsis envolvida em programas de desenvolvimento tal comoregulação de identidade de meristema e especificação de órgão floral (Jofukuet al, (1994) Plant Cell 6, 1211-1225). Proteínas AP2/ERF são divididas emsubfamílias baseado em se elas contêm um (subfamília ERF) ou dois(subfamília AP2) domínios de ligação de DNA (Figura 12). Mais do que 140genes AP2/ERF foram identificados no genoma de Arabidopsis thaliana(Reichmann et ai. (2000) Science 290: 2105-2110), dentre os quais até 18pertencem à subfamília AP2 (Kim et ai. (2006) Mol Bio Evol 23(1): 107-120).
Dois polipeptídeos de fator de transcrição AP2 de Arabidopsis,codificados pelos genes Plethora 1 (PLTl) e Plethora 2 (PLT2),colletivamente chamados de genes PLT, mostraram ser requeridos paraespecificação de célula tronco e manutenção especificamente no meristema deraiz. Em análise RT-PCR, transcritos de PLT foram detectadosprincipalmente em raízes in, indicando que expressão de PLT é fortementeassociada com identidade de raiz. Expressão ectópica de PLT no embrião deArabidopsis induz transformação homeótica de domínios apicais em célulastronco de raiz, raízes, ou hipocótilos (Aida et al (2004) Cell 119:109-120).
Pedido de Patente Norte-Americana 2004/0045049 e Pedidode Patente Internacional W003/013227 fornecem a seqüência de ácidosnucleicos codificando o fator de transcrição PLTl de Arabidopsis (referidosnos pedidos como Gl 793). Superexpressão de G1793 (usando o promotorCaMV 35S) em Arabidopsis foi relatada produzindo alterações emmorfologia de coltilédone, uma leve redução em tamanho geral de planta einflorescências finas (possivelmente com flores anormais) comparado comcontroles tipo selvagem. Superexpressores de G1793 produzem mais óleo desemente do que plantas de controle. Seqüências de ácidos nucleicoscodificando ortólogos potenciais de Glycine max, Oryza sativa e Zea mayssão fornecidas.
Pedido de Patente Internacional WO 03/002751 estabeleceuma seqüência de ácidos nucleicos de Glycine max codificando umpolipeptídeo PLT, com similaridade de seqüência com uma seqüência deácidos nucleicos de milho identificada por definição de perfil de (pormicroarranjo de DNA).
Pedido de Patente Internacional WO 05/075655 estabeleceseqüências de ácidos nucleicos de Oryza sativa e Zea mays com similaridadede seqüência com os genes PLT de Arabidopsis.
bHLH
As proteínas hélice-alça-hélice básicas (bHLH) são umasuperfamília de fatores de transcrição que se ligam como dímeros a sítios alvode DNA específicos e que foram bem caracterizados em eucariotos nãovegetais como componentes reguladores importantes em diversos processosbiológicos. As características diferenciadas da superfamília bHLH é umdomínio bipartido consistindo de aproximadamente 60 aminoácidos. Estedomínio bipartido é compreendido de uma região básica de ligação de DNA,que se liga a um hexanucleotídeo consenso E-box e duas α-hélices separadaspor uma região circular variável. As duas α-hélices promovem dimerização,permitindo a formação de homo e heterodímeros entre diferentes membros defamília. Enquanto que o domínio bHLH é evolutivamente conservada, hápouca similaridade de seqüência entre ciados além do domínio.
Bailey et ai, 2003 (The Plant Cell, Vol. 15, 2497-2501)relatam o número total de genes bHLH detectados em Arabidopsis thalianacomo sendo 162, tornando genes bHLH uma das maiores famílias de fatoresde transcrição em Arabidopsis; o genoma de arroz de acordo com o relatadocontém 131 genes bHLH (Buck and Atchley, 2003 (J. Mol. Evol. 56:742-750)). Heim et al., 2003 (Mol. Biol. Evol. 20(5):735-747) identificaram 12subfamílias de genes bHLH de Arabidopsis thaliana baseados emsimilaridades estruturais.
As proteínas bHLH de plantas que foram caracterizadas foramrelatadas funcionando em biossíntese de antocianina, sinalização defitocromo, expressão de globulina, deiscência dos frutos, desenvolvimento decarpelo e epidérmico (Buck and Atchley, 2003).
SPL
Os polipeptídeos de fator de transcrição tipo proteína deligação de promotor Squamosa (SPL) são proteínas estruturalmente diversasque compartilham um domínio de ligação de DNA (DBD) altamenteconservado de cerca de 80 resíduos de aminoácidos de comprimento (Klein etal. (1996) Mol Gen Genet 259: 7-16; Cardon et al. (1999) Gene 237: 91-104).O sítio de ligação de seqüência consenso de DNA de fator de transcrição SPLno promotor de genes alvo é 5 '-TNCGTACAA-3' onde N representa qualquerbase. Dentro do DBD de SPL há dez resíduos conservados de cisteína (Cys)ou histidina (His) (veja Figura 23) dos quais oito são resíduos coordenadoresde zinco ligando dois íons de zinco necessários para a formação de estruturaterciária de dedo de zinco específico de SPL (Yamasaki et al. (2004) J MolBiol 337: 49-63). Uma segunda característica conservada dentro do DBD deSPL é um sinal de localização nuclear bipartido. Fora do DBD, um motivoalvo (miR156) de micro RNA (miRNA) é encontrado na maioria dasseqüências de ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL (ou na região de codificação, ou na 3' UTR) ao longo doreino vegetal (Rhoades et al. (2002) Cell 110: 513-520). miRNAs controlamexpressão de gene SPL pós-transcricionalmente direcionando mRNAscodificando SPL para degradação ou por repressão traducional.
Riechmann et al. (Science 290: 2105-2109, 2000) relatam 16polipeptídeos de fator de transcrição SPL em Arabidopsis thaliana, compouca similaridade de seqüência entre eles (além das característicasmencionadas acima), o tamanho do polipeptídeo SPL deduzido variando de131 a 927 aminoácidos. Contudo, pares de polipeptídeos de fator detranscrição SPL compartilhando maior homologia de seqüência foramdetectadas dentro da família SPL desta planta (Cardon et al. (1999)).
Os polipeptídeos de fator de transcrição SPL (apenasencontrados em plantas) caracterizados até o momento demonstraramfuncionar em desenvolvimento vegetal, em particular em desenvolvimentofloral. Plantas transgênicas superexpressando um polipeptídeo de fator detranscrição SPL3 demonstraram florescer mais cedo (Cardon et al. (1997)PlantJ 12:367-377).
Em Pedido de Patente Européia EP1033405, as seqüências deácidos nucleicos e polipeptídeo deduzido do polipeptídeo de fator detranscrição SPL15 são apresentadas.
Em Pedido de Patente Internacional W003013227, aseqüência de ácidos nucleicos (e seqüência de polipeptídeo deduzido;referência interna G2346) é apresentada que codifica parte do polipeptídeo defator de transcrição SPL15 entretanto 38 aminoácidos da extremidade C-terminal do fator de transcrição SPLl5. Plantas transgênicas de Arabidopsisthaliana superexpressando constitutivamente o polipeptídeo de fator detranscrição SPL15 modificado (ou G2346) teve cotilédones levementeaumentados. Em estágios tardios de desenvolvimento, as mesmas plantas nãodemonstraram nenhuma diferença consistente de plantas de controle.
SUMÁRIO DA INVENÇÃO
Surpreendentemente, foi descoberto agora que aumentarpreferencialmente expressão de um ácido nucleico codificando umpolipeptídeo HAL3 em tecidos em expansão gera plantas tendo característicasde produção melhoradas, em particular vigor precoce aumentado e produçãoaumentada de sementes em relação a plantas de controle, cujo aumento emprodução de sementes é pelo menos 10% comparado com as plantas decontrole.
De acordo com outra forma de realização da presenteinvenção, é fornecido um método para melhorar características de produção,em particular para aumentar vigor precoce de uma planta e aumentarprodução de sementes de uma planta, em relação a plantas de controle,compreendendo aumentar preferencialmente expressão de um ácido nucleicocodificando um polipeptídeo HAL3 em tecidos em expansão de uma planta.
Surpreendentemente, foi descoberto agora que modularexpressão de um ácido nucleico codificando um polipeptídeo MADS15 geraplantas tendo características de produção melhoradas, em particular produçãoaumentada em relação a plantas de controle.
De acordo com uma forma de realização, é fornecido ummétodo para aumentar produção vegetal em relação a plantas de controle,compreendendo aumentar expressão de um ácido nucleico codificando umpolipeptídeo MADS15 em uma planta. A produção aumentada compreendeubiomassa vegetativa aumentada, mas não produção aumentada de sementes.
De acordo com outra forma de realização, a presente invençãofornece métodos para aumentar produção de uma planta em relação a plantasde controle, compreendendo diminuir o nível e/ou atividade de umpolipeptídeo MADS15 endógeno. A produção aumentada compreendeu maiorprodução de sementes, mas não compreendeu biomassa vegetativaaumentada.
Surpreendentemente, foi descoberto agora que aumentarexpressão de um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT gera plantas tendo características de produção melhoradas,em particular produção aumentada em relação a plantas de controle.
De acordo com uma forma de realização adicional, é fornecidoum método para aumentar produção vegetal em relação a plantas de controle,compreendendo aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT.
Surpreendentemente, foi descoberto agora que modularexpressão em uma planta de um ácido nucleico codificando uma classeparticular de fator de transcrição bHLH gera plantas tendo características deprodução melhoradas em relação a plantas de controle. A classe particular defator de transcrição bHLH adequada para melhorar características deprodução em plantas é descrita em detalhe abaixo.
De acordo com uma forma de realização adicional, a presenteinvenção fornece um método para melhorar características de produção emplantas em relação a plantas de controle, compreendendo modular expressãoem uma planta de um ácido nucleico codificando uma classe particular defator de transcrição bHLH.
Surpreendentemente, foi descoberto agora que aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeode fator de transcrição SPL15 gera plantas tendo características de produçãomelhoradas, em particular produção aumentada em relação a plantas decontrole.
De acordo com uma forma de realização adicional, a invençãofornece um método para aumentar produção em plantas em relação a plantasde controle, compreendendo aumentar expressão em uma planta de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15.DEFINIÇÕES
Polipeptideo(S)ZProteina(S)
Os termos "polipeptídeo" e "proteína" são usadospermutavelmente neste lugar e se referem a aminoácidos em uma formapolimérica de qualquer comprimento.
Polinucleotídeo(s)/Acido(s) nucleico(s)/Seqüência(s) de ácidosnucleicos/seqüência(s) de nucleotídeos
Os termos "polinucleotídeo(s)", "seqüência(s) de ácidosnucleicos", "seqüência(s) de nucleotídeos", "ácido(s) nucleico(s)" são usadospermutavelmente neste lugar e se referem a nucleotídeos, ou ribonucleotídeosou desoxirribonucleotídeos ou uma combinação de ambos, em uma formapolimérica de qualquer comprimento.
Planta(s) de controle
A escolha de plantas de controle adequadas é uma parte derotina de uma estrutura experimental e pode incluir plantas tipo selvagemcorrespondentes ou plantas correspondentes sem o gene de interesse. A plantade controle é tipicamente da mesma espécie de planta ou mesmo a mesmavariedade do que a planta a ser verificada. A planta de controle também podeser um nulizigoto da planta a ser verificada. Uma "planta de controle" comousado neste lugar se refere não apenas a plantas inteiras, mas também a partesvegetais, incluindo sementes e partes de sementes.
Homólogo(s)
"Homólogos" de uma proteína abrangem peptídeos,oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições,deleções e/ou inserções de aminoácidos em relação à proteína não modificadaem questão e tendo atividade biológica e funcional similar à proteína nãomodificada da qual eles são derivados.
Uma deleção se refere a remoção de um ou mais aminoácidosde uma proteína.
Uma inserção se refere a um ou mais resíduos de aminoácidossendo introduzidos em um sítio pré-determinado em uma proteína. Inserçõespodem compreender fusões N-terminais e/ou C-terminais assim comoinserções intra-seqüência de aminoácidos únicos ou múltiplos. Geralmente,inserções dentro da seqüência de aminoácidos serão menores do que fusõesN- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos deproteínas ou peptídeos de fusão N- ou C-terminais incluem o domínio deligação ou domínio de ativação de um ativador transcricional como usado nosistema de dois híbridos de levedura, proteínas de revestimento de fago,etiqueta de (histidina)-ó, etiqueta de glutationa S-transferase, proteína A,proteína de ligação de maltose, dihidrofolato redutase, epítopo Etiqueta· 100,epítopo c-myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligaçãocalmodulina), epítopo HA, epítopo de proteína C e epítopo VSV.
Uma substituição se refere à substituição de aminoácidos daproteína por outros aminoácidos tendo propriedades similares (tal comohidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ouquebrar estruturas α-helicoidais ou estruturas de folha β similares).Substituições de aminoácidos tipicamente são de resíduos únicos, mas podemser agrupadas dependendo de restrições funcionais colocadas no polipeptídeo;inserções normalmente serão da ordem de cerca de 1 a 10 resíduos deaminoácidos. As substituições de aminoácidos são preferivelmente assubstituições de aminoácidos conservativas. Tabelas de SubstituiçãoConservativa são bem conhecidas na arte (veja, por exemplo, Creighton(1984) Proteins. W.H. Freeman and Company e Tabela 1 abaixo).
Tabela 1: Exemplos de substituições conservadas deaminoácidos
<table>table see original document page 17</column></row><table>
Substituições, deleções e/ou inserções de aminoácidos podemser prontamente feitas usando técnicas de peptídeo sintético bem conhecidasna arte, tal como síntese de peptídeo em fase sólida e os semelhantes, ou pormanipulação de DNA recombinante. Métodos para a manipulação deseqüências de DNA para produzir variantes de substituição, inserção oudeleção de uma proteína são bem conhecidos na arte. Por exemplo, técnicaspara fazer mutações por substituição em sítios pré-determinados em DNA sãobem conhecidas por aqueles versados na arte e incluem mutagênese Ml3,mutagênese in vitro T7-Gen (USB, Cleveland, OH), mutagênese dirigida asítio QuickChange (Stratagene, San Diego, CA), mutagênese dirigida a sítiomediada por PCR ou outros protocolos de mutagênese dirigida a sítio.
Derivados"Derivados" incluem peptídeos, oligopeptídeos, polipeptídeosque podem, comparados com a seqüência de aminoácidos da formanaturalmente ocorrente da proteína, tal como a proteína de interesse,compreender substituições de aminoácidos com resíduos de aminoácidos nãonaturalmente ocorrentes, ou adições de resíduos de aminoácidos nãonaturalmente ocorrentes. "Derivados" de uma proteína também abrangempeptídeos, oligopeptídeos, polipeptídeos que compreendem resíduos deaminoácidos naturalmente ocorrentes alterados (glicosilados, acilados,prenilados, fosforilados, miristoilados, sulfatados etc.) ou resíduos deaminoácidos não naturalmente alterados comparado com a seqüência deaminoácidos de uma forma naturalmente ocorrente do polipeptídeo. Umderivado também pode compreender um ou mais substituintes ou adições denão aminoácidos comparado com a seqüência de aminoácidos da qual ele éderivado, por exemplo uma molécula repórter ou outro ligante,covalentemente ou não covalentemente ligado à seqüência de aminoácidos, talcomo uma molécula repórter que é ligada para facilitar sua detecção, eresíduos de aminoácidos não naturalmente ocorrentes em relação à seqüênciade aminoácidos de uma proteína não naturalmente ocorrente.
Ortólogo(s)/Parálogo(s)
Ortólogos e parálogos abrangem conceitos evolutivos usadospara descrever relações ancestrais de genes. Paralogues são genes dentro damesma espécie que se originaram através de duplicação de um gene ancestrale ortólogos são genes de organismos diferentes que se originaram através deespeciação.
Domínio
O termo "domínio" se refere a um conjunto de aminoácidosconservados em posições específicas ao longo de um alinhamento deseqüências de proteínas evolutivamente relacionadas. Enquanto queaminoácidos em outras posições podem variar entre homólogos, aminoácidosque são são altamente conservados em posições específicas indicamaminoácidos que provavelmente são essenciais na estrutura, estabilidade oufunção de uma proteína. Identificados por seu alto grau de conservação emseqüências alinhadas de uma família de homólogos de proteína, eles podemser usados como identificadores para determinar se qualquer polipeptídeo emquestão pertence a uma família de polipeptídeo previamente identificada.
Motivo/Seqüência consenso/Assinatura
O termo "motivo" ou "seqüência consenso" ou "assinatura" serefere a uma região conservada curta na seqüência de proteínasevolutivamente relacionadas. Motivos freqüentemente são partes altamenteconservadas de domínios, mas também podem incluir apenas parte dodomínio, ou estarem localizados fora de domínio conservado (se todos osaminoácidos do motivo caem fora de um domínio definido).
Hibridização
O termo "hibridização" como definido neste lugar é umprocesso caracterizado pelo fato de que seqüências de nucleotídeoscomplementares substancialmente homólogas se anelam uma a outra. Oprocesso de hibridização pode ocorrer inteiramente em solução, i.e. ambosácidos nucleicos complementares estão em solução. O processo dehibridização também pode ocorrer com um dos ácidos nucleicoscomplementares imobilizado a uma matriz tal como microesferas magnéticas,microesferas de Sepharose ou qualquer outra resina. O processo dehibridização além disso pode ocorrer com um dos ácidos nucleicoscomplementares imobilizado a um suporte sólido tal como uma membrana denitrocelulose ou de náilon ou imobilizado por e.g. fotolitografia a, porexemplo, um suporte de vidro silicioso (o último conhecido como arranjos oumicroarranjos de ácido nucleico ou como circuitos integrados de ácidonucleico). A fim de permitir que hibridização ocorra, as moléculas de ácidosnucleicos geralmente são termalmente ou quimicamente desnaturadas paraderreter uma dupla fita em duas fitas simples e/ou para remover estruturas emgrampo ou outras estruturas secundárias de ácidos nucleicos de fita simples.
O termo "estringência" se refere às condições nas quais umahibridização pode ocorrer. A estringência de hibridização é influenciada porcondições tal como temperatura, concentração salina, força iônica ecomposição de tampão de hibridização. Geralmente, condições de baixaestringência são selecionadas para ser cerca de 30°C menores do que o pontode fusão térmica (Tm) para a seqüência específica em uma força iônica e pHdefinidos. Condições de média estringência são quando a temperatura é 20°Cabaixo de Tm, e condições de alta estringência são quando a temperatura é10°C abaixo de Tm. Condições de hibridização de alta estringênciatipicamente são usadas para isolar Seqüências de hibridização que têm altasimilaridade de seqüência com a seqüência de ácidos nucleicos alvo.Entretanto, ácidos nucleicos podem desviar em seqüência e ainda codificarum polipeptídeo substancialmente idêntico, devido à degenerescência docódigo genético. Portanto condições de hibridização de média estringênciapodem ser algumas vezes necessárias para identificar tais moléculas de ácidosnucleicos.
A Tm é a temperatura em força iônica e pH definidos, na qual50% da seqüência alvo hibridiza com uma sonda perfeitamente compatível. ATm é dependente das condições de solução e da composição de base ecomprimento da sonda. Por exemplo, seqüências maiores hibridizamespecificamente em temperaturas superiores. A taxa máxima de hibridização éobtida a partir de cerca de 16°C até 32°C abaixo de Tm. A presença de cátionsmonovalentes na solução de hibridização reduz a repulsão eletrostática entreas duas fitas de ácidos nucleicos com isso promovendo formação de híbrido;este efeito é visível para concentrações de sódio de até 0,4M (paraconcentrações maiores, este efeito pode ser ignorado). Formamida reduz atemperatura de fusão de duplexes DNA-DNA e DNA-RNA com 0,6 a 0,7°Cpara cada formamida percentual, e adição de 50% de formamida permite quehibridização seja realizada a 30 a 45°C, embora a taxa de hibridização sejadiminuída. Pareamento incorreto de bases reduz a taxa de hibridização e aestabilidade térmica dos duplexes. Em média e para sondas grandes, a Tmdiminui cerca de 1°C por % de pareamento incorreto de bases. A Tm pode sercalculada usando as seguintes equações, dependendo dos tipos de híbridos:
1) Híbridos de DNA-DNA (Meinkoth and Wahl, Anal.Biochem., 138: 267-284, 1984):
Tm= 81,5°C + 16,6xlogi0[Na+]a + 0,41x%[G/Cb] - SOOxtLc]-1 -0,6 lx% formamida
2) Híbridos de DNA-RNA ou RNA-RNA:
Tm= 79,8 + 18,5 (logio[Na+]a) + 0,58 (%G/Cb) +11,8 (%G/Cb)2
- 820/Lc
3) Híbridos de oligo-DNA ou oligo-RNAd:
Para <20 nucleotídeos: Tm= 2 (In)
Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)
a ou para outro cátion monovalente, mas apenas acurado nointervalo 0,01-0,4 M.
b apenas acurado para %GC no intervalo de 30% a 75%.
cL = comprimento de duplex em pares de bases.
d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador= 2x(no. de G/C)+(no. de A/T).
Ligação não específica pode ser controlada usando qualqueruma das diversas técnicas conhecidas tal como, por exemplo, bloqueando amembrana com soluções contendo proteína, adições de RNA, DNA, e SDSheterólogo ao tampão de hibridização, e tratamento com Rnase. Para sondasnão homólogas, uma série de hibridizações podem ser realizadas variando umde (i) diminuindo progressivamente a temperatura de anelamento (porexemplo de 68°C para 42°C) ou (ii) diminuindo progressivamente aconcentração de formamida (por exemplo de 50% para 0%). O artesãoversado está ciente de vários parâmetros que podem ser alterados durantehibridização e que irão ou manter ou mudar as condições de estringência.
Além das condições de hibridização, especificidade dehibridização tipicamente também depende da função de lavagens póshibridização. Para remover antecedentes resultando de hibridização nãoespecífica, amostras são lavadas com soluções salinas diluídas. Fatorescríticos de tais lavagens incluem a força iônica e temperatura da solução delavagem final: quanto menor a concentração salina e maior a temperatura delavagem, maior é a estringência da lavagem. Condições de lavagem sãotipicamente realizadas em ou abaixo de estringência de hibridização. Umahibridização positiva gera um sinal que é pelo menos duas vezes aquele doantecedente. Geralmente, condições estringentes adequadas para ensaios dehibridização de ácidos nucleicos ou procedimentos de detecção deamplificação de gene são como expostos acima. Condições mais ou menosestringentes também podem ser selecionadas. O artesão versado está ciente devários parâmetros que podem ser alterados durante lavagem e que irão oumanter ou mudar as condições de estringência.
Por exemplo, condições de hibridização de alta estringênciatípicas para híbridos de DNA maiores do que 50 nucleotídeos abrangemhibridização a 65°C em Ix SSC ou a 42°C em Ix SSC e 50% formamida,seguido por lavagem a 65°C em 0.3x SSC. Exemplos de condições dehibridização de média estringência para híbridos de DNA maiores do que 50nucleotídeos abrangem hibridização a 50°C em 4x SSC ou a 40°C em 6x SSCe 50% formamida, seguido por lavagem a 50°C em 2x SSC. O comprimentodo híbrido é o comprimento antecipado para o ácido nucleico hibridizante.
Quando ácidos nucleicos de seqüência conhecida são hibridizados, ocomprimento de híbrido pode ser determinado alinhando as seqüências eidentificando as regiões conservadas descritas neste lugar. IxSSC é 0,15M deNaCl e 15mM de citrato de sódio; a solução de hibridização e soluções delavagem podem incluir adicionalmente 5 χ de reagente de Denhardt, 0,5-1,0%de SDS, 100 μg/ml de DNA de esperma de salmão fragmentado desnaturado,0,5% de pirofosfato de sódio.
Para os propósitos de definir o nível de estringência, referênciapode ser feita a Sambrook et al. (2001) Molecular Cloning: a laboratorymanual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New Yorkou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989e atualizações anuais).
Variante de processamento
O termo "variante de processamento" como usado neste lugarabrange variantes de uma seqüência de ácidos nucleicos nas quais íntrons e/ouéxons selecionados foram cortados, substituídos, deslocados ou adicionados,ou nas quais íntrons foram encurtados ou alongados. Tais variantes serãoumas nas quais a atividade biológica da proteína é substancialmente mantida;isto pode ser atingido mantendo seletivamente segmentos funcionais daproteína. Tais variantes de união podem ser encontradas na natureza oupodem ser feitas pelo homem. Métodos para prever e isolar tais variantes deunião são bem conhecidos na arte (veja por exemplo Foissac and Schiex,BMC Bioinformatics. 2005; 6: 25).
Variante alélica
Alelos ou variantes alélicas são formas alternativas de umdado gene, localizado na mesma posição cromossômica. Variantes alélicasabrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim comoPolimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho deINDELs normalmente é menor do que 100 bp. SNPs e INDELs formam omaior conjunto de variantes de seqüência em linhagens polimórficasnaturalmente ocorrentes da maioria dos organismos.
Embaralhamento gênico/Evolução dirigidaEmbaralhamento gênico ou evolução dirigida consiste derepetições de embaralhamento de DNA seguido por triagem e/ou seleçãoapropriada para gerar variantes de ácidos nucleicos ou porções destescodificando proteínas tendo uma atividade biológica modificada (Castle et al.,(2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e6.395.547).
Elemento regulador/Seqüência de controle/Promotor
Os termos "elemento regulador", "seqüência de controle" e"promotor" são todos usados permutavelmente neste lugar e devem seradotados em um amplo contexto para se referir a seqüências reguladoras deácidos nucleicos capazes de efetuar expressão das seqüências aos quais elessão ligados. O termo "promotor" tipicamente se refere a uma seqüência decontrole de ácido nucleico localizada antes do início transcricional de umgene e que está envolvida em reconhecimento e ligação de RNA polimerase eoutras proteínas, com isso dirige transcrição de um ácido nucleicooperacionalmente ligado. Abrangidas pelos termos mencionados acima sãoseqüências reguladoras transcricionais derivadas de um gene genômicoeucariótico clássico (incluindo a caixa TATA que é requerida para iniciaçãoacurada de transcrição, com ou sem uma seqüência de caixa CCAAT) eelementos reguladores adicionais (i.e. seqüências situadas acima dospromotores gênicos, acentuadores e silenciadores) que alteram expressão degene em resposta a desenvolvimento e/ou estímulos externos, ou de umamaneira tecido específica. Também incluída dentro do termo é uma seqüênciareguladora transcricional de um gene procariótico clássico, em cujo caso elapode incluir uma seqüência de caixa -35 e/ou seqüências reguladorasadicionais de caixa -10. O termo "elemento regulador" também abrange umamolécula de fusão sintética ou derivado que confere, ativa ou acentuaexpressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.
Um "promotor vegetal" compreende elementos reguladores,que mediam a expressão de um segmento de seqüência de codificação emcélulas de planta. Por conseguinte, um promotor vegetal não precisa ser deorigem vegetal, mas pode se originar de vírus ou microorganismos, porexemplo de vírus que atacam células de planta. O "promotor vegetal" tambémpode se originar de uma célula vegetal, e.g. da planta que é transformada coma seqüência de ácidos nucleicos a ser expressa no processo inventivo edescrito neste lugar. Isto também se aplica outros sinais reguladores"vegetais", tal como terminadores "vegetais". Os promotores antes dasseqüências de nucleotídeos úteis nos métodos da presente invenção podem sermodificados por uma ou mais substituição(ões), inserção(ões) e/oudeleção(ões) de nucleotídeos sem interferir na funcionalidade ou atividade dequalquer dos promotores, o quadro aberto de leitura (ORF) ou a regiãoreguladora 3' tal como terminadores ou outras regiões reguladoras 3' que estãolocalizadas fora do ORR Além disso é possível que a atividade dospromotores seja aumentada por modificação de sua seqüência, ou que elessejam completamente substituídos por promotores mais ativos, mesmopromotores de organismos heterólogos. Para expressão em plantas, amolécula de ácido nucleico deve, como descrito acima, ser operacionalmenteligada a ou compreender um promotor adequado que expressa o gene nomomento certo e com o padrão de expressão espacial requerido.
Para a identificação de promotores funcionalmenteequivalentes, a força de promotor e/ou padrão de expressão de um promotorcandidato pode ser analisado por exemplo ligando operacionalmente opromotor a um gene repórter e ensaiando o nível e padrão de expressão dogene repórter em vários tecidos da planta. Genes repórteres bem conhecidosadequados incluem por exemplo beta-glucuronidase ou beta galactosidase. Aatividade de promotor é ensaiada medindo a atividade enzimática da beta-glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão deexpressão podem ser comparados com aqueles de um promotor de referência(tal como aquele usado nos métodos da presente invenção). Alternativamente,força de promotor pode ser ensaiada quantificando níveis de mRNA oucomparando níveis de mRNA do ácido nucleico usado nos métodos dapresente invenção, com níveis de mRNA de genes responsáveis pelamanutenção do metabolismo celular tal como 18S rRNA, usando métodosconhecidos na arte, tal como Northern blotting com análise densitométrica deautoradiogramas, PCR quantitativo em tempo real ou RT-PCR (Heid et al.,1996 Genome Methods 6: 986-994). Geralmente por "promotor" fraco épretendido um promotor que dirige expressão de uma seqüência decodificação em um nível baixo. Por "nível baixo" é pretendido em níveis decerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos a cerca de1/500.0000 transcritos por célula. Inversamente, um "promotor forte" dirigeexpressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10transcritos a cerca de 1/100 transcritos a cerca de 1/1.000 transcritos porcélula.
Operacionalmente ligado
O termo "operacionalmente ligado" como usado neste lugar serefere a uma ligação funcional entre a seqüência de promotor e o gene deinteresse, de forma que a seqüência de promotor é capaz de iniciar transcriçãodo gene de interesse.
Promotor constitutivo
Um "promotor constitutivo" se refere a um promotor que étranscricionalmente ativo durante a maioria, mas não necessariamente todas,fases de crescimento e desenvolvimento e na maioria das condiçõesambientais, em pelo menos uma célula, tecido ou órgão. Tabela 2 abaixofornece exemplos de promotores constitutivos.Tabela 2: Exemplos de promotores constitutivos
<table>table see original document page 27</column></row><table>
Promotor ubíquo
Um promotor ubíquo é ativo em substancialmente todostecidos ou células de um organismo.
Promotor regulado por desenvolvimento
Um promotor regulado por desenvolvimento é ativo durantecertos estágios de desenvolvimento ou em partes da planta que passam pormudanças evolutivas.
Promotor induzível
Um promotor induzível tem início de transcrição induzido ouaumentado em resposta a um estímulo químico (para uma revisão veja Gatz1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental oufísico, ou pode ser "induzível por estresse", i.e. ativado quando uma planta éexposta a várias condições de estresse, ou um "induzível por patógeno" i.e.ativado quando uma planta é exposta à exposição a vários patógenos.
Promotor Órgão específico/Tecido específicoUm promotor órgão específico ou tecido específico é um que écapaz de preferencialmente iniciar transcrição em certos órgãos ou tecidos, talcomo as folhas, raízes, tecido de semente etc. Por exemplo, um "promotorraiz específico" é um promotor que é transcricionalmente ativopredominantemente em raízes vegetais, substancialmente para a exclusão dequaisquer outra partes de uma planta, enquanto que ainda permitindo qualquerexpressão evasiva nestas outras partes vegetais. Promotores capaz de iniciartranscrição em certas células apenas são referidos neste lugar como "célulaespecíficos".
Um promotor tecido verde específico como definido nestelugar é um promotor que é transcricionalmente ativo predominantemente emtecido verde, substancialmente para a exclusão de quaisquer outras partes deuma planta, enquanto que ainda permitindo qualquer expressão evasiva nestasoutras partes vegetais.
Exemplos de promotores tecido verde específicos que podemser usados para realizar os métodos da invenção são mostrados em Tabela 3abaixo.
Tabela 3: Exemplos de promotores tecido verde específicos
<table>table see original document page 28</column></row><table>
Outro exemplo de um promotor tecido específico é umpromotor meristema específico, que é transcricionalmente ativopredominantemente em tecido meristemático, substancialmente para aexclusão de quaisquer outras partes de uma planta, enquanto que aindapermitindo qualquer expressão evasiva nestas outras partes vegetais.Terminador
O termo "terminador" abrange uma seqüência de controle queé uma seqüência de DNA na extremidade de uma unidade transcricional quesinaliza processamento 3' e poliadenilação de um transcrito primário etérmino de transcrição. O terminador pode ser derivado do gene natural, deuma variedade de outros genes vegetais, ou de T-DNA. O terminador a seradiconado pode ser derivado, por exemplo, dos genes de nopalina sintase ouoctopina sintase, ou alternativamente de outro gene vegetal, ou menospreferivelmente de qualquer outro gene eucariótico.
Modulação
O termo "modulação" significa em relação a expressão ouexpressão de gene, um processo no qual o nível de expressão é mudado porexpressão de gene em comparação com a planta de controle, preferivelmenteo nível de expressão é aumentado. A expressão original não modulada podeser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) oumRNA com subsequente tradução. O termo "modular a atividade" devesignificar qualquer mudança da expressão das seqüências de ácidos nucleicosinventivas ou proteínas codificadas, que leva a produção aumentada e/oucrescimento aumentado das plantas.
Expressão aumentada/superexpressão
O termo "expressão aumentada" ou "superexpressão" comousado neste lugar significa qualquer forma de expressão que é adicional aonível de expressão original de tipo selvagem.
Métodos para aumentar expressão de genes ou produtos degene são bem documentados na arte e incluem, por exemplo, superexpressãodirigida por promotores apropriados, o uso de acentuadores de transcrição ouacentuadores de tradução. Ácidos nucleicos isolados que servem comoelementos promotores ou acentuadores podem ser introduzidos em umaposição apropriada (tipicamente antes) de uma forma não heteróloga de umpolinucleotídeo de forma a aumentar expressão de um ácido nucleicocodificando o polipeptídeo de interesse. Por exemplo, promotores endógenospodem ser alterados in vivo por mutação, deleção, e/ou substituição (veja,Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al.,PCT/US93/03868), ou promotores isolados podem ser introduzidos em umacélula vegetal na orientação e distância apropriada de um gene da presenteinvenção de forma a controlar a expressão do gene.
Se expressão de polipeptídeo é desejada, geralmente édesejável incluir uma região de poliadenilação na extremidade 3' de umaregião de codificação de polinucleotídeo. A região de poliadenilação pode serderivada do gene natural, de uma variedade de outros genes vegetais, ou de T-DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, porexemplo, dos genes de nopalina sintase ou octopina sintase, oualternativamente de outro gene vegetal, ou menos preferivelmente de qualqueroutro gene eucariótico.
Uma seqüência de íntron também pode ser adicionada à região5' não traduzida (UTR) ou à seqüência de codificação da seqüência decodificação parcial para aumentar a quantidade da mensagem madura que seacumula no citosol. Inclusão de um íntron processável na unidade detranscrição tanto em construções vegetais como animais mostrou aumentarexpressão de gene tanto no nível de mRNA como protéico em até 1000 vezes(Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987)Genes Dev 1:1183-1200). Tal estimulação de íntron de expressão de genetipicamente é maior quando colocada perto da extremidade 5' da unidade detranscrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntronBronze-I são conhecidos na arte. Para informação geral veja: The MaizeHandbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Gene endógeno
Referência neste lugar a um gene "endógeno" se refere nãoapenas ao gene em questão como encontrado em uma planta em sua formanatural (i.e., sem haver qualquer intervenção humana), mas também se refereao mesmo gene (ou um ácido nucleico/gene substancialmente homólogo) emuma forma isolada subseqüentemente (re)introduzido em uma planta (umtransgene). Por exemplo, uma planta transgênica contendo um tal transgenepode confrontar uma redução substancial da expressão de transgene e/ouredução substancial de expressão do gene endógeno.
Expressão diminuída
Referência neste lugar a "redução ou eliminação substancial" éadotada para significar uma diminuição em expressão de gene endógeno e/ouníveis de polipeptídeo e/ou atividade de polipeptídeo em relação a plantas decontrole. A redução ou eliminação substancial é em ordem crescente depreferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%, 80%, 85%,90%, ou 95%, 96%, 97%, 98%, 99% ou mais reduzida comparada com aquelade plantas de controle.
Para a redução ou eliminação substancial de expressão umgene endógeno em uma planta, um comprimento suficiente de nucleotídeossubstancialmente contíguos de uma seqüência de ácidos nucleicos érequerido. A fim de realizar silenciamento gênico, isto pode ser tão poucoquanto 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 ou menos nucleotídeos,alternativamente isto pode ser tanto quanto o gene inteiro (incluindo a 5' e/ou3' UTR, ou em parte ou inteira). O trecho de nucleotídeos substancialmentecontíguos pode ser derivado do ácido nucleico codificando a proteína deinteresse (gene alvo), ou de qualquer ácido nucleico capaz de codificar umortólogo, parálogo ou homólogo da proteína de interesse. Preferivelmente, otrecho de nucleotídeos substancialmente contíguos é capaz de formar ligaçõesde hidrogênio com o gene alvo (ou fita sentido ou antisentido), maispreferivelmente, o trecho de nucleotídeos substancialmente contíguos tem, emordem crescente de preferência, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%,97%, 98%, 99%, 100% de identidade de seqüência com o gene alvo (ou fitasentido ou antisentido). A seqüência de ácidos nucleicos codificando umpolipeptídeo (funcional) não é um requerimento para os vários métodosdiscutidos neste lugar para a redução ou eliminação substancial de expressãode um gene endógeno.
Esta redução ou eliminação substancial de expressão pode seratingida usando ferramentas e técnicas de rotina. Um método preferido para aredução ou eliminação substancial de expressão de gene endógeno éintroduzir e expressar em uma planta uma construção genética na qual o ácidonucleico (neste caso um trecho de nucleotídeos substancialmente contíguosderivado do gene de interesse, ou de qualquer ácido nucleico capaz decodificar um ortólogo, parálogo ou homólogo de qualquer uma das proteínasde interesse) é clonado como uma repetição invertida (em parte oucompletamente), separada por um espaçador (DNA não codificante).
Em um tal método preferido, expressão do gene endógeno éreduzida ou substancialmente eliminada através de silenciamento mediado porRNA usando uma repetição invertida de um ácido nucleico ou uma partedeste (neste caso um trecho de nucleotídeos substancialmente contíguosderivado do gene de interesse, ou de qualquer ácido nucleico capaz decodificar um ortólogo, parálogo ou homólogo da proteína de interesse),preferivelmente capaz de formar uma estrutura em forma de grampo. Arepetição invertida é clonada um vetor de expressão compreendendoseqüências de controle. Uma seqüência de ácidos nucleicos de DNA nãocodificante (um espaçador, por exemplo um fragmento de região deacoplamento de matriz (MAR), um íntron, um poliligante, etc.) estálocalizado entre os dois ácidos nucleicos invertidos formando a repetiçãoinvertida. Depois de transcrição da repetição invertida, um RNA quiméricocom uma estrutura auto-complementar é formado (parcial ou completo). Estaestrutura de RNA dupla fita é referida como o RNA em forma de grampo(hpRNA). O hpRNA é processado pela planta em siRNAs que sãoincorporados em um complexo de silenciamento induzido por RNA (RISC).O RISC adicionalmente cliva os transcritos de mRNA, com isso reduzindosubstancialmente o número de transcritos de mRNA a serem traduzidos empolipeptídeos. Para detalhes gerais adicionais veja por exemplo, Grierson etal. (1998) Patente Internacional 98/53083; Waterhouse et ai. (1999) PatenteInternacional 99/53050).
Desempenho dos métodos da invenção não se fia em introduzire expressar em uma planta uma construção genética na qual o ácido nucleicoé clonado como uma repetição invertida, mas qualquer um ou mais dediversos métodos bem conhecidos de "silenciamento gênico" podem serusados para atingir os mesmos efeitos.
Um tal método para a redução de expressão de gene endógenoé silenciamento mediado por RNA de expressão de gene (regulação de formanegativa). Silenciamento neste caso é desencadeado em uma planta por umaseqüência de RNA dupla fita (dsRNA) que é substancialmente similar ao geneendógeno alvo. Este dsRNA é adicionalmente processado pela planta emcerca de 20 a cerca de 26 nucleotídeos chamados RNAs de interferênciacurtos (siRNAs). Os siRNAs são incorporados em um complexo desilenciamento induzido por RNA (RISC) que cliva o transcrito de mRNA dogene endógeno alvo, com isso reduzindo substancialmente o número detranscritos de mRNA a serem traduzidos em um polipeptídeo.Preferivelmente, a seqüência de RNA dupla fita corresponde a um gene alvo.
Outro exemplo de um método de silenciamento de RNAenvolve a introdução de seqüências de ácidos nucleicos ou partes destas(neste caso um trecho de nucleotídeos substancialmente contíguos derivadodo gene de interesse, ou de qualquer ácido nucleico capaz de codificar umortólogo, parálogo ou homólogo da proteína de interesse) em uma orientaçãosentido em uma planta. "Orientação sentido" se refere a uma seqüência deDNA que é homóloga a um transcrito de mRNA deste. Deve ser introduzidaem uma planta portanto pelo menos uma cópia da seqüência de ácidosnucleicos. A seqüência de ácidos nucleicos adicional irá reduzir expressão dogene endógeno, gerando um fenômeno conhecido como co-supressão. Aredução de expressão de gene será mais pronounciada se diversas cópiasadicionais de uma seqüência de ácidos nucleicos são introduzidas na planta,pois existe uma correlação positiva entre altos níveis de transcrito e odesencadeamento de co-supressão.
Outro exemplo de um método de silenciamento de RNAenvolve o uso de seqüências de ácidos nucleicos antisentido. Uma seqüênciade ácidos nucleicos "antisentido" compreende uma seqüência de nucleotídeosque é complementar a uma seqüência de ácidos nucleicos "sentido"codificando uma proteína, i.e. complementar à fita de codificação de umamolécula de cDNA dupla fita ou complementar a uma seqüência transcrita demRNA. A seqüência de ácidos nucleicos antisentido preferivelmente écomplementar ao gene endógeno a ser silenciado. A complementaridade podeestar localizada na "região de codificação" e/ou na "região não codificante"de um gene. O termo "região de codificação" se refere a uma região daseqüência de nucleotídeos compreendendo códons que são traduzidos emresíduos de aminoácidos. O termo "região não codificante" se refere aseqüências 5' e 3' que flanqueaim a região de codificação que são transcritasmas não traduzidas em aminoácidos (também referidas como regiões 5' e 3'não traduzidas).
Seqüências de ácidos nucleicos antisentido pode ser construídade acordo com as regras de pareamento de bases de Watson e Crick. Aseqüência de ácidos nucleicos antisentido pode ser complementar à seqüênciade ácidos nucleicos inteira (neste caso um trecho de nucleotídeossubstancialmente contíguos derivado do gene de interesse, ou de qualquerácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo daproteína de interesse), mas também pode ser um oligonucleotídeo que éantisentido para apenas uma parte da seqüência de ácidos nucleicos (incluindoa UTR 5' e 3' de mRNA). Por exemplo, a seqüência de oligonucleotídeosantisentido pode ser complementar à região circundando o sítio de início detranscrição de um transcrito de mRNA codificando um polipeptídeo. Ocomprimento de uma seqüência de oligonucleotídeos antisentido adequada éconhecido na arte e pode começar de cerca de 50, 45, 40, 35, 30, 25, 20, 15 ou10 nucleotídeos de comprimento ou menos. Uma seqüência de ácidosnucleicos antisentido de acordo com a invenção pode ser construída usandoreações de síntese química e ligação enzimática usando métodos conhecidosna arte. Por exemplo, uma seqüência de ácidos nucleicos antisentido (e.g.,uma seqüência de oligonucleotídeos antisentido) pode ser quimicamentesintetizada usando nucleotídeos naturalmente ocorrentes ou nucleotídeosmodificados de forma variada construídos para aumentar a estabilidadebiológica das moléculas ou para aumentar a estabilidade física do duplexformado entre as seqüências de ácidos nucleicos antisentido e sentido, e.g.,derivados de fosforotioato e nucleotídeos substituídos com acridina podem serusados. Exemplos de nucleotídeos modificados que podem ser usados paragerar as seqüências de ácidos nucleicos antisentido são bem conhecidos naarte. Modificações conhecidas de nucleotídeos incluem metilação, ciclizaçãoe 'caps' e substituição de um ou mais dos nucleotídeos naturalmenteocorrentes por um análogo tal como inosina. Outras modificações denucleotídeos são bem conhecidas na arte.
A seqüência de ácidos nucleicos antisentido pode serproduzida biologicamente usando um vetor de expressão no qual umaseqüência de ácidos nucleicos foi subclonada em uma orientação antisentido(i.e., RNA transcrito a partir do ácido nucleico inserido será de umaorientação antisentido para um ácido nucleico alvo de interesse).Preferivelmente, produção de seqüências de ácidos nucleicos antisentido emplantas ocorre por meio de uma construção de ácido nucleico estavelmenteintegrada compreendendo um promotor, um oligonucleotídeo antisentidooperacionalmente ligado, e um terminador.
As moléculas de ácido nucleico usadas para silenciamento nosmétodos da invenção (quer introduzidas em uma planta ou geradas in situ)hibridizam com ou se ligam a transcritos de mRNA e/ou DNA genômicocodificando um polipeptídeo para com isso inibir expressão da proteína, e.g.,inibindo transcrição e/ou tradução. A hibridização pode ser porcomplementaridade convencional de nucleotídeos para formar um duplexestável, ou, por exemplo, no caso de uma seqüência de ácidos nucleicosantisentido que se liga a duplexes de DNA, através de interações específicasna principal fenda da dupla hélice. Seqüências de ácidos nucleicos antisentidopodem ser introduzidas em uma planta por transformação ou injeção diretaem um sítio de tecido específico. Alternativamente, seqüências de ácidosnucleicos antisentido podem ser modificadas para direcionar célulasselecionadas e então sistemicamente administradas. Por exemplo, paraadministração sistêmica, seqüências de ácidos nucleicos antisentido podemser modificadas de forma que elas se liguem especificamente a receptores ouantígenos expressos em uma superfície celular selecionada, e.g., ligando aseqüência de ácidos nucleicos antisentido a peptídeos ou a anticorpos que seligam a receptores ou antígenos de superfície celular. As seqüências de ácidosnucleicos antisentido também podem ser liberadas para células usando osvetores descritos neste lugar.
De acordo com um aspecto adicional, a seqüência de ácidosnucleicos antisentido é uma seqüência de ácidos nucleicos α-anomérica. Umaseqüência de ácidos nucleicos α-anomérica forma híbridos dupla fitaespecíficos com RNA complementar nos quais, ao contrário das unidades busuais, as fitas correm paralelas uma a outra (Gaultier et al. (1987) Nucl AcRes 15: 6625-6641). A seqüência de ácidos nucleicos antisentido tambémpode compreender um 2-o-metilribonucleotídeo (Inoue et al. (1987) Nucl AcRes 15, 6131-6148) ou um análogo quimérico de RNA-DNA (Inoue et al.(1987) FEBS Lett. 215, 327-330).
A redução ou eliminação substancial de expressão de geneendógeno também pode ser realizada usando ribozimas. Ribozimas sãomoléculas catalíticas de RNA com atividade de ribonuclease que são capazesde clivar uma seqüência de ácidos nucleicos de fita simples, tal como ummRNA, ao qual eles têm uma região complementar. Assim, ribozimas (e.g.,ribozimas cabeça-de-martelo (descritas em Haselhoff and Gerlach (1988)Nature 334, 585-591) podem ser usadas para clivar cataliticamente transcritosde mRNA codificando um polipeptídeo, com isso reduzindo substancialmenteo número de transcritos de mRNA a serem traduzidos em um polipeptídeo.
Uma ribozima tendo especificidade para uma seqüência de ácidos nucleicospode ser construída (veja por exemplo: Cech et al. Patente Norte-AmericanaNo. 4.987,071; e Cech et al. Patente Norte-Americana No. 5.116.742).
Alternativamente, transcritos de mRNA correspondendo a uma seqüência deácidos nucleicos podem ser usados para selecionar um RNA catalítico tendouma atividade específica de ribonuclease a partir de um conjunto demoléculas de RNA (Bartel and Szostak (1993) Science 261, 1411-1418). Ouso de ribozimas para silenciamento de genes em plantas é conhecido na arte(e.g., Atkins et al. (1994) Patente Internacional 94/00012; Lenne et al. (1995)Patente Internacional 95/03404; Lutziger et al. (2000) Patente Internacional00/00619; Prinsen et al. (1997) Patente Internacional 97/13865 e Scott et al.(1997) Patente Internacional 97/38116).
Silenciamento gênico também pode ser atingido pormutagênese por inserção (por exemplo, inserção de T-DNA ou inserção detransposon) ou por estratégias como descrito por, entre outros, Angell andBaulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS PatenteInternacional 98/36083), ou Baulcombe (Patente Internacional 99/15682).Silenciamento gênico também pode ocorrer se existe umamutação on um gene endógeno e/ou uma mutação em um gene/ácido nucleicoisolado subseqüentemente introduzido em uma planta. A redução oueliminação substancial pode ser causada por um polipeptídeo não funcional.Por exemplo, um polipeptídeo pode ser ligar a várias proteínas de interação;uma ou mais mutação(ões) e/ou truncamento(s) pode(m) portanto fornecer umpolipeptídeo que ainda é capaz de se ligar a proteínas de interação (tal comoproteínas receptoras) mas que não podem exibir sua função normal (tal comoligante de sinalização).
Uma abordagem adicional para silenciamento gênico édirecionar seqüências de ácidos nucleicos complementares à regiãoreguladora do gene (e.g., o promotor e/ou acentuadores) para formarestruturas de tripla hélice que previnem transcrição do gene em células alvo.Veja Helene, C., Anticancer Drug Res. 6, 569-84, 1991; Helene et al., Ann.N.Y. Acad. Sei. 660, 27-36 1992; e Maher, L.J. Bioassays 14, 807-15, 1992.
Outros métodos, tal como o uso de anticorpos dirigidos a umpolipeptídeo endógeno para inibir sua função em planta, ou interferência navia de sinalização na qual um polipeptídeo está envolvido, serão bemconhecidos por alguém versado. Em particular, pode ser contemplado quemoléculas fabricadas podem ser úteis para inibir a função biológica de umpolipeptídeo alvo, ou para interferir na via de sinalização na qual opolipeptídeo alvo está envolvido.
Alternativamente, um programa de triagem pode ser ajustadopara identificar em uma população vegetal variantes naturais de um gene,cujas variantes codificam polipeptídeos com atividade reduzida. Taisvariantes naturais também podem ser usadas por exemplo, para realizarrecombinação homóloga.
MicroRNAs (miRNAs) artificiais e/ou naturais podem serusados para nocautear expressão de gene e/ou tradução de mRNA. miRNAsendógenos são RNAs pequenos de fita simples de tipicamente 19-24nucleotídeos de comprimento. Eles funcionam primariamente para regularexpressão de gene e/ ou tradução de mRNA. A maioria de microRNAs(miRNAs) de plantas têm complementaridade perfeita ou quase perfeita comsuas seqüências alvo. Entretanto, há alvos naturais com até cincomalpareamentos. Eles são processados a partir de RNAs não codificantesmaiores com estruturas reversas características por RNases de dupla fitaespecíficas da família Dicer. Mediante processamento, eles são incorporadosno complexo de silenciamento induzido por RNA (RISC) se ligando a seucomponente principal, uma proteína Argonauta. MiRNAs servem como oscomponentes de especificidade de RISC, uma vez que eles pareaim bases comácidos nucleicos alvo, principalmente mRNAs, no citoplasma. Eventosreguladores subsequentes incluem clivagem de mRNA alvo e destruição e/ouinibição traducional. Efeitos de superexpressão de miRNA são assimfreqüentemente refletidos em níveis diminuídos de mRNA de genes alvo.
MicroRNAs artificiais (amiRNAs), os quais são tipicamentede 21 nucleotídeos de comprimento, podem ser geneticamente manipuladosespecificamente para regular negativamente expressão de gene de um oumúltiplos genes de interesse. Determinantes de seleção de alvo de microRNAvegetal são bem conhecidos na arte. Parâmetros emoíricos parareconhecimento de alvo foram definidos e podem ser usados para auxiliar aconcepção de amiRNAs específicos, Schwab R, 2005. Ferramentasconvenientes para concepção e geração de amiRNAs e seus precursorestambém estão disponíveis para o público, Schwab et ai., 2006.
Para desempenho ótimo, as técnicas de silenciamento gênicousadas para reduzir expressão em uma planta de um gene endógeno requeremo uso de seqüências de ácidos nucleicos de plantas monocotiledôneas paratransformação de plantas monocotiledôneas, e de plantas dicotiledôneas paratransformação de plantas dicotiledôneas. Preferivelmente, a seqüência deácidos nucleicos de qualquer dada espécie vegetal é introduzida naquelamesma espécie. Por exemplo, uma seqüência de ácidos nucleicos de arroz étransformada em uma planta de arroz. Entretanto, não é um requerimentoabsoluto que a seqüência de ácidos nucleicos a ser introduzida se origine damesma espécie de planta que a planta na qual ela será introduzida. Esuficiente que exista uma homologia substancial entre o gene endógeno alvo eo ácido nucleico a ser introduzido.
São descritos acima exemplos de vários métodos para aredução ou eliminação substancial de expressão em uma planta de um geneendógeno. Uma pessoa versada na arte deve ser prontamente capaz de adaptaros métodos mencionados acima para silenciamento de forma a atingir reduçãode expressão de um gene endógeno em uma planta inteira ou em partes destaatravés do uso de um promotor apropriado, por exemplo.
Marcador selecionável (geneVGene repórter
"Marcador selecionável", "gene marcador selecionável" ou"gene repórter" inclui qualquer gene que confere um fenótipo em uma célulana qual ele é expresso para facilitar a identificação e/ou seleção de células quesão transfectadas ou transformadas com uma construção de ácido nucleico dainvenção. Estes genes marcadores possibilitam a identificação de umatransferência bem sucedida das moléculas de ácido nucleico através de umasérie de princípios diferentes. Marcadores adequados podem ser selecionadosa partir de marcadores que conferem resistência a antibiótico ou herbicida,que introduzem uma nova característica metabólica ou que permitem seleçãovisual. Exemplos de genes marcadores selecionáveis incluem genesconferindo resistência a antibióticos (tal como nptll que fosforila neomicina ecanamicina, ou hpt, fosforilando higromicina, ou genes conferindo resistênciaa, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol,ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina),®a herbicidas (por exemplo bar que fornece resistência a Basta ; aroA ou goxfornecendo resistência contra glifosato, ou os genes conferindo resistência a,por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou genes quefornecem uma característica metabólica (tal como manA que permite queplantas usem manose como única fonte de carbono ou xilose isomerase para autilização de xilose, ou marcadores antinutritivos tal como a resistência a 2-desoxiglucose). Expressão de genes marcadores visuais resulta na formaçãode cor (por exemplo β-glucuronidase, GUS ou β-galactosidase com seussubstratos coloridos, por exemplo X-Gal), luminescência (tal como o sistemade luciferina/luceferase) ou fluorescência (Proteína fluorescente verde, GFP, ederivados deste). Esta lista representa apenas um pequeno número depossíveis marcadores. O trabalhador versado é familiar com tais marcadores.Diferentes marcadores são preferidos, dependendo do organismo e do métodode seleção.
Sabe-se que mediante integração estável ou transiente deácidos nucleicos em células de planta, apenas uma minoria das célulasabsorve o DNA exógeno e, se desejado, o integra em seu genoma,dependendo do vetor de expressão usado e da técnica de transfecção usada.
Para identificar e selecionar estes integrantes, um gene codificando para ummarcador selecionável (tal como aqueles descritos acima) normalmente éintroduzido nas células hospedeiras junto com o gene de interesse. Estesmarcadores podem ser por usados em mutantes nos quais estes genes não sãofuncionais, por exemplo, por deleção por métodos convencionais. Além disso,moléculas de ácido nucleico codificando um marcador selecionável podemser introduzida em uma célula hospedeira no mesmo vetor que compreende aseqüência codificando os polipeptídeos da invenção ou usados nos métodosda invenção, ou ainda em um vetor separado. Células que foram estavelmentetransfectadas com o ácido nucleico introduzido podem ser identificadas porexemplo por seleção (por exemplo, células que integraram o marcadorselecionável sobrevivem ao passo que as outras células morrem).Uma vez que os genes marcadores, particularmente genes pararesistência a antibióticos e herbicidas, não são mais requeridos ou sãoindesejados na célula hospedeira transgênica uma vez os ácidos nucleicostenham sido introduzidos com sucesso, o processo de acordo com a invençãopara introduzir os ácidos nucleicos vantajosamente emprega técnicas quepossibilitam a remoção ou excisão destes genes marcadores. Um tal método éo que é conhecido como co-transformação. O método de co-transformaçãoemprega dois vetores simultaneamente para a transformação, em vetorcarregando o ácido nucleico de acordo com a invenção e um segundocarregando o(s) gene(s) marcador(es). Uma grande proporção detransformantes recebe ou, no caso de plantas, compreende (até 40% ou maisdos transformantes), ambos os vetores. Em caso de transformação comAgrobactérias, os transformantes normalmente recebem apenas uma parte dovetor, i.e. a seqüência flanqueada pelo T-DNA, que normalmente representa agaveta de expressão. Os genes marcadores podem ser subseqüentementeremovidos da planta transformada realizando cruzamentos. Em outro método,genes marcadores integrados em um transposon são usados para atransformação junto com ácido nucleico desejado (conhecida como atecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte detransposase ou os transformantes são transformados com uma construção deácido nucleico conferindo expressão de uma transposase, transientemente ouestavelmente. Em alguns casos (aprox. 10%), o transposon pula fora dogenome da célula hospedeira uma vez que transformação tenha ocorrido comsucesso e é perdido. Em diversos casos adicionais, o transposon pula parauma localização diferente. Nestes casos o gene marcador deve ser eliminadorealizando cruzamentos. Em microbiologia, foram desenvolvidas técnicas quetornam possível, ou facilitam, a detecção de tais eventos. Um métodovantajoso adicional se fia no que é conhecido como sistemas derecombinação; cuja vantagem é de que eliminação por cruzamento pode serdispensada. O sistema mais conhecido deste tipo é o que é conhecido como osistema Cre/lox. Crel é uma recombinase que remove as seqüênciaslocalizadas entre as seqüências IoxP. Se o gene marcador está integrado entreas seqüências IoxP, ele é removido uma vez que transformação tenha ocorridocom sucesso, por expressão da recombinase. Sistemas de recombinaçãoadicionais são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J.Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149,2000: 553-566). Uma integração sítio específica no genoma vegetal dasseqüências de ácidos nucleicos de acordo com a invenção é possível.Naturalmente, estes métodos também podem ser aplicados a microorganismostal como levedura, fungos ou bactérias.
Transgênico/Transgene/Recombinante
Para os propósitos da invenção, "transgênico", "transgene" ou"recombinante" significa com erlação a, por exemplo, uma seqüência deácidos nucleicos, uma gaveta de expressão, construção gênica ou um vetorcompreendendo a seqüência de ácidos nucleicos ou um organismotransformado com as seqüências de ácidos nucleicos, gavetas de expressão ouvetores de acordo com a invenção, todas estas construções causadas pormétodos recombinantes nos quais ou
(a) as seqüências de ácidos nucleicos codificando proteínasúteis nos métodos da invenção, ou
(b) seqüência(s) de controle genético que é(são)operacionalmente ligada(s) com a seqüência de ácidos nucleicos de acordocom a invenção, por exemplo um promotor, ou
(c) a) e b)não estão localizadas em seu ambiente genético natural ouforam modificadas por métodos recombinantes, sendo possível para amodificação tomar a forma de, por exemplo, uma substituição, adição,deleção, inversão ou inserção de um ou mais resíduos de nucleotídeos. Oambiente genético natural é entendido como significando o locus genômicoou cromossômico natural na planta original ou a presença em uma bibliotecagenômica. No caso de uma biblioteca genômica, o ambiente genético naturalda seqüência de ácidos nucleicos é preferivelmente mantido, pelo menos emparte. O ambiente flanqueia a seqüência de ácidos nucleicos pelo menos emum lado e tem um comprimento de seqüência de pelo menos 50 bp,preferivelmente pelo menos 500 bp, especialmente preferivelmente pelomenos 1000 bp, mais preferivelmente pelo menos 5000 bp. Uma gaveta deexpressão naturalmente ocorrente - por exemplo, a combinação naturalmenteocorrente do promotor natural das seqüências de ácidos nucleicos com aseqüência de ácidos nucleicos correspondente codificando um polipeptídeoútil nos métodos da presente invenção, como definido acima - se torna umagaveta de expressão quando esta gaveta de expressão é modificada pormétodos não naturais, sintéticos ("artificiais") tal como, por exemplo,tratamento mutagênico. Métodos adequados são descritos, por exemplo, emPatente US 5.565.350 ou Patente Internacional 00/15815.
Uma planta transgênica para os propósitos da invenção é assimentendida como significando, como acima, que os ácidos nucleicos usados nométodo da invenção não estão em seu locus natural no genoma de dita planta,sendo possível para os ácidos nucleicos serem expressos homologamente ouheterologamente. Entretanto, como mencionado, transgênico tambémsignifica que, enquanto os ácidos nucleicos de acordo com a invenção ouusados no método inventivo estão em sua posição natural no genoma de umaplanta, a seqüência foi modificada com relação à seqüência natural, e/ou queas seqüências reguladoras das seqüências naturais foram modificadas.
Transgênica é preferivelmente entendido como significando a expressão dosácidos nucleicos de acordo com a invenção em um locus não natural nogenoma, i.e. expressão homóloga ou, preferivelmente, heteróloga dos ácidosnucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar.Transformação
O termo "introdução" ou "transformação" como referido nestelugar abrange a transferência de um polinucleotídeo exógeno para uma célulahospedeira, independente do método usado para transferência. Tecido vegetalcapaz de subseqüente propagação clonal, quer por organogênese ouembriogênese, pode ser transformado com uma construção genética dapresente invenção e uma planta inteira regenerada a partir daí. O tecidoparticular escolhido irá variar dependendo dos sistemas de propagação clonaldisponíveis para, e melhor adequados para, a espécie particular sendotransformada. Alvos de tecido exemplares incluem discos foliares, pólen,embriões, cotilédones, hipocótilos, megagametófitos, tecido de calo, tecidomeristemático existente (e.g., meristema apical, gemas axilares, e meristemasde raiz), e tecido de meristema induzido (e.g., meristema de cotilédone emeristema de hipocótilo). O polinucleotídeo pode ser transientemente ouestavelmente introduzido em uma célula hospedeira e pode ser mantido nãointegrado, por exemplo, como um plasmídeo. Alternativamente, ele pode serintegrado no genoma hospedeiro. A célula vegetal transformada resultantepode então ser usada para regenerar uma planta transformada de uma maneiraconhecida por pessoas versadas na arte.
A transferência de genes exógenos para o genoma de umaplanta é chamada transformação. Transformação de espécies vegetais é agorauma técnica bastante rotineira. Vantajosamente, qualquer dos diversosmétodos de transformação pode ser usado para introduzir o gene de interesseem uma célula ancestral adequada. Os métodos descritos para a transformaçãoe regeração de plantas a partir de tecidos vegetais ou células de planta podemser utilizados para transformação transiente ou estável. Métodos detransformação incluem o uso de lipossomos, eletroporação, produtos químicosque aumentam absorção de DNA livre, injeção do DNA diretamente naplanta, bombardeamento por pistola de partícula, transformação usando vírusou pólen e microprojeção. Métodos podem ser selecionados a partir dométodo de cálcio/polietilenoglicol para protoplastos (Krens, F.A. et al., (1982)Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373);eletroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); microinjeção em material vegetal (Crossway A et al., (1986) Mol. GenGenet 202: 179-185); bombardeamento de partícula revestida de DNA ouRNA (Klein TM et al., (1987) Nature 327: 70) infecção com (não integrativa)vírus e os semelhantes. Plantas transgênicas, incluindo plantas de culturatransgênicas, preferivelmente são produzidas através de transformaçãomediada por Agrobacterium. Um método de transformação vantajoso é atransformação em planta. Para esta finalidade, é possível, por exemplo,permitir que as agrobactérias atuem em grãos vegetais ou inocular omeristema vegetal com agrobactérias. Provou-se particularmente adequadoem conformidade com a invenção permitir que uma suspensão deagrobactérias transformadas atue na planta intacta ou pelo menos nosprimórdios florais. A planta é subseqüentemente cultivadas até que assementes da planta tratada sejam obtidas (Clough and Bent, Plant J. (1998)16, 735-743). Métodos para transformação mediada por Agrobacterium dearroz incluem métodos bem conhecidos para transformação de arroz, tal comoaqueles descritos em qualquer dos seguintes: pedido da Patente Européia EP1198985 Al, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al.(Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282,1994), cujas descrições são incorporadas por referência neste lugar como secompletamente apresentadas. No caso de transformação de milho, o métodopreferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50,1996) ou Frame et al. (Plant Physiol 129(1): 13-22, 2002), cujas descriçõessão incorporadas por referência neste lugar como se completamenteapresentadas. Ditos métodos são adicionalmente descritos como forma deexemplo em B. Jenes et al., Techniques for Gene Transfer, in: TransgenicPlants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu5Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol.Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção aser expressa é preferivelmente clonada em um vetor, que é adequado paratransformar Agrobacterium tumefaciens, por exemplo pBinl9 (Bevan et ai.,Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um talvetor podem ser usadas de uma maneira conhecida para a transformação deplantas, tal como plantas usadas como um modelo, como Arabidopsis{Arabidopsis thaliana está dentro do escopo da presente invenção nãoconsiderada como uma planta de cultivo), ou plantas de cultura tal como,como forma de exemplo, plantas de tabaco, por exemplo imergindo folhasmachucadas ou folhas picadas em uma solução agrobacteriana e então ascultivando em meio adequado. A transformação de plantas por meio deAgrobacterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzerem Nucl. Acid Res. (1988) 16, 9877 ou é conhecida entre outras maneiras apartir de F.F. White, Vectors for Gene Transfer in Higher Plants; inTransgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R.Wu, Academic Press, 1993, pp. 15-38.
Em adição à transformação de células somáticas, que entãotêm que ser regeneradas em plantas intactas, também é possível transformaras células de meristemas vegetais e em particular aquelas células que sedesenvolvem em gametas. Neste caso, os gametas transformados seguem odesenvolvimento vegetal natural, gerando plantas transgênicas. Assim, porexemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementessão obtidas a partir das plantas em desenvolvimento das quais uma certaproporção é transformada e assim transgênica [Feldman, KA and Marks MD(1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-HChua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific,Singapore, pp. 274-289]. Métodos alternativos são baseados na remoçãorepetida das inflorescências e incubação do sítio de excisão no centro daroseta com agrobactérias transformadas, através do que sementestransformadas podem da mesma maneira ser obtidas em um momentoposterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet,245: 363-370). Entretanto, um método especialmente efetivo é o método deinfiltração a vácuo com suas modificações tal como o método de "botãofloral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sobpressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold,N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso dométodo de "botão floral" o tecido floral em desenvolvimento é incubadobrevemente com uma suspensão agrobacteriana tratada com surfactante[Clough, SJ und Bent, AF (1998). The Plant J. 16, 735-743]. Uma certaproporção de sementes transgênicas são coletadas em ambos os casos, e estassementes pode ser distinguidas de sementes não transgênicas cultivando nascondições seletivas descritas acima. Em adição, a transformação estável deplastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmentereduzindo ou eliminando o risco de fluxo de transgene através de pólen namaioria das culturas. A tranformação do genoma de cloroplasto geralmente éatingida por um processo que foi esquematicamente apresentado em Klaus etal., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente asseqüências a serem transformadas são clonadas junto com um gene marcadorselecionável entre seqüências flanqueadoras homólogas ao genoma decloroplasto. Estas seqüências flanqueadoras homólogas dirigem integraçãosítio específica no plastoma. Transformação plastidial foi descrita para muitasespécies de plantas diferentes e uma visão geral é dada em Bock (2001)Transgenic plastids in basic research and plant biotechnology. J Mol Biol.2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towardscommercialization of plastid transformation technology. Trends Biotechnol.21, 20-28. Progresso biotecnológico adicional foi recentemente relatado emforma de transformantes de plastídeos livres de marcador, que podem serproduzidos por um gene marcador co-integrado transiente (Klaus et al., 2004,Nature Biotechnology 22(2), 225-229).
Identificação por ativação de T-DNA
Identificação por ativação de T-DNA (Hayashi et al. Science(1992) 1350-1353), envolve inserção de T-DNA, normalmente contendo umpromotor (também pode ser um acentuador de tradução ou um íntron), naregião genômica do gene de interesse ou 10 kb antes ou depois da região decodificação de um gene em uma configuração de forma que o promotor dirigeexpressão do gene dirigido. Tipicamente, regulação de expressão do genedirigido por seu promotor natural é interrompida e o gene cai sob o controledo promotor recentemente introduzido. O promotor é tipicamente embebidoem um T-DNA. Este T-DNA é aleatoriamente inserido no genoma vegetal,por exemplo, através de infecção por Agrobacterium e leva a expressãomodificada de genes perto do T-DNA inserido. As plantas transgênicasresultantes mostram fenótipos dominantes devido a expressão modificada degenes próximos ao promotor introduzido.
TILLING
TILLING (Lesões Locais Induzidas Dirigidas em Genomas) éuma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicoscodificando proteínas com expressão e/ou atividade modificada. TILLINGtambém permite seleção de plantas carregando tais variantes mutantes. Estasvariantes mutantes podem exibir expressão modificada, ou em força ou emlocalização ou em momento (se as mutações afetam o promotor por exemplo).Estas variantes mutantes podem exibir atividade maior do que aquela exibidapelo gene em sua forma natural. TILLING combina mutagênese de altadensidade com métodos de triagem rápida. As etapas tipicamente seguidas emTILLING são: (a) mutagênese EMS (Redei GP and Koncz C (1992) InMethods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds.Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al.,(1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold SpringHarbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner Jand Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods onMolecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b)preparação de DNA e combinação de indivíduos; (c) amplificação por PCRde uma região de interesse; (d) desnaturação e anelamento para permitirformação de heteroduplexes; (e) DHPLC, onde a presença de umheteroduplex em uma combinação é detectada como um pico extra nocromatograma; (f) identificação do mutante individual; e (g) seqüenciamentodo produto de PCR mutante. Métodos para TILLING são bem conhecidos naarte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto porStemple (2004) Nat Rev Genet 5(2): 145-50).
Recombinação homóloga
Recombinação homóloga permite introdução em um genomade um ácido nucleico selecionado em uma posição selecionada definida.Recombinação homóloga é uma tecnologia padrão usada rotineiramente emciências biológicas para organismos inferiores tal como levedura ou o musgoPhyscomitrella. Métodos para realizar recombinação homóloga em plantasforam descritos não apenas para plantas modelo (Offringa et al. (1990)EMBO J 9(10): 3077-84) mas também para plantas de cultura, por exemploarroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida and Terada(2004) Curr Opin Biotech 15(2): 132-8).
Produção
O termo "produção" em geral significa uma produçãomensurável de valor econômico, tipicamente relacionada a uma culturaespecificada, a uma área, e a um período de tempo. Partes vegetais individuaiscontribuem diretamente para produção baseada em seu número, tamanho e/oupeso, ou a produção atual é a produção por acre para uma cultura e ano, que édeterminada dividindo produção total (inclui tanto produção coletada comoavaliada) por acres plantados.
Vigor precoce
Vigor precoce (crescimento bem equilibrado saudável ativoespecialmente durante estágios iniciais de crescimento vegetal) pode resultarde aptidão vegetal aumentada devido a, por exemplo, as plantas serem melhoradaptadas a seu ambiente (i.e. otimizando o uso de recursos energéticos eparticionamento entre parte aérea e raiz). Plantas tendo vigor precoce tambémmostram uma sobrevivência de plântula aumentada e um melhorestabelecimento da cultura, o que freqüentemente resulta em camposaltamente uniformes (com a cultura crescendo de maneira uniforme, i.e. coma maioria das plantas atingindo os vários estágios de desenvolvimentosubstancialmente ao mesmo tempo), e freqüentemente produção melhor emaior. Portanto, vigor precoce pode ser determinado medindo vários fatores,tal como peso de mil sementes, porcentagem de germinação, porcentagem deemergência, crescimento de plântula, altura de plântula, comprimento de raiz,biomassa de raiz e parte aérea e muito mais.
Aumento/Melhora/Acentuação
Os termos "aumento", "melhora" ou "acentuação" sãopermutáveis e devem significar no sentido do pedido pelo menos a 5%, 6%,7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, maispreferivelmente 25%, 30%, 35% ou 40% mais produção e/ou crescimento emcomparação com plantas de controle como definido neste lugar.
Produção de sementes
Produção aumentada de sementes pode ser manifestada comoum ou mais dos seguintes: a) um aumento em biomassa de semente (pesototal de semente) que pode ser em uma base de semente individual e/ou porplanta e/ou por hectare ou acre; b) número aumentado de flores por planta; c)número aumentado de sementes (cheias); d) taxa aumentada de enchimento degrãos (que é expressa como a proporção entre o número de grãos cheiosdividido pelo número total de grãos); e) índice de colheita aumentado, que éexpresso como proporção da produção de partes aptas para corte, tal comosementes, dividida pela biomassa total; e f) Peso de Mil Sementes (TKW)aumentado, que é extrapolado a partir do número de grãos cheios contados eseu peso total. Um TKW aumentado pode resultar de um tamanho de sementee/ou peso de semente aumentado, e também pode resultar de um aumento emtamanho de embrião e/ou endosperma.
Um aumento em produção de sementes também pode sermanifestado como um aumento em tamanho de semente e/ou volume desemente. Além disso, um aumento em produção de sementes também podeser manifestado como um aumento em área de semente e/ou comprimento desemente e/ou largura de semente e/ou perímetro de semente. Produçãoaumentada também pode resultar em arquitetura modificada, ou pode ocorrerpor causa de arquitetura modificada.
Planta
O termo "planta" como usado neste lugar abrange plantasinteiras, ancestrais e progênie das plantas e partes vegetais, incluindosementes, partes aéreas, caules, folhas, raízes (incluindo tubérculos), flores, etecidos e órgãos, caracterizado pelo fato de que cada um dos mencionadosacima compreende o gene/ácido nucleico de interesse. O termo "planta"também abrange células de planta, culturas em suspensão, tecido de calo,embriões, regiões meristemáticas, gametófitos, esporófitos, pólen emicrósporos, de novo caracterizado pelo fato de que cada um dosmencionados acima compreende o gene/ácido nucleico de interesse.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos selecionados a partir da lista compreendendo Acer spp., Actinidiaspp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera,Allium spp., Amaranthus spp., Ammophila arenaria, Ananas eomosus,Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagusoffieinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina,Avena fatua var. sativa, Avena hybrida), Averrhoa carambola, Bambusa sp.,Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassica spp. (e.g.Brassica napus, Brassiea rapa ssp. [canola, oilseed rape, turnip rape]),Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa,Capsicum spp., Carex elata, Carica papctya, Carissa macrocarpa, Caryaspp., Carthamus tinetorius, Castanea spp., Ceiba pentandra, Cichoriumendivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffeaspp., Colocasia eseulenta, Cola spp., Corchorus sp., Coriandrum sativum,Corylus spp., Crataegus spp., Croeus sativus, Cueurbita spp., Cueumis spp.,Cynara spp., Daucus earota, Desmodium spp., Dimocarpus longan,Dioseorea spp., Diospyros spp., Eehinochloa spp., Elaeis (e.g. Elaeisguineensis, Elaeis oleifera), Eleusine eoraeana, Erianthus sp., Eriobotryajaponiea, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp.,Festuea arundinaeea, Fieus cariea, Fortunella spp., Fragaria spp., Ginkgobiloba, Glyeine spp. (e.g. Glycine max, Soja hispida ou Soja max), Gossypiumhirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva,Hibiseus spp., Hordeum spp. (e.g. Hordeum vulgare), Ipomoea batatas,Juglans spp., Laetuea sativa, Lathyrus spp., Lens eulinaris, Linumusitatissimum, Litehi ehinensis, Lotus spp., Luffa aeutangula, Lupinus spp.,Luzula sylvatiea, Lyeopersieon spp. (e.g. Lyeopersieon eseulentum,Lycopersicon lyeopersicum, Lyeopersieon pyriforme), Maerotyloma spp.,Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica,Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Menthaspp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp.,Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (e.g.Oryza sativa, Oryza latifolia), Panicum miliaceum, Panicum virgatum,Passiflora edulis, Pastinaea sativa, Pennisetum sp., Persea spp.,Petroselinum erispum, Phalaris arundinaeea, Phaseolus spp., Phleumpratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp.,Pistaeia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp.,Psidium spp., Puniea granatum, Pyrus eommunis, Quereus spp., Raphanussativus, Rheum rhabarbarum, Ribes spp., Ricinus eommunis, Rubus spp.,Saecharum spp., Salix sp., Sambueus spp., Seeale cereale, Sesamum spp.,Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium ouSolanum lycopersicum), Sorghum bieolor, Spinaeia spp., Syzygium spp.,Tagetes spp., Tamarindus indica, Theobroma caeao, Trifolium spp.,Triticoseeale rimpaui, Triticum spp. (e.g. Tritieum aestivum, Tritieum durum,Tritieum turgidum, Tritieum hybernum, Triticum maeha, Tritieum sativum ouTritieum vulgare), Tropaeolum minus, Tropaeolum majus, Vaeeinium spp.,Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizania palustris,Ziziphus spp., entre outras.
DESCRIÇÃO DETALHADA DA INVENÇÃO
Descrição detalhada para HAL3
De acordo com uma primeira forma de realização da presenteinvenção, é fornecido um método para aumentar produção vegetal em relaçãoa plantas de controle, compreendendo aumentar preferencialmente expressãode um ácido nucleico codificando um polipeptídeo HAL3 em tecidos emexpansão de uma planta.
Qualquer referência daqui por diante a uma "proteína útil nosmétodos da invenção" é adotada para significar um polipeptídeo HAL3 comodefinido neste lugar. Qualquer referência daqui por diante a um "ácidonucleico útil nos métodos da invenção" é adotada para significar a ácidonucleico capaz de codificar um tal polipeptídeo HAL3. O ácido nucleico a serintroduzido em uma planta (e portanto útil para realizar os métodos dainvenção) é qualquer ácido nucleico codificando o tipo de proteína que seráagora descrito, daqui por diante também chamado "ácido nucleico HAL3" ou"gene HALT.
Uma "referência", "planta de referência", "controle", "plantade controle", "tipo selvagem" ou "planta tipo selvagem" é em particular umacélula, um tecido, um órgão, uma planta, ou uma parte desta, que não foiproduzida de acordo com o método da invenção. Por conseguinte, os termos"tipo selvagem", "controle" ou "referência" são permutáveis e podem ser umacélula ou uma parte da planta tal como uma organela ou tecido, ou umaplanta, que não foi modificada ou tratada de acordo com o método descritoneste lugar de acordo com a invenção. Por conseguinte, a célula ou uma parteda planta tal como uma organela ou uma planta usada como tipo selvagem,controle ou referência corresponde à célula, planta ou parte desta tanto quantopossível e é em qualquer outra propriedade mas no resultado do processo dainvenção tão idêntica ao assunto da invenção quanto possível. Assim, o tiposelvagem, controle ou referência é tratado identicamente ou tão idênticoquanto possível, alegando que apenas condições ou propriedades podem serdiferentes que não influenciam a qualidade da propriedade testada. Istosignifica em outras palavras que o tipo selvagem significa (1) uma planta, quecarrega a forma inalterada ou não modificada de um gene ou alelo ou (2) omaterial/planta inicial do qual as plantas produzidas pelo processo ou métododa invenção são derivadas.
Preferivelmente, qualquer comparação entre as plantas tiposelvagem e as plantas produzidas pelo método da invenção é realizada emcondições análogas. O termo "condições análogas" significa que todas ascondições tal como, por exemplo, condições de cultura ou crescimento,condições de ensaio (tal como composição de tampão, temperatura,substratos, cepa de patógeno, concentrações e os semelhantes) sào mantidasidênticas entre os experimentos a serem comparados.
A "referência", "controle", ou "tipo selvagem" épreferivelmente um sujeito, e.g. uma organela, uma célula, um tecido, umaplanta, que não foi modulada, modificada ou tratada de acordo com oprocesso descrito neste lugar da invenção e é em qualquer outra propriedadetão similar ao assunto da invenção quanto possível. A referência, controle, outipo selvagem é em seu genoma, transcriptoma, proteoma ou metaboloma tãosimilar quanto possível ao sujeito da presente invenção. Preferivelmente, otermo organela, célula, tecido ou planta de "referência" "controle" ou "tiposelvagem", se refere a uma organela, célula, tecido ou planta, que é quasegeneticamente idêntica à organela, célula, tecido ou planta, da presenteinvenção ou uma parte desta preferivelmente 95%, mais preferidos são 98%,ainda mais preferidos são 99,00%, em particular 99,10%, 99,30%, 99,50%,99,70%, 99,90%, 99,99%, 99, 999% ou mais. Preferivelmente a "referência","controle", ou "tipo selvagem" é preferivelmente um sujeito, e.g. umaorganela, uma célula, um tecido, uma planta, que é geneticamente idêntico àplanta, organela celular usada de acordo com o método da invenção excetoque moléculas de ácido nucleico ou o produto de gene codificado por elas sãotrocados, modulados ou modificados de acordo com o método inventivo.
Em caso, um controle, referência ou tipo selvagem diferindodo sujeito da presente invenção apenas não sujeito do método da invenção nãopode ser fornecido, um controle, referência ou tipo selvagem pode ser umaplanta na qual a causa para a modulação da atividade conferindo o aumentodos metabólitos como descrito em exemplos.
O aumento referido da atividade das quantidades depolipeptídeo em uma célula, um tecido, uma organela, um órgão ou umorganismo ou uma parte deste preferivelmente para pelo menos 5%,preferivelmente para pelo menos 10% ou para pelo menos 15%,especialmente preferivelmente para pelo menos 20%, 25%, 30% ou mais,muito especialmente preferivelmente são para pelo menos 40%, 50% ou 60%,mais preferivelmente são para pelo menos 70% ou mais em comparação como controle, referência ou tipo selvagem.
O termo "rendimento aumentado" é adotada para significar umaumento em biomassa (peso) de uma ou mais partes de uma planta, o quepode incluir partes (aptas para corte) acima do solo e/ou partes (aptas paracorte) abaixo do solo. Preferivelmente, o aumento em produção é pelo menos10% sobre a produção de plantas tipo selvagem correspondentes.
Em particular, tais partes aptas para corte são sementes, edesempenho dos métodos da invenção resulta em plantas tendo produçãoaumentada de sementes em relação à produção de sementes de plantas decontrole.
O termo "expressão" ou "expressão de gene" significa oaparecimento de uma característica fenotípica como uma conseqüência datranscrição de um gene específico ou genes específicos. O termo "expressão"ou "expressão de gene" em particular significa a transcrição de um gene ougenes em RNA estrutural (rRNA, tRNA) ou mRNA com traduçãosubseqüente do último em uma proteína. O processo inclui transcrição deDNA, processamento do produto de mRNA resultante e sua tradução em umaproteína ativa.
Desempenho dos métodos da invenção gera plantas tendocaracterísticas de produção melhoradas. Em particular desempenho dosmétodos da invenção gera plantas tendo produção aumentada, especialmenteprodução aumentada de sementes em relação a plantas de controle. Os termos"produção" e "produção de sementes" são descritos em mais detalhe na seçãode "definições" neste lugar.
Referência neste lugar a características de produçãomelhoradas é adotada para significar um aumento em biomassa (peso) de umaou mais partes de uma planta, o que pode incluir partes (aptas para corte)acima do solo e/ou partes (aptas para corte) abaixo do solo. Em particular, taispartes aptas para corte são sementes, e desempenho dos métodos da invençãoresulta em plantas tendo produção aumentada de sementes em relação àprodução de sementes de plantas de controle adequadas.
Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas por hectare ou acre, um aumento no número de espigas por planta, umaumento no número de fileiras, número de sementes por fileira, peso desemente, peso de mil sementes, comprimento/diâmetro de espiga, aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), entre outros. Adotando arrozcomo um exemplo, um aumento de produção pode ser manifestado como umaumento em um ou mais dos seguintes: número de plantas por hectare ouacre, número de panículas por planta, número de espiguilhas por panícula,número de flores (floretes) por panícula (que é expresso como uma proporçãodo número de grãos cheios pelo número de panículas primárias), aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), aumento em peso de milsementes, entre outros.
De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo produçãoaumentada de sementes em relação a plantas de controle. Portanto de acordocom a presente invenção, é fornecido um método para aumentar produção desementes em plantas em relação à produção de sementes de plantas decontrole, o método compreendendo aumentar preferencialmente expressão deum ácido nucleico codificando um polipeptídeo HAL3 em tecidos de partesaéreas, preferivelmente em tecidos em expansão de um parte aérea vegetal.
Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas de controle em um estágiocorrespondente em seu ciclo de vida.
A taxa de crescimento aumentada pode ser específica para umaou mais partes de uma planta (incluindo sementes), ou pode estarsubstancialmente ao longo de toda a planta. Plantas tendo uma taxa decrescimento aumentada podem ter um ciclo de vida mais curto. O ciclo devida de uma planta pode ser adotado para significar o tempo necessário paracrescer de semente madura seca até o estágio onde a planta produziu sementesmaduras secas, similares ao material inicial. Este ciclo de vida pode serinfluenciado por fatores tal como vigor precoce, taxa de crescimento, índicerelativo ao verde, tempo de florescimento e velocidade de maturação desementes. O aumento em taxa de crescimento pode ocorrer em um ou maisestágios no ciclo de vida de uma planta ou durante substancialmente o ciclode vida inteiro de planta. Taxa de crescimento aumentada durante os estágiosiniciais no ciclo de vida de uma planta pode permitir vigor melhorado. Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível (um efeito similar pode ser obtidocom tempo de florescimento adiantado). Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).
Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contra-partestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).
Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.
A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.
De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle. Portanto, deacordo com a presente invenção, é fornecido um método para aumentar a taxade crescimento de plantas, cujo método compreende modular expressão,preferivelmente aumentar expressão, em uma planta de um ácido nucleicocodificando um polipeptídeo HAL3 como definido neste lugar.
Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.
Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devido a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido a seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle adequadas cultivadas emcondições comparáveis. Portanto, de acordo com a presente invenção, éfornecido um método para aumentar produção em plantas cultivadas emcondições de não estresse ou em condições de seca branda, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo HAL3.
Desempenho dos métodos da invenção gera plantas cultivadasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo HAL3. Deficiência de nutrientes pode resultarde uma carência ou excesso de nutrientes tal como nitrogênio, fosfatos eoutros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio,manganês, ferro e boro, entre outros.
De acordo com uma segunda característica preferida dainvenção, desempenho dos métodos da invenção gera plantas tendo vigorvegetal aumentado em relação a plantas de controle, particularmente duranteos estágios iniciais de desenvolvimento vegetal (tipicamente três, quatrosemanas após germinação no caso de arroz e milho, mas isto irá variar deespécie para espécie) levando a vigor precoce. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar o vigor precoce deplanta, cujo método compreende modular, preferivelmente aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeoHAL3. Preferivelmente o aumento em vigor de plântula é atingidoexpressando o ácido nucleico codificando o polipeptídeo HAL3 sob ocontrole de um promotor específico de parte aérea. Também é fornecido ummétodo para produzir plantas tendo vigor precoce em relação a plantas decontrole, cujo método compreende modular, preferivelmente aumentar,expressão em uma planta de um ácido nucleico codificando um polipeptídeoHAL3.
Vigor precoce também pode resultar de aptidão vegetalaumentada devido, por exemplo, às plantas serem mais bem adaptadas a seuambiente (i.e. otimizando o uso de recursos energéticos e particionamentoentre parte aérea e raiz). Plantas tendo vigor precoce também mostram umasobrevivência de plântula aumentada e um melhor estabelecimento da cultura,o que freqüentemente resulta em campos altamente uniformes (com a culturacrescendo de maneira uniforme, i.e. com a maioria das plantas atingindo osvários estágios de desenvolvimento substancialmente ao mesmo tempo), efreqüentemente produção melhor e maior. Portanto, vigor precoce pode serdeterminado medindo vários fatores, tal como peso de mil sementes,porcentagem de germinação, porcentagem de emergência, crescimento deplântula, altura de plântula, comprimento de raiz, biomassa de raiz e parteaérea e muito mais.
Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia.
Outras plantas vantajosas são selecionadas a partir do grupoconsistindo de Asteraceae tal como os gêneros Helianthus, Tagetes e.g. asespécies Helianthus annus [girassol], Tagetes lúcida, Tagetes ereeta ouTagetes tenuifolia [Cravo], Brassicaceae tal como os gêneros Brassica,Arabadopsis e.g. as espécies Brassica napus, Brassica rapa ssp. [canola, colza, nabo] ou Arabidopsis thaliana. Fabaceae tal como os gêneros Glycinee.g. as espécies Glycine max, Soja hispida ou Soja max [soja]. Linaceae talcomo os gêneros Linum e.g. a espécie Linum usitatissimum, [linho, sementede linho]; Poaceae tal como os gêneros Hordeum, Secale, Avena, Sorghum,Oryza, Zea, Triticum e.g. as espécies Hordeum vulgare [cevada]; Secalecereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatuavar. sativa, Avena hybrida [aveia], Sorghum bicolor [Sorgo, milheto], Oryzasativa, Oryza latifolia [arroz], Zea mays [milho, mais] Triticum aestivum,Tritieum durum, Tritieum turgidum, Triticum hybernum, Tritieum macha,Tritieum sativum ou Tritieum vulgare [trigo, trigo da classe pão, trigocomum]; Solanaceae tal como os gêneros Solanum, Lycopersicon e.g. asespécies Solanum tuberosum [batata], Lyeopersieon esculentum, Lycopersiconlyeopersieum, Lyeopersieon pyriforme, Solanum integrifolium ou Solanumlyeopersieum [tomate].
O termo "polipeptídeo HAL3" como definido neste lugar serefere a uma proteína pertecendo à superfamília HFCD (Flavina Homo-oligomérica contendo Cys Descarboxilases; Kupke J. Biol.Chem. 276, 27597-27604, 2001). Estas proteínas compartilham um motivo de ligação de flavina,resíduos conservados de sítio ativo e são enzimas triméricas oudodecaméricas. Proteínas HAL3 compreendem preferivelmente de término Na término C (i) uma hélice de ligação de substrato, (ii) um motivo His deinserção, (iii) um motivo PXMNXXMW e (iv) um grampo dereconhecimento de substrato (Figura 1). Estes quatro domínios são previstosestarem envolvidos em ligação de substrato, o motivo His de inserçãocompreende um resíduo His conservado que está envolvido no sítio ativo aopasso que a seqüência no grampo de reconhecimento de substrato pode ser dealguma maneira variável em seqüência e comprimento (Blaesse et al., EMBOJ. 19, 6299-6310, 2000). As características estruturais (i) a (iv) também sãodescritas em Kupke et al. (2001), cuja descrição é incorporada neste lugar porreferência. Tipicamente, polipeptídeos HAL3 são capazes de ligação decofatores FMN.
Tipicamente a hélice ligação de substrato é compreendida emmotivo de seqüência 1 com a seguinte seqüência consenso (SEQ ID NO: 6):(K/R)PR(V/I)(I/L)LAA(S/T)GSVA(A/S)(I/MA^)KF(G/E/A/S)(N/S/I)L(C/V/A)(H/R7G)(C/S/I)(F/L)(T/S/C)(E/D/Q) WA(E/D) V(RZK)A V(V/A/S).
O motivo His de inserção, o motivo PXMNXXMW e ogrampo de reconhecimento de substrato são parte de motivo de seqüência 2com a seguinte seqüência consenso (SEQ ID NO: 7):VLHIELR(R/K/Q)WAD(V/I/A)(LM)(V/I)IAPLSANTL(G/A)KJAGG(L/M)CDNLLTC(W)(W)RAWD(Y/F)(T/S/N/D/K)KP(L/F/M/I)F(V/A)APAMNT(L/F)MW(N/S/T)NPFT(E/S/Q/A)(R/K)H(L/F/I)F(M)(D/N/S)(E/L/Q)(L/M)G(W/L)(T/S/A/I)L(W)PP(W/T)(K7T/S)K(R/T/K)LACGD(Y/H)G(N/T)GAM(A/S)E
em que Xi pode ser qualquer aminoácido, preferivelmente X1 éum de L, V, Ε, H, D, Μ, I ou Q e caracterizado pelo fato de que X2 pode serqualquer aminoácido, preferivelmente X2 é um de S, L5 T, A, ou V.
Estes motivos formam parte de uma região conservada maiorna proteína, como um exemplo, a região conservada de HAL3a deArabidopsis é dada como SEQ ID NO: 8. Polipeptídeos HAL3 úteis nosmétodos da presente invenção têm em ordem crescente de preferência pelomenos 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüênciacom a região conservada representada por SEQ ID NO: 8.
A região conservada em proteínas HAL3, como exemplificadoem SEQ ID NO: 8 e compreendendo as características descritas acima (i) a(iv), abrange um domínio de Flavoproteína que pode ser identificado usandobancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl.Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30,242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318),Prosite (Bucher and Bairoch (1994), A generalized profile syntax forbiomolecular sequences motifs and its funetion in automatic sequenceinterpretation. (In) ISMB-94; Proceedings 2nd International Conference onIntelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P.,Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al.,Nucl. Acids. Res. 32:D134-D137, (2004)) ou Pfam (Bateman et al., NucleicAcids Research 30(1): 276-280 (2002)). Este domínio de ligação de FMN(Pfam entry PF02441, InterPro entry IPR003382) é tipicamente encontradoem enzimas flavoproteína. Os termos "domínio" e "motivo" são definidos naseção de definições acima.
A região conservada em SEQ ID NO: 2, como representadopor SEQ ED NO: 8, também pode ser identificada em outras proteínas HAL3,usando métodos para o alinhamento de seqüências para comparação comodescrito acima. Em algumas instâncias, os parâmetros padrão podem serajustados para modificar a estringência da busca. Por exemplo usandoBLAST, o limiar de significância estatística (chamado valor esperado") pararelatar pareamentos contra seqüências de banco de dados pode ser aumentadopara mostrar pareamentos menos estringentes. Desta maneira, pareamentoscurtos praticamente exatos podem ser identificados, incluindo os motivosconservados 1 e 2 (SEQ ID NO: 6 e 7), ou pareamentos com uma ou maismudança conservativa em qualquer posição.
Polipeptídeos HAL3 (pelo menos em sua forma nativa) e seushomólogos tipicamente catalisam a descarboxilação de 4'-fosfopantotenoilcisteína para 4'-fosfopanteteína, uma etapa em biossíntese decoenzima A, cuja reação pode ser testada em um ensaio bioquímico;alternativamente, atividade de HAL3 pode ser ensaiada por um teste decomplementação com uma cepa de E. coli dfp mutante (Kupke et al 2001;Yonamine et al 2004). A enzima também é capaz de descarboxilarpantotenoilcisteína a pantotenoilcisteamina. Além disso, a proteína estáenvolvida em conferir tolerância a estresse salino e osmótico a plantas, cujacaracterística pode ser útil em um bioensaio para HAL3.
SEQ ID NO: 2 (codificado por SEQ ID NO: 1) é um exemplode um polipeptídeo HAL3 compreendendo características de término N atérmino C (i) uma hélice de ligação de substrato, (ii) um motivo His deinserção, (iii) um motivo PXMNXXMW e (iv) um grampo dereconhecimento de substrato; e tendo em ordem crescente de preferência pelomenos 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüênciacom a região conservada representada por SEQ ID NO: 8. Exemplosadicionais de polipeptídeos HAL3 compreendendo características (i) a (iv)são dados em Tabela A na seção de exemplos abaixo:
Homólogos de um polipeptídeo HAL3 também podem serusados para realizar os métodos de invenção. Homólogos (ou proteínashomólogas) podem ser prontamente identificados usando técnicas de rotinabem conhecidas na arte, tal como por alinhamento de seqüências. Métodospara o alinhamento de seqüências para comparação são bem conhecidos naarte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA.GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas quemaximiza o número de pareamentos e minimiza o número de lacunas. Oalgoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calculaidentidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Biotechnology Information. Homólogos podem ser prontamenteidentificados usando, por exemplo, o algoritmo de alinhamento de múltiplasseqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamentopareado, e um método de pontuação em porcentagem. Porcentagens globaisde similaridade e identidade também podem ser determinadas usando um dosmétodos disponíveis no pacote de aplicativo computacional MatGAT(Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: anapplication that generates similarity/identity matrices using protein or DNAsequences.). Edição manual secundária pode ser realizada para otimizaralinhamento entre motivos conservados, como seria evidente para uma pessoaversada na arte.
Os valores de identidade de seqüência podem ser determinadosao longo do domínio conservado inteiro (como indicado acima) ou ao longoda seqüência de ácidos nucleicos ou de aminoácidos de comprimentocompleto usando os programas mencionados acima usando os parâmetrospadrão.
Homólogos também incluem ortólogos e parálogos. Ortólogose parálogos podem ser facilmente encontrados realizando uma assim chamadabusca blast recíproca. Isto pode ser feito por um primeiro BLAST envolvendosubmeter uma seqüência de consulta (por exemplo, SEQ ID NO: 1 ou SEQ IDNO: 2) a uma busca BLAST contra qualquer banco de dados de seqüências,tal como o banco de dados publicamente disponível de NCBI. BLASTN ouTBLASTX (usando valores pré-determinados padrão) podem ser usados ao iniciar de uma seqüência de nucleotídeos e BLASTP ou TBLASTN (usandovalores pré-determinados padrão) podem ser usados ao iniciar de umaseqüência de proteínas. Os resultados de BLAST podem ser opcionalmentefiltrados. As seqüências de comprimento completo ou dos resultados filtradosou dos resultados não filtrados são então submetidas a uma segunda buscaBLAST (BLAST de retorno) contra seqüências do organismo do qual aseqüência de consulta é derivada (onde a seqüência de consulta é SEQ IDNO: 1 ou SEQ ID NO: 2 o segundo BLAST deve portanto ser contraseqüências de Arabidopsis). Os resultados da primeira e segunda buscaBLAST são então comparados. Um parálogo é identificado se um acerto dealto pontuação do primeiro BLAST é da mesma espécie da qual a seqüênciade consulta é derivada; um ortólogo é identificado se um acerto de altopontuação não é da mesma espécie da qual a seqüência de consulta éderivada. Ortólogos preferidos são ortólogos de AtHAL3a (SEQ ID NO: 2),AtHAL3b (SEQ ID NO: 10) ou a forma grande de AtHAL3b (SEQ ID NO:40). Acertos de alto pontuação são aqueles tendo um baixo valor E. Quantomenor o valor E, mais significante é o pontuação (ou em outras palavrasmenor a chance de que o acerto tenha sido encontrado ao acaso). Computaçãodo valor E é bem conhecida na arte. No caso de famílias grandes, ClustalWpode ser usado, seguido por uma árvore de agrupamento de vizinhos, paraajudar a visualizar agrupamento de genes relacionados e para identificarortólogos e parálogos. Em adição a valores E, comparações também sãopontuadas por identidade percentual. Identidade percentual se refere aonúmero de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüênciasde ácidos nucleicos (ou polipeptídeos) comparadas ao longo de umcomprimento particular. Preferivelmente, homólogos de polipeptídeo HAL3têm em ordem crescente de preferência pelo menos 60%, 70%, 80%, 85%,90%, 95%, 96%, 97%, 98% ou 99% ou mais identidade ou similaridade deseqüência (identidade funcional) com um polipeptídeo HAL3 não modificadocomo representado por SEQ ID NO: 2. Preferivelmente, homólogos depolipeptídeo HAL3 são as representados pelas seqüências referidas em TabelaA.
O polipeptídeo HAL3 útil nos métodos da presente invençãopode ser um derivado de SEQ ID NO: 2. "Derivados" incluem peptídeos,oligopeptídeos, polipeptídeos que podem, comparados com a seqüência deaminoácidos da forma naturalmente ocorrente da proteína, tal como aquelaapresentada em SEQ ID NO: 2, compreender substituições de aminoácidospor resíduos de aminoácidos não naturalmente ocorrentes, ou adições deresíduos de aminoácidos não naturalmente ocorrentes. Derivados dasproteínas como representado pelas seqüências listadas em Tabela A sãoexemplos adicionais que podem ser adequados para uso nos métodos dainvenção
Exemplos de ácidos nucleicos codificando polipeptídeosHAL3 incluem mas não são limitados àqueles representados pelas seqüênciaslistadas em Tabela A. Variantes de ácidos nucleicos codificando polipeptídeosHAL3 podem ser adequadas para uso nos métodos da invenção. Variantesadequadas incluem porções de ácidos nucleicos codificando polipeptídeosHAL3 e/ou ácidos nucleicos capazes de hibridizar com ácidosnucleicos/genes codificando polipeptídeos HAL3. Variantes adicionaisincluem variantes de união e variantes alélicas de ácidos nucleicoscodificando polipeptídeos HAL3.
O termo "porção" como definido neste lugar se refere a umpedaço de DNA codificando um polipeptídeo compreendendo decaracterísticas de término N a término C (i) uma hélice de ligação desubstrato, (ii) um motivo His de inserção, (iii) um motivo PXMNXXMW e(iv) um grampo de reconhecimento de substrato; e tendo em ordem crescentede preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90% ou 95% deidentidade de seqüência com a região conservada representada por SEQ ID NO: 8.
Uma porção pode ser preparada, por exemplo, fazendo uma oumais deleções a um ácido nucleico codificando um polipeptídeo HAL3. Asporções podem ser usadas em forma isolada ou elas podem ser fusionadas aoutras seqüências de codificação (ou não codificantes) a fim de, por exemplo,produzir uma proteína que combina diversas atividades. Quando fusionado aoutras seqüências de codificação, o polipeptídeo resultante produzidomediante tradução pode ser maior do que aquele previsto para a porção deHAL3. Preferivelmente, a porção codifica para um polipeptídeo comsubstancialmente a mesma atividade biológica que o polipeptídeo HAL3 deSEQ ID NO: 2. A porção é tipicamente é de pelo menos 50, 100, 150 ou 200nucleotídeos de comprimento, preferivelmente pelo menos 250, 300, 350 ou400 nucleotídeos de comprimento, mais preferivelmente pelo menos 450, 500,550, 600 ou 650 nucleotídeos de comprimento.
Preferivelmente, a porção é uma porção de um ácido nucleicocomo representado pelas seqüências listadas em Tabela A. Maispreferivelmente a porção é uma porção de um ácido nucleico comorepresentado por SEQ ID NO: 1.
Os termos "fragmento", "fragmento de uma seqüência" ou"parte de uma seqüência" "porção" ou "porção desta" significam umaseqüência truncada da seqüência original referida. A seqüência truncada(seqüência de ácidos nucleicos ou proteínas) pode variar amplamente emcomprimento; o tamanho mínimo sendo uma seqüência de tamanho suficientepara fornecer uma seqüência com pelo menos uma função e/ou atividadecomparável da seqüência original referida ou hibridizar com a molécula deácido nucleico da invenção ou usado no processo da invenção em condiçõesestringentes, enquanto o tamanho máximo não é crítico. In some applications,o tamanho máximo normalmente não é substancialmente maior do que aquelerequerido para fornecer a(s) atividade(s) e/ou íunções(s) desejada(s) daseqüência original. Uma função comparável significa pelo menos 40%, 45%ou 50%, preferivelmente pelo menos 60%, 70%, 80% ou 90% ou mais daseqüência original.
Outra variante de um ácido nucleico codificando umpolipeptídeo HAL3, útil nos métodos da presente invenção, é um ácidonucleico capaz de hibridizar em condições de estringência reduzida,preferivelmente em condições estringentes, com uma sonda derivada do ácidonucleico como definido acima, cuja seqüência de hibridização codifica umpolipeptídeo compreendendo características de término N a término C (i) umahélice de ligação de substrato, (ii) um motivo His de inserção, (iii) um motivoPXMNXXMW e (iv) um grampo de reconhecimento de substrato; e tem emordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%ou 95% de identidade de seqüência com a região conservada representada porSEQ ID NO: 8.
Preferivelmente, a seqüência de hibridização é uma que écapaz de hibridizar com um ácido nucleico como representado por (ou comsondas derivadas de) as seqüências listadas em Tabela A, ou com uma porçãode qualquer destas seqüências (a seqüência alvo). Mais preferivelmente aseqüência de hibridização é capaz de hibridizar com SEQ ID NO: 1 (ou comsondas derivadas desta). Sondas geralmente são de menos do que 700 bp ou600 bp de comprimento, preferivelmente menos do que 500, 400 bp, 300 bp200 bp ou 100 bp de comprimento. Comumente, comprimentos de sondaspara hibridizações DNA-DNA tal como Southern blotting, variam entre 100 e500 bp, ao passo que a região hibridizante em sondas para hibridizaçõesDNA-DNA tal como em amplificação por PCR geralmente são menores doque 50, mas maiores do que 10 nucleotídeos, preferivelmente elas são de 15,20, 25, 30, 35, 40, 45 ou 50 bp de comprimento.
O polipeptídeo HAL3 pode ser codificado por uma variante deprocessamento. O termo "variante de processamento" como usado neste lugarabrange variantes de uma seqüência de ácidos nucleicos na qual íntrons e/ouéxons selecionados foram cortados, substituídos, deslocados ou adicionados,ou na qual íntrons foram encurtados ou alongados. Tais variantes serão umasnas quais a atividade biológica substancial da proteína é mantida, o que podeser atingido retendo seletivamente segmentos funcionais da proteína. Taisvariantes de união podem ser encontradas na natureza ou podem ser feitaspelo homem. Métodos para fazer tais variantes de união são bem conhecidosna arte.
Variantes de união preferidas são variantes de união do ácidonucleico codificando um polipeptídeo HAL3 compreendendo de término N atérmino C (i) uma hélice de ligação de substrato, (ii) um motivo His deinserção, (iii) um motivo PXMNXXMW e (iv) um grampo dereconhecimento de substrato; e tendo em ordem crescente de preferência pelomenos 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüênciacom a região conservada representada por SEQ ID NO: 8.
Variantes de união adicionalmente preferidas de ácidosnucleicos codificando polipeptídeos HAL3 compreendendo característicascomo definidas acima são variantes de união de um ácido nucleico comorepresentado por qualquer uma das seqüências listadas em Tabela A. Maispreferido é uma variante de processamento de uma seqüência de ácidosnucleicos como representado por SEQ ID NO: 1.
O polipeptídeo HAL3 também pode ser codificado por umavariante alélica de um ácido nucleico codificando um polipeptídeocompreendendo de término N a término C (i) uma hélice de ligação desubstrato, (ii) um motivo His de inserção, (iii) um motivo PXMNXXMW e(iv) um grampo de reconhecimento de substrato; e tendo em ordem crescentede preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90% ou 95% deidentidade de seqüência com a região conservada representada por SEQ EDNO: 8.
Variantes alélicas preferidas de ácidos nucleicos codificandopolipeptídeos HAL3 compreendendo características como definidas acima sãovariantes alélicas de um ácido nucleico como representado por qualquer umadas seqüências listadas em Tabela A. Mais preferido é uma variante alélica deuma seqüência de ácidos nucleicos como representado por SEQ ID NO: 1.
Evolução dirigida (ou embaralhamento gênico) também podeser usada para gerar variantes de ácidos nucleicos codificando polipeptídeosHAL3. Mutagênese dirigida a sítio pode ser usada para gerar variantes deácidos nucleicos codificando polipeptídeos HAL3. Estão disponíveis diversosmétodos para atingir mutagênese dirigida a sítio, o mais comum sendométodos baseados em PCR (Current Protocols in Molecular Biology. Wiley
Eds.).
Ácidos nucleicos codificando polipeptídeos HAL3 podem serderivados de qualquer fonte natural ou artificial. O ácido nucleico pode sermodificado a partir de sua forma nativa em composição e/ou ambientegenômico através de deliberada manipulação humana. Preferivelmente oácido nucleico HAL3 é de uma planta, ainda preferivelmente de uma plantadicotiledônea, mais preferivelmente da família Brassicaceae, maispreferivelmente o ácido nucleico é de Arabidopsis thaliana.
A expressão aumentada de um ácido nucleico codificando umpolipeptídeo HAL3, preferencialmente em partes aéreas de uma planta, podeser realizada introduzindo uma modificação genética (preferivelmente nolocus de um gene HAL3). O locus de um gene como definido neste lugar éadotado para significar uma região genômica, que inclui o gene de interesse e1OKB antes ou depois da região de codificação.
A modificação genética pode ser introduzida, por exemplo, porqualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLINGe recombinação homóloga (como descrito na seção de definições) ouintroduzindo e aumentando expressão um ácido nucleico codificando umpolipeptídeo HAL3 preferencialmente em tecidos em expansão de uma planta.Seguindo introdução da modificação genética, segue uma etapa opcional deselecionar para expressão aumentada de um ácido nucleico codificando umpolipeptídeo de fator HAL3 preferencialmente em tecidos em expansão, cujaexpressão aumentada gera plantas tendo produção aumentada.
Identificação por ativação de T-DNA resulta em plantastransgênicas que mostram fenótipos dominantes devido a expressãomodificada de genes próximos ao promotor introduzido. O promotor a serintroduzido pode ser qualquer promotor capaz de aumentar expressão doácido nucleico codificando um polipeptídeo HAL3 preferencialmente emtecidos em expansão de uma planta.
Uma modificação genética também pode ser introduzida nolocus de um gene codificando um polipeptídeo HAL3 usando a técnica deTILLrNG (Lesões Locais Induzidas Dirigidas em Genomas). Plantascarregando tais variantes mutantes têm expressão aumentada de um ácidonucleico codificando um polipeptídeo HAL3 preferencialmente em tecidosvegetais em expansão.
Ativação de T-DNA e TILLING são exemplos de tecnologiasque possibilitam a geração de modificações genéticas compreendendoaumentar preferencialmente expressão de um ácido nucleico codificando umpolipeptídeo HAL3 em tecidos em expansão de plantas.
Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga. O ácido nucleico a ser direcionadopreferivelmente é a região controlando a expressão natural de um ácidonucleico codificando um polipeptídeo HAL3 em uma planta. Um promotorfraco específico para expressão em partes aéreas é introduzido nesta região,substituindo-a parcialmente ou substancialmente toda ela.
Um método preferido para introduzir uma modificaçãogenética (que neste caso não precisa ser no locus de um gene HAL3) éintroduzir e expressar preferencialmente na parte aérea de uma planta umácido nucleico codificando um polipeptídeo HAL3, como definido acima. Oácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico decomprimento completo ou pode ser uma porção ou uma seqüência dehibridização ou outra variante de ácido nucleico como definido acima.
Os métodos da invenção se fiam em expressãopreferencialmente aumentada de um ácido nucleico codificando umpolipeptídeo HAL3 no tecido de parte aérea de uma planta, preferivelmentena zona de expansão celular de partes aéreas vegetativas.
A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão preferencial das seqüências de ácidosnucleicos úteis nos métodos de acordo com a invenção, em partes aéreas,preferivelmente em tecidos em expansão de uma planta shoots.
Portanto, é fornecido uma construção gênica compreendendo:
(i) um ácido nucleico codificando um polipeptídeo HAL3como definido acima;
(ii) uma ou mais seqüências de controle, das quais pelo menosuma é um promotor específico de parte aérea, operacionalmente ligado aoácido nucleico de (i).
Construções úteis nos métodos de acordo com a presenteinvenção podem ser construídas usando tecnologia de DNA recombinantebem conhecida por pessoas versadas na arte. As construções gênicas podemser inseridas em vetores, que podem estar disponíveis comercialmente,adequados para transformação em plantas e adequados para expressão dogene de interesse nas células transformadas. A invenção portanto fornece usode uma construção gênica como definido acima nos métodos da invenção.
Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeoHAL3). O artesão versado é bem ciente dos elementos genéticos que devemestar presentes no vetor a fim de transformar com sucesso, selecionar epropagar células hospedeiras contendo a seqüência de interesse. A seqüênciade interesse é operacionalmente ligado a uma ou mais seqüências de controle(pelo menos a um promotor).
Promotores adequados, que são funcionais em plantas,geralmente são conhecidos. Eles podem adotar a forma de promotoresconstitutivos ou induzíveis. Promotores adequados podem possibilitar aexpressão desenvolvimento e/ou tecido específica em eucariotosmulticelulares; assim, promotores folha, raiz, flor, semente, estômato,tubérculo ou fruto específicos podem ser vantajosamente usados em plantas.
Diferentes promotores vegetais utilizáveis em plantas sãopromotores tal como, por exemplo, o USP, o LegB4, o promotor DC3 ou opromotor de ubiquitina de salsa.
Para expressão em plantas, a molécula de ácido nucleico deve,como descrito acima, ser operacionalmente ligada a ou compreender umpromotor adequado que expressa o gene no momento certo e de uma maneiracélula ou tecido específica. Promotores utilizáveis são promotoresconstitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), tal como aquelesque se originam de vírus vegetais, tal como 35S CAMV (Franck et al., Cell 21(1980) 285-294), 19S CaMV (veja também Patente Norte-Americana5352605 e Patente Internacional 84/02913), 34S FMV (Sanger et al., Plant.Mol. Biol., 14, 1990: 433-443), o promotor de ubiquitina de salsa, oupromotores vegetais tal como o promotor de subunidade pequena de Rubiscodescrito em Patente Norte-Americana 4.962.028 ou os promotores vegetaisPRP1 [Ward et al., Plant. Mol. Biol. 22 (1993)], SSU, PGEL1, OCS [Leisner(1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai(1990) Plant Mol Biol 15 (3):373-381], STLS1, ScBV (Schenk (1999) PlantMol Biol 39(6):1221-1230), B33, SADl ou SAD2 (promotores de linho, Jainet al., Crop Science, 39 (6), 1999: 1696-1701) ou nos [Shaw et al. (1984)Nucleic Acids Res. 12(20):7831-7846]. Exemplos adicionais de promotoresconstitutivos vegetais são os promotores de V-ATPase de beterraba açucareira(Patente Internacional 01/14572). Exemplos de promotores constitutivossintéticos são o Super promotor (Patente Internacional 95/14098) epromotores derivados de G-boxes (Patente Internacional 94/12015). Seapropriado, promotores quimicamente induzíveis além disso também podemser usados, compare Patente Européia A 388186, Patente Européia A 335528,Patente Internacional 97/06268. Expressão constitutiva estável das proteínasde acordo com a invenção uma planta pode ser vantajosa. Entretanto,expressão induzível do polipeptídeo da invenção é vantajosa, se umaexpressão tardia antes da colheita é vantajosa, pois manipulação metabólicapode levar a retardo de crescimento vegetal.
A expressão de genes vegetais também pode ser facilitadaatravés de um promotor quimicamente induzível (para uma revisão, veja Gatz1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108). Promotoresquimicamente induzíveis são particularmente adequados quando se é desejadoexpressar o gene de uma maneira tempo específica. Exemplos de taispromotores são um promotor induzível por ácido salicílico (PatenteInternacional 95/19443), e promotor induzível por ácido abscísico (PatenteEuropéia 335 528), um promotor induzível por tetraciclina (Gatz et al. (1992)Plant J. 2, 397-404), um promotor induzível por ciclohexanol ou etanol(Patente Internacional 93/21334) ou outros como descrito neste lugar.
Outros promotores adequados são aqueles que reagem acondições de estresse biótico ou abiótico, por exemplo o promotor de genePRPl induzido por patógeno (Ward et al., Plant. Mol. Biol. 22 (1993) 361-366), o promotor hsp80 induzível por calor de tomate (Patente Norte-Americana 5.187.267), o promotor de alfa-amilase induzível por frio de batata(Patente Internacional 96/12814) ou o promotor pinll induzível por ferimento(Patente Européia A-O 375 091) ou outros como descrito neste lugar.
Promotores preferidos são em particular aqueles que induzemexpressão de gene em tecidos e órgãos, em células de semente, tal comocélulas de endosperma e células do embrião em desenvolvimento. Promotoresadequados são o promotor de gene de napina de colza (Patente Norte-Americana 5,608,152), o promotor USP de Vicia faba (Baeumlein et al., MolGen Genet, 1991, 225 (3): 459-67), o promotor de oleosina de Arabidopsis(Patente Internacional 98/45461), o promotor de faseolina de Phaseolusvulgaris (Patente Norte-Americana 5,504,200), o promotor Bce4 de (PatBrassica ente Internacional 91/13980), o promotor arc5 de feijão, o promotorDcG3 de cenoura, ou o promotor de Legumina B4 (LeB4; Baeumlein et al.,1992, Plant Journal, 2 (2): 233-9), e promotores que causam a expressãosemente específica em plantas monocotiledôneas tal como milho, cevada,trigo, centeio, arroz e as semelhantes. Promotores semente específicosvantajosos são o promotor de proteína de ligação de sucrose (PatenteInternacional 00/26388), o promotor de faseolina e o promotor de napina.Promotores adequados que devem ser considerados são o promotor de genelpt2 ou Iptl de cevada (Patente Internacional 95/15389 e Patente Internacional95/23230), e os promotores descritos em Patente Internacional 99/16890(promotores do gene de hordeína de cevada, do gene de glutelina de arroz, dogene de orizina de arroz, do gene de prolamina de arroz, do gene de gliadinade trigo, do gene de glutelina de trigo, do gene de zeína de milho, do gene deglutelina de aveia, do gene de casirina de sorgo e do gene de secalina decenteio). Promotores adequados adicionais são Amy32b, Amy 6-6 eAleuraína [Patente Norte-Americana 5.677.474], Bce4 (colza) [Patente Norte-Americana 5.530.149], glicinina (soja) [Patente Européia 571 741],fosfoenolpiruvato carboxilase (soja) [Patente Japonesa 06/62870], ADRl2-2(soja) [Patente Internacional 98/08962], isocitrato liase (colza) [Patente US5.689.040] ou α-amylase (cevada) [Patente Européia 781 849]. Outrospromotores que estão disponíveis para a expressão de genes em plantas sãopromotores folha específicos tal como aqueles descritos em DE-A 19644478ou promotores regulados por luz tal como, por exemplo, o promotor petE deervilha.
Promotores vegetais adequados adicionais são o promotor deFBPase citosólica ou o promotor ST-LSI de batata (Stockhaus et al., EMBO J.8, 1989, 2445), o promotor de fosforibosilpirofosfato amidotransferase deGlycine max (No. de Acesso de GenBank U87999) ou o promotor nóespecífico descrito em Patente Européia A-O 249 676.
Em uma forma de realização preferida, a seqüência de ácidosnucleicos codificando um polipeptídeo HAL3 é operacionalmente ligada a umpromotor parte aérea específico. Um promotor específico de parte aérea serefere a qualquer promoter capaz de dirigir expressão do gene de interesse emtecidos vegetativos de parte aérea de planta. Preferivelmente, o promotorparte aérea específico é capaz de dirigir preferencialmente expressão do genede interesse em tecidos em expansão de partes aéreas vegetativas, isto é nazona de expansão celular de partes aéreas vegetativas. Referência neste lugara dirigir "preferencialmente" expressão na parte aérea é adotada parasignificar dirigir expressão de qualquer seqüência operacionalmente ligada aeste na zona de expansão celular de partes aéreas vegetativassubstancialmente para a exclusão de expressão dirigida em qualquer outrolugar na planta, além de qualquer expressão residual devido a expressãoevasiva de promotor. O promotor parte aérea específico pode ser ou umpromotor natural ou um sintético.
Preferivelmente, o promotor parte aérea específico é umpromotor isolado de um gene de beta-expansina, tal como um promotorEXBP9 de beta expansina de arroz (Patente Internacional 2004/070039),como representado por SEQ ID NO: 5 ou um promotor de força similar e/ouum promotor com um padrão de expressão similar como o promotor de betaexpansina de arroz (i.e. um promotor funcionalmente equivalente).
Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico codificando um polipeptídeo HAL3 representadopor SEQ ID NO: 1, nem é a aplicabilidade da invenção restrita a expressão deum ácido nucleico codificando um polipeptídeo HAL3 quando dirigida porum promotor de beta expansina.
Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta. Elementos reguladores adicionais podem incluiracentuadores transcricionais assim como traducionais. Aqueles versados naarte estarão cientes de seqüências terminadoras e acentuadoras que podem seradequadas para uso para realizar a invenção. Tais seqüências devem serconhecidas ou podem ser prontamente obtidas por uma pessoa versada naarte.
As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl.Outras seqüências de controle (além de promotor, acentuador,silenciador, seqüências de íntrons, regiões 3'UTR e/ou 5'UTR) podem serproteína e/ou agentes estabilizantes de RNA.
Para a detecção e/ou seleção da transferência bem sucedida dasseqüências de ácidos nucleicos como descrito no protocolo de seqüência eusadas no processo da invenção, é vantajoso usar genes marcadores (= genesrepórteres). Estes genes marcadores possibilitam a identificação de umatransferência bem sucedida das moléculas de ácido nucleico através de umasérie de princípios diferentes, por exemplo, através de identificação visualcom o auxílio de fluorescência, luminescência ou na variação de comprimentode onda de luz que é discernível pelo olho humano, por uma resistência aherbicidas ou antibióticos, através do que são conhecidos como marcadoresnutritivos (marcadores de auxotrofismo) ou marcadores antinutritivos, atravésde ensaios enzimáticos ou através de fitormônios. Exemplos de taismarcadores que podem ser mencionados são GFP (= proteína fluorescenteverde); o sistema luciferina/luciferase, a β-galactosidase com seus substratoscoloridos, por exemplo, X-Gal, as resistências a herbicida para, por exemplo,imidazolinona, glifosato, fosfinotricina ou sulfoniluréia, e resistências aantibiótico para, por exemplo, bleomicina, higromicina, estreptomicina,canamicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina(G418), espectinomicina ou blasticidina, para mencionar apenas alguns,marcadores nutritivos tal como a utilização de manose ou xilose, oumarcadores antinutritivos tal como a resistência a 2-desoxiglicose. Esta lista éum número pequeno possível de marcadores. O trabalhador versado é muitofamiliar com tais marcadores. Diferentes marcadores são preferidos,dependendo do organismo e do método de seleção.
A presente invenção também abrange plantas viáveis pelosmétodos de acordo com a presente invenção. A presente invenção portantofornece plantas, partes vegetais ou células de planta destas viáveis pelométodo de acordo com a presente invenção, cujas plantas ou partes ou célulasdestas compreendem um transgene de ácido nucleico codificando umpolipeptídeo HAL3 sob o controle de um promotor específico de parte aérea.
A invenção também fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, compreendendo introdução e expressão preferencial de um ácidonucleico codificando um polipeptídeo HAL3 na parte aérea de uma planta.
Plantas hospedeiras para os ácidos nucleicos ou o vetor usadono método de acordo com a invenção, a gaveta de expressão ou construção ouvetor são, em princípio, vantajosamente todas as plantas, que são capazes desintetizar os polipeptídeos usados no método inventivo.
Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada cujométodo compreende:
(i) introduzir e preferencialmente expressar um ácido nucleicocodificando um polipeptídeo HAL3 na parte aérea de uma planta; e
(ii) cultivar a célula vegetal em condições que promovemcrescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.
A transferência de genes exógenos para o genoma de umaplanta é chamada transformação. Ao fazer isto os métodos descritos para atransformação e regeração de plantas a partir de tecidos vegetais ou células deplanta são utilizados para transformação transiente ou estável. Para selecionarplantas transformadas, o material vegetal obtido na transformação é, comouma regra, sujeito a condições seletivas de forma que plantas transformadaspodem ser distinguidas de plantas não transformadas. Por exemplo, assementes obtidas da maneira descrita acima podem ser plantadas e, depois deum período inicial de crescimento, sujeitas a uma seleção adequada porpulverização. Uma possibilidade adicional consiste em cultivar as sementes,se apropriado depois de esterilização, em placas de ágar usando um agente deseleção adequado de forma que apenas as sementes transformadas podemcrescer até plantas. Métodos de transformação vantajosos adicionais, emparticular para plantas, são conhecidos pelo trabalhador versado e sãodescritos neste lugar abaixo.
Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, eguindo o que o material transformado éregenerado em uma planta inteira.
Como mencionado Agrobactérias transformadas com um vetorde expressão de acordo com a invenção também podem ser usadas da maneiraconhecida por si para a transformação de plantas tal como plantasexperimentais como Arabidopsis ou plantas de cultura, tal como, porexemplo, cereais, milho, aveia, centeio, cevada, trigo, soja, arroz, algodão,beterraba-açucareira, canola, girassol, linho, cânhamo, batata, tabaco, tomate,cenoura, pimentão, colza, tapioca, mandioca, araruta, cravo, alfafa, alface e asvárias espécies de árvores, nozes, e videiras, em particular plantas de culturacontendo óleo tal como soja, amendoim, mamona, girassol, milho, algodão,linho, colza, coco, dendê, açafrão (<Carthamus tinctorius) ou cacau, porexemplo, banhando folhas escarificadas ou segmentos foliares em umasolução agrobacteriana e subseqüentemente cultivando-as em meio adequado.
Em adição à transformação de células somáticas, as quaisentão têm que ser regeneradas em plantas intactas, também é possíveltransformar as células de meristemas vegetais e em particular aquelas célulasque se desenvolvem em gametas. Neste caso, os gametas transformadosseguem o desenvolvimento vegetal natural, gerando plantas transgênicas.Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactériase sementes são obtidas a partir das plantas em desenvolvimento das quais umacerta proporção é transformada e assim transgênica [Feldman, KA and MarksMD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz,N-H Chua and J Shell, eds, Methods in Arabidopsis Research. WordScientific, Singapore, pp. 274-289]. Métodos alternativos são baseados naremoção repetida das inflorescências e incubação do sítio de excisão nocentro da roseta com agrobactérias transformadas, através do que sementestransformadas podem da mesma maneira ser obtidas em um momentoposterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet,245: 363-370). Entretanto, um método especialmente efetivo é o método deinfiltração a vácuo com suas modificações tal como o método de "botãofloral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sobpressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold,N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso dométodo de "botão floral" o tecido floral em desenvolvimento é incubadobrevemente com uma suspensão agrobacteriana tratada com surfactante[Clough, SJ und Bent, AF (1998). The Plant J. 16, 735-743]. Uma certaproporção de sementes transgênicas são coletadas em ambos os casos, e estassementes podem ser distinguidas de sementes não transgênicas cultivando nascondições seletivas descritas acima. Em adição a transformação estável deplastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmentereduzindo ou eliminando o risco de fluxo de transgene através de pólen namaioria das culturas. A tranformação do genoma de cloroplasto geralmente éatingida por um processo, que foi esquematicamente apresentado em Klaus etal., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente asseqüências a serem transformadas são clonadas junto com um gene marcadorselecionável entre seqüências flanqueadoras homólogas ao genoma decloroplasto. Estas seqüências flanqueadoras homólogas dirigem integraçãosítio específica no plastoma. Transformação plastidial foi descrita para muitasespécies de plantas diferentes e uma visão geral pode ser tirada de Bock(2001) Transgenic plastids in basic research and plant biotechnology. J MolBiol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towardscommercialization of plastid transformation technology. Trends Biotechnol.21, 20-28. Progresso biotecnológico adicional foi recentemente relatado emforma de transformantes de plastídeos livres de marcador, que podem serproduzidos por um gene marcador cointegrado transiente (Klaus et al., 2004,Nature Biotechnology 22(2), 225-229).
As células de planta geneticamente modificadas podem serregeneradas através de todos os métodos com os quais o trabalhador versado éfamiliar. Métodos adequados podem ser encontrados nas publicaçõesmencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hõfgen andWillmitzer.
Seguindo transferência de DNA e regeneração, plantasputativamente transformadas podem ser avaliadas, por exemplo usandoanálise Southern, para a presença do gene de interesse, número de cópias e/ouorganização genômica. Alternativamente ou adicionalmente, níveis deexpressão do DNA recentemente introduzido podem ser monitorados usandoanálise Northern e/ou Western, ou PCR quantitativo, todas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo1 com a invenção.
A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um polipeptídeo HAL3. Célulashospedeiras preferidas de acordo com a invenção são células de planta.
A invenção também se estende a partes aptas para corte de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.
A presente invenção também abrange uso de ácidos nucleicoscodificando polipeptídeos HAL3 e uso de polipeptídeos HAL3 para aumentarprodução vegetal como definido acima nos métodos da invenção.
Ácidos nucleicos codificando polipeptídeos HAL3, oupolipeptídeos HAL3, podem encontrar uso em programas de melhoramentonos quais é identificado um marcador de DNA que pode ser geneticamenteligado a um gene HAL3. Os ácidos nucleicos/genes, ou os polipeptídeosHAL3 podem ser usados para definir um marcador molecular. Este marcadorde DNA ou proteína pode então ser usado em programas de melhoramentopara selecionar plantas tendo produção aumentada como definido acima nosmétodos da invenção.
Variantes alélicas de um ácido nucleico/gene HAL3 tambémpodem encontrar uso em programas de melhoramento auxiliados pormarcador. Tais programas de melhoramento algumas vezes requeremintrodução de variação alélica por tratamento mutagênico das plantas, usandopor exemplo mutagênese EMS; alternativamente, o programa pode começarcom uma coleção de variantes alélicas de assim chamada origem "natural"causadas não intencionalmente. Identificação de variantes alélicas entãoocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção devariantes alélicas superiores da seqüência em questão e que geram produçãoaumentada. Seleção tipicamente é realizada monitorando desempenho decrescimento de plantas contendo diferentes variantes alélicas da seqüência emquestão. Desempenho de crescimento pode ser monitorado em uma casa devegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantasnas quais a variante alélica superior foi identificada com outra planta. Istopode ser usado, por exemplo, para fazer uma combinação de característicasfenotípicas interessantes.
Um ácido nucleico codificando um polipeptídeo HAL3também pode ser usado como sondas para mapear geneticamente efisicamente os genes dos quais elas são uma parte de, e como marcadores paracaracterísticas ligadas a tais genes. Tal informação pode ser útil emmelhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos HÃL3 requer apenas uma seqüência deácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidosnucleicos HAL3 podem ser usados como marcadores de polimorfismo decomprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J5Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)de DNA genômico vegetal digerido por restrição podem ser sondados com osácidos nucleicos HAL3. O padrão de bandeamento resultante pode então sersujeito a análises genéticas usando programas computacionais tal comoMapMaker (Lander et ai. (1987) Genomics 1: 174-181) a fim de construir ummapa genético. Em adição, os ácidos nucleicos podem ser usados para sondarSouthern blots contendo DNAs genômicos tratados com endonuclease derestrição de um conjunto de indivíduos representando ancestral e progênie deum cruzamento genético definido. Segregação dos polimorfismos de DNA éobservada e usada para calcular a posição do ácido nucleico HAL3 no mapagenético previamente obtido usando esta população (Botstein et al. (1980)Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley (1986)Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas, e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas paramapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessárioidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.
Os métodos de acordo com a presente invenção resultam emplantas tendo produção aumentada, como descrito acima. Esta produçãoaumentada também pode ser combinada com outras característicaseconomicamente vantajosas, tal como características acentuadoras deprodução adicionais, tolerância a outros estresses abióticos e bióticos,características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.
Descrição detalhada para MADS15 acima
Surpreendentemente, foi descoberto agora que modularexpressão em uma planta de um ácido nucleico codificando um polipeptídeoMADS15 gera plantas tendo características de produção melhoradas emrelação a plantas de controle. A classe particular de polipeptídeos MADS15adequados para melhorar características de produção em plantas é descrita emdetalhe abaixo.
A presente invenção fornece um método para melhorarcaracterísticas de produção em plantas em relação a plantas de controle,compreendendo modular expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15.
Qualquer referência daqui por diante a uma "proteína útil nosmétodos da invenção" é adotada para significar um polipeptídeo MADS15como definido neste lugar. Qualquer referência daqui por diante a um "ácidonucleico útil nos métodos da invenção" é adotada para significar a ácidonucleico capaz de codificar um tal polipeptídeo MADS15.
Um método preferido para modular (preferivelmente,aumentar) expressão de um ácido nucleico codificando uma proteína útil nosmétodos da invenção é introduzir e expressar em uma planta um ácidonucleico codificando uma proteína útil nos métodos da invenção comodefinido abaixo.
O ácido nucleico a ser introduzido em uma planta (e, portantoútil para realizar os métodos da invenção) é qualquer ácido nucleicocodificando o tipo de proteína que será agora descrito, daqui por diantetambém chamado "ácido nucleico MADS15" ou "gene MADS15".
O termo "polipeptídeo MADS15" como definido neste lugarse refere a uma proteína que cai no grupo de proteínas MADS box tipo FULcomo delineado por Adam et al.(J. Mol. Evol. 62, 15-31). Proteínas MADSbox tipo FUL são parte da subfamília SQUAMOSA e têm a arquiteturaMIKCc típica: um domínio MADS (M) no término N, seguido por umdomínio interveniente (I) envolvido em dimerização, um domínio dequeratina altamente conservado (K) e um domínio variável (C) no término C,que é responsável por ligação de proteínas em interação ou ativaçãotranscricional (De Bodt et al. Trends in Plant Science 8, 475-483).
Polipeptídeos MADS15 vegetais também podem seridentificados pela presença de certos motivos conservados. A presença destesmotivos conservados pode ser identificada usando métodos para oalinhamento de seqüências para comparação como descrito acima. Emalgumas instâncias, os parâmetros padrão podem ser ajustados para modificara estringência da busca. Por exemplo, usando BLAST, o limiar designificância estatística (chamado valor "esperado") para relatar pareamentoscontra seqüências de banco de dados pode ser aumentado para mostrarpareamentos menos estringentes. Desta maneira, pareamentos curtospraticamente exatos podem ser identificados. Mediante identificação de umpolipeptídeo MADS15 pela presença destes motivos, uma pessoa versada naarte pode facilmente derivar o ácido nucleico correspondente codificando opolipeptídeo compreendendo os motivos relevantes, e usar um comprimentosuficiente de nucleotídeos contíguos dos mesmos para realizar qualquer umou mais dos métodos de silenciamento gênico descritos acima (para a reduçãoou eliminação substancial de expressão de um gene MADS15 endógeno).
Tipicamente, a presença de pelo menos um dos motivos 1 a 4deve ser suficiente para identificar qualquer seqüência de consulta como umMADS15, entretanto, a presença de pelo menos motivos 1 e 2 é preferida. Aseqüência consenso fornecida é baseada nas seqüências de monocotiledôneasdadas na listagem de seqüências. Uma pessoa versada na arte estará bemciente de que a seqüência consenso pode variar de alguma maneira seseqüências adicionais ou diferentes (por exemplo, de plantas dicotiledôneas)forem usadas para comparação.
Motivo 1, localizado no domínio MADS (SEQ ID NO: 48):L(L/V)KKA(H/1S0EIS(VI)L(C/Y)DAE(V/I/L)(A/G)(L/A/V)(I/V)(W)FS(T/P/A/N)KGKLYE(Y/F)(A/S)(T/S)(D/N/E)S(K/C/R/S)M(D/E)(N/I/R/K)IL(E/D)R.
Preferivelmente, este motivo conservado de seqüência 1 tem aseqüência:
LLKKAHEISVLCDAEVA(L/A/V)I(W)FS(T/P)KGKLYEYATDS(C/R)M(D/E)(R/K)ILER,
mais preferivelmente o motivo conservado de seqüência 1 tema seqüência:
LLKKAHEISVLCDAEVAAIVFSPKGKLYEYATDSRMDKILER
Motivo 2, localizado no domínio K (SEQ ID NO: 49):KLK(AyS)(K/R)(V/I)E(A/T/S)(L/I)(Q/N)(K/R/N)(S/C/R)(Q/H)(R/K)HLMGE
Preferivelmente, este motivo conservado de seqüência 2 tem aseqüência:
KLKAK(V/I)E(A/T)(L/I)QK(S/C)(Q/H)(R/K)HLMGEMais preferivelmente, este motivo conservado de seqüência 2tem a seqüência:
KLKAKIETIQKCHKHLMGE
Opcionalmente, o polipeptídeo MADS15 ou seu homólogopode compreender no domínio C motivo 3 e/ou motivo 4:motivo 3 (SEQ ID NO: 50):Q(P/Q/V/A)QTS(S/F)(S/F)(S/F)(S/F)(S/C/F)(F/M)motivo 4 (SEQ ID NO: 51):(G/A/V/L)(L/P)XWMX(S/H)
caracterizado pelo fato de que o primeiro resíduo X em motivo4 pode ser qualquer aminoácido, mas preferivelmente L, P ou H; ecaracterizado pelo fato de que o segundo resíduo X pode ser qualqueraminoácido, mas preferivelmente V ou L.
Alternativamente, o domínio C (começando atrás do domíniode queratina, i.e. em Rl75 em SEQ ID NO: 44) pode ser caracterizado pelaocorrência aumentada de glutamina (normalmente 3,93%, aqui pelo menos8,77% com um máximo de 26,73%), em adição, o conteúdo em alanina,prolina, e/ou serina também pode ser aumentado (acima 7,8%, 4,85% e 6,89%respectivamente).
Alternativamente formulada, uma proteína preferida MADS15útil nos métodos da presente invenção compreende pelo menos um domínioMADS N-terminal correspondendo ao domínio SMART SM00432 (PfamPF00319) seguido por um domínio de Queratina correspondendo à região K-box definida em Pfam como PFO1486, mais preferivelmente, a proteínaMADS15 tem em seu domínio MADS a assinatura conservada de SEQ IDNO: 48 e em seu domínio K a assinatura conservada de SEQ ID NO: 49, maispreferivelmente, a proteína MADS15 tem a seqüência dada em SEQ ID NO: 44.
Exemplos de proteínas úteis nos métodos da invenção e ácidosnucleicos codificando as mesmas são dados abaixo em tabela D de Exemplo 8.
Também úteis nos métodos da invenção são homólogos dequalquer uma das seqüências de aminoácidos dadas em tabela D.
Também úteis nos métodos da invenção são derivados dequalquer um dos polipeptídeos dados em tabela D ou ortólogos ou parálogosde qualquer das SEQ ID NOs mencionadas acima. Um derivado preferido éum derivado de SEQ ID NO: 44. Derivados dos polipeptídeos dados emtabela D são exemplos adicionais que podem ser adequados para uso nosmétodos da invenção. Derivados úteis nos métodos da presente invençãopreferivelmente têm atividade biológica e funcional similar à proteína nãomodificada da qual eles são derivados.
A invenção é ilustrada transformando plantas com a seqüênciade ácidos nucleicos de Oryza sativa representada por SEQ ID NO: 43,codificando a seqüência de polipeptídeos de SEQ ID NO: 44, entretantodesempenho da invenção não é restrito a estas seqüências. Os métodos dainvenção podem ser vantajosamente realizados usando qualquer ácidonucleico codificando uma proteína útil nos métodos da invenção comodefinido neste lugar, incluindo ortólogos e parálogos, tal como qualquer dasseqüências de ácidos nucleicos dadas em tabela D. As seqüências deaminoácidos dadas em tabela D podem ser consideradas como sendoortólogas e parálogas do polipeptídeo MADS15 representado por SEQ IDNO: 44.
Ortólogos e parálogos podem ser facilmente encontradosrealizando uma assim chamada busca blast recíproca. Tipicamente, istoenvolve um primeiro BLAST envolvendo realizar BLAST com umaseqüência de consulta (por exemplo, usando qualquer das seqüências listadasem tabela D) contra qualquer banco de dados de seqüências, tal como o bancode dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usandovalores pré-determinados padrão) geralmente são usados ao iniciar de umaseqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência de proteínas. Os resultadosde BLAST podem ser opcionalmente filtrados. As seqüências decomprimento completo ou dos resultados filtrados ou dos resultados nãofiltrados são então BLASTed de volta (segundo BLAST) contra seqüências doorganismo do qual a seqüência de consulta é derivada (onde a seqüência deconsulta é SEQ ID NO: 43 ou SEQ ID NO: 44, o segundo BLAST deve,portanto ser contra seqüências de Oryza sativa). Os resultados do primeiro esegundo BLAST são então comparados. Um parálogo é identificado se umacerto de alto pontuação do primeiro BLAST é da mesma espécie da qual aseqüência de consulta é derivada, um BLAST de retorno então idealmenteresulta na seqüência de consulta como maior acerto; um ortólogo éidentificado se um acerto de alto pontuação no primeiro BLAST não é damesma espécie que da qual a seqüência de consulta é derivada, epreferivelmente resulta mediante BLAST de retorno na seqüência de consultaestando entre os maiores acertos.
Acertos de alto pontuação são aqueles tendo um baixo valor E.Quanto menor o valor E, mais significante é o pontuação (ou em outraspalavras menor a chance de que o acerto tenha sido encontrado ao acaso).Computação do valor E é bem conhecida na arte. Em adição a valores E,comparações também são pontuadas por identidade percentual. Identidadepercentual se refere ao número de nucleotídeos (ou aminoácidos) idênticosentre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadasao longo de um comprimento particular. No caso de famílias grandes,ClustalW pode ser usado, seguido por uma árvore de agrupamento devizinhos, para ajudar a visualizar agrupamento de genes relacionados e paraidentificar ortólogos e parálogos.
Tabela D dá exemplos de ortólogos e parálogos da proteínaMADS15 representada por SEQ ID NO 44. Ortólogos e parálogos adicionaispodem ser prontamente identificados usando o procedimento de BLASTdescrito acima.
As proteínas da invenção são identificáveis pela presença do(s)domínio(s) conservado(s) MADS e/ou queratina (mostrado em Figura 5).Existem bancos de dados especialistas para a identificação de domínios, porexemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244, InterPro (Mulderet al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher and Bairoch(1994), A generalized profile syntax for biomolecular sequences motifs andits function in automatic sequence interpretation. (In) ISMB-94; Proceedings2nd International Conference on Intelligent Systems for Molecular Biology.Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61,AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137,(2004), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280(2002). Um conjunto de ferramentas para análise in silico de seqüênciasprotéicas está disponível no servidor de proteômica ExPASY (hospedado peloSwiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomicsserver for in-depth protein knowledge and analysis, Nucleic Acids Res.31:3784-3788(2003)).
Domínios também podem ser identificados usando técnicas derotina, tal como por alinhamento de seqüências. Métodos para o alinhamentode seqüências para comparação são bem conhecidos na arte, tais métodosincluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar oalinhamento global (i.e. abrangendo as seqüências completas) de duasseqüências que maximiza o número de pareamentos e minimiza o número delacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10)calcula identidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Biotechnology Information (NCBI). Homólogos podem serprontamente identificados usando, por exemplo, o algoritmo de alinhamentode múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão dealinhamento pareado, e um método de pontuação em porcentagem.Porcentagens globais de similaridade e identidade também podem serdeterminadas usando um dos métodos disponíveis no pacote de aplicativocomputacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul10;4:29. MatGAT: an application that generates similarity/identity matricesusing protein or DNA sequences). Edição manual secundária pode serrealizada para otimizar alinhamento entre motivos conservados, como seriaevidente para uma pessoa versada na arte. Além disso, ao invés de usarseqüências de comprimento completo para a identificação de homólogos,domínios específicos (tal como o domínio MADS ou de queratina, ou um dosmotivos definidos acima) também podem ser usados. Os valores de identidadede seqüência, que são indicados abaixo em Exemplo 10 como umaporcentagem foram determinados ao longo da seqüência inteira de ácidosnucleicos ou de aminoácidos, e/ou ao longo de domínios selecionados oumotivo(s) conservado(s), usando os programas mencionados acima usando osparâmetros padrão.
Além disso, uma proteína MADS15 também pode seridentificável por sua capacidade ou incapacidade de se ligar a DNA ou deinteragir com outras proteínas. Atividade de ligação de DNA e interaçõesproteína-proteína podem ser prontamente determinadas in vitro ou in vivousando técnicas bem conhecidas na arte. Exemplos de ensaios in vitro paraatividade de ligação de DNA incluem: análise de retardo em gel usandodomínios de ligação de DNA MADS-box conhecidos (West et al. (1998) NuclAcid Res 26(23): 5277-87), ou ensaios de um híbrido de levedura. Umexemplo de um ensaio in vitro para interações proteína-proteína é a análise dedois híbridos de levedura (Fields and Song (1989) Nature 340:245-6).Proteínas conhecidas por interagir com OsMADS 15 incluem outras proteínasMADS (tal como aquelas envolvidas no complexo de sinalização deflorescimento), quinases tipo receptor tal uma Clavatal e Clavata2, Erecta,BRIl ou RSK. Detalhes adicionais são fornecidos em Exemplo 13.
Ácidos nucleicos codificando proteínas úteis nos métodos dainvenção não precisam ser ácidos nucleicos de comprimento completo, umavez que desempenho dos métodos da invenção não se fia no uso deseqüências de ácidos nucleicos de comprimento completo. Exemplos deácidos nucleicos adequados para uso para realizar os métodos da invençãoincluem as seqüências de ácidos nucleicos dadas em tabela D, mas não sãolimitados àquelas seqüências. Variantes de ácidos nucleicos também podemser úteis para praticar os métodos da invenção. Exemplos de tais variantes deácidos nucleicos incluem porções de ácidos nucleicos codificando umaproteína útil nos métodos da invenção, ácidos nucleicos hibridizando comácidos nucleicos codificando uma proteína útil nos métodos da invenção,variantes de união de ácidos nucleicos codificando uma proteína útil nosmétodos da invenção, variantes alélicas de ácidos nucleicos codificando umaproteína útil nos métodos da invenção e variantes de ácidos nucleicoscodificando uma proteína útil nos métodos da invenção que são obtidas porembaralhamento gênico. Os termos porção, seqüência de hibridização,variante de processamento, variante alélica e embaralhamento gênico serãoagora descritos.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma porção de qualquer uma dasseqüências de ácidos nucleicos dadas em tabela D, ou uma porção de umácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquerdas seqüências de aminoácidos dadas em tabela D.
Porções úteis nos métodos da invenção, codificam umpolipeptídeo caindo dentro da definição de um ácido nucleico codificandouma proteína útil nos métodos da invenção como definido neste lugar e tendosubstancialmente a mesma atividade biológica que as seqüências deaminoácidos dadas em tabela D. Preferivelmente, a porção é uma porção dequalquer um dos ácidos nucleicos dados em tabela D. A porção é tipicamentede pelo menos 400 nucleotídeos consecutivos de comprimento,preferivelmente pelo menos 600 nucleotídeos consecutivos de comprimento,mais preferivelmente pelo menos 700 nucleotídeos consecutivos decomprimento e mais preferivelmente pelo menos 800 nucleotídeosconsecutivos de comprimento, os nucleotídeos consecutivos sendo dequalquer uma das seqüências de ácidos nucleicos dadas em tabela D. Maispreferivelmente a porção é uma porção do ácido nucleico de SEQ ID NO: 43.
Preferivelmente, a porção codifica uma seqüência de aminoácidoscompreendendo (qualquer um ou mais de) do domínio MADS e de queratinacomo definido neste lugar.
Uma porção de um ácido nucleico codificando uma proteínaMADS15 como definido neste lugar pode ser preparada, por exemplo,fazendo uma ou mais deleções ao ácido nucleico. As porções podem serusadas em forma isolada ou elas podem ser fusionadas a outras seqüências decodificação (ou não codificantes) a fim de, por exemplo, produzir umaproteína que combina diversas atividades. Quando fusionado a outrasseqüências de codificação, o polipeptídeo resultante produzido mediantetradução pode ser maior do que aquele previsto para a porção de proteínaMADS15.
Outra variante de ácido nucleico útil nos métodos da invençãoé um ácido nucleico capaz de hibridizar, em condições de estringênciareduzida, preferivelmente em condições estringentes, com um ácido nucleicocodificando uma proteína MADS15 como definido neste lugar, ou com umaporção como definido neste lugar.
Seqüências de hibridização úteis nos métodos da invenção,codificam um polipeptídeo tendo um domínio MADS e/ou de queratina (vejao alinhamento de Figura 6) e tendo substancialmente a mesma atividadebiológica que a proteína MADS15 representada por qualquer das seqüênciasde aminoácidos dadas em tabela D. A seqüência de hibridização é tipicamentede pelo menos 400 nucleotídeos consecutivos de comprimento,preferivelmente pelo menos 600 nucleotídeos consecutivos de comprimento,mais preferivelmente pelo menos 700 nucleotídeos consecutivos decomprimento e mais preferivelmente pelo menos 800 nucleotídeosconsecutivos de comprimento, os nucleotídeos consecutivos sendo dequalquer uma das seqüências de ácidos nucleicos dadas em tabela D.Preferivelmente, a seqüência de hibridização é uma que é capaz de hibridizarcom qualquer dos ácidos nucleicos dados em tabela D, ou com uma porção dequalquer destas seqüências, uma porção sendo como definido acima. Maispreferivelmente, a seqüência de hibridização é capaz de hibridizar com umácido nucleico como representado por SEQ ID NO: 43 ou com uma porçãodeste. Preferivelmente, a seqüência de hibridização codifica uma seqüência deaminoácidos compreendendo qualquer um ou mais dos motivos ou domínioscomo definidos neste lugar.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta um ácido nucleico capaz de hibridizarcom qualquer um dos ácidos nucleicos dados em tabela D, ou compreendendointroduzir e expressar em uma planta um ácido nucleico capaz de hibridizarcom um ácido nucleico codificando um ortólogo, parálogo ou homólogo dequalquer das seqüências de ácidos nucleicos dadas em tabela D.
Outra variante de ácido nucleico útil nos métodos da invençãoé uma variante de processamento codificando uma proteína MADS15 comodefinido acima.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de processamento dequalquer uma das seqüências de ácidos nucleicos dadas em tabela D, ou umavariante de processamento de um ácido nucleico codificando um ortólogo,parálogo ou homólogo de qualquer das seqüências de aminoácidos dadas emtabela D.
Variantes de união preferidas são variantes de união de umácido nucleico representado por SEQ ID NO: 43 ou uma variante deprocessamento de um ácido nucleico codificando um ortólogo ou parálogo deSEQ ID NO: 44. Preferivelmente, a seqüência de aminoácidos codificada pelavariante de processamento compreende qualquer um ou mais dos motivos oudomínios como definido neste lugar.
Outra variante de ácido nucleico útil para realizar os métodosda invenção é uma variante alélica de um ácido nucleico codificando umaproteína MADS15 como definido acima. As variantes alélicas úteis nosmétodos da presente invenção têm substancialmente a mesma atividadebiológica que a proteína MADS15 de SEQ ID NO: 44.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante alélica de qualquer um dosácidos nucleicos dados em tabela D, ou compreendendo introduzir e expressarem uma planta uma variante alélica de um ácido nucleico codificando umortólogo, parálogo ou homólogo de qualquer das seqüências de aminoácidosdadas em tabela D.
Preferivelmente, a variante alélica é uma variante alélica deSEQ ID NO: 43 ou uma variante alélica de um ácido nucleico codificando umortólogo ou parálogo de SEQ ID NO: 44. Preferivelmente, a seqüência deaminoácidos codificada pela variante alélica compreende qualquer um oumais dos motivos ou domínios como definido neste lugar.
Uma variante de ácido nucleico adicional útil nos métodos dainvenção é uma variante de ácido nucleico obtida por embaralhamentogênico. Embaralhamento gênico ou evolução dirigida também pode ser usadapara gerar variantes de ácidos nucleicos codificando proteínas MADS15como definido acima.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de qualquer uma dasseqüências de ácidos nucleicos dadas em tabela D, ou compreendendointroduzir e expressar em uma planta uma variante de um ácido nucleicocodificando um ortólogo, parálogo ou homólogo de qualquer das seqüênciasde aminoácidos dadas em tabela D, cujo ácido nucleico variante é obtido porembaralhamento gênico.
Preferivelmente, o ácido nucleico variante obtido porembaralhamento gênico codifica uma seqüência de aminoácidoscompreendendo qualquer um ou mais dos motivos ou domínios comodefinido neste lugar.
Além disso, variantes de ácidos nucleicos também podem serobtidas por mutagênese dirigida a sítio. Estão disponíveis diversos métodospara atingir mutagênese dirigida a sítio, o mais comum sendo métodosbaseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos codificando proteínas MADS15 podem serderivados de qualquer fonte natural ou artificial. O ácido nucleico pode sermodificado a partir de sua forma nativa em composição e/ou ambientegenômico através de deliberada manipulação humana. Preferivelmente oácido nucleico codificando MADS15 é de uma planta, ainda preferivelmentede uma planta monocotiledônea, mais preferivelmente da família Poaceae,mais preferivelmente o ácido nucleico é de Oryza sativa.
Qualquer referência neste lugar a uma proteína MADS15 éportanto adotada para significar uma proteína MADS15 como definido acima.Qualquer ácido nucleico codificando uma tal proteína MADS15 é adequadopara uso para realizar os métodos da invenção.
A presente invenção também abrange plantas ou partes destas(incluindo sementes) viáveis pelos métodos de acordo com a presenteinvenção. As plantas ou partes destas compreendem um transgene de ácidonucleico codificando uma proteína MADS15 como definido acima.A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de ácidos nucleicosúteis nos métodos de acordo com a invenção, em uma planta. As construçõesgênicas podem ser inseridas em vetores, que podem estar disponíveiscomercialmente, adequados para transformação em plantas e adequados paraexpressão do gene de interesse nas células transformadas. A invenção tambémfornece uso de uma construção gênica como definido neste lugar nos métodosda invenção.
Mais especificamente, a presente invenção fornece umaconstrução compreendendo
(a) ácido nucleico codificando proteína MADS15 comodefinido acima;
(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente
(c) uma seqüência de término de transcrição.
Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeoMADS15 como definido neste lugar. O artesão versado é bem ciente doselementos genéticos que devem estar presentes no vetor a fim de transformarcom sucesso, selecionar e propagar células hospedeiras contendo a seqüênciade interesse. A seqüência de interesse é operacionalmente ligada a uma oumais seqüências de controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor pode ser usadopara dirigir expressão da seqüência de ácidos nucleicos.
O promotor pode ser um promotor constitutivo;alternativamente, o promotor pode ser um promotor induzível, i.e. tendoinício de transcrição induzido ou aumentado em resposta a um promotorquimicamente induzível ou um induzível por estresse, ou um promotorinduzido por patógeno.Adicionalmente ou alternativamente, o promotor pode ser umpromotor órgão específico ou tecido específico, ou o promotor pode ser umpromotor ubíquo, ou o promotor pode ser regulado por desenvolvimento.Além disso, o promotor pode ser órgão específico ou tecido específico oucélula específico.
Preferivelmente, o ácido nucleico MADS15 ou variante deste éoperacionalmente ligado a um promotor constitutivo. Um promotorconstitutivo preferido é um que também é substancialmente expressoubiquamente. Ainda preferivelmente o promotor é derivado de uma planta,mais preferivelmente uma planta monocotiledônea. Mais preferido é uso deum promotor GOS2 (por exemplo de arroz, SEQ ID NO: 47 ou SEQ ID NO:108). Deve ser claro que a aplicabilidade da presente invenção não é restritaao ácido nucleico MADS15 representado por SEQ ID NO: 43, nem é aaplicabilidade da invenção restrita a expressão de um ácido nucleicoMADS15 quando dirigida por um promotor GOS2. Exemplos de outrospromotores constitutivos ou promotores funcionalmente equivalentes quetambém podem ser usados para dirigir expressão de um ácido nucleicoMADS15 são mostrados na seção de definições.
Opcionalmente, uma ou mais seqüências terminadoras podemser usadas na construção introduzida em uma planta. Elementos reguladoresadicionais podem incluir acentuadores transcricionais assim comotraducionais. Aqueles versados na arte estarão cientes de seqüênciasterminadoras e acentuadoras que podem ser adequadas para uso para realizara invenção. Tais seqüências devem ser conhecidas ou podem ser prontamenteobtidas por uma pessoa versada na arte.
Uma seqüência de íntron também pode ser adicionada à região5' não traduzida (UTR) ou na seqüência de codificação para aumentar aquantidade da mensagem madura que se acumula no citosol.
Outras seqüências de controle (além de promotor, acentuador,silenciador, seqüências de íntrons, regiões 3'UTR e/ou 5'UTR) podem serproteína e/ou agentes estabilizantes de RNA. Tais seqüências devem serconhecidas ou podem ser prontamente obtidas por uma pessoa versada naarte.
As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüênciasde ácidos nucleicos como usado nos métodos da invenção e/ou seleção deplantas transgênicas compreendendo estes ácidos nucleicos, é vantajoso usargenes marcadores (ou genes repórteres). Portanto, a construção genética podeopcionalmente compreender um gene marcador selecionável.
A invenção também fornece um método para a produção deplantas transgênicas tendo características de produção melhoradas em relaçãoa plantas de controle, compreendendo introdução e expressão em uma plantade qualquer ácido nucleico codificando uma proteína MADS15 comodefinido acima.
Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada, cujométodo compreende:
(i) introduzir e expressar em uma planta ou célula vegetal umácido nucleico MADS15 ou variante deste; e
(ii) cultivar a célula vegetal em condições que promovemcrescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.
As células de planta geneticamente modificadas podem serregeneradas através de todos os métodos com os quais o trabalhador versado éfamiliar. Métodos adequados podem ser encontrados nas publicaçõesmencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hõfgen andWillmitzer.
Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira. Para selecionar plantas transformadas, omaterial vegetal obtido na transformação é, como uma regra, sujeito acondições seletivas de forma que plantas transformadas podem serdistinguidas de plantas não transformadas. Por exemplo, as sementes obtidasda maneira descrita acima podem ser plantadas e, depois de um períodoinicial de crescimento, sujeitas a uma seleção adequada por pulverização.
Uma possibilidade adicional consiste em cultivar as sementes, se apropriadodepois de esterilização, em placas de ágar usando um agente de seleçãoadequado de forma que apenas as sementes transformadas podem crescer atéplantas. Alternativamente, as plantas transformadas são tríadas para apresença de um marcador selecionável tal como aqueles descritos acima.
Seguindo transferência de DNA e regeneração, plantasputativamente transformadas também podem ser avaliadas, por exemplousando análise Southern, para a presença do gene de interesse, número decópias e/ou organização genômica. Alternativamente ou adicionalmente,níveis de expressão do DNA recentemente introduzido podem sermonitorados usando análise Northern e/ou Western, ambas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada e transformanteshomozigotos de segunda geração (ou T2) selecionados, e as plantas T2 podemser então adicionalmente propagadas através de técnicas clássicas demelhoramento.
Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos detecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estendeadicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordocom a invenção.
A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando uma proteína MADS15 como definidoacima. Células hospedeiras preferidas de acordo com a invenção são célulasde planta.
Plantas hospedeiras para os ácidos nucleicos ou o vetor usadono método de acordo com a invenção, a gaveta de expressão ou construção ouvetor são, em princípio, vantajosamente todas as plantas, que são capazes desintetizar os polipeptídeos usados no método inventivo.
A invenção também se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, raízes, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, aexpressão modulada é expressão aumentada.
Como mencionado acima, um método preferido para modular(preferivelmente, aumentar) expressão de um ácido nucleico codificando umaproteína MADS15 é introduzir e expressar em uma planta um ácido nucleicocodificando uma proteína MADS15; entretanto os efeitos de realizar ométodo, i.e. melhorar características de produção também podem seratingidos usando outras técnicas bem conhecidas. Uma descrição de algumasdestas técnicas irá agora se seguir.
Uma tal técnica é identificação por ativação de T-DNA. Asplantas transgênicas resultantes mostram fenótipos dominantes devido àexpressão modificada de genes próximos ao promotor introduzido.
Os efeitos da invenção também podem ser reproduzidosusando a técnica de TILLING (Lesões Locais Induzidas Dirigidas emGenomas), ou por recombinação homóloga.
Referência neste lugar a características de produçãomelhoradas é adotada para significar um aumento em biomassa (peso) de umaou mais partes de uma planta, o que pode incluir partes (aptas para corte)acima do solo e/ou partes (aptas para corte) abaixo do solo.
Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas estabelecidas por hectare ou acre, um aumento no número de espigaspor planta, um aumento no número de fileiras, número de sementes porfileira, peso de semente, peso de mil sementes, comprimento/diâmetro deespiga, aumento na taxa de enchimento de grãos (que é o número de grãoscheios dividido pelo número total de grãos e multiplicado por 100), entreoutros. Adotando arroz como um exemplo, um aumento de produção pode sermanifestado como um aumento em um ou mais dos seguintes: número deplantas por hectare ou acre, número de panículas por planta, número deespiguilhas por panícula, número de flores (floretes) por panícula (que éexpresso como uma proporção do número de grãos cheios pelo número depanículas primárias), aumento na taxa de enchimento de grãos (que é onúmero de grãos cheios dividido pelo número total de grãos e multiplicadopor 100), aumento em peso de mil sementes, entre outros.
Em uma forma de realização particular, tais partes aptas paracorte são raízes, e desempenho dos métodos da invenção resulta em plantastendo crescimento aumentado de raízes em relação ao crescimento de raízesde plantas de controle adequadas. Desenvolvimento de raiz é um determinanteessencial de crescimento vegetal e produção de cultura uma vez que a raiz é oprincipal canal para extrair nutrientes do ambiente.
Produção aumentada de raízes pode por exemplo sermanifestada como um de mais dos seguintes: a) quantidade aumentada debiomassa de raiz (através do que uma discriminação entre raízes espessas eraízes delgadas pode ser feita definindo um certo limiar), b) diâmetro médiode raiz aumentado, c) biomassa total de raiz aumentada, e d) proporçãobiomassa de raízes/biomassa de parte aérea aumentada. Para o propósito destainvenção, deve ser entendido que o termo 'crescimento de raiz abrange todosos aspectos de crescimento das diferentes partes que constituem o sistemaradicular em diferentes estágios de seu desenvolvimento, tanto em plantasmonocotiledôneas como dicotiledôneas. Deve ser entendido que crescimentoacentuado da raiz pode resultar de crescimento acentuado de uma ou mais desuas partes incluindo a raiz primária, raízes laterais, raízes adventícias, etc.todas as quais caem dentro do escopo desta invenção.
Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas de controle em um estágiocorrespondente em seu ciclo de vida. A taxa de crescimento aumentada podeser específica para uma ou mais partes de uma planta (incluindo sementes), oupode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxade crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo devida de uma planta pode ser adotado para significar o tempo necessário paracrescer de semente madura seca até o estágio onde a planta produziu sementesmaduras secas, similar ao material inicial. Este ciclo de vida pode serinfluenciado por fatores tal como vigor precoce, taxa de crescimento, índicerelativo ao verde, tempo de florescimento e velocidade de maturação desementes. O aumento em taxa de crescimento pode ocorrer em um ou maisestágios no ciclo de vida de uma planta ou durante substancialmente o ciclode vida inteiro de planta. Taxa de crescimento aumentada durante os estágiosiniciais no ciclo de vida de uma planta pode permitir vigor melhorado. Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível (um efeito similar pode ser obtidocom tempo de florescimento adiantado). Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contrapartestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.
De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle. Portanto, deacordo com a presente invenção, é fornecido um método para aumentar a taxade crescimento de plantas, cujo método compreende modular expressão,preferivelmente aumentar expressão, em uma planta de um ácido nucleicocodificando uma proteína MADS15 como definido neste lugar.
Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.
Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.
Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeoMADS15.
Desempenho dos métodos da invenção gera plantas crescidasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15. Deficiência de nutrientes poderesultar de uma carência ou excesso de nutrientes tal como nitrogênio,fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio,magnésio, manganês, ferro e boro, entre outros.
Em uma forma de realização preferida da invenção, o aumentoem produção e/ou taxa de crescimento ocorre de acordo com os métodos dapresente invenção em condições de não estresse.
Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas include cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia.
A presente invenção também abrange uso de ácidos nucleicoscodificando a proteína MADS15 descrita neste lugar e uso destas proteínasMADS15 para melhorar características de produção em plantas.
Ácidos nucleicos codificando a proteína MADS15 descritaneste lugar, ou as próprias proteínas MADS15, podem encontrar uso emprogramas de melhoramento nos quais é identificado um marcador de DNAque pode ser geneticamente ligado a um gene codificando MADS15. Osácidos nucleicos/genes, ou as próprias proteínas MADS15 podem ser usadospara definir um marcador molecular. Este marcador de DNA ou proteína podeentão ser usado em programas de melhoramento para selecionar plantas tendocaracterísticas de produção melhoradas como definido acima nos métodos dainvenção.
Variantes alélicas de um gene/ácido nucleico codificandoproteína MADS15 também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.
Ácidos nucleicos codificando proteínas MADS15 tambémpodem ser usados como sondas para mapear geneticamente e fisicamente osgenes dos quais elas são uma parte de, e como marcadores para característicasligadas a tais genes. Tal informação pode ser útil em melhoramento vegetal afim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidosnucleicos codificando proteína MADS15 requer apenas uma seqüência deácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidosnucleicos codificando proteína MADS15 podem ser usados como marcadoresde polimorfismo de comprimento de fragmento de restrição (RFLP). Southernblots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, ALaboratory Manual) de DNA genômico vegetal digerido por restrição podemser sondados com os ácidos nucleicos codificando proteína MADS15. Opadrão de bandeamento resultante pode então ser sujeito a análises genéticasusando programas computacionais tal como MapMaker (Lander et al. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, osácidos nucleicos podem ser usados para sondar Southern blots contendoDNAs genômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando proteína MADS15 no mapagenético previamente obtido usando esta população (Botstein et al. (1980)Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley (1986)Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas, e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestrais docruzamento de mapeamento na região correspondendo à atual seqüência deácidos nucleicos. Isto, entretanto, geralmente não é necessário para métodosde mapeamento.
Os métodos de acordo com a presente invenção resultam emplantas tendo características de produção melhoradas, como descrito acima.Estas características também podem ser combinadas com outrascaracterísticas economicamente vantajosas, tal como característicasacentuadoras de produção adicionais, tolerância a outros estresses abióticos ebióticos, características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.
Descrição detalhada de MADS15 abaixo
Foi agora surpreendentemente descoberto que diminuir o nívele/ou atividade de um polipeptídeo MADS15 endógeno gera plantas tendocaracterísticas de produção melhoradas, em particular produção aumentadaem relação a plantas tipo selvagem correspondentes. A presente invençãoportanto fornece métodos para estimular características de produção,particularmente para aumentar produção de uma planta em relação a plantasde controle, compreendendo diminuir o nível e/ou atividade de umpolipeptídeo MADS15 endógeno. Referência neste lugar a "plantas decontrole" é adotada para significar plantas tipo selvagem correspondentes nasquais não existe nenhuma redução em atividade do polipeptídeo MADS15endógeno.
Vantajosamente, desempenho dos métodos de acordo com apresente invenção resulta em plantas tendo produção aumentada,particularmente produção aumentada de sementes e/ou biomassa aumentada,em relação a plantas tipo selvagem correspondentes.
O termo "rendimento aumentado" como definido neste lugar éadotado para significar um aumento em biomassa (peso) de uma ou maispartes de uma planta, o que pode incluir partes (aptas para corte) acima dosolo e/ou partes (aptas para corte) abaixo do solo.
Em particular, tais partes aptas para corte incluem biomassavegetativa e/ou sementes, e desempenho dos métodos da invenção resulta emplantas tendo produção aumentada (em biomassa vegetativa e/ou semente) emrelação à produção de plantas de controle.
Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas por hectare ou acre, um aumento no número de espigas por planta, umaumento no número de fileiras, número de sementes por fileira, peso desemente, peso de mil sementes, comprimento/diâmetro de espiga, aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), entre outros. Adotando arrozcomo um exemplo, um aumento de produção pode ser manifestado como umaumento em um ou mais dos seguintes: número de plantas por hectare ouacre, número de panículas por planta, número de espiguilhas por panícula,número de flores (floretes) por panícula (que é expresso como uma proporçãodo número de grãos cheios pelo número de panículas primárias), aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), aumento em peso de milsementes, entre outros.
O aumento em produção de sementes também pode sermanifestado como um aumento em tamanho de semente e/ou volume desemente. Isto pode aumentar a quantidade, ou mudar a composição de,substâncias na semente, tal como óleos, proteínas e carboidratos.
De acordo com uma característica preferida, desempenho dosmétodos da invenção resulta em plantas tendo produção aumentada,particularmente biomassa e/ou produção de sementes aumentada. Portanto, deacordo com a presente invenção, é fornecido um método para aumentarprodução vegetal, cujo método compreende diminuir o nível de atividade deum polipeptídeo MADS15 ou um homólogo deste, preferivelmentediminuindo expressão de um gene MADS15 ou um homólogo deste.
Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Plantas tendo uma taxa de crescimento aumentada podem terum ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotadopara significar o tempo necessário para crescer de semente madura seca até oestágio onde a planta produziu sementes maduras secas, similar ao materialinicial. Este ciclo de vida pode ser influenciado por fatores tal como vigorprecoce, taxa de crescimento, tempo de florescimento e velocidade dematuração de sementes. Um aumento em taxa de crescimento pode ocorrerem um ou mais estágios no ciclo de vida de uma planta ou durantesubstancialmente o ciclo de vida inteiro de planta. Taxa de crescimentoaumentada durante os estágios iniciais no ciclo de vida de uma planta podepermitir vigor melhorado. O aumento em taxa de crescimento pode alterar ociclo de colheita de uma planta permitindo que plantas sejam semeadas maistarde e/ou colhidas mais cedo do que de outra maneira seria possível (umefeito similar pode ser obtido com tempo de florescimento adiantado). Se ataxa de crescimento é suficientemente aumentada, ela pode permitirsemeadura adicional de sementes da mesma espécie de planta (por exemplosemeadura e colheita de plantas de arroz seguido por semeadura e colheita deplantas de arroz adicionais todas dentro de um período de cultivoconvencional). Similarmente, se a taxa de crescimento é suficientementeaumentada, ela pode permitir semeadura adicional de sementes de espéciesvegetais diferentes (por exemplo a semeadura e colheita de plantas de milhoseguido por, por exemplo, a semeadura e colheita opcional de soja, batata ouqualquer outra planta adequada). Tempos de colheita adicionais do mesmorizoma no caso de algumas plantas de cultura também podem ser possíveis.
Alterar o ciclo de colheita de uma planta pode levar a um aumento emprodução anual de biomassa por acre (devido a um aumento no número devezes (digamos que em um ano) que qualquer planta particular pode sercultivada e colhida). Um aumento em taxa de crescimento também podepermitir o cultivo de plantas transgênicas em uma área geográfica mais amplado que suas contrapartes tipo selvagem, uma vez que as limitações territoriaispara cultivar uma cultura freqüentemente são determinadas por condiçõesambientais adversas ou no momento de plantio (ciclo precoce) ou nomomento de colheita (ciclo tardio). Tais condições adversas podem serevitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode serdeterminada derivando vários parâmetros de curvas de crescimento, taisparâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% deseu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% deseu tamanho máximo), entre outros.
Desempenho dos métodos da invenção gera plantas tendo umataxa de crescimento aumentada. Portanto, de acordo com a presente invenção,é fornecido um método para aumentar a taxa de crescimento de plantas emrelação a plantas de controle, cujo método compreende preferencialmentereduzir o nível e/ou atividade de expressão de um gene MADS15 endógenoem uma planta.
Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende reduzirexpressão de um gene MADS15 endógeno em uma planta.
Desempenho dos métodos da invenção gera plantas crescidasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende diminuir expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15. Deficiência de nutrientes poderesultar de uma carência ou excesso de nutrientes tal como nitrogênio,fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio,magnésio, manganês, ferro e boro, entre outros.
Em uma forma de realização preferida da invenção, o aumentoem produção e/ou taxa de crescimento ocorre de acordo com os métodos dapresente invenção em condições de não estresse.
Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia.
Referência neste lugar a uma "diminuição" em nível de umaproteína MADS15 endógena em uma planta é adotada para significar umaredução na concentração da proteína ou eliminação substancial de umaproteína MADS15 endógena em relação a níveis de proteína MADS15endógena encontrados em plantas tipo selvagem correspondentes. Estaredução ou eliminação substancial pode resultar em atividade reduzida ousubstancialmente abolida de proteína MADS15 em uma planta.
Referência neste lugar a uma "diminuição" em atividade deuma proteína MADS15 endógena em uma planta é adotada para significaruma redução em atividade de proteína MADS15 ou eliminação substancial deatividade de uma proteína MADS15 endógena em relação a níveis deatividade de proteína MADS15 endógena encontrados em plantas tiposelvagem.
Preferivelmente, a redução em nível e/ou atividade de proteínaMADS15 endógena é obtida diminuindo a expressão do gene MADS15endógeno.
Referência neste lugar a um gene MADS15 "endógeno" não serefere apenas a genes MADS15 como encontrados em uma planta em suaforma natural (i.e., sem haver qualquer intervenção humana), mas também serefere a genes MADS15 isolados subseqüentemente introduzidos em umaplanta. Por exemplo, uma planta transgênica contendo um transgeneMADS15 pode confrontar uma redução ou eliminação substancial daexpressão de transgene MADS15 e/ou reduzida ou eliminação substancial deexpressão de um gene MADS15 endógeno.
Esta redução (ou eliminação substancial) de expressão de geneMADS15 endógeno pode ser atingida usando qualquer um ou mais dediversos métodos de silenciamento gênico bem conhecidos. "Silenciamentogênico" ou "diminuição" de expressão, como usado neste lugar, se refere auma redução ou à eliminação substancial expressão de gene MADS15 e/ouníveis de polipeptídeo MADS15 e/ou atividade de polipeptídeo MADS15.
Um tal método para redução ou eliminação substancial deexpressão de gene MADS15 endógeno é diminuição mediada por RNA deexpressão de gene (silenciamento de RNA). Silenciamento neste caso édesencadeado em uma planta por uma molécula de RNA de dupla dita(dsRNA) que é substancialmente homóloga a um gene MADS15 alvo. EstedsRNA é adicionalmente processado pela planta em cerca de 21 a cerca de 26nucleotídeos chamados RNAs curtos de interferência (siRNAs). Os siRNAssão incorporados em um complexo de silenciamento induzido por RNA(RISC) que cliva o mRNA de um gene MADS15 alvo, com isso reduzindo ousubstancialmente eliminando o número de mRNAs de MADS15 a seremtraduzidos em uma proteína MADS15.
Um exemplo de um método de silenciamento de RNA envolvea introdução de seqüências de codificação ou partes destas em uma orientaçãosentido em uma planta. O gene adicional, ou parte deste, irá silenciar um geneMADS15 endógeno, gerando um fenômeno conhecido como co-supressão. Aredução de expressão de gene MADS15 será mais pronunciada se diversascópias adicionais são introduzidas na planta, pois existe uma correlaçãopositiva entre altos níveis de transcrito e o desencadeamento de co-supressão.Outro exemplo de um método de silenciamento de RNAenvolve o uso de seqüências de ácidos nucleicos MADS15 antisentido.
O ácido nucleico antisentido pode ser produzidobiologicamente usando um vetor de expressão no qual um ácido nucleico foisubclonado em uma orientação antisentido (i.e., RNA transcrito a partir doácido nucleico inserido será de uma orientação antisentido para um ácidonucleico alvo de interesse, adicionalmente descrito na subseção seguinte).Preferivelmente, produção de ácidos nucleicos antisentido em plantas ocorrepor meio de um transgene estavelmente integrado compreendendo umpromotor operável para expressão constitutiva em plantas, umoligonucleotídeo antisentido, e um terminador.
Um método preferido para redução ou eliminação substancialde expressão de gene MADS15 endógeno através de silenciamento de RNA éusar um vetor de expressão no qual um gene MADS15 ou fragmento deste foiclonado como uma repetição invertida (em parte ou completamente), separadopor um espaçador (DNA não codificante).
Em ainda outra forma de realização, a redução ou eliminaçãosubstancial de expressão endógena de MADS15 pode ser obtida usandoribozimas. Por exemplo, um derivado de um RNA de Tetrahymena L-19 IVSpode ser construído no qual a seqüência de nucleotídeos do sítio ativo écomplementar à seqüência de nucleotídeos a ser clivada em um mRNAcodificando MADS15.
Silenciamento gênico também pode ser atingido pormutagênese por inserção ou se existe uma mutação no gene MADS15endógeno e/ou uma mutação no gene MADS15 isolado subseqüentementeintroduzida em uma planta. A redução ou eliminação substancial de atividadede proteína MADS15 pode ser causada por um MADS15 não funcional. Porexemplo, MADS15 se liga a várias proteínas de interação; uma ou maismutação(ões) e/ou truncamento(s) dentro do MADS box de um MADS15portanto pode sustentar uma proteína MADS15 que ainda é capaz de se ligar aproteínas de interação mas que não pode exibir sua função normal como fatorde transcrição.
Uma abordagem adicional para silenciamento gênico édirecionar seqüências de nucleotídeos complementares à região reguladora dogene MADS15 (e.g., o promotor e/ou acentuadores de MADSl5) para formarestruturas de tripla hélice que previnem transcrição do gene MADS15 emcélulas alvo.
Ainda outra abordagem para silenciamento gênico é descritapor Hiratsu et al. (Plant J. 34, 733-739, 2003). Este método não depende dehomologia de seqüência com o gene visado mas envolve o uso de um domíniode seqüência de repressão em fusões de gene transcricional, e foi usado paramodificar características de interesse agronômico (Fujita et al., Plant Cell 17,3470-3488, 2005 e Mitsuda at al., Plant Cell 17, 2993-3006, 2005).Tipicamente, uma fusão quimérica de nucleotídeos é feita entre um genecodificando uma proteína capaz de influenciar positivamente a expressão dogene visado (tal como um ativador de transcrição), e um fragmento denucleotídeo codificando um domínio de repressão. Mediante expressão dafusão gênica quimérica, a expressão do gene visado é reprimida, normalmentede uma maneira negativa dominante. Domínios de repressão são bemconhecidos na arte, por exemplo o motivo EAR presente em alguns AP2 efator de transcrição dedo de Zinco. Métodos baseados em domínios derepressão são bem adequados para superar redundância gênica para o genevisado nas espécies vegetais de escolha.
São descritos acima exemplos de vários métodos parasilenciamento gênico (para a redução ou eliminação substancial de expressãode gene MADS15 endógeno. Os métodos da invenção se fiam na redução deexpressão de um gene MADS15 endógeno em uma planta. Uma pessoaversada na arte deve ser prontamente capaz de adaptar os métodosmencionados acima para silenciamento de forma a atingir silenciamentogênico em uma planta inteira ou em partes desta através do uso de umpromotor apropriado, por exemplo.
Deve ser observado que a essência da presente invenção residenos resultados vantajosos e surpreendentes encontrados com redução oueliminação substancial de expressão de gene MADS15 endógeno em umaplanta, e não é limitada a qualquer método particular para tal redução oueliminação substancial de atividade de proteína MADS15 endógena. Aatividade de um polipeptídeo MADS15 também pode ser diminuída oueliminada introduzindo uma modificação genética (preferivelmente no locusde um gene MADS15). O locus de um gene como definido neste lugar éadotado para significar uma região genômica, que inclui o gene de interesse e10 kb antes ou depois da região de codificação.
A modificação genética pode ser introduzida, por exemplo, porqualquer um (ou mais) dos seguintes métodos: inativação de T-DNA,TILLING, mutagênese dirigida a sítio, evolução dirigida, recombinaçãohomóloga. Seguindo introdução da modificação genética, segue uma etapa deselecionar para atividade diminuída de um polipeptídeo MADS15, cujadiminuição em atividade gera plantas tendo produção aumentada.
Identificação por inativação de T-DNA envolve inserção deum T-DNA, na região genômica do gene de interesse ou 10 kb antes oudepois da região de codificação de um gene em uma configuração tal que o T-DNA inibe expressão do gene visado. Tipicamente, regulação de expressão dogene visado por seu promotor natural é interrompida. O T-DNA éaleatoriamente inserido no genoma vegetal, por exemplo, através de infecçãopor Agrobacterium e leva a expressão diminuída de genes perto do T-DNAinserido. As plantas transgênicas resultantes mostram fenótipos devidos aexpressão inibida de genes perto do T-DNA introduzido.
Uma modificação genética também pode ser introduzida nolocus de um gene MADS15 usando a técnica de TILLING (Lesões LocaisInduzidas Dirigidas em Genomas).
Mutagênese dirigida a sítio e mutagênese aleatória podem serusadas para gerar variantes de ácidos nucleicos MADSl5. Estão disponíveisdiversos métodos para atingir mutagênese dirigida a sítio, o mais comumsendo métodos baseados em PCR (current protocols in molecular biology.Wiley Eds.)·
Evolução dirigida também pode ser usada para gerar variantesde ácidos nucleicos MADSl5. Isto consiste de repetições de embaralhamentode DNA seguido por triagem e/ou seleção apropriada para gerar variantes deácidos nucleicos MADS15 ou variantes destes codificando polipeptídeosMADS15 tendo uma atividade biológica modificada (aqui diminuída ouabolida) (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).
Ativação de T-DNA, TILLING, mutagênese dirigida a sítio eevolução dirigida são exemplos de tecnologias que possibilitam a geração denovos alelos e variantes de MADSl5.
Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga. O ácido nucleico a ser direcionado pode serum alelo codificando uma proteína inativa ou uma proteína com atividadediminuída, usada para substituir o gene endógeno ou pode ser introduzido emadição ao gene endógeno, e precisa ser direcionado para o locus do geneMADS15.
Outros métodos, tal como o uso de anticorpos dirigidos para oMADS15 endógeno para inibir sua função in planta, ou interferência na viade sinalização na qual MADS15 está envolvido, serão bem conhecidos poralguém versado. Alternativamente, um programa de triagem pode serestabelecido para identificar variantes naturais de um gene MADS15, cujasvariantes têm atividade reduzida de MADS15, ou nenhuma atividade deMADS15. Tais variantes naturais também podem ser usadas nos métodos dapresente invenção.
Para desempenho ótimo, as técnicas de silenciamento gênicousadas para a redução ou eliminação substancial de expressão de geneMADS15 endógeno requerem o uso de seqüências de ácidos nucleicosMADS15 de plantas monocotiledôneas para transformação em plantasmonocotiledôneas. Preferivelmente, um ácido nucleico MADS15 de qualquerdada espécie vegetal é introduzido naquela mesma espécie. Por exemplo, umácido nucleico MADS15 de arroz (seja ele uma seqüência de MADSl5 decomprimento completo ou um fragmento) é transformado em uma planta dearroz. O ácido nucleico MADS15 não precisa ser introduzido na mesmavariedade vegetal.
Referência neste lugar a um "gene MADS15" ou um "ácidonucleico MADS75" é adotada para significar uma forma polimérica de umdesoxirribonucleotídeo ou um polímero de ribonucleotídeo de qualquercomprimento, ou de fita dupla ou simples, ou análogos destes, que têm ascaracterísticas essenciais de um ribonucleotídeo natural na medida em queeles podem hibridizar com ácidos nucleicos de uma maneira similar apolinucleotídeos naturalmente ocorrentes. Um "gene MADSl5" ou um "ácidonucleico MADS15" se refere a um comprimento suficiente de nucleotídeossubstancialmente contíguos de um gene codificando MADS15 para realizarsilenciamento gênico; isto pode ser tão pouco quanto 20 ou menosnucleotídeos. Um gene codificando uma proteína (funcional) não é umrequerimento para os vários métodos discutidos acima para a redução oueliminação substancial de expressão de um gene MADS15 endógeno.
Os métodos da invenção podem ser realizados usando umcomprimento suficiente de nucleotídeos substancialmente contíguos de umgene/ácido nucleico MADS15, que pode consistir de 20 ou menosnucleotídeos, que podem ser de qualquer parte do gene/ácido nucleicoMADSl 5, tal como a extremidade 5' da região de codificação que é bemconservada entre a família de gene MADSl 5, ou codificando um dos motivosconservados descritos abaixo.
Genes MADS15 são bem conhecidos na arte e úteis nosmétodos da invenção são nucleotídeos substancialmente contíguos dogene/ácido nucleico MADSl5 vegetal descrito em Moon et al. (Plant Physiol.120, 1193-1204, 1999).
Outros genes/seqüências de ácidos nucleicos de MADS15também podem ser usados nos métodos da invenção, e podem serprontamente identificados por uma pessoa versada na arte. PolipeptídeosMADS15 podem ser identificados pela presença de uma ou mais de diversascaracterísticas bem conhecidas (veja abaixo). Mediante identificação de umpolipeptídeo MADS15, uma pessoa versada na arte pode facilmente derivar,usando técnicas de rotina, a seqüência de ácidos nucleicos de codificaçãocorrespondente e usar um comprimento suficiente de nucleotídeos contíguosdos mesmos para realizar qualquer um ou mais dos métodos de silenciamentogênico descritos acima.
O termo "polipeptídeo MADS15 ou homólogo deste" comodefinido neste lugar se refere a uma proteína que cai no grupo de proteínasMADS box tipo FUL como delineado por Adam et al.(J. Mol. Evol. 62, 15-31). Proteínas MADS box tipo FUL são parte da subfamília SQUAMOSA etêm a arquitetura MIKCc típica: um domínio MADS (M) no término N,seguido por um domínio interveniente (I) envolvido em dimerização, umdomínio de queratina altamente conservado (K) e um domínio variável (C) notérmino C, que é responsável por ligação de proteínas em interação ouativação transcricional (De Bodt et al. Trends in Plant Science 8, 475-483).
Polipeptídeos MADS15 vegetais também podem seridentificados pela presença de certos motivos conservados. A presença destesmotivos conservados pode ser identificada usando métodos para oalinhamento de seqüências para comparação como descrito acima. Emalgumas instâncias, os parâmetros padrão podem ser ajustados para modificara estringência da busca. Por exemplo usando BLAST, o limiar designificância estatística (chamado valor esperado") para relatar pareamentoscontra seqüências de banco de dados pode ser aumentado para mostrarpareamentos menos estringentes. Desta maneira, pareamentos curtospraticamente exatos podem ser identificados. Mediante identificação de umpolipeptídeo MADS15 pela presença destes motivos, uma pessoa versada naarte pode facilmente derivar o ácido nucleico correspondente codificando opolipeptídeo compreendendo os motivos relevantes, e usar um comprimentosuficiente de nucleotídeos contíguos dos mesmos para realizar qualquer umou mais dos métodos de silenciamento gênico descritos acima (para a reduçãoou eliminação substancial de expressão um gene MADS15 endógeno).
Tipicamente, a presença de pelo menos um dos motivos 1 a 4deve ser suficiente para identificar qualquer seqüência de consulta como umMADS15, entretanto a presença de pelo menos motivos 1 e 2 é preferida. Aseqüência consenso fornecida é baseada nas seqüências de monocotiledôneasdadas na listagem de seqüências. Uma pessoa versada na arte estará bemciente de que a seqüência consenso pode variar de alguma maneira seseqüências adicionais ou diferentes (por exemplo de seqüências dedicotiledôneas) forem usadas para comparação.
Motivo 1, localizado no domínio MADS (SEQ ID NO: 114):
L(LA^)KKA(H/N)EIS(VI)L(C/Y)DAE(V/I/L)(A/G)(L/AAA)(I/V)(I/V)FS(T/P/Ay^)KGKLYE(Y/F)(A/S)(T/S)(D/N/E)S(K/C/R/S)M(D/E)(>í/I/R/K)IL(E/D)R.
Preferivelmente, este motivo conservado de seqüência 1 tem aseqüência:
LLKKAHEISVLCDAEVA(L/AA^)I(W)FS(T/P)KGKLYEYATDS(C/R)M(D/E)(R/K)ILER,mais preferivelmente o motivo conservado de seqüência 1 tema seqüência:
LLKKAHEISVLCDAEVAAIVFSPKGKLYEYATDSRMDKILER
Motivo 2, localizado no domínio K (SEQ ID NO: 115):
KLK(A/S)(K/R)(V/I)E(A/T/S)(L/I)(Q/N)(K/R/N)(S/C/R)(Q/H)(R/K)HLMGE
Preferivelmente, este motivo conservado de seqüência 2 tem aseqüência:
KLKAK(V/I)E(A/T)(L/I)QK(S/C)(Q/H)(R/K)HLMGE
Mais preferivelmente, este motivo conservado de seqüência 2tem a seqüência:
KLK^KIETIQKCHKHLMGE
Opcionalmente, o polipeptídeo MADS15 ou seu homólogopode compreender no domínio C motivo 3 e/ou motivo 4:
motivo 3 (SEQ ID NO: 116):
Q(P/Q/V/A)QTS(S/F)(S/F)(S/F)(S/F)(S/C/F)(F/M)motivo 4 (SEQ ID NO: 117):
(G/A/V/L)(L/P)XWMX(S/H)
caracterizado pelo fato de que o primeiro resíduo X em motivo4 pode ser qualquer aminoácido, mas preferivelmente L, P ou H; ecaracterizado pelo fato de que o segundo resíduo X pode ser qualqueraminoácido, mas preferivelmente V ou L.
Alternativamente, o domínio C (começando atrás do domíniode queratina, i.e. em Rl 75 em SEQ ID NO: 110) pode ser caracterizado pelaocorrência aumentada de glutamina (normalmente 3,93%, aqui pelo menos8,77% com um máximo de 26,73%), em adição, o conteúdo em alanina,prolina, e/ou serina também pode ser aumentado (acima 7,8%, 4,85% e 6,89%respectivamente).Alternativamente formulada, uma proteína MADS15 preferidaútil nos métodos da presente invenção compreende pelo menos um domínioMADS N-terminal correspondendo ao domínio SMART SM00432 (PfamPF00319) seguido por um domínio de Queratina correspondendo à região K-box definida em Pfam como PFO1486, mais preferivelmente, a proteínaMADS15 tem em seu domínio MADS a assinatura conservada de SEQ IDNO: 114 e em seu domínio K a assinatura conservada de SEQ ID NO: 115,mais preferivelmente, a proteína MADS15 tem a seqüência dados em SEQ IDNO: 110.
Homólogos, como definido acima, podem ser prontamenteidentificados usando técnicas de rotina bem conhecidas na arte, tal como poralinhamento de seqüências; homólogos de OsMADS 15 podem ter sidonomeados diferentemente em várias espécies de plantas, portanto os nomes degene/proteína não devem ser usados para identificar ortólogos ou parálogos.Métodos para o alinhamento de seqüências para comparação são bemconhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA eTFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol48: 443-453) para encontrar o alinhamento de duas seqüências completas quemaximiza o número de pareamentos e minimiza o número de lacunas. Oalgoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calculaidentidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Bioteclinology Information. Seqüências homólogas podem serprontamente identificadas usando, por exemplo, o algoritmo de alinhamentode múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão dealinhamento pareado, e um método de pontuação em porcentagem. Ediçãomanual secundária pode ser realizada para otimizar alinhamento entremotivos conservados (veja abaixo), como seria evidente para uma pessoaversada na arte.
Os vários domínios estruturais em uma proteína MADS15podem ser identificados usando bancos de dados especializados e.g. SMART(Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic etal. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003)Nucl. Acids. Res. 31, 315-318;), Prosite (Bucher and Bairoeh (1994), Ageneralized profile syntax for biomolecular sequences motifs and its funetionin automatic sequence interpretation. (In) ISMB-94; Proceedings 2ndInternational Conferenee on Intelligent Systems for Molecular Biology.10 Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61,AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137,(2004)) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280(2002)).
Além disso, uma proteína MADS15 também pode seridentificável por sua capacidade de se ligar a DNA e de interagir com outrasproteínas. Atividade de ligação de DNA e interações proteína-proteína podemser prontamente determinadas in vitro ou in vivo usando técnicas bemconhecidas na arte. Exemplos de ensaios in vitro para atividade de ligação deDNA incluem: análise de retardo em gel usando domínios de ligação de DNAMADS-box conhecidos (West et al. (1998) Nucl Acid Res 26(23): 5277-87),ou ensaios de um híbrido de levedura. Um exemplo de um ensaio in vitro parainterações proteína-proteína é a análise de dois híbridos de levedura (Fieldsand Song (1989) Nature 340:245-6). Proteínas conhecidas por interagir comOsMADS 15 incluem outras proteínas MADS (tal como aquelas envolvidas nocomplexo de sinalização de florescimento), quinases tipo receptor tal umaClavatal e Clavata2, Erecta, BRIl ou RSK.
Portanto mediante identificação de um polipeptídeo MADS15usando uma ou diversas das características descritas acima, uma pessoaversada na arte pode facilmente derivar o ácido nucleico correspondentecodificando o polipeptídeo, e usar um comprimento suficiente de nucleotídeossubstancialmente contíguos do mesmo para realizar qualquer um ou mais dosmétodos de silenciamento gênico descritos acima (para a redução oueliminação substancial de expressão de um gene MADS15 endógeno).
Preferido para uso nos métodos da invenção é umcomprimento suficiente de nucleotídeos substancialmente contíguos de SEQID NO: 109 {OsMADS15), ou o uso de um comprimento suficiente denucleotídeos substancialmente contíguos de uma seqüência de ácidosnucleicos codificando um ortólogo ou parálogo de OsMADS 15 (SEQ ID NO:109). Exemplos de tais ortólogos e parálogos de OsMADS 15 são fornecidosem Tabela D abaixo. Homólogos próximos de OsMADS 15 são as proteínasrepresentadas por SEQ ID NO: 147, 149, 151, 153, 155, 157, 159, 161, 163,165, 167, 169, 171 e 173.
Ortólogos em, por exemplo, espécies de plantasmonocotiledôneas podem ser facilmente encontrados realizando uma assimchamada busca blast recíproca. Isto pode ser feito por um primeiro blastenvolvendo realizar BLAST com uma seqüência de consulta (por exemplo,SEQ ID NO: 109 ou SEQ ID NO: 110) contra qualquer banco de dados deseqüências, tal como o banco de dados publicamente disponível de NCBI.BLASTN ou TBLASTX (usando valores pré-determinados padrão) podem serusados ao iniciar de uma seqüência de nucleotídeos e BLASTP ou TBLASTN(usando valores pré-determinados padrão) podem ser usados ao iniciar de umaseqüência de proteínas. Os resultados de BLAST podem ser opcionalmentefiltrados. As seqüências de comprimento completo ou dos resultados filtradosou dos resultados não filtrados são então BLASTed de volta (segundoBLAST) contra seqüências do organismo do qual a seqüência de consulta éderivada (onde a seqüência de consulta é SEQ ID NO: 109 ou SEQ ID NO:IlOo segundo BLAST deve portanto ser contra seqüências de arroz). Osresultados do primeiro e segundo BLAST são então comparados. Umparálogo é identificado se um acerto de alto pontuação do primeiro BLAST éda mesma espécie da qual a seqüência de consulta é derivada; um ortólogo éidentificado se um acerto de alto pontuação não é da mesma espécie da qual aseqüência de consulta é derivada. Acertos de alto pontuação são aqueles tendoum baixo valor E. Quanto menor o valor E, mais significante é o pontuação(ou em outras palavras menor a chance de que o acerto tenha sido encontradoao acaso). Computação do valor E é bem conhecida na arte. No caso defamílias grandes, ClustalW pode ser usado, seguido por uma árvore deagrupamento de vizinhos, para ajudar a visualizar agrupamento de genesrelacionados e para identificar ortólogos e parálogos.
A fonte dos nucleotídeos substancialmente contíguos de umgene/ácido nucleico MADS15 pode ser qualquer fonte vegetal ou fonteartificial. Para desempenho ótimo, as técnicas de silenciamento gênico usadaspara a redução ou eliminação substancial de expressão de gene MADS15endógeno requerem o uso de seqüências de MADSl 5 de plantasmonocotiledôneas para transformação em plantas monocotiledôneas.Preferivelmente, seqüências de MADSl 5 da família Poaceae sãotransformadas em plantas da família Poaceae. Ainda preferivelmente, umácido nucleico MADS15 de arroz (seja ele uma seqüência de MADSl5 decomprimento completo ou um fragmento) é transformado em uma planta dearroz. O ácido nucleico MADS15 não precisa ser introduzido na mesmavariedade vegetal. Mais preferivelmente, o ácido nucleico MADS15 de arroz éde um comprimento suficiente de nucleotídeos substancialmente contíguos deSEQ ID NO: 109 (OsMADS 15) ou um comprimento suficiente denucleotídeos substancialmente contíguos de uma seqüência de ácidosnucleicos codificando um ortólogo ou parálogo de OsMADS15 (SEQ ID NO:110). Como mencionado acima, uma pessoa versada na arte deve estar bemciente do que iria constituir um comprimento suficiente de nucleotídeossubstancialmente contíguos para realizar qualquer dos métodos desilenciamento gênico definidos acima, isto pode ser tão pouco quanto 20 oumenos nucleotídeos substancialmente contíguos em alguns casos.
A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de nucleotídeos úteisnos métodos de acordo com a invenção.
Portanto, é fornecido uma construção gênica compreendendouma ou mais seqüências de controle capazes de dirigir expressão de umaseqüência de ácidos nucleicos de MADS15 sentido e/ou antisentido em umaplanta de forma a silenciar um gene MADS15 endógeno na planta; eopcionalmente uma seqüência de término de transcrição. Preferivelmente, aseqüência de controle é um promotor constitutivo e ubíquo.
Uma construção preferida para silenciamento gênico é umacompreendendo uma repetição invertida de um gene MADS15 ou fragmentodeste, preferivelmente capaz de formar uma estrutura em forma de grampo,cuja repetição invertida está sob o controle de um promotor constitutivo.
Portanto, a invenção fornece uma construção compreendendo:
(a) um ácido nucleico MADS15 capaz de formar umaestrutura em forma de grampo;
(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente
(c) uma seqüência de término de transcrição.
Construções úteis nos métodos de acordo com a presente
invenção podem ser criadas usando tecnologia de DNA recombinante bemconhecida por pessoas versadas na arte. As construções gênicas podem serinseridas em vetores, que podem estar disponíveis comercialmente, adequadospara transformação em plantas e adequados para expressão do gene deinteresse nas células transformadas. A invenção portanto fornece uso de umaconstrução gênica como definido acima nos métodos da invenção.
A seqüência de interesse é operacionalmente ligada a uma oumais seqüências de controle (pelo menos a um promotor) capazes deaumentar expressão em uma planta.
Vantajosamente, qualquer tipo de promotor pode ser usadopara dirigir expressão da seqüência de ácidos nucleicos. O promotor pode serum promotor induzível, i.e. tendo início de transcrição induzido ouaumentado em resposta a um estímulo evolutivo, químico, ambiental oufísico. Adicionalmente ou alternativamente, o promotor pode ser um promotorpreferido por tecido ou preferido por célula, i.e. um que é capaz depreferencialmente iniciar transcrição em certos tecidos, tal como as folhas,raízes, tecido de semente etc, ou mesmo em células específicas. Promotorescapazes de iniciar transcrição em certos tecidos ou células apenas sãoreferidos neste lugar como "tecido específicos", respectivamente "célulaespecíficos".
Preferivelmente, o ácido nucleico MADS15 ou variantefuncional deste é operacionalmente ligado a um promotor constitutivo.Preferivelmente o promotor é um promotor ubíquo e é expressopredominantemente ao longo da planta. Preferivelmente, o promotorconstitutivo capaz de expressar preferencialmente o ácido nucleico ao longoda planta tem um perfil de expressão comparável um promotor GOS2. Maispreferivelmente, o promotor constitutivo tem o mesmo perfil de expressãoque o promotor GOS2 de arroz, mais preferivelmente, o promotor capaz deexpressar preferencialmente o ácido nucleico ao longo da planta é o promotorGOS2 de arroz (SEQ ID NO: 113 ou SEQ ID NO: 174). Deve ser claro que aaplicabilidade da presente invenção não é restrita ao ácido nucleico MADS15representado por SEQ ID NO: 109, nem é a aplicabilidade da invençãorestrita a expressão de um ácido nucleico MADS15 quando dirigida por umpromotor GOS2. Um promotor constitutivo alternativo que é útil nos métodosda presente invenção é o grupo de promotor de proteína de alta mobilidade(PR00170, SEQ ID NO: 40 em Patente Internacional 2004070039).Exemplos de outros promotores constitutivos que também podem ser usadospara dirigir expressão de um ácido nucleico MADS15 são mostrados na seçãode definições.
Opcionalmente, uma ou mais seqüências terminadoras tambémpodem ser usadas na construção introduzida em uma planta. Elementosreguladores adicionais podem incluir acentuadores transcricionais assim comotraducionais. Aqueles versados na arte estarão cientes de seqüênciasterminadoras e acentuadoras que podem ser adequadas para uso para realizara invenção. Tais seqüências devem ser conhecidas ou podem ser prontamenteobtidas por uma pessoa versada na arte.
As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl. A construção genética pode opcionalmentecompreender um gene marcador selecionável.
A presente invenção também abrange plantas incluindo partesvegetais viáveis pelos métodos de acordo com a presente invenção tendoprodução aumentada em relação a plantas de controle e que têm expressãoreduzida ou substancialmente eliminada de um gene MADS15 endógeno.
A invenção além disso fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, cujas plantas transgênicas têm expressão reduzida ousubstancialmente eliminada de um gene MADS15 endógeno.
Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada desementes cujo método compreende:introduzir e expressar em uma planta, parte vegetal oucélula vegetal uma construção gênica compreendendo uma ou maisseqüências de controle capazes de preferencialmente dirigir expressão de umaseqüência de ácidos nucleicos de MADS15 com repetição invertida em umaplanta de forma a silenciar um gene MADS15 endógeno na planta; e
cultivar a planta, parte vegetal ou célula vegetal emcondições que promovem crescimento e desenvolvimento vegetal.
Preferivelmente, a construção introduzida em uma planta éuma compreendendo uma repetição invertida (em parte ou completa) de umgene MADS15 ou fragmento deste, preferivelmente capaz de formar umaestrutura em forma de grampo.
De acordo com uma característica preferida da presenteinvenção, a construção é introduzida em uma planta por transformação.
Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira.
Seguindo transferência de DNA e regeneração, plantasputativamente transformadas podem ser avaliadas, por exemplo usandoanálise Southern, para a presença do gene de interesse, número de cópias e/ouorganização genômica. Alternativamente ou adicionalmente, níveis deexpressão do DNA recentemente introduzido podem ser monitorados usandoanálise Northern e/ou Western, ou PCR quantitativo, todas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos detecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estendeadicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordocom a invenção.
A invenção também se estende a partes aptas para corte deuma planta tal como sementes e produtos derivados, preferivelmentediretamente derivados, de uma parte apta para corte de uma tal planta, talcomo péletes ou pós secos, óleo, gordura, ácidos graxos, amido ou proteínas.
A presente invenção também abrange uso de ácidos nucleicosMADS15 para a redução ou eliminação substancial de expressão de geneMADS15 endógeno em uma planta para aumentar produção de sementes deplanta como definido acima.
Ácidos nucleicos codificando a proteína MADS15 descritaneste lugar, ou as próprias proteínas MADS15, podem encontrar uso emprogramas de melhoramento nos quais é identificado um marcador de DNAque pode ser geneticamente ligado a um gene codificando MADS15. Osácidos nucleicos/genes, ou as próprias proteínas MADS15 podem ser usadospara definir um marcador molecular. Este marcador de DNA ou proteína podeentão ser usado em programas de melhoramento para selecionar plantas tendocaracterísticas de produção melhoradas como definido acima nos métodos dainvenção.
Variantes alélicas de um gene/ácido nucleico codificandoproteína MADS15 também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.
Ácidos nucleicos codificando proteínas MADS15 tambémpodem ser usados como sondas para mapear geneticamente e fisicamente osgenes dos quais elas são uma parte de, e como marcadores para característicasligadas a tais genes. Tal informação pode ser útil em melhoramento vegetal afim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidosnucleicos codificando proteína MADS15 requer apenas uma seqüência deácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidosnucleicos codificando proteína MADS15 podem ser usados como marcadoresde polimorfismo de comprimento de fragmento de restrição (RFLP). Southernblots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, ALaboratory Manual) de DNA genômico vegetal digerido por restrição podemser sondados com os ácidos nucleicos codificando proteína MADS15. Opadrão de bandeamento resultante pode então ser sujeito a análises genéticasusando programas computacionais tal como MapMaker (Lander et al. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, osácidos nucleicos podem ser usados para sondar Southern blots contendoDNAs genômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando proteína MADS15 no mapagenético previamente obtido usando esta população (Botstein et al. (1980)Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley (1986)Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas, e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas paramapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.
Os métodos de acordo com a presente invenção resultam emplantas tendo características de produção melhoradas, como descrito acima.
Estas características também podem ser combinadas com outrascaracterísticas economicamente vantajosas, tal como característicasacentuadoras de produção adicionais, tolerância a outros estresses abióticos ebióticos, características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.
Descrição detalhada de PLT
Surpreendentemente, foi descoberto agora que aumentarexpressão de um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT gera plantas tendo características de produção melhoradas,em particular produção aumentada em relação a plantas de controle.
De acordo com a presente invenção, é fornecido um métodopara aumentar produção vegetal em relação a plantas de controle,compreendendo aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT.
O termo "produção aumentada" como definido neste lugar éadotada para significar um aumento em biomassa (peso) de uma ou maispartes de uma planta, o que pode incluir partes (aptas para corte) acima dosolo e/ou partes (aptas para corte) abaixo do solo.
Em particular, tais partes aptas para corte são sementes, edesempenho dos métodos da invenção resulta em plantas tendo produçãoaumentada de sementes em relação à produção de sementes de plantas decontrole.
Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas por hectare ou acre, um aumento no número de espigas por planta, umaumento no número de fileiras, número de sementes por fileira, peso desemente, peso de mil sementes, comprimento/diâmetro de espiga, aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), entre outros. Adotando arrozcomo um exemplo, um aumento de produção pode ser manifestado como umaumento em um ou mais dos seguintes: número de plantas por hectare ouacre, número de panículas por planta, número de espiguilhas por panícula,número de flores (floretes) por panícula (que é expresso como uma proporçãodo número de grãos cheios pelo número de panículas primárias), aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), aumento em peso de milsementes, entre outros.
De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo produçãoaumentada de sementes em relação a plantas de controle. Portanto de acordocom a presente invenção, é fornecido um método para aumentar produção desementes em plantas em relação à produção de sementes de plantas decontrole, o método compreendendo aumentar expressão em uma planta de umácido nucleico codificando um polipeptídeo de fator de transcrição PLT.
Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Um planta tendo uma taxa de crescimento aumentada podeainda exibir florescimento precoce. O aumento em taxa de crescimento podeocorrer em um ou mais estágios no ciclo de vida de uma planta ou durantesubstancialmente o ciclo de vida inteiro de planta. Taxa de crescimentoaumentada durante os estágios iniciais no ciclo de vida de uma planta podepermitir vigor melhorado (vigor aumentado de plântula em emergência). Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível. Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contrapartestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.
Desempenho dos métodos da invenção gera plantas tendo umataxa de crescimento aumentada. Portanto, de acordo com a presente invenção,é fornecido um método para aumentar a taxa de crescimento de plantas, cujométodo compreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT.
Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda característicasde produção melhoradas em relação a plantas de controle cultivadas emcondições comparáveis. Portanto, de acordo com a presente invenção, éfornecido um método para melhorar características de produção, em particularpara aumentar produção, em plantas cultivadas em condições de não estresseou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeode fator de transcrição PLT.
Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Exemplos de plantas de cultura típicas cultivadas para produção de óleoincluem soja, girassol, algodão, canola, amendoim ou palma. Exemplos deplantas de cultura típicas cultivadas para produção de amido incluem arroz,trigo, cevada, milho ou batata. Ainda preferivelmente, a planta é uma plantamonocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereaisincluem arroz, milho, trigo, cevada, milheto, centeio, triticale, sorgo e aveia.
O termo "polipeptídeo de fator de transcrição PLT" comodefinido neste lugar se refere a qualquer polipeptídeo compreendendo emordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90%, 95%,96%, 97%, 98% ou 99% de identidade de seqüência com o domínio AP2representado por SEQ ID NO: 191.
Preferivelmente o polipeptídeo de fator de transcrição PLT deescolha é um polipeptídeo de fator de transcrição PLT que em seu ambientegenético natural é essencialmente expresso nas raízes (partes abaixo do solo)da planta.
Ainda preferivelmente, o polipeptídeo de fator de transcriçãoPLT compreende ou um motivo mas preferivelmente tanto o motivo 1 comorepresentado por SEQ ID NO: 192 PK(V/L)(A/E)DFLG como o motivo 2como representado por SEQ ID NO: 209: (V/L)FX(M/V)WN(D/E),caracterizado pelo fato de que X pode ser qualquer aminoácido;preferivelmente motivo 2 tem a seqüência de SEQ ID NO: 193(V/L)F(T/S/N)(M/V)WN(D/E).
Exemplos de polipeptídeos de fator de transcrição PLTcompreendendo (i) em ordem crescente de preferência pelo menos 70%, 75%,80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüênciacom o domínio AP2 representado por SEQ ID NO: 191 são proteínasrepresentadas pelas seqüências dadas em Tabela I na seção de exemplos.
Exemplos preferidos são representados por SEQ ID NO: 176 e SEQ ED NO:178.
O domínio AP2 em um polipeptídeo de fator de transcriçãoPLT pode ser identificado usando bancos de dados especializados e.g.SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864;
Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al.,(2003) Nucl. Acids. Res. 31,315-318), Prosite (Bucher and Bairoch (1994), Ageneralized profile syntax for biomolecular sequences motifs and its funetionin automatic sequence interpretation. (In) ISMB-94; Proceedings 2ndInternational Conference on Intelligent Systems for Molecular Biology.
Altman R, Brutlag D., Karp P., Lathrop R, Searls D., Eds., pp53-61,AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137,
(2004)) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280(2002)). O domínio AP2 de um fator de transcrição PLT compreende duasrepetições Rl e R2, cada de cerca de 68 aminoácidos e separadas por umaregião ligante (Figura 13).
O domínio AP2 como representado por SEQ ID NO: 191 podeser identificado usando métodos para o alinhamento de seqüências paracomparação como descrito acima. Em algumas instâncias, os parâmetrospadrão podem ser ajustados para modificar a estringência da busca. Porexemplo usando BLAST, o limiar de significância estatística (chamado valoresperado") para relatar pareamentos contra seqüências de banco de dadospode ser aumentado para mostrar pareamentos menos estringentes. Destamaneira, pareamentos curtos praticamente exatos podem ser identificados,incluindo motivo 1 como representado por SEQ ID NO: 192 e motivo 2 comorepresentado por SEQ ID NO: 209, preferivelmente como representado porSEQ ID NO: 193.
Homólogos de um polipeptídeo de fator de transcrição PLTtambém podem ser usados para realizar os métodos de invenção. Homólogos(ou proteínas homólogas) podem ser prontamente identificados usandotécnicas de rotina bem conhecidas na arte, tal como por alinhamento deseqüências. Métodos para o alinhamento de seqüências para comparação sãobem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST,FASTA e TFASTA. GAP usa o algoritmo de Needleman and Wunsch ((1970)J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüênciascompletas que maximiza o número de pareamentos e minimiza o número delacunas. O algoritmo BLAST (Altschul et ai. (1990) J Mol Biol 215: 403-10)calcula identidade de seqüência percentual e realiza uma análise estatística dasimilaridade entre as duas seqüências. O aplicativo computacional pararealizar análise BLAST está publicamente disponível através do NationalCentre for Biotechnology Information. Homólogos podem ser prontamenteidentificados usando, por exemplo, o algoritmo de alinhamento de múltiplasseqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamentopareado, e um método de pontuação em porcentagem. Edição manualsecundária pode ser realizada para otimizar alinhamento entre motivosconservados, como seria evidente para uma pessoa versada na arte.
Homólogos também incluem ortólogos e parálogos. Ortólogose parálogos podem ser facilmente encontrados realizando uma assim chamadarealizar BLAST com uma seqüência de consulta (por exemplo, SEQ ID NO:175, SEQ ID NO: 176, SEQ ID NO: 177 ou SEQ ID NO: 178) contraqualquer banco de dados de seqüências, tal como o banco de dadospublicamente disponível de NCBI. BLASTN ou TBLASTX (usando valorespré-determinados padrão) podem ser usados ao iniciar de uma seqüência denucleotídeos e BLASTP ou TBLASTN (usando valores pré-determinadospadrão) podem ser usados ao iniciar de uma seqüência de proteínas. Osresultados de BLAST podem ser opcionalmente filtrados. As seqüências decomprimento completo ou dos resultados filtrados ou dos resultados nãofiltrados são então BLASTed de volta (segundo BLAST) contra seqüências doorganismo do qual a seqüência de consulta é derivada (onde a seqüência deconsulta é SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 177 ou SEQ IDNO: 178, o segundo BLAST deve portanto ser contra seqüências deArabidopsis thaliana). Os resultados do primeiro e segundo BLAST são entãocomparados. Um parálogo é identificado se um acerto de alto pontuação doprimeiro BLAST é da mesma espécie da qual a seqüência de consulta éderivada; um ortólogo é identificado se um acerto de alto pontuação não é damesma espécie da qual a seqüência de consulta é derivada. Acertos de altopontuação são aqueles tendo um baixo valor E. Quanto menor o valor E, maissignificante é o pontuação (ou em outras palavras menor a chance de que oacerto tenha sido encontrado ao acaso). Computação do valor E é bemconhecida na arte. No caso de famílias grandes, ClustalW pode ser usado,seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizaragrupamento de genes relacionados e para identificar ortólogos e parálogos.
Em adição a valores E, comparações também são pontuadas por identidadepercentual. Identidade percentual se refere ao número de nucleotídeos (ouaminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (oupolipeptídeos) comparadas ao longo de um comprimento particular.Homólogos de polipeptídeo de fator de transcrição PLT têm em ordemcrescente de preferência pelo menos 25%, 30%, 40%, 50%, 60%, 70%, 80%,85%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais identidade ou similaridadede seqüência (identidade funcional) com um polipeptídeo de fator detranscrição PLT não modificado como representado por SEQ ID NO: 176 ouSEQ ID NO: 178. Identidade percentual entre homólogos de polipeptídeo defator de transcrição PLT fora do domínio AP2 pelo que dizem é baixa.Preferivelmente5 homólogos de polipeptídeo de fator de transcrição PLTcompreendem um domínio AP2 com em ordem crescente de preferência pelomenos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% deidentidade de seqüência com o domínio AP2 representado por SEQ ID NO:191. Ainda preferivelmente, homólogos de polipeptídeo de fator detranscrição PLT são como representados por SEQ ID NO: 180, SEQ ED NO:182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ED NO: 200e SEQ ID NO: 202.
O polipeptídeo PLT pode ser um derivado de SEQ ED NO: 176ou SEQ ID NO: 178. "Derivados" incluem peptídeos, oligopeptídeos,polipeptídeos que podem, comparados com a seqüência de aminoácidos daforma naturalmente ocorrente da proteína, tal como aquela apresentada emSEQ ID NO: 176 ou SEQ ID NO: 178, compreender substituições deaminoácidos com resíduos de aminoácidos não naturalmente ocorrentes, ouadições de resíduos de aminoácidos não naturalmente ocorrentes. Derivadosde SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186,SEQ ID NO: 188, SEQ ID NO: 200 e SEQ ID NO: 202 são exemplosadicionais que podem ser adequados para uso nos métodos da invençãocontanto que eles tenham atividade biológica igual ou similar.
Além disso, polipeptídeos de fator de transcrição PLT (pelomenos em sua forma nativa) tipicamente têm atividade de ligação de DNA eum domínio de ativação. Uma pessoa versada na arte pode facilmentedeterminar a presença de um domínio de ativação e atividade de ligação deDNA usando técnicas e procedimentos de rotina. Proteínas interagindo compolipeptídeos de fator de transcrição PLT (como, por exemplo, em complexostranscricionais) podem ser facilmente identificadas usando técnicas padrãopor uma pessoa versada na arte.
Exemplos de ácidos nucleicos codificando polipeptídeos defator de transcrição PLT incluem mas não são limitados àqueles representadospor qualquer um de: SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179,SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187,SEQ ID NO: 199 e SEQ ID NO: 201. Variantes de ácidos nucleicoscodificando polipeptídeos de fator de transcrição PLT podem ser adequadaspara uso nos métodos da invenção contanto que elas tenham atividadebiológica igual ou similar. Variantes adequadas incluem porções de ácidosnucleicos codificando polipeptídeos de fator de transcrição PLT e/ou ácidosnucleicos capazes de hibridizar com ácidos nucleicos/genes codificandopolipeptídeos de fator de transcrição PLT. Variantes adicionais incluemvariantes de união e variantes alélicas de ácidos nucleicos codificandopolipeptídeos de fator de transcrição PLT.
O termo "porção" como definido neste lugar se refere a umpedaço de DNA codificando um polipeptídeo compreendendo em ordemcrescente de preferência pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%,97%, 98% ou 99% de identidade de seqüência com o domínio AP2representado por SEQ ID NO: 191. A porção pode compreenderadicionalmente ou um motivo mas preferivelmente tanto motivo 1 comorepresentado por SEQ ID NO: 192 e/ou motivo 2 como representado por SEQID NO: 209; preferivelmente, motivo 2 tem as seqüências como representadopor SEQ ID NO: 193.
Uma porção pode ser preparada, por exemplo, fazendo uma oumais deleções a um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT. As porções podem ser usadas em forma isolada ou elaspodem ser fusionadas a outras seqüências de codificação (ou não codificantes)a fim de, por exemplo, produzir uma proteína que combina diversasatividades. Quando fusionado a outras seqüências de codificação, opolipeptídeo resultante produzido mediante tradução pode ser maior do queaquele previsto para a porção de fator de transcrição PLT. Preferivelmente, aporção codifica para um polipeptídeo com substancialmente a mesmaatividade biológica que os polipeptídeos de fator de transcrição PLT de SEQID NO: 176 e SEQ ID NO: 178.
Preferivelmente, a porção é uma porção de um ácido nucleicocomo representado por qualquer uma das seqüências listadas em Tabela I dosExemplos. Mais preferivelmente a porção é uma porção de um ácido nucleicocomo representado por SEQ ID NO: 175 e SEQ ID NO: 177.
Outra variante de um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT5 útil nos métodos da presenteinvenção, é um ácido nucleico capaz de hibridizar em condições deestringência reduzida, preferivelmente em condições estringentes, com umasonda derivada do ácido nucleico como definido acima, cuja seqüência dehibridização codifica um polipeptídeo compreendendo em ordem crescente depreferência pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou99% de identidade de seqüência com o domínio AP2 representado por SEQID NO: 191. A seqüência de hibridização pode compreender adicionalmenteou um motivo mas preferivelmente tanto motivo 1 como representado porSEQ ID NO: 192 e/ou motivo 2 como representado por SEQ ID NO: 209,preferivelmente como representado por SEQ ID NO: 193.
Preferivelmente, a seqüência de hibridização é uma que écapaz de hibridizar com um ácido nucleico como representado por (ou comsondas derivadas de) qualquer uma das seqüências listadas em Tabela I dosExemplos, ou com uma porção de qualquer das Seqüências mencionadasacima (a seqüência alvo). Mais preferivelmente a seqüência de hibridização écapaz de hibridizar com SEQ ID NO: 175 ou com SEQ ID NO: 177 (ou comsondas derivadas desta). Sondas geralmente são de menos do que 1000 bp decomprimento, preferivelmente menos do que 500 bp de comprimento.Comumente, comprimentos de sondas para hibridizações DNA-DNA talcomo Southern blotting, variam entre 100 e 500 bp, ao passo que a regiãohibridizante em sondas para hibridizações DNA-DNA tal como emamplificação por PCR geralmente são menores do que 50 mas maiores do quenucleotídeos.
O polipeptídeo de fator de transcrição PLT pode ser codificadopor uma variante de processamento. O termo "variante de processamento"como usado neste lugar abrange variantes de uma seqüência de ácidosnucleicos na qual íntrons e/ou éxons selecionados foram cortados,substituídos, deslocados ou adicionados, ou na qual íntrons foram encurtadosou alongados. Tais variantes serão umas nas quais a atividade biológicasubstancial da proteína é mantida, o que pode ser atingido retendoseletivamente segmentos funcionais da proteína. Tais variantes de uniãopodem ser encontradas na natureza ou podem ser feitas pelo homem. Métodospara fazer tais variantes de união são bem conhecidos na arte.
Variantes de união preferidas são variantes de união do ácidonucleico codificando um polipeptídeo de fator de transcrição PLTcompreendendo em ordem crescente de preferência pelo menos 70%, 75%,80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüênciacom o domínio AP2 representado por SEQ ID NO: 191. Variantes de uniãopodem compreender adicionalmente ou um motivo mas preferivelmente tantomotivo 1 como representado por SEQ ID NO: 192 e/ou motivo 2 comorepresentado por SEQ ID NO: 209, preferivelmente como representado por
SEQ ID NO: 193.
Variantes de união adicionalmente preferidas de ácidosnucleicos codificando polipeptídeos de fator de transcrição PLTcompreendendo características como definidas acima são variantes de uniãode um ácido nucleico como representado por qualquer uma das seqüênciaslistadas em Tabela I dos Exemplos. Mais preferido é uma variante deprocessamento de uma seqüência de ácidos nucleicos como representada porSEQ ID NO: 175 e SEQ ID NO: 177.O polipeptídeo de fator de transcrição PLT também pode sercodificado por uma variante alélica de um ácido nucleico codificando umpolipeptídeo compreendendo em ordem crescente de preferência pelo menos70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade deseqüência com o domínio AP2 representado por SEQ ID NO: 191. A variantealélica pode compreender adicionalmente ou um motivo mas preferivelmentetanto motivo 1 como representado por SEQ ED NO: 192 e/ou motivo 2 comorepresentado por SEQ ID NO: 209, preferivelmente como representado porSEQ ID NO: 193.
Variantes alélicas preferidas de ácidos nucleicos codificandopolipeptídeos de fator de transcrição PLT compreendendo característicascomo definidas acima são variantes de união de um ácido nucleico comorepresentado por qualquer uma das seqüências listadas em Tabela I dosExemplos. Mais preferido é uma variante alélica de uma seqüência de ácidosnucleicos como representada por SEQ ID NO: 175 e SEQ ID NO: 177.
O aumento em expressão de um ácido nucleico codificandoum polipeptídeo de fator de transcrição PLT leva a níveis aumentados depolipeptídeo ou mRNA correspondente, o que pode se igualar a atividadeaumentada do polipeptídeo de fator de transcrição PLT; ou a atividadetambém pode ser aumentada quando não há nenhuma mudança em níveis depolipeptídeo, ou mesmo quando há uma redução em níveis de polipeptídeo.Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo sãoalteradas, por exemplo, fazendo versões mutantes que são mais ativas do queo polipeptídeo tipo selvagem.
Evolução dirigida (ou embaralhamento gênico) pode ser usadapara gerar variantes de ácidos nucleicos codificando polipeptídeos de fator detranscrição PLT. Isto consiste de repetições de embaralhamento de DNAseguido por triagem e/ou seleção apropriada para gerar variantes de ácidosnucleicos ou porções destes codificando polipeptídeos de fator de transcriçãoPLT ou homólogos ou porções destes tendo uma atividade biológicamodificada (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).
Mutagênese dirigida a sítio pode ser usada para gerar variantesde ácidos nucleicos codificando polipeptídeos de fator de transcrição PLT.Estão disponíveis diversos métodos para atingir mutagênese dirigida a sítio, omais comum sendo métodos baseados em PCR (current protocols inmolecular biology. Wiley Eds.).
Evolução dirigida e mutagênese dirigida a sítio são exemplosde tecnologias que possibilitam a geração de variantes de ácidos nucleicoscodificando polipeptídeos de fator de transcrição PLT com atividademodificada úteis para realizar os métodos da invenção.
Ácidos nucleicos codificando polipeptídeos de fator detranscrição PLT podem ser derivados de qualquer fonte natural ou artificial. Oácido nucleico pode ser modificado a partir de sua forma nativa emcomposição e/ou ambiente genômico através de deliberada manipulaçãohumana. Preferivelmente o ácido nucleico de fator de transcrição PLT é deuma planta, preferivelmente de uma planta dicotiledônea, aindapreferivelmente da família Brassicaceae, mais preferivelmente do gêneroArabidopsis, mais preferivelmente o ácido nucleico é de Arabidopsisthaliana.
Os métodos da invenção se fiam em expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcrição PLTem uma planta. O ácido nucleico pode ser um ácido nucleico de comprimentocompleto ou pode ser uma porção ou uma seqüência de hibridização ou outravariante de ácido nucleico como definido acima.
Os métodos da invenção se fiam em expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcrição PLTem uma planta.A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão em uma planta das seqüências deácidos nucleicos úteis nos métodos de acordo com a invenção.
Portanto, é fornecida uma construção gênica compreendendo:(i) Um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT como definido acima;
(ii) Uma ou mais seqüências de controle, das quais pelo menosuma é um promotor constitutivo de meia força.
Construções úteis nos métodos de acordo com a presenteinvenção podem ser construídas usando tecnologia de DNA recombinantebem conhecida por pessoas versadas na arte. As construções gênicas podemser inseridas em vetores, que podem estar disponíveis comercialmente,adequados para transformação em plantas e adequados para expressão dogene de interesse nas células transformadas. A invenção portanto fornece uso de uma construção gênica como definido acima nos métodos da invenção.
Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeode fator de transcrição PLT). O artesão versado é bem ciente dos elementosgenéticos que devem estar presentes no vetor a fim de transformar comsucesso, selecionar e propagar células hospedeiras contendo a seqüência deinteresse. A seqüência de interesse é operacionalmente ligada a uma ou maisseqüências de controle (pelo menos a um promotor).
O ácido nucleico codificando um polipeptídeo de fator detranscrição PLT ou variante deste é operacionalmente ligado a um promotorconstitutivo, preferivelmente um promotor constitutivo de meia força. Umpromotor constitutivo é transcricionalmente ativo durante a maioria, mas nãonecessariamente todas, fases de seu crescimento e desenvolvimento e ésubstancialmente ubiquamente expresso em níveis moderados. Força depromotor e/ou padrão de expressão podem ser analisados como descrito naseção de definições. A força de promotor e/ou padrão de expressão podem serpor exemplo comparados com aqueles de um promotor de referência preferidopor parte aérea bem caracterizado, tal como o promotor Cab27 (expressãofraca, GenBank AP004700) ou o promotor putativo de protoclorofilidaredutase (expressão forte, GenBank AL606456). Preferivelmente o promotorusado nos métodos da presente invenção é derivado de uma planta, aindapreferivelmente uma planta monocotiledônea. Mais preferido é uso de umpromotor GOS2 (de arroz) (SEQ ID NO: 194 ou alternativamente SEQ IDNO: 210). Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico representado por SEQ ID NO: 175 ou SEQ ID NO:177, nem é a aplicabilidade da invenção restrita a expressão de um ácidonucleico codificando um polipeptídeo de fator de transcrição PLT quandodirigida por um promotor GOS2. Exemplos de outros promotoresconstitutivos que também podem ser usados para dirigir expressão de umácido nucleico codificando um polipeptídeo de fator de transcrição PLT sãomostrados na seção de definições.
Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta. Elementos reguladores adicionais podem incluiracentuadores transcricionais assim como traducionais. Aqueles versados naarte estarão cientes de seqüências terminadoras e acentuadoras que podem seradequadas para uso para realizar a invenção. Outras seqüências de controle(além de promotor, acentuador, silenciador, seqüências de íntrons, regiões3'UTR e/ou 5'UTR) podem ser proteína e/ou agentes estabilizantes de RNA.Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas poruma pessoa versada na arte.
As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl. A construção genética pode opcionalmentecompreender um gene marcador selecionável.
A presente invenção também abrange plantas viáveis pelosmétodos de acordo com a presente invenção. A presente invenção portantofornece plantas, partes vegetais ou células de planta destas viáveis pelométodo de acordo com a presente invenção, cujas plantas ou partes ou célulasdestas compreendem um transgene de ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT sob o controle de um promotorconstitutivo, preferivelmente um promotor constitutivo não viral.
A invenção também fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, compreendendo introdução e expressão preferencial de um ácidonucleico codificando um polipeptídeo de fator de transcrição PLT em umaplanta.
Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada cujométodo compreende:
(i) introduzir e expressar um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT em uma planta; e
(ii) cultivar a célula vegetal em condições que promovemcrescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira. Seguindo transferência de DNA eregeneração, plantas putativamente transformadas podem ser avaliadas, porexemplo usando análise Southern, para a presença do gene de interesse,número de cópias e/ou organização genômica. Alternativamente ouadicionalmente, níveis de expressão do DNA recentemente introduzidopodem ser monitorados usando análise Northern e/ou Western, ou PCRquantitativo, todas as técnicas sendo bem conhecidas por pessoas tendohabitual verso na arte.
As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos detecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estendeadicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordocom a invenção.
A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um polipeptídeo de fator de transcriçãoPLT. Células hospedeiras preferidas de acordo com a invenção são células deplanta.
A invenção além disso se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.
A presente invenção também abrange uso de ácidos nucleicoscodificando polipeptídeos de fator de transcrição PLT e uso de polipeptídeosde fator de transcrição PLT para aumentar produção vegetal como definidoacima nos métodos da invenção.
A expressão aumentada de um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT pode ser realizada introduzindo umamodificação genética (preferivelmente no locus de um gene de fator detranscrição PLT). O locus de um gene como definido neste lugar é adotadopara significar uma região genômica, que inclui o gene de interesse e IOKBantes ou depois da região de codificação.
A modificação genética pode ser introduzida por métodosalternativos como aquele descrito acima, por exemplo, por qualquer um (oumais) dos seguintes: ativação de T-DNA, TILLING e recombinaçãohomóloga. Seguindo introdução da modificação genética, segue uma etapaopcional de selecionar para expressão aumentada de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT3 cuja expressãoaumentada gera plantas tendo produção aumentada.
Identificação por ativação de T-DNA resulta em plantastransgênicas que mostram fenótipos dominantes devido a expressãomodificada de genes próximos ao promotor introduzido. O promotor a serintroduzido um promotor constitutivo de meio força capaz de aumentarexpressão do ácido nucleico codificando um polipeptídeo de fator detranscrição PLT em uma planta.
Uma modificação genética também pode ser introduzida nolocus de um gene codificando um polipeptídeo de fator de transcrição PLTusando a técnica de TILLING (Lesões Locais Induzidas Dirigidas emGenomas).
Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga. O ácido nucleico a ser introduzido (quepode ser um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT ou variante deste como definido acima) é direcionado para olocus de um gene PLT. O ácido nucleico a ser direcionado pode ser um alelomelhorado usado para substituir o gene endógeno ou pode ser introduzido emadição ao gene endógeno.
Ativação de T-DNA, TILLING e recombinação homóloga sãoexemplos de tecnologias que possibilitam a geração de modificaçõesgenéticas compreendendo aumentar expressão de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT em plantas.
Ácidos nucleicos codificando polipeptídeos de fator detranscrição PLT, ou polipeptídeos de fator de transcrição PLT, podemencontrar uso em programas de melhoramento nos quais é identificado ummarcador de DNA que pode ser geneticamente ligado a um gene de fator detranscrição PLT. Os ácidos nucleicos/genes, ou os polipeptídeos de fator detranscrição PLT podem ser usados para definir um marcador molecular. Estemarcador de DNA ou proteína pode então ser usado em programas demelhoramento para selecionar plantas tendo produção aumentada comodefinido acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene de fator detranscrição PLT também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.
Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.
Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.
Um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT também pode ser usado como sondas para mapeargeneticamente e fisicamente os genes dos quais elas são uma parte de, e comomarcadores para características ligadas a tais genes. Tal informação pode serútil em melhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos de fator de transcrição PLT requerapenas uma seqüência de ácidos nucleicos de pelo menos 15 nucleotídeos decomprimento. Os ácidos nucleicos de fator de transcrição PLT podem serusados como marcadores de polimorfismo de comprimento de fragmento derestrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T(1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetaldigerido por restrição podem ser sondados com os ácidos nucleicos de fatorde transcrição PLT. O padrão de bandeamento resultante pode então sersujeito a análises genéticas usando programas computacionais tal comoMapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir ummapa genético. Em adição, os ácidos nucleicos podem ser usados para sondarSouthern blots contendo DNAs genômicos tratados com endonuclease derestrição de um conjunto de indivíduos representando ancestral e progênie deum cruzamento genético definido. Segregação dos polimorfismos de DNA éobservada e usada para calcular a posição do ácido nucleico de fator detranscrição PLT no mapa genético previamente obtido usando esta população(Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley (1986)Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas, e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas paramapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.
Os métodos de acordo com a presente invenção resultam emplantas tendo produção aumentada, como descrito acima. Esta produçãoaumentada também pode ser combinada com outras característicaseconomicamente vantajosas, tal como características acentuadoras deprodução adicionais, tolerância a outros estresses abióticos e bióticos,características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.
Descrição detalhada de bHLHSurpreendentemente, foi descoberto agora que modularexpressão em uma planta de um ácido nucleico codificando uma classeparticular de fator de transcrição bHLH gera plantas tendo características deprodução melhoradas em relação a plantas de controle. A classe particular defator de transcrição bHLH adequada para melhorar características deprodução em plantas é descrita em detalhe abaixo.
A presente invenção fornece um método para melhorarcaracterísticas de produção em plantas em relação a plantas de controle,compreendendo modular expressão em uma planta de um ácido nucleicocodificando uma classe particular de fator de transcrição bHLH.
Um método preferido para modular (preferivelmente,aumentar) expressão de um ácido nucleico codificando um fator detranscrição bHLH é introduzir e expressar em uma planta um ácido nucleicocodificando uma classe particular de fator de transcrição bHLH comoadicionalmente definido abaixo.
O ácido nucleico a ser introduzido em uma planta (e portantoútil para realizar os métodos da invenção) é qualquer ácido nucleicocodificando o tipo de fator de transcrição bHLH que será agora descrito. Umfator de transcrição bHLH como definido neste lugar se refere a umpolipeptídeo representado por qualquer um de SEQ ID NO 213, SEQ ID NO215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297,SEQ ID NO: 299 e SEQ ID NO: 301. A invenção é ilustrada transformandoplantas com as seqüências de Oryza sativa representadas por SEQ ID NO:212, codificando o polipeptídeo de SEQ ID NO: 213. SEQ ID NO: 215 deOryza sativa (codificado por SEQ ID NO: 214) e SEQ ID NO: 217 de Oryzasativa (codificado por SEQ ID NO: 216) são parálogos do polipeptídeo deSEQ ID NO: 213. SEQ ID NO: 219 de Arabidopsis thaliana (codificado porSEQ ID NO: 218) e SEQ ID NO: 225 de Arabidopsis thaliana (codificado porSEQ ID NO: 224) são ortólogos do polipeptídeo de SEQ ID NO: 213. SEQID NO: 221 de Arabidopsis thaliana (codificado por SEQ ID NO: 220) e SEQID NO: 223 de Arabidopsis thaliana (codificado por SEQ ID NO: 222) sãovariantes de SEQ ID NO: 218 e SEQ ID NO: 219.
Ortólogos e parálogos podem ser facilmente encontradosrealizando uma assim chamada busca blast recíproca. Tipicamente istoenvolve um primeiro BLAST envolvendo realizar BLAST com umaseqüência de consulta (por exemplo, SEQ ID NO: 212, SEQ ID NO: 213,SEQ ID NO: 214, SEQ ID NO: 215, SEQ LD NO: 216, SEQ ID NO: 217,SEQ ID NO: 218, SEQ ID NO: 219, SEQ ID NO: 224 ou SEQ ID NO: 225)contra qualquer banco de dados de seqüências, tal como o banco de dadospublicamente disponível de NCBI. BLASTN ou TBLASTX (usando valorespré-determinados padrão) geralmente são usados ao iniciar de uma seqüênciade nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinadospadrão) ao iniciar de uma seqüência de proteínas. Os resultados de BLASTpodem ser opcionalmente filtrados. As seqüências de comprimento completoou dos resultados filtrados ou dos resultados não filtrados são então BLASTedde volta (segundo BLAST) contra seqüências do organismo do qual aseqüência de consulta é derivada (onde a seqüência de consulta é SEQ IDNO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ IDNO: 216 ou SEQ ID NO: 217, o segundo BLAST deve portanto ser contraseqüências de Oryza; onde a seqüência de consulta é SEQ ID NO: 218, SEQID NO: 219, SEQ ID NO: 224 ou SEQ ID NO: 225, o segundo BLAST deveportanto ser contra seqüências de Arabidopsis). Os resultados do primeiro esegundo BLAST são então comparados. Um parálogo é identificado se umacerto de alto pontuação do primeiro BLAST é da mesma espécie da qual aseqüência de consulta é derivada, um BLAST de retorno então idealmenteresulta na seqüência de consulta como maior acerto; um ortólogo éidentificado se um acerto de alto pontuação no primeiro BLAST não é damesma espécie que da qual a seqüência de consulta é derivada, epreferivelmente resulta mediante BLAST de retorno na seqüência de consultaestando entre os maiores acertos.
Acertos de alto pontuação são aqueles tendo um baixo valor E.Quanto menor o valor E, mais significante é o pontuação (ou em outraspalavras menor a chance de que o acerto tenha sido encontrado ao acaso).Computação do valor E é bem conhecida na arte. Em adição a E-values,comparações também são pontuadas por identidade percentual. Identidadepercentual se refere ao número de nucleotídeos (ou aminoácidos) idênticosentre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadasao longo de um comprimento particular. Preferivelmente o pontuação é maiordo que 50, mais preferivelmente maior do que 100; e preferivelmente o valor
E é menor do que e-5, mais preferivelmente menos do que e-6. Um exemplodetalhando a identificação de ortólogos e parálogos é dado em Exemplo 31 eExemplo 30 respectivamente neste lugar. No caso de famílias grandes,ClustalW pode ser usado, seguido por uma árvore de agrupamento devizinhos, para ajudar a visualizar agrupamento de genes relacionados e paraidentificar ortólogos e parálogos.
Exemplos de ortólogos obtidos pelo procedimento de BLASTmencionado acima são SEQ ID NO: 227 de Medicago truncatula (codificadopor SEQ ID NO: 226) e SEQ ID NO: 229 de Hordeum vulgare (codificadopor SEQ ID NO: 228). Ortólogos e parálogos adicionais podem serprontamente identificados usando o procedimento de BLAST descrito acima eseguindo o procedimento dado na seção de exemplos.
As proteínas representadas por SEQ ID NO: 297, 299 e 301eram até agora desconhecidas. Portanto, a invenção também fornece fatoresde transcrição bHLH até agora desconhecidos e ácidos nucleicos codificandofator de transcrição bHLH.
De acordo com uma forma de realização adicional da presenteinvenção, portanto é fornecida uma molécula isolada de ácido nucleicocompreendendo:
(i) um ácido nucleico representado por qualquer um de SEQID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;
(ii) o complemento de um ácido nucleico representado porqualquer um de SEQ ID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;
(iii)um ácido nucleico codificando um fator de transcriçãobHLH tendo (a) em ordem crescente de preferência, pelo menos 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou maisidentidade de seqüência com a seqüência de aminoácidos representada porqualquer uma de SEQ ID NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301, e(b) um domínio bHLH.
De acordo com uma forma de realização adicional da presenteinvenção, também é fornecido um polipeptídeo isolado compreendendo:
(i) uma seqüência de aminoácidos representada por qualqueruma de SEQ ID NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301;
(ii) uma seqüência de aminoácidos tendo (a) em ordemcrescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%,85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais identidade de seqüência comqualquer uma das seqüências de aminoácidos representadas por SEQ ID NO:297, SEQ ID NO: 299 e SEQ ID NO: 301, e (b) um domínio bHLH.;
(iii) derivados de qualquer das seqüências de aminoácidosdadas em (i) ou (ii) acima.
Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO221, SEQ ID NO 223, SEQ ID NO 225, SEQ ID NO: 227, SEQ ID NO: 229,SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, todoscompreendem um domínio bHLH.
Domínios bHLH são bem conhecidos na arte e podem serprontamente identificados por pessoas versadas na arte. A família é definidapor um domínio de assinatura bHLH, que consiste de 60 ou mais aminoácidoscom duas regiões funcionalmente distintas. Uma região básica, localizada naextremidade N-terminal do domínio, está envolvida em ligação de DNA econsiste de 15 ou mais aminoácidos com um número alto de resíduos básicos.Uma região HLH, na extremidade C-terminal, funciona como um domínio dedimerização e compreende principalmente resíduos hidrofóbicos que formamduas hélices alifáticas separadas por uma região de alça de seqüência ecomprimento variáveis.
Um domínio bHLH pode ser identificado usando métodos parao alinhamento de seqüências para comparação. Em algumas instâncias,parâmetros padrão podem ser ajustados para modificar a estringência dabusca. Por exemplo usando BLAST, o limiar de significância estatística(chamado valor E) para relatar pareamentos contra seqüências de banco dedados pode ser aumentado para mostrar pareamentos menos estringentes.Desta maneira, pareamentos curtos praticamente exatos podem seridentificados.
Métodos para o alinhamento de seqüências para comparaçãosão bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST,FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) JMol Biol 48: 443-453) para encontrar o alinhamento global (ao longo de todaa seqüência) de duas seqüências que maximiza o número de pareamentos eminimiza o número de lacunas. O algoritmo BLAST (Altschul et ai. (1990) JMol Biol 215: 403-10) calcula identidade de seqüência percentual e realizauma análise estatística da similaridade entre as duas seqüências. O aplicativocomputacional para realizar análise BLAST está publicamente disponívelatravés do National Centre for Biotechnology Information (NCBI).Homólogos podem ser prontamente identificados usando, por exemplo, oalgoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83),com os parâmetros padrão de alinhamento pareado, e um método depontuação em porcentagem. Edição manual secundária pode ser realizadapara otimizar alinhamento entre motivos conservados, como seria evidentepara uma pessoa versada na arte.
Também existem bancos de dados especialistas para aidentificação de domínios. O domínio bHLH em um fator de transcriçãobHLH pode ser identificado usando, por exemplo, SMART (Schultz et al.(1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002)Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids.Res. 31,315-318), Prosite (Bucher and Bairoch (1994), A generalized profilesyntax for biomolecular sequences motifs and its funetion in automaticsequence interpretation. (In) ISMB-94; Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology. Altman R., BrutlagD., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park;Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)) ou Pfam (Bateman etal., Nucleic Acids Research 30(1): 276-280 (2002)). A estrutura de domínioHLH no banco de dados InterPro é designada IPROO1092 e IPROl 1598;PFOOO10 no banco de dados Pfam; SM00353 no banco de dados SMART ePS50888 no banco de dados PROSITE. Além disso, o alinhamento mostradoem Figura 18 destaca o domínio bHLH de fator de transcrição bHLHs útil nosmétodos da invenção.
Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, tipicamenteexibem considerável divergência de seqüências fora do domínio bHLHconservado.
Figura 19a é uma matriz mostrando as similaridades eidentidades gerais (em negrito) das proteínas tipo bHLH descritas acima.Mesmo embora as identidades pareçam ser relativamente baixas,polipeptídeos tendo identidade de seqüência caindo dentro das variaçõesmostradas na matriz podem ser adotados como sendo ortólogos ou parálogosde qualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219 ou SEQ LD NO 225; isto pode ser confirmado pelo procedimento deblast recíproco descrito acima. Tipicamente, ácidos nucleicos codificandofatores de transcrição bHLH úteis nos métodos da invenção têm, em ordemcrescente de preferência, pelo menos 13%, 15%, 20%, 25%, 30%, 35%, 40%,45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou maisidentidade de seqüência com os fatores de transcrição bHLH representadospor qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217,SEQ ID NO: 219 ou SEQ ID NO 225.
A matriz mostrada em Figura 19b mostra similaridades eidentidades (em negrito) ao longo do domínio bHLH, onde certamente osvalores são maiores do que quando considerando proteínas de comprimentocompleto. Tipicamente, ácidos nucleicos codificando fatores de transcriçãobHLH úteis nos métodos da invenção têm domínios bHLH tendo, em ordemcrescente de preferência, pelo menos 25%, 30%, 35%, 40%, 45%, 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou mais identidade de seqüênciacom o domínio bHLH de qualquer um dos polipeptídeos representados porqualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219 ou SEQ ID NO 225.
Um padrão de aminoácidos, denominado uma configuração 5-9-13, pode ser encontrado em três posições dentro da região básica dodomínio bHLH (veja Fig. 4 de Heim et al., 2003 (Mol. Biol. Evol. 20(5):735-747) e Figura 18 neste lugar onde três setas apontando para cima mostram aconfiguração). Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ouparálogos de qualquer das SEQ ED NOs mencionadas acima, compreendempreferivelmente uma configuração K/R ER5 mais preferivelmente umaconfiguração RER5 dentro do domínio bHLH, tipicamente dentro da regiãobásica do domínio. A presença desta configuração não é um pré-requisito pararealizar os métodos da invenção, portanto alguma variação na configuraçãoK/R ER é aceitável. Polipeptídeos bHLH de Arabidopsis foram agrupados emdoze subfamílias de acordo com similaridades estruturais (veja Fig. 4 de Heimet al., 2003). Membros de grupo IX constituem polipeptídeos bHLH tendouma configuração RER. Além disso, um membro de Grupo VI compreendeuma configuração RER.
Os polipeptídeos representados por qualquer um de SEQ IDNO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, também podemcompreender (em adição a um domínio bHLH e opcionalmente um motivoK/R ER 5-9-13, preferivelmente um motivo RER) um domínio designadoPFB26111 (veja banco de dados Pfam). O domínio também é indicado emFigura 18.
Tipicamente, ácidos nucleicos codificando fatores detranscrição bHLH (como definido acima) tendo um domínio bHLH e tendo,em ordem crescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%,75%, 80%, 85%, 90%, 95% ou mais identidade de seqüência com o domínioPFB26111 (veja Figura 18) de qualquer um dos polipeptídeos representadospor qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217,SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, ouSEQ ID NO: 301 são úteis nos métodos da invenção.
Ácidos nucleicos codificando os polipeptídeos representadospor qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217,SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQID NO: 301, ou ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima, não precisam ser ácidos nucleicos de comprimentocompleto, uma vez que desempenho dos métodos da invenção não se fia nouso de seqüências de ácidos nucleicos de comprimento completo. Exemplosde ácidos nucleicos adequados para uso para realizar os métodos da invençãoincluem mas não são limitados àqueles representados por qualquer um de:SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218,SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226,SEQ ID NO: 228, SEQ ID NO: 296, SEQ ID NO: 298, e SEQ ID NO: 300.Variantes de ácidos nucleicos também podem ser úteis para praticar osmétodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluemporções de ácidos nucleicos codificando um fator de transcrição bHLH comodefinido neste lugar, variantes de união de ácidos nucleicos codificando umfator de transcrição bHLH como definido neste lugar, variantes alélicas deácidos nucleicos codificando um fator de transcrição bHLH como definidoneste lugar e variantes de ácidos nucleicos codificando um fator detranscrição bHLH como definido neste lugar que são obtidas porembaralhamento gênico. Os termos porção, variante de processamento,variante alélica e embaralhamento gênico serão agora descritos.
Uma porção de um ácido nucleico codificando um fator detranscrição bHLH como definido neste lugar pode ser preparada, porexemplo, fazendo uma ou mais deleções ao ácido nucleico. As porções podemser usadas em forma isolada ou elas podem ser fusionadas a outras seqüênciasde codificação (ou não codificantes) a fim de, por exemplo, produzir umaproteína que combina diversas atividades. Quando fusionado a outrasseqüências de codificação, o polipeptídeo resultante produzido mediantetradução pode ser maior do que aquele previsto para a porção de fator detranscrição bHLH.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma porção de um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer de SEQID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ IDNO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, ou umaporção de um ácido nucleico codificando ortólogos, parálogos ou homólogosde qualquer das SEQ ID NOs mencionadas acima.
Porções úteis nos métodos da invenção, codificam umpolipeptídeo tendo um domínio bHLH (como descrito acima) e tendosubstancialmente a mesma atividade biológica que o fator de transcriçãobHLH representado por qualquer de SEQ ID NO 213, SEQ ID NO 215, SEQID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ IDNO: 299, SEQ ID NO: 301, ou ortólogos ou parálogos de qualquer das SEQID NOs mencionadas acima. A porção é tipicamente de pelo menos 150nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 300nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos400 nucleotídeos consecutivos de comprimento e mais preferivelmente pelomenos 500 nucleotídeos consecutivos de comprimento. Preferivelmente, aporção é uma porção de um ácido nucleico como representado por qualquerum de SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO:218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO:226, SEQ ID NO: 228, SEQ ID NO: 296, SEQ ID NO: 298, e SEQ ID NO:300. Mais preferivelmente a porção é uma porção de um ácido nucleico comorepresentado por SEQ ID NO: 212.
Outra variante de ácido nucleico útil nos métodos da invenção,é um ácido nucleico capaz de hibridizar em condições de estringênciareduzida, preferivelmente em condições estringentes, com um ácido nucleicocodificando um fator de transcrição bHLH como definido neste lugar, ou comuma porção como definido neste lugar.Seqüências de hibridização úteis nos métodos da invenção,codificam um polipeptídeo tendo um domínio bHLH (como descrito acima) etendo substancialmente a mesma atividade biológica que o fator detranscrição bHLH representado por qualquer de SEQ ID NO 213, SEQ ED NO215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ED NO 225, SEQ ID NO: 297,SEQ ID NO: 299, SEQ ID NO: 301 ou tendo substancialmente a mesmaatividade biológica que ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima. A seqüência de hibridização é tipicamente de pelo menos150 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos300 nucleotídeos consecutivos de comprimento, mais preferivelmente pelomenos 400 nucleotídeos consecutivos de comprimento e mais preferivelmentepelo menos 500 nucleotídeos consecutivos de comprimento. Preferivelmente,a seqüência de hibridização é uma que é capaz de hibridizar com qualquer dosácidos nucleicos representados por SEQ ID NO: 212, SEQ ID NO: 214, SEQID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ IDNO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 296, SEQ IDNO: 298, e SEQ ID NO: 300 ou com uma porção de qualquer das Seqüênciasmencionadas acima, uma porção sendo como definido acima. Maispreferivelmente a seqüência de hibridização é capaz de hibridizar com umácido nucleico como representado por SEQ ID NO: 212, ou com porçõesdeste.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta um ácido nucleico capaz de hibridizarcom um ácido nucleico codificando um fator de transcrição bHLHrepresentado por qualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO:217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299,SEQ ID NO: 301, ou compreendendo introduzir e expressar em uma plantaum ácido nucleico capaz de hibridizar com um ácido nucleico codificando umortólogo, parálogo ou homólogo de qualquer das SEQ ID NOs mencionadasacima.
Outra variante de ácido nucleico útil nos métodos da invençãoé uma variante de processamento codificando um fator de transcrição bHLHcomo definido acima.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de processamento de umácido nucleico codificando um fator de transcrição bHLH representado porqualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, and SEQ IDNO: 301, ou uma variante de processamento de um ácido nucleicocodificando um ortólogo, parálogo ou homólogo de qualquer das SEQ IDNOs mencionadas acima.
Variantes de união preferidas são variantes de união de umácido nucleico codificando fator de transcrição bHLH representado porqualquer de SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ IDNO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, e SEQ IDNO: 301, ou variantes de união codificando ortólogos ou parálogos dequalquer das SEQ ID NOs mencionadas acima. Ademais preferidas sãovariantes de união de ácidos nucleicos representados por qualquer um de SEQID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ IDNO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ IDNO: 228, SEQ ID NO: 296, SEQ ID NO: 298, e SEQ ID NO: 300. Maispreferido é uma variante de processamento de um ácido nucleico comorepresentado por SEQ ID NO: 212.
Outra variante de ácido nucleico útil para realizar os métodosda invenção é uma variante alélica de um ácido nucleico codificando um fatorde transcrição bHLH como definido acima.De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante alélica de um ácidonucleico codificando um fator de transcrição bHLH representado por qualquerde SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, e SEQ ID NO: 301, oucompreendendo introduzir e expressar em uma planta uma variante alélica deum ácido nucleico codificando um ortólogo, parálogo ou homólogo dequalquer das SEQ ID NOs mencionadas acima.
A variante alélica pode ser uma variante alélica de um ácidonucleico codificando um fator de transcrição bHLH representado por qualquerde SEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219,SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, e SEQ ID NO: 301, ouuma variante alélica de um ácido nucleico codificando ortólogos ou parálogosde qualquer das SEQ ID NOs mencionadas acima. Ademais preferidas sãovariantes alélicas de ácidos nucleicos representados por qualquer um de SEQID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ IDNO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226 e SEQ IDNO: 228, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300. Maispreferido é uma variante alélica de um ácido nucleico como representado porSEQ ID NO: 212.
Uma variante de ácido nucleico adicional útil nos métodos dainvenção é uma variante de ácido nucleico obtida por embaralhamentogênico. Embaralhamento gênico ou evolução dirigida também pode ser usadapara gerar variantes de ácidos nucleicos codificando fatores de transcriçãobHLH como definido acima.
De acordo com a presente invenção, é fornecido um métodopara melhorar características de produção em plantas, compreendendointroduzir e expressar em uma planta uma variante de um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer de SEQID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ IDNO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ e ID NO: 301, oucompreendendo introduzir e expressar em uma variante de um ácido nucleicocodificando um ortólogo, parálogo ou homólogo de qualquer das SEQ IDNOs mencionadas acima, cujo ácido nucleico é obtido por embaralhamentogênico.
Além disso, variantes de ácidos nucleicos também podem serobtidas por mutagênese dirigida a sítio. Estão disponíveis diversos métodospara atingir mutagênese dirigida a sítio, o mais comum sendo métodosbaseados em PCR (current protocols in molecular biology. Wiley Eds.).
Também úteis nos métodos da invenção são ácidos nucleicoscodificando homólogos de qualquer um dos aminoácidos representados porSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima.
Também úteis nos métodos da invenção são ácidos nucleicoscodificando derivados de qualquer um dos aminoácidos representados porSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima.Derivados de SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ IDNO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227 e SEQ IDNO: 229, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 sãoexemplos adicionais que podem ser adequados para uso nos métodos dainvenção
Além disso, fatores de transcrição bHLH (pelo menos em suaforma nativa) tipicamente têm atividade de ligação de DNA e um domínio deativação. Uma pessoa versada na arte pode facilmente determinar a presençade um domínio de ativação e atividade de ligação de DNA usandoferramentas e técnicas de rotina.
Ácidos nucleicos codificando fatores de transcrição bHLHpodem ser derivados de qualquer fonte natural ou artificial. O ácido nucleicopode ser modificado a partir de sua forma nativa em composição e/ouambiente genômico através de deliberada manipulação humana.
Preferivelmente o ácido nucleico codificando fator de transcrição bHLH é deuma planta, ainda preferivelmente de uma monocotiledônea, maispreferivelmente da família Poaceae, mais preferivelmente o ácido nucleico éde Oryza sativa.
Qualquer referência neste lugar a um fator de transcriçãobHLH é portanto adotada para significar um fator de transcrição bHLH comodefinido acima. Qualquer ácido nucleico codificando um tal fator detranscrição bHLH é adequado para uso para realizar os métodos da invenção.
A presente invenção também abrange plantas ou partes destas(incluindo células de planta) viáveis pelos métodos de acordo com a presenteinvenção. As plantas ou partes destas compreendem um transgene de ácidonucleico codificando um fator de transcrição bHLH como definido acima.
A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de ácidos nucleicosúteis nos métodos de acordo com a invenção, em uma planta.
Portanto, é fornecida uma construção gênica compreendendo:
(i) Qualquer ácido nucleico codificando um fator detrasncrição tipo bHLH como definido acima;
(ii) Uma ou mais seqüências de controle operacionalmenteligadas ao ácido nucleico de (i).
Construções úteis nos métodos de acordo com a presenteinvenção podem ser construídas usando tecnologia de DNA recombinantebem conhecida por pessoas versadas na arte. As construções gênicas podemser inseridas em vetores, que podem estar disponíveis comercialmente,adequados para transformação em plantas e adequados para expressão dogene de interesse nas células transformadas. A invenção portanto fornece usode uma construção gênica como definido acima nos métodos da invenção.
Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um fator detranscrição tipo bHLH). O artesão versado é bem ciente dos elementosgenéticos que devem estar presentes no vetor a fim de transformar comsucesso, selecionar e propagar células hospedeiras contendo a seqüência deinteresse. A seqüência de interesse é operacionalmente ligada a uma ou maisseqüências de controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor, quer natural ousintético, pode ser usado para dirigir expressão da seqüência de ácidosnucleicos. O promotor pode ser um promotor induzível, i.e. tendo início detranscrição induzido ou aumentado em resposta a um estímulo evolutivo,químico, ambiental ou físico. O promotor pode ser um promotor tecidoespecífico, i.e. um que é capaz de preferencialmente iniciar transcrição emcertos tecidos, tal como as folhas, raízes, tecido de semente etc.
De acordo com uma característica preferida da invenção, oácido nucleico codificando um fator de transcrição tipo bHLH éoperacionalmente ligado a um promotor constitutivo. Um promotorconstitutivo é transcricionalmente ativo durante a maioria mas nãonecessariamente todas fases de seu crescimento e desenvolvimento e ésubstancialmente ubiquamente expresso. O promotor constitutivo épreferivelmente um promotor GOS2, mais preferivelmente o promotorconstitutivo é um promotor GOS2 de arroz, ainda preferivelmente o promotorconstitutivo é representado pela seqüência de ácidos nucleicossubstancialmente similar a SEQ ID NO: 230 ou SEQ ID NO: 233, maispreferivelmente o promotor constitutivo é como representado por SEQ IDNO: 233.
Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico codificando fator de transcrição bHLH representadopor SEQ ID NO: 212, nem é a aplicabilidade da invenção restrita a expressãode um tal ácido nucleico codificando fator de transcrição bHLH quandodirigida por um promotor GOS2. Exemplos de outros promotoresconstitutivos que também podem ser usados para realizar os métodos dainvenção são mostrados na seção de definições.
Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta. Elementos reguladores adicionais podem incluiracentuadores transcricionais assim como traducionais. Aqueles versados naarte estarão cientes de seqüências terminadoras e acentuadoras que podem seradequadas para uso para realizar a invenção. Tais seqüências devem serconhecidas ou podem ser prontamente obtidas por uma pessoa versada naarte.
As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl. Outras seqüências de controle (além depromotor, acentuador, silenciador, seqüências de íntrons, regiões 3'UTR e/ou5'UTR) podem ser proteína e/ou agentes estabilizantes de RNA. A construçãogenética pode opcionalmente compreender um gene marcador selecionável.
A invenção também fornece um método para a produção deplantas transgênicas tendo características de produção melhoradas em relaçãoa plantas de controle, compreendendo introdução e expressão em uma plantade qualquer ácido nucleico codificando um polipeptídeo de fator detranscrição tipo bHLH como definido acima.
Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo características de produçãomelhoradas, cujo método compreende:
(i) introduzir e expressar um ácido nucleico codificando umfator de transcrição tipo bHLH (como definido neste lugar) em uma célulavegetal; e
(ii) cultivar a célula vegetal em condições que promovemcrescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.
Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira.
Seguindo transferência de DNA e regeneração, plantasputativamente transformadas podem ser avaliadas, por exemplo usandoanálise Southern, para a presença do gene de interesse, número de cópias e/ouorganização genômica. Alternativamente ou adicionalmente, níveis deexpressão do DNA recentemente introduzido podem ser monitorados usandoanálise Northern e/ou Western, ou PCR quantitativo, todas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos detecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estendeadicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordocom a invenção.
A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um fator de transcrição bHLH comodefinido acima. Células hospedeiras preferidas de acordo com a invenção sãocélulas de planta.
A invenção também se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.De acordo com uma característica preferida da invenção, aexpressão modulada é expressão aumentada.
Como mencionado acima, um método preferido para modular(preferivelmente, aumentar) expressão de um ácido nucleico codificando umfator de transcrição bHLH é introduzir e expressar em uma planta um ácidonucleico codificando um fator de transcrição bHLH; entretanto os efeitos derealizar o método, i.e. características de produção melhoradas também podemser atingidas usando outras técnicas bem conhecidas. Uma descrição dealgumas destas técnicas irá agora se seguir.
Uma tal técnica é identificação por ativação de T-DNA. Asplantas transgênicas resultantes mostram fenótipos dominantes devido aexpressão modificada de genes próximos ao promotor introduzido. Os efeitosda invenção também podem ser reproduzidos usando a técnica de TILLING(Lesões Locais Induzidas Dirigidas em Genomas). Os efeitos da invençãotambém podem ser reproduzidos usando recombinação homóloga.
Referência neste lugar ao termo características de produçãomelhoradas é adotada para significar um aumento em biomassa (peso) de umaou mais partes de uma planta, o que pode incluir partes (aptas para corte)acima do solo e/ou partes (aptas para corte) abaixo do solo.
Em particular, tais partes aptas para corte são sementes, edesempenho dos métodos da invenção resulta em plantas tendo produçãoaumentada de sementes em relação à produção de sementes de plantas decontrole.
Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento em o númerode plantas estabelecidas por hectare ou acre, um aumento no número deespigas por planta, um aumento no número de fileiras, número de sementespor fileira, peso de semente, peso de mil sementes, comprimento/diâmetro deespiga, aumento na taxa de enchimento de grãos (que é o número de grãoscheios dividido pelo número total de grãos e multiplicado por 100), entreoutros. Adotando arroz como um exemplo, um aumento de produção pode sermanifestado como um aumento em um ou mais dos seguintes: número deplantas por hectare ou acre, número de panículas por planta, número deespiguilhas por panícula, número de flores (floretes) por panícula (que éexpresso como uma proporção do número de grãos cheios pelo número depanículas primárias), aumento na taxa de enchimento de grãos (que é onúmero de grãos cheios dividido pelo número total de grãos e multiplicadopor 100), aumento em peso de mil sementes, entre outros.
Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Uma planta tendo uma taxa de crescimento aumentada podeainda exibir florescimento precoce. O aumento em taxa de crescimento podeocorrer em um ou mais estágios no ciclo de vida de uma planta ou durantesubstancialmente o ciclo de vida inteiro de planta. Taxa de crescimentoaumentada durante os estágios iniciais no ciclo de vida de uma planta podepermitir vigor melhorado (vigor aumentado de plântula em emergência). Oaumento em taxa de crescimento pode alterar o ciclo de colheita de umaplanta permitindo que plantas sejam semeadas mais tarde e/ou colhidas maiscedo do que de outra maneira seria possível. Se a taxa de crescimento ésuficientemente aumentada, ela pode permitir semeadura adicional desementes da mesma espécie de planta (por exemplo semeadura e colheita deplantas de arroz seguido por semeadura e colheita de plantas de arrozadicionais todas dentro de um período de cultivo convencional).Similarmente, se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes de espécies vegetais diferentes (porexemplo a semeadura e colheita de plantas de milho seguido por, porexemplo, a semeadura e colheita opcional de soja, batata ou qualquer outraplanta adequada). Tempos de colheita adicionais do mesmo rizoma no caso dealgumas plantas de cultura também podem ser possíveis. Alterar o ciclo decolheita de uma planta pode levar a um aumento em produção anual debiomassa por acre (devido a um aumento no número de vezes (digamos queem um ano) que qualquer planta particular pode ser cultivada e colhida). Umaumento em taxa de crescimento também pode permitir o cultivo de plantastransgênicas em uma área geográfica mais ampla do que suas contrapartestipo selvagem, uma vez que as limitações territoriais para cultivar uma culturafreqüentemente são determinadas por condições ambientais adversas ou nomomento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio).Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado.A taxa de crescimento pode ser determinada derivando vários parâmetros decurvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado porplantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado porplantas para atingir 90% de seu tamanho máximo), entre outros.
Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et ai. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um fator detranscrição bHLH.
Desempenho dos métodos da invenção gera plantas crescidasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15. Deficiência de nutrientes poderesultar de uma carência ou excesso de nutrientes tal como nitrogênio,fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio,magnésio, manganês, ferro e boro, entre outros.
De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle, particularmentedurante os estágios iniciais de desenvolvimento vegetal (tipicamente trêssemanas após germinação no caso de arroz e milho, mas isto irá variar deespécie para espécie) levando a vigor precoce. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar a taxa decrescimento de plantas, cujo método compreende modular, preferivelmenteaumentar, expressão em uma planta de um ácido nucleico codificando umfator de transcrição bHLH. A presente invenção portanto também fornece ummétodo para obter plantas tendo vigor precoce em relação a plantas decontrole, cujo método compreende modular, preferivelmente aumentar,expressão em uma planta de um ácido nucleico codificando um fator detranscrição bHLH.
Vigor precoce também pode resultar de ou ser manifestadocomo aptidão vegetal aumentada em relação a plantas de controle, porexemplo, devido às plantas serem mais bem adaptadas a seu ambiente (i.e.sendo mais capazes de lidar com vários fatores de estresse abiótico oubiótico). Plantas tendo vigor precoce também mostram melhorestabelecimento da cultura (com a cultura crescendo de maneira uniforme, i.e.com a maioria das plantas atingindo os vários estágios de desenvolvimentosubstancialmente ao mesmo tempo), e mostram melhor crescimento efreqüentemente melhor produção. Vigor precoce pode ser determinadomedindo vários fatores, tal como taxa de crescimento de plântula, peso de milsementes, porcentagem de germinação, porcentagem de emergência, altura deplântula, comprimento de raiz e biomassa de parte aérea e muito mais.
Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia. Plantas nas quais vigor precoce é uma característica particularmente desejável incluem arroz, milho, trigo,girassol, sorgo.
A presente invenção também abrange uso de ácidos nucleicoscodificando fatores de transcrição bHLH e uso de polipeptídeos de fator detranscrição bHLH para melhorar características de produção.
Ácidos nucleicos codificando polipeptídeos de fator detranscrição bHLH, ou os próprios fatores de transcrição bHLH, podemencontrar uso em programas de melhoramento nos quais é identificado ummarcador de DNA que pode ser geneticamente ligado a um gene codificandofator de transcrição bHLH. Os ácidos nucleicos/genes, ou os próprios fatoresde transcrição bHLH podem ser usados para definir um marcador molecular.Este marcador de DNA ou proteína pode então ser usado em programas demelhoramento para selecionar plantas tendo produção aumentada comodefinido acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene codificando fatorde transcrição bHLH também podem encontrar uso em programas demelhoramento auxiliados por marcador. Tais programas de melhoramentoalgumas vezes requerem introdução de variação alélica por tratamentomutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada. Seleção tipicamenteé realizada monitorando desempenho de crescimento de plantas contendodiferentes variantes alélicas da seqüência em questão. Desempenho decrescimento pode ser monitorado em uma casa de vegetação ou no campo.Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélicasuperior foi identificada com outra planta. Isto pode ser usado, por exemplo,para fazer uma combinação de características fenotípicas interessantes.
Um ácido nucleico codificando um fator de transcrição bHLHtambém pode ser usado como sondas para mapear geneticamente efisicamente os genes dos quais elas são uma parte de, e como marcadores paracaracterísticas ligadas a tais genes. Tal informação pode ser útil emmelhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos codificando fator de transcrição bHLHrequer apenas uma seqüência de ácidos nucleicos de pelo menos 15nucleotídeos de comprimento. Os ácidos nucleicos codificando fator detranscrição bHLH podem ser usados como marcadores de polimorfismo decomprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J,Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)de DNA genômico vegetal digerido por restrição podem ser sondados com osácidos nucleicos codificando fator de transcrição bHLH. O padrão debandeamento resultante pode então ser sujeito a análises genéticas usandoprogramas computacionais tal como MapMaker (Lander et ai. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, osácidos nucleicos podem ser usados para sondar Southern blots contendoDNAs genômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando fator de transcrição bHLHno mapa genético previamente obtido usando esta população (Botstein et al.(1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley (1986)Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas, e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas paramapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et ai. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.
Os métodos de acordo com a presente invenção resultam emplantas tendo características melhoradas de produção, como descrito acima.Estas características também podem ser combinadas com outrascaracterísticas economicamente vantajosas, tal como característicasacentuadoras de produção adicionais, tolerância a outros estresses abióticos ebióticos, características modificando várias características de arquitetura e/oucaracterísticas bioquímicas e/ou fisiológicas.
Descrição detalhada de SPL15
Surpreendentemente, foi descoberto agora que aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeode fator de transcrição SPL15 gera plantas tendo características de produçãomelhoradas, particularmente produção aumentada, em relação a plantas decontrole. Portanto, a invenção fornece um método para estimularcaracterísticas de produção em particular para aumentar produção em plantasem relação a plantas de controle, compreendendo aumentar expressão em umaplanta de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPLl5.
Um método preferido para aumentar expressão de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15 éintroduzir e expressar em uma planta um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15.
O termo "polipeptídeo fator de transcrição SPLl 5" comodefinido neste lugar se refere a um polipeptídeo compreendendo de N-terminal a C-terminal: (i) Motivo 1 como representado por SEQ ID NO: 276;e (ii) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%,85%, 90%, 95% ou 98% identidade de seqüência com o SPL DBDrepresentado por SEQ ID NO: 277; e (iii) Motivo 2 como representado porSEQ ID NO: 278.
Os aminoácidos mais conservados dentro de Motivo 1 sãoXLXFGXXXYFX, e dentro de Motivo 2 DSXXALSLLSX (onde X é umsubconjunto especificado de aminoácidos diferindo para cada posição, comoapresentado em SEQ ID NO: 276 e SEQ ID NO: 277). Dentro de Motivo 1 eMotivo 2, são permitidas uma ou mais mudança conservativa em qualquerposição, e/ou uma, duas ou três mudança(s) não conservativa(s) em qualquerposição.
Adicionalmente, o polipeptídeo de fator de transcrição SPL15pode compreender qualquer um ou ambos os seguintes: (a) um trecho rico emG/S precedendo o SPL DBD; e (b) o tripeptídeo W(S/T)L na extremidade C-terminal do polipeptídeo.
Um exemplo de um polipeptídeo de fator de transcrição SPL15como definido acima compreendendo de N-terminal a C-terminal: (i) Motivo1 como representado por SEQ ID NO: 276; e (ii) em ordem crescente depreferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% deidentidade de seqüência com o SPL DBD representado por SEQ ID NO: 277;e (iii) Motivo 2 como representado por SEQ ID NO: 278; e adicionalmentecompreendendo: (a) um trecho rico em G/S precedendo o SPL DBD; e (b) otripeptídeo W(S/T)L na extremidade C- do polipeptídeo, é representado comoem SEQ ID NO: 235. Tais exemplos adicionais são representados porqualquer um de SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ IDNO: 251, SEQ ED NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ IDNO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 283, SEQ IDNO: 285, SEQ ID NO: 287 ou ortólogos ou parálogos de qualquer das SEQED NOs mencionadas acima. A invenção é ilustrada transformando plantascom a seqüência de Arabidopsis thaliana representada por SEQ ID NO: 234,codificando o polipeptídeo de SEQ ID NO: 235. SEQ ID NO: 237 deArabidopsis thaliana (codificado por SEQ ED NO: 236) é um parálogo dopolipeptídeo de SEQ ID NO: 235. SEQ ID NO: 239 (codificado por SEQ IDNO: 238, de Aquilegia formosa χ Aquilegia pubescens), SEQ ID NO: 241(codificado por SEQ ID NO: 240, de Gossypium hirsutum), SEQ ID NO: 243(codificado por SEQ ID NO: 242, de Ipomoea nil), SEQ ID NO: 245(codificado por SEQ ID NO: 244, de Lactuca sativa), SEQ ID NO: 247(codificado por SEQ ID NO: 246, de Malus domestica), SEQ ID NO: 249(codificado por SEQ ID NO: 248, de Medieago truneatulà), SEQ ID NO: 251(codificado por SEQ ID NO: 250, de Nicotiana bentamiana), SEQ ID NO:253 (codificado por SEQ ID NO: 252, de Oryza sativa), SEQ ID NO: 255(codificado por SEQ ID NO: 254, de Oryza sativa), SEQ ID NO: 257(codificado por SEQ ID NO: 256, de Solanum tuberosum SEQ ID NO: 259(codificado por SEQ ID NO: 258, de Vitis vinifera), SEQ ID NO: 261(codificado por SEQ ID NO: 260, de Zea mays), SEQ ID NO: 263 (codificadopor SEQ ID NO: 262, Zea mays), SEQ ID NO: 283 (codificado por SEQ IDNO: 282, Brassiea rapa), SEQ ID NO: 285 (codificado por SEQ ID NO: 284,Glyeine max), e SEQ ID NO: 287 (codificado por SEQ ID NO: 286, Populustremuloides) são ortólogos do polipeptídeo de SEQ ID NO: 235.Ortólogos e parálogos podem ser facilmente encontradosrealizando uma assim chamada busca blast recíproca. Isto pode ser feito porum primeiro BLAST envolvendo realizar BLAST com uma seqüência deconsulta (por exemplo, SEQ ID NO: 234 ou SEQ ID NO: 235) contraqualquer banco de dados de seqüências, tal como o banco de dadospublicamente disponível de NCBI. BLASTN ou TBLASTX (usando valorespré-determinados padrão) podem ser usados ao iniciar de uma seqüência denucleotídeos e BLASTP ou TBLASTN (usando valores pré-determinadospadrão) podem ser usados ao iniciar de uma seqüência de polipeptídeos. Osresultados de BLAST podem ser opcionalmente filtrados. As seqüências decomprimento completo ou dos resultados filtrados ou dos resultados nãofiltrados são então BLASTed de volta (segundo BLAST) contra seqüências doorganismo do qual a seqüência de consulta é derivada (onde a seqüência deconsulta é SEQ ID NO: 234 ou SEQ ID NO: 235, o segundo BLAST deveportanto ser contra seqüências de Arabidopsis). Os resultados do primeiro esegundo BLAST são então comparados. Um parálogo é identificado se umacerto de alto pontuação do primeiro BLAST é da mesma espécie da qual aseqüência de consulta é derivada, um BLAST de retorno então idealmenteresulta na seqüência de consulta como maior acerto (além da própria); umortólogo é identificado se um acerto de alto pontuação no primeiro BLASTnão é da mesma espécie que da qual a seqüência de consulta é derivada epreferivelmente resulta mediante BLAST de retorno na seqüência de consultaentre os maiores acertos. Acertos de alto pontuação são aqueles tendo umbaixo valor E. Quanto menor o valor E, mais significante é o pontuação (ouem outras palavras menor a chance de que o acerto tenha sido encontrado aoacaso). Computação do valor E é bem conhecida na arte. Em adição a valoresE, comparações também são pontuadas por identidade percentual. Identidadepercentual se refere ao número de nucleotídeos (ou aminoácidos) idênticosentre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadasao longo de um comprimento particular. Um exemplo detalhando aidentificação de ortólogos e parálogos é dado em Exemplo 41. No caso defamílias grandes, ClustalW pode ser usado, seguido por uma árvore deagrupamento de vizinhos, para ajudar a visualizar agrupamento de genesrelacionados e para identificar ortólogos e parálogos. Em Figura 22, parálogose ortólogos do polipeptídeo de fator de transcrição SPL15 se agrupam juntos.
Os polipeptídeos representados por qualquer um de SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ IDNO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ IDNO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ IDNO: 261, SEQ ID NO: 263, SEQ ID NO: 283, SEQ ID NO: 285, SEQ IDNO: 287, ou ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima, todos compreendem um SPL DBD tendo, em ordemcrescente de preferência, pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95%ou 98% de identidade de seqüência com o SPL15 DBD representado por SEQID NO: 277.
DBDs de SPL são bem conhecidos na arte e podem serprontamente identificados por pessoas versadas na arte. Um SPL DBD podeser identificado usando métodos para o alinhamento de seqüências paracomparação. Métodos para o alinhamento de seqüências para comparaçãoincluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmode Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar oalinhamento de duas seqüências completas que maximiza o número depareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschulet ai. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüênciapercentual e realiza uma análise estatística da similaridade entre as duasseqüências. O aplicativo computacional para realizar análise BLAST estápublicamente disponível através do National Centre for BiotechnologyInformation. Homólogos podem ser prontamente identificados usando, porexemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW(versão 1.83) disponível em GenomeNet service no Kyoto UniversityBioinformatics Center, com os parâmetros padrão de alinhamento pareado, eum método de pontuação em porcentagem. Edição manual secundária podeser realizada para otimizar alinhamento entre motivos conservados, comoseria evidente para uma pessoa versada na arte. O alinhamento mostrado emFiguras 23 e 24 destaca o SPL DBD em polipeptídeos de fator de transcriçãoSPLl5. Preferivelmente, polipeptídeos de fator de transcrição SPL15 úteisnos métodos da invenção compreendem um SPL DBD tendo, em ordemcrescente de preferência, pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95%ou 98% de identidade de seqüência com o SPL DBD representado por SEQID NO: 277.
Em algumas instâncias, parâmetros padrão podem serajustados para modificar a estringência da busca. Por exemplo usandoBLAST, o limiar de significância estatística (chamado valor esperado") pararelatar pareamentos contra seqüências de banco de dados pode ser aumentadopara mostrar pareamentos menos estringentes. Desta maneira, pareamentoscurtos praticamente exatos podem ser identificados. Motivo 1 comorepresentado por SEQ ID NO: 276 e Motivo 2 como representado por SEQ IDNO: 278 ambos compreendidos nos polipeptídeos de fator de transcriçãoSPL15 úteis nos métodos da invenção podem ser identificados desta maneira(Figura 24). Dentro de Motivo 1 e Motivo 2, são permitidas uma ou maismudança conservativa em qualquer posição, e/ou uma, duas ou trêsmudança(s) não conservativas em qualquer posição. O tripeptídeo W(S/T)Lna extremidade C-terminal do polipeptídeo pode ser da mesma maneiraidentificado (Figura 24).
Também existem bancos de dados especiais para aidentificação de domínios. O SPL DBD em um polipeptídeo de fator detranscrição SPL15 pode ser identificado usando, por exemplo, SMART(Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic etal. (2002) Nucleie Aeids Res 30, 242-244; hosted by the EMBL atHeidelberg, Germany), InterPro (Mulder et ai, (2003) Nucl. Acids. Res. 31,315-318; hospedado pelo European Bioinformaties Institute (EBI) no ReinoUnido), Prosite (Bucher and Bairoeh (1994), A generalized profile syntax forbiomolecular sequences motifs and its fiinction in automatic sequenceinterpretation. (In) ISMB-94; Proeeedings 2nd International Conferenee onIntelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P.,Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et ai,Nucl. Acids. Res. 32: D134-D137, (2004), The ExPASy proteomies server isprovided as a service to the scientific community (hospedado pelo SwissInstitute of Bioinformatics (SIB) na Suíça) ou Pfam (Bateman et al., NucleicAcids Research 30(1): 276-280 (2002), hospedado pelo Sanger Institute noReino Unido). O SPL DBD no banco de dados InterPro é designadoIPR004333, PF03110 no banco de dados Pfam e PS51141 no banco de dadosPROSITE.
Além disso, a presença de trecho rico em G/S precedendo oSPL DBD também pode ser prontamente identificada (Figura 24).Composição primária de aminoácidos (em %) para determinar se um domíniode polipeptídeo é rico em aminoácidos específicos pode ser calculado usandoprogramas de aplicativos computacionais do servidor ExPASy, em particulara ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: the proteomiesserver for in-depth protein knowledge and analysis. Nucleic Acids Res31:3784-3788). A composição da proteína de interesse pode ser entãocomparada com a composição média de aminoácidos (em %) no banco dedados Swiss-Prot Protein Sequence. Dentro deste banco de dados, o conteúdomédio de Gly (G) e Ser (E) são ambos de 6,9% (indo até 13,8%). Como umexemplo, o trecho rico em G/S precedendo o SPL DBD de SEQ ID NO: 235contém 14,5 % de G e 25,5 % de S (indo até 40%). Como definido nestelugar, um trecho rico em G/S tem um conteúdo combinado de G e S (emtermos %) acima daquele encontrado na composição média de aminoácidos(em termos %) das proteínas no Swiss-Prot Protein Sequence. Tanto G comoS pertencem à categoria de aminoácidos muito pequenos.
O ácido nucleico codificando os polipeptídeos representadospor qualquer um de SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239,SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247,SEQ ID NO: 249, SEQ ED NO: 251, SEQ LD NO: 253, SEQ ID NO: 255,SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263,SEQ ED NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, ou ortólogos ouparálogos de qualquer das SEQ ID NOs mencionadas acima, não precisam serácidos nucleicos de comprimento completo, uma vez que desempenho dosmétodos da invenção não se fia no uso de seqüências de ácidos nucleicos decomprimento completo. Além disso, exemplos de ácidos nucleicos adequadospara uso para realizar os métodos da invenção incluem mas não são limitadosàqueles representados por qualquer um de: SEQ ID NO: 234, SEQ ID NO:236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO:244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO:252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO:260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ ID NO:286. Variantes de ácidos nucleicos também podem ser úteis para praticar osmétodos da invenção. Exemplos de tais variantes incluem porções de ácidosnucleicos, variantes de união, variantes alélicas ou naturalmente ocorrentes ouobtidas por manipulação de DNA.
Uma porção pode ser preparada, por exemplo, fazendo uma oumais deleções a um ácido nucleico codificando um polipeptídeo de fator detranscrição SPL15 como definido acima. As porções podem ser usadas emforma isolada ou elas podem ser fusionadas a outras seqüências decodificação (ou não codificantes) a fim de, por exemplo, produzir umaproteína que combina diversas atividades. Quando fusionado a outrasseqüências de codificação, o polipeptídeo resultante produzido mediantetradução pode ser maior do que aquele previsto para a porção de fator detranscrição SPLl5. Porções úteis nos métodos da invenção, codificam umpolipeptídeo de fator de transcrição SPL15 (como descrito acima) e tendosubstancialmente a mesma atividade biológica que o polipeptídeo de fator detranscrição SPLl5 representado por qualquer um SEQ ED NO: 235, SEQ IDNO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ IDNO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ IDNO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ IDNO: 261, SEQ ID NO: 263, SEQ ID NO: 283, SEQ ID NO: 285, SEQ IDNO: 287, ou ortólogos ou parálogos de qualquer das SEQ ID NOsmencionadas acima. Exemplos de porções podem incluir os nucleotídeoscodificando Motivo 1 como representado por SEQ ID NO: 276, em ordemcrescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95%ou 98% de identidade de seqüência com o SPL DBD representado por SEQID NO: 277, e Motivo 2 como representado por SEQ ID NO: 278. Porçõespodem incluir adicionalmente nucleotídeos codificando o trecho rico em G/Sou o tripeptídeo W(S/T)L (mas não necessariamente os nucleotídeoscodificando as seqüências de aminoácidos entre qualquer destes). A porção étipicamente de pelo menos 250 nucleotídeos de comprimento, preferivelmentepelo menos 500 nucleotídeos de comprimento, mais preferivelmente pelomenos 750 nucleotídeos de comprimento e mais preferivelmente pelo menos1000 nucleotídeos de comprimento. Preferivelmente, a porção é uma porçãode um ácido nucleico como representado por qualquer um de SEQ ID NO:234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO:242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO:250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO:258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284e SEQ ID NO: 286. Mais preferivelmente a porção é uma porção de um ácidonucleico como representado por SEQ ID NO: 234.
Outra variante de ácido nucleico útil nos métodos da invenção,é um ácido nucleico capaz de hibridizar em condições de estringênciareduzida, preferivelmente em condições estringentes, com um ácido nucleicocodificando um polipeptídeo de fator de transcrição SPL15 como definidoacima, ou a com uma porção como definido acima.
Seqüências de hibridização úteis nos métodos da invenção,codificam um polipeptídeo compreendendo de N-terminal a C-terminal: (i)Motivo 1 como representado por SEQ ID NO: 276; e (ii) em ordem crescentede preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% deidentidade de seqüência com o SPL DBD representado por SEQ ID NO: 277;e (iii) Motivo 2 como representado por SEQ ID NO: 278, e tendosubstancialmente a mesma atividade biológica que os polipeptídeos de fatorde transcrição SPL15 representados por SEQ ID NO: 235, SEQ ID NO: 237,SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245,SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253,SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261,SEQ ID NO: 263, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO: 287, ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima. Aseqüência de hibridização é tipicamente de pelo menos 250 nucleotídeos decomprimento, preferivelmente pelo menos 500 nucleotídeos de comprimento,mais preferivelmente pelo menos 750 nucleotídeos de comprimento e maispreferivelmente pelo menos 1000 nucleotídeos de comprimento.Preferivelmente, a seqüência de hibridização é uma que é capaz de hibridizarcom qualquer dos ácidos nucleicos representados por SEQ ID NO: 234, SEQID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ IDNO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ IDNO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ IDNO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ IDNO: 286, ou com uma porção de qualquer das Seqüências mencionadasacima, uma porção sendo como definido acima. Mais preferivelmente aseqüência de hibridização é capaz de hibridizar com SEQ ID NO: 234, oucom porções deste.
Outra variante de ácido nucleico útil nos métodos da invençãoé uma variante de processamento codificando um polipeptídeo de fator detranscrição SPL15 como definido acima.
Variantes de união preferidas são variantes de união de umácido nucleico codificando polipeptídeo de fator de transcrição SPL15representado por qualquer de SEQ ID NO: 235, SEQ ID NO: 237, SEQ IDNO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ IDNO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ IDNO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ IDNO: 263, SEQ ID NO: 283, SEQ ID NO: 285, ou SEQ ID NO: 287, ouvariantes de união codificando ortólogos ou parálogos de qualquer dosmencionados acima SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238,SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246,SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254,SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262,SEQ ID NO: 282, SEQ ID NO: 284 e SEQ ID NO: 286. Mais preferido é umavariante de processamento de um ácido nucleico como representado por SEQID NO: 234.
Outra variante de ácido nucleico útil para realizar os métodosda invenção é uma variante alélica de um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 como definido acima.
A variante alélica pode ser uma variante alélica de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15representado por qualquer de SEQ ID NO: 235, SEQ ID NO: 237, SEQ IDNO: 239, SEQ ID NO: 241, SEQ ED NO: 243, SEQ ID NO: 245, SEQ IDNO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ IDNO: 255, SEQ ED NO: 257, SEQ ID NO: 259, SEQ ID NO: 261, SEQ IDNO: 263, SEQ ID NO: 283, SEQ ED NO: 285, ou SEQ ID NO: 287, ou umavariante alélica de um ácido nucleico codificando ortólogos ou parálogos dequalquer das SEQ ID NOs mencionadas acima. Ademais preferidas sãovariantes alélicas de ácidos nucleicos representados por qualquer um de SEQID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ IDNO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ED NO: 248, SEQ IDNO: 250, SEQ ED NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ IDNO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ IDNO: 284 e SEQ ID NO: 286. Mais preferido é uma variante alélica de umácido nucleico como representado por SEQ ID NO: 234.
Uma variante de ácido nucleico adicional útil nos métodos dainvenção é uma variante de ácido nucleico obtida por embaralhamentogênico. Embaralhamento gênico ou evolução dirigida também pode ser usadapara gerar variantes de ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 como definido acima.
Além disso, variantes de ácidos nucleicos também podem serobtidas por mutagênese dirigida a sítio. Estão disponíveis diversos métodospara atingir mutagênese dirigida a sítio, o mais comum sendo métodosbaseados em PCR (Current Protocols in Molecular Biology. Wiley (Eds)).
Também úteis nos métodos da invenção são ácidos nucleicoscodificando homólogos de qualquer um dos aminoácidos representados porSEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241,SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257,SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 283,SEQ ID NO: 285, SEQ ID NO: 287, ou ortólogos ou parálogos de qualquerdas SEQ ID NOs mencionadas acima.
Também úteis nos métodos da invenção são ácidos nucleicoscodificando derivados de qualquer um dos aminoácidos representados porSEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241,SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249,SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257,SEQ ID NO: 259, SEQ ID NO: 261 SEQ ID NO: 263, SEQ ID NO: 283, SEQID NO: 285, SEQ ID NO: 287, ou ortólogos ou parálogos de qualquer dasSEQ ID NOs mencionadas acima. "Derivados" incluem peptídeos,oligopeptídeos, polipeptídeos que podem, comparados com a seqüência deaminoácidos da forma naturalmente ocorrente da proteína, tal como aquelaapresentada em SEQ ID NO: 235, compreender substituições de aminoácidoscom resíduos de aminoácidos não naturalmente ocorrentes, ou adições deresíduos de aminoácidos não naturalmente ocorrentes.
Além disso, polipeptídeos de fator de transcrição SPL15 (pelomenos em sua forma nativa) tipicamente têm atividade de ligação de DNA eum domínio de ativação. Uma pessoa versada na arte pode facilmentedeterminar a presença de um domínio de ativação e atividade de ligação deDNA usando ferramentas e técnicas de rotina.
Ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 podem ser derivados de qualquer fonte natural ou artificial.
O ácido nucleico pode ser modificado a partir de sua forma nativa emcomposição e/ou ambiente genômico através de deliberada manipulaçãohumana. Preferivelmente o ácido nucleico codificando polipeptídeo de fatorde transcrição SPL15 é de uma planta, ainda preferivelmente de umadicotiledônea, mais preferivelmente da família Brassicacea, maispreferivelmente o ácido nucleico é de Arabidopsis thaliana.
Qualquer referência neste lugar a um polipeptídeo de fator detranscrição SPL15 é portanto adotada para significar um peptídeo fator detranscrição SPL15 como definido acima. Qualquer ácido nucleico codificandoum tal polipeptídeo de fator de transcrição SPL15 é adequado para uso pararealizar os métodos da invenção.
A invenção também fornece construções genéticas e vetorespara facilitar introdução e/ou expressão das seqüências de ácidos nucleicosúteis nos métodos de acordo com a invenção, em uma planta.
Portanto, é fornecida uma construção gênica compreendendo:
(i) Um ácido nucleico codificando um polipeptídeo de fatorde transcrição SPL15 como definido acima;
(ii) Uma ou mais seqüências de controle operacionalmenteligadas ao ácido nucleico de (i).
Construções úteis nos métodos de acordo com a presenteinvenção podem ser construídas usando tecnologia de DNA recombinantebem conhecida por pessoas versadas na arte. As construções gênicas podemser inseridas em vetores, que podem estar disponíveis comercialmente,adequados para transformação em plantas e adequados para expressão dogene de interesse nas células transformadas. A invenção portanto fornece usode uma construção gênica como definido acima nos métodos da invenção.
Plantas são transformadas com um vetor compreendendo aseqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeode fator de transcrição SPLl 5). O artesão versado é bem ciente dos elementosgenéticos que devem estar presentes no vetor a fim de transformar comsucesso, selecionar e propagar células hospedeiras contendo a seqüência deinteresse. A seqüência de interesse é operacionalmente ligado a uma ou maisseqüências de controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor, quer natural ousintético, pode ser usado para dirigir expressão da seqüência de ácidosnucleicos. O promotor pode ser um promotor induzível, i.e. tendo início detranscrição induzido ou aumentado em resposta a um estímulo evolutivo,químico, ambiental ou físico. O promotor pode ser um promotor tecidoespecífico, i.e. um que é capaz de preferencialmente iniciar transcrição emcertos tecidos, tal como as folhas, raízes, tecido de semente etc.
De acordo com a invenção, o ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 é operacionalmente ligado a umpromotor constitutivo. O promotor constitutivo é preferivelmente umpromotor HMGB (grupo B de alta mobilidade), mais preferivelmente opromotor constitutivo é um promotor HMGB de arroz, ainda preferivelmenteo promotor constitutivo é representado pela seqüência de ácidos nucleicossubstancialmente similar a SEQ ID NO: 279, mais preferivelmente opromotor constitutivo é como representado por SEQ ID NO: 279 ou SEQ IDNO: 294.
Deve ser claro que a aplicabilidade da presente invenção não érestrita ao ácido nucleico codificando um polipeptídeo de fator de transcriçãoSPL15 como representado por SEQ ID NO: 234, nem é a aplicabilidade dainvenção restrita a expressão de um tal ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 quando dirigida por um promotorHMGB. Exemplos de outros promotores constitutivos que também podem serusados para realizar os métodos da invenção são mostrados na seção dedefinições.
Elementos reguladores adicionais para aumentar expressão deácidos nucleicos ou genes, ou produtos de gene, podem incluir acentuadorestranscricionais assim como traducionais. Aqueles versados na arte estarãocientes de seqüências terminadoras e acentuadoras que podem ser adequadaspara uso para realizar a invenção. Outras seqüências de controle (além depromotor, acentuador, silenciador, seqüências de íntrons, regiões 3'UTR e/ou5'UTR) podem ser proteína e/ou agentes estabilizantes de RNA. Taisseqüências devem ser conhecidas ou podem ser prontamente obtidas por umapessoa versada na arte. Opcionalmente, uma ou mais seqüências terminadoras(também uma seqüência de controle) podem ser usadas na construçãointroduzida em uma planta.
Uma seqüência de íntron também pode ser adicionada à região5' não traduzida (UTR) ou à seqüência de codificação da seqüência decodificação parcial para aumentar a quantidade da mensagem madura que seacumula no citosol.
As construções genéticas da invenção podem incluiradicionalmente uma seqüência de origem de replicação que é requerida paramanutenção e/ou replicação em um tipo de célula específico. Um exemplo équando é requerido que uma construção genética seja mantida em uma célulabacteriana como um elemento genético epissomal (e.g. molécula deplasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas nãosão limitadas a, a fl-ori e colEl.
A construção genética pode opcionalmente compreender umgene marcador selecionável.
A invenção também fornece um método para a produção deplantas transgênicas tendo produção aumentada em relação a plantas decontrole, compreendendo introdução e expressão em uma planta de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15 comodefinido acima.
Mais especificamente, a presente invenção fornece um métodopara a produção de plantas transgênicas tendo produção aumentada emrelação a plantas de controle, cujo método compreende:
(i) introduzir e expressar um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 em uma célula vegetal; e
(ii) cultivar a célula vegetal em condições que promovemcrescimento e desenvolvimento vegetal.
O ácido nucleico pode ser introduzido diretamente em umacélula vegetal ou na própria planta (incluindo introdução em um tecido, órgãoou qualquer outra parte de uma planta). De acordo com uma característicapreferida da presente invenção, o ácido nucleico é preferivelmenteintroduzido em uma planta por transformação.
Geralmente depois de transformação, células de planta ouagrupamentos celulares são selecionados para a presença de um ou maismarcadores que são codificados por genes exprimíveis em plantas co-transferidos com o gene de interesse, seguindo o que o material transformadoé regenerado em uma planta inteira.
Seguindo transferência de DNA e regeneração, plantasputativamente transformadas podem ser avaliadas, por exemplo usandoanálise Southern, para a presença do gene de interesse, número de cópias e/ouorganização genômica. Alternativamente ou adicionalmente, níveis deexpressão do DNA recentemente introduzido podem ser monitorados usandoanálise Northern e/ou Western, ou PCR quantitativo, todas as técnicas sendobem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas poruma variedade de maneiras, tal como por propagação clonal ou técnicasclássicas de melhoramento. Por exemplo, uma planta transformada deprimeira geração (ou TI) pode ser autofecundada para gerar transformanteshomozigotos de segunda geração (ou T2), e as plantas T2 adicionalmentepropagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar umavariedade de formas. Por exemplo, eles podem ser quimeras de célulastransformadas e células não transformadas; transformantes clonais (e.g., todasas células transformadas para conter a gaveta de expressão); enxertos detecidos transformados e não transformados (e.g., em plantas, um rizomatransformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célulavegetal ou planta produzida por qualquer dos métodos descritos neste lugar, ea todas as partes vegetais e propágulos destas. A presente invenção se estendeadicionalmente para abranger a progênie de uma célula, tecido, órgão ouplanta inteira primária transformada ou transfectada que foi produzida porqualquer dos métodos mencionados acima, o único requerimento sendo que aprogênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/oufenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordocom a invenção.
A invenção também inclui células hospedeiras contendo umácido nucleico isolado codificando um polipeptídeo de fator de transcriçãoSPL15 como definido acima. Células hospedeiras preferidas de acordo com ainvenção são células de planta.
A invenção também se estende a partes aptas para corte deuma planta tal como, mas não limitado a sementes, folhas, frutos, flores,caules, rizomas, tubérculos e bulbos. A invenção além disso se refere aprodutos derivados, preferivelmente diretamente derivados, de uma parte aptapara corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura,ácidos graxos, amido ou proteínas.
Como mencionado acima, um método preferido para aumentarexpressão de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPL15 é introduzir e expressar em uma planta um ácido nucleicocodificando um polipeptídeo de fator de transcrição SPLl5; entretanto osefeitos de realizar o método, i.e. produção crescente, também pode seratingida usando outras técnicas bem conhecidas. Uma descrição de algumasdestas técnicas irá agora se seguir.
Uma tal técnica é identificação por ativação de T-DNA. Asplantas transgênicas resultantes mostram fenótipos dominantes devido aexpressão modificada de genes próximos ao promotor introduzido.
Os efeitos da invenção também podem ser reproduzidosusando a técnica de TILLING (Lesões Locais Induzidas Dirigidas emGenomas).
Os efeitos da invenção também podem ser reproduzidosusando recombinação homóloga.
"Rendimento aumentado" como definido neste lugar é adotadapara significar um aumento em biomassa (peso) de uma ou mais partes deuma planta, o que pode incluir partes (aptas para corte) acima do solo e/oupartes (aptas para corte) abaixo do solo.
Em particular, tais partes aptas para corte incluem biomassavegetativa e/ou sementes, e desempenho dos métodos da invenção resulta emplantas tendo produção aumentada (em biomassa vegetativa e/ou semente) emrelação à produção de plantas de controle.
Adotando milho como um exemplo, um aumento de produçãopode ser manifestado como um ou mais dos seguintes: aumento no número deplantas por hectare ou acre, um aumento no número de espigas por planta, umaumento no número de fileiras, número de sementes por fileira, peso desemente, peso de mil sementes, comprimento/diâmetro de espiga, aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), entre outros. Adotando arrozcomo um exemplo, um aumento de produção pode ser manifestado como umaumento em um ou mais dos seguintes: número de plantas por hectare ouacre, número de panículas por planta, número de espiguilhas por panícula,número de flores (floretes) por panícula (que é expresso como uma proporçãodo número de grãos cheios pelo número de panículas primárias), aumento nataxa de enchimento de grãos (que é o número de grãos cheios dividido pelonúmero total de grãos e multiplicado por 100), aumento em peso de milsementes, entre outros.
Uma vez que as plantas transgênicas de acordo com a presenteinvenção têm produção aumentada, é provável que estas plantas exibam umataxa de crescimento aumentada (durante pelo menos parte de seu ciclo devida), em relação à taxa de crescimento de plantas tipo selvagemcorrespondentes em um estágio correspondente em seu ciclo de vida. A taxade crescimento aumentada pode ser específica para uma ou mais partes deuma planta (incluindo sementes), ou pode estar substancialmente ao longo detoda a planta. Uma planta tendo uma taxa de crescimento aumentada podeainda exibir florescimento precoce. O aumento em taxa de crescimento podealterar o ciclo de colheita de uma planta permitindo que plantas sejamsemeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seriapossível. Se a taxa de crescimento é suficientemente aumentada, ela podepermitir semeadura adicional de sementes da mesma espécie de planta (porexemplo semeadura e colheita de plantas de arroz seguido por semeadura ecolheita de plantas de arroz adicionais todas dentro de um período de cultivoconvencional). Similarmente, se a taxa de crescimento é suficientementeaumentada, ela pode permitir semeadura adicional de sementes de espéciesvegetais diferentes (por exemplo a semeadura e colheita de plantas de milhoseguido por, por exemplo, a semeadura e colheita opcional de soja, batata ouqualquer outra planta adequada). Tempos de colheita adicionais do mesmorizoma no caso de algumas plantas de cultura também podem ser possíveis.Alterar o ciclo de colheita de uma planta pode levar a um aumento emprodução anual de biomassa por acre (devido a um aumento no número devezes (digamos que em um ano) que qualquer planta particular pode sercultivada e colhida). Um aumento em taxa de crescimento também podepermitir o cultivo de plantas transgênicas em uma área geográfica mais amplado que suas contrapartes tipo selvagem, uma vez que as limitações territoriaispara cultivar uma cultura freqüentemente são determinadas por condiçõesambientais adversas ou no momento de plantio (ciclo precoce) ou nomomento de colheita (ciclo tardio). Tais condições adversas podem serevitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode serdeterminada derivando vários parâmetros de curvas de crescimento, taisparâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% deseu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% deseu tamanho máximo), entre outros.
De acordo com uma característica preferida da presenteinvenção, desempenho dos métodos da invenção gera plantas tendo uma taxade crescimento aumentada em relação a plantas de controle. Portanto, deacordo com a presente invenção, é fornecido um método para aumentar a taxade crescimento de plantas, cujo método compreende aumentar expressão emuma planta de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPL15
Um aumento em produção e/ou taxa de crescimento ocorrequer a planta esteja em condições de não estresse ou quer a planta sejaexposta a vários estresses comparado com plantas de controle. Plantastipicamente respondem a exposição a estresse crescendo mais lentamente. Emcondições de estresse severo, a planta pode até parar de crescer no geral.
Estresse brando por outro lado é definido neste lugar como sendo qualquerestresse ao qual uma planta é exposta que não resulta em parada decrescimento de planta no geral sem a capacidade de retomar crescimento.
Estresse brando no sentido da invenção leva a uma redução no crescimentodas plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmentemenos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%,13%, 12%, 11% ou 10% ou menos em comparação com a planta de controleem condições de não estresse. Devido a avanços em práticas agrícolas(irrigação, fertilização, tratamentos com pesticidas) estresses severos não sãofreqüentemente encontrados em plantas de cultura cultivadas. Como umaconseqüência, o crescimento comprometido induzido por estresse brandofreqüentemente é uma característica indesejável para agricultura. Estressesbrandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aosquais uma planta é exposta. Estresses abióticos podem ser devidos a seca ouexcesso de água, estresse anaeróbico, estresse salino, toxicidade química,estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresseabiótico pode ser um estresse osmótico causado por um estresse hídrico(particularmente devido à seca), estresse salino, estresse oxidativo ou umestresse iônico. Estresses bióticos são tipicamente aqueles estresses causadospor patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem serrealizados em condições de não estresse ou em condições de seca branda paragerar plantas tendo produção aumentada em relação a plantas de controle.Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abióticoleva a uma série de mudanças morfológicas, fisiológicas, bioquímicas emoleculares que afetam adversamente crescimento e produtividade vegetal.Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidospor serem interconectados e podem induzir prejuízo de crescimento e celularatravés de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133:1755-1767) descreve um grau particularmente alto de "interferência" entreestresse por seca e estresse por alta salinidade. Por exemplo, seca e/ousalinização são manifestadas primariamente como estresse osmótico,resultando na ruptura de homeostase e distribuição iônica na célula. Estresseoxidativo, que freqüentemente acompanha temperatura alta ou baixa,salinidade ou estresse por seca, pode causar desnaturação de proteínasfuncionais e estruturais. Como uma conseqüência, estes diversos estressesambientais freqüentemente ativam vias de sinalização celular e respostascelulares similares, tal como a produção de proteínas de estresse, aumento deantioxidantes, acumulação de solutos compatíveis e suspensão decrescimento. O termo condições de "não estresse" como usado neste lugar sãoaquelas condições ambientais que permitem crescimento ótimo de plantas.Pessoas versadas na arte estarão cientes de condições de solo e condiçõesclimáticas normais para uma dada localização.Desempenho dos métodos da invenção gera plantas cultivadasem condições de não estresse ou em condições de seca branda produçãoaumentada em relação a plantas de controle cultivadas em condiçõescomparáveis. Portanto, de acordo com a presente invenção, é fornecido ummétodo para aumentar produção em plantas cultivadas em condições de nãoestresse ou em condições de seca branda, cujo método compreende aumentarexpressão em uma planta de um ácido nucleico codificando um polipeptídeoMADS15.
Desempenho dos métodos da invenção gera plantas crescidasem condições de deficiência de nutrientes, particularmente em condições dedeficiência de nitrogênio, produção aumentada em relação a plantas decontrole cultivadas em condições comparáveis. Portanto, de acordo com apresente invenção, é fornecido um método para aumentar produção emplantas crescidas em condições de deficiência de nutrientes, cujo métodocompreende aumentar expressão em uma planta de um ácido nucleicocodificando um polipeptídeo MADS15. Deficiência de nutrientes poderesultar de uma carência ou excesso de nutrientes tal como nitrogênio,fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio,magnésio, manganês, ferro e boro, entre outros.
Os métodos da invenção são vantajosamente aplicáveis aqualquer planta.
Plantas que são particularmente úteis nos métodos da invençãoincluem todas as plantas que pertencem à superfamília Viridiplantae, emparticular plantas monocotiledôneas e dicotiledôneas incluindo forragem oulegumes de forragem, plantas ornamentais, cultivos alimentares, árvores ouarbustos. De acordo com uma forma de realização preferida da presenteinvenção, a planta é uma planta de cultivo. Exemplos de plantas de culturaincluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco.Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos deplantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente aplanta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia.
A presente invenção também abrange plantas viáveis pelosmétodos de acordo com a presente invenção. A presente invenção portantofornece plantas, partes e células de tais plantas viáveis pelos métodos deacordo com a presente invenção, cujas plantas ou partes ou célulascompreendem um transgene de ácido nucleico codificando um polipeptídeode fator de transcrição SPL15 como definido acima.
A presente invenção também abrange uso de ácidos nucleicoscodificando polipeptídeos de fator de transcrição SPL15 para aumentarprodução em uma planta comparada com produção em uma planta decontrole.
Um tal uso se refere a aumentar produção de plantas, produçãosendo definida como definido acima. Produção pode incluir em particular umou mais dos seguintes: biomassa acima da terra aumentada, númeroaumentado de flores por panícula, produção aumentada de sementes, númerototal aumentado de sementes, número aumentado de sementes cheias, Peso deMil Sementes (TKW) aumentado e índice de colheita aumentado.
Ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 podem encontrar uso em programas de melhoramento nosquais é identificado um marcador de DNA que pode ser geneticamente ligadoa um gene codificando polipeptídeo de fator de transcrição SPLl5. Ácidosnucleicos codificando polipeptídeos de fator de transcrição SPL15 podem serusados para definir um marcador molecular. Este marcador pode então serusado em programas de melhoramento para selecionar plantas tendo produçãoaumentada de sementes. Os ácidos nucleicos codificando polipeptídeos defator de transcrição SPL15 podem ser, por exemplo, um ácido nucleico comorepresentado por qualquer um de SEQ ID NO: 234, SEQ ID NO: 236, SEQID NO: 238, SEQ ED NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ IDNO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ IDNO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ EDNO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ ID NO: 286.
Variantes alélicas de um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 também podem encontrar uso emprogramas de melhoramento auxiliados por marcador. Tais programas demelhoramento algumas vezes requerem introdução de variação alélica portratamento mutagênico das plantas, usando por exemplo mutagênese EMS;alternativamente, o programa pode começar com uma coleção de variantesalélicas de assim chamada origem "natural" causadas não intencionalmente.Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto éseguido por uma etapa para seleção de variantes alélicas superiores daseqüência em questão e que geram produção aumentada de sementes. Seleçãotipicamente é realizada monitorando desempenho de crescimento de plantascontendo diferentes variantes alélicas da seqüência em questão, por exemplo,variantes alélicas diferentes de qualquer uma de SEQ ID NO: 234, SEQ IDNO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ IDNO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ IDNO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ IDNO: 260, SEQ ID NO: 262, SEQ ID NO: 282, SEQ ID NO: 284 e SEQ IDNO: 286. Desempenho de crescimento pode ser monitorado em uma casa devegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas,nas quais a variante alélica superior foi identificada, com outra planta. Istopode ser usado, por exemplo, para fazer uma combinação de característicasfenotípicas interessantes.
Ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 também podem ser usados como sondas para mapeargeneticamente e fisicamente os genes dos quais elas são uma parte de, e comomarcadores para características ligadas a tais genes. Tal informação pode serútil em melhoramento vegetal a fim de desenvolver linhagens com fenótiposdesejados. Tal uso de ácidos nucleicos codificando polipeptídeos de fator detranscrição SPL15 requer apenas uma seqüência de ácidos nucleicos de pelomenos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificandopolipeptídeos de fator de transcrição SPL15 podem ser usados comomarcadores de polimorfismo de comprimento de fragmento de restrição(RFLP). Southern blots (Sambrook J5 Fritsch EF and Maniatis T (1989)Molecular Cloning, A Laboratory Manual) de DNA genômico vegetaldigerido por restrição podem ser sondados com um ácido nucleicocodificando polipeptídeo de fator de transcrição SPLl5. O padrão debandeamento resultante pode então ser sujeito a análises genéticas usandoprogramas computacionais tal como MapMaker (Lander et al. (1987)Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, oácido nucleico pode ser usado para sondar Southern blots contendo DNAsgenômicos tratados com endonuclease de restrição de um conjunto deindivíduos representando ancestral e progênie de um cruzamento genéticodefinido. Segregação dos polimorfismos de DNA é observada e usada paracalcular a posição do ácido nucleico codificando polipeptídeo de fator detranscrição SPL15 no mapa genético previamente obtido usando estapopulação (Botstein et al (1980) Am. J. Hum. Genet. 32: 314-331).
A produção e uso de sondas derivadas de genes vegetais parauso em mapeamento genético é descrita em Bernatzky and Tanksley(GENETICS 112 (4): 887-898, 1986). Numerosas publicações descrevemmapeamento genético de clones específicos de cDNA usando a metodologiadescrita acima ou variações desta. Por exemplo, populações deintercruzamento de F2, populações endocruzadas, populações cruzadasaleatoriamente, linhagens isogênicas próximas (NIL), e outros conjuntos deindivíduos podem ser usados para mapeamento. Tais metodologias são bemconhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas paramapeamento físico (i.e., alocação de seqüências em mapas físicos; vejaHoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide,Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleicopodem ser usadas em mapeamento direto por hibridização in situ porfluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Emboramétodos atuais de mapeamento por FISH favoreçam uso de clones grandes(diversos kb a diversas centenas de kb; veja Laan et ai. (1995) Genome Res.5:13-20), melhoras em sensibilidade podem permitir desempenho demapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidosnucleicos para mapeamento genético e físico podem ser realizados usando osácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian(1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentosamplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332),ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080),reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res.18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) NucleicAcid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácidonucleico é usada para conceber e produzir pares de iniciadores para uso nareação de amplificação ou em reações de extensão de iniciador. A concepçãode tais iniciadores é bem conhecida por aqueles versados na arte. Em métodosempregando mapeamento genético baseado em PCR, pode ser necessário paraidentificar diferenças de seqüências de DNA entre os ancestral do cruzamentode mapeamento na região correspondendo à atual seqüência de ácidosnucleicos. Isto, entretanto, geralmente não é necessário para métodos demapeamento.
Os métodos de acordo com a presente invenção resultam emplantas tendo produção aumentada, como descrito acima. Estas característicastambém podem ser combinadas com outras características economicamentevantajosas, tal como características de produção melhoradas adicionais,tolerância a outros estresses abióticos e bióticos, características modificandovárias características de arquitetura e/ou características bioquímicas e/oufisiológicas.
Descrição de figuras
A presente invenção será agora descrita com referência àsseguintes figuras nas quais:
Fig. 1 representa a estrutura esquemática do polipeptídeoAtHAL3a compreendendo de término N a término C (i) a hélice de ligação desubstrato (sublinhado simples), (ii) o motivo His de inserção (sublinhadoduplo), (iii) o motivo PXMNXXMW (pontilhado) e (iv) o grampo dereconhecimento de substrato (ondulação). As extremidades N-terminal e C-terminal das proteínas HAL3 são não muito conservadas.
Fig. 2 mostra um vetor binário pEXP::HAL3, para expressãoaumentada em Oryza sativa de um ácido nucleico HAL3 de Arabidopsisthaliana sob o controle de um promotor de beta expansina.
Fig. 3 mostra um alinhamento múltiplo de diversas seqüênciasde HAL3 de Arabidopsis thaliana AtHAL3b (At_NP_973994), Sorghumbicolor (Sb), Arabidopsis thaliana AtHAL3a (Ath0218), Gossipium hirsutum(Cg), Hordeum vulgare (Hv), Oryza sativa (Os), Vitis vinifera (Vv), Glycinemax (Gm), Solanum tuberosum (St), Zea mays (Zm), e Pinus sp (Pg).
Fig. 4 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção: SEQ ID NO: 1 e SEQ ID NO: 2represent a seqüência de ácidos nucleicos e a seqüência de proteínas deAtHABa. SEQ ID NO: 3 e SEQ ID NO: 4 são as seqüências dos iniciadoresdireto e reverso usados para isolar o gene AtHAL3. SEQ ID NO: 5 é aseqüência do promotor de beta expansina usada nos métodos da presenteinvenção. SEQ ID NO: 9 a SEQ ED NO: 42 representam exemplos deDNA/seqüências de proteínas de comprimento completo ou parciais, úteis nosmétodos da invenção ou para isolar seqüências de comprimento completocorrespondentes. Em alguns casos, seqüências foram agrupadas a partir deseqüências EST, com sequenciamento de menos qualidade. Como umaconseqüência, poucas substituições de aminoácidos podem ser esperadas.
Fig. 5 (A) mostra a estrutura de domínio da proteínaMADS15, (B) representa a seqüência de SEQ ID NO: 44 com o domínioMADS em negrito e o domínio de queratina em itálico. Entre o domínioMADS e o de queratina, o domínio interveniente está localizado enquanto odomínio C está localizado C-terminalmente ao domínio de queratina.
Fig. 6 mostra um alinhamento múltiplo de várias proteínasMADS15. Os asteriscos indicam aminoácidos idênticos, as colôniasrepresentam substituições altamente conservativas, os pontos representamsubstituições menos conservadas.
Fig. 7 mostra o vetor binário para expressão aumentada emOryza sativa de um ácido nucleico codificando proteína MADS15 de Oryzasativa sob o controle de um promotor GOS2.
Fig. 8 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção.
Fig. 9 é uma representação esquemática de um polipeptídeoOsMADS 15 de comprimento completo. Os domínios típicos (M, MADS; I,domínio interveniente; K, região K-box de queratina; C, região variável C-terminal) são indicados, as linhas acima e abaixo do diagrama mostram asregiões da proteína envolvidas em ligação de DNA, dimerização e emmultimerização com proteínas de interação.
Fig. 10 mostra o vetor binário pGOS::MADS15hp parasilenciamento de RNA de MADS15 em Oryza sativa, usando uma construçãoem forma de grampo sob o controle de um promotor constitutivo (GOS2).
Fig. 11 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção, ou úteis para isolar taisseqüências. Seqüências podem resultar de associações de EST públicas, comseqüenciamento de menos qualidade. Como uma conseqüência, poucassubstituições de aminoácidos podem ser esperadas. Os códons de início(ATG) e parada delimitam as seqüências de ácidos nucleicos quando estascodificam polipeptídeos MADS15 de comprimento completo. Entretantotanto 5' como 3' UTR também podem ser usadas para a realização dosmétodos da invenção.
Fig. 12 mostra a classificação esquemática dos polipeptídeosde fator de transcrição AP2/ERF de acordo com os domínios presentes: asubfamília AP2 com duas repetições AP2 e a subfamília ERP com apenasuma repetição AP2. A subfamília ERP é adicionalmente subdividida emfatores de transcrição compreendendo um domínio B3 em adição à repetiçãoAP2 (chamada RAV), ou não. Os polipeptídeos de fator de transcrição PLTpertencem à subfamília AP2 com duas repetições AP2.
Fig. 13 respresenta uma apresentação esquemática da estruturade polipeptídeo de fator de transcrição PLT. O domínio AP2 compreende asduas repetições AP2 (envolto) separadas por uma região ligante. As posiçõesaproximadas do sinal de localização nuclear (NL S), de motivo 1PK(V/L)(A/E)DFLG e de motivp 2 (V/L)FX(M/V)WN(D/E) são marcadascomo caixas.
Fig. 14 é um alinhamento de seqüências de polipeptídeo defator de transcrição PLT (de Tabela 4), comparado com outros polipeptídeosde fator de transcrição de domínio AP2 (de Tabela 4 abaixo). O sinal delocalização nuclear (NLS), motivo 1 PK(V/L)(A/E)DFLG e motivo 2(V/L)FX(M/V)WN(D/E) são envoltos. Resíduos idênticos estão enegrecidos,resíduos conservativos estão acinzentados.
Tabela 4: Polipeptídeos de fator de transcrição de domínio
AP2 alinhados contra os polipeptídeos de fator de transcrição PLT usadosDara realizar os métodos da invenção.
<table>table see original document page 229</column></row><table>
Fig. 15 é uma fotografia de 40 sementes de uma planta decontrole (esquerda) comparado com 40 sementes de uma planta transgênicacom expressão aumentada de um polipeptídeo de fator de transcrição PLT.
Fig. 16 mostra um vetor binário pGOS2::PLT, para expressãoaumentada em Oryza sativa de um ácido nucleico de fator de transcrição PLTde Oryza sativa sob o controle de um promotor GOS2.
Fig. 17 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção (SEQ ID NO: 175 a SEQ ID NO:188). Seqüências parciais (SEQ ID NO: 189 e SEQ ID NO: 190) úteis paraisolar seqüências de comprimento completo correspondentes também sãoapresentadas.
Fig. 18 mostra um alinhamento de fatores de transcriçãobHLH como definido acima. As seqüências foram alinhadas usando programaAlignX de Vector NTI suite (InforMax, Bethesda, MD). Alinhamentomúltiplo foi feito com uma penalidade de abertura de lacuna de 10 umaextensão de lacuna de 0,01. Edição manual secundária também foi realizadaonde necessário para melhor posicionar algumas regiões conservadas. Odomínio bHLH é indicado dentro da caixa sólida e o domínio PFB26111 éindicado dentro da caixa hachurada. Também indicada pelas três setasapontando para cima é a configuração 5-9-13 (K/R ER). A única setaapontando para baixo indica o local de ácido glutâmico para reconhecimentodo E-BOX.
Fig. 19 mostra uma matriz de similaridade e identidade entrefatores de transcrição bHLH de várias espécies. Identidade percentual émostrada em negrito. Fig. 19a é uma matriz sobre seqüências de comprimentocompleto e Fig. 19b é uma matriz sobre o domínio bHLH apenas. Maisdetalhes são fornecidos em Exemplo 34.
Fig. 20 mostra um vetor binário pGOS2::bHLH, paraexpressão aumentada em Oryza sativa de um ácido nucleico codificando fatorde transcrição bHLH de Oryza sativa sob o controle de um promotor GOS2.
Fig. 21 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção.
Fig. 22 Resultado de árvore de agrupamento de vizinhosdepois de um alinhamento múltiplo de seqüências de todos os polipeptídeosde fator de transcrição SPL de Arabidopsis thaliana e de ortólogos depolipeptídeo de fator de transcrição SPL15 usando CLUSTAL W (1.83) (emGenomeNet service no Kyoto University Bioinformatics Center), e valores depadrão (Blosum 62 como matriz de pontuação, penalidade de abertura delacuna de 10; penalidade de extensão de lacuna de 0,05). Polipeptídeo de fatorde transcrição SPL15 de Arabidopsis thaliana se agrupa com os outrosortólogos e parálogos de polipeptídeo de fator de transcrição SPL15, comomostrado pelos parênteses.
Fig. 23 mostra um alinhamento do domínio de ligação deDNA (DBD) de ortólogos e parálogos de polipeptídeo de fator de transcriçãoSPL15. As seqüências foram alinhadas usando programa AlignX de VectorNTI suite (InforMax, Bethesda, MD). Alinhamento múltiplo foi feito comuma penalidade de abertura de lacuna de 10 uma extensão de lacuna de 0,01.
Os resíduos Cys e His conservados envolvidos em ligação de íon de zincoestão envoltos. O sinal de localização nuclear (NLS) bipartido estásublinhado.
Fig. 24 é um alinhamento de ortólogos e parálogos depolipeptídeo de fator de transcrição SPL15. As seqüências foram alinhadasusando programa AlignX de Vector NTI suite (InforMax, Bethesda, MD).Alinhamento múltiplo foi feito com uma penalidade de abertura de lacuna deuma extensão de lacuna de 0,01. Edição manual secundária também foirealizada onde necessário para melhor posicionar algumas regiõesconservadas. Os três principais domínios caracterizados, de N-terminal a C-terminal, estão envoltos e identificados como Motivo 1, o domínio de ligaçãode DNA de SPL e Motivo 2. Adicionalmente, o trecho rico em G/Sprecedendo o SPL DBD é marcado com Xs e o tripeptídeo W(S/T)L naextremidade C-terminal do polipeptídeo também envolta.
Fig. 25 mostra um vetor binário pHMGB::SPL15, paraexpressão aumentada em Oryza sativa de um ácido nucleico codificando umpolipeptídeo de fator de transcrição SPL15 de Arabidopsis thaliana sob ocontrole de um promotor HMGB.
Fig. 26 detalha exemplos de seqüências úteis para realizar osmétodos de acordo com a presente invenção.
Exemplos
A presente invenção será agora descrita com referência aosseguintes exemplos, que estão como forma de ilustração apenas. Os seguintesexemplos não são pretendidos para definir completamente ou de outramaneira limitar o escopo da invenção.
Manipulação de DNA: a menos que de outra maneiradeterminado, técnicas de DNA recombinante são realizadas de acordo comprotocolos padrão descrito em (Sambrook (2001) Molecular Cloning: alaboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH,New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocolsin Molecular Biology, Current Protocols. Materiais e métodos padrão paratrabalho molecular com plantas são descritos em Plant Molecular BiologyLabfax (1993) por R.D.D. Croy, publicado por BIOS Scientific PublicationsLtd (UK) e Blackwell Scientific Publications (UK).
Exemplo seção A: HAL3
Exemplo 1: Identificação de seqüências relacionadas àseqüência de ácidos nucleicos usada nos métodos da invenção
Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas à seqüência de ácidos nucleicos usada nos métodosda presente invenção foram identificadas entre aquelas mantidas no banco dedados Entrez Nucleotides no National Center for Biotechnology Information(NCBI) usando ferramentas de busca de seqüência de banco de dados, talcomo a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et ai.(1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic AcidsRes. 25:3389-3402). O programa é usado para encontrar regiões desimilaridade local entre seqüências comparando seqüências de ácidosnucleicos ou polipeptídeos com banco de dados de seqüências e calculando asignificância estatística de pareamentos. Por exemplo, o polipeptídeocodificado pelo ácido nucleico da presente invenção foi usado para oalgoritmo TBLASTN, com configurações padrão e o filtro para ignoraracionamento de seqüências de baixa complexidade. O resultado da análise foivisto por comparação pareada, e ranqueado de acordo com o pontuação deprobabilidade (valor E), onde o pontuação reflete a probabilidade de que umalinhamento particular ocorra ao acaso (quanto menor o valor E, maissignificante o acerto). Em adição a valores E, comparações também forampontuadas por identidade percentual. Identidade percentual se refere aonúmero de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüênciasde ácidos nucleicos (ou polipeptídeos) comparadas ao longo de umcomprimento particular. Em algumas instâncias, os parâmetros padrão podemser ajustados para modificar a estringência da busca. Por exemplo o valor Epode ser aumentado para mostrar pareamentos menos estringentes. Destamaneira, pareamentos curtos praticamente exatos podem ser identificados.
Tabela A fornece uma lista de seqüências de ácidos nucleicosrelacionadas à seqüência de ácidos nucleicos usada nos métodos da presenteinvenção.
Tabela A: Exemplos de polipeptídeos HAL3:
<table>table see original document page 233</column></row><table>
Em algumas instâncias, seqüências relacionadas foramexperimentalmente agrupadas e publicamente descritas por instituições depesquisa, tal como The Institute for Genomic Research (TIGR). O banco dedados Eukaryotic Gene Orthologs (EGO) pode ser usado para identificar taisseqüências relacionadas, ou por busca de palavra chave ou usando o algoritmoBLAST com a seqüência de ácidos nucleicos ou polipeptídeos de interesse.
Exemplo 2: Clonagem da seqüência de ácidos nucleicosusada nos métodos da invenção
A seqüência de ácidos nucleicos usada nos métodos dainvenção foi amplificada por PCR usando como modelo uma biblioteca decDNA de plântulas de Arabidopsis thaliana feita sob encomenda (em pCMVSport 6.0; Invitrogen, Paisley, UK). PCR foi realizado usando Hifi Taq DNApolimerase em condições padrão, usando 200 ng de modelo em uma misturade PCR de 50 μΐ. Os iniciadores usados foram prm00957 (SEQ ID NO: 3;sentido, códon de início em negrito:
5' aaaaagcaggctcacaatggagaatgggaaaagagac 3')e prm00958 (SEQ ID NO: 4; reverso, complementar,:5' agaaagctgggttggttttaactagttccaccg 3'),o que inclui os sítios AttB para recombinação Gateway. Ofragmento de PCR amplificado foi purificado também usando métodospadrão. A primeira etapa do procedimento Gateway, a reação BP, foi entãorealizada, durante a qual o fragmento de PCR se recombina in vivo com oplasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway,um "clone de entrada", pHAL3. Plasmídeo pDONR201 foi adquirido a partirde Invitrogen, como parte da tecnologia Gateway®.
Exemplo 3: Construção de Vetor de ExpressãoO clone de entrada pHAL3 foi subseqüentemente usado emuma reação LR com pEXP, um vetor de destinação usado para transformaçãode Oryza sativa. Este vetor contém como elementos funcionais dentro doslimites de T-DNA: um marcador selecionável vegetal; uma gaveta deexpressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor de beta expansina de arroz (SEQID NO: 5) para expressão parte aérea específica foi localizado antes destagaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressãoresultante pEXP::HAL3 (Figura 2) foi transformado em cepa LBA4044 deAgrobacterium e subseqüentemente para plantas de Oryza sativa.
Exemplo 4: Transformação de cultura
As Agrobacterium transformadas contendo os vetores deexpressão foram usadas independentemente para transformar plantas de Oryzasativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbareforam descascadas. Esterilização foi realizada incubando por um minuto emetanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por umalavagem de 15 minutos por 6 vezes com água destilada estéril. As sementesestéreis foram então germinadas em um meio contendo 2,4-D (meio deindução de calo). Depois de incubação no escuro por quatro semanas, calosembriogênicos derivados de escutelo foram excisados e propagados nomesmo meio. Depois de duas semanas, os calos foram multiplicados oupropagados por subcultura no mesmo meio por outras 2 semanas. Pedaços decalo embriogênico foram subcultivados em meio fresco 3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.
Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.
Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação. Depois de uma análise dePCR quantitativo para verificar número de cópias do inserto de T-DNA,apenas plantas transgênicas de cópia única que exibem tolerância ao agente deseleção foram mantidas para colheita de semente TI. Sementes foram entãocoletadas três a cinco meses depois de transplante. O método produziutransformantes de locus único em uma taxa de até 50 % (Aldemita andHodges 1996, Chan et al. 1993, Hiei et al. 1994).
Transformação de milho
Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al 88 (University of Minnesota) ou híbridos com A188 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25°C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.
Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188).
A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobaeterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobaeterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2SO4, e 100 μm de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobaeterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Exemplo 5: Procedimento de avaliação
5.1 Configuração de avaliação
Aproximadamente 30 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.
Quatro eventos Tl foram adicionalmente avaliados na geraçãoT2 seguindo o mesmo procedimento de avaliação que para a geração Tl mascom mais indivíduos por evento. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.
5.2 Análise estatística: teste t e teste F
Uma ANOVA de dois fatores (análises de variância) foi usadacomo modelo estatístico para a avaliação geral de características fenotípicasvegetais. Um teste F foi realizado em todos os parâmetros medidos de todasas plantas de todos os eventos transformadas com o gene da presenteinvenção. O teste F foi realizado para verificar por um efeito do gene sobretodos os eventos de transformação e para verificar por um efeito geral dogene, também conhecido como um "efeito gênico global". O limiar parasignificância para um verdadeiro efeito gênico global foi ajustado em umnível de probabilidade de 5% para o teste F. Um valor significante de teste Faponta para um efeito gênico, significando que não é apenas a mera presençaou a posição do gene que está causando as diferenças em fenótipo.
Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sãoas plantas tratadas da mesma maneira que a planta transgênica, mas das quaiso transgene foi segregado. Plantas nulas também podem ser descritas como asplantas transformadas negativas homozigotas. O limiar para significância parao teste t é ajustado em 10% de nível de probabilidade. Os resultados paraalguns eventos podem estar acima ou abaixo deste limiar. Isto é baseado nahipótese de que um gene pode apenas ter um efeito em certas posições nogenoma, e que a ocorrência deste efeito dependente de posição não éincomum. Este tipo de efeito gênico é também chamado neste lugar um"efeito de cepa do gene". O valor de ρ é obtido comparando o valor de t coma distribuição de t ou alternativamente, comparando o valor de F com adistribuição de F. O valor de ρ então gera a probabilidade de que a hipótesenula (i.e., que não existe nenhum efeito do transgene) esteja correta.
Exemplo 6: Resultados de avaliação
As panículas primárias maduras foram coletadas, contadas,ensacadas, etiquetadas com código de barras e então secas por três dias emum forno a 37°C. As panículas foram então trilhadas e todas as sementesforam coletadas e contadas. As cascas cheias foram separadas daquelas vaziasusando um dispositivo que sopra ar. As cascas vazias foram descartadas e afração remanescente foi contada novamente. As cascas cheias foram pesadasem uma balança analítica. O número de grãos cheios foi determinadocontando o número de cascas cheias que permaneceram depois da etapa deseparação. A produção total de sementes (peso total de semente) foi medidapesando todas as cascas cheias coletadas de uma planta. Número total desementes por planta foi medido contando o número de cascas coletadas deuma planta. O índice de colheita (HI) na presente invenção é definido como aproporção entre a produção total de sementes e a parte aérea (mm2),multiplicada por um fator IO6. O número total de flores por panícula comodefinido na presente invenção é a proporção entre o número total de sementese o número de panículas primárias maduras. A taxa de enchimento de grãoscomo definida na presente invenção é a proporção (expressa como uma %) donúmero de grãos cheios sobre o número total de sementes (ou floretes).
Como apresentado em Tabela B, a produção de sementes,número de grãos cheios e índice de colheita são aumentados nas plantastransgênicas preferencialmente expressando um ácido nucleico codificandoum polipeptídeo HAL3 na parte aérea, comparado com plantas de controle.
Tabela B mostra o aumento médio de produção (peso total desemente), aumento em número de grãos cheios e aumento de índice decolheita em porcento, calculados a partir dos eventos transgênicoscomparados com plantas de controle, na geração Tl
Tabela B
<table>table see original document page 242</column></row><table>
Exemplo 7: Resultados de avaliação de vigor precoce
Vigor precoce foi determinado contando o número total depixels de partes aéreas vegetais discriminadas do fundo. Foi tirada a médiadeste valor para as fotos tiradas no mesmo momento de ângulos diferentes efoi convertido para um valor de superfície física expresso em mm quadradospor calibração. Os resultados descritos abaixo são para plantas três semanasapós germinação.
Vigor precoce vegetal (se determinado por área aérea) foi vistoem seis de sete eventos da geração TI, com um aumento geral em área aéreapara plântulas transgênicas de 27% comparado com plantas de controle.Quatro destes eventos Tl foram adicionalmente avaliados na geração T2, etodos estes quatro eventos geraram um aumento em área aérea para plântulastransgênicas comparado com plantas de controle, com um aumento geral emárea aérea para plântulas transgênicas de 33% comparado com plantas decontrole. Os resultados também mostraram ser estatisticamente significantescom o valor de ρ do teste F sendo menor do que 0,0001 (geração T2)indicando que o efeito observado provavelmente é deivo ao transgene aoinvés da posição do gene ou um efeito de cepa, veja tabela C.
Tabela C
<table>table see original document page 243</column></row><table>
Exemplo Seção B: MADS15 aumentado
Exemplo 8: Identificação de seqüências relacionadas a SEQID NO: 43 e SEQID NO: 44
Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas a SEQ ID NO: 43 e/ou seqüências protéicasrelacionadas a SEQ LD NO: 44 foram identificadas entre aquelas mantidas nobanco de dados Entrez Nucleotides no National Center for BiotechnologyInformation (NCBI) usando ferramentas de busca de seqüência de banco dedados, tal como a Ferramenta Básica de Alinhamento Local (BLAST)(Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997)Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrarregiões de similaridade local entre seqüências comparando seqüências deácidos nucleicos ou polipeptídeos com banco de dados de seqüências ecalculando a significância estatística de identidades. O polipeptídeocodificado por SEQ ID NO: 43 foi usado para o algoritmo TBLASTN, comconfigurações padrão e o filtro para ignorar contrapeso de seqüências de baixacomplexidade. O resultado da análise foi visto por comparação pareada, eranqueado de acordo com o pontuação de probabilidade (valor E), onde opontuação reflete a probabilidade de que um alinhamento particular ocorra aoacaso (quanto menor o valor E, mais significante o acerto). Em adição avalores E, comparações também foram pontuadas por identidade percentual.Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos)idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos)comparadas ao longo de um comprimento particular. Em algumas instâncias,os parâmetros padrão podem ser ajustados para modificar a estringência dabusca.
Em adição às seqüências de ácidos nucleicos disponíveispublicamente disponíveis em NCBI, bancos de dados particulares deseqüências também são procurados seguindo o mesmo procedimento quedescrito acima.
Tabela D fornece uma lista de seqüências de ácidos nucleicose de proteínas relacionadas à seqüência de ácidos nucleicos comorepresentada por SEQ ID NO: 43 e à seqüência de proteínas representada porSEQ ID NO: 44.Tabela D: Seqüências de ácidos nucleicos relacionadas àseqüência de ácidos nucleicos (SEQ ID NO: 43) úteis nos métodos dapresente invenção, e os polipeptídeos deduzidos correspondentes.
<table>table see original document page 245</column></row><table>
Exemplo 9: Alinhamento de seqüências de polipeptídeosrelevantes
AlignX do Vetor NTI (Invitrogen) é baseado no popularalgoritmo de Clustal de alinhamento progressivo (Thompson et ai. (1997)Nucleic Aeids Res 25:4876-4882; Chenna et al. (2003). Nueleie Aeids Res31:3497-3500). Uma árvore filogenétiea pode ser construída usando umalgoritmo de agrupamento de vizinhos. Valores padrão são para a penalidadede abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 ea matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados).
O resultado do alinhamento múltiplo de seqüências usandopolipeptídeos relevantes para identificar aqueles úteis para realizar osmétodos da invenção é mostrado em Figura 6.
Exemplo 10: Cálculo de identidade percentual global entreseqüências de polipeptídeos de úteis para realizar os métodos da invenção
Porcentagens globais de similaridade e identidade entreseqüências de polipeptídeos de comprimento completo úteis para realizar osmétodos da invenção foram determinadas usando um dos métodos disponíveisna arte, o aplicativo computacional MatGAT (Ferramenta de AlinhamentoGlobal de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an applicationthat generates similarity/identity matrices using protein or DNA sequences.Campanella JJ5 Bitincka L, Smalley J; aplicativo computacional hospedadopor Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes desimilaridade/identidade para seqüências de DNA ou proteína sem precisar depré-alinhamento dos dados. O programa realiza uma série de alinhamentospareados usando o algoritmo de alinhamento global de Myers e Miller (comuma penalidade de abertura de lacuna de 12, e uma penalidade de extensão delacuna de 2), calcula similaridade e identidade usando por exemplo Blosum62 (para polipeptídeos), e então coloca os resultados em uma matriz dedistância. Similaridade de seqüências é mostrada na metade de baixo da linhadivisora e identidade de seqüência é mostrada na metade de cima da linhadivisora diagonal.Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62
PrimeiraLacuna: 12
Lacuna de extensão: 2
Resultados da análise de aplicativo computacional sãomostrados em Tabela E para a similaridade e identidade global nocomprimento completo das seqüências de polipeptídeos (excluindo asseqüências de polipeptídeos parciais). Identidade percentual é dada acima dadiagonal e similaridade percentual é dada abaixo da diagonal.
A identidade percentual entre as seqüências de polipeptídeosde úteis para realizar os métodos da invenção pode ser tão baixa quanto 40 %de identidade de aminoácidos comparada com SEQ ID NO: 44.
Tabela E: Resultados de MatGAT para similaridade eidentidade global no comprimento completo das seqüências de polipeptídeos.
<table>table see original document page 247</column></row><table><table>table see original document page 248</column></row><table>
Exemplo 11: Identificação de domínios compreendidos emseqüências de polipeptídeos de úteis para realizar os métodos da invenção
O banco de dados Integrated Resource of Protein Families,Domains and Sites (InterPro) é uma interface integrada para os bancos dedados de assinatura comumente usados para buscas baseadas em texto eseqüência. O banco de dados InterPro combina estes bancos de dados, queusam diferentes metodologias e graus variados de informação biológica sobreproteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos dedados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL5 PRINTS,ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no EuropeanBioinformatics Institute no Reino Unido.
Os resultados da varredura de InterPro da seqüência depolipeptídeos como representada por SEQ ID NO: 44 são apresentados emTabela F.Tabela F: Resultados de varredura de InterPro da seqüênciade polipeptídeos como representada por SEQ ID NO: 44
Banco de dados Número de acesso Nome de acessoPRINTS PR00404 MAD S DOMA INPFAM PF00319 SRF-TFSMART SM00432 MADSPROFILE PS50066 MADS BOX 2SUPERF AMILY SSF55455 SRF-IikePFAM PFO1486 K-boxSUPERF AMILY SSF46589 tRNA-binding armPANTHER PTHRl 1945 MADS BOX PROTEINPANTHER PTHRl 1945:SF19 MADS BOX PROTEIN
Exemplo 12: Previsão de topologia das seqüências depolipeptídeos de úteis para realizar os métodos da invenção (localizaçãosubcelular, transmembrana...)
TargetP 1.1 prevê a localização subcelular de proteínaseucariotas. A designação de localização é baseada na presença prevista dequalquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto(cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal devia secretora (SP). Pontuaçãos nos quais a previsão final está baseada não sãoprobabilidades realmente, e eles não necessariamente adicionam a uma.Entretanto, a localização com o maior pontuação é a mais provável de acordocom TargetP, e a relação entre os pontuaçãos (a classe de confiança) pode seruma indicação de quão certa é a previsão. A classe de confiança (RC) varia de1 a 5, onde 1 indica a previsão mais forte. TargetP é mantido no servidor daTechnical University of Denmark.
Para as seqüências previstas conterem uma pré-seqüência N-terminal um sítio de clivagem potencial também pode ser previsto.
Diversos parâmetros foram selecionados, tal como grupo deorganismo (não vegetal ou vegetal), conjuntos de atalhos (nenhum, conjuntopré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e ocálculo de previsão de sítios de clivagem (sim ou não).
Os resultados de análise TargetP 1.1 da seqüência depolipeptídeos como representada por SEQ ID NO: 44 são apresentados emTabela G. O grupo de organismo "vegetal" foi selecionado, nenhum atalhodefinido, e o comprimento previsto do peptídeo de trânsito requisitado. Alocalização subcelular da seqüência de polipeptídeos como representada porSEQ ID NO: 44 pode ser o citoplasma ou núcleo, nenhum peptídeo de trânsitoé previsto.
Tabela G: Análise TargetP 1.1 da seqüência de polipeptídeoscomo representada por SEQ ID NO: 44
<table>table see original document page 250</column></row><table>
Muitos outros algoritmos podem ser usados para realizar taisanálises, incluindo:
· ChloroP 1.1 hospedado no servidor da TechnicalUniversityofDenmark;
• Protein Prowler Subcellular Localisation Predictor versão1.2 hospedado no servidor do Institute for Molecular Bioscience, Universityof Queensland, Brisbane, Austrália;
· PENCE Proteome Analyst PA-GOSUB 2.5 hospedado noservidor da University of Alberta, Edmonton, Alberta, Canadá;
• TMHMM, hospedado no servidor da Technical Universityof Denmark
Exemplo 13: Ensaio relacionado às seqüências depolipeptídeos de úteis para realizar os métodos da invençãoLim et al. (PMB 44, 513-527, 2000) descrevem dois ensaiospara medir interações proteína-proteína que podem ser aplicados a MADS15.No ensaio de dois híbridos de levedura, uma forma truncada de MADSl(compreendendo o MADS Box completo, o domínio IeK mas carecendo daparte C-terminal do domínio C) foi usada como isca para testar interação comMADS15. No ensaio de precipitação in vitro, GST e proteínas MADSlfusionadas a GST foram produzidas e imobilizadas em glutationa Sepharose4B. O GST/GST-MADS1 ligado em resina foi misturado com proteínasMADS15 marcadas com S ou fragmentos destas. Depois de lavagem, asproteínas de interação foram eluídas e analisadas por SDS-PAGE. Umapessoa versada na arte irá perceber que a proteína MADS15 pode ser usadacomo isca na triagem de dois híbridos ou pode ser imobilizada em resina deglutationa também. Além disso, uma proteína MADS15, quando usada deacordo com os métodos da presente invenção, irá resultar em produçãoaumentada de raízes em arroz, medida como uma proporção aumentada debiomassa de raiz sobre biomassa de parte aérea.
Exemplo 14: Clonagem de seqüência de ácidos nucleicoscomo representada por SEQID NO: 43
O gene MADS15 de Oryza sativa foi amplificado por PCRusando como modelo uma biblioteca de cDNA de plântula de Oryza sativa(Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído deplântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio deinserto do banco foi 1,5 kb e o número original de clones foi da ordem de 1,59χ 10 cfu. Título original foi determinado como sendo 9,6 χ 10 cfü/ml depoisde primeira amplificação de 6 χ IO11 cfu/ml. Depois de extração deplasmídeo, 200 ng de modelo foi usado em uma mistura de PCR de 50 μΐ.Iniciadores prm06892 (SEQ ID NO: 45; sentido, códon de início em negrito,sítio AttBl em itálico: S^ggggacaagtttgtacaaaaaagcaggcttaaaeaatgggcgggggaaggt-3') e prm06893 (SEQ ID NO: 46; reverso, complementar,sítio AttB2 em itálico: 5'-ggggaccactttgtacaagaaagctgggtttggccga.cga.cgacg3iC-3'), o que inclui os sítiosAttB para recombinação Gateway, foram usados para amplificação por PCR.PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão.Um fragmento de PCR de cerca de 915 bp foi amplificado e purificadotambém usando métodos padrão. A primeira etapa do procedimento Gateway,a reação BP, foi então realizada, durante a qual o fragmento de PCR serecombina in vivo com o plasmídeo pDC)NR201 para produzir, de acordocom a terminologia Gateway, um "clone de entrada", pMADS15. PlasmídeopDC)NR201 foi adquirido a partir de Invitrogen, como parte da tecnologiaGateway®.
Exemplo 15: Construção de vetor de expressão usando aseqüência de ácidos nucleicos as representados por SEQID NO: 43
O clone de entrada pMADS15 foi subseqüentemente usado emuma reação LR com pGOS2, um vetor de destinação usado paratransformação de Oryza sativa. Este vetor contém como elementos funcionaisdentro dos limites de T-DNA: um marcador selecionável vegetal; uma gavetade expressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 108,alternativamente, SEQ ID NO: 47 é igualmente útil) para expressãoconstitutiva foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressãoresultante pGOS2::MADS15 (Figura 7) foi transformado em cepa LBA4044de Agrobacterium de acordo com métodos bem conhecidos na arte.
Exemplo 16: Transformação de planta
Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada paratransformar plantas de Oryza sativa. Sementes maduras secas da cultivarjaponesa de arroz Nipponbare foram descascadas. Esterilização foi realizadaincubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2%de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com águadestilada estéril. As sementes estéreis foram então germinadas em um meiocontendo 2,4-D (meio de indução de calo). Depois de incubação no escuro porquatro semanas, calos embriogênicos derivados de escutelo foram excisados epropagados no mesmo meio. Depois de duas semanas, os calos forammultiplicados ou propagados por subcultura no mesmo meio por outras 2semanas. Pedaços de calo embriogênico foram subcultivados em meio fresco3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD60o) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.
Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação. Depois de uma análise dePCR quantitativo para verificar número de cópias do inserto de T-DNA,apenas plantas transgênicas de cópia única que exibem tolerância ao agente deseleção foram mantidas para colheita de semente TI. Sementes foram entãocoletadas três a cinco meses depois de transplante. O método produziutransformantes de locus único em uma taxa de até 50 % (Aldemita andHodges 1996, Chan et al. 1993, Hiei et al. 1994).
Transformação de milho
Transformação de milho {Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al 88 (University of Minnesota) ou híbridos com Al 88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25°C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25°C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188).
A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 1OO μιτι de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobaeterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Exemplo 17: Procedimento de avaliação fenotípica
17.1 Configuração de avaliação
Aproximadamente 35 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Seis eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.
As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.
Quatro eventos Tl foram adicionalmente avaliados na geraçãoT2 seguindo o mesmo procedimento de avaliação que para a geração Tl mascom mais indivíduos por evento. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.
17.2 Análise estastística: teste F
Uma ANOVA de dois fatores (análises de variância) foi usadacomo um modelo estatístico para a avaliação geral de característicasfenotípicas vegetais. Um teste F foi realizado em todos os parâmetrosmedidos de todas as plantas de todos os eventos transformadas com o gene dapresente invenção. O teste F foi realizado para verificar por um efeito do genesobre todos os eventos de transformação e para verificar por um efeito geraldo gene, também conhecido como efeito gênico global. O limiar parasignificância para um verdadeiro efeito gênico global é ajustado em 5% denível de probabilidade para o teste F. Um valor significante de teste F apontapara um efeito gênico, significando que não é apenas a mera presença ou aposição do gene que está causando as diferenças em fenótipo.
Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sãoas plantas tratadas da mesma maneira que a planta transgênica, mas das quaiso transgene foi segregado. Plantas nulas também podem ser descritas como asplantas transformadas negativas homozigotas. O limiar para significância parao teste t é ajustado em 10% de nível de probabilidade. Os resultados paraalguns eventos podem estar acima ou abaixo deste limiar. Isto é baseado nahipótese de que um gene pode apenas ter um efeito em certas posições nogenoma, e que a ocorrência deste efeito dependente de posição não éincomum. Este tipo de efeito gênico é também chamado neste lugar um"efeito de cepa do gene". O valor de ρ é obtido comparando o valor de t coma distribuição de t ou alternativamente, comparando o valor de F com adistribuição de F. O valor de ρ então gera a probabilidade de que a hipótesenula (i.e., que não existe nenhum efeito do transgene) esteja correta.
17.3 Parâmetros medidos
Do estágio de semeadura até o estágio de maturidade asplantas foram passadas diversas vezes através de uma gabinete de imagemdigital. Em cada momento imagens digitais (2048x1536 pixels, 16 milhões decores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A parte aérea de planta (ou biomassa de folhas) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A parte aérea é a áreamedida no momento no qual a planta atingiu sua biomassa de folhas máxima.O vigor precoce é a área aérea de planta (plântula) três semanas apósgerminação. Aumento em biomassa de raiz é expresso como um aumento embiomassa total de raiz (medida como biomassa máxima de raízes observadadurante o tempo de vida de uma planta); ou como um aumento no índiceraiz/parte aérea (medido como a proporção entre biomassa de raiz e biomassade parte aérea no período de crescimento ativo de raiz e parte aérea).
Exemplo 18: Resultados da avaliação fenotípica das plantastransgênicas
Mediante análise das plantas como descrito acima, osrequerentes encontraram que plantas transformadas com a construção de geneMADS15 tiveram uma maior produção de raízes, expressa como índiceraiz/parte aérea, comparada com plantas carecendo do transgene MADSl 5. Oaumento foi de 9,4% (valor de ρ 0,0207) em Tl e 25,7% (valor de ρ 0,002)em T2. Os valores de ρ mostram que os aumentos foram significantes.
Exemplo seção C: MADS15 diminuído
Veja também Exemplos 8 a 13 para a identificação ecaracterização de seqüência relacionadas a MADS15.
Exemplo 19: Clonagem gênica
O gene MADS15 de Oryza sativa foi amplificado por PCRusando como modelo uma biblioteca de cDNA de plântula de Oryza sativa(Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído deplântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio deinserto do banco foi de 1,5 kb e o número original de clones foi da ordem de1,59 χ IO7 cfii. Título original foi determinado como sendo 9,6 χ IO5 cfu/mldepois de primeira amplificação de 6 χ IO11 cfu/ml. Depois de extração deplasmídeo, 200 ng de modelo foi usado em uma mistura de PCR de 50 μΐ.Iniciadores prm06892 (SEQ ID NO: 111; sentido, códon de início em negrito,sítio AttBl em itálico: '-ggggacaagtttgtacaaaaaagcaggcttaaacaatgggcgggggaaggt-3') e prm06893 (SEQ ID NO: 112; reverso, complementar, sítioAttB2 em itálico:
5' -ggggaccactttgtacaagaaagctgggttíggccgacgacgacgac-3'), oque inclui os sítios AttB para recombinação Gateway, foram usados paraamplificação por PCR. PCR foi realizado usando Hifi Taq DNA polimeraseem condições padrão. Um fragmento de PCR de cerca de 915 bp foiamplificado e purificado também usando métodos padrão. O fragmento dePCR foi subseqüentemente usado para a preparação de uma construção emforma de grampo, usando técnicas conhecidas na arte. A primeira etapa doprocedimento Gateway, a reação BP, foi então realizada, durante a qual aconstrução em forma de grampo se recombina in vivo com o plasmídeopDONR201 para produzir, de acordo com a terminologia Gateway, um "clonede entrada", pMADS15hp. Plasmídeo pDONR201 foi adquirido a partir deInvitrogen, como parte da tecnologia Gateway®.
Exemplo 20: Construção de Vetor
O clone de entrada pMADS15hp foi subseqüentemente usadoem uma reação LR com p01519, um vetor de destinação para a construçãocom repetição invertida. Este vetor contém como elementos funcionais dentrodos limites de T-DNA: um marcador selecionável vegetal; uma gaveta deexpressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR de forma que a seqüência de interesse do clone deentrada é integrada como uma repetição invertida. Um promotor GOS2 dearroz (SEQ ID NO: 174, alternativamente, SEQ ID NO: 113 é igualmenteútil) para expressão constitutiva foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressãoresultante com a repetição invertida, Figura 10) foi transformado em cepaLBA4044 de Agrobacterium e subseqüentemente para plantas de Oryzasativa.
Exemplo 21: Transformação de planta
Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada paratransformar plantas de Oryza sativa. Sementes maduras secas da cultivarjaponesa de arroz Nipponbare foram descascadas. Esterilização foi realizadaincubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2%de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com águadestilada estéril. As sementes estéreis foram então germinadas em um meiocontendo 2,4-D (meio de indução de calo). Depois de incubação no escuro porquatro semanas, calos embriogênicos derivados de escutelo foram excisados epropagados no mesmo meio. Depois de duas semanas, os calos forammultiplicados ou propagados por subcultura no mesmo meio por outras 2semanas. Pedaços de calo embriogênico foram subcultivados em meio fresco3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 250C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.
Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação. Depois de uma análise dePCR quantitativo para verificar número de cópias do inserto de T-DNA,apenas plantas transgênicas de cópia única que exibem tolerância ao agente deseleção foram mantidas para colheita de semente TL Sementes foram entãocoletadas três a cinco meses depois de transplante. O método produziutransformantes de locus único em uma taxa de até 50 % (Aldemita andHodges 1996, Chan et ai 1993, Hiei et al. 1994).
Transformação de milho
Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al88 (University of Minnesota) ou híbridos com Al88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.
Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).
As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de trigoTransformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 100 |im de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Exemplo 22: Métodos de avaliação de plantas transformadascom a repetição invertida de MADS15 sob controle do promotor GOS2 dearroz
Aproximadamente 15 a 20 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Oito eventos para a construção de repetição invertidados quais a progênie Tl segregou 3:1 para presença/ausência do transgene,foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas Tlcontendo o transgene (hetero e homozigotos) e aproximadamente 10 plântulasTl carecendo do transgene (nulizigotos) foram selecionadas monitorandoexpressão de marcador visual. As plantas Tl selecionadas foram transferidaspara uma casa de vegetação. Cada planta recebeu um código de barrasexclusivo para se ligar inequivocamente os dados de fenotipagem para aplanta correspondente. As plantas Tl selecionadas forma cultivadas em soloem potes de diâmetro de 10 cm nas seguintes configurações ambientais:fotoperíodo= 11,5 h, intensidade diurna= 30.000 Iux ou mais, temperaturadiurna= 28°C ou mais, temperatura noturna = 22°C, umidade relativo = 60-70%. Plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.
A parte aérea de planta (ou biomassa de folhas) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A Areamax é a áreaaérea no momento no qual a planta atingiu sua biomassa de folhas máxima.
As panículas primárias maduras foram coletadas, ensacadas,etiquetadas com código de barras e então secas por três dias no forno a 37°C.
As panículas foram então trilhadas e todas as sementes coletadas. As cascascheias foram separadas daquelas vazias usando um dispositivo que sopra ar.Depois de separação, ambos os lotes de sementes foram então contadosusando uma máquina de contagem disponível comercialmente. As cascasvazias foram descartadas. As cascas cheias foram pesadas em uma balançaanalítica e a área seccional cruzada das sementes foi medida usandoimageamento digital. Este procedimento resultou no estabelecimento dosseguintes parâmetros relacionados a sementes:
As flores por panícula é um parâmetro estimando o númeromédio de floretes por panícula em uma planta, derivado do número desementes total dividido pelo número de primeiras panículas. A panícula maisalta e todas as panículas que se sobrepõe com a panícula mais alta quandoalinhadas verticalmente, foram consideradas as primeiras panículas e foramcontadas manualmente. O número de grãos cheios foi determinado contando onúmero de cascas cheias que permaneceram depois da etapa de separação. Aprodução total de sementes (peso total de semente) foi medida pesando todasas cascas cheias coletadas de uma planta. Número total de sementes porplanta foi medido contando o número de cascas coletadas de uma planta ecorresponde ao número de floretes por planta. Estes parâmetros foramderivados de uma maneira automatizada a partir das imagens digitais usandoaplicativo computacional de análise de imagem e foram analisadosestatisticamente. Parâmetros individuais de sementes (incluindo largura,comprimento, área, peso) foram medidos usando um dispositivo feito sobencomenda consistindo de dois componentes principais, um dispositivo depesagem e imageamento, acoplado a aplicativo computacional para análise deimagem.Uma ANOVA de dois fatores (análises de variância) corrigidapara o modelo não equilibrado foi usada como modelo estatístico para aavaliação geral de características fenotípicas vegetais. Um teste F foirealizado em todos os parâmetros medidos de todas as plantas de todos oseventos transformadas com aquele gene. O teste F foi realizado para verificarpor um efeito do gene sobre todos os eventos de transformação e paraverificar por um efeito geral do gene, também chamado neste lugar "efeitogênico global". Se o valor do teste F mostra que os dados são significantes,então foi concluído que houve um efeito "gênico", significando que não foiapenas presença ou a posição do gene que estava causando o efeito. O limiarpara significância para um verdadeiro efeito gênico global foi ajustado em umnível de probabilidade de 5% para o teste F.
Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sereferem a plantas tratadas da mesma maneira que a planta transgênica, masdas quais o transgene foi segregado. Plantas nulas também podem serdescritas como as plantas transformadas negativas homozigotas. O limiar parasignificância para o teste t foi ajustado em um nível de probabilidade de 10%.
Os resultados para alguns eventos podem estar acima ou abaixo deste limiar.Isto é baseado na hipótese de que um gene pode apenas ter um efeito emcertas posições no genoma, e que a ocorrência deste efeito dependente deposição não é incomum. Este tipo de efeito gênico é também chamado nestelugar de um "efeito de cepa do gene". O valor de ρ foi obtido comparando ovalor de t com a distribuição de t ou alternativamente, comparando o valor deF com a distribuição de F. O valor de ρ então gera a probabilidade de que ahipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.
Exemplo 23: mensuração de parâmetros relacionados àprodução para os transformantes de construção com repetição invertida:
Mediante análise das sementes como descrito acima, osrequerentes encontraram que plantas transformadas com a construção emforma de grampo de gene MADS15 tinham uma maior produção de sementes,expressa como número de grãos cheios, peso total de sementes, número totalde sementes, e flores por panícula, comparadas com plantas carecendo dotransgene MADSl 5, ao passo que as plantas transformadas com a construçãode gene MADS15 sentido mostraram efeitos opostos. Os valores de ρ mostramque os aumentos foram significantes.
Os resultados obtidos para plantas na geração Tl estãoresumidos em Tabela H, os quais representam os valores médios para todas aslinhagens testadas:
Tabela H:
<table>table see original document page 270</column></row><table>
Exemplo Seção D: PLT
Exemplo 24: Identificação de seqüências relacionadas a aseqüência de ácidos nucleicos usada nos métodos da invenção
Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas a a seqüência de ácidos nucleicos usada nos métodosda presente invenção foram identificadas entre aquelas mantidas no banco dedados Entrez Nucleotides no National Center for Biotechnology Information(NCBI) usando ferramentas de busca de seqüência de banco de dados, talcomo a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al.(1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res.25:3389-3402). O programa é usado para encontrar regiões de similaridadelocal entre seqüências comparando seqüências de ácidos nucleicos oupolipeptídeos com banco de dados de seqüências e calculando a significânciaestatística de identidades. Por exemplo, o polipeptídeo codificado pelo ácidonucleico da presente invenção foi usado para o algoritmo TBLASTN, comconfigurações padrão e o filtro para ignorar contrapeso de seqüências de baixacomplexidade. O resultado da análise foi visto por comparação pareada, eranqueado de acordo com o pontuação de probabilidade (valor E), onde opontuação reflete a probabilidade de que um alinhamento particular ocorra aoacaso (quanto menor o valor E, mais significante o acerto). Em adição avalores E, comparações também foram pontuadas por identidade percentual.
Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos)idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos)comparadas ao longo de um comprimento particular. Em algumas instâncias,os parâmetros padrão podem ser ajustados para modificar a estringência dabusca. Por exemplo o valor E pode ser aumentado para mostrar pareamentosmenos estringentes. Desta maneira, pareamentos curtos praticamente exatospodem ser identificados.
A Tabela I abaixo fornece uma lista de seqüências de ácidosnucleicos relacionadas à seqüência de ácidos nucleicos usada nos métodos dapresente invenção.
Tabela I: seqüências de ácidos nucleicos relacionadas àseqüência de ácidos nucleicos usada nos métodos da presente invenção
<table>table see original document page 271</column></row><table><table>table see original document page 272</column></row><table>
Em algumas instâncias, seqüências relacionadas foramexperimentalmente agrupadas e publicamente descritas por instituições depesquisa, tal como The Institute for Genomic Research (TIGR). O banco dedados Eukaryotic Gene Orthologs (EGO) pode ser usado para identificar tais- 5 seqüências relacionadas, ou por busca de palavra chave ou usando o algoritmoBLAST com a seqüência de ácidos nucleicos ou polipeptídeos de interesse.
Exemplo 25: Clonagem das seqüências de ácidos nucleicosusadas nos métodos da invenção
As seqüências de ácidos nucleicos usadas nos métodos dainvenção foram amplificadas por PCR usando como modelo uma bibliotecade cDNA de Arabidopsis thaliana feita sob encomenda começando do RNAextraído de diferentes tecidos (em pCMV Sport 6.0; Invitrogen, Paisley, UK).PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão,usando 200 ng de modelo em uma mistura de PCR de 50 μΐ. Os iniciadoresusados para amplificar SEQ ID NO: 175 (PLTl) foram prm08180 (SEQ IDNO: 195; sentido, códon de início em negrito, sítio AttBl em itálico: 5'GGGGACAAGTTTGTA
CAAAAAAGCAGGCTTAAACAATGATCAATCCACACGGTG 3') eprm08181 (SEQ ID NO: 196; reverso, complementar, sítio AttB2 em itálico:5' GGGGA CCA CTTTGTA CAA GAAA GCTGGG7TCCTTGTTTACTCATTCCACA 3'), o que inclui os sítios AttBpara recombinação Gateway. Os iniciadores usados para amplificar SEQ IDNO: 177 (PLT2) foram prm08182 (SEQ ID NO: 197; sentido, códon de inícioem negrito, sítio AttBl em itálico: 5'GGGGA CAA GTTTGTA CAA AAAA GCA GGCTTAAA CA ATG AATTCTAAC AACTGGCTC 3') e prm08183 (SEQ ID NO: 198; reverso, complementar, sítioAttB2 em itálico: 5'GGGGA CCA CTTTGTA CAA GAAA GC7GGG7TC ATCTTTTATTC ATTCC ACA 3'),
Os fragmentos de PCR amplificados foram purificadostambém usando métodos padrão. A primeira etapa do procedimento Gateway,a reação BP, foi então realizada, durante a qual o fragmento de PCR serecombina in vivo com o plasmídeo pDONR2()l para produzir, de acordocom a terminologia Gateway, um "clone de entrada", pPLTl para SEQ IDNO: 175 e pPLT2 para SEQ ID NO: 177. Plasmídeo pDONR2()l foiadquirido a partir de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 26: Construção de Vetor de Expressão
Os clones de entrada pPLTl e pPLT2 foram subseqüentementeusados em uma reação LR com vetores de destinação usados paratransformação de Oryza sativa. Um primeiro vetor contém como elementosfuncionais dentro dos limites de T-DNA: um marcador selecionável vegetal;uma gaveta de expressão de marcador rastreável; e uma gaveta Gatewaypretendida para recombinação in vivo LR com a seqüência de ácidosnucleicos de interesse já clonada no clone de entrada. Um promotorconstitutivo de arroz, um promotor GOS2 (SEQ ID NO: 210, alternativamenteSEQ ID NO: 194 é igualmente útil) foi localizado antes desta gavetaGateway.
Um segundo vetor contém os mesmos elementos funcionaisdentro dos limites de T-DNA: um marcador selecionável vegetal; uma gavetade expressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor de arroz para expressão emmeristemas, um promotor MT (SEQ ID NO: 211) (PR00126) foi localizadoantes desta gaveta Gateway.
Depois da etapa de recombinação LR5 os vetores de expressãoresultantes, pGOS2::PLTl, pGOS2; PLT2, pMT::PLTl e pMT::PLT2 (Figura16 mostra a construção com o promotor GOS2) foram independentementetransformados em cepa LBA4044 de Agrobacterium e subseqüentemente paraplantas de Oryza sativa. Plantas de arroz transformadas foram deixadascrescendo e foram entào examinadas para os parâmetros descritos abaixo.
Exemplo 27: Transformação de cultura
As Agrobacterium transformadas contendo os vetores deexpressão foram usadas independentemente para transformar plantas de Oryzasativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbareforam descascadas. Esterilização foi realizada incubando por um minuto emetanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por umalavagem de 15 minutos por 6 vezes com água destilada estéril. As sementesestéreis foram então germinadas em um meio contendo 2,4-D (meio deindução de calo). Depois de incubação no escuro por quatro semanas, calosembriogênicos derivados de escutelo foram excisados e propagados nomesmo meio. Depois de duas semanas, os calos foram multiplicados oupropagados por subcultura no mesmo meio por outras 2 semanas. Pedaços decalo embriogênico foram subcultivados em meio fresco 3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD600) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.
Aproximadamente 35 transformantes TO de arrozindependentes foram gerados para uma construção. Os transformantesprimários foram transferidos de uma câmara de cultura de tecido para umacasa de vegetação. Depois de uma análise de PCR quantitativo para verificarnúmero de cópias do inserto de T-DNA, apenas plantas transgênicas de cópiaúnica que exibem tolerância ao agente de seleção foram mantidas paracolheita de semente TI. Sementes foram então coletadas três a cinco mesesdepois de transplante. O método produziu transformantes de locus único emuma taxa de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei etal. 1994).
Transformação de milho
Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural A188 (University of Minnesota) ou híbridos com A188 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.
Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.
Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188).
A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.
Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2SO4, e 100 |im de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Exemplo 28: Procedimento de avaliação fenotípica
28.1 Configuração de avaliação
Avaliação em condições normais de cultivo
Os transformantes primários foram transferidos de uma câmarade cultura de tecido para uma casa de vegetação para cultivo e colheita desemente TI. Seis eventos, dos quais a progênie Tl segregou 3:1 parapresença/ausência do transgene, foram retidos. Para cada um destes eventos,aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.
Avaliação em condições de disponibilidade reduzida denitrogênioAs plantas de arroz foram cultivadas em terra para vaso comoem condições normais exceto para a solução nutritiva. Os potes forammolhados de transplante até maturação com uma solução nutritiva específicacontendo teor reduzido de N nitrogênio (N), normalmente entre 7 a 8 vezesmenos. O resto do cultivo (maturação vegetal, coleta de sementes) foi omesmo que para plantas não cultivadas sob estresse abiótico.
28.2 Análise estastística: teste F
Uma ANOVA de dois fatores (análises de variância) foi usadacomo um modelo estatístico para a avaliação geral de característicasfenotípicas vegetais. Um teste F foi realizado em todos os parâmetrosmedidos de todas as plantas de todos os eventos transformadas com o gene dapresente invenção. O teste F foi realizado para verificar por um efeito do genesobre todos os eventos de transformação e para verificar por um efeito geraldo gene, também conhecido como efeito gênico global. O limiar parasignificância para um verdadeiro efeito gênico global foi ajustado em umnível de probabilidade de 5% para o teste F. Um valor significante de teste Faponta para um efeito gênico, significando que não é apenas a mera presençaou posição do gene que está causando as diferenças em fenótipo.
Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sereferem a plantas tratadas da mesma maneira que a planta transgênica, masdas quais o transgene foi segregado. Plantas nulas também podem serdescritas como as plantas transformadas negativas homozigotas. O limiar parasignificância para o teste t foi ajustado em um nível de probabilidade de 10%.
Os resultados para alguns eventos podem estar acima ou abaixo deste limiar.Isto é baseado na hipótese de que um gene pode apenas ter um efeito emcertas posições no genoma, e que a ocorrência deste efeito dependente deposição não é incomum. Este tipo de efeito gênico é também chamado nestelugar de um "efeito de cepa do gene". O valor de ρ foi obtido comparando ovalor de t com a distribuição de t ou alternativamente, comparando o valor deF com a distribuição de F. O valor de ρ então gera a probabilidade de que ahipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.
28.3 Parâmetros medidos
Mensuração de parâmetro relacionado a biomassa
Do estágio de semeadura até o estágio de maturidade asplantas foram passadas diversas vezes através de uma gabinete de imagemdigital. Em cada momento imagens digitais (2048x1536 pixels, 16 milhões decores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A área aérea de planta (ou biomassa de folhas, areamax) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.
Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A parte aérea é a áreamedida no momento no qual a planta atingiu sua biomassa de folhas máxima.
O vigor precoce é a área aérea de planta (plântula) três semanas apósgerminação. Aumento em biomassa de raiz é expresso como um aumento embiomassa total de raiz (medida como biomassa máxima de raízes observadadurante o tempo de vida de uma planta); ou como um aumento no índiceraiz/parte aérea (medido como a proporção entre massa radicular e massa departe aérea no período de crescimento ativo de raiz e parte aérea).
Mensurações de parâmetros relacionados a semente
As panículas primárias maduras foram coletadas, contadas,ensacadas, etiquetadas com código de barras e então secas por três dias emum forno a 37°C. As panículas foram então trilhadas e todas as sementesforam coletadas e contadas. As cascas cheias foram separadas daquelas vaziasusando um dispositivo que sopra ar. As cascas vazias foram descartadas e afração remanescente foi contada novamente. As cascas cheias foram pesadasem uma balança analítica. O número de grãos cheios foi determinadocontando o número de cascas cheias que permaneceram depois da etapa deseparação. A produção total de sementes foi medida pesando todas as cascascheias coletadas de uma planta. Número total de sementes por planta foimedido contando o número de cascas coletadas de uma planta. Peso de milsementes (TKW) é extrapolado a partir do número de grãos cheios contados eseu peso total. O índice de colheita (HI) na presente invenção é definido comoa proporção entre a produção total de sementes e a parte aérea (mm2),multiplicada por um fator IO6. O número total de flores por panícula comodefinido na presente invenção é a proporção entre o número total de sementese o número de panículas primárias maduras. A taxa de enchimento de grãoscomo definida na presente invenção é a proporção (expressa como uma %) donúmero de grãos cheios sobre o número total de sementes (ou floretes).
Exemplo 29: Resultados da avaliação fenotípica das plantastransgênicas
29.1 Resultados da avaliação fenotípica das plantastransgênicas cultivadas em condições normais de cultivo, expressando ouseqüência de ácidos nucleicos PLTl ou PLT2 sob o controle de um promotorconstitutivo
Os resultados da mensuração de TKW das sementes Tl deplantas de arroz transgênicas PLTl e PLT2 cultivadas em condições normaisde cultivo, são mostrados em Tabela J, em valores absolutos (média doseventos) e como uma porcentagem comparada a plantas tipo selvagem. Umaumento substancial em TKW é observado para as sementes transgênicascontendo qualquer construção, comparado com sementes tipo selvagem.Tabela J: Resultados de mensurações de TKW das sementesTl de Plantas transgênicas PLTl e PLT2 cultivadas em condições normais decultivo.
<table>table see original document page 283</column></row><table>
Parâmetros individuais de sementes (incluindo largura,comprimento, área, peso) foram medidos usando um dispositivo feito sobencomenda consistindo de dois componentes principais, um dispositivo depesagem e imageamento, acoplado a aplicativo computacional para análise deimagem.
Os resultados de mensuração de área de semente ecomprimento de semente das sementes Tl de plantas de arroz transgênicasPLTl e PLT2 são mostrados em Tabela K em valores absolutos (média doseventos) e como uma porcentagem comparada a plantas tipo selvagem. Umclaro aumento tanto em área de semente como comprimento de semente éobservado para as sementes transgênicas contendo qualquer construção,comparado com sementes tipo selvagem.
Tabela K: Resultados de mensurações de área de semente ecomprimento de semente das sementes Tl de plantas transgênicas PLTl ePLT2 cultivadas em condições normais de cultivo.
<table>table see original document page 283</column></row><table>
Largura de semente não foi significantemente afetada nassementes Tl das plantas transgênicas PLT e PLT2 (dados não mostrados).
29.2 Resultados da avaliação fenotípica das plantastransgênicas cultivadas em condições de disponibilidade reduzida denitrogênio, expressando ou seqüência de ácidos nucleicos PLTl ou PLT2 sobo controle de um promotor constitutivo
Os resultados da mensuração de TKW das sementes Tl deplantas de arroz transgênicas PLTl e PLT2 cultivadas em condições dedisponibilidade reduzida de nitrogênio, são mostradas em Tabela L, emvalores absolutos (média dos eventos) e como uma porcentagem comparada aplantas tipo selvagem. Um aumento substancial em TKW é observado para assementes transgênicas contendo qualquer construção, comparado comsementes tipo selvagem.
Tabela L: Resultados de mensurações de TKW das sementes
Tl de plantas transgênicas PLTl e PLT2 cultivadas em condições dedisponibilidade reduzida de nitrogênio.
<table>table see original document page 284</column></row><table>
29.3 Resultados da avaliação fenotípica das plantastransgênicas cultivadas em condições normais de cultivo, expressandoseqüência de ácidos nucleicos de PLT2 sob o controle de um promotormeristema específico
Os resultados de mensuração de TKW das sementes Tl deplantas de arroz cultivadas transgênicas PLT2 em condições normais decultivo, expressando seqüência de ácidos nucleicos de PLT2 sob o controle deum promotor meristema específico, são mostrados em Tabela M, em valoresabsolutos (média dos eventos) e como uma porcentagem comparada a plantastipo selvagem. Um aumento substancial em TKW é observado para assementes transgênicas contendo a construção, comparado com sementes tiposelvagem.Tabela Μ: Resultados de mensurações de TKW das sementesTl de plantas transgênicas PLT2 cultivadas em condições normais de cultivo,expressando seqüência de ácidos nucleicos de PLT2 sob o controle de umpromotor meristema específico.
<table>table see original document page 285</column></row><table>
Exemplo Seção E: bHLH
Exemplo 30: Identificação de parálogos do bHLH de SEQID NO: 213 em arroz
SEQID 2 foi usado para procurar por parálogos no genoma dearroz usando um algoritmo BLASTP usado para realizar buscas desimilaridade de uma seqüência de proteínas de consulta com uma dadaseqüência de proteínas de banco de dados. A seqüência de proteínas de bancode dados procurada correspondeu ao proteoma de arroz do instituto MIPS, obanco de dados de Oryza sativa de MIPS (MOsDB)5 compreendendo 59.712seqüências; 27.051.637 letras totais. Resultados foram ranqueados de acordocom maior similaridade se determinada a partir do maior pontuação e menorvalor e. Acertos identificando parálogos de seqüências de proteínas de bHLHcom SEQID NO: 2 tiveram um pontuação de pelo menos 50 e um valor emenor do que e-05. Alinhamentos pareados entre a seqüência de consulta e osparálogos identificados de novo são mostrados abaixo.
Consulta: SEQID 2Menor soma
Alta Probabilidade
Seqüências produzindo Pares de Segmentos de Alta pontuação: Pontuação P(N) N
9629.m00093|proteína Domínio de ligação de DNA hélice-alça-hélice, 1132 1.3e-l 15 1
9629.m00090|proteína Domínio de ligação de DNA hélice-alça-hélice, 305 5.7e-28 1
9630.mO 1262|proteína Domínio de ligação de DNA hélice-alça-hélice, 189 1.1 e-15 1
9629.m07159|proteína Domínio de ligação de DNA hélice-alça-hélice, 112 3.4e-05 1
>9629.m00093lproteína Domínio de ligação de DNA hélice-alça-hélice, putativo
Comprimento = 225Pontuação = 1132 (403,5 bits), Esperado = 1.3e-115, P = 1.3e-115Identidades = 224/224 (100%), Positivos = 224/224 (100%)
Consulta: 1 MKSRKNSTTSIKAAGSCHTSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLS 60
MKSRKNSTTSTXAAGSCHTSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLSSujeito: 1 MKSRKNSTTSTKAAGSCHTSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLS 60Consulta: 61 SLIPAAAPRRHHHHYSTSSSSSPPSSTTCEAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ 120
SLIP AAAPRRHHHHYSTS S S S SPP S STKE A VTQLDHLEQ AAA YIKQLKGRIDELKKRKQQSujeito: 61 SLlPAAAPRRHHHHYSTSSSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ 120Consulta: 121 AAALTTSTSNGGGGGMPWEVRCQDGTLDVWVSEAIREERERAVRLHEVIGVLEEEGAE 180
AAALTTSTSNGGGGGMPWEVRCQDGTLDVVWSEAIREERERAVRLHEVIGVLEEEGAESujeito: 121 AAALTTSTSNGGGGGMPWEVRCQDGTLDVVWSEAIREERERAVRLHEVIGVLEEEGAE 180Consulta: 181 WNASFS WGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQY 224
WNASFSWGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQYSujeito: 181 WNASFSWGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQY 224>9629.m000901proteina Domínio de ligação de DNA hélice-alça-hélice, putativo
Comprimento = 363Pontuação = 305 (112,4 bits), Esperado = 5.7e-28, P = 5.7e-28Identidades = 87/230 (37%), Positivos = 126/230 (54%)
Consulta: 19 TSSSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLSSLIPAAAPRRHHHHYSTS 78TSSSG G +++++ ERK++E+ RR MKGLC+KL+SLIP +HS
Sujeito: 18 TSSSGSGASS—TAAAAAAERKEMERRRRQDMKGLCVKLASLIP-----KEHCSMSKM 68
Consulta: 79 SSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ----------------AA 122
++S TQL L-H-AAAYIK+LK R+DEL ++ AA
Sujeito: 69 QAASR--------TQLGSLDEAAAYIKKLKERVDELHHKRSMMSITSSRCRSGGGGGPAA 120
Consulta: 123 ALTTSTSNGGGGGMPWEVRCQDGTLDWWSEAIRE------------ERERAVRLHEV 170
A STS GGGG ++ VV V + -H-E R V+ H+VSujeito: 121 AAGQSTSGGGGGEEEEEDMTRTT AAAA VVE VRQHVQEGSLISLDVVLICSAARP VKFHDV 180Consulta: 171 IGVLEEEGAEVVNASFSVVGDKIFYTLHSQALCSRIGLDASRVSHRLRNL 220I VLEEEGA-h-H-A+FS+ +YT++S+A SRIG-H-ASR+S RLR LSujeito: 181 ITVLEEEGADIISANFSLAAHNFYYTIYSRAFSSRJGIEASRISERLRAL 230>9630.m01262lproteína Domínio de ligação de DNA hélice-alça-hélice, putativo
Comprimento = 211Pontuação = 189 (71,6 bits), Esperado = l.le-15, P = 1.1 e-15Identidades = 66/214 (30%), Positivos = 102/214 (47%)
Consulta: 21 SSGGGGGGGNCYSSSSSKMERKDVEKNRRLHMKGLCLKLSSLIPAAAPRRHH-HHYSTSS 79S+GGGGGGG K +RK E+ RR M L L SL+ +A P + +S S+
Sujeito: 7 SAGGGGGGG--------KPDRKTTERIRREQMNKLYSHLDSLVRSAPPTVNSEPSHSNSN 58
Consulta: 80 SSSPPSSTK------EAVTQLDHLEQAAAYIKQLKGRIDELKKRKQQ—AAALTTSTSN 130
S + A T+ D L AA YI+Q + R+D L+++K++ +S+S+Sujeito: 59 SKYHQRKLRILGGAAAATTRPDRLGVAAEYIRQTQERVDMLREKKRELTGGGGGGSSSSS 118Consulta: 131 GGGGGM—PWE VRCQDGTLD V V WSEAIREERERA VRLHE VIGVLEEEGAE WNASFS 187
GG PVEV+ L++ + A+ H + +E+G+VNAFSSujeito: 119 GAGAATAAAPEVEVQHLGSGLHAILFTGAPPTD—GASFHRAVRAVEDAGGQVQNAHFS 175Consulta: 188 WGDKIFYTLHSQALCSRIGLDASRVSHRLRNLL 221
VGK YT+H+ G++ RV RL+ +Sujeito: 176 VAGAKAVYTIHAMIGDGYGGIE—RVVQRLKEAI 207
Exemplo 31: Identificação de ortólogos do bHLH de SEQIDNO: 213 em Arabidopsis thaliana
SEQID 2 foi usado para procurar por ortólogos no genoma deArabidopsis usando um algoritmo BLASTP usado para realizar uma busca desimilaridade de uma seqüência de proteínas de consulta com uma dadaseqüência de proteínas de banco de dados. A seqüência de proteínas de bancode dados procurada correspondeu ao proteoma de Arabidopsis do institutoMIPS, o banco de dados de Arabidopsis thaliana de MIPS (MAtDB)compreendendo 26.735 seqüências; 11.317.104 letras totais. Resultados foramranqueados de acordo com maior similaridade se determinada a partir domaior pontuação e menor valor e. Acertos identificando ortólogos deseqüências de proteínas bHLH com SEQID2 tiveram um pontuação de pelomenos 50 e um valor e menor do que e-05. Alinhamentos pareados entre aseqüência de consulta e the de novo identified orthologue são mostradosabaixo.
Consulta: SEQID 2
Database: /home/data/blast/orgs_sets/arabi
26.735 Seqüências; 11.317.104 letras totais.
Menor soma
Alta Probabilidade
Pontuação P(N) N180 4.5e-15 1149 8.7e-12 1118 2.0e-06 1105 1.5e-05 1110 1. 5e-05 1
Seqüências produzindo Pares de Segmentos de Alta pontuação:Atlgl0585 proteína desconhecidaAt4g20970 proteína hipotéticaAt4g25410 proteína putativa
At5g51780 fator de transcrição bHLH putativo (bHLH036)At5g51790 proteína putativa>Atlgl0585 proteína desconhecida
Comprimento = 122Pontuação = 180 (68,4 bits), Esperado = 4.5e-15, P = 4.5e-15Identidades = 38/119 (31%), Positivos = 72/119 (60%)
Consulta: 106 QLKGRIDELKKRKQQAAALTTSTSNGGGGGMPWEVRCQDGTLDWWSEAIREERERAV 165QLK ++ LK++K+ G +P + +R +D T+++ +++++RV
Sujeito: 3 QLKENVNYLKEKKRTLLQGELGNLYEGSFLLPKLSIRSRDSTIEMNLIMD-LNMKR---V 58
Consulta: 166 RLHEVIGVLEEEGAEWNASFSWGDKIFYTLHSQALCSRIGLDASRVSHRLRNLLLQY 224
LHE++ + EEEGA+V++A+ + D+ YT+ +QA+ SRIG+D SR+ R+R ++ YSujeito: 59 MLHELVSIFEEEGAQVMSANLQNLNDRTTYTIIAQAIISRIGIDPSRIEERVRKIIYGY 117>At4g20970 proteína hipotética
Comprimento = 167Pontuação = 149 (57,5 bits), Esperado = 8.7e-12, P = 8.7e-12Identidades = 49/171 (28%), Positivos = 86/171 (50%)
Consulta: 33 SSSSSKMERKDVEKNRRLHMKGLCLKLSSLIPAAAPRRHHHHYSTSSSSSPPSSTKEAVT 92+ S ++RK VEKNRR+ MK L +L SL+P HH ST + P EA
Sujeito: 8 TGQSRSVDRKTVEKNRRMQMKSLYSELISLLP--------HHSSTEPLTLP-DQLDEAAN 58
Consulta: 93 QLDHLEQAAAYIKQLKGRI---DELKKRKQQ-AAALTTSTSNGGGGGMPWEVRCQDGTL 148
+L+ ++ K + L+K ++++++S +P +E++ + G++Sujeito: 59 YIKKLQVNVEKKRERKRNLVATTTLEKLNSVGSSSVSSSVDVSVPRKLPKIEIQ-ETGSI 117Consulta: 14 9 DVVVVSEAIREERERAVRLHEVIGVLEEE-GAEWNASFSVVGDKIFYTLH 198
+ + ++ E E+I VL EE GAE+ +A +S+V D +F+TLHSujeito: 118 FHIFLVTSL----EHKFMFCEIIRVLTEELGAEITHAGYSIVDDAVFHTLH 164
Exemplo 32: Identificação de um bHLH de Medicagotruncatula
A questão a ser discutida foi se a seqüência de consulta (SEQID NO: 227 de Medicago truncatula) era um polipeptídeo bHLH de acordocom a definição aplicada neste lugar. SEQ ID 227 foi comparada com o bancode dados de proteoma de Arabidopsis do MIPS institute.
Comparação foi realizada usando o algoritmo BLASTP
2.0MP-WashU, que realiza buscas de similaridade de uma seqüência deproteínas de consulta com uma dada seqüência de proteínas de banco dedados. (Referência: Gish, W. (1996-2002)). Os parâmetros usados nacomparação foram valor 10 Pontuação de remoção (S2): 56
A seqüência de proteínas de banco de dados procuradacorrespondeu ao proteoma de Arabidopsis do MIPS institute compreendendo26.735 seqüências (Banco de dados: /home/data/blast/orgs_sets/arabi 26.735seqüências; 11.317.104 letras totais). Resultados foram ranqueados de acordocom maior similaridade se determinada a partir do maior pontuação e menorvalor e. O primeiro Acerto identificado (sublinhado no alinhamento)correspondeu a SEQ ID NO: 225 (At4g20970) indicando que a seqüência éum polipeptídeo bHLH de acordo com a definição aplicada neste lugar.
Alinhamentos pareados entre a seqüência de consulta de Medicago e oprimeiro acerto correspondendo ao bHLH identificado de novo são mostradosabaixo.
BLASTP 2.OMP-WashU [09-Sep-2002] [decunix4.0-ev56-I32LPF64 2002-09-09ΊΊ7:45:09]
Consulta= SEQ ID NO: 227(140 letras)
Banco de dados: /home/data/blast/orgs_sets/arabi26.735 Seqüências; 11.317.104 letras totais.
Buscando____10____20____ 30. . . .40____50____60____7 0____ 80---- 90----100% feito
Menor somaAlta Probabilidade
Seqüências produzindo Pares de Segmentos de Alto pontuação: Pontuação P(N) N
At4g20970 proteína hipotética_248 2.8e-22 1
At5g51780 fator de transcrição bHLH putativo (bHLH036) 103 6.5e-07 1
Atlgl0585 proteína desconhecida 100 1.4e-06 1
At4g25400 fator de transcrição bHLH putativo (bHLH118) 99 7.3e-06 1
>At4g20970 proteína hipotética
Comprimento = 167Pontuação = 248 (92,4 bits), Esperado = 2.8e-22, P = 2.8e-22Identidades = 52/123 (42%), Positivos = 82/123 (66%)
Consulta: 7 EAISVPDQLKEATNYIKKLQINLEKMKEKKNFLLG---IQRPN------VNLNRNQKMGL 57
E +++PDQL EA NYIKKLQ+N+EK +E+K L+ +++ N V+ + + +Sujeito: 45 EPLTLPDQLDEAANYIKKLQVNVEKKRERKRNLVATTTLEKLNSVGSSSVSSSVDVSVPR 104Consulta: 58 KSPKIKIQQIGLVLEWLITGLESQFLFSETFRVLHEE-GVDIVNASYKVNEDSVFHSIH 116
K PKI+IQ+ G + + L+T LE +F+F E RVL EE G +1 +A Y + +D+VFH++HSujeito: 105 KLPKIEIQETGSIFHIFLVTSLEHKFMFCEIIRVLTEELGAEITHAGYSIVDDAVFHTLH 164Consulta: 117 CQV 119C+V
Sujeito: 165 CKV 167
Exemplo 33: Identificação de seqüências relacionadas àseqüência de ácidos nucleicos usada nos métodos da invenção
Seqüências de bHLH, quer nucleotídeo (cDNA decomprimento completo, ESTs ou genômico) ou proteína (polipeptídeos decomprimento completo ou parcial), foram usadas para identificar outrasSeqüências de nucleotídeos ou proteínas de bHLH entre aquelas mantidas nobanco de dados Entrez Nucleotides no National Center for BiotechnologyInformation (NCBI) usando ferramentas de busca de seqüência de banco dedados, tal como a Ferramenta Básica de Alinhamento Local (BLAST)(Altschul et ai. (1990) J. Mol. Biol. 215:403-410; e Altschul et ai. (1997)Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrarregiões de similaridade local entre seqüências comparando seqüências deácidos nucleicos ou polipeptídeos com banco de dados de seqüências ecalculando a significância estatística de identidades. Por exemplo, opolipeptídeo codificado por SEQ ID NO: 213 foi usado como consulta para aseqüências de banco de dados de seqüências nr (não redundantes: (Bancos dedados: Todas as seqüências de GenBank+EMBL+DDBJ+PDB (mas nãoseqüências de EST, STS, GSS, amostras ambientais ou seqüências HTGS defase 0, 1 ou 2) 3.819.973 seqüências; 16.928.533.343 letras totais) usando oalgoritmo TBLASTN, com configurações padrão e o filtro para ignorarseqüências de baixa complexidade. O resultado da análise (mostrado abaixo)foi visto por comparação pareada, e ranqueado de acordo com o pontuação deprobabilidade (valor E), onde o pontuação reflete a probabilidade de que umalinhamento particular ocorra ao acaso (quanto menor o valor E, maissignificante o acerto). Em adição a valores E, comparações também forampontuadas por identidade percentual. Identidade percentual se refere aonúmero de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüênciasde ácidos nucleicos (ou polipeptídeos) comparadas ao longo de umcomprimento particular.
Acertos no banco de dados identificando proteínas BHLHproduziram um pontuação de pelo menos 50 e um valor e igual a ou menor doque e-05.
Pontuação
Valor E
Seqüências produzindo alinhamentos significantes : (Bits)
giI55765745Iref|NM_183508.2 I Oryza sativa (japonica cultivar-gro 440 le-121
giI42821746IdbjIAK109432.2 I Oryza sativa (japonica cultivar-g 440 le-121
gi I 55769744 IrefIXM_549862.11 Oryza sativa (japonica cultivar-gro 247 le-105
giI58530787IdbjIAP008207.11 Oryza sativa (japonica cultivar-g 263 2e-68
giI17385651IdbjIAP002845.3 I Oryza sativa (japonica cultivar-g 263 2e-68
giI32980356Idbj|AK070332.1| Oryza sativa (japonica cultivar-g 251 9e-65
gi I 34894135Iref|NM_183504.1 I Oryza sativa (japonica cultivar-gro 137 3e-30
gi115293050 IgbIAY050959.11 Arabidopsis thaliana unknown prote 80.1 6e-16
giI79340923Iref|NM_100934.2 I Arabidopsis thaliana transcripti 87.8 2e-15
giI58531195IdbjIAP008214.1 I Oryza sativa (japonica cultivar-g 51.6 4e-13
giI42408246IdbjIAP004557.3 I Oryza sativa (japonica cultivar-g 51.6 4e-13
gi I 42408168IdbjIAP004376.3 I Oryza sativa (japonica cultivar-g 51.6 4e-13
giI22328837|ref|NM_118215.2| Arabidopsis thaliana DNAbinding 78.2 le-12
gi I 7268888IemblAL161554.2IATCHRIV54 Arabidopsis thaliana DNA chr 77.8 2e-12
gi I 5262774IembIAL080282.ilATT13K14 Arabidopsis thaliana DNA c 77.8 2e-12
giI50906596Iref|XM_464787.11 Oryza sativa (japonica cultivar-gro 77.0 3e-12
Exemplo 34: Determinação de similaridade e identidadeglobal entre fatores de transcrição bHLH
Similaridade e identidade percentuais globais entrepolipeptídeos bHLH foi determinada usando o aplicativo computacionalMatGAT (BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an applicationthat generates similarity/identity matrices using protein or DNA sequences.
Campanella JJ, Bitincka L, Smalley J.). Aplicativo computacional MatGATgera matrizes de similaridade/identidade para seqüências de DNA ou proteínasem precisar de pré-alinhamento dos dados. O programa realiza uma série dealinhamentos pareados, calcula similaridade e identidade, e então coloca osresultados em uma matriz de distância.
Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62
PrimeiraLacuna: 12
Lacuna de extensão: 2
Resultados são mostrados em Figura 19a.
Exemplo 35: Determinação de similaridade e identidadeglobal entre domínios bHLH em polipeptídeos bHLH
Domínios bHLH foram mapeados usando o aplicativocomputacional SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95,5857-5864; Letunic et al. (2006) Nucleic Aeids Res 34, D257-D260).Aplicativo computacional SMART está disponível através de instituto EMBL(European Molecular Biology Laboratory (EMBL).
As seqüências do domínio bHLH usadas são dadas abaixo.Hv_BHLH
KESEKERRKRMKALCEKLASLIPREHCCSTTDTMTQLGSLDVGASYIKKLKERVDE0S_NP_9 0839 3_BHLH
KEME RRRRQ DMKGLCVKLASLIPKEHCSMSKMQAAS RTQLGS LDEAAAYIKKLKERVDEOS_NP_908397.1_BHLH
KDVEKNRRLHMKGLCLKLSSLIPAAAPRRHHHHYSTSSSSSPPSSTKEAVTQLDHLEQAAAYIKQLKGRIDE
Os_XP_4 64787.1_BHLH
KTTERIRREQMNKLYSHLDSLVRSAPPTVNSIPSHSNSNSKYHQRKLRILGGAAAATTRPDRLGVAAEYIRQTQERVDM
ATlG10585_bHLHnlrekdrrmrmkhlfsilsshvsptrklpvphlidqatsymiqlkenvnyAt 4 g2 0 9 7 0_bHLH
KTVEKNRRMQMKSLYSELISLLPHHSSTEPLTLPDQLDEAANYIKKLQVNVEKPorcentagens globais de similaridade e identidade entredomínios bHLH de polipeptídeos bHLH foram determinadas usando oaplicativo computacional e parâmetros descritos em Exemplo 34.
Resultados são mostrados em Figura 19b.
Exemplo 36: Clonagem da seqüência de ácidos nucleicosusada nos métodos da invenção
A seqüência de ácidos nucleicos usada nos métodos dainvenção foi amplificada por PCR usando como modelo uma biblioteca decDNA de plântulas de Oryza sativa feita sob encomenda (em pCMV Sport6.0; Invitrogen, Paisley, UK). PCR foi realizado usando Hifi Taq DNApolimerase em condições padrão, usando 200 ng de modelo em uma misturade PCR de 50 μΐ. Os iniciadores usados foram prm06808 (SEQ ID NO: 231;sentido, códon de início em negrito, sítio AttBl em itálico: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaagagcaggaagaacagc 3') andprm06809 (SEQ ID NO: 232; reverso, complementar, sítio AttB2 em itálico:5' ggggaccactttgtacaagaaagctgggtgcagagtgaaagagtggtgtg 3'), o que inclui ossítios AttB para recombinação Gateway. O fragmento de PCR amplificado foipurificado também usando métodos padrão. A primeira etapa doprocedimento Gateway, a reação BP5 foi então realizada, durante which ofragmento de PCR se recombina in vivo com o plasmídeo pDONR201 paraproduzir, de acordo com a terminologia Gateway, um "clone de entrada",pbHLH. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, comoparte da tecnologia Gateway®.
Exemplo 37: Construção de Vetor de Expressão
O clone de entrada p076 foi subseqüentemente usado em umareação LR com pGOS2, um vetor de destinação usado para transformação deOryza sativa. Este vetor contém como elementos funcionais dentro doslimites de T-DNA: um marcador selecionável vegetal; uma gaveta deexpressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor GOS2 de arroz (SEQ LD NO: 233,alternativamente, SEQ ID NO: 230 é igualmente útil) para expressãoconstitutiva (referência interna PROO129) foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressãoresultante pGOS2::bHLH (Figura 20) foi transformado em cepa LBA4044 deAgrobacterium e subseqüentemente para plantas de Oryza sativa.
Exemplo 38: Transformação de planta
Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada paratransformar plantas de Oryza sativa. Sementes maduras secas da cultivarjaponesa de arroz Nipponbare foram descascadas. Esterilização foi realizadaincubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2%de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com águadestilada estéril. As sementes estéreis foram então germinadas em um meiocontendo 2,4-D (meio de indução de calo). Depois de incubação no escuro porquatro semanas, calos embriogênicos derivados de escutelo foram excisados epropagados no mesmo meio. Depois de duas semanas, os calos forammultiplicados ou propagados por subcultura no mesmo meio por outras 2semanas. Pedaços de calo embriogênico foram subcultivados em meio fresco3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Cepa LBA4404 de Agrobacterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobaeterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.
Aproximadamente 30 transformantes TO de arrozindependentes foram gerados para uma construção. Os transformantesprimários foram transferidos de uma câmara de cultura de tecido para umacasa de vegetação. Depois de uma análise de PCR quantitativo para verificarnúmero de cópias do inserto de T-DNA, apenas plantas transgênicas de cópiaúnica que exibem tolerância ao agente de seleção foram mantidas paracolheita de semente TL Sementes foram então coletadas três a cinco mesesdepois de transplante. O método produziu transformantes de locus único emuma taxa de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei etal. 1994).
Transformação de milho
Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al 88 (University of Minnesota) ou híbridos com Al 88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 °C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.
Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.
Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de colza/eanola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188).
A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.
Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobaeterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobacterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 100 μτη de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Exemplo 39: Procedimento de avaliação39.1 Configuração de avaliação
Aproximadamente 30 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.
Quatro eventos Tl foram adicionalmente avaliados na geraçãoT2 seguindo o mesmo procedimento de avaliação que para a geração Tl mascom mais indivíduos por evento. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.
39.2 Análise estastística: teste t e teste F
Uma ANOVA de dois fatores (análises de variância) foi usadacomo um modelo estatístico para a avaliação geral de característicasfenotípicas vegetais. Um teste F foi realizado em todos os parâmetrosmedidos de todas as plantas de todos os eventos transformadas com o gene dapresente invenção. O teste F foi realizado para verificar por um efeito do genesobre todos os eventos de transformação e para verificar por um efeito geraldo gene, também conhecido como efeito gênico global. O limiar parasignificância para um verdadeiro efeito gênico global é ajustado em 5% denível de probabilidade para o teste F. Um valor significante de teste F apontapara um efeito gênico, significando que não é apenas a mera presença ou aposição do gene que está causando as diferenças em fenótipo.
Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sereferem a plantas tratadas da mesma maneira que a planta transgênica, masdas quais o transgene foi segregado. Plantas nulas também podem serdescritas como as plantas transformadas negativas homozigotas. O limiar parasignificância para o teste t foi ajustado em um nível de probabilidade de 10%.Os resultados para alguns eventos podem estar acima ou abaixo deste limiar.Isto é baseado na hipótese de que um gene pode apenas ter um efeito emcertas posições no genoma, e que a ocorrência deste efeito dependente deposição não é incomum. Este tipo de efeito gênico é também chamado nestelugar de um "efeito de cepa do gene". O valor de ρ foi obtido comparando ovalor de t com a distribuição de t ou alternativamente, comparando o valor deF com a distribuição de F. O valor de ρ então gera a probabilidade de que ahipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.
Exemplo 40: Resultados de avaliação
Vigor precoce foi determinado contando o número total depixels de partes aéreas vegetais discriminadas do fundo. Foi tirada a médiadeste valor para as fotos tiradas no mesmo momento de ângulos diferentes efoi convertido para um valor de superfície física expresso em mm quadradospor calibração. Os resultados descritos abaixo são para plantas três semanasapós germinação.
Vigor precoce (se determinado por área aérea) foi visto emseis de sete eventos da geração TI, com um aumento geral em área aérea paraplântulas transgênicas de 22% comparado com plantas de controle. Quatrodestes eventos Tl foram adicionalmente avaliados na geração T2, e todosestes quatro eventos geraram um aumento em área aérea para plântulastransgênicas comparado com plantas de controle, com um aumento geral emárea aérea para plântulas transgênicas de 13% comparado com plantas decontrole. Os resultados também mostraram ser estatisticamente significantescom o valor de ρ do teste F sendo 0,0007 (geração T2) indicando que o efeitoobservado provavelmente é deivo ao transgene ao invés da posição do geneou um efeito de cepa.
Exemplo Seção F: SPL15
Exemplo 41: Identificação de seqüências relacionadas àseqüência de ácidos nucleicos usada nos métodos da invenção
Seqüências (cDNA de comprimento completo, ESTs ougenômicas) relacionadas à seqüência de ácidos nucleicos usada nos métodosda presente invenção foram identificadas entre aquelas mantidas no banco dedados Entrez Nucleotides no National Center for Biotechnology Informationusando ferramentas de busca de seqüência de banco de dados, tal como aFerramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J.Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res.25:3389-3402). O programa é usado para encontrar regiões de similaridadelocal entre seqüências comparando seqüências de ácidos nucleicos oupolipeptídeos com banco de dados de seqüências e calculando a significânciaestatística de identidades. O polipeptídeo codificado pelo ácido nucleico dapresente invenção foi usado para o algoritmo TBLASTN, com configuraçõespadrão e o filtro para ignorar contrapeso de seqüências de baixacomplexidade. O resultado da análise foi visto por comparação pareada, eranqueado de acordo com o pontuação de probabilidade (valor E), onde opontuação reflete a probabilidade de que um alinhamento particular ocorra aoacaso (quanto menor o valor E, mais significante o acerto). Em adição avalores E, comparações também foram pontuadas por identidade percentual.
Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos)idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos)comparadas ao longo de um comprimento particular. Em algumas instâncias,os parâmetros padrão podem ser ajustados para modificar a estringência dabusca
A Tabela N abaixo fornece uma Iist de seqüências de ácidosnucleicos relacionadas à seqüência de ácidos nucleicos usada nos métodos dapresente invenção.
Tabela N: seqüências de ácidos nucleicos relacionadas àseqüência de ácidos nucleicos (SEQ ID NO: 234) usada nos métodos dapresente invenção, e os polipeptídeos deduzidos correspondentes
<table>table see original document page 303</column></row><table><table>table see original document page 304</column></row><table><table>table see original document page 305</column></row><table>
Exemplo 42: Determinação de similaridade e identidadeglobal entre fatores de transcrição SPLl 5, e seus SPL DBD.
Porcentagens globais de similaridade e identidade entre fatoresde transcrição SPL15 foram determinadas usando um dos métodosdisponíveis na arte, o aplicativo computacional MatGAT (Ferramenta deAlinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT:an application that generates similarity/identity matrices using protein orDNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativocomputacional hospedado por Ledion Bitincka). Aplicativo computacionalMatGAT gera matrizes de similaridade/identidade para seqüências de DNAou proteína sem precisar de pré-alinhamento dos dados. O programa realizauma série de alinhamentos pareados usando o algoritmo de alinhamentoglobal de Myers e Miller (com uma penalidade de abertura de lacuna de 12, euma penalidade de extensão de lacuna de 2), calcula similaridade e identidadeusando por exemplo Blosum 62 (para polipeptídeos), e então coloca osresultados em uma matriz de distância. Similaridade de seqüências é mostradana metade de baixo da linha divisora e identidade de seqüência é mostrada nametade de cima da linha divisora diagonal. A seqüência de SEQ ID NO: 235 éindicada como número 5 na matriz.
Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62
PrimeiraLacuna: 12
Lacuna de extensão: 2
Resultados da análise de aplicativo computacional sãomostrados em Tabela O para a similaridade e identidade global sobre ocomprimento completo dos polipeptídeos de fator de transcrição SPLl5.Identidade percentual é dada acima da diagonal e similaridade percentual édada abaixo da diagonal. Identidade percentual entre os parálogos e ortólogosde fator de transcrição SPL15 varia entre 30 e 70%, refletindo a conservaçãorelativamente baixa de identidade de seqüência entre eles fora do SPL DBD.
Tabela O: Resultados de MatGAT para similaridade eidentidade global sobre o comprimento completo dos polipeptídeos de fatorde transcrição SPL15.
<table>table see original document page 306</column></row><table>
Resultados da análise de aplicativo computacional sãomostrados em Tabela P para a similaridade e identidade global sobre o SPLDBD dos polipeptídeos de fator de transcrição SPL15. Identidade percentual édada acima da diagonal e similaridade percentual é dada abaixo da diagonal.
Identidade percentual entre o SPL DBD de parálogos e ortólogos de fator detranscrição SPL15 varia entre 70% e 100%.Tabela Ρ: Resultados de MatGAT para similaridade eidentidade global sobre o SPL DBD dos polipeptídeos de fator de transcriçãoSPL15.
<table>table see original document page 307</column></row><table>
Exemplo 43: Clonagem da seqüência de ácidos nucleicosusada nos métodos da invenção
Manipulação de DNA: a menos que de outra maneiradeterminado, técnicas de DNA recombinante são realizadas de acordo comprotocolos padrão descrito em (Sambrook (2001) Molecular Cloning: alaboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH,New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocolsin Molecular Biology, Current Protocols. Materiais e métodos padrão paratrabalho molecular com plantas são descritos em Plant Molecular BiologyLabfase (1993) por R.D.D. Croy, publicado por BIOS Scientific PublicationsLtd (UK) e Blackwell Scientific Publications (UK).
A seqüência de ácidos nucleicos usada nos métodos dainvenção foi amplificada por PCR usando como modelo uma biblioteca decDNA de tecidos misturados de Arabidopsis thaliana feita sob encomenda(em pCMV Sport 6.0; Invitrogen, Paisley, UK). PCR foi realizado usandoHifi Taq DNA polimerase em condições padrão, usando 200 ng de modeloem uma mistura de PCR de 50 μΐ. Os iniciadores usados foram prm07277(SEQ ID NO: 280; sentido, códon de início em negrito, sítio AttBl em letrasminúsculas: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaATGGAGTTGTTAATGTGTTCG3') e prm07278 (SEQ ID NO: 281; reverso, complementar, sítio AttB2 emletras minúsculas: 5'ggggaccactttgtacaagaaagctgggtTGATGAAGATCTTAAAAGGTGA 3'), oque inclui os sítios AttB para recombinação Gateway. O fragmento de PCRamplificado foi purificado também usando métodos padrão. A primeira etapado procedimento Gateway, a reação BP5 foi então realizada, durante a qual ofragmento de PCR se recombina in vivo com o plasmídeo pDONR201 paraproduzir, de acordo com a terminologia Gateway, um "clone de entrada",pSPL15. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, comoparte da tecnologia Gateway®.
Exemplo 44: Construção de Vetor de Expressão
O clone de entrada ρ 13075 foi subseqüentemente usado emuma reação LR com p06659, um vetor de destinação usado paratransformação de Oryza sativa. Este vetor contém como elementos funcionaisdentro dos limites de T-DNA: um marcador selecionável vegetal; uma gavetade expressão de marcador rastreável; e uma gaveta Gateway pretendida pararecombinação in vivo LR com a seqüência de ácidos nucleicos de interesse jáclonada no clone de entrada. Um promotor HMGB de arroz (SEQ ID NO:294) para expressão constitutiva foi localizado antes desta gaveta Gateway.Alternativamente, o promotor HMGB representado por SEQ ID NO: 46 éigualmente útil. Uma construção similar foi feita com a seqüência decodificação de SPL15 sob controle do promotor constitutivo GOS2 (SEQ IDNO: 295).
Depois da etapa de recombinação LR, o vetor de expressãoresultante pHMGB::SPL15 (Figura 26), ou pGOS2::SPL15, foi transformadoem cepa LBA4044 de Agrobacterium e subseqüentemente para plantas deOryza sativa,.
Exemplo 45: Transformação de planta
Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada paratransformar plantas de Oryza sativa. Sementes maduras secas da cultivarjaponesa de arroz Nipponbare foram descascadas. Esterilização foi realizadaincubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2%de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com águadestilada estéril. As sementes estéreis foram então germinadas em um meiocontendo 2,4-D (meio de indução de calo). Depois de incubação no escuro porquatro semanas, calos embriogênicos derivados de escutelo foram excisados epropagados no mesmo meio. Depois de duas semanas, os calos forammultiplicados ou propagados por subcultura no mesmo meio por outras 2semanas. Pedaços de calo embriogênico foram subcultivados em meio fresco3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Cepa LBA4404 de Agrobaeterium contendo o vetor deexpressão foi usada para co-cultivo. Agrobacterium foi inoculada em meioAB com os antibióticos apropriados e cultivada por 3 dias a 28°C. Asbactérias foram então coletadas e suspensas em meio de co-cultivo líquidopara uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferidapara uma placa de Petri e os calos imersos na suspensão por 15 minutos. Ostecidos de calos foram então secados em um papel filtro e transferidos paraum meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C.
Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanasno escuro a 28°C na presença de um agente de seleção. Durante este período,ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depoisde transferência deste material para um meio de regeneração e incubação naluz, o potencial embriogênico foi liberado e partes aéreas se desenvolveramnas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calose incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qualelas foram transferidas para o solo. Partes aéreas endurecidas foramcultivadas em alta umidade e dias curtos em uma casa de vegetação.
Aproximadamente 35 transformantes TO de arrozindependentes foram gerados para uma construção. Os transformantesprimários foram transferidos de uma câmara de cultura de tecido para umacasa de vegetação. Depois de uma análise de PCR quantitativo para verificarnúmero de cópias do inserto de T-DNA, apenas plantas transgênicas de cópiaúnica que exibem tolerância ao agente de seleção foram mantidas paracolheita de semente TI. Sementes foram então coletadas três a cinco mesesdepois de transplante. O método produziu transformantes de locus único emuma taxa de até 50 % (Aldemita and Hodges 1996, Chan et ai. 1993, Hiei etai 1994).
Transformação de milho
Transformação de milho (Zea mays) é realizada com umamodificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6):745-50. Transformação é dependente de genótipo em milho e apenasgenótipos específicos são receptivos para transformação e regeneração. Acepa natural Al88 (University of Minnesota) ou híbridos com Al88 como umancestral são boas fontes de material doador para transformação, mas outrosgenótipos também podem ser usados com sucesso. Espigas são coletadas apartir de planta de milho aproximadamente 11 dias depois de polinização(DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.
Embriões imaturos são co-cultivados com Agrobacterium tumefacienscontendo o vetor de expressão, e plantas transgênicas são recuperadas atravésde organogênese. Embriões excisados são cultivados em meio de indução decalo, então meio de regeneração de milho, contendo o agente de seleção (porexemplo imidazolinona mas vários marcadores de seleção podem ser usados).As placas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento de milho e incubadas a 25 °C por 2-3semanas, até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito porIshida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite(disponível a partir de CIMMYT, México) é comumente usada emtransformação. Embriões imaturos são co-cultivados com Agrobacteriumtumefaciens contendo o vetor de expressão, e plantas transgênicas sãorecuperadas através de organogênese. Depois de incubação comAgrobacterium, os embriões são cultivados in vitro em meio de indução decalo, então meio de regeneração, contendo o agente de seleção (por exemploimidazolinona mas vários marcadores de seleção podem ser usados). Asplacas de Petri são incubadas na luz a 25 °C por 2-3 semanas, ou até quepartes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cadaembrião para meio de enraizamento e incubadas a 25 °C por 2-3 semanas, atéque raízes se desenvolvam. As partes aéreas com raiz são transplantadas parasolo na casa de vegetação. Sementes Tl são produzidas a partir de plantas queexibem tolerância ao agente de seleção e que contêm uma única cópia doinserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação dométodo descrito na Patente Norte-Americana de Texas A&M 5.164.310.Diversas variedades comerciais de soja são receptivas para transformação poreste método. A cultivar Jack (disponível a partir da Illinois Seed foundation) écomumente usada para transformação. Sementes de soja são esterilizadas parasemeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados apartir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédoneremanescente são adicionalmente cultivados para desenvolver nós axilares.
Estes nós axilares são excisados e incubados com Agrobacterium tumefacienscontendo o vetor de expressão. Depois do tratamento de co-cultivo, osexplantes são lavados e transferidos para meio de seleção. Partes aéreasregeneradas são excisadas e colocadas em um meio de prolongamento departe aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio deenraizamento até que raízes se desenvolvam. As partes aéreas com raiz sãotransplantadas para solo na casa de vegetação. Sementes Tl são produzidas apartir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6dias de idade são usados como explantes para cultura de tecido etransformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188).
A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usadapara transformação, mas outras variedades também podem ser usadas.
Sementes de canola são superfície-esterilizadas para semeadura in vitro. Osexplantes de pecíolo de cotilédone com o cotilédone acoplado são excisadosdas plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor deexpressão) banhando a extremidade de corte do explante de pecíolo nasuspensão bacteriana. Os explantes são então cultivados por 2 dias em meioMSBAP-3 contendo 3 mg/l de BAP, 3 % de sucrose, 0,7 % de Phytagar a 23°C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobaeterium, osexplantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l deBAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e entãocultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina eagente de seleção até regeneração de parte aérea. Quando as partes aéreasestão com 5-10 mm de comprimento, elas são cortadas e transferidas parameio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l deBAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para omeio de enraizamento (MSO) para indução de raiz. As partes aéreas com raizsão transplantadas para solo na casa de vegetação. Sementes Tl sãoproduzidas a partir de plantas que exibem tolerância ao agente de seleção eque contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) étransformado usando o método de (McKersie et al., 1999 Plant Physiol 119:839-847). Regeneração e transformação de alfafa é dependente de genótipo eportanto uma planta regenerante é requerida. Métodos para obter plantasregenerantes foram descritos. Por exemplo, estas podem ser selecionadas apartir da cultivar Rangelander (Agriculture Canada) ou qualquer outravariedade comercial de alfafa como descrito por Brown DCW e A Atanassov(1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, avariedade RA3 (University of Wisconsin) foi selecionada para uso em culturade tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolosão co-cultivados com uma cultura noturna de Agrobacterium tumefaciensC58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ouLBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ Lde tioprolina, 4,35 g/ L de K2S04, e 100 μηι de acetoseringona. Os explantessão lavados em meio Murashige-Skoog com meia força (Murashige andSkoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringonamas com um agente de seleção adequado e antibiótico adequado para inibircrescimento de Agrobacterium. Depois de diversas semanas, embriõessomáticos são transferidos para meio de desenvolvimento BOÍ2Y nãocontendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L desucrose. Embriões somáticos são subseqüentemente germinados em meioMurashige-Skoog com meia força. Plântulas enraizadas foram transplantadasem potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidasa partir de plantas que exibem tolerância ao agente de seleção e que contêmuma única cópia do inserto de T-DNA.
Exemplo 46: Procedimento de avaliação
46.1 Configuração de avaliação
Aproximadamente 35 transformantes TO de arrozindependentes foram gerados. Os transformantes primários foram transferidosde uma câmara de cultura de tecido para uma casa de vegetação para cultivo ecolheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1para presença/ausência do transgene, foram retidos. Para cada um desteseventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero ehomozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene(nulizigotos) foram selecionadas monitorando expressão de marcador visual.
As plantas transgênicas e os nulizigotos correspondentes foram cultivadoslado a lado em posições aleatórias. Condições de casa de vegetação foram dedias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidaderelativa de 70%.
Cinco eventos Tl foram adicionalmente avaliados na geraçãoT2 seguindo o mesmo procedimento de avaliação que para a geração Tl mascom mais indivíduos por evento. Do estágio de semeadura até o estágio dematuridade as plantas foram passadas diversas vezes através de uma gabinetede imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulosdiferentes.
O vigor precoce é a área aérea de planta (plântula) trêssemanas após germinação. Aumento em biomassa de raiz é expresso comoum aumento em biomassa total de raiz (medida como biomassa máxima deraízes observada durante o tempo de vida de uma planta); ou como umaumento no índice raiz/parte aérea (medido como a proporção entre massaradicular e massa de parte aérea no período de crescimento ativo de raiz eparte aérea).
46.2 Análise estastística: teste F
Uma ANOVA de dois fatores (análises de variância) foi usadacomo um modelo estatístico para a avaliação geral de característicasfenotípicas vegetais. Um teste F foi realizado em todos os parâmetrosmedidos de todas as plantas de todos os eventos transformadas com o gene dapresente invenção. O teste F foi realizado para verificar por um efeito do genesobre todos os eventos de transformação e para verificar por um efeito geraldo gene, também conhecido como efeito gênico global. O limiar parasignificância para um verdadeiro efeito gênico global é ajustado em 5% denível de probabilidade para o teste F. Um valor significante de teste F apontapara um efeito gênico, significando que não é apenas a mera presença ou aposição do gene que está causando as diferenças em fenótipo.
Para verificar por um efeito dos genes dentro de um evento,i.e., por um efeito cepa específico, um teste t foi realizado dentro de cadaevento usando conjuntos de dados das plantas transgênicas e das plantas nulascorrespondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" sereferem a plantas tratadas da mesma maneira que a planta transgênica, masdas quais o transgene foi segregado. Plantas nulas também podem serdescritas como as plantas transformadas negativas homozigotas. O limiar parasignificância para o teste t foi ajustado em um nível de probabilidade de 10%.Os resultados para alguns eventos podem estar acima ou abaixo deste limiar.Isto é baseado na hipótese de que um gene pode apenas ter um efeito emcertas posições no genoma, e que a ocorrência deste efeito dependente deposição não é incomum. Este tipo de efeito gênico é também chamado nestelugar de um "efeito de cepa do gene". O valor de ρ foi obtido comparando ovalor de t com a distribuição de t ou alternativamente, comparando o valor deF com a distribuição de F. O valor de ρ então gera a probabilidade de que ahipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.
Exemplo 4 7: Resultados de avaliação
A parte aérea de planta (ou biomassa de folhas) foideterminada contando o número total de pixels nas imagens digitais de partesaéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para asfotos tiradas no mesmo momento dos diferentes ângulos e foi convertido paraum valor de superfície física expresso em mm quadrados por calibração.
Experimentos mostram que a parte aérea de planta medida desta maneira secorrelaciona com a biomassa de partes aéreas de planta. A área aérea é omomento no qual a planta atingiu sua biomassa máxima de folhas.
As panículas primárias maduras foram coletadas, contadas,ensacadas, etiquetadas com código de barras e então secas por três dias emum forno a 37°C. As panículas foram então trilhadas e todas as sementesforam coletadas e contadas. As cascas cheias foram separadas daquelas vaziasusando um dispositivo que sopra ar. As cascas vazias foram descartadas e afração remanescente foi contada novamente. As cascas cheias foram pesadasem uma balança analítica. O número de grãos cheios foi determinadocontando o número de cascas cheias que permaneceram depois da etapa deseparação. A produção total de sementes foi medida pesando todas as cascascheias coletadas de uma planta. Número total de sementes por planta foimedido contando o número de cascas coletadas de uma planta. Peso de milsementes (TKW) é extrapolado a partir do número de grãos cheios contados eseu peso total. O índice de colheita (HI) na presente invenção é definido comoa proporção entre a produção total de sementes e a parte aérea (mm2),multiplicada por um fator IO6. O número total de flores por panícula comodefinido na presente invenção é a proporção entre o número total de sementese o número de panículas primárias maduras. A taxa de enchimento de grãoscomo definida na presente invenção é a proporção (expressa como uma %) donúmero de grãos cheios sobre o número total de sementes (ou floretes).
Como apresentado em Tabelas Q a W, a biomassa aérea, onúmero de flores por panícula, a produção de sementes, o número total desementes, o número de grãos cheios, o peso de mil sementes (TKW) e índicede Colheita são aumentados nas plantas transgênicas com expressãoaumentada de um ácido nucleico codificando um polipeptídeo de fator detranscrição SPLl5, comparados com plantas de controle adequadas.
Resultados das gerações Tl e T2 são mostrados.
Tabela Q mostra o número de eventos transgênicos com umaumento em biomassa aérea, a porcentagem deste aumento, assim como arelevância estatística deste aumento de acordo com o teste F.
Tabela Q: Número de eventos transgênicos com um aumentoem biomassa aérea, a porcentagem do aumento, e valor de P do teste F emgeração Tl e T2 de arroz transgênico com expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15.
<table>table see original document page 317</column></row><table>
Tabela R mostra o número de eventos transgênicos com umaumento em o número total de flores por panícula, a porcentagem desteaumento, assim como a relevância estatística deste aumento de acordo com oteste F.Tabela R: Número de eventos transgênicos com um aumentoem flores por panícula, a porcentagem do aumento, e valor de P do teste F emgeração Tl e T2 de arroz transgênico com expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPL15.
<table>table see original document page 318</column></row><table>
Tabela S mostra o número de eventos transgênicos com umaumento em produção total de sementes (peso total de semente), aporcentagem deste aumento, assim como a relevância estatística desteaumento de acordo com o teste F.
Tabela S: Número de eventos transgênicos com um aumentoem produção de sementes, a porcentagem do aumento, e valor de P do teste Fem geração Tl e T2 de arroz transgênico com expressão aumentada de umácido nucleico codificando um polipeptídeo de fator de transcrição SPL15.
<table>table see original document page 318</column></row><table>
Tabela T mostra o número de eventos transgênicos com umaumento no número total de sementes, a porcentagem deste aumento, assimcomo a relevância estatística deste aumento de acordo com o teste F.
Tabela T: Número de eventos transgênicos com um aumentoem número total de sementes, a porcentagem do aumento, e valor de P doteste F em geração Tl e T2 de arroz transgênico com expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcriçãoSPL15.
<table>table see original document page 318</column></row><table>
Tabela U mostra o número de eventos transgênicos com umaumento no número de grãos cheios, a porcentagem deste aumento, assimcomo a relevância estatística deste aumento de acordo com o teste F.
Tabela U: Número de eventos transgênicos com um aumentoem número de grãos cheios, a porcentagem do aumento, e valor de P do testeF em geração Tl e T2 de arroz transgênico com expressão aumentada de umácido nucleico codificando um polipeptídeo de fator de transcrição SPL15.
Número de grãos cheios Número de eventos mostrando um aumento % de Diferença Valor de P de teste FGeração Tl 6 de 7 14 0,0031Geração T2 4 de 5 19 0,0003
Tabela V mostra o número de eventos transgênicos com umaumento no índice de Colheita, a porcentagem deste aumento, assim como arelevância estatística deste aumento de acordo com o teste F.
Tabela V Número de eventos transgênicos com um aumentoem índice de Colheita, a porcentagem do aumento, e valor de P do teste F emgeração Tl e T2 de arroz transgênico com expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição SPLl5.índice de Col íeita
Tabela W mostra o número de eventos transgênicos com umaumento no peso de mil sementes (TKW), a porcentagem deste aumento,assim como a relevância estatística deste aumento de acordo com o teste F.
Tabela W: Número de eventos transgênicos com um aumentoem peso de mil sementes (TKW), a porcentagem do aumento, e valor de P doteste F em geração Tl e T2 de arroz transgênico com expressão aumentada deum ácido nucleico codificando um polipeptídeo de fator de transcriçãoSPL15.
Peso de mil sementes Número de eventos mostrando um aumento % de Diferença Valor de P de teste FGeração Tl 4 de 7 2 0,0041Geração T2 4 de 5 1 0,0259Exemplo 48: Resultados da avaliação fenotípica das plantastransgênicas expressando SEQID NO: 234 sob o controle de um promotorconstitutivo
Os resultados da avaliação de plantas transgênicas de arrozexpressando a seqüência de ácidos nucleicos útil para realizar os métodos dainvenção, sob o controle do promotor constitutivo GOS2, são apresentadosem Tabela X. A diferença percentual entre os transgênicos e os nulizigotoscorrespondentes também é mostrada.
As plantas transgênicas expressando a seqüência de ácidosnucleicos útil para realizar os métodos da invenção, têm vigor precoceaumentado e TKW aumentado comparadas com as plantas de controle (nestecaso, os nulizigotos).
Tabela X: Resultados da avaliação de plantas transgênicas dearroz de geração Tl expressando a seqüência de ácidos nucleicos útil pararealizar os métodos da invenção, sob o controle de um promotor constitutivoGOS2 forte.
<table>table see original document page 320</column></row><table>LISTAGEM DE SEOÜENCIAS
<110> CropDesign N.V.
<120> Plantas tendo características relacionadas a rendimento melhoradase um método para fazer as mesmas
<130> PF58328<160> 301
<170> PatentIn versão 3.3<210> 1<211> 630<212> DNA
<213> Arabidopsis thaliana<400> 1
atggagaatg ggaaaagaga cagacaagac atggaagtga ataccacacc gaggaagcct 60
cgtgtactac tcgctgcaag tggaagcgtc gctgctatca aattcggcaa tctctgccat 120tgcttcaccg aatgggcaga agtcagagcc gtcgttacga aatcatctct acatttcctc 180gataaactct ctctcccaca agaagtgact ctgtatactg atgaagatga atggtctagc 240tggaacaaga tcggtgatcc tgtccttcac atcgagctta gacgttgggc tgatgtttta 300gtcattgctc ctttgtctgc taacacctta ggcaagattg ctggtgggct ttgtgataat 360cttctgactt gcattatacg agcttgggac tataccaaac cactgtttgt tgctccagct 420atgaatactt tgatgtggaa caatcctttc actgaaaggc atcttttgtc tcttgatgaa 480ctgggaatca cacttattcc tcctatcaag aagagacttg cctgtggaga ctacggtaat 540ggagctatgg ctgagccctc tcttatctat tccactgtca gactcttctg ggagtctcag 600gctcatcagc aaaccggtgg aactagttaa 630
<210> 2
<211> 209
<212> PRT
<213> Arabidopsis thaliana
<400> 2
Met Glu Asn Gly Lys Arg Asp Arg Gln Asp Met Glu Val Asn Thr Thr1 5 10 15
Pro Arg Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala Ala
20 25 30
Ile Lys Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu Val
35 40 45
Arg Ala Val Val Thr Lys Ser Ser Leu His Phe Leu Asp Lys Leu Ser
50 55 60
Leu Pro Gln Glu Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser Ser65 70 75 80
Trp Asn Lys Ile Gly Asp Pro Val Leu His Ile Glu Leu Arg Arg Trp
85 90 95
Ala Asp Val Leu Val Ile Ala Pro Leu Ser Ala Asn Thr Leu Gly Lys
100 105 110
Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Ile Arg Ala
115 120 125
Trp Asp Tyr Thr Lys Pro Leu Phe Val Ala Pro Ala Met Asn Thr Leu
130 135 140
Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu Leu Ser Leu Asp Glu145 150 155 160
Leu Gly Ile Thr Leu Ile Pro Pro Ile Lys Lys Arg Leu Ala Cys Gly
165 170 175
Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile Tyr Ser Thr
180 185 190
Val Arg Leu Phe Trp Glu Ser Gln Ala His Gln Gln Thr Gly Gly Thr195 200 205
Ser
<210> 3<211> 37<212> DNA
<213> Seqüência artificial<220><223> iniciador: prm00957<400> 3
aaaaagcagg ctcacaatgg agaatgggaa aagagac<210> 4<211> 33<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: prm00958<400> 4
agaaagctgg gttggtttta actagttcca ccg<210> 5<211> 1243<212> DNA
<213> Oryza sativa<400> 5
aaaaccaccg agggacctga tctgcaccgg ttttgatagtgttttccgat cgagggacga aaatcggatt cggtgtaaagttattccgga gcatgattgg gaagggagga cataaggcccgtccagatct ccagatcact cagcaggatc ggccgcgttcttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgccgcacgccgcc gccgccgacc cggctctgcg tttgcaccgcatagatagct actactctct ccgtttcaca atgtaaatcaatattgatgt taatgaatat agacatatat atctatttagatgtaggaaa tgctagaatg acttacattg tgaattgtgatggatggatg caggatcatg aaagaattaa tgcaagatcgttactaattg cgctgcatat atgcatgaca gcctgcatgcccattaggaa gtaaccttgt cattacttat accagtactatcatgagcaa atctacaaaa ctggaaagca ataaggaatacattaatcac caaatatttc gccttctcca gcagaatatatgtacacact gacagtgtac gcataaacgc agcagccagcgcacactggc cttccatctc aggctagctt tctcagccacgcgcgcgcac aggcacaaat tacgtacaaa acgcatgaccgaatcgctcc cgcgcgcggc ggcggcgcgc acgtacgaatccacgacacg atcgcgcgcg acgccggcga caccggccatccgactataa atacgtaggc atctgcttga tcttgtcatcaggaaaaaaa aacaaaacac accaagccaa ataaaagcga<210> 6<211> 34<212> PRT
<213> Seqüência artificial<220>
<223> motivo conservado 1<220>
<221> VARIANTE<222> (1)..(1)<223> /substituir = "Arg"<220>
<221> VARIANTE
<222> (4) . . (4)
<223> /substituir = "lie"
<220>
<221> VARIANTE
<222> (9)..(9)
<223> /substituir = "Thr"
<220>
<221> VARIANTE
<222> (14)..(14)
<223> /substituir = "Ser"
<220>
<221> VARIANTE<222> (15)..(15)
<223> /substituir = "Met" /substituir = "Val'
37
33
tgagggaccc gttgtgtctg 60ttaagggacc tcagatgaac 120atgtcgcatg tgtttggacg 180gcgtagcacc cgcggtttga 240gtagcttccg ccggaagcga 300cttgcacgcg atacatcggg 360ttctactatt ttccacattc 420attcattaac atcaatatga 480aatggacgaa gtacctacga 540tatctgccgc atgcaaaatc 600gggcgtgtaa gcgtgttcat 660catactatat agtattgatt 720cgggactgga aaagactcaa 780tatctctcca tcttgatcac 840ttaactgtcg tctcaccgtc 900ccatcgtaca tgtcaactcg 960aaatcaaaac caccggagaa 1020gcacgcacgc acgcccaacc 1080ccacccgcgc cctcacctcg 1140catctcacca ccaaaaaaaa 1200caa 1243<220><221><222><223><220><221><222>
VARIANTE(18)..(18)/substituir
"Glu" /substituir = "Ala" /substituir = "Ser"
VARIANTE(21)..(21)<223> /substituir = "Vai"<220>
VARIANTE(22) . . (22)/substituir
<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222>
VARIANTE(23)..(23)/substituir
VARIANTE
(25)..(25)/substituir
VARIANTE
(26) . . (26)/substituir
"Arg" /substituir = "Gly"
= "Ser" /substituir = "lie"
= "Ser"
VARIANTE(29) . . (29)<223> /substituir<220>
VARIANTE(31)..(31)/substituir
<221><222><223><220><221><222><223><400>
VARIANTE(34)..(34)/substituir6
= "Asp"
"Asp"
= "Lys"
= "Ala"
Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala Ala Ile Lys15 10 15
Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu Val Arg Ala20 25 30
Val Val
<210> 7<211> 98<212> PRT
<213> Seqüência artificial<220>
<223> motivo conservado 2<220>
<221> VARIANTE<222> (8)..(8)<223> /substituir<220>
<221> VARIANTE<222> (12)..(12)<223> /substituir = "lie"<220>
<221> VARIANTE
<222> (13)..(13)
<223> /substituir = "Met"
<220>
<221> VARIANTE
"Lys" /substituir = "Gln"<222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223>
(14) .. (14)/substituir
VARIANTE(24) . . (24)/substituir
VARIANTE(30)..(30)/substituir
VARIANTE
(38) . . (38)
/substituir
VARIANTE
(39)..(39)/substituir
VARIANTE(44) . . (44)/substituir
= "lie"
= "Ala"
= "Met"
= "Vai"
"Vai"
= "Phe"
VARIANTE(45)..(45)/substituir/substituir ="Lys "
<220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220>
= "Ser" /substituir = "Asn" /substituir
"Asp"
VARIANTE(48) . . (48)/substituir
VARIANTE(50)..(50)/substituir
VARIANTE(57)..(57)/substituir
VARIANTE(60)..(60)/substituir
VARIANTE
(65)..(65)
/substituir
VARIANTE
(66)..(66)/substituir
VARIANTE(68) . . (68)/substituir
= "Phe" /substituir = "Met" /substituir = "lie"
= "Ala"
= "Phe"
= "Ser"
"Ser" /substituir = "Gln" /substituir = "Ala"
"Lys"
"Phe" /substituir = "He"
<221> INSEGURO<222> (69)..(70)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>
<221> VARIANTE<222> (71)..(71)
<223> /substituir = "lie" /substituir = "Met"<220>
<221> VARIANTE<222> (72)..(72)
<223> /substituir = "Asn" /substituir = "Ser"<220>
<221> VARIANTE<222> (73)..(73)
<223> /substituir = "Leu" /substituir = "Gln"<220>
<221> VARIANTE
<222> (74) .. (74)
<223> /substituir = "Met"
<220>
<221> VARIANTE
<222> (76)..(76)
<223> /substituir = "Vai"
<220>
<221> VARIANTE<222> (77)..(77)
<223> /substituir = "Ser" /substituir = "Ala" /substituir = "lie"<220>
<221> VARIANTE
<222> (79)..(79)
<223> /substituir = "Vai"
<220>
<221> VARIANTE<222> (82) .. (82)
<223> /substituir = "Vai" /substituir = "Thr"<220>
<221> VARIANTE<222> (83)..(83)
<223> /substituir = "Thr" /substituir = "Ser"<220>
<221> VARIANTE<222> (85)..(85)
<223> /substituir = "Thr" /substituir = "Lys"<220>
<221> VARIANTE<222> (91)..(91)<223> /substituir = "His"<220>
<221> VARIANTE<222> (93)..(93)<223> /substituir = "Thr"<220>
<221> VARIANTE<222> (97)..(97)<223> /substituir = "Ser"<400> 7
Val Leu His Ile Glu Leu Arg1 5
Pro Leu Ser Ala Asn Thr Leu20
Asn Leu Leu Thr Cys Ile Ile35
Phe Val Ala Pro Ala Met Asn
50 55
Glu Arg His Leu Xaa Xaa Leu65 70
Pro Ile Lys Lys Arg Leu Ala85
Arg Trp Ala10
Gly Lys Ile25
Arg Ala Trp40
Thr Leu Met
Asp Glu Leu
Cys Gly Asp90
Asp Val Leu
Ala Gly Gly
Asp Tyr Thr45
Trp Asn Asn60
Gly Ile Thr75
Tyr Gly Asn
Val Ile Ala15
Leu Cys Asp30
Lys Pro Leu
Pro Phe Thr
Leu Ile Pro80
Gly Ala Met95Ala Glu
<210> 8<211> 171<212> PRT
<213> Arabidopsis thaliana<400> 8
Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala
1 5 10
Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu
20 25
Val Val Thr Lys Ser Ser Leu His Phe Leu Asp Lys Leu
35 40 45
Gln Glu Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser
50 55 60
Lys Ile Gly Asp Pro Val Leu His Ile Glu Leu Arg Arg65 70 75
Val Leu Val Ile Ala Pro Leu Ser Ala Asn Thr Leu Gly
85 90
Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Ile Arg
100 105
Tyr Thr Lys Pro Leu Phe Val Ala Pro Ala-Met Asn Thr115 120 125
Asn Asn Pro Phe Thr Glu Arg His Leu Leu Ser Leu Asp
130 135 140
Ile Thr Leu Ile Pro Pro Ile Lys Lys Arg Leu Ala Cys145 150 155
Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile165 170
<210> 9<211> 606<212> DNA
<213> Arabidopsis thaliana<400> 9
atgaatatgg aagtggatac agtaacaagg aagcctcgtaagtgtggctt caattaagtt cagtaatctc tgccattgttaaagccgtcg cttcaaaatc atctctcaat ttcgttgatagtgactctct atacagatga agatgaatgg tctagctggacttcatatcg agctcagacg ctgggctgat gttatgatcaacattagcca agattgctgg tgggttatgt gataatctattgggattata gcaaaccgtt gtttgttgca ccggcgatgacctttcacag aacggcacct tgtcttgctt gatgaacttgatcaagaaga aactggcctg tggagactac ggtaatggcgatttattcca ctgttagact gttctgggag tcacaagctcagttga<210> 10<211> 201<212> PRT
<213> Arabidopsis thaliana<4 00> 10
Met Asn Met Glu Val Asp Thr Val Thr Arg Lys Pro Arg
1 5 10 Ala Ala Ser Gly Ser Val Ala Ser Ile Lys Phe Ser Asn
20 25
Cys Phe Ser Glu Trp Ala Glu Val Lys Ala Val Ala Ser
35 40 45
Leu Asn Phe Val Asp Lys Pro Ser Leu Pro Gln Asn Val
50 55 60
Thr Asp Glu Asp Glu Trp Ser Ser Trp Asn Lys Ile Gly65 70 75
Leu His Ile Glu Leu Arg Arg Trp Ala Asp Val Met Ile
85 90
Leu Ser Ala Asn Thr Leu Ala Lys Ile Ala Gly Gly Leu
Ala Ile Lys1 5
Val Arg Ala30
Ser Leu Pro
Ser Trp Asn
Trp Ala Asp80*
Lys Ile Ala95
Ala Trp Asp110
Leu Met Trp
Glu Leu Gly
Gly Asp Tyr160
tcttactagctctcagaatgaaccttctctacaagattggttgctccttttgacatgtatacactttgatgaatcaccctcaatggctgagtaaacaaag
tgcaagtggaggctgaagtcacctcagaattgatcccgttgtctgctaacagtaagagcagtggaacaataattcctcccgccttctctgagatggaacc
Ile Leu Leu1 5
Leu Cys His30
Lys Ser Ser
Thr Leu Tyr
Asp Pro Val80
Ile Ala Pro95
Cys Asp Asn
60120180240300360420480540600606105
Ile Val Arg Ala Trp Asp Tyr120
Val Ala Pro Ala Met Asn Thr Leu Met Trp Asn
100
Leu Leu Thr Cys115
130
135
Arg His Leu Val Leu Leu Asp Glu Leu Gly Ile145 150 155
Ile Lys Lys Lys Leu Ala Cys Gly Asp Tyr Gly
165 170
Glu Pro Ser Leu Ile Tyr Ser Thr Val Arg Leu
180 185
Ala Arg Lys Gln Arg Asp Gly Thr Ser195 200
<210> 11
<211> 1128
<212> DNA
<213> Oryza sativa
<4 00> 11
caaccaaagt ccaaaggcta ttctgaaccg aagtcctcccccgtcgcggc accctcctcc gccgccggat ctccaccggatcctcccccg gatcttcacc gccggtgaag tactgaggtgacaagaaacc ttgggattgg atttccctca tcctagcaaactctggaagc gtcgctgcta taaaatttga gagcctttgcagaagtcaga gccgtcgcca ccaaggcttc attacatttttagcaatatt attctttaca ctgatgatga tgaatggtcttgaagttttg cacattgaac tgcgaaaatg ggcagatatcagctaatacc ctagctaaga ttgctggtgg tttatgtgacgagagcatgg gactacagca aaccactctt tgttgccccagaacaacccg ttcaccagtc gtcatcttga gacaatcaacccctcccatt accaaaaggc tggcctgtgg tgattatggtttctgtgatc gattccaccg tcaggcttgc ttgcaagagattcacctgtg gttcctgccg gcagaaacct cccatctagctcaagattaa actctggacc tagttttcta tggtaaagagaatgttaagt gatgtctatg tcggccaaca tagcacctttctattagtga tatggtagga cgtggagatt ggagaaaggcgttgcttttc caaatttctt gtgacataat gctaaggtgctagcactatt tttttctgca aatgtttgca aagactcgtg<210> 12<211> 220<212> PRT
<213> Oryza sativa<4 00> 12
Met Thr Thr Ser Glu Ser Val Gln Glu Thr Leu1 5
110
Ser Lys Pro Leu Phe125
Asn Pro Phe Thr Glu140
Thr Leu Ile Pro Pro160
Asn Gly Ala Met Ala175
Phe Trp Glu Ser Gln190
acaccaaaacgtacggcgccatgactacatcctcgggtcccgtagcttctattgatagaaacctggaagaatggtgattgaacctcttgagctatgaacactgctaggtaaatggtgcaacagccacttatgatgcggcatacttcgtgtattggccagttattgtcccatgatgaatatatggaatc
ttcgaggccc
ggccaccccc
cagagtcagt
tccttgctgc
cggaatgggc
cgtctctgcc
agatagggga
cgccattatc
catgcatagt
ccttcatgtg■
tatctttggt
tggctgagcc
atacaaatag
actattctgt
cacaaaatga
tgttgtacta
gcactttaat
gttcatgttg
Gly Leu
His Pro Ser Lys Pro Arg Val Leu Leu Ala Ala Ser Gly
10
20
25
Ala Ile Lys Phe Glu Ser Leu Cys Arg Ser Phe
35
IO
Val Arg Ala Val Ala Thr Lys Ala Ser Leu His
50
55
Ser Leu Pro Ser Asn Ile Ile Leu Tyr Thr Asp
65 70 75
Thr Trp Lys Lys Ile Gly Asp Glu Val Leu His
85 90
Trp Ala Asp Ile Met Val Ile Ala Pro Leu Ser
100 105
Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu
115 120
Ala Trp Asp Tyr Ser Lys Pro Leu Phe Val Ala
130 135
Phe Met Trp Asn Asn Pro Phe Thr Ser Arg His
145 150 155
Leu Leu Gly Ile Ser Leu Val Pro Pro Ile Thr Lys Arg
Ser Glu
45Phe Ile60
Asp Asp
Ile Glu
Ala Asn
Thr Cys125Pro Ala140
Leu Glu
Asp Phe Pro15
Ser Val Ala30
Trp Ala Glu
Asp Arg Thr
Glu Trp Ser80
Leu Arg Lys95
Thr Leu Ala110
Ile Val Arg
Met Asn Thr
Thr Ile Asn160
Leu Ala Cys
60120180240300360420480540600660720780840900960102010801128165 170
Gly Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro
180 185
Thr Val Arg Leu Ala Cys Lys Arg Gln Pro Leu
195 200
Pro Val Val Pro Ala Gly Arg Asn Leu Pro Ser
210 215
<210> 13<211> 1164<212> DNA<213> Triti<400> 13gcacgagcagtccagttgaggtggtgcactgccgctataagtggccaccactttacactgatcgagctgcgctaagatcgtacagcaaacacggagcggcaaaaggctggacttccgtgacctgtcagtataggaatttgtagtgtttgttcctccctgcatgctacaatatagcttcctgaagtgtccactgtcctaaa<210> 14<211> 220<212> PRT<213> Triti<400> 14Met Ala Thr1
Gln Pro Ser
175
Ser Val Ile Asp Ser190
Asn Thr Asn Ser Ser205
Ser220
ccgcggagcccggttcaagcactcacaaccaatttgagagcgccatccttatgacgatgaggaaatgggcccggtgggttcgctctttgtatcttcacaccctgtggcgaggctcgcgtgataaccggccttttatatgcgtgtattgaatcagtaattaattgtttgttccctgcccaggcaaacttttaaaaaaaaaa
gccagagacaagagctgatgtagtaggccccctttgccgtgcacttcgttatggtctaccagacgttatgatgcgacaactgccccagccaatcaaccaattacgggaaccaagacgcaaatctagctgaagtgtgcatcattgggggggtgagtctatttgtgtgtgtgccagtaatgactactaccct
gacgctgccggctacatcagcgggtcctccagcttctctggatagatcattggaagaagagtgatcgctcctcttgacctatgaacacgtctgggcatagggcgcaatggccgcacgatgtgcagcagtttggagtgttgaaaggctgttcagtttgtaatgggagttggtagtgattatttgatattcc
ccgtcggccgagccagtacattgctgcttcagtgggcggactctaccaagtaggagatgacattgtcagcgcatcgtgagtaatgtggaaccttgatcccccgaaacctccgagcagttcggccacttgataacagatttgtcacaggatttgtcggtggggagtgctgctcagtttgtatggtacaaat
tcctccgcccagagagtttgaggaagtgtatgtccgagcttggcatcgttagtcttacacaaataccctgagcgtgggaccaacccattccccagttaccgcagatccatactcgcgggtttgtcaagcttttttccaacaacaataactgagtacaatttgccacagaggttgtcagtggttggaacga
Ala
Val
Ser
65
Thr
Trp
Lys
Ala
Leu145Gln
Gly
Ser
Ile Lys35
Arg Ala50
Leu Pro
Trp Lys
Ala Asp
Ile Ala115Trp Asp130
Met Trp
Leu Gly
Asp Tyr
Val Arg195
cum aestivum
Ser Glu Pro5
Arg Pro Arg20
Phe Glu Ser
Val Ala Thr
Ser Gly Ile70
Lys Ile Gly85
Val Met Val100
Gly Gly Leu
Tyr Ser Lys
Asn Asn Pro150
Ile Ala Leu
165Gly Asn Gly180
Leu Ala Cys
Val Gln
Val Leu
Leu Cys
40Thr Pro55
Val Leu
Asp Glu
Ile Ala
Cys Asp120Pro Leu135
Phe Thr
Ile Pro
Ala Met
Lys Thr200
Glu Ser Leu10
Leu Ala Ala25
Arg Ser Phe
Ser Leu His
Tyr Thr Asp75
Val Leu His90
Pro Leu Ser105
Asn Leu Leu
Phe Val Ala
Glu Arg His155
Pro Val Thr170
Ala Glu Thr185
Gln Pro His
Val Val
Ser Gly
Ser Glu
45Phe Val60
Asp Asp
Ile Glu
Ala Asn
Thr Cys125Pro Ala140
Leu His
Lys Arg
Ser Gln
Asp Ala205
His Tyr Ser15
Ser Val Ala30
Trp Ala Asp
Asp Arg Ser
Glu Trp Ser80
Leu Arg Lys95
Thr Leu Ala110
Ile Val Arg
Met Asn Thr
Thr Ile Asn160
Leu Ala Cys
175Ile His Thr190
Ser Ser Ser
601201802403003604204805406006607207808409009601020108011401164Leu Ala Gly Pro Val Ser Asn Asn Arg Pro Ser Ser210 215 220
<210> 15<211> 1165<212> DNA<213> Zea mays<4 00> 15
gcacgaggtc agatcgacct ggactttggc ggcagctact tctagaacgc ggcggcacggcagcaagcca gcaaggagaa cgcggcggca cgggcgtgct gctacttctg cttcctctccgacgcttgct gttgagcggt tcaagcagag ctgatggcta catcagagcc agtacaagagagtttggtgg tgcactactc acaacctagt aggccccggg tcctccttgc tgcttcaggaagtgtagccg ctataaaatt tgagagcctt tgccgtagct tctctgagtg ggcggatgtccgagctgtgg ccaccacgcc atccttgcac ttcgttgata gatcatctct accaagtggcatcgttcttt acactgatga cgatgaatgg tctacctgga agaagatagg agatgaagtcttacacatcg agctgcggaa atgggcagac gttatggtga tcgctccatt gtcagcaaataccctggcta agatcgccgg tgggttatgc gacaacctct tgacctgcat cgtgagagcgtgggactaca gcaaaccgct ctttgttgcc ccagccatga acacgttaat gtggaacaacccattcacgg agcggcatct tcacacaatc aaccaactgg gcatagcctt gatccccccagttaccaaaa ggctggcctg tggcgattac gggaacggcg caatggccga aacctcgcagatccatactt ccgtgaggct cgcgtgcaag acgcaaccgc acgatgcgag cagttcactcgcgggtcctg tcagtaataa ccggccatct agctgatgca gcagttggcc acttgattgtcaagcttagg aatttgtttt atatgcagtg tgcatctgga gtgttgtaac agattttttttccaactagt gtttgtgtgt attgaaattg ggggggaaag gctgttgtca caggataacaataacttcct ccctgctcag taattatgag tctattcagt ttgtaattgt cggtgggagtacaattatgc tacaatattg tttgtttgtg tgtgtgtggg agttggggag tgctgctgccacagagatag cttcctccct gcccagccag taatgatagt gattattcag tttgtaaaaaaaaaaaaaaa aaaaaaaaaa aaaaa<210> 16<211> 220<212> PRT<213> Zea mays<4 00> 16
Met Ala Thr Ser Glu Pro Val Gln Glu Ser Leu Va:15 10
Gln Pro Ser Arg Pro Arg Val Leu Leu Ala Ala Se]
20 25
Ala Ile Lys Phe Glu Ser Leu Cys Arg Ser Phe Se:
35 40
Val Arg Ala Val Ala Thr Thr Pro Ser Leu His Phi50 55 60
Ser Leu Pro Ser Gly Ile Val Leu Tyr Thr Asp Asi65 70 75
Thr Trp Lys Lys Ile Gly Asp Glu Val Leu His Ile
85 90
Trp Ala Asp Val Met Val Ile Ala Pro Leu Ser Alc
100 105
Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thi
115 120 125
Ala Trp Asp Tyr Ser Lys Pro Leu Phe Val Ala Pro Ala Met Asn Thr
130 135 140
Leu Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu His Thr Ile Asn145 150 155 160
Gln Leu Gly Ile Ala Leu Ile Pro Pro Val Thr Lys Arg Leu Ala Cys
165 170 175
Gly Asp Tyr Gly Asn Gly Ala Met Ala Glu Thr Ser Gln Ile His Thr
180 185 190
Ser Val Arg Leu Ala Cys Lys Thr Gln Pro His Asp Ala Ser Ser Ser
195 200 205
Leu Ala Gly Pro Val Ser Asn Asn Arg Pro Ser Ser210 215 220
<210> 17<211> 631<212> DNA
Val His Tyr Ser 15 Gly Ser Val Ala 30 Glu Trp Ala Asp45 Val Asp Arg SerAsp Glu Trp Ser 80Glu Leu Arg Lys 95 Asn Thr Leu Ala 110 Cys Ile Val Arg
601201802403003604204805406006607207808409009601020108011401165<213> Picea abies<220>
<221> misc_feature<222> (546)..(546)<223> η é a, c, g, ou t<400> 17
ggacgcgtgg gtactgtact gcatatagaa ctccggcaatgctccactat cagcaaacac gcttgctaag atagcaggtgacttgcataa tacgtgcatg ggactttaac aagcctctctactttcatgt ggaacaaccc atttactcaa cggcatttgggtatcactta tcccccctat aacaaagacg ttagcttgtgatgtcagaac cttcctcaat agatacaact cttaggtttttgaagtatct gatctccctt tctccaattc ttgttatgaaggactgtggt atagactcag attcgtagct gggctagacatggctatgtt aagaaattct gatgataaac aatctcgaacgttccnccat tctggacact tacaagaact gtgtggatacgtcaatctac attgcatatc atctaatttg g<210> 18<211> 120<212> PRT<213> Picea abies<4 00> 18
Gly Arg Val Gly Thr Val Leu His Ile Glu Leu15 10
Ala Met Val Ile Ala Pro Leu Ser Ala Asn Thr
20 25
Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile
35 40
Phe Asn Lys Pro Leu Phe Val Ala Pro Ala Met
50 55
Asn Asn Pro Phe Thr Gln Arg His Leu Asp Ser65 70 75
Val Ser Leu Ile Pro Pro Ile Thr Lys Thr Leu
85 90
Gly Asn Gly Ala Met Ser Glu Pro Ser Ser Ile
100 105
Phe Ser Leu Asp Pro Ser Ile Lys115 120
<210> 19<211> 769<212> DNA
<213> Brassica napus<4 00> 19
gagatctgta agggttttca aaaagagcca tggagaacggtggaagtgca gctctcccct agaaagcccc gcgtactcctccgccatcaa attcggcaac ctctgccact gcttcacagatcgtctcgaa atcgtctctc cacttcctcg acaagctctctctacaccga cgaagacgag tggtcgagct ggaacaagattcgagctcag acgctgggct gacgtcatgg tcatcgctccccaagatagc tggtgggatg tgtgataatc ttctgacttgatagcaaacc gcttttcgtt gcgccggcta tgaatactttcggagaggca tcttttgtcg cttgatgagc ttggaatcacagaggttggc ttgtggtgac tatggtaatg gcgcgatggcccactgttag actcttctgg gagtctcagg ctcatcagcaaccatgatgg ttttgcactt tgcaatggtt ggtcagtgtctgctcgtcct tgtatatgtt aagaacagct gtctgggttg<210> 20<211> 209<212> PRT
<213> Brassica napus<400> 20
Met Glu Asn Gly Lys Arg Asp Arg Glu Asp Met15 10
gggctgatgcgcctatgcgattgtagctccactctatctcgtgattatggcactcgatcctctaacatgcgcatgaacccttatgatttatcctgcttat
tatggtgattcaatctactgtgcaatgaatggagatgggaaaatggtgcattcaattaaattagtactatagctcgtgtgtgtaacatttaagaaaatgt
Arg Gln
Leu Ala
Ile Arg
45Asn Thr60
Ile SerAla CysAsp Thr
Trp Ala Asp15
Lys Ile Ala30
Ala Trp Asp
Phe Met Trp
Glu Met Gly80
Gly Asp Tyr95
Thr Leu Arg110
gaaaagagaccgcagcaaccgtgggcggaatctcccacagcggcgatccctttgtctgcttatcataagagatgtggaactcttattccttgagccgtctaagtggtggaatagattgttatgtctctt
agagaagacaggaagcgtcggtgagagccggaagtgactcgtgcttcacaaacactttaggcttgggattaatccttttaccgatcaagacttatctattactagttaatctgtctgaaa
60120180240300360420480540600631
60120180240300360420480540600660720769
Glu Val Gln Leu Ser15Pro Arg Lys Pro 20 Arg Val Leu Leu Ala 25 Ala Thr Gly Ser Val 30 Ala AlaIle Lys Phe 35 Gly Asn Leu Cys His 40 Cys Phe Thr Glu Trp 45 Ala Glu ValArg Ala 50 Val Val Ser Lys Ser 55 Ser Leu His Phe Leu 60 Asp Lys Leu SerLeu Pro Gln Glu Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser Ser65 70 75 80Trp Asn Lys Ile Gly 85 Asp Pro Val Leu His 90 Ile Glu Leu Arg Arg 95 TrpAla Asp Val Met 100 Val Ile Ala Pro Leu 105 Ser Ala Asn Thr Leu 110 Ala LysIle Ala Gly 115 Gly Met Cys Asp Asn 120 Leu Leu Thr Cys Ile 125 Ile Arg AlaTrp Asp 130 Tyr Ser Lys Pro Leu 135 Phe Val Ala Pro Ala 140 Met Asn Thr LeuMet Trp Asn Asn Pro Phe Thr Glu Arg His Leu Leu Ser Leu Asp Glu145 150 155 160Leu Gly Ile Thr Leu 165 Ile Pro Pro Ile Lys 170 Lys Arg Leu Ala Cys 175 GlyAsp Tyr Gly Asn 180 Gly Ala Met Ala Glu 185 Pro Ser Leu Ile Tyr 190 Ser ThrVal Arg Leu 195 Phe Trp Glu Ser Gln 200 Ala His Gln Gln Ser 205 Gly Gly Thr
Ser
<210> 21
<211><212>
<222>
636DNA
<213> Brassica oleracea var. alboglabra<220>
<221> misc_feature(622)..(622)
c, g, ou t
<223> η é a,<400> 21
gacgcgtggg cggacgcgtg gggggttttc aaaaagagcc atggagaacg
cagagaagac atggaagtgc agctctcccc tagaaagccc cgcgtactcc
cggaagcgtc gccgccatca aattcggcaa cctctgccac tgcttcacag
agtgagagcc gtcgtctcga aatcgtctct ccacttcctc gacaagctct
ggaagtgact ctctacaccg acgaagacga gtggtcgagc tggaacaaga
cgtgcttcac atcgagctca gacgctgggc tgacgtcatg gtcatcgctc
taacacttta gccaagatag ctggtgggat gtgtgataat cttctgactt
agcttgggat tatagcaaac cgcttttcgt tgcgccggct atgaatactt
caatcctttt acggagaggc atcttttgtc gcttgatgag cttggaatca
tccgatcaag aagaggttgg cttgtggtga ctatggtaat ggcgcgatgg
tcttatctat tccactgtta gnctcttctg ggagtc<210> 22
ggaaaagagatcgcagcaacagtgggcggactctcccacatcggcgatccctttgtctgcgtatcataagtgatgtggaactcttattccctgagccgtc
<211><212>
198PRT
alboglabra
<221><222>
<213> Brassica oleracea var.<220>
INSEGURO(194)..(194)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 22
Met Glu Asn Gly Lys Arg Asp Arg Glu Asp Met Glu Val Gln Leu Ser15 10 15
Pro Arg Lys Pro Arg Val Leu Leu Ala Ala Thr Gly Ser Val Ala Ala
20 25 30
Ile Lys Phe Gly Asn Leu Cys His Cys Phe Thr Glu Trp Ala Glu Val
35 40 45
Arg Ala Val Val Ser Lys Ser Ser Leu His Phe Leu Asp Lys Leu Ser50 55 60
60120180240300360420480540600636Leu Pro Gln Glu Val Thr Leu Tyr Thr Asp Glu65 70 75
Trp Asn Lys Ile Gly Asp Pro Val Leu His Ile
85 90
Ala Asp Val Met Val Ile Ala Pro Leu Ser Ala
100 105
Ile Ala Gly Gly Met Cys Asp Asn Leu Leu Thr
115
120
Trp Asp Tyr Ser Lys Pro Leu Phe Val Ala Pro
130
135
Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu145 150 155
Leu Gly Ile Thr Leu Ile Pro Pro Ile Lys Lys
165 170
Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser
180 185
Val Xaa Leu Phe Trp Glu195
<210> 23<211> 958<212> DNA
<213> Nicotiana tabacum<400> 23
ggagctgtgt tgccgcagaa ggagcaagaa ttgttggtgcatttaattcc tagcagattt gatttagatt agggtagataccggttcaga ttaacaatgc accgaggaga cctcgcattcgtggctgcta tcaagtttgc cagtctatgc cgttcctttagcggttgcta caaaagcttc tcttcatttc atagacaaagattctttata ctgatgagga tgaatggtca acttggacgacacatcgagc tccggaggtg ggctgatatt atgattattgcttgggaaga ttgctggtgg actatgtgat aacttgttaagactacgata aacccctttt cgtggcacca gcaatgaatattcacagaaa agcaccttat ggcaattgat gagcttgggatcaaagagac tagcctgtgg agattacggg aatggagcaattccaagctg taagactcta ttatgacgca caattacgattgatccacag gtcatgaaat ttcattcatc ggtttgtacattcaggacca ggagcccagc tgtgttattt ttctcctaaatttcttgtgt cctagagcta ctttcaatca aggttcatgtagaatatcac gtaactgctg ttactaatgg atgtgatcat<210> 24<211> 207<212> PRT
<213> Nicotiana tabacum<400> 24
Met Glu Thr Ser Glu Met Glu Pro Val Gln Ile1 5 10
Arg Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser
Asp
Glu
Asn
Cys
Ala140Leu
Arg
Leu
Glu Trp
Leu Arg
Thr Leu110Ile Ile125
Met Asn
Ser Leu
Leu Ala
Ile Tyr190
Ser Ser80Arg Trp95
Ala Lys
Arg Ala
Thr Leu
Asp Glu160Cys Gly175
Ser Thr
ttcaaggatatggagacttctgcttgcagcctgattgggccttcacttccagataggtgacccctttgtccctgcatcgtcattgatgtgtctctctcattggctgaacccaggtggcagagtgatagaattcttcaccttcattttagtgatcatgaac
attggtgttgagagatggaaaagtggaagttgaagttaaaggaagatgtcccgtgtgctaagcaaatacaacgagcatgggaataatccaaccaccagtagtctctgatccaacgtggcggttgttgaaaccctagtatccgataaaatgatgaaaaa
20
25
Phe Ala Ser Leu Cys Arg Ser Phe Thr Asp Trp
35
40
Val Ala Thr Lys Ala Ser Leu His Phe Ile Asp
50
55
Glu Asp Val Ile Leu Tyr Thr Asp Glu Asp Glu
Asn Asn Ala
Val Ala Ala30
Ala Glu Val45
Lys Ala Ser60
Trp Ser Thr
65
70
75
Lys Ile Gly Asp Arg Val Leu His Ile Glu Leu Arg Arg Trp
85
90
Ile Met Ile Ile Ala Pro Leu Ser Ala Asn Thr
100
105
Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile
115
120
Tyr Asp Lys Pro Leu Phe Val Ala Pro Ala Met
130
135
Asn Asn Pro Phe Thr Glu Lys His Leu Met Ala
Leu Gly Lys110
Val Arg Ala125
Asn Thr Leu140
Ile Asp Glu
Pro Arg15
Ile Lys
Lys Ala
Leu Pro
Trp Thr80Ala Asp95
Ile AlaTrp AspMet TrpLeu Gly
60120180240300360420480540600660720780840900958145 150 155 160
Ile Ser Leu Ile Pro Pro Val Ser Lys Arg Leu Ala Cys Gly Asp Tyr
165 170 175
Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile Phe Gln Ala Val Arg
180 185 190
Leu Tyr Tyr Asp Ala Gln Leu Arg Ser Gly Gly Ser Asn Val Ala195 200 205
<210> 25<211> 1016<212> DNA
<213> Solanum tuberosum<400> 25
gaattgatcg gcgccggact tcgatcaccg tcggcgtttc taagccgtcg ccggaactaa 60
gccggagaaa atctcaatca agtgagctaa gcactcggcg tttcaacttc tggttataaa 120tttattaaag cctttgctcc attaggttag gtagatacgg atcctatgac ttcagagatg 180gaaccagttc agattaatgg tgcacctagg agacctcgta ttctgctggc agcaagtgga 240agtgtggctg caattaagtt tgcaaatcta tgtggttgtt tttctgaatg ggcagaagtt 300aaagcagttg caacaaaacc ttctcttcat ttcatagaca aagcttcact tccggaagat 360gccattctat atactgatga ggaggaatgg tccacttgga agaaaattgg tgatagtgtg 420ctacacattg agctccgcag gtgggctgat attatggtta ttgccccttt gtcagcaaac 480acacttggga agattgcagg tggactatgt gataacttgt taacctgcat cgtacgagca 540tgggactaca ataaacccct ttttgtggca ccagccatga atacattgat gtggaataat 600ccattcacag aacgacacct tatggtaatt gatgagcttg gaatctctct cataccacca 660gtttctaaaa gactagcttg tggagattat ggaaacggcg ctatggctga accttctctc 720atctactcaa ctgtaagact cttctatgag tcacggtcac aatcaggtgg catcaacttg 780gcttgatcca cggatcatta aattttattc gtcggtttgt acaagtggta gaaattgttg 840aaattcagga cctggaacag tgttacttag catacaccag ttgtgtttat ttttctcctt 900aattagtgtc atgtttgtat ccaagagctg actttcaatc aagtttcatg ttcattgtag 960tctattgact ctgaatatta tgcaactcta tatagtaccc gctactaatt atgtat 1016
<210> 26<211> 206<212> PRT
<213> Solanum tuberosum<400> 26
Met Thr Ser Glu Met Glu Pro Val Gln Ile Asn Gly Ala Pro Arg Arg1 5 10 15 Pro Arg Ile Leu 20 Leu Ala Ala Ser Gly 25 Ser Val Ala Ala Ile 30 Lys PheAla Asn Leu 35 Cys Gly Cys Phe Ser 40 Glu Trp Ala Glu Val 45 Lys Ala ValAla Thr 50 Lys Pro Ser Leu His 55 Phe Ile Asp Lys Ala 60 Ser Leu Pro GluAsp Ala Ile Leu Tyr Thr Asp Glu Glu Glu Trp Ser Thr Trp Lys Lys65 70 75 80Ile Gly Asp Ser Val 85 Leu His Ile Glu Leu 90 Arg Arg Trp Ala Asp 95 IleMet Val Ile Ala 100 Pro Leu Ser Ala Asn 105 Thr Leu Gly Lys Ile 110 Ala GlyGly Leu Cys 115 Asp Asn Leu Leu Thr 120 Cys Ile Val Arg Ala 125 Trp Asp TyrAsn Lys 130 Pro Leu Phe Val Ala 135 Pro Ala Met Asn Thr 140 Leu Met Trp AsnAsn Pro Phe Thr Glu Arg His Leu Met Val Ile Asp Glu Leu Gly Ile145 150 155 160Ser Leu Ile Pro Pro 165 Val Ser Lys Arg Leu 170 Ala Cys Gly Asp Tyr 175 GlyAsn Gly Ala Met 180 Ala Glu Pro Ser Leu 185 Ile Tyr Ser Thr Val 190 Arg LeuPhe Tyr Glu 195 Ser Arg Ser Gln Ser 200 Gly Gly Ile Asn Leu 205 Ala
<210> 27<211> 967<212> DNA<213> Glycine max<400> 27
ggttgaacag aagagattta ggcagcccga accgacgatg ttgtttttaa ctgacagcag 60
cacaaagcga acactaacac taacgtgaaa cgcgttgcgt tgtcggaaaa tcaccctcac 120
ctgatcactg tggaagtctc taggtgatgg ccggttcaga acctgttagg gcagagggag 180
agactatggc tgtggatgct gccccaagga agccccggat tctacttgct gctagtggga 240
gtgttgctgc tgtcaaattt gcaaatcttt gtcactgttt ctctgaatgg gcagatgtaa 300
gagcagtttc cacaagtgca tctttgcatt tcattgatag agcagcaatg cccaaggatg 360
taattctata cacggatgac aatgaatggt ctagttggaa gaaattaggt gatagcgtgc 420
ttcacattga gcttcgcaaa tgggctgata tcatggtcat cgctccatta tcagcaaaca 480
cccttggcaa gattgctgga gggttgtgtg acaatctact gacatgcatc gttcgagcct 540
gggactacag caagccattc tttgttgcac cagccatgaa cactttgatg tggaacaatc 600
ctttcactga gcggcatttc atctccattg atgagcttgg catttctctc atcccgcctg 660
ttacaaagag gttagcttgt ggggattatg gcaatggtgc catggctgaa ccctctacca 720
tttactcaac tgtaaggctc ttctatgagt caaaggctca gcaaggtaga gctgtggtaa 780
ccttaaggtg aatgaagggg tagtcctacg cccccattca tggtagtcaa tagcactcta 840
tagcaggata acggagcgca gcagccctga gttactatgg aagtcgaaat cgctgagcga 900
ttttcaataa ccgctgtagc ggctgcaata gtggtctaaa tacagctttt cgggtgctac 960
agcgcac 967<210> 28<211> 214
<212> PRT
<213> Glycine max
<400> 28
Met Ala Gly Ser Glu Pro Val Arg Ala Glu Gly Glu Thr Met Ala Val1 5 10 15 Asp Ala Ala Pro Arg Lys Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser 20 25 30 Val Ala Ala Val Lys Phe Ala Asn Leu Cys His Cys Phe Ser Glu Trp 35 40 45 Ala Asp Val Arg Ala Val Ser Thr Ser Ala Ser Leu His Phe Ile Asp 50 55 60 Arg Ala Ala Met Pro Lys Asp Val Ile Leu Tyr Thr Asp Asp Asn Glu65 70 75 80Trp Ser Ser Trp Lys Lys Leu Gly Asp Ser Val Leu His Ile Glu Leu 85 90 95 Arg Lys Trp Ala Asp Ile Met Val Ile Ala Pro Leu Ser Ala Asn Thr 100 105 110 Leu Gly Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile 115 120 125 Val Arg Ala Trp Asp Tyr Ser Lys Pro Phe Phe Val Ala Pro Ala Met 130 135 140 Asn Thr Leu Met Trp Asn Asn Pro Phe Thr Glu Arg His Phe Ile Ser145 150 155 160Ile Asp Glu Leu Gly Ile Ser Leu Ile Pro Pro Val Thr Lys Arg Leu 165 170 175 Ala Cys Gly Asp Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser Thr Ile 180 185 190 Tyr Ser Thr Val Arg Leu Phe Tyr Glu Ser Lys Ala Gln Gln Gly Arg 195 200 205 Ala Val oin Val Thr Leu Arg
<210> 29<211> 1067<212> DNA
<213> Vitis vinifera<400> 29
ttgggagaga tgccacggcc ctcattcgct ctcgatcccc gacctcggct tcactctctc 60
taattttccc gagcaattct ccgagttgag gctgatttga aagttaatga tgatgacata 120tgcagaacct ttgagtccag aagttgatgc gataccagtc aacattgctc ccagaagacc 180ccggattcta cttgctgcta gtgggagtgt agctgctatg aagtttggga atctcgtcca 240ttctttttgt gaatgggcag aagtaagagc agttgtcaca aaggcttctt tacacttcat 300tgatagagca gcactgccta aggatttata tctttacact gatgatgatg aatggtccag 360ttggacaaaa ttaggagaca gtgtgcttca cattgagctc cgcaggtggg ctgatgtcat 420
ggtaatcgcc ccattatcag caaatacact tggcaagatt gccgggggac tgtgtgacaa 480
cctgctgaca tgcattgtgc gagcgtggga ctacagcaag ccaatgtttg ttgcgccagc 540
tatgaacacc ttcatgtgga ccaatccttt cacagaacgc catcttatga caattgatga 600
acttggaatt tctcttattc cacctgtcac taaaaggctg gcttgcggag attatgggac 660
tggtgcaatg gctgaacctt ttctcatcca ctcaaccgta agactcttct tggagacacg 720
ggctcaatca agtagcagta atgtgcagta attgggtatg gttaatctgt ctgttggaga 780
agtcaccaga gagttggctg aaatggcatg ttggaaatgc taaacgtagt tcacttggac 840
cgcattgatt ttgttatgac cgtccattaa acttactacg tcttgtagat tgttggtatc 900
ggtggatttg catatcctgt ttctcaatat ttctagtagc gccttttgaa tgttatgtgc 960
cttgtgtatt aatggtgagg gagaatgtat cagtctccta aatttctcaa tctctgtgta 1020
gacatgcttg atgatacatt cctataaata gactctgatt tctgggc 1067<210> 30<211> 214<212> PRT
<213> Vitis vinifera<400> 30
Met Met Met Thr Tyr Ala Glu Pro Leu Ser Pro Glu Val Asp Ala Ile1 5 10 15 Pro Val Asn Ile Ala Pro Arg Arg Pro Arg Ile Leu Leu Ala Ala Ser 20 25 30 Gly Ser Val Ala Ala Met Lys Phe Gly Asn Leu Val His Ser Phe Cys 35 40 45 Glu Trp Ala Glu Val Arg Ala Val Val Thr Lys Ala Ser Leu His Phe 50 55 60 Ile Asp Arg Ala Ala Leu Pro Lys Asp Leu Tyr Leu Tyr Thr Asp Asp65 70 75 80Asp Glu Trp Ser Ser Trp Thr Lys Leu Gly Asp Ser Val Leu His Ile 85 90 95 Glu Leu Arg Arg Trp Ala Asp Val Met Val Ile Ala Pro Leu Ser Ala 100 105 110 Asn Thr Leu Gly Lys Ile Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr 115 120 125 Cys Ile Val Arg Ala Trp Asp Tyr Ser Lys Pro Met Phe Val Ala Pro 130 135 140 Ala Met Asn Thr Phe Met Trp Thr Asn Pro Phe Thr Glu Arg His Leu145 150 155 160Met Thr Ile Asp Glu Leu Gly Ile Ser Leu Ile Pro Pro Val Thr Lys 165 170 175 Arg Leu Ala Cys Gly Asp Tyr Gly Thr Gly Ala Met Ala Glu Pro Phe 180 185 190 Leu Ile His Ser Thr Val Arg Leu Phe Leu Glu Thr Arg Ala Gln Ser 195 200 205 Ser Ser Ser Asn Val Gln 210 <210> 31 <211> 1081 <212> DNA <213> Hordeum vulgare <400> 31
cggcacgagg ctccccaatt ccctccgccc gcggcgcgcc gctccgggca gcctcggtcg 60
ccgccgccgc cgccgctgcc tccacctacc gccggccgac gacgcccttc gaacctaccg 120
cctccgccgc catcttcaac cgcttatttg cctgcgctcc taccagatcg cctctgagtt 180
gagggctcca agtgaagcag atggctacat cagaaccggt acagcaaagc tgggagctgg 240
aatccagcag gcctcgggtc ctccttgctg cgtcagggag tgtagctgct ataaaattcg 300
agagcctctg ccgtatcttc tccgagtggg cggaagtccg agctgtggcg accaagtcag 360
cattgcactt tgttgacaga tcatctctgc caagcgacgt cgtcctttac actgatgatg 420
atgagtggtc tacctggaca aagataggag acgaggttct gcacatagag ctgcgaaagt 480
gggcagacat catggtgatc gcccccttat cagcaaacac tctggccaag atcgccggcg 540
ggttatgcga caacctcctg acgtgcatta tccgagcgtg ggactacaag aagccgatct 600
tcgccgcgcc agccatgaac accttcatgt ggaacaaccc attcacggcg cgccacatcg 660
agaccatgaa ccaactgggc atctccctgg tcccgcccac cacgaaacgg ctggcctgcg 720
gcgactacgg gaacggcgcg atggctgagc cctcgcagat ccacacgact gtgaggctcg 780cgtgcaagtc gcagacgttt ggcacgggca tttcgcccgc gcacccttcc agcggccacc 84 0ccgtctagcc gatgcggtga tggtcactat gttcaggtgg tctagtactc gaggtttttc 900tatgccgccc acatcatcag ggtttgagaa agtgaagggt atcaccaggt gttctgttca 960tcggtggtgt ctgtattaac cgaagtatcg tacctgtggg atatggatca gcttatttgt 1020tatgtggtag tagacgttag ggcgtagacg tagagattgg ggaattgctg ttgctccagc 10801081
<210> 32<211> 215<212> PRT
<213> Hordeum vulgare<400> 32
Met Ala Thr Ser Glu Pro Val Gln Gln Ser Trp Glu Leu Glu15 10
Arg Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala Ala
20 25 30
Phe Glu Ser Leu Cys Arg Ile Phe Ser Glu Trp Ala Glu Val
35 40 45
Val Ala Thr Lys Ser Ala Leu His Phe Val Asp Arg Ser Ser
50 55 60
Ser Asp Val Val Leu Tyr Thr Asp Asp Asp Glu Trp Ser Thr65 70 75
Lys Ile Gly Asp Glu Val Leu His Ile Glu Leu Arg Lys Trp
85 90
Ile Met Val Ile Ala Pro Leu Ser Ala Asn Thr Leu Ala Lys100 105 110
Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Ile Arg Ala
115 120 125
Tyr Lys Lys Pro Ile Phe Ala Ala Pro Ala Met Asn Thr Phe
130 135 140
Asn Asn Pro Phe Thr Ala Arg His Ile Glu Thr Met Asn Gln145 150 155
Ile Ser Leu Val Pro Pro Thr Thr Lys Arg Leu Ala Cys Gly
165 170
Gly Asn Gly Ala Met Ala Glu Pro Ser Gln Ile His Thr Thr180 185 190
Leu Ala Cys Lys Ser Gln Thr Phe Gly Thr Gly Ile Ser Pro
195 200 205
Pro Ser Ser Gly His Pro Val210 215
<210> 33<211> 1175<212> DNA
<2l3> Gossypium hirsutum<400> 33
cccattgtca cctttagtgc tggtgagcat ttaagagagg gcagagcaac ggaggaaatc 60
cccttttttg tgcagtggaa gtaaaaatta cctaccatta gaaaaggaga aggattggta 120aagtattgca gcgctccgta aaggcatttt ggtatagcaa gtagcagcaa ttcatcaaaa 180ggcagcattt ctttttgcac caggggccct ttaaaaagct caactctcgc gcttctttgc 240gtttcaaatc tctctgcaag tcgcaaggac atctgaagca gaaagcccag attcctctct 300aatcttagat tccagatttg cataggttat ggcgtatcct gagcctcaag gtgcagatag 360ggagatggtt aaggtcaatc ctaccccaag aaaaccccgg gttttactcg ctgccagtgg 420aagtgtagct gccataaagt ttgggaatct ctgccattgt ttctctgaat gggcagaagt 480aaaagcagtt gccacgaaag cttctttgca tttcattgac agagcatcac ttcctaagga 540tctaaagctt tacactgatg aggaggaatg gtctagttgg gggaaaatag gtgacagtgt 600gcttcacatt gagcttcgtc gatgggctga tattatggtc attgccccat tgtcagcaaa 660cacacttggc aagattgctg gaggattatg tgacaatttg ttaacttgtg tcgtacgagc 720atgggactac agcaagccaa tgtttgttgc accagctatg aacactttca tgtggagcaa 780ccctttcaca gaaaagcatc tcatgacaat tgatgagctt ggtatttctc tcatcccccc 840tgtctccaaa agactagctt gtggggacta tggaaacggc gcaatggcag aaccttctct 900aatccactcg actgtaagat tattcttgga gtcacgacct caaccaagtg actgaagatc 960tatttattcg ccatgaatta taaatactat attagttgta tggtagccca gttgactcta 1020ggttgggtgt atgtctatta gctgtctaac aagcttattg tacatttata gttgcatttc 1080cgagtttgct taactttgca tatcatgagg agtggtcttt gaatactgct gaaaatttga 1140
Ser Ser15
Ile Lys
Arg Ala
Leu Pro
Trp Thr80Ala Asp95
Ile Ala
Trp Asp
Met Trp
Leu Gly160Asp Tyr175
Val ArgAla Histcctgtaagc tgatgatact gatgagagtt ggcag<210> 34<211> 208<212> PRT
<213> Gossypium hirsutum<400> 34
1175
Met Ala Tyr Pro Glu Pro Gln Gly Ala Asp Arg Glu Met Val Lys Val1 5 10 15 Asn Pro Thr Pro 20 Arg Lys Pro Arg Val 25 Leu Leu Ala Ala Ser 30 Gly SerVal Ala Ala 35 Ile Lys Phe Gly Asn 40 Leu Cys His Cys Phe 45 Ser Glu TrpAla Glu 50 Val Lys Ala Val Ala 55 Thr Lys Ala Ser Leu 60 His Phe Ile AspArg Ala Ser Leu Pro Lys Asp Leu Lys Leu Tyr Thr Asp Glu Glu Glu65 70 75 80Trp Ser Ser Trp Gly 85 Lys Ile Gly Asp Ser 90 Val Leu His Ile Glu 95 LeuArg Arg Trp Ala 100 Asp Ile Met Val Ile 105 Ala Pro Leu Ser Ala 110 Asn ThrLeu Gly Lys 115 Ile Ala Gly Gly Leu 120 Cys Asp Asn Leu Leu 125 Thr Cys ValVal Arg 130 Ala Trp Asp Tyr Ser 135 Lys Pro Met Phe Val 140 Ala Pro Ala MetAsn Thr Phe Met Trp Ser Asn Pro Phe Thr Glu Lys His Leu Met Thr145 150 155 160Ile Asp Glu Leu Gly 165 Ile Ser Leu Ile Pro 170 Pro Val Ser Lys Arg 175 LeuAla Cys Gly Asp 180 Tyr Gly Asn Gly Ala 185 Met Ala Glu Pro Ser 190 Leu IleHis Ser Thr 195 Val Arg Leu Phe Leu 200 Glu Ser Arg Pro Gln 205 Pro Ser Asp
<210> 35<211> 1119<212> DNA
<213> Sorghum bicolor<400> 35
gcacgagggc tctctccgct cacctccact tccccgcccc
acacgggcgc gcacccgtcc gcctccgact gacccggagcgggagggaga gcccgaaccg cggcggggcg ggagggctccgggccagccg ccccatgggc cggtcgcctg agcgcgctac
ggaaagctga gcgttagcgg agctgatggc tacatcagaggatggactac tcacaaccta gtaagcctcg ggtactccttcgctataaaa tttgagaacc tttgtcgtag tttctctgag
ggccaccgca tcatctttgc actttattga tagatcatct
ttacactgat gatgatgagt ggtctacctg gaagaagata
tgagctgcgt aaatgggcag atattatggt gattgctccg
taagatcgcc ggtgggttat gtgacaacct cttaacatgc
cagcaaaccg ctctttgttg ccccagctat gaacacatta
agagcgtcat cttcaaacga tcaaccaact gggcataatc
aaggttggct tgtggcgatc acgggaatgg tgcaatggct
ttctgtgagg cttgcatgga agacgcaacc acatgatgca
tgtcagtaat aaccgcccat ctagctggtg tttgacctct
tgttttatct gcagtgtgca tcttgatgtt agaaatgttg
tgttttagtg tgtattgtga tgagaatgtg gggaaaggaa
ataaattact gccagctcag tatcgatagt gaggatgag<210> 36<211> 225<212> PRT
<213> Sorghum bicolor<400> 36
Met Ala Thr Ser Glu Pro Val Gln Glu Asn Leu15 10
cgccccggtccgactcgaccttttcgtttggtatcagctcccagtacaaggctgcttcagtgggcggatgcttccaagtgggagatgaagttatcagcaaatcgtgagagatgtggaacattgatcccccgaaacctcgcagcagttcactaattaagagtaccaattttggttgtcagt
tccgtccttgttgttcaggaccccgccggaatcgaccggcagaatttggcgaagtgtagctccgagccgtacattgttctttttacacatataccctggccgtgggactaacccattcaccagttaccaaagatctatacttgtggttcccttaggaattttttaaccagtgtcacggtg
60120180240300360420480540600660720780840900960102010801119
Ala Met Asp Tyr Ser
15Gln Pro Ser Lys Pro Arg Val Leu Leu Ala Ala Ser Gly Ser Val Ala
20
25
30
Ala Ile Lys Phe Glu Asn Leu Cys Arg Ser Phe Ser Glu Trp Ala Asp
35
40
45
Val Arg Ala Val Ala Thr Ala Ser Ser Leu His Phe Ile Asp Arg Ser
50
55
60
Ser Leu Pro Ser Asp Ile Val Leu Tyr Thr Asp Asp Asp Glu Trp Ser
65
70
75
80
Thr Trp Lys Lys Ile 85 Gly Asp Glu Val Leu 90 His Ile Glu Leu Arg 95 LysTrp Ala Asp Ile 100 Met Val Ile Ala Pro 105 Leu Ser Ala Asn Thr 110 Leu AlaLys Ile Ala 115 Gly Gly Leu Cys Asp 120 Asn Leu Leu Thr Cys 125 Ile Val ArgAla Trp 130 Asp Tyr Ser Lys Pro 135 Leu Phe Val Ala Pro 140 Ala Met Asn ThrLeu Met Trp Asn Asn Pro Phe Thr Glu Arg His Leu Gln Thr Ile Asn145 150 155 160Gln Leu Gly Ile Ile 165 Leu Ile Pro Pro Val 170 Thr Lys Arg Leu Ala 175 CysGly Asp His Gly 180 Asn Gly Ala Met Ala 185 Glu Thr Ser Gln Ile 190 Tyr ThrSer Val Arg 195 Leu Ala Trp Lys Thr 200 Gln Pro His Asp Ala 205 Ser Ser SerLeu Val 210 Val Pro Val Ser Asn 215 Asn Arg Pro Ser Ser 220 Trp Cys Leu Thr
Ser225
<210> 37<211> 975<212> DNA
<213> Lycopersicon esculentum<400> 37
ctacaattga tcggcgccgg actttgatca ccgtcggcgt ttctaagccg ttgccggact 60
atgccggagc aaatctcaat caagtgagct aaccactctg tgtttcaact tctggttata 120aattttttaa agcctttgct ccgttaggtt aggtagatac ggatcctatg acttcagaga 180tggaaccagt tcagattaat ggtgcaccta ggagacctcg tattctgctg gcagcaagtg 240gaagtgtggc ttcaattaag tttgctaatc tatgtcgttg tttttctgaa tgggcagaag 300ttaaagcagt tgcaacgaaa ccttctcttc atttcataga caaagcttcg cttccggaag 360atgtcattct ttatactgat gaggaggaat ggtccacttg gtgcagattg gtgatagtgt 420gctacacatt gagctccgca gatgggctga tattatggtt attgcccctt tgtcagcaaa 480cacacttggg aagattgcag gtggactatg tgataacttg ttaacctgca tcgtacgagc 540atgggactac aataaacccc tttttgtggc accagccatg aatacattga tgtggaataa 600tccattcaca gaacgacacc ttatggtaat tgatgagctt ggaatctctc tcataccccc 660agtttcaaaa agactagcat gtggagatta tggaaatggc gctatggctg aaccttctct 720catttactca actgtaagac tcttttatga gtcacggtca caatcaggtg gcatcaactt 780ggcttgattc gcagatcatt aaattttatt catcggtttg tacaagtggt aaaaattgtt 840gaaattcagg acctggaaca gtgttactta gcatacacca gttgggttta tttttctcct 900aaattcttca cctctttaac ttgtgtcatg tttgtatcca agcggtaact ttcaatcaag 960tttcatgttc attgt 975
<210> 38<211> 206<212> PRT
<213> Lycopersicon esculentum<220>
<221> INSEGURO<222> (74)..(74)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 38
Met Thr Ser Glu Met Glu Pro Val Gln Ile Asn Gly Ala Pro Arg Arg1 5 10 15
Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser Val Ala Ser Ile Lys Phe20 25 30Ala Asn Leu Cys35
Ala Thr Lys Pro50
Asp Val Ile Leu65
Ile Gly Asp Ser
Met Val Ile Ala100
Gly Leu Cys Asp115
Asn Lys Pro Leu130
Asn Pro Phe Thr145
Ser Leu Ile Pro
Asn Gly Ala Met180
Phe Tyr Glu Ser195
<210> 39<211> 1395<212> DNA<213> Arabidopsis thaliana<400> 39
atggcgaaaa cagctcttac tcctcccgcg tctggttccg aagttccaag atccggtaca 60
cctggagatg cgtctggcaa caaacctcaa acggatgcca ccggcgtctc agctactgat 120actgcttctc agaaacgcgg tcgtggtcga ccgccaaagg ctaaatctga ctcttcccaa 180atcggtgccg tttctgcgaa ggcgagtact aaaccaagtg gtcgtccgaa aagaaacgta 240gctcaggctg ttccttctac gtctgtggcg gcggctgtga agaaacgtgg tagggcaaag 300aggtcgactg taacggcggc tgtggttact actgctactg gagagggttc tagaaaacga 360gggaggccaa agaaagatga cgtggcggct gcaactgttc cagcagaaac tgtggtggct 420ccagctaaga gacgtggaag gaaacctact gtcgaagtag ctgcacagcc tgtgcgcagg 480actaggaagg tattcgggtt ttctatgcat gaacaaaaga gcacttcagt ggcaccggta 540gctgcaaacg tcggagatct caagaaaaga accgcactct tacaaaagaa agtgaaggaa 600gctgcagcta agttgaaaca agcagtaaca gcaattgacg aggtccagaa gttagcggat 660ggaatattga ccagcgatga cgtcgacttc tctgttttgt tttcaaactt aaagaccctc 720gcggcatttg atttcgattt ccgattaggg ttcctcgcag atcctccttc ctcggctata 780gagaagaaga tgaatatgga agtggataca gtaacaagga agcctcgtat cttactagct 840gcaagtggaa gtgtggcttc aattaagttc agtaatctct gccattgttt ctcagaatgg 900gctgaagtca aagccgtcgc ttcaaaatca tctctcaatt tcgttgataa accttctcta 960cctcagaatg tgactctcta tacagatgaa gatgaatggt ctagctggaa caagattggt 1020gatcccgttc ttcatatcga gctcagacgc tgggctgatg ttatgatcat tgctcctttg 1080tctgctaaca cattagccaa gattgctggt gggttatgtg ataatctatt gacatgtata 1140gtaagagcat gggattatag caaaccgttg tttgttgcac cggcgatgaa cactttgatg 1200tggaacaatc ctttcacaga acggcacctt gtcttgcttg atgaacttgg aatcacccta 1260attcctccca tcaagaagaa actggcctgt ggagactacg gtaatggcgc aatggctgag 1320ccttctctga tttattccac tgttagactg ttctgggagt cacaagctcg taaacaaaga 1380gatggaacca gttga 1395
<210> 40<211> 464<212> PRT
<213> Arabidopsis thaliana<400> 40
Met Ala Lys Thr Ala Leu Thr Pro Pro Ala Ser Gly Ser Glu Val Pro15 10 15
Arg Ser Gly Thr Pro Gly Asp Ala Ser Gly Asn Lys Pro Gln Thr Asp
20 25 30
Ala Thr Gly Val Ser Ala Thr Asp Thr Ala Ser Gln Lys Arg Gly Arg
35 40 45
Gly Arg Pro Pro Lys Ala Lys Ser Asp Ser Ser Gln Ile Gly Ala Val
Arg Cys
Ser Leu
Tyr Thr
70Val Leu85
Pro Leu
Asn Leu
Phe Val
Glu Arg150Pro Val165
Ala Glu
Phe
His
55
Asp
His
Ser
Leu
Ala135His
SerProArg Ser Gln
Ser Glu40
Phe Ile
Glu Glu
Ile Glu
Ala Asn105Thr Cys120
Pro Ala
Leu Met
Lys Arg
Ser Leu185Ser Gly200
Trp Ala GluAspXaa
Leu
90
Thr
Ile
Met
Val
Leu170Ile
Gly
Lys Ala60
Met Val75
Arg Arg
Leu Gly
Val Arg
Asn Thr140Ile Asp155
Ala CysTyr SerIle Asn
Val Lys Ala45
Ser Leu Pro
His Leu Val
Trp Ala Asp95
Lys Ile Ala110Ala Trp Asp125
Leu Met Trp
Glu Leu Gly
Gly Asp Tyr175
Thr Val Arg
190Leu Ala205
Val
Glu
Gln80Ile
Gly
Tyr
Asn
Ile160Gly
Leu50 55 60 Ser Ala Lys Ala Ser Thr Lys Pro Ser Gly Arg Pro Lys Arg Asn Val65 70 75 80Ala Gln Ala Val Pro Ser Thr Ser Val Ala Ala Ala Val Lys Lys Arg 85 90 95 Gly Arg Ala Lys Arg Ser Thr Val Thr Ala Ala Val Val Thr Thr Ala 100 105 110 Thr Gly Glu Gly Ser Arg Lys Arg Gly Arg Pro Lys Lys Asp Asp Val 115 120 125 Ala Ala Ala Thr Val Pro Ala Glu Thr Val Val Ala Pro Ala Lys Arg 130 135 140 Arg Gly Arg Lys Pro Thr Val Glu Val Ala Ala Gln Pro Val Arg Arg145 150 155 160Thr Arg Lys Val Phe Gly Phe Ser Met His Glu Gln Lys Ser Thr Ser 165 170 175 Val Ala Pro Val Ala Ala Asn Val Gly Asp Leu Lys Lys Arg Thr Ala 180 185 190 Leu Leu Gln Lys Lys Val Lys Glu Ala Ala Ala Lys Leu Lys Gln Ala 195 200 205 Val Thr Ala Ile Asp Glu Val Gln Lys Leu Ala Asp Gly Ile Leu Thr 210 215 220 Ser Asp Asp Val Asp Phe Ser Val Leu Phe Ser Asn Leu Lys Thr Leu225 230 235 240Ala Ala Phe Asp Phe Asp Phe Arg Leu Gly Phe Leu Ala Asp Pro Pro 245 250 255 Ser Ser Ala Ile Glu Lys Lys Met Asn Met Glu Val Asp Thr Val Thr 260 265 270 Arg Lys Pro Arg Ile Leu Leu Ala Ala Ser Gly Ser Val Ala Ser Ile 275 280 285 Lys Phe Ser Asn Leu Cys His Cys Phe Ser Glu Trp Ala Glu Val Lys 290 295 300 Ala Val Ala Ser Lys Ser Ser Leu Asn Phe Val Asp Lys Pro Ser Leu305 310 315 320Pro Gln Asn Val Thr Leu Tyr Thr Asp Glu Asp Glu Trp Ser Ser Trp 325 330 335 Asn Lys Ile Gly Asp Pro Val Leu His Ile Glu Leu Arg Arg Trp Ala 340 345 350 Asp Val Met Ile Ile Ala Pro Leu Ser Ala Asn Thr Leu Ala Lys Ile 355 360 365 Ala Gly Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Val Arg Ala Trp 370 375 380 Asp Tyr Ser Lys Pro Leu Phe Val Ala Pro Ala Met Asn Thr Leu Met385 390 395 400Trp Asn Asn Pro Phe Thr Glu Arg His Leu Val Leu Leu Asp Glu Leu 405 410 415 Gly Ile Thr Leu Ile Pro Pro Ile Lys Lys Lys Leu Ala Cys Gly Asp 420 425 430 Tyr Gly Asn Gly Ala Met Ala Glu Pro Ser Leu Ile Tyr Ser Thr Val 435 440 445 Arg Leu Phe Trp Glu Ser Gln Ala Arg Lys Gln Arg Asp Gly Thr Ser 450 455 460
<210> 41<211> 1182<212> DNA<213> Pinus sp.<400> 41
atattgaaac tcatttttaa acacttattc tgcactataa gaagcagcag gcccccagaa 60
atatgagctt catacacaca acgggggagt aatcagcacc atcaaagggg ggatttgcgg 120caattgtgag atcaagtgga ggaagctgga atagatctaa atctaggccc ttgaggagaa 180tgctctccta atggtggttt taaaaatcaa tactctagtg caaaacatgg atgcaacaaa 240ttctcaacct gatgaacctg gaagggatgc taattcatct cagaaaccac gaatcattct 300agcagccagc gggagtgtgg cagcaataaa atttggaatt cttgcccatt gtctatgtca 360atgggcagaa gtcaaagcag tggtcacaaa atctgctttg catttcattg acaagatgtc 420tcttccggct aatgttaagc tctacactga tgaaaatgaaaggtgatact gtactgcata tagaactccg gcaatgggctactctcagca aacacgcttg ctaagatagc aggtggcctacatagtacgt gcatgggact ttaacaagcc tctctttgtacatgtggaac aatccattta ctcaacggca tttggactcaacttatcccc ccaataacaa agaagttagc ttgtggtgattgaaccttct acgatagata caactcttag gttttcactttgtctgatgt cccgttcaac aattcttgtt atgaatctaaatggtataga cccagatagt gtttcttggt agctgggttatgtgtggtga agttaagttc tgatgataaa caatcatgaattgctcattt attctggaca cttacaagaa ctgtgtggatgtgtcaaact actatgcaaa tcatctaatt tggaacttgactttattttc ttccctgtga taattattaa tctctatgat<210> 42<211> 215<212> PRT<213> Pinus sp.<400> 42
Met Val Val Leu Lys Ile Asn Thr Leu Val Gln1 5 10
Asn Ser Gln Pro Asp Glu Pro Gly Arg Asp Ala
20 25
Pro Arg Ile Ile Leu Ala Ala Ser Gly Ser Val
35 40
Gly Ile Leu Ala His Cys Leu Cys Gln Trp Ala
50 55
Val Thr Lys Ser Ala Leu His Phe Ile Asp Lys65 70 75
Asn Val Lys Leu Tyr Thr Asp Glu Asn Glu Trp
tggtctagctgatgctatggtgcgacaatcgctcctgcaaatctcagagctatggaaatggatccttcaacatgcttagtgacagcatgacttgtgatttactcctgctttgatgtaaga
tg
ggagcaaaattgattgctcctacttacttgtgaatacttttcggactatcgtgcaatggcttgtatgaagacaatggactactcagcttgtatgtaacatataagagaatggagtatgca
85
90
Ile Gly Asp Thr Val Leu His Ile Glu Leu Arg
100 105
Met Val Ile Ala Pro Leu Ser Ala Asn Thr Leu
115 120
Gly Leu Cys Asp Asn Leu Leu Thr Cys Ile Val
130 135
Asn Lys Pro Leu Phe Val Ala Pro Ala Met Asn145 150 155
Asn Pro Phe Thr Gln Arg His Leu Asp Ser Ile
165 170
Ser Leu Ile Pro Pro Ile Thr Lys Lys Leu Ala
180 185
Asn Gly Ala Met Ala Glu Pro Ser Thr Ile Asp
195 200
Ser Leu Asp Pro Ser Ile Val210 215
<210> 43<211> 804<212> DNA<213> Oryza sativa<400> 43
atggggcggg ggaaggtgca gctgaagcgg atagagaacattctccaaga ggaggaatgg attgctgaag aaggcgcacggccgaggtcg ccgccatcgt cttctccccc aagggcaagctccaggatgg acaaaatcct tgaacgttat gagcgctattatttcagctg aatccgagag tgagggaaat tggtgccatgaagattgaga ccatacaaaa atgtcacaaa cacctcatggaatctcaaag aactccaaca gctagagcag cagctggagatcaagaaaga gccaccttat gcttgagtcc atttccgagcctgcaggagg agaacaaggc tctgcagaag gaactggtggggccagcagc aagtagggca gtgggaccaa acccaggtccccccaagccc agacaagctc ctcctcctcc tccatgctgaccaccacaaa atatctgcta cccgccggtg atgatgggcg
Asn Met
Asn Ser
Ala Ala
45Glu Val60
Met Ser
Ser Ser
Gln Trp
Ala Lys125Arg Ala140
Thr Phe
Ser Glu
Cys Gly
Thr Thr205
Asp
Ser
30
Ile
Lys
Leu
Trp
Ala110Ile
Trp
Met
Leu
Asp190Leu
Ala Thr15
Gln Lys
Lys Phe
Ala Val
Pro Ala80Ser Lys95
Asp Ala
Ala Gly
Asp Phe
Trp Asn160Gly Leu175
Tyr GlyArg Phe
agatcaacagagatctccgttctacgagtacatatgctgaaatacaggaagagaggatctgttcattgaatgcagaaaaaagaggcagaaaggcccaggcgggatcagcaagagaaatga
gcaggtgacgcctctgcgaccgccactgacaaaggctcttacttaaggcaagaatccctggcacataataggagaggtcagaatgtgaggccaagcccaaggcacttctttgcggcggcg
4805406006607207808409009601020108011401182
60120180240300360420480540600660720gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg 780atgctgagcc acctcaatgc ttaa 804
<210> 44<211> 267
<212> PRT <213> Oryza sativa <400> 44 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Ala Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Ile Ser Arg Lys Ser 130 135 140 His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln Trp Asp Gln Thr Gln 180 185 190 Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala Gln Thr Ser Ser Ser 195 200 205 Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu Leu Pro Pro Gln Asn 210 215 220 Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg Asn Asp Ala Ala Ala225 230 235 240Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln Leu Arg Ile Gly Gly 245 250 255 Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala 260 265 <210> 45 <211> 52
<212> DNA
<213> Seqüência artificial<220>
<223> iniciador<400> 45
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg gcgggggaag gt 52
<210> 46<211> 47<212> DNA
<213> Seqüência artificial<220>
<223> iniciador<400> 46
ggggaccact ttgtacaaga aagctgggtt tggccgacga cgacgac 47
<210> 47
<211> 2193
<212> DNA
<213> Oryza sativa
<400> 47
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgccatccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctacatttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatatatctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactcaaaaaatctt tctagctgaa ctcaatgggt aaagagagag attttttttaatgaagatat tctgaacgta ttggcaaaga tttaaacata taattatatattgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatccttagtaatta aagacaattg acttattttt attatttatc ttttttcgatgtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctccttcaactagca acacatctct aatatcactc gcctatttaa tacatttaggtgaattcaag cactccacca tcaccagacc acttttaata atatctaaaaaattttacag aatagcatga aaagtatgaa acgaactatt taggtttttcaaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcacacagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacggatccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggagaaccaagcat cctcctcctc ccatctataa attcctcccc ccttttccccggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagccgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctccacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattgtgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgattgatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttgaggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtacgattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgatttaataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcgactatcctttg tttattccct attgaacaaa aataatccaa ctttgaagacatgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggcacagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaacctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatctctttctggtt cagttcaatg aattgattgc tacaaataat gcttttataggctgtagttc agttaatagg taatacccct atagtttagt caggagaagatttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagtattatttttt ttattagctc tcaccccttc attattctga gctgaaagtctgtcctcaat tttgttttca aattcacatc gattatctat gcattatcctcctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaagagctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttttggtgtagct tgccactttc accagcaaag ttc<210> 48<211> 42<212> PRT
<213> Seqüência artificial<220>
<223> Seqüência artificial<220>
<221> VARIANTE<222> (2)..(2)<223> /substituir = "Vai"<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "Asn"
<220>
<221> VARIANTE
<222> (ΙΟ)-.(ΙΟ)
<223> /substituir = "He"
<220>
<221> VARIANTE<222> (12)..(12)<223> /substituir = "Tyr"<220>
<221> VARIANTE<222> (16)..(16)
<223> /substituir = "lie" /substituir = "Leu"<220>
aagaaaaact 120ctagtttcgt 180cgttcacatc 240ttcttgaata 300aaaaaataga 360attttatagt 420caatttttat 480tagatgcaag 540caatacacgt 600tagcaatatc 660tacaaaaaat 720acatacaaaa 780acaggcaaca 840ggacagcaag 900aggcaaagaa 960tctctatata 1020agaagccgag 1080ttccctcctc 1140ttctaggttg 1200cctgttcttg 1260ttagtagtat 1320ggaatcttgc 1380tgcttggtgt 1440tttgacgaag 1500ggtcccgttg 1560ttgtttagat 1620caggggattc 1680taaaaagtca 1740cgttatccta 1800acttatccga 1860attcatttgg 1920tggcatgaac 1980cttgtatcta 2040aaatttatga 2100gtgcagttct 2160 2193<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><4 00>
VARIANTE
(17)..(17)/substituir
VARIANTE
(18)..(18)
/substituir
VARIANTE
(19)··(19)/substituir
VARIANTE
(20)..(20)/substituir
VARIANTE(23)..(23)/substituir
VARIANTE
(30)..(30)/substituir
VARIANTE
(31)..(31)/substituir
VARIANTE
(32)..(32)/substituir
VARIANTE
(33)..(33)/substituir
VARIANTE(35)..(35)/substituir
VARIANTE
(37)..(37)
/substituir
VARIANTE
(38) . . (38)
/substituir
VARIANTE(41)..(41)/substituir48
= "Gly"
"Ala" /substituir = "Vai"
= "Vai"
= "Vai"
= "Pro" /substituir = "Ala" /substituir = "Asn"
= "Phe"
"Ser"
"Ser"
= "Asn" /substituir = "Glu"
= "Cys" /substituir = "Arg" /substituir = "Ser"
= "Glu"
"lie" /substituir = "Arg" /substituir = "Lys"
= "Glu"
Leu1
Ala
Leu Lys Lys
Leu Ile Ile20
Asp Ser Lys Met35
<210> 49<211> 19<212> PRT<213> Seqüência<220>
Ala His Glu Ile Ser Val Leu Cys Asp Ala Glu Val5 10 15
Phe Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
25 30
Asp Asn Ile Leu Glu Arg40
artificial<223> Seqüência artificial<220>
<221> VARIANTE
<222> (4)..(4)
<223> /substituir = "Ser"
<220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir = "Arg"
<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "lie"
<220>
<221> VARIANTE<222> (8)..(8)
<223> /substituir = "Thr" /substituir = "Ser"<220>
<221> VARIANTE
<222> (9)..(9)
<223> /substituir = "lie"
<220>
<221> VARIANTE<222> (10)..(10)<223> /substituir = "Asn"<220>
<221> VARIANTE<222> (11)..(11)
<223> /substituir = "Arg" /substituir = "Asn"<220>
<221> VARIANTE<222> (12)..(12)
<223> /substituir = "Cys" /substituir = "Arg"<220>
<221> VARIANTE
<222> (13)..(13)
<223> /substituir = "His"
<220>
<221> VARIANTE<222> (14) . . (14)<223> /substituir = "Lys"<400> 49
Lys -Leu Lys Ala Lys Val Glu Ala Leu Gln Lys Ser Gln Arg His Leu15 10 15
Met Gly Glu
<210> 50<211> 11<212> PRT
<213> Seqüência artificial<220>
<223> Seqüência artificial<220>
<221> VARIANTE<222> (2)..(2)
<223> /substituir = "Gln" /substituir = "Vai" /substituir = "Ala"<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "Phe"
<220>
<221> VARIANTE<222> (7)..(7)<223> /substituir = "Phe"<220>
<221> VARIANTE
<222> (8)..(8)
<223> /substituir = "Phe"
<220>
<221> VARIANTE
<222> (9)..(9)
<223> /substituir = "Phe"
<220>
<221> VARIANTE<222> (10)..(10)
<223> /substituir = "Cys" /substituir = "Phe"<220>
<221> VARIANTE<222> (11)..(11)<223> /substituir = "Met"<400> 50
Gln Pro Gln Thr Ser Ser Ser Ser Ser Ser Phe15 10
<210> 51<211> 7<212> PRT
<213> Seqüência artificial<220>
<223> Seqüência artificial<220>
<221> VARIANTE<222> (1) . . (1)
<223> /substituir = "Ala" /substituir = "Vai" /substituir = "Leu"<220>
<221> VARIANTE
<222> (2)..(2)
<223> /substituir = "Pro"
<220>
<221> INSEGURO<222> (3)..(3)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural, preferably
Leu, Pro ou His
<220>
<221> INSEGURO<222> (3)..(3)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural, preferably
Leu, Pro ou His
<220>
<221> INSEGURO<222> (6)..(6)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural, preferably
Leu, Pro ou His
<220>
<221> VARIANTE<222> (7) .. (7)<223> /substituir = "His"<400> 51
Gly Leu Xaa Trp Met Xaa Ser
1 5
<210> 52
<211> 735
<212> DNA
<213> Hordeum vulgare<400> 52
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg ccaggtcacc 60
ttctccaagc gccgctcggg gctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gccgaggtcg gcctcatcat cttctccacc aagggaaagc tctacgagtt ctccaccgag 180tcatgtatgg acaaaattct tgaacggtat gagcgctact cttatgcaga aaaggttctc 240gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga caatacagaa atgtcaaaag catctcatgg gagaggatct tgaatctttg 360aatctcaagg agttgcagca actggagcag cagctggaaa gctcactgaa acatatcaga 420gccaggaaga accaacttat gcacgaatcc atttctgagc ttcagaagaa ggagaggtca 480ctgcaggagg agaataaagt tctccagaag gaacttgtgg agaagcagaa ggcccaggcg 540gcgcagcaag atcaaactca gcctcaaacc agctcttctt cttcttcctt catgatgagg 600gatgctcccc ctgtcgcaga taccagcaat cacccagcgg cggcaggcga gagggcagag 660gatgtggcag tgcagcctca ggtcccactc cggacggcgc ttccactgtg gatggtgagc 720cacatcaacg gctga 735
<210> 53<211> 244<212> PRT
<213> Hordeum vulgare<400> 53
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala
20 25 30
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80
Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ala Arg Lys Asn
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln
165 170 175
Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser
180 185 190
Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Val Ala Asp Thr
195 200 205
Ser Asn His Pro Ala Ala Ala Gly Glu Arg Ala Glu Asp Val Ala Val
210 215 220
Gln Pro Gln Val Pro Leu Arg Thr Ala Leu Pro Leu Trp Met Val Ser225 230 235 240
His Ile Asn Gly
<210> 54<211> 1196<212> DNA
<213> Hordeum vulgare<400> 54
ctctcccctc ccacttcacc caaccacctg acagccatgg ctccgccacc tcgcctccgc 60
ccgcgcctct gagagtagcc gtcgcggtcg ctcgctcgct cgctcgctgc tgccggtgtt 120
ggcccggtcc tcgagcggag atggggcgca ggaaggtgca gctgaagcgg atcgagaaca 180
agatcaaccg ccaggtcacc ttctccaagc gccgctcggg gctgctcaag aaggcgcacg 240
agatctccgt gctctacgac gccgaggtcg gcctcatcat cttctccacc aagggaaagc 300
tctacgagtt ctccaccgag tcatgtatgg acaaaattct tgaacggtat gagcgctact 360
cttatgcaga aaaggttctc gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg 420
aatataggaa actgaaggcg aaggttgaga caatacagaa atgtcaaaag catctcatgg 480
gagaggatct tgaatctttg aatctcaagg agttgcagca actggagcag cagctggaaa 540
gctcactgaa acatatcaga gccaggaaga accaacttat gcacgaatcc atttctgagc 600ttcagaagaa ggagaggtca ctgcaggagg agaataaagt tctccagaagagaagcagaa ggcccaggcg gcgcagcaag atcaaactca gcctcaaacccttcttcctt catgatgagg gatgctcccc ctgtcgcaga taccagcaatcggcaggcga gagggcagag gatgtggcag tgcagcctca ggtcccactcttccactgtg gatggtgagc cacatcaacg gctgaagggc ttccagcccactattcagta cgagtaacaa gttgcagcgg ccagcctggt gtatcatgcgtgctaacccc atggagggga gaggaaaaga aatcagagta aagcagcaaggtgtatattt cacttcgtcc acctcagttt cctttccacc tgggctgagaagtaatctac catgtaattt atatgtagca tgagtgacga attttcaacttccgttgctc ctgggtgttg tttctgtgaa ttaacctatc gaatatgagc<210> 55<211> 244<212> PRT
<213> Hordeum vulgare<400> 55
Met Gly Arg Arg Lys Val Gln Leu Lys Arg Ile Glu Asn1 5 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu
20 25
His Glu Ile Ser Val Leu Tyr Asp Ala Glu Val Gly Leu
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75
Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His
85 90
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ala
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val
165 170
Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln
180 185
Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Val195 200 205
Ser Asn His Pro Ala Ala Ala Gly Glu Arg Ala Glu Asp
210 215 220
Gln Pro Gln Val Pro Leu Arg Thr Ala Leu Pro Leu Trp225 230 235
His Ile Asn Gly
gaacttgtggagctcttcttcacccagcggcggacggcgctgtaagcgtagttgcgaacactgcaggaattggctgtacgttcgatgatagttgtg
Lys Ile Asn15
Lys Lys Ala30
Ile Ile Phe
Cys Met Asp
Lys Val Leu80
Glu Tyr Arg95
Lys His Leu110
Gln Gln Leu
Arg Lys Asn
Glu Arg Ser160
Glu Lys Gln175
Thr Ser Ser190
Ala Asp Thr
Val Ala Val
Met Val Ser240
6607207808409009601020108011401196
<210> 56<211> 1161<212> DNA<213> Trit<400> 56ggcacgagctcggcacgagcaccggcaggtccgtgctctgagttctccaccagaaaaggtggaaactgaaatcttgaatctgaaacatatagaaggagagagaaggccca
icum aestivum
ctctctctctggagatgggggaccttctcccgacgccgagcgagtcatgttctcgtttcaggcgaaggtttttgaatctccagatccagggtcactgcagggcggcgcaa
ctctctctctcgcgggaaggaagcgccgctgtcggcctcaatggacaaaaagtgaatctggagacaatacaaggagttgcaagaaccaacgaggagaatacaagatcaga
ctctctctcttgcagctgaacggggctgcttcatcttctcttcttgaacgaaattcagggagaaatgtcaagcaactggattatgcacgaaagttctccactcagcctca
ctctctcctcgcggatcgagcaagaaggcgcaccaagggagtatgagcgcaaactggtgtaaagcatctggcagcagctgatccatttctgaaggaactcaacaagctct
gtgccgaattaacaagatcacacgagatctaagctctacgtactcttatgcacgaatataatgggagagggaaagctcacgagcttcagagtcgagaagctcttcttctt
60120180240300360420480540600660ccttcatgat gagggatgct ccccctgccg cagctaccag cattcatcca gcggcggcag 720gcgagagggc aggggatgcg gcagtgcagc cgcaggcccc accccggacg gggcttccac 780tgtggatggt gagccacatc aacggctgaa gggcttccag cccatataag cgtactattc 840agtagagagt aacaagttgc accggccagt ctggtgtatg ttgcggttgc tagcacgcct 900gaccccttgg aggggaaagg aaaagaaatc agagtaaagt agcaagctgc agcgatgtgt 960atatttcact ttgtccaccc cagtttccct cccagctggg ctcaatttac catgtaatct 1020atatgtagct tgagtgatga attttcaagt ttccatgata cccgtctcta gtgggatgtt 1080gtttatgtga attaacctat caaatatgag cattgtgtat attgtgattc ttgaaaataa 1140ataaatcagg atctttgtct t 1161
<210> 57<211> 244<212> PRT
<213> Triticum aestivum<400> 57
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn15 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala
20 25 30
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80
Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Asn
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln
165 170 175
Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser
180 185 190
Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala Ala Ala Thr
195 200 205
Ser Ile His Pro Ala Ala Ala Gly Glu Arg Ala Gly Asp Ala Ala Val
210 215 220
Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp Met Val Ser225 230 235 240
His Ile Asn Gly
<210> 58<211> 1210<212> DNA
<213> Triticum aestivum<400> 58
tccctctcct ccctctcttc cgcctcaccc aaccacctga cagccatggc tccgcccccc 60
cgcccccgcc tgcgcctgtc ggagtagccg tcgcggtctg ccggtgttgg aggcttgggg 120
tgtagggttg gccccgttct ccagcggaga tggggcgcgg gaaggtgcag ctgaagcgga 180
tcgagaacaa gatcaaccgg caggtgacct tctccaagcg ccgctcgggg ctgctcaaga 240
aggcgcacga gatctccgtg ctctgcgacg ccgaggtcgg cctcatcatc ttctccacca 300
agggaaagct ctacgagttc tccaccgagt catgtatgga caaaattctt gaacggtatg 360
agcgctactc ttatgcagaa aaggttctcg tttcaagtga atctgaaatt cagggaaact 420
ggtgtcacga atataggaaa ctgaaggcga aggttgagac aatacagaaa tgtcaaaagc 480
atctgatggg agaggatctt gaatctttga atctcaagga gttgcagcaa ctggagcagc 540
agctggaaag ctcactgaaa catatcagat ccaggaagaa ccaacttatg cacgaatcca 600
tttctgagct tcagaagaag gagaggtcac tgcaggagga gaataaagtt ctccagaagg 660
aactcgtcga gaagcagaag gcccaggcgg cgcaacaaga tcagactcag cctcaaacaa 720gctcttcttc ttcttccttc atgatgaggg atgctccccc tgccgcaact accagcattc 780
atccagcggc atcaggagag agggcagagg atgcggcagt gcagccgcag gccccacccc 840
ggacggggct tccactgtgg atggttagcc acatcaacgg ctgaagggct tccagcccat 900
ataagcgtac tattcagtag agagtaacaa gttgcaccgg ccagcctggt gtatgttgcg 960
gttgctagca tgcctgaccc cttggagggg aaaggaaaag aaatcagagt aaagtagcaa 1020
gctgcagtga tgtgtatatt tcactttgtc cacctcagtt tccctcccag ctgggctcaa 1080
tttaccatgt aatctatatg tagcttgagt gatgaatttt caagtttcca tgatacccgt 1140
ctcgagcggg tgttgtttat gtgaattaac ctatcaaata tgagcattgt gtaaaaaaaa 1200
aaaaaaaaaa 1210<210> 59<211> 244
<212> PRT <213> Triticum ,aestivum <400> 59 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu . Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Asn 130 135 140 Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser 180 185 190 Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala Ala Thr Thr 195 200 205 Ser Ile His Pro Ala Ala Ser Gly Glu Arg Ala Glu Asp Ala Ala Val 210 215 220 Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp Met Val Ser225 230 235 240His Ile Asn Gly
<210> 60<211> 735<212> DNA
<213> Triticum monococcum<400> 60
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgacc 60
ttctccaagc gccgctcggg gcttctcaag aaggcgcacg agatctccgt gctctgcgac 120
gccgaggtcg gcctcatcat cttctccacc aagggaaagc tctacgagtt ctccaccgag 180
tcatgtatgg acaaaattct tgaacggtat gagcgctatt cttatgcaga aaaggttctc 240
gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg aatataggaa actgaaggcg 300
aaggttgaga caatacagaa atgtcaaaaa catctcatgg gagaggatct tgaatctttg 360
aatctcaagg agttgcagca actggagcag cagctggaaa gctcactgaa acatatcaga 420
tccaggaaga accaacttat gcacgaatcc atttctgagc tgcagaagaa ggagaggtca 480
ctgcaggagg agaataaagt tctccagaag gaactcgtgg agaagcagaa ggcccatgcg 540
gcgcagcaag atcaaactca gcctcaaacc agctcttctt cttcttcctt catgctgagg 600
gatgctcccc ctgccgcaaa taccagcatt catccagcgg cggcaggcga gagggcagag 660
gatgcggcag tgcagccgca ggccccaccc cggacggggc ttccaccgtg gatggtgagc 720cacatcaacg ggtga<210> 61<211> 244<212> PRT
<213> Triticum monococcum<400> 61
Met Gly Arg Gly Lys Val Gln Leu1 5
Arg Gln Val Thr Phe Ser Lys Arg20
His Glu Ile Ser Val Leu Cys Asp
35 40
Ser Thr Lys Gly Lys Leu Tyr Glu
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg65 70
Val Ser Ser Glu Ser Glu Ile Gln85
Lys Leu Lys Ala Lys Val Glu Thr100
Met Gly Glu Asp Leu Glu Ser Leu115 120
Glu Gln Gln Leu Glu Ser Ser Leu
130 135
Gln Leu Met His Glu Ser Ile Ser145 150
Leu Gln Glu Glu Asn Lys Val Leu165
Lys Ala His Ala Ala Gln Gln Asp180
Ser Ser Ser Ser Phe Met Leu Arg195 200
Ser Ile His Pro Ala Ala Ala Gly
210 215
Gln Pro Gln Ala Pro Pro Arg Thr225 230
His Ile Asn Gly
735
Lys Arg Ile Glu Asn Lys Ile Asn 10 15 Arg Ser Gly Leu Leu Lys Lys Ala25 30 Ala Glu Val Gly Leu Δ R Ile Ile PhePhe Ser Thr Glu 4 D Ser Cys Met Asp 60 Tyr Ser Tyr Ala Glu Lys Val Leu 75 80Gly Asn Trp Cys His Glu Tyr Arg 90 95 Ile Gln Lys Cys Gln Lys His Leu105 110 Asn Leu Lys Glu Leu Gln Gln Leu 125 Lys His Ile Arg Ser Arg Lys Asn 140 Glu Leu Gln Lys Lys Glu Arg Ser 155 160Gln Lys Glu Leu Val Glu Lys Gln 170 175 Gln Thr Gln Pro Gln Thr Ser Ser185 190 Asp Ala Pro Pro Ala Ala Asn Thr 205 Glu Arg Ala Glu Asp Ala Ala Val 220 Gly Leu Pro Pro Trp Met Val Ser 235 240
<210> 62<211> 735<212> DNA<213> Triti<400> 62atggggcgggttctccaagcgccgaggtcgtcatgtatgggtttcaagtgaaggttgagaaatctcaaggtccaggaagactgcaggagggcgcagcaaggatgctccccgatgcggcagcacatcaacg<210> 63<211> 244<212> PRT<213> Triti<400> 63Met Gly Arg1
cum aestivum
ggaaggtgcagccgctcggggcctcatcatacaaaattctaatctgaaatcaatacagaaagttgcagcaaccaacttatagaataaagtatcaaactcactgccgcaaatgcagccgcaggtga
gctgaagcgggcttctcaagcttctccacctgaacggtattcagggaaacatgtcaaaagactggagcaggcacgaatcctctccagaaggcctcaaacctaccagcattggccccaccc
atcgagaacaaaggcgcacgaagggaaagcgagcgctatttggtgtcacgcatctcatggcagctggaaaatttctgagcgaactcgtggagctcttcatcatccagcggcggacggggc
agatcaaccgagatctccgttctacgagttcttatgcagaaatataggaagagaggatctgctcactgaattcagaagaaagaagcagaacttcttccttcaacaggcgattccaccgtg
gcaggtgaccgctctgcgacctccaccgagaaaggttctcactgaaggcgtgaatctttgacatatcagaggagaggtcaggcccatgcgcatgctgagggagggcagaggatggtgagc
cum aestivum
Gly Lys Val Gln Leu Lys Arg Ile5 10
60120180240300360420480540600660720735
Glu Asn Lys Ile Asn15His Ile Asn Gly<210> 64<211> 738<212> DNA
<213> Lolium perenne<400> 64
atggggcgcg gcaaggtgca gctcaagcgg atcgagaacattctccaagc gccgctcggg gctgctcaag aaggcgcacggccgaggtcg ggctcatcat cttctccacc aagggaaagctcatgtatgg acaaaattct tgagcggtat gagcgctactatttcaaccg aatctgaaat tcagggaaac tggtgtcatgaaggttgaga caatacagag atgtcaaaag catctaatggaatctcaagg agttgcagca actagagcag cagctggaaagccagaaaga accagcttat gcacgaatcc atatctgagcctgcaggagg agaataaaat tctccagaag gaactcatagcagcaagcgc agtgggagca aactcagccc caaaccagctatgggggaag ctaccccagc aacaaattgc agtaatccccgcagaggatg cgacggggca gccttcagct cgcacggtgccacatcaaca atggctga<210> 65<211> 245<212> PRT
<213> Lolium perenne<400> 65
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly
Ser Gly Leu Leu Lys Lys Ala 30 Glu Val Gly Leu δ ^ Ile Ile PheSer Thr Glu *± 3 Ser Cys Met Asp 60 Ser Tyr Ala Glu Lys Val Leu 75 80Asn Trp Cys His Glu Tyr Arg90 95 Gln Lys Cys Gln Lys His Leu 110 Leu Lys Glu Leu Gln Gln Leu 125 His Ile Arg Ser Arg Lys Asn 140 Leu Gln Lys Lys Glu Arg Ser 155 160Lys Glu Leu Val Glu Lys Gln170 175 Thr Gln Pro Gln Thr Ser Ser 190 Ala Pro Pro Ala Ala Asn Thr 205 Arg Ala Glu Asp Ala Ala Val 220 Leu Pro Pro Trp Met Val Ser 235 240
agatcaaccgagatctccgttctacgagttcctatgcagaaatataggaagagaggatctgttcactgaattcaaaagaaagaagcagaacttcctcctccagcagcggcttccaccatg
ccaggtcaccgctctgcgaccgcaaccgacgaaagtgctcactgaaggcgtgaatcattgacatattagaggagaggtcaggcccacacgctcctttatgcagcgacagagatggtgagt
20
25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35
40
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr
50
55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr
65
70
75
Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp
Glu Asn Lys Ile Asn15
Leu Leu Lys Lys Ala30
Gly Leu Ile Ile Phe45
Asp Ser Cys Met Asp60
Ala Glu Lys Val Leu80
Cys His Glu Tyr Arg
6012018024030036042048054060066072073885 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ala Arg Lys Asn
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln
165 170 175
Lys Ala His Thr Gln Gln Ala Gln Trp Glu Gln Thr Gln Pro Gln Thr
180 185 190
Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr
195 200 205
Asn Cys Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala
210 215 220
Thr Gly Gln Pro Ser Ala Arg Thr Val Leu Pro Pro Trp Met Val Ser225 230 235 240
His Ile Asn Asn Gly245
<210> 66<211> 738<212> DNA
<213> Lolium temulentum<400> 66
atggggcgcg gcaaggtgca gctcaagcgg atcgagaaca agatcaaccg ccaggtcacc 60
ttctccaagc gccgctcagg cctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gcagaggtcg ggctcatcat cttctccacc aagggaaagc tctacgagtt cgccaccgac 180tcatgtatgg acaaaattct tgagcggtat gagcgctact cctatgcaga gaaagtgctc 240atttcaactg aatctgaaat tcagggaaac tggtgtcatg aatataggaa actgaaggcg 300aaggttgaga caatacagag atgtcaaaag catctaatgg gagaggatct tgaatcattg 360aatctcaagg agttgcagca actagagcag cagctggaaa gttcactgaa acatattaga 420tccagaaaga gccagcttat gcacgaatcc atatctgagc ttcaaaagaa ggagaggtca 480ctgcaagagg agaataaaat tctccagaag gaactcatag agaagcagaa ggcccacacg 540cagcaagcgc agttggagca aactcagccc caaaccagct cttcctcctc ctcctttatg 600atgggggaag ctaccccagc aacaaatcgc agtaatcccc cagcagcggc cagcgacaga 660gcagaggatg cgacggggca gcctccagct cgcacggtgc ttccaccatg gatggtgagt 720cacctcaaca atggctga 738
<210> 67<211> 245<212> PRT
<213> Lolium temulentum<400> 67
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala
20 25 30
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr Asp Ser Cys Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80
Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln
165 170 175
Lys Ala His Thr Gln Gln Ala Gln Leu Glu Gln Thr Gln Pro Gln Thr
180 185 190
Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr
195 · 200 205
Asn Arg Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala
210 215 220
Thr Gly Gln Pro Pro Ala Arg Thr Val Leu Pro Pro Trp Met Val Ser225 230 235 240
His Leu Asn Asn Gly245
<210> 68<211> 738<212> DNA<213> Zea mays<400> 68
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg ccaggtgacc 60
ttctccaagc gccgctcggg gctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gccgaggtcg cgctcatcat cttctccacc aaagggaagc tctacgagta ttccaccgat 180tcatgtatgg acaaaattct tgaccggtac gagcgctact cctatgcaga aaaggttctt 240atttcagcag aatctgaaac tcagggcaat tggtgccacg agtatagaaa actaaaggcg 300aaggtcgaga caatacaaaa atgtcaaaag cacctcatgg gagaggatct tgaaacgttg 360aatctcaaag agcttcagca actagagcag cagctggaga gttcactgaa acatatcaga 420accaggaaga accaacttat gctcgagtca atttcggagc tccaacggaa ggagaagtcg 480ctgcaggagg agaacaaggt tctgcagaag gagctcgcgg agaagcagaa agcccagcgg 540aagcaagtgc aatggggcca aacccaacag cagaccagtt cgtcttcctc gtgcttcgtg 600ataagggaag ctgccccaac aacaaatatc agcatttttc ctgtggcagc aggcgggagg 660ttggtggaag gtgcagcagc gcagccacag gctcgcgttg gactaccacc atggatgctt 720agccacctga gcagctga 738
<210> 69<211> 245<212> PRT<213> Zea mays<400> 69
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ser Thr Asp Ser Cys Met Asp 50 55 60 Lys Ile Leu Asp Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Thr Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Thr Arg Lys Asn 130 135 140 Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Ala Glu Lys Gln 165 170 175 Lys Ala Gln Arg Lys Gln Val Gln Trp Gly Gln Thr Gln Gln Gln Thr 180 185 190 Ser Ser Ser Ser Ser Cys Phe Val Ile Arg Glu Ala Ala Pro Thr Thr 195 200 205 Asn Ile Ser Ile Phe Pro Val Ala Ala Gly Gly Arg Leu Val Glu Gly210 215
Ala Ala Ala Gln Pro Gln Ala Arg Val Gly Leu225 230 235
Ser His Leu Ser Ser245
<210> 70<211> 738<212> DNA<213> Zea mays<400> 70
atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccgctcggg gctactcaag aaggcgcacggccgaggtcg cgctcatcat cttctccacc aagggcaagctcatgtatgg acaaaattct tgaacggtat gagcgctactatttccgcag aatatgaaac tcagggcaat tggtgccatgaaggtcgaga caatacagaa atgtcaaaag cacctcatggaatctcaaag agcttcagca actagagcag cagctggagaacaaggaaga gccagcttat ggtcgagtca atttcagcgcctgcaggagg agaacaaggt tctgcagaag gagctcgcggcagcaagtgc aacgggacca aactcaacag cagaccagttttaagggaag ctgccccaac aacaaatgtc agcatcttccgtggtggaag gggcagcagc gcagccgcag gctcgcgttgagccatctga gctgctga<210> 71<211> 245<212> PRT<213> Zea mays<400> 71
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Thr Lys Gly Lys. Leu Tyr Glu Tyr Ser Thr
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Ile Ser Ala Glu Tyr Glu Thr Gln Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys
100 105
Met Gly Glu Asp Leu Glu Thr Leu Asn Leu Lys
115 120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130 135
Gln Leu Met Val Glu Ser Ile Ser Ala Leu Gln145 150 155
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu
165 170
Lys Asp Gln Arg Gln Gln Val Gln Arg Asp Gln
180 185
Ser Ser Ser Ser Thr Ser Phe Met Leu Arg Glu
195 200
Asn Val Ser Ile Phe Pro Val Ala Ala Gly Gly
210 215
Ala Ala Ala Gln Pro Gln Ala Arg Val Gly Leu225 230 235
Ser His Leu Ser Cys245
<210> 72<211> 762<212> DNA
220
Pro Pro Trp Met Leu240
agatcaaccgagatctccgttctacgagtacctatgcagaaatatagaaagagaggatctgttcactgaatccaacggaaagaagcagaacgtcttccacctgtggcagcgactgccacc
ccaggtgacagctctgcgacctctaccgataaaggttctcactaaaggcgtgaaactttgacatatcagaggagaagtcaagaccagcgggtccttcatgaggcgggaggatggatgctt
Glu Asn
Leu Leu
Ala Leu
45Asp Ser60
Ala Glu
Cys His
Cys Gln
Glu Leu125Arg Thr140
Arg Lys
Leu Ala
Thr Gln
Ala Ala205Arg Val220
Pro Pro
Lys Ile
15Lys Lys30
Ile Ile
Cys Met
Lys Val
Glu Tyr
95Lys His110
Gln Gln
Arg Lys
Glu Lys
Glu Lys175Gln Gln190
Pro ThrVal GluTrp Met
Asn
Ala
Phe
Asp
Leu80Arg
Leu
Leu
Ser
Ser160Gln
Thr
Thr
Gly
Leu240
60120180240300360420480540600660720738<213> Oryza sativa<400> 72
atggggcggg gcaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgaccttctccaagc gcaggtcggg gctgctcaag aaggcgaatg agatctccgt gctctgcgacgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagta cgccaccgactcatgtatgg acaaaatcct tgaacgttat gagcgctact cctatgcaga aaaggtccttatttcagctg aatctgacac tcagggcaac tggtgccacg aatataggaa actgaaggctaaggttgaga caatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttgaatctcaaag agctgcagca gctggagcag cagctggaaa attcgttgaa acatatcagatccagaaaga gccaactaat gctcgagtcc attaacgagc ttcaacggaa ggaaaagtcactgcaggagg agaataaggt cctacagaaa gaaaaccctt gctccttcct acagctggtggagaagcaga aagtccagaa gcaacaagtg caatgggacc agacacaacc tcaaacaagttcctcatcat cctccttcat gatgagggaa gcccttccaa caactaatat cagtaactaccctgcagcag ctggcgaaag gatagaggat gtagcagcag ggcagccaca gcatgttcgcattgggctgc caccatggat gctgagccac atcaacggct aa<210> 73<211> 253<212> PRT
<213> Oryza sativa<400> 73
Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn5 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu
Met1
20
25
Asn Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35
40
Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
50
55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr
65
70
75
Ile Ser Ala Glu Ser Asp Thr Gln Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys
115 120
Glu Gln Gln Leu Glu Asn Ser Leu Lys His Ile
130 135
Gln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln145 150 155
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu
165 170
Leu Gln Leu Val Glu Lys Gln Lys Val Gln Lys
180 185
Asp Gln Thr Gln Pro Gln Thr Ser Ser Ser Ser
195 200
Arg Glu Ala Leu Pro Thr Thr Asn Ile Ser Asn
210 215
Gly Glu Arg Ile Glu Asp Val Ala Ala Gly Gln225 230 235
Ile Gly Leu Pro Pro Trp Met Leu Ser His Ile245 250
<210> 74
<211> 741
<212> DNA
<213> Oryza sativa
<400> 74
atggggcggg gcaaggtgca gctgaagcgg atcgagaacattctccaagc gcaggtcaaa actgctcaag aaggcgaatggccgaggtcg cgctcatcat cttctccacc aagggcaagctcatgtatgg acaaaatcct tgaacgttat gagcgctactatttcagctg aatctgacac tcagggcaac tggtgccacgaaggttgaga caatacagaa atgtcaaaag cacctcatgg
Ala Leu45
Asp Ser60
Ala Glu
Cys His
Cys Gln
Glu Leu125Arg Ser140
Arg Lys
Asn Pro
Gln Gln
Ser Ser205Tyr Pro220
Pro GlnAsn Gly
Lys
Lys
30
Ile
Cys
Lys
Glu
Lys110Gln
Arg
Glu
Cys
Val190Phe
Ala
His
Ile Asn15
Lys Ala
Ile Phe
Met Asp
Val Leu80Tyr Arg95
His Leu
Gln Leu
Lys Ser
Lys Ser160Ser Phe175
Gln Trp
Met Met
Ala Ala
Val Arg240
agatcaaccgagatctccgttctacgagtacctatgcagaaatataggaagagaggatct
gcaggtgaccgctctgcgaccgccaccgacaaaggtccttactgaaggcttgaatctttg
60120180240300360420480540600660720762
60120180240300360aatctcaaag agctgcagca gctggagcag cagctggaaatccagaaaga gccaactaat gctcgagtcc attaacgagcctgcaggagg agaataaggt cctacagaaa gaactggtggcaacaagtgc aatgggacca gacacaacct caaacaagttatgagggaag cccttccaac aactaatatc agtaactaccatagaggatg tagcagcagg gcagccacag catgaacgcactgagccaca tcaacggcta a<210> 75<211> 246<212> PRT
attcgttgaattcaacggaaagaagcagaacctcatcatcctgcagcagcttgggctgcc
acatatcagaggaaaagtcaagtccagaagctccttcatgtggcgaaaggaccatggatg
420480540600660720741
<400> 75 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Lys Leu Leu Lys Lys Ala 20 25 30 Asn Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser Asp Thr Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Asn Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 Gln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Lys Val Gln Lys Gln Gln Val Gln Trp Asp Gln Thr Gln Pro Gln Thr 180 185 190 Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr 195 200 205 Asn Ile Ser Asn Tyr Pro Ala Ala Ala Gly Glu Arg Ile Glu Asp Val 210 215 220 Ala Ala Gly Gln Pro Gln His Glu Arg Ile Gly Leu Pro Pro Trp Met
225
235
230
Leu Ser His Ile Asn Gly245
<210> 76<211> 735<212> DNA
<213> Dendrocalamus latiflorus<400> 76
atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccggtcggg gctgctcaag aaggcgcatggccgaggtcg gccttatcat cttctccacc aagggcaagctcatgtatgg acaaaattct tgaacggtac gagcgttactatttcagccg aatctgaaac tcagggcaac tggtgtcacgaaggttgaga cgatacagaa atgtcaaaag cacctcatggaatctcaagg agctgcagca actcgagcag cagctggaaatccagaaaga gccagcttat gctcgagtcc atttccgagcctgcaggagg agaacaaggt tctgcagaag gaactcgtggcggttagtgc aatgggacca aactcagccg caaactagttatgagggaag ctctcccaac aacaaatatc agtatttacggcagaggacg cagcagggca gcctcagatt cacattgggccacatcaacg gctaa<210> 77
240
agatcaaccgagatctccgttctacgagtacctatgcagaaatataggaagagaggatccgttcagtgaattcaaaagaaagaagcagcacctcttcctcctgcggcagctgccgccatg
gcaagtgactcctctgcgaccgccaccgacaaaggttcttactgaaggcgtgaatctttgacatatcagaggagaagtcaggtccataaagtccttcatgcggcgagagggatggtgagc
60120180240300360420480540600660720735<211> 244<212> PRT
<213> Dendrocalamus<400> 77
Iatiflorus
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Pro Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Val Lys His Ile Arg Ser Arg Lys Ser 130 135 140 Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Gln Val His Lys Arg Leu Val Gln Trp Asp Gln Thr Gln Pro Gln Thr 180 185 190 Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr 195 200 205 Asn Ile Ser Ile Tyr Ala Ala Ala Ala Gly Glu Arg Ala Glu Asp Ala 210 215 220 Ala Gly Gln Pro Gln Ile His Ile Gly Leu Pro Pro Trp Met Val Ser225 230 235 240His Ile Asn Gly
<210> 78<211> 735<212> DNA
<213> Dendrocalamus Iatiflorus<400> 78
atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccggtcggg gctgctcaag aaggcgcatggccgaggtcg gccttatcat cttctccacc aagggcaagctcatgtatgg acaaaattct tgaacggtac gagcgttactatttcagccg aatctgaaac tcagggcaac tggtgtcacgaaggttgaga cgatacagaa atgtcaaaag cacctcatggaatctcaagg agctgcagca actcgagcag cagctggaaatccagaaaga gccagcttat gctcgagtcc atttccgagcctgcaggagg agaacaaggt tctgcagaag gaactcgtggcggttagtgc aatgggacca aactcagccg caaactagttatgagggaag ctctcccaac aacaaatatc agtatttacggcagaggacg cagcagggca gcctcagatt cacattgggccacatcaacg gctaa<210> 79<211> 244<212> PRT
<213> Dendrocalamus Iatiflorus<400> 79
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly20 25
agatcaaccgagatctccgttctacgagtacctatgcagaaatataggaagagaggatctgttcagtgaattcaaaagaaagaagcagca
CCtCttCCtC
ctgcggcagctgccgccatg
gcaagtgactcctctgcgaccgccaccgacaaaggttcttactgaaggcgtgaatctttgacatatcagaggagaagtcaggtccataaagtccttcatgcggcgagagggatggtgagc
Glu Asn Lys Ile Asn15
Leu Leu Lys Lys Ala30
60120180240300360420480540600660720735His Glu Ile Ser35
Ser Thr Lys Gly50
Lys Ile Leu Glu65
Ile Ser Ala Glu
Lys Leu Lys Ala100
Met Gly Glu Asp115
Glu Gln Gln Leu130
Gln Leu Met Leu145
Leu Gln Glu Glu
Gln Val His Lys180
Ser Ser Ser Ser195
Asn Ile Ser Ile210
Ala Gly Gln Pro225
His Ile Asn Gly
80
Val Leu CysLysArg
40
Ser
85
Lys
Leu
Glu
Glu
Asn165Arg
Ser
Tyr
Gln
Leu Tyr
55Tyr Glu70
Glu Thr
Val Glu
Glu Ser
Ser Ser135Ser Ile150
Lys Val
Leu Val
Ser Phe
Ala Ala215Ile His230
120
200
Ala Glu Val Gly Leu 45 Ile Ile PheTyr Ala Thr Asp 60 Ser Cys Met AspTyr Ser Tyr 75 Ala Glu Lys Val Leu 80Gly Asn 90 Trp Cys His Glu Tyr 95 ArgIle Gln Lys Cys Gln Lys His Leu105 110 Asn Leu Lys Glu Leu 125 Gln Gln LeuLys His Ile Arg 140 Ser Arg Lys SerGlu Leu Gln 155 Lys Lys Glu Lys Ser 160Gln Lys 170 Glu Leu Val Glu Lys 175 GlnTrp Asp Gln Thr Gln Pro Gln Thr185 190 Met Arg Glu Ala Leu 205 Pro Thr ThrAla Gly Glu Arg 220 Ala Glu Asp AlaGly Leu Pro 235 Pro Trp Met Val Ser 240
<210><211> 813<212> DNA<213> Zea mays<400> 80
atggggcgcg gcaaggtgca gctgaagcgg atagagaacattctccaagc gccggaacgg gctgctgaag aaggcgcacggccgaggtcg ccgtcatcgt cttctccccc aagggcaagctcccgcatgg acaaaattct agaacgttat gagcgatattatttcagctg aatctgaaag tgagggaaat tggtgccacgaaaattgaga ccatacaaag atgccacaag cacctgatggaatccaaaag agctccaaca actagagcag cagctggagatcaagaaaga gccaccttat ggccgagtca atttctgagcctgcaggagg agaacaagat tctacagaag gaactttcagagccggcagc agcagcagca gcaggtgcag tgggaccagcacaagctcat cgtcttcttc cttcatgatg aggcaggatccaaaacatct gcttcccgcc gttgagcatc ggagagagaggcgcagcagc agctgcctcc tccggggcag gcgcaaccacccgccatgga tgctgagcca cctcaatgca taa<210> 81<211> 270<212> PRT<213> Zea mays<400> 81
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly
agataaaccgagatctccgttctacgagtacctatgctgaaatacaggaagagaggatctgctcactgaatacagaagaaagaggcagaaagacacaggtagcagggactgcgaagaggtagctccgcat
gcaggtgacccctctgcgaccgcctccgacaaaggctcttactgaaggccagagtctttggcacatcagaggagaggtcaggcggtcgctccaggtccaggccacctccaggctgcggcgcgcaggtctg
20
25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35
40
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Ser
50
55
Lys
65
Ile
Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr
70 75
Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp
Glu Asn Lys Ile Asn1 5
Leu Leu Lys Lys Ala30
Ala Val Ile Val Phe45
Asp Ser Arg Met Asp60
Ala Glu Lys Ala Leu80
Cys His Glu Tyr Arg
6012018024030036042048054060066072078081385 90 95
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Arg Cys His Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser
130 135 140
His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ser Glu Arg Gln
165 170 175
Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln Gln Val Gln Trp Asp
180 185 190
Gln Gln Thr Gln Val Gln Val Gln Thr Ser Ser Ser Ser Ser Ser Phe
195 200 205
Met Met Arg Gln Asp Gln Gln Gly Leu Pro Pro Pro Gln Asn Ile Cys
210 215 220
Phe Pro Pro Leu Ser Ile Gly Glu Arg Gly Glu Glu Val Ala Ala Ala225 230 235 240
Ala Gln Gln Gln Leu Pro Pro Pro Gly Gln Ala Gln Pro Gln Leu Arg
245 250 255
Ile Ala Gly Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265 270
<210> 82<211> 689<212> DNA
<213> Sorghum bicolor<400> 82
gcaaggtgca gctcaagcgg atagagaaca agataaaccg gcaggtgacc ttctccaagc 60
gccgcaacgg gctgctcaag aaggcgcacg agatctccgt cctctgcgac gccgaggtcg 120ccgtcatcgt cttctccccc aagggcaagc tctatgagta cgccaccgac tcccgcatgg 180acaaaattct cgaacgttat gagcgatatt cctatgctga aaaggctctt atttcagctg 240aatctgaaag tgagggaaac tggtgccacg aatacaggaa actgaaggcc aaaattgaga 300ccattcaaaa atgccacaag cacctgatgg gagaggatct agagtctttg aatcccaaag 360agctccaaca actagagcag cagctggaga gctcactgaa gcacatcaga tcaagaaaga 420gccaccttat ggctgagtct atttctgaac tacagaagaa ggagaggtca ctgcaggagg 480agaacaaggc tctacagaag gaacttgcgg agaggcagaa ggcggccgcg agcaggcagc 540agcagcaagg tgcagtggga ccagcagaca cagacccagg cccagacaag ctcatcatcg 600tcctccttca tgatgaggca ggatcagcag ggtctgccgc ctccacaaaa catatgcttc 660ccgccgctga taatcggaga gagaggtga 689
<210> 83<211> 228<212> PRT
<213> Sorghum bicolor<400> 83
Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn Arg Gln Val Thr15 10 15
Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala His Glu Ile Ser
20 25 30
Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe Ser Pro Lys Gly
35 40 45
Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp Lys Ile Leu Glu
50 55 60
Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Ile Ser Ala Glu65 70 75 80
Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg Lys Leu Lys Ala
85 90 95
Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu Met Gly Glu Asp
100 105 110
Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu
115 120 125
Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser His Leu Met Ala130 135 140Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg145 150 155
Asn Lys Ala Leu Gln Lys Glu Leu Ala Glu Arg
165 170
Ser Arg Gln Gln Gln Gln Gly Ala Val Gly Pro
180 185
Gly Pro Asp Lys Leu Ile Ile Val Leu Leu His
195 200
Ala Gly Ser Ala Ala Ser Thr Lys His Met Leu
210 215
Arg Arg Glu Arg225
<210> 84<211> 822<212> DNA<213> Zea mays<400> 84
atggggcgcg gcaaggtaca gctgaagcgg atagagaacattctccaagc gccggaacgg cctgctcaag aaggcgcacggccgaggtcg ccgtcatcgt cttctccccc aagggcaagctcccgcatgg acaaaattct tgaacgctat gagcgatattatttcagctg aatctgaaag tgagggaaat tggtgccacgaaaattgaga ccatacaaaa atgccacaag cacctgatggaatcccaaag agctccagca actagagcag cagctggatatcaaggaaga gccaccttat ggccgagtct atttctgagcctgcaggagg agaacaaggc tctgcagaag gaacttgcggagccggcagc agcagcaaca gcagcaggtg cagtgggacccagacaagct catcatcgtc ctccttcatg atgaggcaggccacacaaca tctgcttccc gccgttgaca atgggagatagcggcggcgg cgcagcagca gcagccactg ccggggcagggcaggtctgc caccatggat gctgagccac ctcaatgcat<210> 85<211> 273<212> PRT<213> Zea mays<400> 85
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys
115 120
Glu Gln Gln Leu Asp Ser Ser Leu Lys His Ile
130 135
His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln145 150 155
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu
165 170
Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln
180 185
Asp Gln Gln Thr His Ala Gln Ala Gln Thr Ser
195 200
Phe Met Met Arg Gln Asp Gln Gln Gly Leu Pro
Ser Leu Gln Glu Glu160
Gln Lys Ala Ala Ala175
Ala Asp Thr Asp Pro190
Asp Glu Ala Gly Ser205
Pro Ala Ala Asp Asn220
agataaaccgagatctccgttctacgagtacctatgctgaaatacaggaagagaggatctgctcactgaatacagaagaaagaggcagaaagcagacacaatcagcaggggaggtgaagacgcaaccgcaaa
gcaggtgacccctctgcgatcgccaccgacaaaggctcttactgaaggccagagtctttggcacatcagaggagaggtcaggccgtcgcgtgcccaggccactgccgcctgctggctgcggctccgcatc
Glu Asn
Leu Leu
Ala Val45
Asp Ser60
Ala Glu
Cys His
Cys His
Glu Leu125Arg Ser140
Lys Lys
Leu Ala
Gln Gln
Ser Ser205Pro Pro
Lys Ile
15Lys Lys30
Ile Val
Arg Met
Lys Ala
Glu Tyr
95Lys His110
Gln Gln
Arg Lys
Glu Arg
Glu Arg175Val Gln190
Ser Ser
Asn
Ala
Phe
Asp
Leu80Arg
Leu
Leu
Ser
Ser160Gln
60120180240300360420480540600660720780822
TrpSerHis Asn Ile210 215
Cys Phe Pro Pro Leu Thr Met Gly Asp Arg Gly225 230 235
Ala Ala Ala Ala Gln Gln Gln Gln Pro Leu Pro
245 250
Gln Leu Arg Ile Ala Gly Leu Pro Pro Trp Met260 265
Ala
220
Glu Glu Leu Ala Ala240
Gly Gln Ala Gln Pro255
Leu Ser His Leu Asn270
<210> 86<211> 786<212> DNA
<213> Lolium temulentum<400> 86
atgggtcgcg gcaaggtgca gctgaagcgg atagagaaca agataaaccgttctccaagc gccgcaacgg gctactcaag aaggcgcacg agatctccgtgccgaggtcg ccgtcgtcgt cttctccccg aaagggaagc tctatgagtatccagcatgg acaaaattct tgaacgttat gaacgctact cttatgctgaatttcagctg aatctgaaag tgagggaaat tggtgccatg aatacaggaaaagattgaga ctatacaaaa atgtcacaag cacctcatgg gggaggatctaacctgaaag agctccaaca actagagcag cagctggaga gttcattgaatcgagaaaga gccaccttat gatggagtcc atttctgagc tacagaagaactccaggagg agaacaaggc tctacagaag gaactggtgg agaggcagaacagcagcagc aagagcagtg ggaccgtcag acccaaacac aacaagcccacaggcccaga cgagctcatc atcttcctcc ttcatgatga gggatcagcacaacaaaaca tctgttaccc gctggtgaca atgggtggag aggctgtggcgggcagcagg ggcagcttcg catcggaggc ctgccaccat ggatgctgaggcttga<210> 87<211> 261<212> PRT
<213> Lolium temulentum<400> 87
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val
35 40 45
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75
Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His
85 90
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His
100 105
Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys Glu Leu115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser
130 135 140
His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val
165 170
Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp Asp Arg
180 185
Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln Thr Ser195 200 205
Ser Ser Phe Met Met Arg Asp Gln Gln Ala His Ala Gln
210 215 220
Cys Tyr Pro Leu Val Thr Met Gly Gly Glu Ala Val Ala225 230 235
tcaggtgacacctctgcgaccgccactgacaaaggctttggctgaaggcgggagtgtctagcacatcagaggagcggtcaggcggccaggaaaccaacctggcccatgctcgcggcgccaccacctcaac
Lys Ile Asn15
Lys Lys Ala30
Val Val Phe
Ser Met Asp
Lys Ala Leu80
Glu Tyr Arg95
Lys His Leu110
Gln Gln Leu
Arg Lys Ser
Glu Arg Ser160
Glu Arg Gln175
Gln Thr Gln190
Ser Ser Ser
Gln Asn Ile
Ala Ala Pro240
60120180240300360420480540600660720780786Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu
245 250
Ser His Leu Asn Ala260
<210> 88<211> 786<212> DNA
<213> Lolium perenne<400> 88
atgggtcgcg gcaaggtgca gctgaagcgg atagagaacattctccaagc gccgcaacgg gctactcaag aaggcgcacggccgaggtcg ccgtcgtcgt cttctccccg aaagggaagctccagcatgg acaaaattct tgaacgttat gaacgctactatttcagctg aatctgaaag tgagggaaat tggtgccatgaagattgaga ctatacaaaa atgtcacaag cacctcatggaacctgaaag agctccaaca actagagcag cagctggagatcgagaaaga gccaccttat gatggagtcc atttctgagcctccaggagg agaacaaggc tctacagaag gaactggtggcagcagcagc aagagcagtg ggaccgtcag acccaaacaccaggcccaga cgagctcatc atcttcctcc ttcatgatgacaacaaaaca tctgttaccc gccggtgaca atgggtggaggggcagcagg ggcagcttcg catcggaggc ctgccaccatgcttga<210> 89<211> 261<212> PRT
<213> Lolium perenne<400> 89
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys
100 105
Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys
115 120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130 135
His Leu Met Met Glu Ser Ile Ser Glu Leu Gln145 150 155
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu
165 170
Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp
180 185
Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln
195 200
Ser Ser Phe Met Met Arg Asp Gln Gln Ala His
210 215
Cys Tyr Pro Pro Val Thr Met Gly Gly Glu Ala225 230 235
Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu
245 250
Ser His Leu Asn Ala260
<210> 90
Pro Pro Trp Met Leu255
agataaaccg tcaggtgacc 60agatctccgt cctctgcgac 120tctatgagta cgccactgac 180cttatgctga aaaggctttg 240aatacaggaa actgaaggcg 300gggaggatct ggagtgtcta 360gttcattgaa gcacatcaga 420tacagaagaa ggagcggtca 480agaggcagaa ggcggccagg 540aacaagccca aaaccaacct 600gggatcagca ggcccatgct 660aggctgtggc cgcggcgcca 720ggatgctgag ccacctcaac 780 786
Glu Asn Lys
Leu Leu Lys30
Ala Val Val45
Asp Ser Ser60
Ala Glu Lys
Cys His Glu
Cys His Lys110
Glu Leu Gln125
Arg Ser Arg140
Lys Lys Glu
Leu Val Glu
Asp Arg Gln190
Thr Ser Ser
205Ala Gln Gln220
Val Ala AlaPro Pro Trp
Ile Asn15
Lys Ala
Val Phe
Met Asp
Ala Leu80
Tyr Arg95
His Leu
Gln Leu
Lys Ser
Arg Ser160Arg Gln175
Thr Gln
Ser Ser
Asn Ile
Ala Pro240Met Leu255<211> 831<212> DNA
<213> Hordeum vulgare<400> 90
atgggtcgcg gtaaggtgca gctgaagcgg atagagaacattctccaagc gccgcaacgg gctcctgaag aaggcgcacggcagaggtcg ccgtcatcgt cttctccccc aaaggcaagctccagcatgg acaaaattct tgaacgttat gagcgctactatttcagctg aatctgaaag tgaggggaat tggtgtcatgaagattgaga ccatacagaa gtgtcacaag cacctcatggaacctcaaag aactccaaca actggagcag cagctggagatcgagaaaga gccatcttat gatggagtcc atttctgagcctgcaggagg agaacaaggc cctacagaag gaactggtggaggcagcagc agctgcagca gcagcaacaa caacaacaaacagacccaaa cccataccca tactcaaaac cagccccaagtcctctttca tgatgaggga tcagcaggcc catgcccctcccaccggtga cgatgggtgg ggaggcgacg gcggcggcggcagcttcgca tatgcctacc gccatggatg ctgagccacc<210> 91<211> 276<212> PRT
<213> Hordeum vulgare<400> 91
agataaatcgagatctccgttctatgagtacttatgctgaaatacaggaagagaggatctgttcattgaatacagaagaaagaggcagaatgcaatgggacccagactagaacagaacatcggcgccggatcaacgcttg
gcaggtgacccctctgtgaccgccaccgacaaaggctcttacttaaggcgggattctctggcacatcagaggagaggtcaggcggccagcgcaccaagccctcatcatctttgtagctacgcagcaggcta
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Ser Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Asp Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Ala Ala Ser Arg Gln Gln Gln Leu Gln Gln Gln Gln Gln Gln Gln 180 185 190 Gln Met Gln Trp Glu His Gln Ala Gln Thr Gln Thr His Thr His Thr 195 200 205 Gln Asn Gln Pro Gln Ala Gln Thr Ser Ser Ser Ser Ser Ser Phe Met 210 215 220 Met Arg Asp Gln Gln Ala His Ala Pro Gln Gln Asn Ile Cys Ser Tyr225 230 235 240Pro Pro Val Thr Met Gly Gly Glu Ala Thr Ala Ala Ala Ala Ala Pro 245 250 255 Glu Gln Gln Ala Gln Leu Arg Ile Cys Leu Pro Pro Trp Met Leu Ser 260 265 270 His Leu Asn Ala
60120180240300360420480540600660720780831
<210><211><212>
275
92
804
DNA
<213> Oryza sativa<400> 92
atggggcggg ggaaggtgca gctgaagcgg atagagaactttctccaaga ggaggaatgg attgctgaag aaggcgcacggccgaggtcg ccgccatcgt cttctccccc aagggcaagctccaggatgg acaaaatcct tgaacgttat gagcgctattatttcagctg aatctgagag tgagggaaat tggtgccatgaagattgaga ccatacaaaa atgtcacaaa cacctcatggaatctcaaag aactccaaca gctagagcag cagctggagatcaagaaaga gccaccttat gcttgagtcc atttccgagcctgcaggagg agaacaaggc tctgcagaag gaactggtggggccagcagc aagtagggca gtgggaccaa acccaggtccccccaagccc agacaagctt cttcttcttc ttcatgctgatcaccacaaa atatctgcta cccgccggtg atgatgggcccggcggcggt ggcggcccaa ggccaggtgc aacttccgcaatgctgagca ccttcaaggc ttaa<210> 93<211> 267<212> PRT<213> Oryza sativa<400> 93
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp
cgatgaaccgagatctccgttctacgagtacatatgctgaaatacaggaagagaggatctgttcattgaatgcagaaaaaagaggcagaaaggcccaggcgggatcagcaagagaaatgattggaggctt
gcaggtgacgcctctgcgaccgccactgacaaaggctcttgcttaaggcaagaatccctggcacataagaggagaggtcagaatgtgaggccaagcccaaggcacttctttgcggcggcgtccgccatgg
Glu Asn Ser
Leu Leu Lys30
Ala Ala Ile45
Ser Arg
Met Asn15
Lys AlaVal PheMet Asp
50
55
60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Ser Glu Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Ile Glu Thr Ile 105 Gln Lys Cys His Lys 110 His LeuMet Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115
120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130
135
His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln
Arg140Lys
125
Ser Arg Lys Ser
145
150
155
165
170
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu
TrpGln
Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln
180 185
Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala
195 200
Phe Phe Phe Met Leu Arg Asp Gln Gln Ala Leu
210 215
Ile Cys Tyr Pro Pro Val Met Met Gly Gln Arg225 230 235
Arg Arg Arg Trp Arg Pro Lys Ala Arg Cys Asn
245 250
Phe Pro Pro Trp Met Leu Ser Thr Phe Lys Ala260 265
<210> 94
<211> 804
<212> DNA
<213> Oryza sativa
<400> 94
atggggcggg ggaaggtgca gctgaagcgg atagagaacattctccaaga ggaggaatgg attgctgaag aaggcgcacggccgaggtcg ccgccatcgt cttctccccc aagggcaagctccaggatgg acaaaatcct tgaacgttat gagcgctatt
Leu220Asn
Phe
Lys Glu
Val Glu
Asp Gln190Thr Ser205
Ser ProAsp AlaArg Ile
Arg Ser160Arg Gln175
Thr Gln
Phe Phe
Gln Asn
Ala Ala240Gly Gly255
agatcaacag gcaggtgacgagatctccgt cctctgcgactctacgagta cgccactgaccatatgctga aaaggctctt
60120180240300360420480540600660720780804
60120180240atttcagctg aatccgagag tgagggaaat tggtgccatg aatacaggaa acttaaggca
aagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatca tgaatccctg
aatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataata
tcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca
ctgcaggagg agaacaaggc tctgcagaag gaactggtgg agaggcagaa gaatgtgagg
ggccagcagc aagtagggca gtgggaccaa acccaggtcc aggcccaggc ccaagcccaa
ccccaagccc agacaagctc ctcctcctcc tccatgctga gggatcagca ggcacttctt
ccaccacaaa atatctgcta cccgccggtg atgatgggcg agagaaatga tgcggcggcg
gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg
atgctgagcc acctcaatgc ttaa<210> 95<211> 267<212> PRT
<213> Oryza sativa<400> 95
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Asn Gly Leu Leu Lys 30 Lys AlaHis Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Ala Ala 45 Ile Val PheSer Pro 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Arg Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Ser Glu Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Ile Glu Thr Ile 105 Gln Lys Cys His Lys 110 His LeuMet Gly Glu Asp His Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115
120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130
135
His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln145 150 155
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu
165 170
Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln
180 185
Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala
195 200
Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu
210 215
Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg225 230 235
Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln
245 250
Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265
<210> 96<211> 668<212> DNA
<213> Tradescantia virginiana<400> 96
gggctggtga agaaggctca tgagatctcd atkytrtgtgattttctcta ctaaaggcaa actatacgag tatgccactgcttgaacgct atgaacgtta ctcatatgct gagaaggcttttacagggaa attggtgcca agagtatgtt aaacttaaggaaaagccaaa ggcatcttat gggagagcaa ctagaagcgtcaactagagc atcaacttga aggttctttg aggcttgtcaatgttggact ccatttccga acttcagagg aaggaaaagtaacctagaga aggagatttt ggagaagcag aaagaaaaggtgggaacagc agaatcagcc actacaaagc actaattcgc
125
Ile Ser Arg Lys Ser140
Lys Lys
Leu Val
Trp Asp
Gln Thr205Leu Pro220
Asn AspLeu Arg
Glu Arg Ser160
Glu Arg Gln175
Gln Thr Gln190
Ser Ser Ser
Pro Gln Asn
Ala Ala Ala240
Ile Gly Gly255
atgcygaggtattccaaaattaacttcatcctaaggttgatggatctcaaggtcaagaaactctggaagactctggcacactccaaggcc
tgcgcttattggaaaatatcagatcctgaaggccttacatagaattgcaggactcaaatggcaaaacaagccaagctcaccttcgtgatt
300360420480540600660720780804
60120180240300360420480540gcagaaactc atccaacact aaacattgga aatttccaag gtagaacaaa taccgtccat 600gcagaagaaa gtctgcagcg tcagatgagg atcagcagca gcctactgcc mycmtggatg 660mttcacma 668
<210> 97<211> 222<212> PRT
<213> Tradescantia virginiana<220>
<221> VARIANTE<222> (11) .. (11)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>
<221> VARIANTE<222> (218)..(218)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>
<221> VARIANTE<222> (221)..(221)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 97
Gly Leu Val Lys Lys Ala His Glu Ile Ser Xaa Leu Cys Asp Ala Glu15 10 15
Val Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala
20 25 30
Thr Asp Ser Lys Met Glu Asn Ile Leu Glu Arg Tyr Glu Arg Tyr Ser
35 40 45
Tyr Ala Glu Lys Ala Leu Thr Ser Ser Asp Pro Glu Leu Gln Gly Asn
50 55 60
Trp Cys Gln Glu Tyr Val Lys Leu Lys Ala Lys Val Glu Ala Leu His65 70 75 80
Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu Glu Ala Leu Asp Leu
85 90 95
Lys Glu Leu Gln Gln Leu Glu His Gln Leu Glu Gly Ser Leu Arg Leu
100 105 110
Val Arg Ser Arg Lys Thr Gln Met Met Leu Asp Ser Ile Ser Glu Leu
115 120 125
Gln Arg Lys Glu Lys Ser Leu Glu Glu Gln Asn Lys Asn Leu Glu Lys
130 135 140
Glu Ile Leu Glu Lys Gln Lys Glu Lys Ala Leu Ala His Gln Ala His145 150 155 160
Trp Glu Gln Gln Asn Gln Pro Leu Gln Ser Thr Asn Ser Pro Pro Arg
165 170 175
Pro Phe Val Ile Ala Glu Thr His Pro Thr Leu Asn Ile Gly Asn Phe
180 185 190
Gln Gly Arg Thr Asn Thr Val His Ala Glu Glu Ser Leu Gln Arg Gln
195 200 205
Met Arg Ile Ser Ser Ser Leu Leu Pro Xaa Trp Met Xaa His
210 215 220
<210> 98<211> 723<212> DNA
<213> Tradescantia virginiana<400> 98
gtgcagctga aacggatgga gaacaagatt aacaggcagg tgacgttttc taaacgtcga 60
ggagggctgc tgaagaaagc tcatgagatc tctattctat gtgatgctga gattgctctt 120attattttct ctactaaagg gaagctctat gagtatgcca ccaattccaa aatggacaat 180attcttgaac gctatgagcg ttactcatat gctgaaaagg ctctaacttc atcagatcct 240gatatacagg gaaattggtg ccaagagtat gctaaactta agtctaaggt tgaggcttta 300tgtaaaagcc aaaggcatct tatgggagag cagcttgaaa cattgaatct caaagaattg 360cagcaactag agcaacagct cgaaggttct ctaaagcatg tcaggtcaag aaagactcaa 420gttatgctgg actctatttc tgaacttcag aggaaggaaa agtcactaga ggagcaaaac 480aagaacctag agaaggagat tttggagaag cagaaaatca aggctcttgc acagcaggct 540cactgggaac accagaatca accagcacca aggggttcac ctcctaggcc atttgtgatt 600gcagagtctc atccgacact aaatattgga catttccaag gcaggacaaa tgcagtcgaa 660gcagaagaaa atcagcagcc tcakatgaga atttgcagta gcctcctgcc cccctggatg 720ctt 723
<210> 99<211> 241<212> PRT
<213> Tradescantia virginiana<220>
<221> INSEGURO<222> (228)..(228)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 99
Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn Arg Gln Val Thr Phe1 5 10 15 Ser Lys Arg Arg Gly Gly Leu Leu Lys Lys Ala His Glu Ile Ser Ile 20 25 30 Leu Cys Asp Ala Glu Ile Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys 35 40 45 Leu Tyr Glu Tyr Ala Thr Asn Ser . Lys Met Asp Asn Ile Leu Glu Arg 50 55 60 Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Thr Ser Ser Asp Pro65 70 75 80Asp Ile Gln Gly Asn Trp Cys Gln Glu Tyr Ala Lys Leu Lys Ser Lys 85 90 95 Val Glu Ala Leu Cys Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu 100 105 110 Glu Thr Leu Asn Leu Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu Glu 115 120 125 Gly Ser Leu Lys His Val Arg Ser Arg Lys Thr Gln Val Met Leu Asp 130 135 140 Ser Ile Ser Glu Leu Gln Arg Lys Glu Lys Ser Leu Glu Glu Gln Asn145 150 155 160Lys Asn Leu Glu Lys Glu Ile Leu Glu Lys Gln Lys Ile Lys Ala Leu 165 170 175 Ala Gln Gln Ala His Trp Glu His Gln Asn Gln Pro Ala Pro Arg Gly
180 185 190
Ser Pro Pro Arg Pro Phe Val Ile Ala Glu Ser His Pro Thr Leu Asn
195 200 205
Ile Gly His Phe Gln Gly Arg Thr Asn Ala Val Glu Ala Glu Glu Asn
210 215 220
Gln Gln Pro Xaa Met Arg Ile Cys Ser Ser Leu Leu Pro Pro Trp Met225 230 235 240
Leu
<210> 100<211> 599<212> DNA
<213> Tradescantia virginiana<4 00> 100
gggctkgtga agaaagctca tgagatctcg gtactttgtg atgctgagct tgctcttatt 60
atcttctctc ccaaaggcaa gctctatgag tatgccaccg attccaaaat ggaaattatt 120cttgaacgct atgaacgtta cacctacgct gaaaaagctt taattgcatc agatcctgat 180gtacagggaa actggtgtca tgagtacatt aagcttaaag ctaaatttga ggccttgaat 240aaaagccaga ggcatcttat gggagaacaa ctagatacgt tgaaccaaaa ggaattgctg 300caactagaga ctaagcttga aggttctctg aaaaacgtca ggtcaagaaa gactcaactt 360atgttggatt ccatttctga gcttcaagaa aagggaaagt cactccagga gcaaaacacc 420tgcctagaaa aggagatttt gggaaaacag aaagacaagg ctcccaaaca gcatgttcag 480tgggaaaaac agaatcaacc accacctacc tcttctgcgc caatgccatt cctcattggt 540gatattcacc caacccctaa tatcagaaat ttccaaggca gaacagtagc tgatgcaga 599
<210> 101<211> 199<212> PRT
<213> Tradescantia virginiana<400> 101
Gly Leu Val Lys Lys Ala His Glu Ile Ser Val Leu Cys Asp Ala Glu1 5 10 15 Leu Ala Leu Ile Ile Phe Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala 20 25 30 Thr Asp Ser Lys Met Glu Ile Ile Leu Glu Arg Tyr Glu Arg Tyr Thr 35 40 45 Tyr Ala Glu Lys Ala Leu Ile Ala Ser Asp Pro Asp Val Gln Gly Asn 50 55 60 Trp Cys His Glu Tyr Ile Lys Leu Lys Ala Lys Phe Glu Ala Leu Asn65 70 75 80Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu Asp Thr Leu Asn Gln 85 90 95 Lys Glu Leu Leu Gln Leu Glu Thr Lys Leu Glu Gly Ser Leu Lys Asn 100 105 110 Val Arg Ser Arg Lys Thr Gln Leu Met Leu Asp Ser Ile Ser Glu Leu 115 120 125 Gln Glu Lys Gly Lys Ser Leu Gln Glu Gln Asn Thr Cys Leu Glu Lys 130 135 140 Glu Ile Leu Gly Lys Gln Lys Asp Lys Ala Pro Lys Gln His Val Gln145 150 155 160Trp Glu Lys Gln Asn Gln Pro Pro Pro Thr Ser Ser Ala Pro Met Pro 165 170 175 Phe Leu Ile Gly Asp Ile His Pro Thr Pro Asn Ile Arg Asn Phe Gln 180 185 190 Gly Arg Thr Val Ala Asp Ala 195 <210> 102 <211> 753
<212> DNA
<213> Elaeis guineensis<4 00> 102
atggggagag ggagggtgca gctgaggcgg atcgagaaca agataaaccg gcaggtgacg 60
ttctcgaagc gccggtcggg gctcctgaag aaagcccacg agatctccgt cctctgcgac 120
gccgaggtcg ccctcatcat cttctcgacc aagggcaagc tctacgagta cgccaccgac 180
tcctgcatgg aaaggattct tgaacgctat gaacgttaca cctatgcaga aaaagcacta 240
atttcatctg gacccgaatt gcagggtaac tggtgccatg aatttggcaa actcaaagct 300
aaggttgagg ctttacaaaa aagccaaagg catctcatgg gtgagcaact tgagcccttg 360
aatctcaaag aactccagca actagagcaa cagcttgaaa gttctttaaa gcatataaga 420
accagaaagt gccaactcat gtttgaatcc atctctgagc ttcaaaaaaa ggaaaagtca 480
ctgcaggagc agaacaagat gctggagaag gagctcatgg agaagcagaa ggtgaaggca 54 0
ctaaaccagc aggcaccttg ggagcagcaa ggcccgccgc agacaagctc atcatcccca 600
acctccttcc tgatcggaga ctctctcccc accctgaata ttgggacata ccaatgtagc 660
ggaaatgaac atggggagga agcagcacaa ccccaggttc gtataggaaa cagcctgtta 720
ccaccttgga tgcttagcca cttgaacggg tag 753<210> 103
<211> 250 <212> PRT <213> Elaeis guineensis <4 00> 103 Met Gly Arg Gly Arg Val Gln Leu Arg Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Glu50 55 60 Arg Ile Leu Glu Arg Tyr Glu Arg Tyr Thr Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ser Gly Pro Glu Leu Gln Gly Asn Trp Cys His Glu Phe Gly 85 90 95 Lys Leu Lys Ala Lys Val Glu Ala Leu Gln Lys Ser Gln Arg His Leu100 105 110
Met Gly Glu Gln Leu Glu Pro Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Thr Arg Lys Cys
130 135 140
Gln Leu Met Phe Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Lys Ser145 150 155 160
Leu Gln Glu Gln Asn Lys Met Leu Glu Lys Glu Leu Met Glu Lys Gln
165 170 175
Lys Val Lys Ala Leu Asn Gln Gln Ala Pro Trp Glu Gln Gln Gly Pro
180 185 190
Pro Gln Thr Ser Ser Ser Ser Pro Thr Ser Phe Leu Ile Gly Asp Ser
195 200 205
Leu Pro Thr Leu Asn Ile Gly Thr Tyr Gln Cys Ser Gly Asn Glu His
210 215 220
Gly Glu Glu Ala Ala Gln Pro Gln Val Arg Ile Gly Asn Ser Leu Leu225 230 235 240
Pro Pro Trp Met Leu Ser His Leu Asn Gly245 250
<210> 104<211> 699<212> DNA<213> Allium sp.<4 00> 104
gtgcaattga agaggatgga aaacaagatt aatagacaag tgaccttctc aaaaagaaga 60
aatggtttgt tgaagaaagc tcatgagatt tcwgtgcttt gtgatgcaga agttgcactt 120attgttttct ctgctaaagg aaaactctat gaatattcaa ctgattcaag tatggaaaaa 180attctggaga ggtatgaacg ttattgcttt gcggagaaat catcaacaat gagtgacatt 240gactcccagg aggattggag ccttgaatat cacaaactga aggctaaggt tgagagttta 300aacaacaggc aaaggcatct tatgggagag caacttgaat ctctgagtct tcgagaaatt 360ggacagcttg agcaacaact tgagaattct ctcaaaactg ttcggacgcg caagagccaa 420gaattgttaa gttctatttc agagcttcag gacaaggaga aaactttgcg agatgagaac 480aaagctttag aaaatgagct tatgaaaagg gccagggcaa aagctattct ggaacaacaa 540gcacgatgga agcatcataa tcataaacaa caggataatc ttcataatcc aaatatcaac 600attggaaatt accaaacaag gaacaatgag ggaggagttg agccagcaac ggatgttcaa 660gtacgtgttg ttagaaattt gttgccccac tggatgctt 699
<210> 105<211> 233<212> PRT<213> Allium sp.<4 00> 105
Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn Arg Gln Val Thr Phe15 10 15
Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala His Glu Ile Ser Val
20 25 30
Leu Cys Asp Ala Glu Val Ala Leu Ile Val Phe Ser Ala Lys Gly Lys
35 40 45
Leu Tyr Glu Tyr Ser Thr Asp Ser Ser Met Glu Lys Ile Leu Glu Arg
50 55 60
Tyr Glu Arg Tyr Cys Phe Ala Glu Lys Ser Ser Thr Met Ser Asp Ile65 70 75 80
Asp Ser Gln Glu Asp Trp Ser Leu Glu Tyr His Lys Leu Lys Ala Lys
85 90 95
Val Glu Ser Leu Asn Asn Arg Gln Arg His Leu Met Gly Glu Gln Leu
100 105 110
Glu Ser Leu Ser Leu Arg Glu Ile Gly Gln Leu Glu Gln Gln Leu Glu
115 120 125
Asn Ser Leu Lys Thr Val Arg Thr Arg Lys Ser Gln Glu Leu Leu Ser
130 135 140
Ser Ile Ser Glu Leu Gln Asp Lys Glu Lys Thr Leu Arg Asp Glu Asn145 150 155 160
Lys Ala Leu Glu Asn Glu Leu Met Lys Arg Ala Arg Ala Lys Ala Ile165 170 175Leu Glu Gln Gln Ala Arg Trp Lys His His Asn
180 185
Asn Leu His Asn Pro Asn Ile Asn Ile Gly Asn
195 200
Asn Glu Gly Gly Val Glu Pro Ala Thr Asp Val
210 215
Arg Asn Leu Leu Pro His Trp Met Leu225 230
<210> 106<211> 744<212> DNA
<213> Dendrobium grex Madame Thong-IN<4 00> 106
atgggtcgtg gcagggtgca gctgaagcga atcgagaatattctcgaagc ggagatctgg tttgcttaag aaggcgcacggctgaagttg ctctgatcgt tttttccaat aagggaaagctccagcatgg agaaaattct tgaacggtat gagcgttattttttccaatg aggccaaccc ccaggctgat tggcgccttgagggttgaaa gcttacagaa gagccaaagg caccttatggagcattaaag aactccaacg tctagagcaa cagcttgaaatccagaaaga cacagctcat actacattca atttccgagcttgctggagc aaaacaagac cttagagaag gagattatagttggtgcagc atgccccatg ggagaagcaa aaccagtccccctgtgattt cggattctgt cccaactccc accagcagaagaagaagaat cacctcagcc acagttaaga gtaagcaacactcagtcata tgaatggaca ataa<210> 107<211> 247<212> PRT
<213> Dendrobium grex Madame Thong-IN<4 00> 107
Met Gly Arg Gly Arg Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Asn Lys Gly Lys Leu Tyr Glu Tyr Ser Thr
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Phe Ser Asn Glu Ala Asn Pro Gln Ala Asp Trp
85 90
Lys Leu Lys Ala Arg Val Glu Ser Leu Gln Lys
100 105
Met Gly Glu Gln Leu Asp Ser Leu Ser Ile Lys
115 120
Glu Gln Gln Leu Glu Ser Ser Leu Lys Phe Ile
130 135
Gln Leu Ile Leu His Ser Ile Ser Glu Leu Gln145 150 155
Leu Leu Glu Gln Asn Lys Thr Leu Glu Lys Glu
165 170
Lys Ala Lys Ala Leu Val Gln His Ala Pro Trp
180 185
Ser Gln Tyr Ser Ser Ala Leu Pro Pro Val Ile
195 200
Thr Pro Thr Ser Arg Thr Phe Gln Ala Arg Ala
210 215
Pro Gln Pro Gln Leu Arg Val Ser Asn Thr Leu225 230 235
Leu Ser His Met Asn Gly Gln245
His Lys Gln 190 Gln AspTyr Gln 205 Thr Arg AsnGln Val Arg Val Val220
aaataaaccgagatctccgttttatgagtacatatgctgaaatataataagggagcaactgttccttgaatacaaaagatctaaagagaaaatatagctccgtttcaagcctctgctgcc
gcaggtgacggctctgtgacttccaccgataagagcattaactgaaggcatgactccttggtttatacgaggaaaaaataagccaaagcttgcactcccgcagagccaatcccatggatg
Glu Asn Lys
Leu Leu Lys30
Ala Leu Ile45
Asp Ser Ser60
Ala Glu Arg
Arg Leu Glu
Ser Gln Arg110
Glu Leu Gln125
Arg Ser Arg140
Lys Met Glu
Ile Ile Ala
Glu Lys Gln190
Ser Asp Ser
205Asn Glu Glu220
Leu Pro Pro
Ile Asn15
Lys Ala
Val Phe
Met Glu
Ala Leu80Tyr Asn95
His Leu
Arg Leu
Lys Thr
Lys Ile160Lys Glu175
Asn Gln
Val Pro
Glu Ser
Trp Met240
60120180240300360420480540600660720744<210> 108
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 108
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata àtatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 109<211> 804<212> DNA<213> Oryza sativa<400> 109
atggggcggg ggaaggtgca gctgaagcgg atagagaaca agatcaacag gcaggtgacg 60
ttctccaaga ggaggaatgg attgctgaag aaggcgcacg agatctccgt cctctgcgac 120
gccgaggtcg ccgccatcgt cttctccccc aagggcaagc tctacgagta cgccactgac 180
tccaggatgg acaaaatcct tgaacgttat gagcgctatt catatgctga aaaggctctt 240
atttcagctg aatccgagag tgagggaaat tggtgccatg aatacaggaa acttaaggca 300
aagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatct agaatccctg 360
aatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataata 420
tcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca 480
ctgcaggagg agaacaaggc tctgcagaag gaactggtgg agaggcagaa gaatgtgagg 540
ggccagcagc aagtagggca gtgggaccaa acccaggtcc aggcccaggc ccaagcccaa 600
ccccaagccc agacaagctc ctcctcctcc tccatgctga gggatcagca ggcacttctt 660
ccaccacaaa atatctgcta cccgccggtg atgatgggcg agagaaatga tgcggcggcg 720
gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg 780
atgctgagcc acctcaatgc ttaa 804<210> 110<211> 267<212> PRT
<213> Oryza sativa<400> 110
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala
20 25 30
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Ala Ile Val Phe
35 40 45
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80
Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Ile Ser Arg Lys Ser
130 135 140
His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln
165 170 175
Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln Trp Asp Gln Thr Gln
180 185 190
Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala Gln Thr Ser Ser Ser
195 200 205
Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu Leu Pro Pro Gln Asn
210 215 220
Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg Asn Asp Ala Ala Ala225 230 235 240
Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln Leu Arg Ile Gly Gly
245 250 255
Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265
<210> 111<211> 52<212> DNA
<213> Seqüência artificial<220>
<223> iniciador<4 00> 111 '
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg gcgggggaag gt 52
<210> 112<211> 47<212> DNA
<213> Seqüência artificial<220>
<223> iniciador<4 00> 112
ggggaccact ttgtacaaga aagctgggtt tggccgacga cgacgac 47
<210> 113
<211> 2193
<212> DNA
<213> Oryza sativa
<4 00> 113
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300<210> 114<211> 42<212> PRT
<213> Seqüência artificial<220>
<223> Seqüência artificial<220>
<221> VARIANTE<222> (2)..(2)<223> /substituir = "Vai"<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir = "Asn"
<220>
<221> VARIANTE<222> (10)..(10)<223> /substituir = "He"<220>
<221> VARIANTE<222> (12) .. (12)<223> /substituir = "Tyr"<220>
<221> VARIANTE<222> (16)..(16)
<223> /substituir = "lie" /substituir = "Leu"<220>
<221> VARIANTE
<222> (17)..(17)
<223> /substituir = "Gly"
<220>
aaaaaatcttatgaagatatttgtgcattcttagtaattagtacttacgctcaactagcatgaattcaagaattttacagaaaaaaagaaacagagtggctccgcaacaaaaccaagcatggaggcatcccgaccgccttcacctcctcctgtagtacgggatttgggatggttttcaatgattttgtgaaataaaagtactatcctttgatgagattgaacagtagtcccctgttcttcctttctggttgctgtagttctttctgatctattatttttttgtcctcaatcctgtagaagagctgtaatctggtgtagct
tctagctgaatctgaacgtagtcatatcgcaagacaattgacacactttgacacatctctcactccaccaaatagcatgattttgctcgttgcccacagaccttttaacacctcctcctcaagccaagaacttcgatccatcacagggtagcgttgatgtagaggggttccgtctggagagtaccttttgcggttgtttgtttattccctatgattgattccatcacgaacgatttgcttcagttcaatgagttaataggccatttttaattattagctctttgttttcatttctttttggggatagttatgccactttc
ctcaatgggt
ttggcaaaga
acatcattaa
acttattttt
tgctcatgtg
aatatcactc
tcaccagacc
aaagtatgaa
gcgcgagcgc
acaacccaca
gcaggctttg
ccatctataa
gagggagagc
tatcttccgg
tgtgcccttc
taggaaaggg
ttgatgttgc
gctctatgga
tttgaggtaa
gtcctcgatt
attgaacaaa
cttaagcctg
attcatggaa
tagtcccaga
aattgattgc
taatacccct
ttatatgaaa.
tcaccccttc
aattcacatc
gttattcctt
tactgcttgt
accagcaaag
aaagagagag attttttttatttaaacata taattatata
ggacatgtctattatttatccatgtgtgaggcctatttaaacttttaataacgaactattcaatctcccaaaaaacgatgcggccaggagattcctccccaccaaggacatcgagttcttggttgttcttgatctgtatcatgttatcggaatgaaatggaatcagagcactggtagtgaaataatccaatccaaaatttacagttataaattttttttctacaaataatatagtttagttgaactgtagattattctgagattatctatgactgcttgatcttatgattttc
tactccatccttttttcgattgcacctccttacatttaggatatctaaaataggtttttctattgggcacatctaacggaagaggaggagccttttcccccgcgactagcggtcgatctcggatttattgtgtgatgattttcggtttgatttagggtacccggtgattttgcttctcgactttgaagaccgcagctggctcctcaggaaccaaatatctgcttttatagcaggagaagacataagcagtgctgaaagtcgcattatcctttacagaaagcatttccttt
aaaaaatagaattttatagtcaatttttattagatgcaagcaatacacgttagcaatatctacaaaaaatacatacaaaaacaggcaacaggacagcaagaggcaaagaatctctatataagaagccgagttccctcctcttctaggttgcctgttcttgttagtagtatggaatcttgctgcttggtgttttgacgaagggtcccgttgttgtttagatcaggggattctaaaaagtcacgttatcctaacttatccgaattcatttggtggcatgaaccttgtatctaaaatttatgagtgcagttct<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><4 00>Leu Leu1
Ala Leu Ile
VARIANTE(18)..(18)/substituir
VARIANTE
(19)..(19)/substituir
VARIANTE
(20)..(20)/substituir
VARIANTE(23)..(23)/substituir
VARIANTE
(30)..(30)/substituir
VARIANTE
(31)..(31)/substituir
VARIANTE
(32) . . (32)/substituir
VARIANTE
(33)..(33)/substituir
VARIANTE(35)..(35)/substituir
VARIANTE
(37)..(37)/substituir
VARIANTE
(38) . . (38)/substituir
VARIANTE(41) . . (41)/substituir114
= "Ala" /substituir = "Vai"
"Vai"
= "Vai"
= "Pro" /substituir = "Ala" /substituir = "Asn"
= "Phe"
= "Ser"
"Ser"
"Asn" /substituir = "Glu"
= "Cys /substituir = "Arg" /substituir = "Ser'
= "Glu"
= "lie" /substituir = "Arg" /substituir = "Lys"
= "Asp"
Lys Lys
Ala5
Phe
Ile20
Met Asp
Asp Ser Lys35
<210> 115<211> 19<212> PRT
<213> Seqüência arti<220>
<223> Seqüência arti<220>
<221> VARIANTE<222> (4)..(4)
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
10 15
Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
25 30
Asn Ile Leu Glu Arg40
ficialficial<223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><4 00>
/substituir = "Ser"
VARIANTE
(5)..(5)/substituir
VARIANTE
(6)..(6)
/substituir
VARIANTE(8)..(8)/substituir
VARIANTE
(9)■·(9)
/substituir
VARIANTE
(10) . . (10)/substituir
VARIANTE(H) · ■ (H)/substituir
VARIANTE(12) . . (12)/substituir
VARIANTE
(13)..(13)/substituir
VARIANTE
(14)..(14)/substituir115
= nArg"
= "lie"
"Thr" /substituir = "Ser"
"lie"
= "Asn"
"Arg" /substituir = "Asn"
= "Cys" /substituir = "Arg"
= "His"
= "Lys"
Lys Leu Lys Ala Lys1 5
Met Gly Glu
Val Glu Ala Leu
Gln10
Lys Ser Gln Arg
His15
Leu
<210> 116<211> 11<212> PRT
<213> Seqüência artificial<220>
<223> Seqüência artificial<220>
<221> VARIANTE<222> (2) .. (2)
<223> /substituir = "Gln" /substituir<220>
<221> VARIANTE<222> (6)..(6)<223> /substituir = "Phe"<220>
<221> VARIANTE
<222> (7) . . (7)
<223> /substituir = "Phe"
<220>
<221> VARIANTE<222> (8)..(8)
"Vai" /substituir = "Ala""Phe"
<223> /substituir = "Phe"<220>
<221> VARIANTE<222> (9)..(9)<223> /substituir = "Phe"<220>
<221> VARIANTE<222> (10)..(10)
<223> /substituir = "Cys" /substituir<220>
<221> VARIANTE<222> (11)..(11)<223> /substituir = "Met"<400> 116
Gln Pro Gln Thr Ser Ser Ser Ser Ser Ser Phe1 5 10
<210> 117<211> 7<212> PRT
<213> Seqüência artificial<220>
<223> Seqüência artificial<220>
<221> VARIANTE<222> (1)..(1)
<223> /substituir = "Ala" /substituir = "Vai" /substituir = "Leu"<220>
<221> VARIANTE<222> (2)..(2)<223> /substituir = "Pro"<220>
<221> INSEGURO<222> (3)..(3)
<223> Xaa can be any amino acid, preferably Leu, Phe ou His<220>
<221> INSEGURO<222> (6)..(6)
<223> Xaa can be any naturally occuring amino acid, preferably Val ouLeu
<220>
<221> VARIANTE<222> (7) . . (7)<223> /substituir = "His"<4 00> 117
Gly Leu Xaa Trp Met Xaa Ser1 5
<210> 118<211> 735<212> DNA
<213> Hordeum vulgare<4 00> 118
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg ccaggtcacc 60
ttctccaagc gccgctcggg gctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gccgaggtcg gcctcatcat cttctccacc aagggaaagc tctacgagtt ctccaccgag 180tcatgtatgg acaaaattct tgaacggtat gagcgctact cttatgcaga aaaggttctc 240gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga caatacagaa atgtcaaaag catctcatgg gagaggatct tgaatctttg 360aatctcaagg agttgcagca actggagcag cagctggaaa gctcactgaa acatatcaga 420gccaggaaga accaacttat gcacgaatcc atttctgagc ttcagaagaa ggagaggtca 480ctgcaggagg agaataaagt tctccagaag gaacttgtgg agaagcagaa ggcccaggcg 540gcgcagcaag atcaaactca gcctcaaacc agctcttctt cttcttcctt catgatgagg 600gatgctcccc ctgtcgcaga taccagcaat cacccagcgg cggcaggcga gagggcagag 660gatgtggcag tgcagcctca ggtcccactc cggacggcgc ttccactgtg gatggtgagc 720cacatcaacg gctga 735
<210> 119<211> 244<212> PRT
<213> Hordeum vulgare<4 00> 119
Met Gly Arg Gly Lys1 5
Arg Gln Val Thr Phe20
His Glu Ile Ser Val35
Ser Thr Lys Gly Lys50
Lys Ile Leu Glu Arg65
Val Ser Ser Glu Ser85
Lys Leu Lys Ala Lys100
Met Gly Glu Asp Leu115
Glu Gln Gln Leu Glu130
Gln Leu Met His Glu145
Leu Gln Glu Glu Asn165
Lys Ala Gln Ala Ala180
Ser Ser Ser Ser Phe195
Ser Asn His Pro Ala210
Gln Pro Gln Val Pro225
His Ile Asn Gly
<210> 120<211> 1196<212> DNA<213> Hordeum vulgare<4 00> 120
ctctcccctc ccacttcacc caaccacctg acagccatgg ctccgccacc tcgcctccgc 60
ccgcgcctct gagagtagcc gtcgcggtcg ctcgctcgct cgctcgctgc tgccggtgtt 120
ggcccggtcc tcgagcggag atggggcgca ggaaggtgca gctgaagcgg atcgagaaca 180
agatcaaccg ccaggtcacc ttctccaagc gccgctcggg gctgctcaag aaggcgcacg 240
agatctccgt gctctacgac gccgaggtcg gcctcatcat cttctccacc aagggaaagc 300
tctacgagtt ctccaccgag tcatgtatgg acaaaattct tgaacggtat gagcgctact 360
cttatgcaga aaaggttctc gtttcaagtg aatctgaaat tcagggaaac tggtgtcacg 420
aatataggaa actgaaggcg aaggttgaga caatacagaa atgtcaaaag catctcatgg 480
gagaggatct tgaatctttg aatctcaagg agttgcagca actggagcag cagctggaaa 540
gctcactgaa acatatcaga gccaggaaga accaacttat gcacgaatcc atttctgagc 600
ttcagaagaa ggagaggtca ctgcaggagg agaataaagt tctccagaag gaacttgtgg 660
agaagcagaa ggcccaggcg gcgcagcaag atcaaactca gcctcaaacc agctcttctt 720
cttcttcctt catgatgagg gatgctcccc ctgtcgcaga taccagcaat cacccagcgg 780
cggcaggcga gagggcagag gatgtggcag tgcagcctca ggtcccactc cggacggcgc 840
ttccactgtg gatggtgagc cacatcaacg gctgaagggc ttccagccca tgtaagcgta 900
ctattcagta cgagtaacaa gttgcagcgg ccagcctggt gtatcatgcg gttgcgaaca 960
tgctaacccc atggagggga gaggaaaaga aatcagagta aagcagcaag ctgcaggaat 1020
gtgtatattt cacttcgtcc acctcagttt cctttccacc tgggctgaga tggctgtacg 1080
agtaatctac catgtaattt atatgtagca tgagtgacga attttcaact ttcgatgata 1140
tccgttgctc ctgggtgttg tttctgtgaa ttaacctatc gaatatgagc gttgtg 1196
Val Gln Leu Lys Arg10
Ser Lys Arg Arg Ser25
Leu Cys Asp Ala Glu40
Leu Tyr Glu Phe Ser55
Tyr Glu Arg Tyr Ser70
Glu Ile Gln Gly Asn90
Val Glu Thr Ile Gln105
Glu Ser Leu Asn Leu120
Ser Ser Leu Lys His135
Ser Ile Ser Glu Leu150
Lys Val Leu Gln Lys170
Gln Gln Asp Gln Thr185
Met Met Arg Asp Ala200
Ala Ala Gly Glu Arg215
Leu Arg Thr Ala Leu230
Ile Glu Asn Lys Ile Asn15
Gly Leu Leu Lys Lys Ala30
Val Gly Leu Ile Ile Phe45
Thr Glu Ser Cys Met Asp60
Tyr Ala Glu Lys Val Leu75 80
Trp Cys His Glu Tyr Arg95
Lys Cys Gln Lys His Leu110
Lys Glu Leu Gln Gln Leu125
Ile Arg Ala Arg Lys Asn140
Gln Lys Lys Glu Arg Ser155 160
Glu Leu Val Glu Lys Gln175
Gln Pro Gln Thr Ser Ser190
Pro Pro Val Ala Asp Thr205
Ala Glu Asp Val Ala Val220
Pro Leu Trp Met Val Ser235 240<210> 121<211> 244<212> PRT
<213> Hordeum vulgare<400> 121
Met Gly Arg Arg Lys Val Gln1 5
Arg Gln Val Thr Phe Ser Lys20
His Glu Ile Ser Val Leu Tyr35
Ser Thr Lys Gly Lys Leu Tyr
50 55
Lys Ile Leu Glu Arg Tyr Glu65 70
Val Ser Ser Glu Ser Glu Ile85
Lys Leu Lys Ala Lys Val Glu100
Met Gly Glu Asp Leu Glu Ser115
Glu Gln Gln Leu Glu Ser Ser130 135
Gln Leu Met His Glu Ser Ile145 150
Leu Gln Glu Glu Asn Lys Val165
Lys Ala Gln Ala Ala Gln Gln180
Ser Ser Ser Ser Phe Met Met195
Ser Asn His Pro Ala Ala Ala210 215
Gln Pro Gln Val Pro Leu Arg225 230
His Ile Asn Gly
Leu Lys Arg10
Arg Arg Ser25
Asp Ala Glu40
Glu Phe Ser
Arg Tyr Ser
Gln Gly Asn90
Thr Ile Gln
105Leu Asn Leu120
Leu Lys His
Ser Glu Leu
Leu Gln Lys170
Asp Gln Thr185
Arg Asp Ala200
Gly Glu ArgThr Ala Leu
Ile Glu Asn LysGlyValThr
Tyr
75
Trp
Lys
Lys
Ile
Gln155Glu
Gln
Pro
Ala
Pro235
Leu Leu Lys30
Gly Leu Ile45
Glu Ser Cys60
Ala Glu Lys
Cys His Glu
Cys Gln Lys110
Glu Leu Gln125
Arg Ala Arg140
Lys Lys Glu
Leu Val Glu
Pro Gln Thr190
Pro Val Ala
205Glu Asp Val220
Leu Trp Met
Ile Asn15
Lys Ala
Ile Phe
Met Asp
Val Leu80Tyr Arg95
His Leu
Gln Leu
Lys Asn
Arg Ser160Lys Gln175
Ser Ser
Asp Thr
Ala Val
Val Ser240
<210> 122
<211> 1161
<212> DNA
<213> Trit
<4 00> 122
ggcacgagct
cggcacgagc
accggcaggt
ccgtgctctg
agttctccac
cagaaaaggt
ggaaactgaa
atcttgaatc
tgaaacatat
agaaggagag
agaaggccca
ccttcatgat
gcgagagggc
tgtggatggt
agtagagagt
gaccccttgg
atatttcact
atatgtagct
gtttatgtga
ataaatcagg
<210> 123
icum aestivum
ctctctctctggagatgggggaccttctcccgacgccgagcgagtcatgttctcgtttcaggcgaaggtttttgaatctccagatccagggtcactgcagggcggcgcaagagggatgctaggggatgcggagccacatcaacaagttgcaggggaaaggttgtccaccctgagtgatgaattaacctatatctttgtct
ctctctctct ctctctctct
cgcgggaaggaagcgccgctgtcggcctcaatggacaaaaagtgaatctggagacaatacaaggagttgcaagaaccaacgaggagaatacaagatcagaccccctgccggcagtgcagcaacggctgaaaccggccagtaaaagaaatccagtttccctattttcaagtcaaatatgagt
tgcagctgaacggggctgcttcatcttctcttcttgaacgaaattcagggagaaatgtcaagcaactggattatgcacgaaagttctccactcagcctcacagctaccagcgcaggccccgggcttccagctggtgtatgagagtaaagtcccagctgggttccatgatacattgtgtat
ctctctcctcgcggatcgagcaagaaggcgcaccaagggagtatgagcgcaaactggtgtaaagcatctggcagcagctgatccatttctgaaggaactcaacaagctctcattcatccaaccccggacgcccatataagttgcggttgcagcaagctgcctcaatttaccccgtctctaattgtgattc
gtgccgaattaacaagatcacacgagatctaagctctacgtactcttatgcacgaatataatgggagagggaaagctcacgagcttcagagtcgagaagctcttcttcttgcggcggcaggggcttccaccgtactattctagcacgcctagcgatgtgtcatgtaatctgtgggatgttttgaaaataa
601201802403003604204805406006607207808409009601020108011401161<211> 244<212> PRT
<213> Triticum aestivum <400> 123 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe 35 40 45 Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser Cys Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Asn 130 135 140 Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln 165 170 175 Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln Thr Ser Ser 180 185 190 Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala Ala Ala Thr 195 200 205 Ser Ile His Pro Ala Ala Ala Gly Glu Arg Ala Gly Asp Ala Ala Val 210 215 220 Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp Met Val Ser225 230 235 240His Ile Asn Gly
<210> 124<211> 1210<212> DNA
<213> Triticum aestivum<4 00> 124
tccctctcct ccctctcttc cgcctcaccc aaccacctga cagccatggc tccgcccccc 60
cgcccccgcc tgcgcctgtc ggagtagccg tcgcggtctg ccggtgttgg aggcttgggg 120
tgtagggttg gccccgttct ccagcggaga tggggcgcgg gaaggtgcag ctgaagcgga 180
tcgagaacaa gatcaaccgg caggtgacct tctccaagcg ccgctcgggg ctgctcaaga 240
aggcgcacga gatctccgtg ctctgcgacg ccgaggtcgg cctcatcatc ttctccacca 300
agggaaagct ctacgagttc tccaccgagt catgtatgga caaaattctt gaacggtatg 360
agcgctactc ttatgcagaa aaggttctcg tttcaagtga atctgaaatt cagggaaact 420
ggtgtcacga atataggaaa ctgaaggcga aggttgagac aatacagaaa tgtcaaaagc 480
atctgatggg agaggatctt gaatctttga atctcaagga gttgcagcaa ctggagcagc 540
agctggaaag ctcactgaaa catatcagat ccaggaagaa ccaacttatg cacgaatcca 600
tttctgagct tcagaagaag gagaggtcac tgcaggagga gaataaagtt ctccagaagg 660
aactcgtcga gaagcagaag gcccaggcgg cgcaacaaga tcagactcag cctcaaacaa 720
gctcttcttc ttcttccttc atgatgaggg atgctccccc tgccgcaact accagcattc 780
atccagcggc atcaggagag agggcagagg atgcggcagt gcagccgcag gccccacccc 840
ggacggggct tccactgtgg atggttagcc acatcaacgg ctgaagggct tccagcccat 900
ataagcgtac tattcagtag agagtaacaa gttgcaccgg ccagcctggt gtatgttgcg 960
gttgctagca tgcctgaccc cttggagggg aaaggaaaag aaatcagagt aaagtagcaa 1020
gctgcagtga tgtgtatatt tcactttgtc cacctcagtt tccctcccag ctgggctcaa 1080
tttaccatgt aatctatatg tagcttgagt gatgaatttt caagtttcca tgatacccgt 1140
ctcgagcggg tgttgtttat gtgaattaac ctatcaaata tgagcattgt gtaaaaaaaa 1200
aaaaaaaaaa 1210<210> 125<211> 244<212> PRT
<213> Triticum aestivum<400> 125
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn
1 5 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75
Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His
85 90
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val
165 170
Lys Ala Gln Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln
180 185
Ser Ser Ser Ser Phe Met Met Arg Asp Ala Pro Pro Ala195 200 205
Ser Ile His Pro Ala Ala Ser Gly Glu Arg Ala Glu Asp
210 215 220
Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Leu Trp225 230 235
His Ile Asn Gly
Lys Ile Asn15
Lys Lys Ala30
Ile Ile Phe
Cys Met Asp
Lys Val Leu80
Glu Tyr Arg95
Lys His Leu110
Gln Gln Leu
Arg Lys Asn
Glu Arg Ser160
Glu Lys Gln
175Thr Ser Ser190
Ala Thr Thr
Ala Ala Val
Met Val Ser240
<210> 126<211> 735<212> DNA<213> Triti<4 00> 126atggggcgcgttctccaagcgccgaggtcgtcatgtatgggtttcaagtgaaggttgagaaatctcaaggtccaggaagactgcaggagggcgcagcaaggatgctccccgatgcggcagcacatcaacg<210> 127<211> 244<212> PRT<213> Triti<4 00> 127Met Gly Arg1
Arg Gln Val
cum monococcum
ggaaggtgcagccgctcggggcctcatcatacaaaattctaatctgaaatcaatacagaaagttgcagcaaccaacttatagaataaagtatcaaactcactgccgcaaatgcagccgcaggtga
gctgaagcgggcttctcaagcttctccacctgaacggtattcagggaaacatgtcaaaaaactggagcaggcacgaatcctctccagaaggcctcaaacctaccagcattggccccaccc
atcgagaacaaaggcgcacgaagggaaagcgagcgctatttggtgtcacgcatctcatggcagctggaaaatttctgagcgaactcgtggagctcttcttcatccagcggcggacggggc
cum monococcum
Gly Lys Val Gln Leu Lys Arg Ile
5 10
Thr Phe Ser Lys Arg Arg Ser Gly20 25
agatcaaccgagatctccgttctacgagttcttatgcagaaatataggaagagaggatctgctcactgaatgcagaagaaagaagcagaacttcttccttcggcaggcgattccaccgtg
gcaggtgaccgctctgcgacctccaccgagaaaggttctcactgaaggcgtgaatctttgacatatcagaggagaggtcaggcccatgcgcatgctgagggagggcagaggatggtgagc
Glu Asn Lys Ile Asn15
Leu Leu Lys Lys Ala30
60120180240300360420480540600660720735His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr Glu Ser
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu65 70 75
Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp Cys His
85 90
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys145 150 155
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val
165 170
Lys Ala His Ala Ala Gln Gln Asp Gln Thr Gln Pro Gln
180 185
Ser Ser Ser Ser Phe Met Leu Arg Asp Ala Pro Pro Ala195 200 205
Ser Ile His Pro Ala Ala Ala Gly Glu Arg Ala Glu Asp
210 215 220
Gln Pro Gln Ala Pro Pro Arg Thr Gly Leu Pro Pro Trp225 230 235
His Ile Asn Gly
Ile Ile Phe
Cys Met Asp
Lys Val Leu80
Glu Tyr Arg95
Lys His Leu110
Gln Gln Leu
Arg Lys Asn
Glu Arg Ser160
Glu Lys Gln
175Thr Ser Ser190
Ala Asn Thr
Ala Ala Val
Met Val Ser240
<210> 128<211> 735<212> DNA
<213> Triticum aestivum<4 00> 128
atggggcggg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccgctcggg gcttctcaag aaggcgcacggccgaggtcg gcctcatcat cttctccacc aagggaaagctcatgtatgg acaaaattct tgaacggtat gagcgctattgtttcaagtg aatctgaaat tcagggaaac tggtgtcacgaaggttgaga caatacagaa atgtcaaaag catctcatggaatctcaagg agttgcagca actggagcag cagctggaaatccaggaaga accaacttat gcacgaatcc atttctgagcctgcaggagg agaataaagt tctccagaag gaactcgtgggcgcagcaag atcaaactca gcctcaaacc agctcttcatgatgctcccc ctgccgcaaa taccagcatt catccagcgggatgcggcag tgcagccgca ggccccaccc cggacggggccacatcaacg ggtga<210> 129<211> 244<212> PRT
<213> Triticum aestivum<400> 129
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ser Thr
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Val Ser Ser Glu Ser Glu Ile Gln Gly Asn Trp85 90
agatcaaccgagatctccgttctacgagttcttatgcagaaatataggaagagaggatctgctcactgaattcagaagaaagaagcagaacttcttccttcaacaggcgattccaccgtg
gcaggtgaccgctctgcgacctccaccgagaaaggttctcactgaaggcgtgaatctttgacatatcagaggagaggtcaggcccatgcgcatgctgagggagggcagaggatggtgagc
Glu Asn Lys Ile Asn15
Leu Leu Lys Lys Ala30
Gly Leu Ile Ile Phe45
Glu Ser Cys Met Asp60
Ala Glu Lys Val Leu80
Cys His Glu Tyr Arg95
60120180240300360420480540600660720735Lys Leu Lys
Met Gly Glu115
Glu Gln Gln
130Gln Leu Met145
Leu Gln Glu
Lys Ala His
Ser Ser Ser195
Ser Ile His210Gln Pro Gln225
His Ile Asn
Ala Lys100
Asp Leu
Leu Glu
His Glu
Glu Asn165Ala Ala180
Ser PhePro AlaAla ProGly
Val Glu Thr
Glu Ser Leu120
Ser Ser Leu
135Ser Ile Ser150
Lys Val Leu
Gln Gln Asp
Met Leu Arg200
Ala Thr Gly
215Pro Arg Thr230
Ile Gln Lys105
Asn Leu Lys
Lys His Ile
Glu Leu Gln155
Gln Lys Glu
170Gln Thr Gln185
Asp Ala Pro
Glu Arg Ala
Gly Leu Pro235
Cys Gln
Glu Leu125Arg Ser140
Lys Lys
Leu Val
Pro Gln
Pro Ala205Glu Asp220
Pro Trp
Lys His Leu110
Gln Gln Leu
Arg Lys Asn
Glu Arg Ser160
Glu Lys Gln
175Thr Ser Ser190
Ala Asn Thr
Ala Ala Val
Met Val Ser240
<210> 130<211> 738<212> DNA
<213> Lolium perenne<4 00> 130
atggggcgcg gcaaggtgca gctcaagcgg atcgagaacattctccaagc gccgctcggg gctgctcaag aaggcgcacggccgaggtcg ggctcatcat cttctccacc aagggaaagctcatgtatgg acaaaattct tgagcggtat gagcgctactatttcaaccg aatctgaaat tcagggaaac tggtgtcatgaaggttgaga caatacagag atgtcaaaag catctaatggaatctcaagg agttgcagca actagagcag cagctggaaagccagaaaga accagcttat gcacgaatcc atatctgagcctgcaggagg agaataaaat tctccagaag gaactcatagcagcaagcgc agtgggagca aactcagccc caaaccagctatgggggaag ctaccccagc aacaaattgc agtaatccccgcagaggatg cgacggggca gccttcagct cgcacggtgccacatcaaca atggctga<210> 131<211> 245<212> PRT
<213> Lolium perenne<400> 131
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr
50 55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys
115 120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130 135
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln145 150 155
agatcaaccgagatctccgttctacgagttcctatgcagaaatataggaagagaggatctgttcactgaattcaaaagaaagaagcagaacttcctcctccagcagcggcttccaccatg
ccaggtcaccgctctgcgaccgcaaccgacgaaagtgctcactgaaggcgtgaatcattgacatattagaggagaggtcaggcccacacgctcctttatgcagcgacagagatggtgagt
Glu Asn
Leu Leu
Gly Leu
45Asp Ser60
Ala Glu
Cys His
Cys Gln
Glu Leu125Arg Ala140
Lys Lys
Lys Ile
15Lys Lys30
Ile Ile
Cys Met
Lys Val
Glu Tyr
95Lys His110
Gln GlnArg LysGlu Arg
Asn
Ala
Phe
Asp
Leu80Arg
Leu
Leu
Asn
Ser160
60120180240300360420480540600660720738Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln
165 170 175
Lys Ala His Thr Gln Gln Ala Gln Trp Glu Gln Thr Gln Pro Gln Thr
180 185 190
Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr
195 200 205
Asn Cys Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala
210 215 220
Thr Gly Gln Pro Ser Ala Arg Thr Val Leu Pro Pro Trp Met Val Ser225 230 235 240
His Ile Asn Asn Gly245
<210> 132<211> 738<212> DNA
<213> Lolium temulentum<4 00> 132
atggggcgcg gcaaggtgca gctcaagcgg atcgagaaca agatcaaccg ccaggtcacc 60
ttctccaagc gccgctcagg cctgctcaag aaggcgcacg agatctccgt gctctgcgac 120gcagaggtcg ggctcatcat cttctçcacc aagggaaagc tctacgagtt cgccaccgac 180tcatgtatgg acaaaattct tgagcggtat gagcgctact cctatgcaga gaaagtgctc 240atttcaactg aatctgaaat tcagggaaac tggtgtcatg aatataggaa actgaaggcg 300aaggttgaga caatacagag atgtcaaaag catctaatgg gagaggatct tgaatcattg 360aatctcaagg agttgcagca actagagcag cagctggaaa gttcactgaa acatattaga 420tccagaaaga gccagcttat gcacgaatcc atatctgagc ttcaaaagaa ggagaggtca 480ctgcaagagg agaataaaat tctccagaag gaactcatag agaagcagaa ggcccacacg 540cagcaagcgc agttggagca aactcagccc caaaccagct cttcctcctc ctcctttatg 600atgggggaag ctaccccagc aacaaatcgc agtaatcccc cagcagcggc cagcgacaga 660gcagaggatg cgacggggca gcctccagct cgcacggtgc ttccaccatg gatggtgagt 720cacctcaaca atggctga 738
<210> 133<211> 245<212> PRT
<213> Lolium temulentum<4 00> 133
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn15 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala
20 25 30
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Phe Ala Thr Asp Ser Cys Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80
Ile Ser Thr Glu Ser Glu Ile Gln Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Arg Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser
130 135 140
Gln Leu Met His Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ile Glu Lys Gln
165 170 175
Lys Ala His Thr Gln Gln Ala Gln Leu Glu Gln Thr Gln Pro Gln Thr
180 185 190
Ser Ser Ser Ser Ser Ser Phe Met Met Gly Glu Ala Thr Pro Ala Thr
195 200 205
Asn Arg Ser Asn Pro Pro Ala Ala Ala Ser Asp Arg Ala Glu Asp Ala210 215 220Thr Gly Gln Pro Pro Ala Arg Thr Val Leu Pro225 230 235
His Leu Asn Asn Gly245
<210> 134<211> 738<212> DNA<213> Zea mays<400> 134
atggggcgcg ggaaggtgca gctgaagcgg atcgagaacattctccaagc gccgctcggg gctgctcaag aaggcgcacggccgaggtcg cgctcatcat cttctccacc aaagggaagctcatgtatgg acaaaattct tgaccggtac gagcgctactatttcagcag aatctgaaac tcagggcaat tggtgccacgaaggtcgaga caatacaaaa atgtcaaaag cacctcatggaatctcaaag agcttcagca actagagcag cagctggagaaccaggaaga accaacttat gctcgagtca atttcggagcctgcaggagg agaacaaggt tctgcagaag gagctcgcggaagcaagtgc aatggggcca aacccaacag cagaccagttataagggaag ctgccccaac aacaaatatc agcatttttcttggtggaag gtgcagcagc gcagccacag gctcgcgttgagccacctga gcagctga
<210> 135
<211> 245
<212> PRT
<213> Zea mays
<400> 135
Pro Trp Met Val Ser240
agatcaaccgagatctccgttctacgagtacctatgcagaagtatagaaagagaggatctgttcactgaatccaacggaaagaagcagaacgtcttcctcctgtggcagcgactaccacc
ccaggtgaccgctctgcgacttccaccgataaaggttcttactaaaggcgtgaaacgttgacatatcagaggagaagtcgagcccagcgggtgcttcgtgaggcgggaggatggatgctt
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10 Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly 20 25 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val 35 40 Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ser Thr 50 55 Lys Ile Leu Asp Arg Tyr Glu Arg Tyr Ser Tyr65 70 75Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp 85 90 Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys 100 105 Met Gly Glu Asp Leu Glu Thr Leu Asn Leu Lys 115 120 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile 130 135 Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln145 150 155Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu 165 170 Lys Ala Gln Arg Lys Gln Val Gln Trp Gly Gln 180 185 Ser Ser Ser Ser Ser Cys Phe Val Ile Arg Glu
195 200
Asn Ile Ser Ile Phe Pro Val Ala Ala Gly Gly
210 215
Ala Ala Ala Gln Pro Gln Ala Arg Val Gly Leu225 230 235
Ser His Leu Ser Ser245
<210> 136<211> 738<212> DNA<213> Zea mays
Glu Asn
Leu Leu
Ala Leu45
Asp Ser60
Ala Glu
Cys His
Cys Gln
Glu Leu125Arg Thr140
Arg Lys
Leu Ala
Thr Gln
Ala Ala205Arg Leu220
Pro Pro
Lys Ile Asn15
Lys Lys Ala30
Ile Ile Phe
Cys Met Asp
Lys Val Leu80
Glu Tyr Arg95
Lys His Leu110
Gln Gln Leu
Arg Lys Asn
Glu Lys Ser160
Glu Lys Gln
175Gln Gln Thr190
Pro Thr Thr
Val Glu Gly
Trp Met Leu240
60120180240300360420480540600660720738<400> 136
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccgttctccaagc gccgctcggg gctactcaag aaggcgcacg agatctccgtgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagtatcatgtatgg acaaaattct tgaacggtat gagcgctact cctatgcagaatttccgcag aatatgaaac tcagggcaat tggtgccatg aatatagaaaaaggtcgaga caatacagaa atgtcaaaag cacctcatgg gagaggatctaatctcaaag agcttcagca actagagcag cagctggaga gttcactgaaacaaggaaga gccagcttat ggtcgagtca atttcagcgc tccaacggaactgcaggagg agaacaaggt tctgcagaag gagctcgcgg agaagcagaacagcaagtgc aacgggacca aactcaacag cagaccagtt cgtcttccacttaagggaag ctgccccaac aacaaatgtc agcatcttcc ctgtggcagcgtggtggaag gggcagcagc gcagccgcag gctcgcgttg gactgccaccagccatctga gctgctga<210> 137<211> 245<212> PRT<213> Zea mays<400> 137
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn1 5 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
40
ccaggtgacagctctgcgacctctaccgataaaggttctcactaaaggcgtgaaactttgacatatcagaggagaagtcaagaccagcgggtccttcatgaggcgggaggatggatgctt
35
Ala Leu45
Lys Ile
15Lys Lys30
Ile Ile
AsnAla
Phe
Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ser Thr Asp Ser Cys Met Asp
50
55
60
Leu80Arg
Leu
Leu
Ser
Ser160Gln
Thr
Thr
Gly
Leu240
<211> 762<212> DNA
<213> Oryza sativa<4 00> 138
atggggcggg gcaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgaccttctccaagc gcaggtcggg gctgctcaag aaggcgaatg agatctccgt gctctgcgacgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagta cgccaccgactcatgtatgg acaaaatcct tgaacgttat gagcgctact cctatgcaga aaaggtccttatttcagctg aatctgacac tcagggcaac tggtgccacg aatataggaa actgaaggctaaggttgaga caatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttgaatctcaaag agctgcagca gctggagcag cagctggaaa attcgttgaa acatatcaga
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val65 70 75 Ile Ser Ala Glu Tyr 85 Glu Thr Gln Gly Asn 90 Trp Cys His Glu Tyr 95Lys Leu Lys Ala 100 Lys Val Glu Thr Ile 105 Gln Lys Cys Gln Lys 110 HisMet Gly Glu 115 Asp Leu Glu Thr Leu 120 Asn Leu Lys Glu Leu 125 Gln GlnGlu Gln 130 Gln Leu Glu Ser Ser 135 Leu Lys His Ile Arg 140 Thr Arg LysGln Leu Met Val Glu Ser Ile Ser Ala Leu Gln Arg Lys Glu Lys145 150 155 Leu Gln Glu Glu Asn 165 Lys Val Leu Gln Lys 170 Glu Leu Ala Glu Lys 175Lys Asp Gln Arg 180 Gln Gln Val Gln Arg 185 Asp Gln Thr Gln Gln 190 GlnSer Ser Ser 195 Ser Thr Ser Phe Met 200 Leu Arg Glu Ala Ala 205 Pro ThrAsn Val 210 Ser Ile Phe Pro Val 215 Ala Ala Gly Gly Arg 220 Val Val GluAla Ala Ala Gln Pro Gln Ala Arg Val Gly Leu Pro Pro Trp Met225 230 235 Ser His Leu Ser Cys 245 <210> 138
60120180240300360420480540600660720738
60120180240300360420tccagaaaga gccaactaat gctcgagtcc attaacgagc ttcaacggaa ggaaaagtca
ctgcaggagg agaataaggt cctacagaaa gaaaaccctt gctccttcct acagctggtg
gagaagcaga aagtccagaa gcaacaagtg caatgggacc agacacaacc tcaaacaagt
tcctcatcat cctccttcat gatgagggaa gcccttccaa caactaatat cagtaactac
cctgcagcag ctggcgaaag gatagaggat gtagcagcag ggcagccaca gcatgttcgc
attgggctgc caccatggat gctgagccac atcaacggct aa<210> 139<211> 253<212> PRT
<213> Oryza sativa <4 00> 139 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Ser Gly Leu Leu Lys 30 Lys AlaAsn Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Ala Leu 45 Ile Ile PheSer Thr 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Cys Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser 85 Asp Thr Gln Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Val Glu Thr Ile 105 Gln Lys Cys Gln Lys 110 His LeuMet Gly Glu 115 Asp Leu Glu Ser Leu 120 Asn Leu Lys Glu Leu 125 Gln Gln LeuGlu Gln 130 Gln Leu Glu Asn Ser 135 Leu Lys His Ile Arg 140 Ser Arg Lys SerGln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160Leu Gln Glu Glu Asn 165 Lys Val Leu Gln Lys 170 Glu Asn Pro Cys Ser 175 PheLeu Gln Leu Val 180 Glu Lys Gln Lys Val 185 Gln Lys Gln Gln Val 190 Gln TrpAsp Gln Thr 195 Gln Pro Gln Thr Ser 200 Ser Ser Ser Ser Ser 205 Phe Met MetArg Glu 210 Ala Leu Pro Thr Thr 215 Asn Ile Ser Asn Tyr 220 Pro Ala Ala AlaGly Glu Arg Ile Glu Asp Val Ala Ala Gly Gln Pro Gln His Val Arg225 230 235 240Ile Gly Leu Pro Pro 245 Trp Met Leu Ser His 250 Ile Asn Gly
<210> 140
<211> 741
<212> DNA
<213> Oryza sativa
<400> 140
atggggcggg gcaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaggtgaccttctccaagc gcaggtcaaa actgctcaag aaggcgaatg agatctccgt gctctgcgacgccgaggtcg cgctcatcat cttctccacc aagggcaagc tctacgagta cgccaccgactcatgtatgg acaaaatcct tgaacgttat gagcgctact cctatgcaga aaaggtccttatttcagctg aatctgacac tcagggcaac tggtgccacg aatataggaa actgaaggctaaggttgaga caatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttgaatctcaaag agctgcagca gctggagcag cagctggaaa attcgttgaa acatatcagatccagaaaga gccaactaat gctcgagtcc attaacgagc ttcaacggaa ggaaaagtcactgcaggagg agaataaggt cctacagaaa gaactggtgg agaagcagaa agtccagaagcaacaagtgc aatgggacca gacacaacct caaacaagtt cctcatcatc ctccttcatgatgagggaag cccttccaac aactaatatc agtaactacc ctgcagcagc tggcgaaaggatagaggatg tagcagcagg gcagccacag catgaacgca ttgggctgcc accatggatgctgagccaca tcaacggcta a<210> 141<211> 246
480540600660720762
60120180240300360420480540600660720741<212> PRT
<213> Oryza sativa<4 00> 141
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Lys Leu Leu Lys Lys Ala
20 25 30
Asn Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Ile Phe
35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80
Ile Ser Ala Glu Ser Asp Thr Gln Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Leu Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Asn Ser Leu Lys His Ile Arg Ser Arg Lys Ser
130 135 140
Gln Leu Met Leu Glu Ser Ile Asn Glu Leu Gln Arg Lys Glu Lys Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln
165 170 175
Lys Val Gln Lys Gln Gln Val Gln Trp Asp Gln Thr Gln Pro Gln Thr
180 185 190
Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr
195 200 205
Asn Ile Ser Asn Tyr Pro Ala Ala Ala Gly Glu Arg Ile Glu Asp Val
210 215 220
Ala Ala Gly Gln Pro Gln His Glu Arg Ile Gly Leu Pro Pro Trp Met225 230 235 240
Leu Ser His Ile Asn Gly245
<210> 142<211> 735<212> DNA
<213> Dendrocalamus Iatiflorus<4 00> 142
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaagtgact 60
ttctccaagc gccggtcggg gctgctcaag aaggcgcatg agatctccgt cctctgcgac 120gccgaggtcg gccttatcat cttctccacc aagggcaagc tctacgagta cgccaccgac 180tcatgtatgg acaaaattct tgaacggtac gagcgttact cctatgcaga aaaggttctt 240atttcagccg aatctgaaac tcagggcaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga cgatacagaa atgtcaaaag cacctcatgg gagaggatcc tgaatctttg 360aatctcaagg agctgcagca actcgagcag cagctggaaa gttcagtgaa acatatcaga 420tccagaaaga gccagcttat gctcgagtcc atttccgagc ttcaaaagaa ggagaagtca 480ctgcaggagg agaacaaggt tctgcagaag gaactcgtgg agaagcagca ggtccataaa 540cggttagtgc aatgggacca aactcagccg caaactagtt cctcttcctc gtccttcatg 600atgagggaag ctctcccaac aacaaatatc agtatttacg ctgcggcagc cggcgagagg 660gcagaggacg cagcagggca gcctcagatt cacattgggc tgccgccatg gatggtgagc 720cacatcaacg gctaa 735
<210> 143<211> 244<212> PRT
<213> Dendrocalamus latiflorus<4 00> 143
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn15 10 15
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala
20 25 30
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Gly Leu Ile Ile Phe35 40 45
Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Cys Met Asp
50 55 60
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80
Ile Ser Ala Glu Ser Glu Thr Gln Gly Asn Trp Cys His Glu Tyr Arg
85 90 95
Lys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His Leu
100 105 110
Met Gly Glu Asp Pro Glu Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu
115 120 125
Glu Gln Gln Leu Glu Ser Ser Val Lys His Ile Arg Ser Arg Lys Ser
130 135 140
Gln Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Lys Ser145 150 155 160
Leu Gln Glu Glu Asn Lys Val Leu Gln Lys Glu Leu Val Glu Lys Gln
165 170 175
Gln Val His Lys Arg Leu Val Gln Trp Asp Gln Thr Gln Pro Gln Thr
180 185 190
Ser Ser Ser Ser Ser Ser Phe Met Met Arg Glu Ala Leu Pro Thr Thr
195 200 205
Asn Ile Ser Ile Tyr Ala Ala Ala Ala Gly Glu Arg Ala Glu Asp Ala
210 215 220
Ala Gly Gln Pro Gln Ile His Ile Gly Leu Pro Pro Trp Met Val Ser225 230 235 240
His Ile Asn Gly
<210> 144<211> 735<212> DNA
<213> Dendrocalamus latiflorus<4 00> 144
atggggcgcg ggaaggtgca gctgaagcgg atcgagaaca agatcaaccg gcaagtgact 60
ttctccaagc gccggtcggg gctgctcaag aaggcgcatg agatctccgt cctctgcgac 120gccgaggtcg gccttatcat cttctccacc aagggcaagc tctacgagta cgccaccgac 180tcatgtatgg acaaaattct tgaacggtac gagcgttact cctatgcaga aaaggttctt 240atttcagccg aatctgaaac tcagggcaac tggtgtcacg aatataggaa actgaaggcg 300aaggttgaga cgatacagaa atgtcaaaag cacctcatgg gagaggatct tgaatctttg 360aatctcaagg agctgcagca actcgagcag cagctggaaa gttcagtgaa acatatcaga 420tccagaaaga gccagcttat gctcgagtcc atttccgagc ttcaaaagaa ggagaagtca 480ctgcaggagg agaacaaggt tctgcagaag gaactcgtgg agaagcagca ggtccataaa 540cggttagtgc aatgggacca aactcagccg caaactagtt cctcttcctc gtccttcatg 600atgagggaag ctctcccaac aacaaatatc agtatttacg ctgcggcagc cggcgagagg 660gcagaggacg cagcagggca gcctcagatt cacattgggc tgccgccatg gatggtgagc 720cacatcaacg gctaa 735
<210> 145<211> 244<212> PRT
<213> Dendrocalamus latiflorus<4 00> 145
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Ser Gly Leu Leu Lys 30 Lys AlaHis Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Gly Leu 45 Ile Ile PheSer Thr 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Cys Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Val Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Thr Gln Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala Lys Val Glu Thr Ile Gln Lys Cys Gln Lys His LeuMet
Glu
Gln145Leu
Gln
Ser
Asn
Ala225His
Gly
Gln130Leu
Gln
Val
Ser
Ile210Gly
Ile
100Glu Asp Leu115
Gln Leu Glu
Met Leu Glu
Glu Glu Asn165
His Lys Arg180Ser Ser Ser195
Ser Ile TyrGln Pro GlnAsn Gly
Glu Ser
Ser Ser135Ser Ile150
Lys Val
Leu Val
Ser Phe
Ala Ala215Ile His230
105
Leu Asn Leu120
Val Lys His
Ser Glu Leu
Leu Gln Lys170
Gln Trp Asp185
Met Met Arg200
Ala Ala GlyIle Gly Leu
Lys Glu
Ile Arg140Gln Lys155
Glu Leu
Gln Thr
Glu Ala
Glu Arg220Pro Pro235
110Leu Gln125
Ser Arg
Lys Glu
Val Glu
Gln Pro190Leu Pro205
Ala GluTrp Met
Gln Leu
Lys Ser
Lys Ser160Lys Gln175
Gln Thr
Thr Thr
Asp Ala
Val Ser240
<210> 146<211> 813<212> DNA<213> Zea mays<4 00> 146
atggggcgcg gcaaggtgca gctgaagcgg atagagaaca agataaaccg gcaggtgacc 60
ttctccaagc gccggaacgg gctgctgaag aaggcgcacg agatctccgt cctctgcgac 120gccgaggtcg ccgtcatcgt cttctccccc aagggcaagc tctacgagta cgcctccgac 180tcccgcatgg acaaaattct agaacgttat gagcgatatt cctatgctga aaaggctctt 240atttcagctg aatctgaaag tgagggaaat tggtgccacg aatacaggaa actgaaggcc 300aaaattgaga ccatacaaag atgccacaag cacctgatgg gagaggatct agagtctttg 360aatccaaaag agctccaaca actagagcag cagctggaga gctcactgaa gcacatcaga 420tcaagaaaga gccaccttat ggccgagtca atttctgagc tacagaagaa ggagaggtca 480ctgcaggagg agaacaagat tctacagaag gaactttcag agaggcagaa ggcggtcgct 540agccggcagc agcagcagca gcaggtgcag tgggaccagc agacacaggt ccaggtccag 600acaagctcat cgtcttcttc cttcatgatg aggcaggatc agcagggact gccacctcca 660caaaacatct gcttcccgcc gttgagcatc ggagagagag gcgaagaggt ggctgcggcg 720gcgcagcagc agctgcctcc tccggggcag gcgcaaccac agctccgcat cgcaggtctg 780ccgccatgga tgctgagcca cctcaatgca taa 813
<210> 147<211> 270<212> PRT<213> Zea mays<4 00> 147
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile
Glu Asn
Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu
10
20
25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35
40
Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Ser
50
55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr
65 70 75
Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Arg
100 105
Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys
115
120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130
135
His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln
Ala Val45
Asp Ser60
Ala Glu
Cys His
Cys His
Glu Leu125Arg Ser140
Lys Lys
145
150
155
Lys Ile Asn15
Lys Lys Ala30
Ile Val Phe
Arg Met Asp
Lys Ala Leu80
Glu Tyr Arg95
Lys His Leu110
Gln Gln Leu
Arg Lys Ser
Glu Arg Ser160Leu Gln Glu Glu Asn Lys Ile Leu Gln Lys Glu Leu Ser Glu Arg Gln
165 170 175
Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln Gln Val Gln Trp Asp
180 185 190
Gln Gln Thr Gln Val Gln Val Gln Thr Ser Ser Ser Ser Ser Ser Phe
195 200 205
Met Met Arg Gln Asp Gln Gln Gly Leu Pro Pro Pro Gln Asn Ile Cys
210 215 220
Phe Pro Pro Leu Ser Ile Gly Glu Arg Gly Glu Glu Val Ala Ala Ala225 230 235 240
Ala Gln Gln Gln Leu Pro Pro Pro Gly Gln Ala Gln Pro Gln Leu Arg
245 250 255
Ile Ala Gly Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265 270
<210> 148<211> 689<212> DNA
<213> Sorghum bicolor<4 00> 148
gcaaggtgca gctcaagcgg atagagaaca agataaaccg gcaggtgacc ttctccaagc 60
gccgcaacgg gctgctcaag aaggcgcacg agatctccgt cctctgcgac gccgaggtcg 120ccgtcatcgt cttctccccc aagggcaagc tctatgagta cgccaccgac tcccgcatgg 180acaaaattct cgaacgttat gagcgatatt cctatgctga aaaggctctt atttcagctg 240aatctgaaag tgagggaaac tggtgccacg aatacaggaa actgaaggcc aaaattgaga 300ccattcaaaa atgccacaag cacctgatgg gagaggatct agagtctttg aatcccaaag 360agctccaaca actagagcag cagctggaga gctcactgaa gcacatcaga tcaagaaaga 420gccaccttat ggctgagtct atttctgaac tacagaagaa ggagaggtca ctgcaggagg 480agaacaaggc tctacagaag gaacttgcgg agaggcagaa ggcggccgcg agcaggcagc 540agcagcaagg tgcagtggga ccagcagaca cagacccagg cccagacaag ctcatcatcg 600tcctccttca tgatgaggca ggatcagcag ggtctgccgc ctccacaaaa catatgcttc 660ccgccgctga taatcggaga gagaggtga 689
<210> 149<211> 228<212> PRT
<213> Sorghum bicolor<4 00> 149
Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn Arg Gln Val Thr15 10 15
Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala His Glu Ile Ser
20 25 30
Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe Ser Pro Lys Gly
35 40 45
Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp Lys Ile Leu Glu
50 55 60
Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Ile Ser Ala Glu65 70 75 80
Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg Lys Leu Lys Ala
85 90 95
Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu Met Gly Glu Asp
100 105 110
Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu
115 120 125
Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser His Leu Met Ala
130 135 140
Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser Leu Gln Glu Glu145 150 155 160
Asn Lys Ala Leu Gln Lys Glu Leu Ala Glu Arg Gln Lys Ala Ala Ala
165 170 175
Ser Arg Gln Gln Gln Gln Gly Ala Val Gly Pro Ala Asp Thr Asp Pro
180 185 190
Gly Pro Asp Lys Leu Ile Ile Val Leu Leu His Asp Glu Ala Gly Ser
195 200 205
Ala Gly Ser Ala Ala Ser Thr Lys His Met Leu Pro Ala Ala Asp Asn210 215 220
Arg Arg Glu Arg225
<210> 150<211> 822<212> DNA<213> Zea mays<400> 150
atggggcgcg gcaaggtaca gctgaagcgg atagagaaca agataaaccg gcaggtgacc 60
ttctccaagc gccggaacgg cctgctcaag aaggcgcacg agatctccgt cctctgcgat 120gccgaggtcg ccgtcatcgt cttctccccc aagggcaagc tctacgagta cgccaccgac 180tcccgcatgg acaaaattct tgaacgctat gagcgatatt cctatgctga aaaggctctt 240atttcagctg aatctgaaag tgagggaaat tggtgccacg aatacaggaa actgaaggcc 300aaaattgaga ccatacaaaa atgccacaag cacctgatgg gagaggatct agagtctttg 360aatcccaaag agctccagca actagagcag cagctggata gctcactgaa gcacatcaga 420tcaaggaaga gccaccttat ggccgagtct atttctgagc tacagaagaa ggagaggtca 480ctgcaggagg agaacaaggc tctgcagaag gaacttgcgg agaggcagaa ggccgtcgcg 54 0agccggcagc agcagcaaca gcagcaggtg cagtgggacc agcagacaca tgcccaggcc 600cagacaagct catcatcgtc ctccttcatg atgaggcagg atcagcaggg actgccgcct 660ccacacaaca tctgcttccc gccgttgaca atgggagata gaggtgaaga gctggctgcg 720gcggcggcgg cgcagcagca gcagccactg ccggggcagg cgcaaccgca gctccgcatc 780gcaggtctgc caccatggat gctgagccac ctcaatgcat aa 822
<210> 151<211> 273<212> PRT
<213> Zea mays <4 00> 151 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Arg Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Ser Leu Asn Pro Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Asp Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Ala Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Ala Glu Arg Gln 165 170 175 Lys Ala Val Ala Ser Arg Gln Gln Gln Gln Gln Gln Gln Val Gln Trp 180 185 190 Asp Gln Gln Thr His Ala Gln Ala Gln Thr Ser Ser Ser Ser Ser Ser 195 200 205 Phe Met Met Arg Gln Asp Gln Gln Gly Leu Pro Pro Pro His Asn Ile 210 215 220 Cys Phe Pro Pro Leu Thr Met Gly Asp Arg Gly Glu Glu Leu Ala Ala225 230 235 240Ala Ala Ala Ala Gln Gln Gln Gln Pro Leu Pro Gly Gln Ala Gln Pro 245 250 255 Gln Leu Arg Ile Ala Gly Leu Pro Pro Trp Met Leu Ser His Leu Asn 260 265 270 Ala<210> 152<211> 786<212> DNA
<213> Lolium temulentum<400> 152
atgggtcgcg gcaaggtgca gctgaagcgg atagagaaca agataaaccg tcaggtgaca 60
ttctccaagc gccgcaacgg gctactcaag aaggcgcacg agatctccgt cctctgcgac 120gccgaggtcg ccgtcgtcgt cttctccccg aaagggaagc tctatgagta cgccactgac 180tccagcatgg acaaaattct tgaacgttat gaacgctact cttatgctga aaaggctttg 240atttcagctg aatctgaaag tgagggaaat tggtgccatg aatacaggaa gctgaaggcg 300aagattgaga ctatacaaaa atgtcacaag cacctcatgg gggaggatct ggagtgtcta 360aacctgaaag agctccaaca actagagcag cagctggaga gttcattgaa gcacatcaga 420tcgagaaaga gccaccttat gatggagtcc atttctgagc tacagaagaa ggagcggtca 480ctccaggagg agaacaaggc tctacagaag gaactggtgg agaggcagaa ggcggccagg 54 0cagcagcagc aagagcagtg ggaccgtcag acccaaacac aacaagccca aaaccaacct 600caggcccaga cgagctcatc atcttcctcc ttcatgatga gggatcagca ggcccatgct 660caacaaaaca tctgttaccc gctggtgaca atgggtggag aggctgtggc cgcggcgcca 720gggcagcagg ggcagcttcg catcggaggc ctgccaccat ggatgctgag ccacctcaac 780gcttga 786
<210> 153<211> 261<212> PRT
<213> Lolium temulentum <4 00> 153 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Val Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Ser Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp Asp Arg Gln Thr Gln 180 185 190 Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln Thr Ser Ser Ser Ser 195 200 205 Ser Ser Phe Met Met Arg Asp Gln Gln Ala His Ala Gln Gln Asn Ile 210 215 220 Cys Tyr Pro Leu Val Thr Met Gly Gly Glu Ala Val Ala Ala Ala Pro225 230 235 240Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu Pro Pro Trp Met Leu 245 250 255 Ser His Leu Asn Ala 260 <210> 154
<211> 786<212> DNA
<213> Lolium perenne<4 00> 154atgggtcgcg gcaaggtgca gctgaagcgg atagagaaca
ttctccaagc gccgcaacgg gctactcaag aaggcgcacg
gccgaggtcg ccgtcgtcgt cttctccccg aaagggaagc
tccagcatgg acaaaattct tgaacgttat gaacgctact
atttcagctg aatctgaaag tgagggaaat tggtgccatg
aagattgaga ctatacaaaa atgtcacaag cacctcatgg
aacctgaaag agctccaaca actagagcag cagctggaga
tcgagaaaga gccaccttat gatggagtcc atttctgagc
ctccaggagg agaacaaggc tctacagaag gaactggtgg
cagcagcagc aagagcagtg ggaccgtcag acccaaacac
caggcccaga cgagctcatc atcttcctcc ttcatgatga
caacaaaaca tctgttaccc gccggtgaca atgggtggag
gggcagcagg ggcagcttcg catcggaggc ctgccaccatgcttga<210> 155<211> 261<212> PRT
<213> Lolium perenne<4 00> 155
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile
15 10Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly
20 25His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
agataaaccgagatctccgttctatgagtacttatgctgaaatacaggaagggaggatctgttcattgaatacagaagaaagaggcagaaaacaagcccagggatcagcaaggctgtggcggatgctgag
tcaggtgacccctctgcgaccgccactgacaaaggctttgactgaaggcgggagtgtctagcacatcagaggagcggtcaggcggccaggaaaccaacctggcccatgctcgcggcgccaccacctcaac
50
55
Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75
Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys
100 105
Met Gly Glu Asp Leu Glu Cys Leu Asn Leu Lys
115 120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130 135
His Leu Met Met Glu Ser Ile Ser Glu Leu Gln145 150 155
Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu
165 170
Lys Ala Ala Arg Gln Gln Gln Gln Glu Gln Trp
180 185
Thr Gln Gln Ala Gln Asn Gln Pro Gln Ala Gln
195 200
Ser Ser Phe Met Met Arg Asp Gln Gln Ala His
210 215
Cys Tyr Pro Pro Val Thr Met Gly Gly Glu Ala225 230 235
Gly Gln Gln Gly Gln Leu Arg Ile Gly Gly Leu
245 250
Ser His Leu Asn Ala260
<210> 156<211> 831<212> DNA
<213> Hordeum vulgare<4 00> 156
atgggtcgcg gtaaggtgca gctgaagcgg atagagaacattctccaagc gccgcaacgg gctcctgaag aaggcgcacggcagaggtcg ccgtcatcgt cttctccccc aaaggcaagctccagcatgg acaaaattct tgaacgttat gagcgctactatttcagctg aatctgaaag tgaggggaat tggtgtcatg
Glu Asn
Leu Leu
Ala Val45
Asp Ser60
Ala Glu
Cys His
Cys His
Glu Leu125Arg Ser140
Lys Lys
Leu Val
Asp Arg
Thr Ser205Ala Gln220
Val AlaPro Pro
Lys Ile
15Lys Lys30
Val Val
Ser Met
Lys Ala
Glu Tyr
95Lys His110
Gln Gln
Arg Lys
Glu Arg
Glu Arg175Gln Thr190
Ser Ser
Gln Asn
Ala Ala
Trp Met255
Asn
Ala
Phe
Asp
Leu80Arg
Leu
Leu
Ser
Ser160Gln
Gln
Ser
Ile
Pro240Leu
60120180240300360420480540600660720780786
agataaatcgagatctccgttctatgagtacttatgctgaaatacaggaa
gcaggtgacccctctgtgaccgccaccgacaaaggctcttacttaaggcg
60120180240300aagattgaga ccatacagaa gtgtcacaag cacctcatgg gagaggatct ggattctctgaacctcaaag aactccaaca actggagcag cagctggaga gttcattgaa gcacatcagatcgagaaaga gccatcttat gatggagtcc atttctgagc tacagaagaa ggagaggtcactgcaggagg agaacaaggc cctacagaag gaactggtgg agaggcagaa ggcggccagcaggcagcagc agctgcagca gcagcaacaa caacaacaaa tgcaatggga gcaccaagcccagacccaaa cccataccca tactcaaaac cagccccaag cccagactag ctcatcatcttcctctttca tgatgaggga tcagcaggcc catgcccctc aacagaacat ttgtagctacccaccggtga cgatgggtgg ggaggcgacg gcggcggcgg cggcgccgga gcagcaggctcagcttcgca tatgcctacc gccatggatg ctgagccacc tcaacgcttg a<210> 15.7<211> 276<212> PRT
<213> Hordeum vulgare<400> 157
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala 20 25 30 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Val Ile Val Phe 35 40 45 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr Asp Ser Ser Met Asp 50 55 60 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp Cys His Glu Tyr Arg 85 90 95 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys Cys His Lys His Leu 100 105 110 Met Gly Glu Asp Leu Asp Ser Leu Asn Leu Lys Glu Leu Gln Gln Leu 115 120 125 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile Arg Ser Arg Lys Ser 130 135 140 His Leu Met Met Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu Leu Val Glu Arg Gln 165 170 175 Lys Ala Ala Ser Arg Gln Gln Gln Leu Gln Gln Gln Gln Gln Gln Gln 180 185 190 Gln Met Gln Trp Glu His Gln Ala Gln Thr Gln Thr His Thr His Thr 195 200 205 Gln Asn Gln Pro Gln Ala Gln Thr Ser Ser Ser Ser Ser Ser Phe Met 210 215 220 Met Arg Asp Gln Gln Ala His Ala Pro Gln Gln Asn Ile Cys Ser Tyr225 230 235 240Pro Pro Val Thr Met Gly Gly Glu Ala Thr Ala Ala Ala Ala Ala Pro 245 250 255 Glu Gln Gln Ala Gln Leu Arg Ile Cys Leu Pro Pro Trp Met Leu Ser 260 265 270 His Leu Asn Ala
275<210> 158<211> 804<212> DNA<213> Oryza sativa<4 00> 158
atggggcggg ggaaggtgca gctgaagcgg atagagaact cgatgaaccg gcaggtgacgttctccaaga ggaggaatgg attgctgaag aaggcgcacg agatctccgt cctctgcgacgccgaggtcg ccgccatcgt cttctccccc aagggcaagc tctacgagta cgccactgactccaggatgg acaaaatcct tgaacgttat gagcgctatt catatgctga aaaggctcttatttcagctg aatctgagag tgagggaaat tggtgccatg aatacaggaa gcttaaggcaaagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatct agaatccctgaatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataagatcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca
360420480540600660720780831
60120180240300360420480ctgcaggagg agaacaaggc tctgcagaag gaactggtggggccagcagc aagtagggca gtgggaccaa acccaggtccccccaagccc agacaagctt cttcttcttc ttcatgctgatcaccacaaa atatctgcta cccgccggtg atgatgggcccggcggcggt ggcggcccaa ggccaggtgc aacttccgcaatgctgagca ccttcaaggc ttaa<210> 159<211> 267<212> PRT
<213> Oryza sativa<400> 159
agaggcagaaaggcccaggcgggatcagcaagagaaatgattggaggctt
gaatgtgaggccaagcccaaggcacttctttgcggcggcgtccgccatgg
Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile Glu Asn Ser Met Asn1 5 10 15 Arg Gln Val Thr 20 Phe Ser Lys Arg Arg 25 Asn Gly Leu Leu Lys 30 Lys AlaHis Glu Ile 35 Ser Val Leu Cys Asp 40 Ala Glu Val Ala Ala 45 Ile Val PheSer Pro 50 Lys Gly Lys Leu Tyr 55 Glu Tyr Ala Thr Asp 60 Ser Arg Met AspLys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu65 70 75 80Ile Ser Ala Glu Ser 85 Glu Ser Glu Gly Asn 90 Trp Cys His Glu Tyr 95 ArgLys Leu Lys Ala 100 Lys Ile Glu Thr Ile 105 Gln Lys Cys His Lys 110 His LeuMet Gly Glu 115 Asp Leu Glu Ser Leu 120 Asn Leu Lys Glu Leu 125 Gln Gln LeuGlu Gln 130 Gln Leu Glu Ser Ser 135 Leu Lys His Ile Arg 140 Ser Arg Lys SerHis Leu Met Leu Glu Ser Ile Ser Glu Leu Gln Lys Lys Glu Arg Ser145 150 155 160Leu Gln Glu Glu Asn 165 Lys Ala Leu Gln Lys 170 Glu Leu Val Glu Arg 175 GlnLys Asn Val Arg 180 Gly Gln Gln Gln Val 185 Gly Gln Trp Asp Gln 190 Thr GlnVal Gln Ala 195 Gln Ala Gln Ala Gln 200 Pro Gln Ala Gln Thr 205 Ser Phe PhePhe Phe 210 Phe Met Leu Arg Asp 215 Gln Gln Ala Leu Leu 220 Ser Pro Gln AsnIle Cys Tyr Pro Pro Val Met Met Gly Gln Arg Asn Asp Ala Ala Ala225 230 235 240Arg Arg Arg Trp Arg 245 Pro Lys Ala Arg Cys 250 Asn Phe Arg Ile Gly 255 GlyPhe Pro Pro Trp 260 Met Leu Ser Thr Phe 265 Lys Ala
<210> 160
<211> 804
<212> DNA
<213> Oryza sativa
<4 00> 160
atggggcggg ggaaggtgca gctgaagcgg atagagaaca agatcaacag gcaggtgacg
ttctccaaga ggaggaatgg attgctgaag aaggcgcacg agatctccgt cctctgcgac
gccgaggtcg ccgccatcgt cttctccccc aagggcaagc tctacgagta cgccactgac
tccaggatgg acaaaatcct tgaacgttat gagcgctatt catatgctga aaaggctctt
atttcagctg aatccgagag tgagggaaat tggtgccatg aatacaggaa acttaaggca
aagattgaga ccatacaaaa atgtcacaaa cacctcatgg gagaggatca tgaatccctg
aatctcaaag aactccaaca gctagagcag cagctggaga gttcattgaa gcacataata
tcaagaaaga gccaccttat gcttgagtcc atttccgagc tgcagaaaaa ggagaggtca
ctgcaggagg agaacaaggc tctgcagaag gaactggtgg agaggcagaa gaatgtgagg
ggccagcagc aagtagggca gtgggaccaa acccaggtcc aggcccaggc ccaagcccaa
ccccaagccc agacaagctc ctcctcctcc tccatgctga gggatcagca ggcacttctt
ccaccacaaa atatctgcta cccgccggtg atgatgggcg agagaaatga tgcggcggcg
gcggcggcgg tggcggcgca gggccaggtg caactccgca tcggaggtct tccgccatgg
540600660720780804
60120180240300360420480540600660720780atgctgagcc acctcaatgc ttaa<210> 161<211> 267<212> PRT
804
<213> Oryza sativa <400> 161 Met Gly Arg Gly Lys Val Gln Leu Lys Arg Ile1 5 10 Arg Gln Val Thr Phe Ser Lys Arg Arg Asn Gly 20 25 His Glu Ile Ser Val Leu Cys Asp Ala Glu Val 35 40 Ser Pro Lys Gly Lys Leu Tyr Glu Tyr Ala Thr 50 55 Lys Ile Leu Glu Arg Tyr Glu Arg Tyr Ser Tyr65 70 75Ile Ser Ala Glu Ser Glu Ser Glu Gly Asn Trp 85 90 Lys Leu Lys Ala Lys Ile Glu Thr Ile Gln Lys 100 105 Met Gly Glu Asp His Glu Ser Leu Asn Leu Lys 115 120 Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile 130 135 His Leu Met Leu Glu Ser Ile Ser Glu Leu Gln145 150 155Leu Gln Glu Glu Asn Lys Ala Leu Gln Lys Glu 165 170 Lys Asn Val Arg Gly Gln Gln Gln Val Gly Gln 180 185 Val Gln Ala Gln Ala Gln Ala Gln Pro Gln Ala
Glu Asn LysLeuAla
Asp60Ala
Cys
Cys
Glu
Ile140Lys
Leu
Trp
Gln
Leu Lys
30Ala Ile45
Ser Arg
195
200
Ser Ser Ser Met Leu Arg Asp Gln Gln Ala Leu Leu210 215 220
Ile Cys Tyr Pro Pro Val Met Met Gly Glu Arg Asn225 230 235
Ala Ala Ala Val Ala Ala Gln Gly Gln Val Gln Leu
245 250
Leu Pro Pro Trp Met Leu Ser His Leu Asn Ala260 265
<210> 162<211> 668<212> DNA
<213> Tradescantia virginiana<4 00> 162
gggctggtga agaaggctca tgagatctcd atkytrtgtgattttctcta ctaaaggcaa actatacgag tatgccactgcttgaacgct atgaacgtta ctcatatgct gagaaggcttttacagggaa attggtgcca agagtatgtt aaacttaaggaaaagccaaa ggcatcttat gggagagcaa ctagaagcgtcaactagagc atcaacttga aggttctttg aggcttgtcaatgttggact ccatttccga acttcagagg aaggaaaagtaacctagaga aggagatttt ggagaagcag aaagaaaaggtgggaacagc agaatcagcc actacaaagc actaattcgcgcagaaactc atccaacact aaacattgga aatttccaaggcagaagaaa gtctgcagcg tcagatgagg atcagcagcamttcacma<210> 163<211> 222<212> PRT
<213> Tradescantia virginiana<220>
<221> INSEGURO
Glu Lys
His Glu
His Lys110Leu Gln125
Ser Arg
Lys Glu
Val Glu
Asp Gln190Thr Ser205
Pro ProAsp AlaArg Ile
Ile Asn15
Lys Ala
Val Phe
Met Asp
Ala Leu80Tyr Arg95
His Leu
Gln Leu
Lys Ser
Arg Ser160Arg Gln175
Thr Gln
Ser Ser
Gln Asn
Ala Ala240Gly Gly255
atgcygaggtattccaaaattaacttcatcctaaggttgatggatctcaaggtcaagaaactctggaagactctggcacactccaaggccgtagaacaaagcctactgcc
tgcgcttattggaaaatatcagatcctgaaggccttacatagaattgcaggactcaaatggcaaaacaagccaagctcaccttcgtgatttaccgtccatmycmtggatg
60120180240300360420480540600660668<222> (11) .. (11)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>
<221> INSEGURO<222> (218) .. (218)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>
<221> INSEGURO<222> (221)..(221)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<4 00> 163
Gly Leu Val Lys Lys Ala His Glu Ile Ser Xaa Leu Cys Asp Ala Glu15 10 15
Val Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala
20 25 30 Thr Asp Ser 35 Lys Met Glu Asn Ile 40 Leu Glu Arg Tyr Glu 45 Arg Tyr SerTyr Ala 50 Glu Lys Ala Leu Thr 55 Ser Ser Asp Pro Glu 60 Leu Gln Gly AsnTrp Cys Gln Glu Tyr Val Lys Leu Lys Ala Lys Val Glu Ala Leu His65 70 75 80Lys Ser Gln Arg His 85 Leu Met Gly Glu Gln 90 Leu Glu Ala Leu Asp 95 LeuLys Glu Leu Gln 100 Gln Leu Glu His Gln 105 Leu Glu Gly Ser Leu 110 Arg LeuVal Arg Ser 115 Arg Lys Thr Gln Met 120 Met Leu Asp Ser Ile 125 Ser Glu LeuGln Arg 130 Lys Glu Lys Ser Leu 135 Glu Glu Gln Asn Lys 140 Asn Leu Glu LysGlu Ile Leu Glu Lys Gln Lys Glu Lys Ala Leu Ala His Gln Ala His145 150 155 160Trp Glu Gln Gln Asn 165 Gln Pro Leu Gln Ser 170 Thr Asn Ser Pro Pro 175 ArgPro Phe Val Ile 180 Ala Glu Thr His Pro 185 Thr Leu Asn Ile Gly 190 Asn PheGln Gly Arg 195 Thr Asn Thr Val His 200 Ala Glu Glu Ser Leu 205 Gln Arg Gln
Met Arg Ile Ser Ser Ser Leu Leu Pro Xaa Trp Met Xaa His
215
220
210<210> 164<211> 723<212> DNA
<213> Tradescantia virginiana<4 00> 164
gtgcagctga aacggatgga gaacaagatt aacaggcagg tgacgttttc taaacgtcga 60
ggagggctgc tgaagaaagc tcatgagatc tctattctat gtgatgctga gattgctctt 120attattttct ctactaaagg gaagctctat gagtatgcca ccaattccaa aatggacaat 180attcttgaac gctatgagcg ttactcatat gctgaaaagg ctctaacttc atcagatcct 240gatatacagg gaaattggtg ccaagagtat gctaaactta agtctaaggt tgaggcttta 300tgtaaaagcc aaaggcatct tatgggagag cagcttgaaa cattgaatct caaagaattg 360cagcaactag agcaacagct cgaaggttct ctaaagcatg tcaggtcaag aaagactcaa 420gttatgctgg actctatttc tgaacttcag aggaaggaaa agtcactaga ggagcaaaac 480aagaacctag agaaggagat tttggagaag cagaaaatca aggctcttgc acagcaggct 540cactgggaac accagaatca accagcacca aggggttcac ctcctaggcc atttgtgatt 600gcagagtctc atccgacact aaatattgga catttccaag gcaggacaaa tgcagtcgaa 660gcagaagaaa atcagcagcc tcakatgaga atttgcagta gcctcctgcc cccctggatg 720ctt 723
<210> 165<211> 241<212> PRT
<213> Tradescantia virginiana<220>
<221> INSEGURO<222> (228) . . (228)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<4 00> 165
Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn Arg Gln Val Thr Phe1 5 10 15 Ser Lys Arg Arg Gly Gly Leu Leu Lys Lys Ala His Glu Ile Ser Ile 20 25 30 Leu Cys Asp Ala Glu Ile Ala Leu Ile Ile Phe Ser Thr Lys Gly Lys 35 40 45 Leu Tyr Glu Tyr Ala Thr Asn Ser Lys Met Asp Asn Ile Leu Glu Arg 50 55 60 Tyr Glu Arg Tyr Ser Tyr Ala Glu Lys Ala Leu Thr Ser Ser Asp Pro65 70 75 80Asp Ile Gln Gly Asn Trp Cys Gln Glu Tyr Ala Lys Leu Lys Ser Lys 85 90 95 Val Glu Ala Leu Cys Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu 100 105 110 Glu Thr Leu Asn Leu Lys Glu Leu Gln Gln Leu Glu Gln Gln Leu Glu 115 120 125 Gly Ser Leu Lys His Val Arg Ser Arg Lys Thr Gln Val Met Leu Asp 130 135 140 Ser Ile Ser Glu Leu Gln Arg Lys Glu Lys Ser Leu Glu Glu Gln Asn145 150 155 160Lys Asn Leu Glu Lys Glu Ile Leu Glu Lys Gln Lys Ile Lys Ala Leu 165 170 175 Ala Gln Gln Ala His Trp Glu His Gln Asn Gln Pro Ala Pro Arg Gly 180 185 190 Ser Pro Pro Arg Pro Phe Val Ile Ala Glu Ser His Pro Thr Leu Asn 195 200 205 Ile Gly His Phe Gln Gly Arg Thr Asn Ala Val Glu Ala Glu Glu Asn 210 215 220 Gln Gln Pro Xaa Met Arg Ile Cys Ser Ser Leu Leu Pro Pro Trp Met225 230 235 240
Leu<210> 166<211> 599<212> DNA
<213> Tradescantia virginiana<4 00> 166
gggctkgtga agaaagctca tgagatctcg gtactttgtg atgctgagct tgctcttatt 60
atcttctctc ccaaaggcaa gctctatgag tatgccaccg attccaaaat ggaaattatt 120cttgaacgct atgaacgtta cacctacgct gaaaaagctt taattgcatc agatcctgat 180gtacagggaa actggtgtca tgagtacatt aagcttaaag ctaaatttga ggccttgaat 240aaaagccaga ggcatcttat gggagaacaa ctagatacgt tgaaccaaaa ggaattgctg 300caactagaga ctaagcttga aggttctctg aaaaacgtca ggtcaagaaa gactcaactt 360atgttggatt ccatttctga gcttcaagaa aagggaaagt cactccagga gcaaaacacc 420tgcctagaaa aggagatttt gggaaaacag aaagacaagg ctcccaaaca gcatgttcag 480tgggaaaaac agaatcaacc accacctacc tcttctgcgc caatgccatt cctcattggt 540gatattcacc caacccctaa tatcagaaat ttccaaggca gaacagtagc tgatgcaga 599
<210> 167<211> 199<212> PRT
<213> Tradescantia virginiana<4 00> 167
Gly 1 Leu Val Lys Lys 5 Ala His Glu Ile Ser 10 Val Leu Cys Asp Ala 15 GluLeu Ala Leu Ile 20 Ile Phe Ser Pro Lys 25 Gly Lys Leu Tyr Glu 30 Tyr AlaThr Asp Ser 35 Lys Met Glu Ile Ile 40 Leu Glu Arg Tyr Glu 45 Arg Tyr ThrTyr Ala 50 Glu Lys Ala Leu Ile 55 Ala Ser Asp Pro Asp 60 Val Gln Gly AsnTrp Cys His Glu Tyr Ile Lys Leu Lys Ala Lys Phe Glu Ala Leu Asn65 70 75
Lys Ser Gln Arg His Leu Met Gly Glu Gln Leu
85 90
Lys Glu Leu Leu Gln Leu Glu Thr Lys Leu Glu
100 105
Val Arg Ser Arg Lys Thr Gln Leu Met Leu Asp
115 120
Gln Glu Lys Gly Lys Ser Leu Gln Glu Gln Asn
130 135
Glu Ile Leu Gly Lys Gln Lys Asp Lys Ala Pro145 150 155
Trp Glu Lys Gln Asn Gln Pro Pro Pro Thr Ser
165 170
Phe Leu Ile Gly Asp Ile His Pro Thr Pro Asn
180 185
Gly Arg Thr Val Ala Asp Ala
195<210> 168<211> 753<212> DNA
<213> Elaeis guineensis<400> 168
atggggagag ggagggtgca gctgaggcgg atcgagaacattctcgaagc gccggtcggg gctcctgaag aaagcccacggccgaggtcg ccctcatcat cttctcgacc aagggcaagctcctgcatgg aaaggattct tgaacgctat gaacgttacaatttcatctg gacccgaatt gcagggtaac tggtgccatgaaggttgagg ctttacaaaa aagccaaagg catctcatggaatctcaaag aactccagca actagagcaa cagcttgaaaaccagaaagt gccaactcat gtttgaatcc atctctgagcctgcaggagc agaacaagat gctggagaag gagctcatggctaaaccagc aggcaccttg ggagcagcaa ggcccgccgcacctccttcc tgatcggaga ctctctcccc accctgaataggaaatgaac atggggagga agcagcacaa ccccaggttcccaccttgga tgcttagcca cttgaacggg tag<210> 169<211> 250<212> PRT
<213> Elaeis guineensis<4 00> 169
Met Gly Arg Gly Arg Val Gln Leu Arg Arg Ile15 10
Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly
20 25
His Glu Ile Ser Val Leu Cys Asp Ala Glu Val
35 40
Ser Thr Lys Gly Lys Leu Tyr Glu Tyr Ala Thr
50 55
Arg Ile Leu Glu Arg Tyr Glu Arg Tyr Thr Tyr65 70 75
Ile Ser Ser Gly Pro Glu Leu Gln Gly Asn Trp
85 90
Lys Leu Lys Ala Lys Val Glu Ala Leu Gln Lys
100 105
Met Gly Glu Gln Leu Glu Pro Leu Asn Leu Lys
115 120
Glu Gln Gln Leu Glu Ser Ser Leu Lys His Ile
130 135
Gln Leu Met Phe Glu Ser Ile Ser Glu Leu Gln145 150 155
Leu Gln Glu Gln Asn Lys Met Leu Glu Lys Glu
165 170
Lys Val Lys Ala Leu Asn Gln Gln Ala Pro Trp
Asp Thr LeuGlySer
Thr140Lys
Ser
Ile
Ser Leu110Ile Ser125
Cys Leu
Gln His
Ala Pro
Arg Asn190
Asn
95
Lys
Glu
Glu
Val
Met175Phe
80Gln
Asn
Leu
Lys
Gln160Pro
Gln
agataaaccgagatctccgttctacgagtacctatgcagaaatttggcaagtgagcaactgttctttaaattcaaaaaaaagaagcagaaagacaagctcttgggacatagtataggaaa
gcaggtgacgcctctgcgaccgccaccgacaaaagcactaactcaaagcttgagcccttggcatataagaggaaaagtcaggtgaaggcaatcatccccaccaatgtagccagcctgtta
Glu Asn
Leu Leu
Ala Leu45
Asp Ser60
Ala Glu
Cys His
Ser Gln
Glu Leu125Arg Thr140
Lys LysLeu MetGlu Gln
Lys Ile Asn15
Lys Lys Ala30
Ile Ile Phe
Cys Met Glu
Lys Ala Leu80
Glu Phe Gly95
Arg His Leu110
Gln Gln Leu
Arg Lys Cys
Glu Lys Ser160
Glu Lys Gln175
Gln Gly Pro
60120180240300360420480540600660720753180 185
Pro Gln Thr Ser Ser Ser Ser Pro Thr Ser Phe
195 200
Leu Pro Thr Leu Asn Ile Gly Thr Tyr Gln Cys
210 215
Gly Glu Glu Ala Ala Gln Pro Gln Val Arg Ile225 230 235
Pro Pro Trp Met Leu Ser His Leu Asn Gly245 250
<210> 170<211> 699<212> DNA<213> Allium sp.<4 00> 170
gtgcaattga agaggatgga aaacaagatt aatagacaagaatggtttgt tgaagaaagc tcatgagatt tcwgtgctttattgttttct ctgctaaagg aaaactctat gaatattcaaattctggaga ggtatgaacg ttattgcttt gcggagaaatgactcccagg aggattggag ccttgaatat cacaaactgaaacaacaggc aaaggcatct tatgggagag caacttgaatggacagcttg agcaacaact tgagaattct ctcaaaactggaattgttaa gttctatttc agagcttcag gacaaggagaaaagctttag aaaatgagct tatgaaaagg gccagggcaagcacgatgga agcatcataa tcataaacaa caggataatcattggaaatt accaaacaag gaacaatgag ggaggagttggtacgtgttg ttagaaattt gttgccccac tggatgctt<210> 171<211> 233<212> PRT<213> Allium sp.<4 00> 171
Val Gln Leu Lys Arg Met Glu Asn Lys Ile Asn1 5 10
Ser Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala
20 25
Leu Cys Asp Ala Glu Val Ala Leu Ile Val Phe
35 40
Leu Tyr Glu Tyr Ser Thr Asp Ser Ser Met Glu
50 55
Tyr Glu Arg Tyr Cys Phe Ala Glu Lys Ser Ser65 70 75
Asp Ser Gln Glu Asp Trp Ser Leu Glu Tyr His
85 90
Val Glu Ser Leu Asn Asn Arg Gln Arg His Leu
100 105
Glu Ser Leu Ser Leu Arg Glu Ile Gly Gln Leu
115 120
Asn Ser Leu Lys Thr Val Arg Thr Arg Lys Ser
130 135
Ser Ile Ser Glu Leu Gln Asp Lys Glu Lys Thr145 150 155
Lys Ala Leu Glu Asn Glu Leu Met Lys Arg Ala
165 170
Leu Glu Gln Gln Ala Arg Trp Lys His His Asn
180 185
Asn Leu His Asn Pro Asn Ile Asn Ile Gly Asn
195 200
Asn Glu Gly Gly Val Glu Pro Ala Thr Asp Val
210 215
Arg Asn Leu Leu Pro His Trp Met Leu225 230
<210> 172<211> 744
190
Leu Ile Gly Asp Ser205
Ser Gly Asn Glu His220
Gly Asn Ser Leu Leu240
tgaccttctcgtgatgcagactgattcaagcatcaacaataggctaaggtctctgagtctttcggacgcgaaactttgcgaagctattctttcataatccagccagcaac
aaaaagaagaagttgcactttatggaaaaagagtgacatttgagagtttatcgagaaattcaagagccaaagatgagaacggaacaacaaaaatatcaacggatgttcaa
Arg
His
Ser
Lys60Thr
Lys
Met
Glu
Gln140Leu
Arg
His
Tyr
Gln220
Gln
Glu
Ala
45
Ile
Met
Leu
Gly
Gln125Glu
Arg
Ala
Lys
Gln205Val
Val
Ile
30
Lys
Leu
Ser
Lys
Glu110Gln
Leu
Asp
Lys
Gln190Thr
Arg
Thr Phe15
Ser Val
Gly Lys
Glu Arg
Asp Ile80Ala Lys95
Gln Leu
Leu Glu
Leu Ser
Glu Asn160Ala Ile175
Gln AspArg AsnVal Val
60120180240300360420480540600660699<212> DNA
<213> Dendrobium grex Madame Thong-IN<400> 172
atgggtcgtg gcagggtgca gctgaagcga atcgagaatattctcgaagc ggagatctgg tttgcttaag aaggcgcacggctgaagttg ctctgatcgt tttttccaat aagggaaagctccagcatgg agaaaattct tgaacggtat gagcgttattttttccaatg aggccaaccc ccaggctgat tggcgccttgagggttgaaa gcttacagaa gagccaaagg caccttatggagcattaaag aactccaacg tctagagcaa cagcttgaaatccagaaaga cacagctcat actacattca atttccgagcttgctggagc aaaacaagac cttagagaag gagattatagttggtgcagc atgccccatg ggagaagcaa aaccagtccccctgtgattt cggattctgt cccaactccc accagcagaagaagaagaat cacctcagcc acagttaaga gtaagcaacactcagtcata tgaatggaca ataa<210> 173<211> 247<212> PRT
<213> Dendrobium grex Madame Thong-IN<4 00> 173
Met Gly Arg Gly Arg Val Gln Leu Lys Arg Ile
25
aaataaaccgagatctccgttttatgagtacatatgctgaaatataataagggagcaactgttccttgaatacaaaagatctaaagagaaaatatagctccgtttcaagcctctgctgcc
gcaggtgacggctctgtgacttccaccgataagagcattaactgaaggcatgactccttggtttatacgaggaaaaaataagccaaagcttgcactcccgcagagccaatcccatggatg
1 5 Arg Gln Val Thr Phe Ser 20 His Glu Ile Ser Val Leu 35 Ser Asn Lys Gly Lys Leu 50 Lys Ile Leu Glu Arg Tyr65 70Phe Ser Asn Glu Ala Asn 85 Lys Leu Lys Ala Arg Val 100 Met Gly Glu Gln Leu Asp 115 Glu Gln Gln Leu Glu Ser 130 Gln Leu Ile Leu His Ser145 150Leu Leu Glu Gln Asn Lys 165 Lys Ala Lys Ala Leu Val 180 Ser Gln Tyr Ser Ser Ala 195 Thr Pro Thr Ser Arg Thr
55
105
120
135
185
200
210
215
Pro Gln Pro Gln Leu Arg Val Ser Asn Thr Leu
225
230
[N Arg Ile Glu Asn Lys Ile Asn10 15 Ser Gly Leu Leu Lys Lys Ala 30 Glu Val Ala Leu Ile Val Phe 45 Ser Thr Asp Ser Ser Met Glu 60 Ser Tyr Ala Glu Arg Ala Leu 75 80Asp Trp Arg Leu Glu Tyr Asn90 95 Gln Lys Ser Gln Arg His Leu 110 Ile Lys Glu Leu Gln Arg Leu 125 Phe Ile Arg Ser Arg Lys Thr 140 Leu Gln Lys Met Glu Lys Ile 155 160Lys Glu Ile Ile Ala Lys Glu170 175 Pro Trp Glu Lys Gln Asn Gln 190 Val Ile Ser Asp Ser Val Pro 205 Arg Ala Asn Glu Glu Glu Ser 220 Thr Leu Leu Pro Pro Trp Met 235 240
Leu Ser His Met Asn Gly Gln245
<210> 174
<211> 2194
<212> DNA
<213> Oryza sativa
<4 00> 174
aatccgaaaa gtttctgcac cgttttcacc ccctaactaaaaatataaaa tgagacctta tatatgtagc gctgataactcatccaccta ctttagtggc aatcgggcta aataaaaaagtttccttagt aattaagtgg gaaaatgaaa tcattattgctctgtcatga agttaaatta ttcgaggtag ccataattgt
caatatagggagaactatgcagtcgctacattagaatatacatcaaactc
aacgtgtgctaagaaaaactctagtttcgtcgttcacatcttcttgaata
60120180240300360420480540600660720744
60120180240300aaaaaatctt tctagctgaa ctcaatgggtatgaagatat tctgaacgta ttggcaaagattgtgcattc gtcatatcgc acatcattaattagtaatta aagacaattg acttatttttgtacttacgc acacactttg tgctcatgtgtcaactagca acacatctct aatatcactctgaattcaag cactccacca tcaccagaccaattttacag aatagcatga aaagtatgaaaaaaaaagaa ttttgctcgt gcgcgagcgcacagagtggc tgcccacaga acaacccacatccgcaacaa ccttttaaca gcaggctttgaaccaagcat cctccttctc ccatctataaggaggcatcc aagccaagaa gagggagagccgaccgcctt ctcgatccat atcttccggtacctcctcct cacagggtat gtgcctcccttgtgtagtac gggcgttgat gttaggaaagtggatttggg atagaggggt tcttgatgttatggttttca atcgtctgga gagctctatggcgattttgt gagtaccttt tgtttgaggtgtaataaagt acggttgttt ggtcctcgátgctatccttt gtttattccc tattgaacaagatgagattg aatgattgat tcttaagccttacagtagtc cccatcacga aattcatggaccctgttctt ccgatttgct ttagtcccagactttctggt tcagttcaat gaattgattgagctgtagtt cagttaatag gtaataccccatttctgatc tccattttta attatatgaagattattttt tttattagct ctcaccccttctgtcctcaa ttttgttttc aaattcacatacctgtagaa gtttcttttt ggttattcctaagctgtaat cgggatagtt atactgcttgttggtgtagc ttgccacttt caccagcaaa<210> 175<211> 1725<212> DNA
<213> Arabidopsis thaliana<400> 175
atgaattcta acaactggct tggctttcctcatgaataca accttggctt ggtcagcgactggaatatga tcaatccaca cggtggaggagccgattttc tcggtgtgag caaaccggacaacgactcag actactactt ccataccaatgtcgttgtag cagcttgtga ctccaatactgagagtgctc acaatctaca gtcacttactgttgtagaca aagcttcacc atccgagaccgccgttgttg agacggccac gccaagacgtatctatcgtg gtgtcacaag acatcgatggaatagttgta gaagggaagg ccagtctagggataaagaag ataaagcagc aagatcatattcaactacta ctaatttccc cattacaaacatgacgaggc aagagttcgt ggctgccattgcttcgatgt atcgaggagt tacaaggcacggccgagtcg ccgggaacaa agacctctacgcagaagctt acgatatagc tgcaataaaggagatcaacc ggtacgacgt gaaagccattggcgcagcta aacggctcaa agaagctcaagagatgatag cccttggttc aagtttccagtccacctcat caagacttca gcttcaacctccttttctat ctcttcagaa caatgacatctcctcctctt ttaatcacca tagctatatcaacaattact tgcagcaaca gtcgagccagcatagcaatc cggctctgct tcatggacttaacaatggag gctctagtgg gagctacaac
aaagagagag attttttttatttaaacata taattatata
ggacatgtctattatttatccatgtgtgaggcctatttaaacttttaataacgaactattcaatctcccaaaaaacgatgcggccaggagattcctccccaccaaggacacgagttcttgtcggttgttcgggatctgtagcatgttatcgaaatgaaataaaatcagagtctggtagtgaaataatccagtccaaaattaacagttataaattttttttctacaaataatatagtttagatgaactgtacattattctgcgattatctatgactgcttgttcttatgatgttc
tactccatccttttttcgattgcacctccttacatttaggatatctaaaataggtttttctattgggcacatctaacggaagaggaggagccttttcccccgcgactagcgtcgatctctttggatttattctgtgatgaggttcggtttggtttagggacaccggtgatatgcttctcgactttgaagatcgcagctggatcctcaggacccaaatatctgcttttatatcaggagaaggcataagcagagctgaaagttgcattatccattacagaaatcatttcctt
aaaaaatagaattttatagtcaatttttattagatgcaagcaatacacgttagcaatatctacaaaaaatacatacaaaaacaggcaacaggacagcaagaggcaaagaatctctatataagaagccgagtccctcctcctgttctaggtttcctgttctgattagtagttcggaatctttttgcttggtatttgacgaacggtcccgttcttgtttagaacaggggattttaaaaagtcgcgttatcctaacttatccgtattcatttgctggcatgaatcttgtatctgaaatttatgtgtgcagttc
ctttcaccga acaactcttccatatggaca acccttttcaggagatgaag gaggagaggtgaaaaccaat ccaaccacctagcttgatgc ctagcgtccacctaacaaca gtagctatcattgtccatgg ggaccaccgcaccggggata acgctagcgggcattggaca ctttcggacaactggtcgat atgaggctcaaaaggaagac aagtttacttgatctagctg cacttaagtatacgagaaag aagtagaggaagaaggaaaa gtagtggattcaccaacatg gaagatggcattgggaactt ttagcactgatttagaggac ttaatgcagtctagagagta gcactcttccgctcttgagt cttcaaggaatacggtggtg gctcgagcactaccctctaa gcattcaacatctcattaca acaacaacaacagacacaac ttcatctccaaactctcagc agctctacaagtctctacct ctatcgttgaactgcagcat ttcttgggaa
tttgcctcctaacacaagagtccaaaagtgagtagcttacatcaaacgattgagcttcaatggtaataattggagcactaacgaacctcgtctatgggatgggtggatatctggggtcccaatgaagcacttcgagaggcagcaaggatcggaagaagcagaccaacttccatcggaggaacgcgaggcgaggctctggcaccattagagtgctcacgatccaacagacctgcgtatcttcaacaataatccacggtatt
360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001860192019802040210021602194
601201802403003604204805406006607207808409009601020108011401200126013201380144015001560ggtattgggt ccagctcgac tgttggatcg accgaggagt ttccaaccgt taaaacagat 1620tacgatatgc cttccagtga tggaaccgga gggtatagtg gttggaccag tgagtctgtt 1680caggggtcaa accctggtgg tgttttcact atgtggaatg agtaa 1725
<210> 176<211> 574<212> PRT
<213> Arabidopsis thaliana<400> 176
Met Asn Ser Asn Asn Trp Leu Gly Phe Pro Leu Ser Pro Asn Asn Ser1 5 10 15 Ser Leu Pro Pro His Glu Tyr Asn Leu Gly Leu Val Ser Asp His Met 20 25 30 Asp Asn Pro Phe Gln Thr Gln Glu Trp Asn Met Ile Asn Pro His Gly 35 40 45 Gly Gly Gly Asp Glu Gly Gly Glu Val Pro Lys Val Ala Asp Phe Leu 50 55 60 Gly Val Ser Lys Pro Asp Glu Asn Gln Ser Asn His Leu Val Ala Tyr65 70 75 80Asn Asp Ser Asp Tyr Tyr Phe His Thr Asn Ser Leu Met Pro Ser Val 85 90 95 Gln Ser Asn Asp Val Val Val Ala Ala Cys Asp Ser Asn Thr Pro Asn 100 105 110 Asn Ser Ser Tyr His Glu Leu Gln Glu Ser Ala His Asn Leu Gln Ser 115 120 125 Leu Thr Leu Ser Met Gly Thr Thr Ala Gly Asn Asn Val Val Asp Lys 130 135 140 Ala Ser Pro Ser Glu Thr Thr Gly Asp Asn Ala Ser Gly Gly Ala Leu145 150 155 160Ala Val Val Glu Thr Ala Thr Pro Arg Arg Ala Leu Asp Thr Phe Gly 165 170 175 Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly 180 185 190 Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln 195 200 205 Ser Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Asp 210 215 220 Lys Ala Ala Arg Ser Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Pro225 230 235 240Ser Thr Thr Thr Asn Phe Pro Ile Thr Asn Tyr Glu Lys Glu Val Glu 245 250 255 Glu Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg 260 265 270 Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr 275 280 285 Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala 290 295 300 Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala305 310 315 320Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala 325 330 335 Val Thr Asn Phe Glu Ile Asn Arg Tyr Asp Val Lys Ala Ile Leu Glu 340 345 350 Ser Ser Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu 355 360 365 Ala Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Ala Glu Met Ile Ala 370 375 380 Leu Gly Ser Ser Phe Gln Tyr Gly Gly Gly Ser Ser Thr Gly Ser Gly385 390 395 400Ser Thr Ser Ser Arg Leu Gln Leu Gln Pro Tyr Pro Leu Ser Ile Gln 405 410 415 Gln Pro Leu Glu Pro Phe Leu Ser Leu Gln Asn Asn Asp Ile Ser His 420 425 430 Tyr Asn Asn Asn Asn Ala His Asp Ser Ser Ser Phe Asn His His Ser435
450
455
465
470
485
490
500
505
515
520
530
535
445 Gln Thr Asn Asn Tyr Leu 460 Leu Tyr Asn Ala Tyr Leu475 480Val Ser Thr Ser Ile Val 495 Gly Ser Tyr Asn Thr Ala 510 Gly Ser Ser Ser Thr Val 525 Thr Asp Tyr Asp Met Pro 540 Trp Thr Ser Glu Ser Val
545
550
555
560
Gln Gly Ser Asn Pro Gly Gly Val Phe Thr Met Trp Asn Glu
565
570
<210> 177<211> 1707<212> DNA
<213> Arabidopsis thaliana<400> 177
atgaattcta acaactggct cgcgttccct ctatcaccaa ctcactcttccacattcact cttcacaaaa ttctcatttc aatctaggttaacccttttc aaaaccaagg atggaatatg atcaatccacggagaggttc caaaagtggc tgatttctta ggagtgagcagatcacaacc tcgtacctta taacgacatt catcaaaccacaaaccaata gcttgttacc tacagtcgtc acttgtgcctgagcttcaag agagtgcaca caatttgcaa tctctcactcgctgccgctg cagaagtcgc cactgtgaaa gcctcgccggagtagcagca ctaccaacac aagcggagga gccatcgttg
ttggaaactt ttggacaacg aacctctatc tatcgtggagggtagatatg aagctcatct ttgggataat agctgtagaaggaagacaag tctacttagg tgggtatgac aaagaagagactagctgcac ttaaatattg gggtccctct actactaccagagaaggaag tagaggagat gaaaaacatg acgagacaagaggaagagta gcggattctc gcgtggtgca tccatgtatccaacatggaa gatggcaagc aaggatcggc cgagttgctgggaacattca gcacggagga agaagcagca gaagcttatgcgaggtctaa acgcggttac aaactttgag ataaatcggtgagagcaaca cacttcctat aggaggtggt gcggctaaacctagaatcat caagaaaacg agaggaaatg atagccctcgggtgcagcga gcggctcgag ctctgttgct tccagctctacctctaagca ttcaacaacc ttttgagcat cttcatcatccagaacaaca acgatatctc tcagtatcat gattcctttacatcttcacc aacaacaaac caacaattac ttgcagtctttacaatgctt atcttcagag taaccctggt ctgcttcatgaacacttcag ggtttcttgg aaacaatggg attggtattgtcatcggctg aggaagagtt tccagccgtg aaagtcgattggagctacag ggtatggagg atggaatagt ggagagtctgggtgttttca cgatgtggaa tgaataa<210> 178<211> 568<212> PRT
<213> Arabidopsis thaliana<4 00> 178
Met Asn Ser Asn Asn Trp Leu Ala Phe Pro Leu15 10
Ser Leu Pro Pro His Ile His Ser Ser Gln Asn
20 25
Gly Leu Val Asn Asp Asn Ile Asp Asn Pro Phe
35 40
Asn Met Ile Asn Pro His Gly Gly Gly Gly Glu
tggtcaacgaatggtggaggaatcgggggaacgcctccgactaatgctcctctctatgggctgagactagaggctacaccttacaagacagagaaggacaaagcagccagactttccgatagtttgtggcgtggagtaacgaaacaaagaacatagctgcatgatgtgaaggctcaaagagatcaaatttggcttcagctatcagcctttgttacattcactagtcacacgatttgtctcggtcaagctcacgatatgccctcaaggatc
tttgccgcctcaatatcgaccggcgaaggttcatcacaccctactacttttaataattataagtactggatgccgataatgagacggacttagatggaccatcaaggaaaagcatatgataactaactacttctataagaaaggcatcattctctacttggataaagtttagccatcctgagctcaagctccatcaatattcaaccttacacttactctagacgcagcttttcacagctctgataataactaccgttggatccttccggtgaatccagga
Ser Pro Thr His Ser15
Ser His Phe Asn Leu30
Gln Asn Gln Gly Trp45
Gly Gly Glu Val Pro
60120180240' 300360420480540600660720780840900960102010801140120012601320138014401500156016201680170750 55 60
Lys Val Ala Asp Phe Leu Gly Val Ser Lys Ser Gly Asp His His Thr65 70 75 80
Asp His Asn Leu Val Pro Tyr Asn Asp Ile His Gln Thr Asn Ala Ser
85 90 95
Asp Tyr Tyr Phe Gln Thr Asn Ser Leu Leu Pro Thr Val Val Thr Cys
100 105 110
Ala Ser Asn Ala Pro Asn Asn Tyr Glu Leu Gln Glu Ser Ala His Asn
115 120 125
Leu Gln Ser Leu Thr Leu Ser Met Gly Ser Thr Gly Ala Ala Ala Ala
130 135 140
Glu Val Ala Thr Val Lys Ala Ser Pro Ala Glu Thr Ser Ala Asp Asn145 150 155 160
Ser Ser Ser Thr Thr Asn Thr Ser Gly Gly Ala Ile Val Glu Ala Thr
165 170 175
Pro Arg Arg Thr Leu Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg
180 185 190
Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp
195 200 205
Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val
210 215 220
Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp225 230 235 240
Leu Ala Ala Leu Lys Tyr Trp Gly Pro Ser Thr Thr Thr Asn Phe Pro
245 250 255
Ile Thr Asn Tyr Glu Lys Glu Val Glu Glu Met Lys Asn Met Thr Arg
260 265 270
Gln Glu Phe Val Ala Ser Ile Arg Arg Lys Ser Ser Gly Phe Ser Arg
275 280 285
Gly Ala Ser Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg
290 295 300
Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu305 310 315 320
Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala
325 330 335
Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile Asn
340 345 350
Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser Asn Thr Leu Pro Ile Gly
355 360 365
Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala Gln Ala Leu Glu Ser Ser
370 375 380
Arg Lys Arg Glu Glu Met Ile Ala Leu Gly Ser Asn Phe His Gln Tyr385 390 395 400
Gly Ala Ala Ser Gly Ser Ser Ser Val Ala Ser Ser Ser Arg Leu Gln
405 410 415
Leu Gln Pro Tyr Pro Leu Ser Ile Gln Gln Pro Phe Glu His Leu His
420 425 430
His His Gln Pro Leu Leu Thr Leu Gln Asn Asn Asn Asp Ile Ser Gln
435 440 445
Tyr His Asp Ser Phe Ser Tyr Ile Gln Thr Gln Leu His Leu His Gln
450 455 460
Gln Gln Thr Asn Asn Tyr Leu Gln Ser Ser Ser His Thr Ser Gln Leu465 470 475 480
Tyr Asn Ala Tyr Leu Gln Ser Asn Pro Gly Leu Leu His Gly Phe Val
485 490 495
Ser Asp Asn Asn Asn Thr Ser Gly Phe Leu Gly Asn Asn Gly Ile Gly
500 505 510
Ile Gly Ser Ser Ser Thr Val Gly Ser Ser Ala Glu Glu Glu Phe Pro
515 520 525
Ala Val Lys Val Asp Tyr Asp Met Pro Pro Ser Gly Gly Ala Thr Gly
530 535 540
Tyr Gly Gly Trp Asn Ser Gly Glu Ser Ala Gln Gly Ser Asn Pro Gly545 550 555 560Gly Val Phe Thr Met Trp Asn Glu565
<210> 179<211> 1662<212> DNA<213> Glycine max<400> 179
atgaacaaca actggctttc gttccctctt tctcctactcgatcttcaag caactcaata tcatcaattt tcccttgggtaaccctttcc aaaatcatga ttggaatctg attaacacccaaagtggctg attttctagg agtgagcaag tctgaaaatcaacgaaattc attcaaatga ttcagattat ctgttcacaacaaaaccctg tgttggacac acctagcaat gagtatcaagcaatcattga cattatccat gggaagtggt aaggattcaaaatagcacaa acactactgt tgaagttgca cctagaagaaagaacatcca tatatcgtgg agtaactcga catagatggactttgggata atagctgtag aagggaaggc caatcaagaaggtggatatg ataaagaaga gaaagcagct agagcttatgtgggggacat ccaccactac caactttcca attagcaactatgaaacaca tgacgagaca agaatttgtt gccgccattatccaggggtg catcaatgta tcgtggagtt acaaggcatcgcaaggattg gcagagttgc aggaaacaaa gatctttactgaagaggctg cagaagcata cgacatagca gcgataaagtacaaactttg acatgagccg ctacgacgtg aaagccattcataggaggag gcgctgcaaa gcgtctgaaa gaagctcaagcgcgaagaga tgattgcact aggctcatct tccacgttcctcttctaggc ttcacgctta ccctctaatg cagcaccacccctctgctaa ctcttcaaaa ccacgacata agttcttctccctttgcãtc atcagggtta catccaaacg cagcttcagttcttcttata gctttcagaa taatgctcag ttctacaatggcattgcttc agggaatgat gaacatgggg tcttcttcttaataataata gtaacaataa taataataat gttggtgggtatggcttcga atgcaacggc ggggaacacg gtggggacagaaggtggact atgacatgcc ggctggaggt tacggtggctcagacgtcaa atggtggggt gttcacaatg tggaatgatt<210> 180<211> 553<212> PRT<213> Glycine max<4 00> 180
Leu Pro Ala His Asp Leu Gln Ala Thr Gln Tyr
attcttcctttagtgaacgaatagtagcaaagtcagacctacaacagtctaaaatgctaacatgtgaaacctttggatacctggaaggtaaaggacgccaatttagctgcatgagaaggagaaggaaaagaccaacacggtgggaacttttcagaggtctttgaaagcaactctagaatcaatacggaacaccagttcgaacttctctcatgcaccagcagttaccttcacttcctcatcttgtgggaagcggaggagttggtcggcggcaa
accagctcatgaacatggatcgaaattccatgcagccttaggtgcctatgtagtaatttgcagtggtgaaattcgggcagtgaagctcatagtttatttgactgaagtacattggatgaacagtggtttcaagatggcaacagtactgagcaacgctgtccactctcccattcgagaaaactcagcaagcgcaacctcaaccagcaagacgagtggcgctgaaccacccttgtgttggagtgggtttggtagggctggtgggactccatg
20
25
Gly Leu Val Asn Glu Asn Met Asp Asn Pro Phe
35
40
Asn Leu Ile Asn Thr His Ser Ser Asn Glu Ile
50
55
Phe65
Leu Gly Val Ser Lys Ser Glu Asn Gln Ser70
Asn Glu Ile His Ser Asn Asp Ser Asp Tyr Leu85
Leu Val Pro Met Gln Asn Pro Val Leu Asp Thr
100
105
Gln Glu Asn Ala Asn Ser Asn Leu Gln Ser Leu
115
120
Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly
130
135
Thr Thr Val Glu Val Ala Pro Arg Arg Thr Leu
145
150
Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His165
Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg
Leu Ser Pro Thr His Ser Ser10 15 Gln Tyr His Gln Phe Ser Leu 30 Pro Phe Gln Asn His Asp Trp 45 Glu Ile Pro Lys Val Ala Asp 60 Gln Ser Asp Leu Ala Ala Leu 75 80Tyr Leu Phe Thr Asn Asn Ser90 95 Asp Thr Pro Ser Asn Glu Tyr 110 Ser Leu Thr Leu Ser Met Gly 125 Ser Gly Glu Asn Ser Thr Asn 140 Thr Leu Asp Thr Phe Gly Gln 155 160Arg His Arg Trp Thr Gly Arg170 175 Cys Arg Arg Glu Gly Gln Ser
60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201662180 185 190 Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys 195 200 205 Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser 210 215 220 Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Leu Asp Glu225 230 235 240Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg Lys 245 250 255 Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg 260 265 270 His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly 275 280 285 Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala 290 295 300 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser 325 330 335 Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala 340 345 350 Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Glu Met Ile Ala Leu Gly 355 360 365 Ser Ser Ser Thr Phe Gln Tyr Gly Thr Ser Ala Ser Ser Ser Arg Leu 370 375 380 His Ala Tyr Pro Leu Met Gln His His His Gln Phe Glu Gln Pro Gln385 390 395 400Pro Leu Leu Thr Leu Gln Asn His Asp Ile Ser Ser Ser His Phe Ser 405 410 415 His Gln Gln Asp Pro Leu His His Gln Gly Tyr Ile Gln Thr Gln Leu 420 425 430 Gln Leu His Gln Gln Ser Gly Ala Ser Ser Tyr Ser Phe Gln Asn Asn 435 440 445 Ala Gln Phe Tyr Asn Gly Tyr Leu Gln Asn His Pro Ala Leu Leu Gln 450 455 460 Gly Met Met Asn Met Gly Ser Ser Ser Ser Ser Ser Ser Val Leu Glu465 470 475 480Asn Asn Asn Ser Asn Asn Asn Asn Asn Asn Val Gly Gly Phe Val Gly 485 490 495 Ser Gly Phe Gly Met Ala Ser Asn Ala Thr Ala Gly Asn Thr Val Gly 500 505 510 Thr Ala Glu Glu Leu Gly Leu Val Lys Val Asp Tyr Asp Met Pro Ala 515 520 525 Gly Gly Tyr Gly Gly Trp Ser Ala Ala Asp Ser Met Gln Thr Ser Asn 530 535 540 Gly Gly Val Phe Thr Met Trp Asn Asp 545 550
<210> 181<211> 1674<212> DNA<213> Glycine max<4 00> 181
atgaacaaca actggctttc gttccctctt tctcctactc attcttcctt accagctcat 60
gatcttcaag caactcaata tcatcaattt tcccttgggt tagtgaacga gaacatggat 120
aaccctttcc aaaatcatga ttggaatctg attaacaccc atagtagcaa cgaaattcca 180
aaagtggctg attttctagg agtgagcaag tctgaaaatc agtcagacct tgcagcctta 240
aacgaaattc attcaaatga ttcagattat ctgttcacaa acaacagtct ggtgcctatg 300
caaaaccctg tgttggacac acctagcaat gagtatcaag aaaatgctaa tagtaatttg 360
caatcattga cattatccat gggaagtggt aaggattcaa catgtgaaac cagtggtgaa 420
aatagcacaa acactactgt tgaagttgca cctagaagaa ctttggatac attcgggcag 480
agaacatcca tatatcgtgg agtaactcga catagatgga ctggaaggta tgaagctcat 540
ctttgggata atagctgtag aagggaaggc caatcaagaa aaggacgcca agtttatttg 600
ggtggatatg ataaagaaga gaaagcagct agggcttatg atttagctgc actgaagtac 660tgggggacat ccaccactac caactttcca attagtaact atgagaagga attggatgaa 720
atgaaacaca tgacgcgaca agaatttgtt gctgccatta gaaggaaaag cagtggtttc 780
tccaggggtg catcaatgta tcgtggagtt acaaggcatc accaacacgg aagatggcaa 840
gcaagaattg gcagagttgc aggaaacaaa gatctttact tgggaacttt cagtactgaa 900
gaagaggctg ctgaagcata cgacatagct gcgataaagt tcagaggtct caacgctgtc 960
acaaactttg acatgagccg ctacgacgtg aaagccatcc ttgaaagcaa cactctccca 1020
ataggaggag gagctgcaaa gcgtctgaaa gaagctcaag ctctagaatc ttcgagaaag 1080
cgcgaagaga tgattgcact aggatcatcc acattccaat atggaaccac aagctctaat 1140
tctaggctac atgcttaccc tctaatgcag caccaccacc agtttgaaca acctcaacct 1200
ctgctaactt tgcaaaacca tgatatcagt tctcacttct ctcaccagca agaccctttg 1260
catcagggtt acatccaaac gcagcttcag ttgcaccagc agcagagtgg tggttcttct 1320
tcttatagct ttcagaataa taatataaat aatgctcagt tctataatgg ttataatctt 1380
cagaaccacc ctgcattgct tcagggaatg attaacatgg ggtcttcatc ttcttcatct 1440
gtgttggaga ataataatag taccaataat aatgttggtg ggtttgtggg aagtgggttt 1500
ggtatggctt ctaatgcaac gtcggggaac acggtgggga cggcggagga gctagggctg 1560
gtgaaggtgg actatgacat gccgactggt ggttacggtg gatggtcggc ggcggcggcg 1620
gcggagtcca tgcagacgtc gaatagtggg gtgttcacaa tgtggaatga ctga 1674<210> 182<211> 557<212> PRT<213> Glycine max<4 00> 182
Met Asn Asn Asn Trp Leu Ser Phe Pro Leu Ser Pro Thr His Ser Ser1 5 10 15 Leu Pro Ala His Asp Leu Gln Ala Thr Gln Tyr His Gln Phe Ser Leu 20 25 30 Gly Leu Val Asn Glu Asn Met Asp Asn Pro Phe Gln Asn His Asp Trp 35 40 45 Asn Leu Ile Asn Thr His Ser Ser Asn Glu Ile Pro Lys Val Ala Asp 50 55 60 Phe Leu Gly Val Ser Lys Ser Glu Asn Gln Ser Asp Leu Ala Ala Leu65 70 75 80Asn Glu Ile His Ser Asn Asp Ser Asp Tyr Leu Phe Thr Asn Asn Ser 85 90 95 Leu Val Pro Met Gln Asn Pro Val Leu Asp Thr Pro Ser Asn Glu Tyr 100 105 110 Gln Glu Asn Ala Asn Ser Asn Leu Gln Ser Leu Thr Leu Ser Met Gly 115 120 125 Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly Glu Asn Ser Thr Asn 130 135 140 Thr Thr Val Glu Val Ala Pro Arg Arg Thr Leu Asp Thr Phe Gly Gln145 150 155 160Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg 165 170 175 Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser 180 185 190 Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys 195 200 205 Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser 210 215 220 Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Leu Asp Glu225 230 235 240Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg Lys 245 250 255 Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg 260 265 270 His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly 275 280 285 Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala 290 295 300 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser325 330
Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys
340 345
Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Glu
355 360
Ser Ser Thr Phe Gln Tyr Gly Thr Thr Ser Ser
370
375
Ala Tyr Pro Leu Met Gln His His His Gln Phe385 390 395
Leu Leu Thr Leu Gln Asn His Asp Ile Ser Ser
405 410
Gln Asp Pro Leu His Gln Gly Tyr Ile Gln Thr
420 425
Gln Gln Gln Ser Gly Gly Ser Ser Ser Tyr Ser
435 440
Ile Asn Asn Ala Gln Phe Tyr Asn Gly Tyr Asn
450 455
Ala Leu Leu Gln Gly Met Ile Asn Met Gly Ser465 470 475
Val Leu Glu Asn Asn Asn Ser Thr Asn Asn Asn
485 490
Gly Ser Gly Phe Gly Met Ala Ser Asn Ala Thr
500 505
Gly Thr Ala Glu Glu Leu Gly Leu Val Lys Val
515 520
Thr Gly Gly Tyr Gly Gly Trp Ser Ala Ala Ala
530 535
Gln Thr Ser Asn Ser Gly Val Phe Thr Met Trp545 550 555
<210> 183<211> 1632<212> DNA
<213> Medicago trunculata<400> 183
atgaacaata actggctttc attccctctc tcaccttctcgatcttcaag caactcaata tcatcacttt cctcttggataaccctttcc aaaatcatga ttggaatctg atgaacacacaaggttgcgg attttctcgg tgtatgcaag tctgaaaatcaacgaaattc aatctaatga ttcagattat ctgtttacaaatgcaaaacc aaatggttac aacatgcacc aatgagtatcaatttgcagt ctttgacatt atccatggga agtggtaaagggtgaaaata gtacaaacac tgttgaagtt gctgttcctaggacaaagaa cttcgatata tcgcggtgta acaaaacatagctcaccttt gggataacag ctgtagaagg gaaggtcagtggatatgata aagaagagaa agctgctagg tcttatgattgggacatcca ccactaccaa ctttccagtt agcaactatgaagcacatga caagacaaga atttgttgcc tctattagaaaggggtgcat caatgtaccg tggagttaca aggcatcaccaggattggca gagttgcagg aaataaagat ctatacttgggaggctgcag aagcatacga catagcagca ataaaattcaaactttgaca tgactcgtta cgacgtgaaa gccattctcgggaggaggag ctgcaaaaag actaaaagaa gcacaagctcgaagaaatgc ttgcacttaa ctcatcatct ttccaatatgactagactcc aaccctaccc tctcatgcaa tatcatcaccttgctaacat tacaaaacaa ccatgaaagc ttgaattctcggtggtggtt atttccaaac acagcttgag ttgtgtcaaccagaatagta acataggttc attctacaat ggttattatccagatgaata atataggatc ttcttcttca tcttcggtgatctagtggga tttatagtaa tagtggaggg ttaattagtagtgccggtta aggttgatta tgacatgcaa ggtgatggaagcggcaggag agaacatgca gactgctgat ttgtttacaaagagagaatt ag<210> 184
Arg
Met
Asn380Glu
His
Gln
Phe
Leu460Ser
Val
Ser
Asp
Ala540Asn
Leu Lys350Ile Ala365
Ser Arg
Gln Pro
Phe Ser
Leu Gln430Gln Asn445
Gln Asn
Ser Ser
Gly Gly
Gly Asn510Tyr Asp525
Ala GluAsp
335
Glu Ala
Leu Gly
Leu His
Gln Pro400His Gln415
Leu His
Asn Asn
His Pro
Ser Ser480Phe Val495
Thr ValMet ProSer Met
attcttcctttagtcaatgaacaacagcaaactcagatctataacaatacaagaaaaggcattcaacatgaaagaacttcgatggactggcgagaaaaggtagctgcactagaaggaaatggaaaagcagaacatggaaggaactttcaggaggactcaaaaagcaacactagaaacttcgaacatcaagaatttgaacaaacaattctcaacaaaaccaagaatcatcctgggaaataaataatgctgtgtggttttggtgtggaatga
accttctaatcaacatggaatgaagttccatgctacaccgtctcatgccatagtaatagttgaaactagtagagacatttaaggtatgaaccgccaaggttaagtactggagatgaaatgcggtttctctatggcaagcacactgaagaacgctgtaacaactgccaattgagaaaacgcctctagtaacacctcaaccatcaacaccaaacaaccatcttggtttgttttggtggtggttgaggaatttcggctggtcgctatgagaca
60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201632<211> 557<212> PRT
<213> Medicago trunculata<400> 184
Met Asn Asn Asn Trp Leu Ser Phe Pro Leu Ser Pro Thr His Ser Ser1 5 10 15
Leu Pro Ala His Asp Leu Gln Ala Thr Gln Tyr His Gln Phe Ser Leu
20 25 30
Gly Leu Val Asn Glu Asn Met Asp Asn Pro Phe Gln Asn His Asp Trp
35 40 45
Asn Leu Ile Asn Thr His Ser Ser Asn Glu Ile Pro Lys Val Ala Asp
50 55 60
Phe Leu Gly Val Ser Lys Ser Glu Asn Gln Ser Asp Leu Ala Ala Leu65 70 75 80
Asn Glu Ile His Ser Asn Asp Ser Asp Tyr Leu Phe Thr Asn Asn Ser
85 90 95
Leu Val Pro Met Gln Asn Pro Val Leu Asp Thr Pro Ser Asn Glu Tyr
100 105 110
Gln Glu Asn Ala Asn Ser Asn Leu Gln Ser Leu Thr Leu Ser Met Gly
115 120 125
Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly Glu Asn Ser Thr Asn
130 135 140
Thr Thr Val Glu Val Ala Pro Arg Arg Thr Leu Asp Thr Phe Gly Gln145 150 155 160
Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg
165 170 175
Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser
180 185 190
Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys
195 200 205
Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser
210 215 220
Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Leu Asp Glu225 230 235 240
Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ala Ile Arg Arg Lys
245 250 255
Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg
260 265 270
His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly
275 280 285
Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala
290 295 300
Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320
Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser
325 330 335
Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala
340 345 350
Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Glu Met Ile Ala Leu Gly
355 360 365
Ser Ser Thr Phe Gln Tyr Gly Thr Thr Ser Ser Asn Ser Arg Leu His
370 375 380
Ala Tyr Pro Leu Met Gln His His His Gln Phe Glu Gln Pro Gln Pro385 390 395 400
Leu Leu Thr Leu Gln Asn His Asp Ile Ser Ser His Phe Ser His Gln
405 410 415
Gln Asp Pro Leu His Gln Gly Tyr Ile Gln Thr Gln Leu Gln Leu His
420 425 430
Gln Gln Gln Ser Gly Gly Ser Ser Ser Tyr Ser Phe Gln Asn Asn Asn
435 440 445
Ile Asn Asn Ala Gln Phe Tyr Asn Gly Tyr Asn Leu Gln Asn His Pro
450 455 460
Ala Leu Leu Gln Gly Met Ile Asn Met Gly Ser Ser Ser Ser Ser Ser465 470 475
Val Leu Glu Asn Asn Asn Ser Thr Asn Asn Asn
485 490
Gly Ser Gly Phe Gly Met Ala Ser Asn Ala Thr
500 505
Gly Thr Ala Glu Glu Leu Gly Leu Val Lys Val
515 520
Thr Gly Gly Tyr Gly Gly Trp Ser Ala Ala Ala
530 535
Gln Thr Ser Asn Ser Gly Val Phe Thr Met Trp545 550 555
<210> 185<211> 2079<212> DNA<213> Oryza sativa<400> 185
atggccacca tgaacaactg gctggccttc tccctctccctctcagacca actccactct catctccgcc gccgccaccatccaccggcg acgtctgctt caacatcccc caagattggatcggcgctcg tcgccgagcc gaagctggag gacttcctcgcagcagcatc atcacggcgg caagggcggc gtgatcccgagcgagctccg gcagcagcgt cggctacctg taccctcctcttcgccgact ccgtcatggt ggccacctcc tcgcccgtcgggcggcggca tggtgagcgc cgccgccgcc gcggcggccactgtccatga tcaagaactg gctccggagc cagccggcgctctctgtcca tgaacatggc ggggacgacg acggcgcaggctcgccggcg caggggagcg aggccggacg acgcccgcgtgcgcacggag cgacgacggc gacgatggct ggtggtcgcaagcggcagcg ccggcgccgt ggttgccgtc ggctcggagtgtggaggccg gcgcggcggc ggcggcggcg aggaagtccgacatcgatct accgcggcgt gacaaggcat agatggacagtgggacaaca gctgcagaag agagggccaa actcgcaaggaaagaggaaa aagctgctag agcttatgat ttggctgctcacgacgacaa attttccggt aaataactat gaaaaggagcacaaggcagg agttcgtagc ctctttgaga aggaagagcatccatttacc gtggagtaac taggcatcac cagcatgggaagagttgcag ggaacaagga cctctacttg ggcaccttcagaggcgtacg acatcgcggc gatcaagttc cgggggctcaatgagccgct acgacgtcaa gagcatcctc gacagcgctggccaagcgcc tcaaggacgc cgaggccgcc gccgcctacgcacctcggcg gcgacggcgc ctacgccgcg cattacggccgccgcctggc cgaccatcgc gttccaggcg gcggcggcgcctttaccacc cgtacgcgca gccgctgcgt gggtggtgcagtgatcgcgg cggcgcacag cctgcaggat ctccaccaccgccgcgcatg acttcttctc gcaggcgatg cagcagcagcaacgcgtcgc tcgagcacag caccggctcc aactccgtcgggcggaggcg gcggctacat catggcgccg atgagcgccggtggcgagca gccacgatca cggcggcgac ggcgggaagcagctacctcg tcggcgcaga cgcctacggc ggcggcggcggcgatgacgc cggcgtcggc gccggccgcc acgagcagcacatggcgcac agctcttcag cgtctggaac gacacataa<210> 186<211> 692<212> PRT
<213> Oryza sativa<4 00> 186
Met Ala Thr Met Asn Asn Trp Leu Ala Phe Ser15 10
Gln Leu Pro Pro Ser Gln Thr Asn Ser Thr Leu
20 25
Thr Thr Thr Thr Ala Gly Asp Ser Ser Thr Gly
35 40
Ile Pro Gln Asp Trp Ser Met Arg Gly Ser Glu
480
Val Gly Gly Phe Val495
Ser Gly Asn Thr Val510
Asp Tyr Asp Met Pro525
Ala Ala Glu Ser Met540
Asn Asp
cgcaggatcaccaccaccgcgcatgagggggcggcatctcgcagcgccgccaagctcatctcgcccacgagtggcaacggcgcagccggcgcggcggcgccagagagcctaggagattaacaggcggcagtcgacacgttggaggtatgagtcgtcaaggtcaaatactgtggaggagatgtggtttctcgatggcaagcgcacgcaggaacgccgtcacccctccccgtacgtcggccgaccaccaccacgccgccgcaagcaggagcatcaacctcggacggcctcggtctacaacggtgtcggccacaggtgcagatccgggaggatgcgacatgac
gctcccgccgcggcgactccatcggagctccttctcggagcgcttgctacctcgctccagcggcgtcagccggcattggcgcaggcgctgcatggcgctcgtccacgtcgcgaggaaggccggcgccgtgcggccagagaggctcatctttggttatgacgggcccgacggaagcacatgcagaggtgcaaaggataggaggaggcggcgcaacttcgaccggcaccgcccatcgcctcgctcggccgcccgccgccgggggaccacgcccgccgccgcccagcatcgaccgacaatggcggccaccgcgggggtacgacgccatcctggcggagtctgc
601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801740180018601920198020402079
Leu Ser Pro Gln Asp15
Ile Ser Ala Ala Ala30
Asp Val Cys Phe Asn45
Leu Ser Ala Leu Val50 55 60
Ala Glu Pro Lys Leu Glu Asp Phe Leu Gly Gly Ile Ser Phe Ser Glu65 70 75 80
Gln Gln His His His Gly Gly Lys Gly Gly Val Ile Pro Ser Ser Ala
85 90 95
Ala Ala Cys Tyr Ala Ser Ser Gly Ser Ser Val Gly Tyr Leu Tyr Pro
100 105 110
Pro Pro Ser Ser Ser Ser Leu Gln Phe Ala Asp Ser Val Met Val Ala
115 120 125
Thr Ser Ser Pro Val Val Ala His Asp Gly Val Ser Gly Gly Gly Met
130 135 140
Val Ser Ala Ala Ala Ala Ala Ala Ala Ser Gly Asn Gly Gly Ile Gly145 150 155 160
Leu Ser Met Ile Lys Asn Trp Leu Arg Ser Gln Pro Ala Pro Gln Pro
165 170 175
Ala Gln Ala Leu Ser Leu Ser Met Asn Met Ala Gly Thr Thr Thr Ala
180 185 190
Gln Gly Gly Gly Ala Met Ala Leu Leu Ala Gly Ala Gly Glu Arg Gly
195 200 205
Arg Thr Thr Pro Ala Ser Glu Ser Leu Ser Thr Ser Ala His Gly Ala
210 215 220
Thr Thr Ala Thr Met Ala Gly Gly Arg Lys Glu Ile Asn Glu Glu Gly225 230 235 240
Ser Gly Ser Ala Gly Ala Val Val Ala Val Gly Ser Glu Ser Gly Gly
245 250 255
Ser Gly Ala Val Val Glu Ala Gly Ala Ala Ala Ala Ala Ala Arg Lys
260 265 270
Ser Val Asp Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr
275 280 285
Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser
290 295 300
Cys Arg Arg Glu Gly Gln Thr Arg Lys Gly Arg Gln Gly Gly Tyr Asp305 310 315 320
Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr
325 330 335
Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Asn Asn Tyr Glu Lys
340 345 350
Glu Leu Glu Glu Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ser
355 360 365
Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg
370 375 380
Gly Val Thr Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly385 390 395 400
Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Gln
405 410 415
Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly
420 425 430
Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ser
435 440 445
Ile Leu Asp Ser Ala Ala Leu Pro Val Gly Thr Ala Ala Lys Arg Leu
450 455 460
Lys Asp Ala Glu Ala Ala Ala Ala Tyr Asp Val Gly Arg Ile Ala Ser465 470 475 480
His Leu Gly Gly Asp Gly Ala Tyr Ala Ala His Tyr Gly His His His
485 490 495
His Ser Ala Ala Ala Ala Trp Pro Thr Ile Ala Phe Gln Ala Ala Ala
500 505 510
Ala Pro Pro Pro His Ala Ala Gly Leu Tyr His Pro Tyr Ala Gln Pro
515 520 525
Leu Arg Gly Trp Cys Lys Gln Glu Gln Asp His Ala Val Ile Ala Ala
530 535 540
Ala His Ser Leu Gln Asp Leu His His Leu Asn Leu Gly Ala Ala Ala545 550 555 560Ala Ala His Asp Phe Phe Ser Gln Ala Met Gln
565 570
Gly Ser Ile Asp Asn Ala Ser Leu Glu His Ser
580 585
Val Val Tyr Asn Gly Asp Asn Gly Gly Gly Gly
595 600
Ala Pro Met Ser Ala Val Ser Ala Thr Ala Thr
610 615
His Asp His Gly Gly Asp Gly Gly Lys Gln Val625 630 635
Ser Tyr Leu Val Gly Ala Asp Ala Tyr Gly Gly
645 650
Met Pro Ser Trp Ala Met Thr Pro Ala Ser Ala
660 665
Ser Ser Asp Met Thr Gly Val Cys His Gly Ala
675 680
Trp Asn Asp Thr
690<210> 187<211> 2133<212> DNA<213> Zea mays<4 00> 187
atggccactg tgaacaactg gctcgctttc tccctctccccagacgacgg actccacact catctcggcc gccaccgccgtgcttcaaca tcccccaaga ttggagcatg aggggatcaggagccgaagc tggaggactt cctcggcggc atctccttctaactgcaaca tgatacccag cactagcagc acagtttgctaccggctacc atcaccagct gtaccaccag cccaccagcttccgtaatgg tggcctcctc ggccggtgtc cacgacggcggccgctaacg gtgtcgctgg cgctgccagt gccaacggcgattaagaact ggctgcggag ccaaccggcg cccatgcagcggcgcgcagg ggctctcttt gtccatgaac atggcggggaatgccacttc tcgctggaga gcgcgcacgg gcgcccgagaggtggagccg tcgtcgtcac ggcgccgaag gaggatagcggctctagtag ccgtgagcac ggacacgggt ggcagcggcggcaaggaaga cggtggacac gttcgggcag cgcacgtcgacatagatgga ctgggagata tgaggcacat ctttgggatacaaactcgta agggtcgtca agtctattta ggtggctatgagggcttatg atcttgctgc tctgaagtac tggggtgccagtgagtaact acgaaaagga gctcgaggac atgaagcacagcgtctctga gaaggaagag cagtggtttc tccagaggtgactaggcatc accaacatgg aagatggcaa gcacggattggatctttact tgggcacctt cagcacccag gaggaggcaggcgatcaagt tccgcggcct caacgccgtc accaacttcgaagagcatcc tggacagcag cgccctcccc atcggcagcggccgaggccg cagcgtccgc gcagcaccac cacgccggcgcgcatcgcct cgcagctcgg cgacggcgga gccctggcggcacggcgccg cctggccgac catcgcgttc cagccgggcgcacccgtacg cgcagcagcc aatgcgcggc ggcgggtggtgcggtgatcg cggccgcgca cagcctgcag gacctccaccggcgcgcacg actttttctc ggcagggcag caggccgccgggtagcatcg acagtgcgtc gctcgagcac agcaccggctggcggggtcg gcgacagcaa cggcgccagc gccgtcggcgatgccgatga gcgctgccgg agcaaccact acatcggcaacatgcacggg cctacgacga agccaagcag gctgctcagagtgaacgcgg agaacaatgg tggcggaagg atgtctgcatgccgcggcgg cagcagcaag cagcaacgac aacatggccggcgcagctct tcagtgtctg gaacgacact taa<210> 188<211> 710<212> PRT<213> Zea mays
Gln Gln His
Thr Gly Ser590
Gly Gly Tyr605
Ala Val Ala620
Gln Met Gly
Gly Gly Ala
Pro Ala Ala670
Gln Leu Phe685
Gly Leu575
Asn Ser
Ile Met
Ser Ser
Tyr Asp640Gly Arg655
Thr SerSer Val
cgcaggagct gccgccctcc 60accatgtctc cggcgatgtc 120agctttcggc gctcgtcgcg 180ccgagcagca tcacaaggcc 240acgcgagctc aggtgctagc 300cagcgctcca cttcgcggac 360gtgccatgct cagcgcggcc 420gcggcatcgg gctgtccatg 480cgagggtggc ggcggctgag 540cgacccaagg cgctgctggc 600gtgtatcgac gtcagcacag 660gtggcagcgg tgttgccggc 720gcgcgtcggc tgacaacacg 780tttaccgtgg cgtgacaagg 840acagttgcag aagggaaggg 900ataaagagga gaaagctgct 960caacaacaac aaattttcca 1020tgacaaggca ggagtttgta 1080catccattta caggggagtg 1140gacgagttgc agggaacaag 1200cggaggcgta cgacatcgcg 1260acatgagccg ctacgacgtg 1320ccgccaagcg cctcaaggag 1380tggtgagcta cgacgtcggc 1440cggcgtacgg cgcgcactac 1500ccgccagcac aggcctgtac 1560gcaagcagga gcaggaccac 1620acctgaacct gggcgcggcc 1680ccgctgcgat gcacggcctg 1740ccaactccgt cgtctacaac 1800gcagtggcgg tggctacatg 1860tggtgagcca cgagcaggtg 1920tggggtacga gagctacctg 1980gggggactgt cgtgtctgca 2040ccgacgtcgg ccatggcggc 2100 2133<400> 188
Met Ala Thr Val Asn Asn Trp Leu Ala Phe Ser Leu Ser Pro Gln Glu1 5 10 15
Leu Pro Pro Ser Gln Thr Thr Asp Ser Thr Leu Ile Ser Ala Ala Thr
20 25 30
Ala Asp His Val Ser Gly Asp Val Cys Phe Asn Ile Pro Gln Asp Trp
35 40 45
Ser Met Arg Gly Ser Glu Leu Ser Ala Leu Val Ala Glu Pro Lys Leu
50 55 60
Glu Asp Phe Leu Gly Gly Ile Ser Phe Ser Glu Gln His His Lys Ala65 70 75 80
Asn Cys Asn Met Ile Pro Ser Thr Ser Ser Thr Val Cys Tyr Ala Ser
85 90 95
Ser Gly Ala Ser Thr Gly Tyr His His Gln Leu Tyr His Gln Pro Thr
100 105 110
Ser Ser Ala Leu His Phe Ala Asp Ser Val Met Val Ala Ser Ser Ala
115 120 125
Gly Val His Asp Gly Gly Ala Met Leu Ser Ala Ala Ala Ala Asn Gly
130 135 140
Val Ala Gly Ala Ala Ser Ala Asn Gly Gly Gly Ile Gly Leu Ser Met145 150 155 160
Ile.. Lys Asn Trp Leu Arg Ser Gln Pro Ala Pro Met Gln Pro Arg Val
165 170 175
Ala Ala Ala Glu Gly Ala Gln Gly Leu Ser Leu Ser Met Asn Met Ala
180 185 190
Gly Thr Thr Gln Gly Ala Ala Gly Met Pro Leu Leu Ala Gly Glu Arg
195 200 205
Ala Arg Ala Pro Glu Ser Val Ser Thr Ser Ala Gln Gly Gly Ala Val
210 215 220
Val Val Thr Ala Pro Lys Glu Asp Ser Gly Gly Ser Gly Val Ala Gly225 230 235 240
Ala Leu Val Ala Val Ser Thr Asp Thr Gly Gly Ser Gly Gly Ala Ser
245 250 255
Ala Asp Asn Thr Ala Arg Lys Thr Val Asp Thr Phe Gly Gln Arg Thr
260 265 270
Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu
275 280 285
Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Thr Arg Lys
290 295 300
Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala305 310 315 320
Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Ala Thr Thr Thr
325 330 335
Thr Asn Phe Pro Val Ser Asn Tyr Glu Lys Glu Leu Glu Asp Met Lys
340 345 350
His Met Thr Arg Gln Glu Phe Val Ala Ser Leu Arg Arg Lys Ser Ser
355 360 365
Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His
370 375 380
Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys385 390 395 400
Asp Leu Tyr Leu Gly Thr Phe Ser Thr Gln Glu Glu Ala Ala Glu Ala
405 410 415
Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn
420 425 430
Phe Asp Met Ser Arg Tyr Asp Val Lys Ser Ile Leu Asp Ser Ser Ala
435 440 445
Leu Pro Ile Gly Ser Ala Ala Lys Arg Leu Lys Glu Ala Glu Ala Ala
450 455 460
Ala Ser Ala Gln His His His Ala Gly Val Val Ser Tyr Asp Val Gly465 470 475 480
Arg Ile Ala Ser Gln Leu Gly Asp Gly Gly Ala Leu Ala Ala Ala Tyr485 490 495Gly Ala His Tyr His Gly Ala Ala Trp Pro Thr
500 505
Gly Ala Ala Ser Thr Gly Leu Tyr His Pro Tyr
515 520
Arg Gly Gly Gly Trp Cys Lys Gln Glu Gln Asp
530 535
Ala Ala His Ser Leu Gln Asp Leu His His Leu545 550 555
Gly Ala His Asp Phe Phe Ser Ala Gly Gln Gln
565 570
Met His Gly Leu Gly Ser Ile Asp Ser Ala Ser
580 585
Gly Ser Asn Ser Val Val Tyr Asn Gly Gly Val
595 600
Ala Ser Ala Val Gly Gly Ser Gly Gly Gly Tyr
610 615
Ala Ala Gly Ala Thr Thr Thr Ser Ala Met Val625 630 635
His Ala Arg Ala Tyr Asp Glu Ala Lys Gln Ala
645 650
Glu Ser Tyr Leu Val Asn Ala Glu Asn Asn Gly
660 665
Ala Trp Gly Thr Val Val Ser Ala Ala Ala Ala
675 680
Asn Asp Asn Met Ala Ala Asp Val Gly His Gly
690 695
Ser Val Trp Asn Asp Thr705 710
<210> 189<211> 1374<212> DNA
<213> Lotus corniculatus<4 00> 189
agatctctct ctgcagtgca caatccagtg gtaagcacatcaagaaaatg gtaatggtaa tttgcaatcg ttgacattattcaacatgtg aaaccagtgg tgacactagt accaacactaaccttggaga catttgggca aagaacatct atatatcgagaccggaaggt atgaagctca cctttgggac aatagctgtaaaaggtcgcc aaggtggata tgataaagaa gacaaagcaggcccttaagt actgggggac atccactact accaactttcgaagtggatg acatgaagca tatgacaaga caagaatttgagcagtggtt tctcgagggg tgcttcaatg tatcgtggaggggaggtggc aagcaaggat tggaagagtt gcaggaaacattcggtactg aggaagaggc ggcagaagct tacgacatagcttaacgcca tcaccaactt tgacatgaac cgttacgatgaacaccctcc caatcggagg aggagcttca aaaaggctaatcttcaagaa aacgtgaaga tcagatgatt gcactcggctattgcaaccc catcaagctc tacaaggcca caaccttacccacaatcagt ttgaacaaca gcctcaacca tttctaaccttctcaatact cccatcatca gcaggaccct tcgtttcagccttcagttgc agttgaatca acacggtggt ggtggttctacctcatcaga acagtgagtt ctataatggt ggaaattattatgatgatga acaatagtat ggggtcttgt tcttcatcgtaatgctgctg ctggtggggc ttcttttgtg ggtcccgcagaaggttgatt atgacatgga tgctgctgct ggcggtggttgagtccatgc acacgtcggc ggctggtggt ttgtttacta<210> 190<211> 457<212> PRT
<213> Lotus corniculatus<400> 190
Arg Ser Leu Ser Ala Val His Asn Pro Val Val1 5 10
Ile
Ala
His540Asn
Ala
Leu
Gly
Met620Ser
Ala
Gly
Ala
Gly700
Ala Phe510Gln Gln525
Ala Val
Leu Gly
Ala Ala
Glu His590Asp Ser605
Met Pro
His Glu
Gln Met
Gly Arg670Ala Ala685
Ala Gln
Gln Pro
Pro Met
Ile Ala
Ala Ala560Ala Ala575
Ser Thr
Asn Gly
Met Ser
Gln Val640Gly Tyr655
Met SerSer SerLeu Phe
gtagtaatggccatgggaagtcgaagctgtgtgtaacaaggaagggaaggctagggcctacggttagcaatggcttccatttacaaggcaaagatctttactgcgataaatgaaagccataagaaactcacaacatttcacgctaaaccttacaaaaccaagagttacatgttatgctcaaccttcagaactgtgttggacggaggaactatggtggttgtgtggaatga
taatgagtcttggtaaggatgcctagaagaacatagatggacagtcaaggtgatttagctctatgagaagtagaaggaaatcatcaacatcttgggaactgttcagaggctctagagagcagctctggaatcaatacggaaatgcatcattgacattaattcaaacacagagaaacagctccttcagggagaatgatcattgggttggttgtcagcggcggtga
601201802403003604204805406006607207808409009601020108011401200126013201374
Ser Thr Cys Ser Asn1 5Gly Asn Glu Ser Gln Glu Asn Gly Asn Gly Asn Leu Gln Ser Leu Thr
20 25 30
Leu Ser Met Gly Ser Gly Lys Asp Ser Thr Cys Glu Thr Ser Gly Asp
35 40 45
Thr Ser Thr Asn Thr Ile Glu Ala Val Pro Arg Arg Thr Leu Glu Thr
50 55 60
Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp65 70 75 80
Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu
85 90 95
Gly Gln Ser Arg Lys Gly Arg Gln Gly Gly Tyr Asp Lys Glu Asp Lys100 105 110
Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser 115 120 125 Thr Thr Thr Asn Phe Pro Val Ser Asn Tyr Glu Lys Glu Val Asp Asp 130 135 140 Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ser Ile Arg Arg Lys145 150 155 160Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg 165 170 175 His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly 180 185 190 Asn Lys Asp Leu Tyr Leu Gly Thr Phe Gly Thr Glu Glu Glu Ala Ala 195 200 205 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Ile 210 215 220 Thr Asn Phe Asp Met Asn Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser225 230 235 240Asn Thr Leu Pro Ile Gly Gly Gly Ala Ser Lys Arg Leu Lys Glu Thr 245 250 255 Gln Ala Leu Glu Ser Ser Arg Lys Arg Glu Asp Gln Met Ile Ala Leu 260 265 270 Gly Ser Thr Phe His Gln Tyr Gly Ile Ala Thr Pro Ser Ser Ser Thr 275 280 285 Arg Pro Gln Pro Tyr Pro Leu Asn Leu Met His His His Asn Gln Phe 290 295 300 Glu Gln Gln Pro Gln Pro Phe Leu Thr Leu Gln Asn His Asp Ile Asn305 310 315 320Ser Gln Tyr Ser His His Gln Gln Asp Pro Ser Phe Gln Gln Ser Tyr 325 330 335 Ile Gln Thr Gln Leu Gln Leu Gln Leu Asn Gln His Gly Gly Gly Gly 340 345 350 Ser Ser Tyr Ala Gln Glu Thr Ala Pro His Gln Asn Ser Glu Phe Tyr 355 360 365 Asn Gly Gly Asn Tyr Tyr Leu Gln Asn Leu Gln Gly Met Met Met Asn 370 375 380 Asn Ser Met Gly Ser Cys Ser Ser Ser Ser Val Leu Glu Asn Asp His385 390 395 400Asn Ala Ala Ala Gly Gly Ala Ser Phe Val Gly Pro Ala Ala Glu Glu 405 410 415 Leu Gly Leu Val Lys Val Asp Tyr Asp Met Asp Ala Ala Ala Gly Gly 420 425 430 Gly Tyr Gly Gly Trp Ser Ala Ala Glu Ser Met His Thr Ser Ala Ala 435 440 445 Gly Gly Leu Phe Thr Met Trp Asn Glu 450 455
<210> 191
<211> 202<212> PRT
<213> Seqüência artificial<220>
<223> Domínio AP2 de Arath_PLTl e Arath_PLT2<220><221> VARIANTE
<222> (4)..(4)
<223> /substituir = "Thr"
<220>
<221> VARIANTE<222> (6)..(6)<223> /substituir = "Glu"<220>
<221> VARIANTE
<222> (57)..(57)
<223> /substituir = "Glu"
<220>
<221> VARIANTE
<222> (62)..(62)
<223> /substituir = "Ala"
<220>
<221> VARIANTE
<222> (93)..(93)
<223> /substituir = "Asn"
<220>
<221> VARIANTE<222> (102)..(102)<223> /substituir = "Ser"<220>
<221> VARIANTE<222> (187)..(187)<223> /substituir = "Asn"<4 00> 191
Pro Arg Arg Ala Leu Asp Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg15 10 15
Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp
20 25 30
Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val
35 40 45
Tyr Leu Gly Gly Tyr Asp Lys Glu Asp Lys Ala Ala Arg Ser Tyr Asp
50 55 60
Leu Ala Ala Leu Lys Tyr Trp Gly Pro Ser Thr Thr Thr Asn Phe Pro65 70 75 80
Ile Thr Asn Tyr Glu Lys Glu Val Glu Glu Met Lys His Met Thr Arg
85 90 95
Gln Glu Phe Val Ala Ala Ile Arg Arg Lys Ser Ser Gly Phe Ser Arg
100 105 110
Gly Ala Ser Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg
115 120 125
Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu
130 135 140
Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala145 150 155 160
Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile Asn
165 170 175
Arg Tyr Asp Val Lys Ala Ile Leu Glu Ser Ser Thr Leu Pro Ile Gly
180 185 190
Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala
195 200
<210> 192<211> 8<212> PRT
<213> Seqüência artificial<220>
<223> motivo 1<220>
<221> VARIANTE<222> (3)..(3)<223> /substituir = "Leu"<220>
<221> VARIANTE<222> (4) . . (4)<223> /substituir = "Glu"<4 00> 192
Pro Lys Val Ala Asp Phe Leu Gly
1 5
<210> 193
<211> 7
<212> PRT
<213> Seqüência artificial<220>
<223> motivo 2<220>
<221> VARIANTE
<222> (1)..(1)
<223> /substituir = "Leu"
<220>
<221> VARIANTE<222> (3)..(3)<223> /substituir = "Ser"<220>
<221> VARIANTE<222> (4)..(4)<223> /substituir = "Vai"<220>
<221> VARIANTE<222> (7)..(7)<223> /substituir = "Glu"<4 00> 193
Val Phe Thr Met Trp Asn Asp
1 5
<210> 194
<211> 2193
<212> DNA
<213> Oryza sativa
<4 00> 194
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160tggtgtagct tgccactttc accagcaaag ttc 2193
<210> 195<211> 54<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: PRM08180<4 00> 195
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgat caatccacac ggtg 54
<210> 196<211> 50<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: PRM08181<4 00> 196
ggggaccact ttgtacaaga aagctgggtt ccttgtttac tcattccaca 50
<210> 197<211> 56<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: PRM08182<400> 197
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa ttctaacaac tggctc 56
<210> 198<211> 50<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: PRM08183<4 00> 198
ggggaccact ttgtacaaga aagctgggtt catcttttat tcattccaca 50
<210> 199<211> 1638<212> DNA
<213> Populus tremuloides<4 00> 199
atgaattcta acaactggct ttcatttcct ctttctccta ctcatccttc cttgcctgct 60
catctacatg catcccaccc tcatcaattc tctctagggt tagtcaatga taatatggaa 120aacccatttc aaactcaaga gtggagtctt cttaacactc atcaaggcaa caatgaagtg 180ccaaaggttg cagactttct tggtgtgagc aaatctgaga atcaatcaga tcttgtagcc 240ttcaatgaaa ttcaagctaa tgaatctgac tatctctttt caaacaatag tctagtacca 300gtccaaaatg ctgttgtagg cgccaataat acctttgagt ttcaagaaaa tgctagcaat 360ttgcagtcat taacattgtc tatgggcagt gctagtggta aaggttctac atgtgaaccc 420agtggggata atagcactaa tactgttgaa gctgctgcac caagaagaac tttggataca 480tttgggcaaa gaacatccat atatcgtggt gtaacaaggc atcgatggac aggaaggtat 540gaagctcatt tatgggataa tagttgcaga agagaaggtc aatctaggaa aggaagacag 600ggtggctatg acaaagaaga aaaggcagct agggcttatg atcttgctgc acttaagtac 660tggggaacat ccaccactac caattttcca atcagcaact acgagaaaga aatagaggaa 720atgaagcaca tgaccaggca agaatttgtg gcctccatta gaaggaagag tagtggcttc 780tctaggggtg catccatgta tcgtggagtt acaaggcatc accagcatgg tagatggcaa 840gcaaggatag gcagagttgc aggaaacaaa gatctctact tgggaacttt tagcactgag 900gaggaggctg cagaagctta tgacatagca gcaataaagt ttagagggct taatgcagtg 960actaactttg acatgaatcg atatgatgtg aagagcattc ttgaaagcaa tactttgcca 1020attggaggag gggcagccaa acggctaaag gaggctcaag caattgaatc atcacgaaaa 1080agagaagaaa tgattgctct tggctcaagt tttccatatg gatcaacttc aagctctagc 1140aggctacaag cttaccctct aatgcagaca ccatttgagc aacctcaacc tttacttact 1200ctacaaaatc aagacatttc tcagtacact caggattcct catcattcca ccaaaatttc 1260cttcaaacac agcttcattt gcaccagcaa tctacagggt ctaatttcct gcataaccaa 1320tcaaaccaaa accctcaata ttacaatagt tatatccaaa acaatccagc tttacttcat 1380ggattgtgga acatgggttc ttcatcatct gtaatggaga ataatggaag ttctagtggg 1440agctatagta ctggaggtta tctgggaaat gggctgggaa tggcttccaa ttcaacaggg 1500tctaatgcag .taggatcagc cgaggaactt gcacttgtca aagttgatta tgatatgcct 1560tctagtggct atggaagctg gtctggggac tcagtccagg gatccaatcc aggtgttttc 1620actatgtgga atgagtga 1638
<210> 200<211> 545<212> PRT
<213> Populus tremuloides<400> 200
Met Asn Ser Asn Asn Trp Leu Ser Phe Pro Leu Ser Pro Thr His Pro15 10 15
Ser Leu Pro Ala His Leu His Ala Ser His Pro His Gln Phe Ser Leu
20 25 30
Gly Leu Val Asn Asp Asn Met Glu Asn Pro Phe Gln Thr Gln Glu Trp
35 40 45
Ser Leu Leu Asn Thr His Gln Gly Asn Asn Glu Val Pro Lys Val Ala
50 55 60
Asp Phe Leu Gly Val Ser Lys Ser Glu Asn Gln Ser Asp Leu Val Ala65 70 75 80
Phe Asn Glu Ile Gln Ala. Asn Glu Ser Asp Tyr Leu Phe Ser Asn Asn
85 90 95
Ser Leu Val Pro Val Gln Asn Ala Val Val Gly Ala Asn Asn Thr Phe
100 105 110
Glu Phe Gln Glu Asn Ala Ser Asn Leu Gln Ser Leu Thr Leu Ser Met
115 120 125
Gly Ser Ala Ser Gly Lys Gly Ser Thr Cys Glu Pro Ser Gly Asp Asn
130 135 140
Ser Thr Asn Thr Val Glu Ala Ala Ala Pro Arg Arg Thr Leu Asp Thr145 150 155 160
Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp
165 170 175
Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu
180 185 190
Gly Gln Ser Arg Lys Gly Arg Gln Gly Gly Tyr Asp Lys Glu Glu Lys
195 200 205
Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Thr Ser
210 215 220
Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu Ile Glu Glu225 230 235 240
Met Lys His Met Thr Arg Gln Glu Phe Val Ala Ser Ile Arg Arg Lys
245 250 255
Ser Ser Gly Phe Ser Arg Gly Ala Ser Met Tyr Arg Gly Val Thr Arg
260 265 270
His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly
275 280 285
Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala
290 295 300
Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val305 310 315 320
Thr Asn Phe Asp Met Asn Arg Tyr Asp Val Lys Ser Ile Leu Glu Ser
325 330 335
Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala340 345 350Gln Ala Ile Glu Ser Ser Arg Lys Arg Glu Glu
355 360
Ser Ser Phe Pro Tyr Gly Ser Thr Ser Ser Ser
370 375
Tyr Pro Leu Met Gln Thr Pro Phe Glu Gln Pro385 390 395
Leu Gln Asn Gln Asp Ile Ser Gln Tyr Thr Gln
405 410
His Gln Asn Phe Leu Gln Thr Gln Leu His Leu
425
Met
Ser380Gln
AspHis
Gly Ser Asn Phe Leu His Asn Gln Ser Asn Gln Asn
420
435
440
Asn Ser Tyr Ile Gln Asn Asn Pro Ala Leu Leu
450
455
Met Gly Ser Ser Ser Ser Val Met Glu Asn Asn465 470 475
Ser Tyr Ser Thr Gly Gly Tyr Leu Gly Asn Gly
485 490
Asn Ser Thr Gly Ser Asn Ala Val Gly Ser Ala
500 505
Val Lys Val Asp Tyr Asp Met Pro Ser Ser Gly
515 520
Gly Asp Ser Val Gln Gly Ser Asn Pro Gly Val530 535
Glu545<210> 201<211> 1515<212> DNA
<213> Populus tremuloides<400> 201
atgttttttt ttttgtttcc tttagagtgg agtcttcttagtgccaaagg ttgcagattt tcttggtgta agtaaatctggccttcaatg aaattcaagc cagtgattct gagtatctctccggtccaaa atgctgtggt agccgccagt actaactacgaatttgcagt cattaacatt gtctatgggc agtgctagtgaccagtggtg ataatagtac taattctgtc gaagctgctgacatttggtc aaagaacatc catctatcgt ggtgtaacaatatgaagctc atttatggga taatagttgc agaagagaagcaaggtggct atgacaaaga agacaaggct gctagggctttactggggaa catcgaccac taccaatttt cctatcagcagacatgaaga acatgaccag acaagaattt gtggcctccattctctaggg gtgcatccat gtatcgtgga gtcacaaggccaagcaagaa ttggtagagt tgcaggaaac aaagatctctgaggaggagg ctgcagaagc ttatgacata gcagcaataagtgactaatt ttgacatgaa tcgatatgat gtgaaaagcaccaattggag gaggggcagc caaaaggcta aaggaggctcaaacgagaag aaatgattgc tcttggatca agttatccatagtcgacaac aagcttactc tctaatgcag aaaccatttgactctacaaa atcaagacat ttctcagtac actcaagattcttcaaacac agcttcattt gcaccagcta tctgcagggtcaatcaagcc aaaatcctca gtattacaac agctatatcccatggattgt ggaacatggg ttcttcatca tctctaatgggggagttata gtactgtcgg ttatctggga aatgggttgggggtctaatg cagtagctga ggaacttcca cttgttaagaggtggctatg gaagttggtc tggggaatca gttcagggatatgtggaatg agtga<210> 202<211> 504<212> PRT
<213> Populus tremuloides<400> 202
Met Phe Phe Phe Leu Phe Pro Leu Glu Trp Ser
His460Gly
Leu
Glu
Tyr
Phe540
Ile365Arg
Pro
Ser
Gln
Pro445Gly
Ser
Gly
Glu
Gly525Thr
Ala Leu
Leu Gln
Leu Leu
Ser Ser415'Gln Ser430
Gln Tyr
Leu Trp
Ser Ser
Met Ala495Leu Ala510
Ser Trp
Gly
Ala
Thr400Phe
Thr
Tyr
Asn
Gly480Ser
LeuSerMet Trp Asn
acactcaaggagaatcaatctttcaagcaaaatttcaagagtaagggttcctccaagaagggcatcgatggtcaatccagatgatcttgcactatgagaattagaaggaaatcaccaacaacttgggaacagtttagaggttcttgagagaagcaatcgaatggatcaacagcaacctcacttcatttcactaatttcctaaaacaatccagaataatgggaatggctactagattatgaccaacccagg
caacaatgaaagatctcgtatagtctgttgaaatcctagctaaatgtgaagactttggatgacaggaagggaaaggaagatgcacttaagagaactagaggagtagtggctggaagatggttttagcactgcttaatgcacaatagtttgatcgtcacaattcaagctctacctttacttgcaaaattacgcataataaccactttgcttcagttctagtcaattcaacatatgccttcttgtttttaca
601201802403003604204805406006607207808409009601020108011401200126013201380144015001515
Leu Leu Asn Thr Gln1 5 10 15
Gly Asn Asn Glu Val Pro Lys Val Ala Asp Phe Leu Gly Val Ser Lys
20 25 30
Ser Glu Asn Gln Ser Asp Leu Val Ala Phe Asn Glu Ile Gln Ala Ser
35 40 45
Asp Ser Glu Tyr Leu Phe Ser Ser Asn Ser Leu Leu Pro Val Gln Asn
50 55 60
Ala Val Val Ala Ala Ser Thr Asn Tyr Glu Phe Gln Glu Asn Pro Ser65 70 75 80
Asn Leu Gln Ser Leu Thr Leu Ser Met Gly Ser Ala Ser Gly Lys Gly
85 90 95
Ser Lys Cys Glu Thr Ser Gly Asp Asn Ser Thr Asn Ser Val Glu Ala
100 105 110
Ala Ala Pro Arg Arg Thr Leu Asp Thr Phe Gly Gln Arg Thr Ser Ile
115 120 125
Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His
130 135 140
Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg145 150 155 160
Gln Gly Gly Tyr Asp Lys Glu Asp Lys Ala Ala Arg Ala Tyr Asp Leu
165 170 175
Ala Ala Leu Lys Tyr Trp Gly Thr Ser Thr Thr Thr Asn Phe Pro Ile
180 185 190
Ser Asn Tyr Glu Lys Glu Leu Glu Asp Met Lys Asn Met Thr Arg Gln
195 200 205
Glu Phe Val Ala Ser Ile Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly
210 215 220
Ala Ser Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp225 230 235 240
Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly
245 250 255
Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala
260 265 270
Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Met Asn Arg
275 280 285
Tyr Asp Val Lys Ser Ile Leu Glu Ser Asn Ser Leu Pro Ile Gly Gly
290 295 300
Gly Ala Ala Lys Arg Leu Lys Glu Ala Gln Ala Ile Glu Ser Ser Gln305 310 315 320
Lys Arg Glu Glu Met Ile Ala Leu Gly Ser Ser Tyr Pro Tyr Gly Ser
325 330 335
Thr Ser Ser Ser Ser Arg Gln Gln Ala Tyr Ser Leu Met Gln Lys Pro
340 345 350
Phe Glu Gln Pro Gln Pro Leu Leu Thr Leu Gln Asn Gln Asp Ile Ser
355 360 365
Gln Tyr Thr Gln Asp Ser Ser Phe Gln Gln Asn Tyr Leu Gln Thr Gln
370 375 380
Leu His Leu His Gln Leu Ser Ala Gly Ser Asn Phe Leu His Asn Asn385 390 395 400
Gln Ser Ser Gln Asn Pro Gln Tyr Tyr Asn Ser Tyr Ile Gln Asn Asn
405 410 415
Pro Thr Leu Leu His Gly Leu Trp Asn Met Gly Ser Ser Ser Ser Leu
420 425 430
Met Glu Asn Asn Gly Ser Ser Ser Gly Ser Tyr Ser Thr Val Gly Tyr
435 440 445
Leu Gly Asn Gly Leu Gly Met Ala Thr Asn Ser Thr Gly Ser Asn Ala
450 455 460
Val Ala Glu Glu Leu Pro Leu Val Lys Ile Asp Tyr Asp Met Pro Ser465 470 475 480
Gly Gly Tyr Gly Ser Trp Ser Gly Glu Ser Val Gln Gly Ser Asn Pro
485 490 495
Gly Val Phe Thr Met Trp Asn Glu500<210> 203<211> 785<212> DNA
<213> Vitis vinifera<400> 203
tcttgataaa tcccaaaact gactgtgtag gtactgagga ggaagctgca gaagcctatg 60
atattgcagc aataaagttc agaggcctta atgcagtgac caactttgac atgaatcgat 120acgatgtgaa gagcattctt gaaagcaaca ctcttccgat aggtggggga gcggccaagc 180ggctaaagga ggctcaagca attgaatcat caagaaaacg ggaagaaatg atagccctag 240gttcaagttt ccaatatggg agctcgagct ctagcaggtt acagacatat cctctaatgc 300agcagcagtt tgagcaacct cagcctttac taacattaca gaaccaagaa ccattactaa 360ctttgcaaaa ccctgaaatt tctcagtacc cccaagactc ccagtttcac caaaactaca 420tccaaactca gttgcagttg caccagcaat ctgggtcgta cctgaaccat tcaagccaaa 480gtcctcagtt ctacaacagt tacctccaca acaacccggc tcttcttcat gggctgatga 540gtatgggctc ttcttcatct gtcatggaga ataatgggag ttctagtggg agttacaatg 600gaggmtactt caataatgga cttggggttg cttcgaattc tacggtggct agtgcagtag 660gatcagcaga ggagcttccc ctcatcaagg ttgattacga tatgccggcc gcaggctatg 720gcagctggtc aggtgactca gttcagggac agaatgctgg agtttttaca atgtggaatg 780actga 785
<210> 204<211> 260<212> PRT
<213> Vitis vinifera<400> 204
Leu Ile Asn Pro Lys Thr Asp Cys Val Gly Thr Glu Glu Glu Ala Ala1 5 10 15 Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val 20 25 30 Thr Asn Phe Asp Met Asn Arg Tyr Asp Val Lys Ser Ile Leu Glu Ser 35 40 45 Asn Thr Leu Pro Ile Gly Gly Gly Ala Ala Lys Arg Leu Lys Glu Ala 50 55 60 Gln Ala Ile Glu Ser Ser Arg Lys Arg Glu Glu Met Ile Ala Leu Gly65 70 75 80Ser Ser Phe Gln Tyr Gly Ser Ser Ser Ser Ser Arg Leu Gln Thr Tyr 85 90 95 Pro Leu Met Gln Gln Gln Phe Glu Gln Pro Gln Pro Leu Leu Thr Leu 100 105 110 Gln Asn Gln Glu Pro Leu Leu Thr Leu Gln Asn Pro Glu Ile Ser Gln 115 120 125 Tyr Pro Gln Asp Ser Gln Phe His Gln Asn Tyr Ile Gln Thr Gln Leu 130 135 140 Gln Leu His Gln Gln Ser Gly Ser Tyr Leu Asn His Ser Ser Gln Ser145 150 155 160Pro Gln Phe Tyr Asn Ser Tyr Leu His Asn Asn Pro Ala Leu Leu His 165 170 175 Gly Leu Met Ser Met Gly Ser Ser Ser Ser Val Met Glu Asn Asn Gly 180 185 190 Ser Ser Ser Gly Ser Tyr Asn Gly Gly Tyr Phe Asn Asn Gly Leu Gly 195 200 205 Val Ala Ser Asn Ser Thr Val Ala Ser Ala Val Gly Ser Ala Glu Glu 210 215 220 Leu Pro Leu Ile Lys Val Asp Tyr Asp Met Pro Ala Ala Gly Tyr Gly225 230 235 240Ser Trp Ser Gly Asp Ser Val Gln Gly Gln Asn Ala Gly Val Phe Thr
245
Met Trp Asn Asp260
<210> 205<211> 150<212> DNA
<213> brassica napus<400> 205
250
255ggaacatcgg ccgaggaaga gtttcccacg gttaaagttg attacgatat gcctccttta 60
ggtggagcca cagggtgtga acgatggact aatggagaga atggtcaggg gtcaaatcca 120ggaggtgtct tcacaatgtg gaatgaataa 150
<210> 206<211> 49<212> PRT
<213> Brassica napus<400> 206
Gly Thr Ser Ala Glu Glu Glu Phe Pro Thr Val Lys Val Asp Tyr Asp1 5 10 15 Met Pro Pro Leu 20 Gly Gly Ala Thr Gly 25 Cys Glu Arg Trp Thr 30 Asn GlyGlu Asn Gly Gln Gly Ser Asn Pro Gly Gly Val Phe Thr Met Trp Asn
35 40 45
Glu
<210> 207<211> 162<212> DNA
<213> Phaseolus coccineus<400> 207
tcgaatgcat cgtcgggtaa tgcggtgggc acggcggagg aacttggatt ggtgaaagttgactatgaca tgccggccgg aggttacggt ggttggtcgg cggcggcggc ggaatccatgcagacgtcaa atggtggggt gttcacaatg tggaatgagt ga<210> 208<211> 53<212> PRT
<213> Phaseolus coccineus<400> 208
Ser Asn Ala Ser Ser Gly Asn Ala Val Gly Thr Ala Glu Glu Leu Gly15 10 15
Leu Val Lys Val Asp Tyr Asp Met Pro Ala Gly Gly Tyr Gly Gly Trp
20 25 30
Ser Ala Ala Ala Ala Glu Ser Met Gln Thr Ser Asn Gly Gly Val Phe
35 40 45
Thr Met Trp Asn Glu50
<210> 209<211> 7<212> PRT
<213> Seqüência artificial<220>
<223> Motivo 2<220>
<221> VARIANTE
<222> (1)..(1)
<223> /substituir = "Leu"
<220>
60120162
<221><222>
INSEGURO(3) . . (3)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<220>
<221> VARIANTE
<222> (4) .. (4)
<223> /substituir = "Vai"
<220>
<221> VARIANTE<222> (7) . . (7)<223> /substituir = "Glu"<400> 209
Val Phe Xaa Met Trp Asn Asp1 5
<210> 210<211> 2194<212> DNA<213> Oryza sativa<400> 210
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 211<211> 1245<212> DNA<213> Oryza sativa<400> 211
cttgttgttg atctgtgccc ccaagaagaa taacactcta ctcttacttg ttggaaaaaa 60
atagtattag caaccacgca tatgcaaatt ttaatgcagt aataataaga gatggatcga 120
tcgttttcca gctcttgtat atgtgactgg ccctgcttta tgtgtgtagt gttaatttca 180
gctttagcag tacgtgatta gtgatggaca ataattgtcg cagacgtatc tatcaattgc 240
tcctgttgtg tgatgcttta actgttggaa tcaaagttgc gttgcctttg ttgttatgag 300
gaggaatata tatgttgggg caggaaaaga atggaggaga gatcgttctc catatcctta 360
tcatcggcct cgtcactgct cgcagtttaa ctttttggtg atgcgagcga tggtcagcca 420
tatatatact cccatgctgc atgctagtaa tcaatatacg ccttgtaaaa gtaaacgatc 480
gtctagtaat tgcaatatca taggggtagc cattgacaga gatctacata gatagagggg 540
gaacaagaat tgacactcca cagatgctcc actcattcac ctttactaat ttatatcttt 600
tgatgtttga tcgatcgatc gatccgtccg tcggtgtctc gacgaataaa aactgcaaat 660
cgaactgtat gtatataata tagcgtcgta aattaaatta aattaaatcg aactgaatac 720
tacatgtcga agcaagaatt agttcaacta aaagatttag tttttccggt tgcaatatct 780
gtgaaattaa ttgaagaaat taagaagaaa actggagaga tatatatatg gatgagacaa 840
aatgagataa gacgcatgat ggtccctcgg atgatgtcgt ccgttcctta tttccattcc 900
atggcagctg ctatcgctat ctagtgcgcg cggcatctcc aatcccatcc attctagtgg 960
tcgatctagc tactactgag tattgttttt tcttcttttt actactgttg attattctgc 1020aactgcagtt agatgcttgc tactcctaca tcgatctctc
cattcactac tgatgatccg tgggtgtagt gtgggtggct
ttgccattgc tcctcaggcc agcaactgag aagctccata
gccgacaagg ccagagaagg aagaagaagc tctcatcatc
<210> 212
<211> 675
<212> DNA
<213> Oryza sativa
<400> 212
atgaagagca ggaagaacag cacgacgagc acaaaagcagagcagcggag gaggaggagg cggcggcaac tgctatagcacgcaaggatg tggagaagaa tcggcgcctc cacatgaaggtccctcatcc ccgccgccgc tccccgccgc catcaccacctcatcgccgc cctcctccac caaggaggct gtgacgcagcgcggcgtaca tcaagcagct caaggggagg atcgacgagcgcggcggcac tcaccaccag caccagcaat ggcggcggcggtgcggtgcc aggatgggac gctggacgtg gtggtggtgaagggagaggg cggtgcggct gcacgaggtg atcggcgtgcgtggtgaacg ccagcttctc cgtcgtcggc gacaagatctgcgctctgct ccaggatcgg cctcgacgcc tccagggtctctcctccaat attaa<210> 213<211> 224<212> PRT
<213> Oryza sativa<400> 213
tcgcgcgggc gtatgcattgataaataggg cagggtgcggcaagtaagca gcagctagttatcac
caggcagctggcagcagtaggtctctgcctactactccactggatcaccttgaagaagaggcgggatgccgcgaggcgattggaggaagatctacactctcccacaggct
ccacaccagccaagatggagcaagctctccctcctcctccggagcaggcggaagcagcagggtggtggagcagggaggagaggcgcggagccactcccaggcgcaacctc
Met Lys Ser Arg Lys Asn Ser Thr Thr Ser Thr Lys Ala Ala Gly Ser1 5 10 15 Cys His Thr Ser 20 Ser Ser Gly Gly Gly 25 Gly Gly Gly Gly Asn 30 Cys TyrSer Ser Ser 35 Ser Ser Lys Met Glu 40 Arg Lys Asp Val Glu 45 Lys Asn ArgArg Leu 50 His Met Lys Gly Leu 55 Cys Leu Lys Leu Ser 60 Ser Leu Ile ProAla Ala Ala Pro Arg Arg His His His His Tyr Ser Thr Ser Ser Ser65 70 75 80Ser Ser Pro Pro Ser 85 Ser Thr Lys Glu Ala 90 Val Thr Gln Leu Asp 95 HisLeu Glu Gln Ala 100 Ala Ala Tyr Ile Lys 105 Gln Leu Lys Gly Arg 110 Ile AspGlu Leu Lys 115 Lys Arg Lys Gln Gln 120 Ala Ala Ala Leu Thr 125 Thr Ser ThrSer Asn 130 Gly Gly Gly Gly Gly 135 Met Pro Val Val Glu 140 Val Arg Cys GlnAsp Gly Thr Leu Asp Val Val Val Val Ser Glu Ala Ile Arg Glu Glu
145
150
155
Arg Glu Arg Ala Val Arg Leu His Glu Val Ile Gly Val
Val Val
165
170
Glu Gly Ala Glu Val Val Asn Ala Ser Phe Ser
180
185
Ile Phe Tyr Thr Leu His Ser Gln Ala Leu Cys
195
200
Asp Ala Ser Arg Val Ser His Arg Leu Arg Asn
210 215
<210> 214<211> 696<212> DNA<213> Oryza sativa<400> 214
atggatcagg agaaggcgga cggcggcggc aggaggaggaagcggcagcg gcgcgagcag cacggcggcg gcggcggcggcgcaggaggc ggcaggacat gaagggcctc tgcgtcaagcgaacactgct ccatgtccaa gatgcaggcg gcgtctagga
160
Leu Glu Glu175
Gly Asp Lys190
Ser Arg Ile Gly Leu205
Leu Leu Leu Gln Tyr220
ggagcagggc gacgagtagccggagaggaa ggagatggagtcgcctctct catccccaaacccagctggg cagcctggac
1080114012001245
60120180240300360420480540600660675
60120180240gaagcggcgg cctacatcaa gaagctcaag gaaagggtggagcatgatga gtatcacatc atcgcgctgc cgctcaggaggctgctggcc agtcgacgag cggcggcggc ggcggggaagaggacgacgg cggcggcggc ggtggtggag gtgcggcagcatcagcttgg acgtggtgct gatctgcagc gcagcgaggcatcaccgtcc tcgaggaaga aggcgccgac atcatctccgcacaatttct actacaccat ctactccagg gcctttagcttcgaggattt ctgagagact acgggcattg gtatga<210> 215<211> 231<212> PRT
<213> Oryza sativa<400> 215
Met Asp Gln Glu Lys Ala Asp Gly Gly Gly Arg1 5 10
Ala Thr Ser Ser Ser Gly Ser Gly Ala Ser Ser
20 25
Ala Ala Glu Arg Lys Glu Met Glu Arg Arg Arg
acgagctgcagaggaggaggaagaagaagaacgtgcaggacggtcaagttccaacttctccaagaattgg
ccacaagaggaccagctgctagatatgacgggggtcgctgccacgacgtccctcgccgcccatagaggct
35
40
Gly Leu Cys Val Lys Leu Ala Ser Leu Ile Pro
50
55
Met Ser Lys Met Gln Ala Ala Ser Arg Thr Gln
Arg Arg Arg
Thr Ala Ala30
Arg Gln Asp45
Lys Glu His60
Leu Gly Ser
65
70
75
Glu Ala Ala Ala Tyr Ile Lys Lys Leu Lys Glu Arg Val Asp
85
90
His His Lys Arg Ser Met Met Ser Ile Thr Ser
100
105
Gly Gly Gly Gly Gly Pro Ala Ala Ala Ala Gly
115 120
Gly Gly Gly Gly Glu Glu Glu Glu Glu Asp Met
130 135
Ala Ala Ala Val Val Glu Val Arg Gln His Val145 150 155
Ile Ser Leu Asp Val Val Leu Ile Cys Ser Ala
165 170
Phe His Asp Val Ile Thr Val Leu Glu Glu Glu
180 185
Ser Ala Asn Phe Ser Leu Ala Ala His Asn Phe
195 200
Ser Arg Ala Phe Ser Ser Arg Ile Gly Ile Glu
210 215
Glu Arg Leu Arg Ala Leu Val225 230
<210> 216<211> 633<212> DNA<213> Oryza sativa<400> 216
atggagatcc cgccgccgtc agctggtggc ggaggcggcgacgacggagc gcatccgccg cgagcagatg aacaagctctgtccgctccg ctccccccac agttaattcc attccttcactaccatcaaa gaaaattacg gattctcggt ggggcggcggaggttggggg tggcggcgga gtacataagg cagacgcagggagaagaaga gggagctcac cggcggcggc ggcggcggctggggcggcca cggccgccgc gccggaggtg gaggtgcagcgccatcctct tcaccggcgc gccgcccacc gacggcgcctgccgtcgagg acgccggcgg ccaggtgcag aacgcgcactgccgtctaca ccatccacgc catgattgga gatggatatgcagagattaa aggaagcaat acggagcaac taa<210> 217<211> 210<212> PRT
<213> Oryza sativa
Ser Arg Cys110
Gln Ser Thr
125Thr Arg Thr140
Gln Glu Gly
Ala Arg Pro
Gly Ala Asp190
Tyr Tyr Thr
205Ala Ser Arg220
Ser Arg15
Ala Ala
Met Lys
Cys Ser
Leu Asp80Glu Leu95
Arg Ser
Ser Gly
Thr Ala
Ser Leu160Val Lys175
Ile IleIle TyrIle Ser
gcggcaagcc cgaccggaagactcccacct cgactccctcattcaaattc aaattcaaaa
cggcgacgacagagggtggacctcgtcgtcacctggggtcccttccaccgtctccgtcgcgaggcattga
gaggccggaccatgctgagggtccggcgcccggcctgcaccgccgtccgccggcgccaaggagggtggtg
300360420480540600660696
60120180240300360420480540600633<400> 217
Met Glu Ile Pro Pro Pro Ser Ala Gly Gly Gly Gly Gly Gly Gly Lys1 5 10 15
Pro Asp Arg Lys Thr Thr Glu Arg Ile Arg Arg Glu Gln Met Asn Lys
20 25 30
Leu Tyr Ser His Leu Asp Ser Leu Val Arg Ser Ala Pro Pro Thr Val
35 40 45
Asn Ser Ile Pro Ser His Ser Asn Ser Asn Ser Lys Tyr His Gln Arg
50 55 60
Lys Leu Arg Ile Leu Gly Gly Ala Ala Ala Ala Thr Thr Arg Pro Asp65 70 75 80
Arg Leu Gly Val Ala Ala Glu Tyr Ile Arg Gln Thr Gln Glu Arg Val
85 90 95
Asp Met Leu Arg Glu Lys Lys Arg Glu Leu Thr Gly Gly Gly Gly Gly
100 105 110
Gly Ser Ser Ser Ser Ser Gly Ala Gly Ala Ala Thr Ala Ala Ala Pro
115 120 125
Glu Val Glu Val Gln His Leu Gly Ser Gly Leu His Ala Ile Leu Phe
130 135 140
Thr Gly Ala Pro Pro Thr Asp Gly Ala Ser Phe His Arg Ala Val Arg145 150 155 160
Ala Val Glu Asp Ala Gly Gly Gln Val Gln Asn Ala His Phe Ser Val
165 170 175
Ala Gly Ala Lys Ala Val Tyr Thr Ile His Ala Met Ile Gly Asp Gly
180 185 190
Tyr Gly Gly Ile Glu Arg Val Val Gln Arg Leu Lys Glu Ala Ile Arg195 200 205
Ser Asn210<210> 218<211> 546<212> DNA
<213> Arabidopsis thaliana<400> 218
atggggagag caagagaaat aggagaagga aactcatcgt cgttaaggga acaacgaaac 60
ctcagagaga aggatcgaag gatgcgcatg aaacatctct tctctatact ttcttctcat 120gtttctccca ctcgcaagtt accagtgcct caccttatag atcaagcgac atcatacatg 180atccaattga aagagaatgt aaattatttg aaagagaaga aaaggacatt gttacaagga 240gaactcggga atctctacga agggtcgttt cttctaccca aactcagtat tcgttcgcgg 300gattcgacca tagaaatgaa tctgatcatg gatctaaaca tgaaaagagt aatgttacac 360gagcttgtga gtatttttga agaagaagga gctcaagtaa tgagtgctaa tcttcagaac 420ttgaatgata ggaccactta cacaatcata gcccaggcta tcattagtcg gattggcatt 480gatccatcaa ggatagaaga gagagtacgg aaaatcatct atggatatat atattttgaa 540gcatga 54 6
<210> 219<211> 188<212> PRT
<213> Arabidopsis thaliana<400> 219
Met Gly Arg Ala Arg Glu Ile Gly Glu Gly Asn Ser Ser Ser Leu Arg15 10 15
Glu Gln Arg Asn Leu Arg Glu Lys Asp Arg Arg Met Arg Met Lys His
20 25 30
Leu Phe Ser Ile Leu Ser Ser His Val Ser Pro Thr Arg Lys Leu Pro
35 40 45
Val Pro His Leu Ile Asp Gln Ala Thr Ser Tyr Met Ile Gln Leu Lys
50 55 60
Glu Asn Val Asn Tyr Leu Lys Glu Lys Lys Arg Thr Leu Leu Gln Gly65 70 75 80
Glu Leu Gly Asn Leu Tyr Glu Gly Ser Phe Leu Leu Pro Lys Leu Ser
85 90 95
Ile Arg Ser Arg Asp Ser Thr Ile Glu Met Asn Leu Ile Met Asp Leu100 105 110Asn Met Lys 115 Arg Val Met Leu His 120 Glu Leu Val Ser Ile 125 Phe Glu GluGlu Gly 130 Ala Gln Val Met Ser 135 Ala Asn Leu Gln Asn 140 Leu Asn Asp ArgThr Thr Tyr Thr Ile Ile Ala Gln Val Pro His Pro His Ala Tyr Ala145 150 155 160Ile Ile Ser Arg Ile 165 Gly Ile Asp Pro Ser 170 Arg Ile Glu Glu Arg 175 ValArg Lys Ile Ile 180 Tyr Gly Tyr Ile Tyr 185 Phe Glu Ala
<210> 220<211> 525<212> DNA
<213> Arabidopsis thaliana<400> 220
atggaaagag cgagagaaat aggagaagga agcgcatcgt cattacggga acaacgaaac 60
ctcagagaga aagaacgacg aatgcgcatg aaacatctct tctccatact ctcttctcat 120gtttctccca ctcgtaggtt gccagtgcct caacttatag atcaagcggt atcatacatg 180atccaactga aagagaaggt aaactatttg aatgagatga aaaggagaat gttaggagga 240gaagtcaaaa atcgctctga agggtcgtct cttctgccaa aactcagtat tcgttcactg 300gattcgatca tagaaatgaa tctggttatg gatctaaaca tgaaaggagt aatgttacac 360aagcttgtga gtgtttttga agaagaagga gctcaagtga tgagtgctaa tcttcagaac 420ttgaatgata ggacctttta tacaatcata gcccaggcta tcatatgtcg gatcgggatt 480gatccatcaa ggatagaaga gagattaagg gatataatct catga 525
<210> 221<211> 174<212> PRT
<213> Arabidopsis thaliana<400> 221
Met Glu Arg Ala Arg Glu Ile Gly Glu Gly Ser Ala Ser Ser Leu Arg1 5 10 15 Glu Gln Arg Asn 20 Leu Arg Glu Lys Glu 25 Arg Arg Met Arg Met 30 Lys HisLeu Phe Ser 35 Ile Leu Ser Ser His 40 Val Ser Pro Thr Arg 45 Arg Leu ProVal Pro 50 Gln Leu Ile Asp Gln 55 Ala Val Ser Tyr Met 60 Ile Gln Leu LysGlu Lys Val Asn Tyr Leu Asn Glu Met Lys Arg Arg Met Leu Gly Gly65 70 75 80Glu Val Lys Asn Arg 85 Ser Glu Gly Ser Ser 90 Leu Leu Pro Lys Leu 95 SerIle Arg Ser Leu 100 Asp Ser Ile Ile Glu 105 Met Asn Leu Val Met 110 Asp LeuAsn Met Lys 115 Gly Val Met Leu His 120 Lys Leu Val Ser Val 125 Phe Glu GluGlu Gly 130 Ala Gln Val Met Ser 135 Ala Asn Leu Gln Asn 140 Leu Asn Asp ArgThr Phe Tyr Thr Ile Ile Ala Gln Ala Ile Ile Cys Arg Ile Gly Ile145 150 155 160Asp Pro Ser Arg Ile 165 Glu Glu Arg Leu Arg 170 Asp Ile Ile Ser
<210> 222<211> 369<212> DNA
<213> Arabidopsis thaliana<400> 222
atgatccaat tgaaagagaa tgtaaattat ttgaaagaga agaaaaggac attgttacaa 60
ggagaactcg ggaatctcta cgaagggtcg tttcttctac ccaaactcag tattcgttcg 120cgggattcga ccatagaaat gaatctgatc atggatctaa acatgaaaag agtaatgtta 180cacgagcttg tgagtatttt tgaagaagaa ggagctcaag taatgagtgc taatcttcag 240aacttgaatg ataggaccac ttacacaatc atagcccagg ctatcattag tcggattggc 300attgatccat caaggataga agagagagta cggaaaatca tctatggata tatatatttt 360gaagcatga 369<210> 223<211> 122<212> PRT
<213> Arabidopsis thaliana<400> 223
Met Ile Gln Leu Lys Glu Asn Val Asn Tyr Leu Lys Glu1 5 10
Thr Leu Leu Gln Gly Glu Leu Gly Asn Leu Tyr Glu Gly
20 25
Leu Pro Lys Leu Ser Ile Arg Ser Arg Asp Ser Thr Ile
35 40 45
Leu Ile Met Asp Leu Asn Met Lys Arg Val Met Leu His
50 55 60
Ser Ile Phe Glu Glu Glu Gly Ala Gln Val Met Ser Ala65 70 75
Asn Leu Asn Asp Arg Thr Thr Tyr Thr Ile Ile Ala Gln
85 90
Ser Arg Ile Gly Ile Asp Pro Ser Arg Ile Glu Glu Arg
100 105
Ile Ile Tyr Gly Tyr Ile Tyr Phe Glu Ala
115 120
<210> 224<211> 573<212> DNA
<213> Arabidopsis thaliana<400> 224
atggagccga gccattcaaa cacaggtcaa tcaagatctg tagatcgcaaaaaaatagaa ggatgcaaat gaagtctctc tactcagaac tcatctctctcattcttcta cggagccttt aacactacct gatcagctag atgaagctgcaagaagctac aagtgaacgt ggagaaaaag agagaaagga aaaggaacctacaactttgg agaaactgaa ttccgtcgga tcttcatcgg tttcgtcgagtccgtgccaa gaaagctgcc aaaaatcgag attcaagaaa ctggttccattttcttgtga caagcttgga acacaagttt atgttttgtg agatcattcggaggaattag gagctgagat cactcatgct ggatactcca ttgttgatgacacacccttc actgcaaggt ggaagaacac gattatggag ctaggagtcaagactggaga agattgtgaa cagtgttcac taa<210> 225<211> 190<212> PRT
<213> Arabidopsis thaliana<400> 225
Met Glu Pro Ser His Ser Asn Thr Gly Gln Ser Arg Ser15 10
Lys Thr Val Glu Lys Asn Arg Arg Met Gln Met Lys Ser
20 25
Glu Leu Ile Ser Leu Leu Pro His His Ser Ser Thr Glu
35 40 45
Leu Pro Asp Gln Leu Asp Glu Ala Ala Asn Tyr Ile Lys
50 55 60
Val Asn Val Glu Lys Lys Arg Glu Arg Lys Arg Asn Leu65 70 75
Thr Thr Leu Glu Lys Leu Asn Ser Val Gly Ser Ser Ser
85 90
Ser Val Asp Val Ser Val Pro Arg Lys Leu Pro Lys Ile
100 105
Glu Thr Gly Ser Ile Phe His Ile Phe Leu Val Thr Ser115 120 125
Lys Phe Met Phe Cys Glu Ile Ile Arg Val Leu Thr Glu
130 135 140
Ala Glu Ile Thr His Ala Gly Tyr Ser Ile Val Asp Asp145 150 155
His Thr Leu His Cys Lys Val Glu Glu His Asp Tyr Gly165 170
Lys Lys Arg15
Ser Phe Leu30
Glu Met Asn
Glu Leu Val
Asn Leu Gln80
Ala Ile Ile95
Val Arg Lys110
aacggttgagtcttcctcataaactacatccgttgcgactcgtcgatgtcttttcacatctgttctcacctgctgtcttcaattcctgaa
60120180240300360420480540573
Val Asp Arg15
Leu Tyr Ser30
Pro Leu Thr
Lys Leu Gln
Val Ala Thr80
Val Ser Ser95
Glu Ile Gln110
Leu Glu His
Glu Leu Gly
Ala Val Phe160
Ala Arg Ser175Gln Ile Pro Glu Arg Leu Glu Lys Ile Val Asn Ser Val His180 185 190
<210> 226<211> 423<212> DNA
<213> Medicago truncatula<400> 226
atgacatctc taacaaagga ggcgatttca gtgccggatc agctaaagga agcaacaaac 60
tacataaaga aattgcagat caacctggag aaaatgaagg aaaagaagaa ttttctacta 120ggaattcaaa ggccaaatgt gaatttgaat agaaaccaga agatgggatt aaagtctcca 180aaaattaaga tacaacaaat tggtttagtc ttagaggttg ttctaataac tggattggag 240tctcagtttt tgttcagcga aacctttcga gttcttcatg aagaaggagt tgatattgtt 300aatgctagtt ataaggtcaa tgaagattct gttttccatt caatacactg ccaggtagga 360gaatttggca atgaagctgc aagaatatct gagagattga agaagtttat gcaagactat 420tag 423
<210> 227<211> 140<212> PRT
<213> Medicago truncatula<400> 227
Met Thr Ser Leu Thr Lys Glu Ala Ile Ser Val Pro Asp Gln Leu Lys1 5 10 15
Glu Ala Thr Asn 20 Tyr Ile Lys Lys Leu 25 Gln Ile Asn Leu Glu 30 Lys MetLys Glu Lys 35 Lys Asn Phe Leu Leu 40 Gly Ile Gln Arg Pro 45 Asn Val AsnLeu Asn 50 Arg Asn Gln Lys Met 55 Gly Leu Lys Ser Pro 60 Lys Ile Lys IleGln Gln Ile Gly Leu Val Leu Glu Val Val Leu Ile Thr Gly Leu Glu65 70 75 80Ser Gln Phe Leu Phe 85 Ser Glu Thr Phe Arg 90 Val Leu His Glu Glu 95 GlyVal Asp Ile Val 100 Asn Ala Ser Tyr Lys 105 Val Asn Glu Asp Ser 110 Val PheHis Ser Ile 115 His Cys Gln Val Gly 120 Glu Phe Gly Asn Glu 125 Ala Ala ArgIle Ser 130 Glu Arg Leu Lys Lys 135 Phe Met Gln Asp Tyr 140 <210> 228
<211> 882<212> DNA
<213> Hordeum vulgare<400> 228
atgaatgcct gcgctctgaa ctcgatggag ccggtgaagg cgaagccggc gaggggcggg 60
aagaggagca gggagagcgg cggcacggcg gtggtgctgc tggagaagaa ggagtcggag 120aaggagagga ggaagcgcat gaaggcgctc tgcgagaagc tcgcatccct catcccaagg 180gaacactgct gctccaccac tgatacaatg acccagctag gcagcctgga tgtgggggca 240tcgtatatca agaagctgaa ggagagggtc gatgagctac aacgtaggat gacctctgcg 300cagaccttgg ataccttcag aggagacact agcatcccaa cgcccactac caccactacc 360acgaaaagcg ttgtagggtc gctggaagaa gagaaagctc gggaggcatc ggcacccgta 420ttgcaggtgc ggcaacacga cgattcaagc atggaggtga gattgatatg ctgcatgaag 480aggccgatca agctccatga ggtgatcacc atccatgagg aagaaggtgc tgagatcatc 540aacgccaatc actctgttgc tggccaaaaa atgttctaca ctatacactc tcgggcctct 600agctcgagaa ttggcataga tgttccaagg gtttctgaac gactgcgagc attgctccaa 660ctttattcgc atgaaaatca ggcaccgtcg tgcatgcaca acaatcaagt cctcaggtac 720aatgatgggg ccaacgcgac tcctcccaag gagctcgtcg gcaacaatga tataggtgga 780accaacaagg tggcaaacca cgagtgtgag tcttgggttg agcaagacca agtgatgtgg 840agttccctgc ttgcgtcaat atcaccagag ttgctcgagt ag 882
<210> 229
<211> 293
<212> PRT
<213> Hordeum vulgare
<400> 229Met Asn Ala Cys Ala Leu Asn Ser Met Glu Pro Val Lys Ala Lys Pro1 5 10 15 Ala Arg Gly Gly Lys Arg Ser Arg Glu Ser Gly Gly Thr Ala Val Val 20 25 30 Leu Leu Glu Lys Lys Glu Ser Glu Lys Glu Arg Arg Lys Arg Met Lys 35 40 45 Ala Leu Cys Glu Lys Leu Ala Ser Leu Ile Pro Arg Glu His Cys Cys 50 55 60 Ser Thr Thr Asp Thr Met Thr Gln Leu Gly Ser Leu Asp Val Gly Ala65 70 75 80Ser Tyr Ile Lys Lys Leu Lys Glu Arg Val Asp Glu Leu Gln Arg Arg 85 90 95 Met Thr Ser Ala Gln Thr Leu Asp Thr Phe Arg Gly Asp Thr Ser Ile 100 105 110 Pro Thr Pro Thr Thr Thr Thr Thr Thr Lys Ser Val Val Gly Ser Leu 115 120 125 Glu Glu Glu Lys Ala Arg Glu Ala Ser Ala Pro Val Leu Gln Val Arg 130 135 140 Gln His Asp Asp Ser Ser Met Glu Val Arg Leu Ile Cys Cys Met Lys145 150 155 160Arg Pro Ile Lys Leu His Glu Val Ile Thr Ile His Glu Glu Glu Gly 165 170 175 Ala Glu Ile Ile Asn Ala Asn His Ser Val Ala Gly Gln Lys Met Phe 180 185 190 Tyr Thr Ile His Ser Arg Ala Ser Ser Ser Arg Ile Gly Ile Asp Val 195 200 205 Pro Arg Val Ser Glu Arg Leu Arg Ala Leu Leu Gln Leu Tyr Ser His 210 215 220 Glu Asn Gln Ala Pro Ser Cys Met His Asn Asn Gln Val Leu Arg Tyr225 230 235 240Asn Asp Gly Ala Asn Ala Thr Pro Pro Lys Glu Leu Val Gly Asn Asn 245 250 255 Asp Ile Gly Gly Thr Asn Lys Val Ala Asn His Glu Cys Glu Ser Trp 260 265 270 Val Glu Gln Asp Gln Val Met Trp Ser Ser Leu Leu Ala Ser Ile Ser
275 280
Pro Glu Leu Leu Glu
290<210> 230<211> 2193<212> DNA
<213> Oryza sativa<400> 230
aatccgaaaa gtttctgcac cgttttcacc ccctaactaaaaatataaaa tgagacctta tatatgtagc gctgataactcatccaccta ctttagtggc aatcgggcta aataaaaaagtttccttagt aattaagtgg gaaaatgaaa tcattattgctctgtcatga agttaaatta ttcgaggtag ccataattgtaaaaaatctt tctagctgaa ctcaatgggt aaagagagagatgaagatat tctgaacgta ttggcaaaga tttaaacatattgtgcattc gtcatatcgc acatcattaa ggacatgtctttagtaatta aagacaattg acttattttt attatttatcgtacttacgc acacactttg tgctcatgtg catgtgtgagtcaactagca acacatctct aatatcactc gcctatttaatgaattcaag cactccacca tcaccagacc acttttaataaattttacag aatagcatga aaagtatgaa acgaactattaaaaaaagaa ttttgctcgt gcgcgagcgc caatctcccaacagagtggc tgcccacaga acaacccaca aaaaacgatgtccgcaacaa ccttttaaca gcaggctttg cggccaggagaaccaagcat cctcctcctc ccatctataa attcctccccggaggcatcc aagccaagaa gagggagagc accaaggacacgaccgcctt cttcgatcca tatcttccgg tcgagttcttcacctcctcc tcacagggta tgtgcccttc ggttgttctt
285
caatatagggagaactatgcagtcgctacattagaatatacatcaaactcattttttttataattatatatactccatccttttttcgattgcacctccttacatttaggatatctaaaataggtttttctattgggcacatctaacggaagaggaggagccttttcccccgcgactagcggtcgatctcggatttattg
aacgtgtgctaagaaaaactctagtttcgtcgttcacatcttcttgaataaaaaaatagaattttatagtcaatttttattagatgcaagcaatacacgttagcaatatctacaaaaaatacatacaaaaacaggcaacaggacagcaagaggcaaagaatctctatataagaagccgagttccctcctcttctaggttg
601201802403003604204805406006607207808409009601020108011401200aaacaatgaa gagcaggaag aacagc
cagagtgaaa gagtggtgtg
56
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193<210> 231<211> 56<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: prm06808<400> 231
ggggacaagt ttgtacaaaa aagcaggctt<210> 232<211> 50<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: prm06809<400> 232
ggggaccact ttgtacaaga aagctgggtg<210> 233<211> 2194<212> DNA<213> Oryza sativa<400> 233
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
50gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 234<211> 1065<212> DNA
<213> Arabidopsis thaliana<400> 234
atggagttgt taatgtgttc gggtcaggcc gagtcaggtg gttcctcttc caccgagtct 60
tcttcactca gtggtggact caggtttggt cagaagatct acttcgagga tggatccgga 120
tccagaagca agaaccgggt caataccgtt egtaagtcgt ctaccacggc gaggtgccaa 180
gtggaaggtt gtagaatgga tctaagcaat gttaaagctt attactcgag acacaaagtt 240
tgttgcattc actctaaatc atctaaagtc attgtctctg gtcttcatca aaggttttgt 300
caacaatgta gcaggtttca ccagctttct gagtttgact tggagaaaag aagttgtcgc 360
agaagactcg cttgtcataa cgaacgacga agaaaaccac aacccacaac ggctcttttc 420
acttctcatt actctcgaat cgctccatct ctttacggaa accccaatgc tgcaatgatt 480
aaaagcgttt tgggagatcc tactgcgtgg tcaaccgcaa gatcagtgat gcagcggcct 540
ggaccgtggc agattaatcc agttagggaa acccatccac acatgaatgt tttatcacat 600
ggaagctcaa gctttactac atgtccagag atgataaaca acaatagcac agattcaagc 660
tgtgctctct ctcttctgtc aaactcatac ccaattcatc agcagcaact tcagacacca 720
acaaatacat ggcgaccatc ttctggtttc gactcgatga tctcattctc cgataaggtt 780
acaatggctc agccaccgcc catttcaacc catcagccgc ccatctcaac acatcagcag 840
tacctcagcc aaacttggga agtcatcgcg ggcgaaaaga gcaattcaca ttatatgtct 900
cctgtgagtc aaatctcgga gccagcagat ttccagataa gcaatggcac cacaatgggt 960
ggatttgagc tgtatcttca tcagcaggtt ctgaagcaat acatggaacc cgagaacaca 1020
agagcttatg actcctctcc tcaacatttc aattggtctc tttga 1065<210> 235<211> 354<212> PRT
<213> Arabidopsis thaliana<400> 235
Met Glu Leu Leu Met Cys Ser Gly Gln Ala Glu Ser Gly Gly Ser Ser1 5 10 15 Ser Thr Glu Ser Ser Ser Leu Ser Gly Gly Leu Arg Phe Gly Gln Lys 20 25 30 Ile Tyr Phe Glu Asp Gly Ser Gly Ser Arg Ser Lys Asn Arg Val Asn 35 40 45 Thr Val Arg Lys Ser Ser Thr Thr Ala Arg Cys Gln Val Glu Gly Cys 50 55 60 Arg Met Asp Leu Ser Asn Val Lys Ala Tyr Tyr Ser Arg His Lys Val65 70 75 80Cys Cys Ile His Ser Lys Ser Ser Lys Val Ile Val Ser Gly Leu His 85 90 95 Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Ser Glu Phe 100 105 110 Asp Leu Glu Lys Arg Ser Cys Arg Arg Arg Leu Ala Cys His Asn Glu 115 120 125 Arg Arg Arg Lys Pro Gln Pro Thr Thr Ala Leu Phe Thr Ser His Tyr 130 135 140 Ser Arg Ile Ala Pro Ser Leu Tyr Gly Asn Pro Asn Ala Ala Met Ile145 150 155 160Lys Ser Val Leu Gly Asp Pro Thr Ala Trp Ser Thr Ala Arg Ser Val 165 170 175 Met Gln Arg Pro Gly Pro Trp Gln Ile Asn Pro Val Arg Glu Thr His180 185 190
Pro His Met Asn Val Leu Ser His Gly Ser Ser Ser Phe Thr Thr Cys
195 200 205
Pro Glu Met Ile Asn Asn Asn Ser Thr Asp Ser Ser Cys Ala Leu Ser
210 215 220
Leu Leu Ser Asn Ser Tyr Pro Ile His Gln Gln Gln Leu Gln Thr Pro225 230 235 240
Thr Asn Thr Trp Arg Pro Ser Ser Gly Phe Asp Ser Met Ile Ser Phe
245 250 255
Ser Asp Lys Val Thr Met Ala Gln Pro Pro Pro Ile Ser Thr His Gln
260 265 270
Pro Pro Ile Ser Thr His Gln Gln Tyr Leu Ser Gln Thr Trp Glu Val
275 280 285
Ile Ala Gly Glu Lys Ser Asn Ser His Tyr Met Ser Pro Val Ser Gln
290 295 300
Ile Ser Glu Pro Ala Asp Phe Gln Ile Ser Asn Gly Thr Thr Met Gly305 310 315 320
Gly Phe Glu Leu Tyr Leu His Gln Gln Val Leu Lys Gln Tyr Met Glu
325 330 335
Pro Glu Asn Thr Arg Ala Tyr Asp Ser Ser Pro Gln His Phe Asn Trp340 345 350
Ser Leu
<210> 236<211> 1128<212> DNA
<213> Arabidopsis thaliana<400> 236
atggagatgg gttccaactctcctccactg agtcatcctcgaggacggtg gtggtggatccgtggaggcg ggtcgggtcaatggatctaa ccaatgcaaaaaaacaccta aagtcactgttttcatcagc ttccggaattcataatgagc gacgaaggaagggaggatcg caccttcgctgggaaccaag agataggatgccagtgtcgt caccgtcatgggtggaggag ggacaagcttaagggaattg gcgactcaaagacaacaaca acaacaacaatcaggttttg gcccgatgaccagtatctga acccgccttgaatttaggtc gatacaccgagagttcgagt tatctgatcaacaagggctt atgactcttc<210> 237<211> 375<212> PRT<213> Arabidopsis thaliana<400> 237
Met Glu Met Gly Ser Asn Ser Gly Pro Gly His Gly Pro Gly Gln Ala1 5 10 15 Glu Ser Gly Gly 20 Ser Ser Thr Glu Ser 25 Ser Ser Phe Ser Gly 30 Gly LeuMet Phe Gly 35 Gln Lys Ile Tyr Phe 40 Glu Asp Gly Gly Gly 45 Gly Ser GlySer Ser 50 Ser Ser Gly Gly Arg 55 Ser Asn Arg Arg Val 60 Arg Gly Gly GlySer Gly Gln Ser Gly Gln Ile Pro Arg Cys Gln Val Glu Gly Cys Gly65 70 75 80Met Asp Leu Thr Asn Ala Lys Gly Tyr Tyr Ser Arg His Arg Val Cys
gggtccgggttttcagtggacgggtcttctgtcgggtcagaggttattacggctggtatctgacctagaggccacagcctttacgaaaatgccaagttcagcagatcaatctcatctccactgtgctctccaacaacaacggttacaatgggtattcaaggccagataatccatcatcaattctcaccat
catggtccgggggctcatgttcctcaggtgataccaaggttcgagacaccgaacagaggtaaaaggagttgcgtctctctggtgatgctgagaacattggccaatgaatggagattatggtctcttctgtaacaacaacagctcaaccacgacaatgatatgtcagataaagtaggagacaccaactggt
gtcaggcagattggccagaagtcgttcaaagccaagtggagagtttgtggtttgtcaacagccgcaggagctgtgttagcgaatgaatggatacaagagttatttagtcaacactaaactcaaatccacaacaatacatgcacctgcaccatgatatgtcgtagtggcacagtacatggaccctctga
gtcgggtggtgatctacttccagacgtgtcaggttgtgggagtgcactctgtgcagcaggactcgctggtttctcgttacaagctttcttgatgaggcggaggttcagttagagagctactcaaccacatgcgagcttcttagccagcattcctgttttgggcaatgggtagatgagaac
6012018024030036042048054060066072078084090096010201080112885 90 95
Gly Val His Ser Lys Thr Pro Lys Val Thr Val Ala Gly Ile Glu Gln
100 105 110
Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Pro Glu Phe Asp
115 120 125
Leu Glu Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg
130 135 140
Arg Arg Lys Pro Gln Pro Ala Ser Leu Ser Val Leu Ala Ser Arg Tyr145 150 155 160
Gly Arg Ile Ala Pro Ser Leu Tyr Glu Asn Gly Asp Ala Gly Met Asn
165 170 175
Gly Ser Phe Leu Gly Asn Gln Glu Ile Gly Trp Pro Ser Ser Arg Thr
180 185 190
Leu Asp Thr Arg Val Met Arg Arg Pro Val Ser Ser Pro Ser Trp Gln
195
200
205
Ile Asn Pro Met Asn Val Phe Ser Gln Gly Ser Val Gly Gly Gly Gly
210
215
220
Thr Ser Phe Ser Ser Pro Glu Ile Met Asp Thr Lys Leu Glu Ser Tyr
225
230
235 240
Lys Gly Ile Gly Asp Ser Asn Cys Ala Leu Ser Leu Leu Ser Asn Pro
245 250 255
His Gln Pro His Asp Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn
260 265 270
Asn Asn Asn Thr Trp Arg Ala Ser Ser Gly Phe Gly Pro Met Thr Val
275 280 285
Thr Met Ala Gln Pro Pro Pro Ala Pro Ser Gln His Gln Tyr Leu Asn
290
295
300
Pro Pro Trp Val Phe Lys Asp Asn Asp Asn Asp Met Ser Pro Val Leu
305
310
315
320
Asn Leu Gly Arg Tyr Thr Glu Pro Asp Asn Cys Gln Ile Ser Ser Gly
325
330
335
Thr Ala Met Gly Glu Phe Glu Leu Ser Asp His His His Gln Ser Arg
340 345 350
Arg Gln Tyr Met Glu Asp Glu Asn Thr Arg Ala Tyr Asp Ser Ser Ser
355 360 365His His Thr Asn Trp Ser Leu
370 375<210> 238<211> 1149<212> DNA
<213> Aquilegia formosa χ Aquilegia pubescens<400> 238
atggaaatgg gttccagctc tttcgctggt ggtgggggta agggtgcttc tggttcatct 60
gattcttcac tgaatggttt gaaatttggg aagaaaatct actttgaaga tgtgggtatt 120
ggagttttag gcaagtcaag tgttgggtct ccgtcaattt tggtttctga agctcggttg 180
ccaccggctt cgtcggtgaa gaagggtaga ggggttttgc aaggacaacc acctagatgt 240
tctgttgaag gttgtaagct tgatcttact gatgctaagc cttattactc aaggcacaaa 300
gtctgtggta tgcactctaa atctcctaaa gtaattgttg gtggtttgga gcagaggttt 360
tgccagcagt gtagcagatt tcatctactc tgtgaatttg accaaggcaa gcgaagctgt 420
cgtagacgtc tagctggcca caatgagcgt cgaagaaaac cacaacctgg atcaatattt 480
tcaccgcgct atggtcgtgt gtcaccatct ttccaagaaa atagcaccag aggaggaggt 540
tttctaatgg acttcacagc gtacccaagg ctggcaggaa gggatgcatg gcaaacagta 600
aaagccggca attgggcaga tggaaaccaa acctctccta ttaagaagct tctcccacat 660
caatggcaag gcaattcaga gaatcctcct cctattgtct attctcaggc acctcacccg 720
tatctgcaag gtgtggctag tggatcaatt ttttccagta caagaatacc ttcagccgag 780
tgttttgctg gtgtctctga ctccagctgt gctctctctc ttctgtcaaa tcaaccatgg 840
aaccccagaa accagacttc cgatttggag gtgaataaca tagtgaacgg tgaaggggta 900
tccatggcaa gatctatagc acctcatagt gctgtagtca ccaacttcac gaacaacaca 960
tggaatttta agggcaacag tgaagttagt ggcagttccc atgaaattcc acgtcaggtg 1020
tcgcagccag tcaccaatca tttctccagt gagctcgatc tagctcagca ggggaacagg 1080
cagtacatgg agatccggca ttcaagggat tttggttctt ccactcacca gatgcactgg 1140tctctttga 1149<210> 239<211> 382<212> PRT
<213> Aquilegia formosa χ Aquilegia pubescens<400> 239
Met Glu Met Gly Ser Ser Ser Phe Ala Gly Gly Gly Gly Lys Gly Ala1 5 10 15
Ser Gly Ser Ser Asp Ser Ser Leu Asn Gly Leu Lys Phe Gly Lys Lys
20 25 30
Ile Tyr Phe Glu Asp Val Gly Ile Gly Val Leu Gly Lys Ser Ser Val
35 40 45
Gly Ser Pro Ser Ile Leu Val Ser Glu Ala Arg Leu Pro Pro Ala Ser
50 55 60
Ser Val Lys Lys Gly Arg Gly Val Leu Gln Gly Gln Pro Pro Arg Cys65 70 75 80
Ser Val Glu Gly Cys Lys Leu Asp Leu Thr Asp Ala Lys Pro Tyr Tyr
85 90 95
Ser Arg His Lys Val Cys Gly Met His Ser Lys Ser Pro Lys Val Ile
100 105 110
Val Gly Gly Leu Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His
115 120 125
Leu Leu Cys Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu
130 135 140
Ala Gly His Asn Glu Arg Arg Arg Lys Pro Gln Pro Gly Ser Ile Phe145 150 155 160
Ser Pro Arg Tyr Gly Arg Val Ser Pro Ser Phe Gln Glu Asn Ser Thr
165 170 175
Arg Gly Gly Gly Phe Leu Met Asp Phe Thr Ala Tyr Pro Arg Leu Ala
180 185 190
Gly Arg Asp Ala Trp Gln Thr Val Lys Ala Gly Asn Trp Ala Asp Gly
195 200 205
Asn Gln Thr Ser Pro Ile Lys Lys Leu Leu Pro His Gln Trp Gln Gly
210 215 220
Asn Ser Glu Asn Pro Pro Pro Ile Val Tyr Ser Gln Ala Pro His Pro225 230 235 240
Tyr Leu Gln Gly Val Ala Ser Gly Ser Ile Phe Ser Ser Thr Arg Ile
245 250 255
Pro Ser Ala Glu Cys Phe Ala Gly Val Ser Asp Ser Ser Cys Ala Leu
260 265 270
Ser Leu Leu Ser Asn Gln Pro Trp Asn Pro Arg Asn Gln Thr Ser Asp
275 280 285
Leu Glu Val Asn Asn Ile Val Asn Gly Glu Gly Val Ser Met Ala Arg
290 295 300
Ser Ile Ala Pro His Ser Ala Val Val Thr Asn Phe Thr Asn Asn Thr305 310 315 320
Trp Asn Phe Lys Gly Asn Ser Glu Val Ser Gly Ser Ser His Glu Ile
325 330 335
Pro Arg Gln Val Ser Gln Pro Val Thr Asn His Phe Ser Ser Glu Leu
340 345 350
Asp Leu Ala Gln Gln Gly Asn Arg Gln Tyr Met Glu Ile Arg His Ser
355 360 365
Arg Asp Phe Gly Ser Ser Thr His Gln Met His Trp Ser Leu
370 375 380
<210> 240<211> 1170<212> DNA
<213> Gossypium hirsutum<400> 240
atggaaatgg gttcgggctc tttgactgag tcgggcggtt ctcccaccaa ctcttccgcc 60
gagtcactca acggcttgaa gttcggtaaa aagatctact ttgaggatac agccgctgtc 120gccgccgccg ctggtggtaa aagtgttggt ggtggtgcaa acatagggac tccatccaag 180tccggtccag catcttcaag cttagccggg tcgtgtagga aagccagggt tgatggaatg 240gcgcaagggg ttctgccttc taggtgtcaa gtagaagggt gtaaagtgga tctgagtgat 300gctaaggctt actattcaag gcataaggtt tgttgtatgc actctaagtc atctaaagtc 360Gly Gly Ser
Phe Gly Lys30
Ala Gly Gly45
Ser Gly
attgttgctg gtctcgagca aagattttgt cagcagtgta gcagatttca tcagctttctgaatttgaca aagggaaacg gagttgtcgt agacggcttg caggtcacaa tgagcgacgcaggaaaccac cacctggatc attattttcc tctccttatg gccggctttc ttcctctattattgaaaatg gcagtagagg tggaagcttt atagtggatt tctcagcata cccaaggctttcaggaaggg atgcatggcc agcagctcga tcgttagaat gcataactgg aaatcgaagcacagccactg gaagctcatt ttcacatcca cggcaaaaca actccagcaa acctcctcatgaccatttct tgcaaggttc accatgtggg actagtttct ccagcactgg aatttctccaggagaatgct tcacagggtc tggtgactca agctgtgctc tctctcttct gtcaaatcaaccgtggggct ccaggaacca ggctttgaat ttttctgtaa atggcgtgat aagtactgaagggtcctctg cggcacaacc aacaacgctt catggtgcag ttgtgaaccc ttattcaaatgcctctttgg atttcaatgg cagtgacact gttcgcagtt ctcacaagat gctgccacacctagatttgg gtcaaatccc agaccctgtt aactgtcaat tctctagtga ccttgagttgtctcaacaaa gctggaggtc atatatcgaa catgagcagt ccggggcagc ctatgacgactccatgcagc atatccactg gacgctctaa<210> 241<211> 389<212> PRT
<213> Gossypium hirsutum<400> 241
Met Glu Met Gly Ser Gly Ser Leu Thr Glu Ser1 5 10
Asn Ser Ser Ala Glu Ser Leu Asn Gly Leu Lys
20 25
Tyr Phe Glu Asp Thr Ala Ala Val Ala Ala Ala
35 40
Val Gly Gly Gly Ala Asn Ile Gly Thr Pro Ser Lys
50 55 60
Ser Ser Ser Leu Ala Gly Ser Cys Arg Lys Ala Arg Val Asp65 70 75
Ala Gln Gly Val Leu Pro Ser Arg Cys Gln Val Glu Gly Cys
85 90
Asp Leu Ser Asp Ala Lys Ala Tyr Tyr Ser Arg His Lys Val100 105 110
Met His Ser Lys Ser Ser Lys Val Ile Val Ala Gly Leu Glu
115 120 125
Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Ser Glu Phe
130 135 140
Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu145 150 155
Arg Lys Pro Pro Pro Gly Ser Leu Phe Ser Ser Pro Tyr Gly
165 170
Ser Ser Ser Ile Ile Glu Asn Gly Ser Arg Gly Gly Ser Phe180 185 190
Asp Phe Ser Ala Tyr Pro Arg Leu Ser Gly Arg Asp Ala Trp
195 200 205
Ala Arg Ser Leu Glu Cys Ile Thr Gly Asn Arg Ser Thr Ala
210 215 220
Ser Ser Phe Ser His Pro Arg Gln Asn Asn Ser Ser Lys Pro225 230 235
Asp His Phe Leu Gln Gly Ser Pro Cys Gly Thr Ser Phe Ser
245 250
Gly Ile Ser Pro Gly Glu Cys Phe Thr Gly Ser Gly Asp Ser260 265 270
Ala Leu Ser Leu Leu Ser Asn Gln Pro Trp Gly Ser Arg Asn
275 280 285
Leu Asn Phe Ser Val Asn Gly Val Ile Ser Thr Glu Gly Ser
290 295 300
Ala Gln Pro Thr Thr Leu His Gly Ala Val Val Asn Pro Tyr305 310 315
Ala Ser Leu Asp Phe Asn Gly Ser Asp Thr Val Arg Ser Ser
325 330
Met Leu Pro His Leu Asp Leu Gly Gln Ile Pro Asp Pro Val340 345 350
Pro Thr1 5
Lys Ile
Lys Ser
Pro Ala
Gly Met80Lys Val95
Cys Cys
Gln Arg
Asp Lys
Arg Arg160Arg Leu175
Ile Val
Pro Ala
Thr Gly
Pro His240Ser Thr255
Ser Cys
Gln Ala
Ser Ala
Ser Asn320His Lys335
Asn Cys
4204805406006607207808409009601020108011401170Gln Phe Ser Ser Asp Leu355
Ile Glu His Glu Gln Ser370
Ile His Trp Thr Leu385
<210> 242<211> 1017<212> DNA<213> Ipomoea nil<400> 242
atggaactgg gttcttcttc ttcttctacc tctacctccg ccgactcctc atccgacggc 60ttgaagttcg gcaaaaaagt ctactttgaa gatgcgggtg gtgggagtgg tgggtcgtcg 120ctgccggcca agagagggag gagcgcggtg gcgcaaggcg gacagccacc caggtgccag 180gtggaagggt gcaaggcaga tctgagtgaa tttaaggctt attactcaaa gcataaagtt 240tgtggtatgc actccaagtc tcctaaggtc attgtttctg ggcttgaaca gagattctgc 300cagcagtgca gcaggtttca tcaattgagt gaatttgatc aagtaaaaag gagctgccgt 360aggcgtttgg ctggtcataa tgagcgtcgt aggaagcccc cacttggatc catattgtcc 420acacattatg ggactctttc ttcttcaatg tttggaaaca atggccactt tgtgatggat 480ttcgcctcat acccatatcc gggtggtaag ggctcatggc ggccaagtac caatggcgtg 540gggaactttc ttcaacaacc atggcagaga aactctgaag atcccccacc caagcttctt 600ttgctaggtt cggatgctgc tgctagggct acttatccca gtccttgtgg agaatacttc 660aatggggtct cggattccac ccgtgctctc tctcttctgt caaactcaaa tcagccctgg 720ggctcgagaa accaacaacc ctctggtctc ggggttaata gcttacttaa cactgatgga 780acgcttgctg ttcatccatc cggttcccat gctgccgtta tcaatgaatt ttcttcaagt 840ccatggggtt ttaaaggcaa tcaagccact accagctcag ataagatcct tcctgatagt 900cactattctg gtgagctcga gatgatggct catcaacaaa ctggacgagc atacatggga 960atggagtact cgacgggtta tgattcttct gtccagaatg tgcactggac tctctga 1017
<210> 243<211> 338<212> PRT<213> Ipomoea nil<400> 243
Met Glu Leu Gly Ser Ser1 5
Ser Ser Asp Gly Leu Lys20
Gly Gly Gly Ser Gly Gly35
Ala Val Ala Gln Gly Gly50
Lys Ala Asp Leu Ser Glu65 70
Cys Gly Met His Ser Lys85
Gln Arg Phe Cys Gln Gln100
Asp Gln Val Lys Arg Ser115
Arg Arg Arg Lys Pro Pro130
Thr Leu Ser Ser Ser Met145 150
Phe Ala Ser Tyr Pro Tyr165
Thr Asn Gly Val Gly Asn180
Glu Asp Pro Pro Pro Lys195
Arg Ala Thr Tyr Pro Ser210
Asp Ser Thr Arg Ala Leu225 230
Glu Leu Ser Gln Gln Ser Trp Arg Ser Tyr
360 365
Gly Ala Ala Tyr Asp Asp Ser Met Gln His375 380
Ser Ser Ser Thr Ser10
Phe Gly Lys Lys Val25
Ser Ser Leu Pro Ala40
Gln Pro Pro Arg Cys55
Phe Lys Ala Tyr Tyr75
Ser Pro Lys Val Ile90
Cys Ser Arg Phe His105
Cys Arg Arg Arg Leu120
Leu Gly Ser Ile Leu135
Phe Gly Asn Asn Gly155
Pro Gly Gly Lys Gly170
Phe Leu Gln Gln Pro185
Leu Leu Leu Leu Gly200
Pro Cys Gly Glu Tyr215
Ser Leu Leu Ser Asn235
Thr Ser Ala Asp Ser15
Tyr Phe Glu Asp Ala30
Lys Arg Gly Arg Ser45
Gln Val Glu Gly Cys60
Ser Lys His Lys Val80
Val Ser Gly Leu Glu95
Gln Leu Ser Glu Phe110
Ala Gly His Asn Glu125
Ser Thr His Tyr Gly140
His Phe Val Met Asp160
Ser Trp Arg Pro Ser175
Trp Gln Arg Asn Ser190
Ser Asp Ala Ala Ala205
Phe Asn Gly Val Ser220
Ser Asn Gln Pro Trp240Gly Ser Arg Asn Gln Gln Pro Ser Gly Leu Gly Val Asn Ser Leu Leu
245 250 255
Asn Thr Asp Gly Thr Leu Ala Val His Pro Ser Gly Ser His Ala Ala
260 265 270
Val Ile Asn Glu Phe Ser Ser Ser Pro Trp Gly Phe Lys Gly Asn Gln
275 280 285
Ala Thr Thr Ser Ser Asp Lys Ile Leu Pro Asp Ser His Tyr Ser Gly
290 295 300
Glu Leu Glu Met Met Ala His Gln Gln Thr Gly Arg Ala Tyr Met Gly305 310 315 320
Met Glu Tyr Ser Thr Gly Tyr Asp Ser Ser Val Gln Asn Val His Trp325 330 335
Thr Leu
<210> 244<211> 1035<212> DNA
<213> Lactuca sativa<400> 244
atggagatgg gtggttcgag tggttcttcg gagtcgcaacttcgggaaag aaatctattt tgaggatgtg ggagttggaggggttgtctc cggcgagcgg cggcgatgct gctggagggcgctggtgggg tggtgagtgg ttttggacaa cagcaaccactgtaatctgg atctgagtga tgctaaaagt tactattcaacattcgaaaa cggctaaggt cattgttaat ggccttgaacagcaggttcc atcaactacc agagtttgac cagggaaaaagctgggcaca atgaacgtag aagaaagcca tctctgctattcctcctcaa tctttgaaaa caatgggaat tctggaggcttgctcaagag gaaggattca gtggccagga acaagggcggatcgacctcc caattgccgg agaaaagttc ccaccgcttcaatccacctc cttatgttcc accaggaggg tgttttaatgtgtgctctct ctcttctgtc aaatcactca tctggctcaagagtactata tcaaccctga agctggtgca tatgtgcaccggaaccggag ctgggttcgg aaccatggtt gaggtcaccgacccatgatg cccatttggg tttgggtcac gtcccacagtgaggttggac ttggtccaca tggtggggga aggcgatatggactggtcac tttga<210> 245<211> 344<212> PRT
<213> Lactuca sativa<400> 245
Met Glu Met Gly Gly Ser Ser Gly Ser Ser Glu1 5 10
Ile Gly Leu Gln Phe Gly Lys Glu Ile Tyr Phe
20 25
Gly Ala Gln Val Lys Ser Asp Asp Gly Leu Ser
35 40
Asp Ala Ala Gly Gly Pro Gln Lys Lys Gly Arg
50 55
Val Ser Gly Phe Gly Gln Gln Gln Pro Pro Arg
tgctcaaaatctcaggttaacgcagaagaacgaggtgtcaggcacaaagtagagattctggaagctgcagccactcgctattctaatggacaccaccgcccatggcaaaggagtccatgaggaaccaatcagcttcatcaccactggctgctggtggtggactcatctgt
tggtttgcaaatccgatgatagggagaactggtggaaggtttgtggtgctccaacagtgcgagacgattgtggaactgtccttttcgtcatcgagccgcccaacctggatggactccaaccctgagccataccaacaaccggtatacgagctactctggttgaccacatt
Ser
Glu
Pro
Thr60Cys
65
70
Cys Asn Leu Asp Leu Ser Asp Ala Lys Ser
75Tyr
85
90
Tyr
Val Cys Gly Ala His Ser Lys Thr Ala Lys Val Ile
100 105
Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His
115
120
Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg
130 135
Glu Arg Arg Arg Lys Pro Ser Leu Leu Ser Thr145 150 155
Ser Ser Ser Ile Phe Glu Asn Asn Gly Asn Ser
Leu140Arg
Gly
Gln Leu Leu Lys 15 Asp Val Gly Val 30 Ala Ser Gly Gly45 Ala Gly Gly ValGln Val Glu Gly 80Ser Arg His Lys 95 Val Asn Gly Leu 110 Gln Leu Pro Glu125 Ala Gly His AsnTyr Gly Thr Val 160Gly Phe Leu Met
6012018024030036042048054060066072078084090096010201035165 170
Asp Phe Ser Ser Cys Ser Arg Gly Arg Ile Gln
180 185
Ala Ala Pro Pro Pro Arg Ala Ala Ile Asp Leu
195 200
Lys Phe Pro Pro Leu Pro Trp Gln Ser Asn Leu
210 215
Tyr Val Pro Pro Gly Gly Cys Phe Asn Gly Val225 230 235
Cys Ala Leu Ser Leu Leu Ser Asn His Ser Ser
245 250
Ser Leu Ser His Glu Tyr Tyr Ile Asn Pro Glu
260 265
His Gln Leu His Gln Pro Thr Thr Gly Thr Gly275 280
Val Glu Val Thr Ala Thr Gly Trp Val Tyr290 295
Leu Gly Leu Gly His Val Pro Gln Ser Gly310
Met
His305
Trp Pro
Pro Ile205Asp Asn220
His Glu
Gly Ser
Ala Gly
Ala Gly285Glu Thr300
Gly Gly
315
Glu Val Gly Leu Gly Pro His Gly Gly Gly Arg Arg Tyr
325
330
175Gly Thr190
Ala Gly
Pro Pro
Asp Ser
Arg Asn255Ala Tyr270
Phe Gly
His Asp
Tyr Ser
Asp Ser335
Arg
Glu
Pro
Asn240Gln
Val
Thr
Ala
Gly320Ser
Val Asp His Ile Asp Trp Ser Leu340
<210> 246<211> 1137<212> DNA
<213> Malus domestica<400> 246
atggaaatgg gctcgagttc taagaccgag tcagcgagctaactcctccg ctgagtcact caacggcttg aaattcggccgggggttttg gagctctgca caaatcatca tgcgggtctgggggctacgc cgccaaagaa gcaaaggggc ggcggaaattcaggtggagg gctgcgaggt agatctgagt ggtgccaaaggtctgtggct tgcactctaa aactcccact gtcattgttgtgccaacagt gtagcaggtt tcatttactt, cctgaatttgcgtagacgct tggctgggca taatgagcgt cgtagaaaactctacgcgtg gcagactttc ttcgtctctc tacgaaaacactgatggact tcactgcata cccaaggttt tctgggagggtctgagcgag cacctgttaa tcaaaatgcc aatgacgcagtggcagagca actctgatat ttctacatcc ggcttttaccactagttatc ctggtcctgg aattcctcca ggagaatgtgagctgtgctc tctctcttct gtcaaatcag ccatggggctgctgggatga attccttgat gaacactcaa ggggtacctgtctgcaacct ccaatcactt tccgaccact tcgtggggttagcagctcac acgggatgct tccagatctg ggtctcggtcagtcagtact ctggtgtgct ggagctgtct caacagggtactcggacaca ccaggggcta tgactccacc agtcagcaga<210> 247<211> 378<212> PRT
<213> Malus domestica<400> 247
Met Glu Met Gly Ser Ser Ser Lys Thr Glu Ser1 5 10
Ser Ser Pro Pro Asn Ser Ser Ala Glu Ser Leu
cttcctcctcggaaaatctactgctgggtctgggtcagcccttactattcctggtcttgaatcaaggaaacacctccagggcagcagaatatacatggacggaagtttcttacaaggttctcacagtagtctcgaaaccgtggctcaacctcaaaggaaaaaatctcgcaggaggcagcatgcactggtc
ttcgccgcccctttgaggatttcctccgccgccgcggtgtcaggcacaaaacagaggtttacgtagttgtatccatactgtggaagctttaacaagaaccacaacagccgagcaggcgggcactgactcaagtattgggtagtccctcattgaaaatggtgccgcttagcacacatggaaactttaa
20
25
Gly Arg Lys Ile Tyr Phe Glu Asp 35 40Ser Ser Cys Gly Ser Ala Ala Gly 50 55 Pro Lys Lys Gln Arg Gly Gly Gly65 70 Gln Val Glu Gly Cys Glu Val Asp
75
Ala Ser Ser Ser Ser15
Asn Gly Leu Lys Phe30
Gly Ala Leu His Lys45
Ala Gly Ala Thr Pro60
Gln Pro Pro Arg Cys80
Ala Lys Ala Tyr Tyr
6012018024030036042048054060066072078084090096010201080113785 90 95 Ser Arg His Lys 100 Val Cys Gly Leu His 105 Ser Lys Thr Pro Thr 110 Val IleVal Ala Gly 115 Leu Glu Gln Arg Phe 120 Cys Gln Gln Cys Ser 125 Arg Phe HisLeu Leu 130 Pro Glu Phe Asp Gln 135 Gly Lys Arg Ser Cys 140 Arg Arg Arg LeuAla Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Ser Ile Leu145 150 155 160Ser Thr Arg Gly Arg 165 Leu Ser Ser Ser Leu 170 Tyr Glu Asn Ser Ser 175 ArgIle Gly Ser Phe 180 Leu Met Asp Phe Thr 185 Ala Tyr Pro Arg Phe 190 Ser GlyArg Asp Thr 195 Trp Thr Thr Arg Thr 200 Ser Glu Arg Ala Pro 205 Val Asn GlnAsn Ala 210 Asn Asp Ala Gly Lys 215 Phe Leu Gln Gln Pro 220 Trp Gln Ser AsnSer Asp Ile Ser Thr Ser Gly Phe Tyr Leu Gln Gly Ser Ala Gly Gly225 230 235 240Thr Ser Tyr Pro Gly 245 Pro Gly Ile Pro Pro 250 Gly Glu Cys Val Thr 255 ValVal Thr Asp Ser 260 Ser Cys Ala Leu Ser 265 Leu Leu Ser Asn Gln 270 Pro TrpGly Ser Arg 275 Asn Arg Val Leu Gly 280 Ala Gly Met Asn Ser 285 Leu Met AsnThr Gln 290 Gly Val Pro Val Ala 295 Gln Pro Val Pro His 300 Ser Ala Thr SerAsn His Phe Pro Thr Thr Ser Trp Gly Phe Lys Gly Asn Glu Asn Gly305 310 315 320Ser Ser Ser His Gly 325 Met Leu Pro Asp Leu 330 Gly Leu Gly Gln Ile 335 SerGln Pro Leu Ser 340 Ser Gln Tyr Ser Gly 345 Val Leu Glu Leu Ser 350 Gln GlnGly Arg Arg 355 Gln Gln His Met Glu 360 Leu Gly His Thr Arg 365 Gly Tyr Asp
Ser Thr Ser Gln Gln Met His Trp Ser Leu
370 375<210> 248<211> 1014<212> DNA
<213> Medicago trunculata<400> 248
atggattcag gaggcaactc ttcttcagaa gagtcctcac ttaatggctt gaaatttggc 60
caacgaatct atttcgaaga tacagctctt actgctgctt ctgctgctgc tgctagtact 120
accattgctg ctggttctcc ttcttcttct ggttcaaaga aaggaagagg tgggtcagtt 180caacattctc aaccacctag gtgtcaagtt gaaggatgta aactagatct gactgatgct 240
aaagcttact attctagaca caaagtttgt agcatgcact ctaaatcccc tactgttact 300
gtttctggtc ttcaacaaag gttttgtcaa caatgtagca gatttcatca gcttgctgag 360
tttgatcaag gaaaaagaag ttgtcggaga cgactagctg gtcataatga gcgtcgcaga 420
aagcccccac ccagctctct cttaacctca cgttttgcca ggctttcttc gtctgttttt 480
ggtaacagcg acagaggtgg cagctttttg atggaatttg cttcaaatcc gaaacatagt 540
ctgaggaatt cacccggaaa tcaaaccaca gcaatcggtt ggccttggcc ggggaacacg 600
gagtcgccat ctagcaacct tttcttgcaa ggttcggtgg gtgggacaag cttccctggt 660
gccaggcatc ctcccgagga aacttacact ggagtcacag attcaaactg tgctctctct 720
cttctgtcaa atcaaacatg gggttctcaa aacacagaac caagtcctgg attgaataac 780
atgctgaatt tcaacgggac acccatgaca caacttggta catcttctca tggtgtagcc 840
atgcatcaaa ttccaaacaa ttacgaggtt gtccctgatc ttggtcgggg tcacattttg 900
catcctcttg gtagccaaca ctctggcgag cttgatctgt tgcagcaggg aaggaggcat 960
tatatggatg tagaacattc cagggcctat gaatcttctc agtggtcact gtaa 1014<210> 249<211> 337<212> PRT
<213> Medicago trunculata<400> 249 Met Asp Ser Gly Gly Asn Ser Ser Ser Glu Glu Ser Ser Leu Asn Gly1 5 10 15 Leu Lys Phe Gly Gln Arg Ile Tyr Phe Glu Asp Thr Ala Leu Thr Ala 20 25 30 Ala Ser Ala Ala Ala Ala Ser Thr Thr Ile Ala Ala Gly Ser Pro Ser 35 40 45 Ser Ser Gly Ser Lys Lys Gly Arg Gly Gly Ser Val Gln His Ser Gln 50 55 60 Pro Pro Arg Cys Gln Val Glu Gly Cys Lys Leu Asp Leu Thr Asp Ala65 70 75 80Lys Ala Tyr Tyr Ser Arg His Lys Val Cys Ser Met His Ser Lys Ser 85 90 95 Pro Thr Val Thr Val Ser Gly Leu Gln Gln Arg Phe Cys Gln Gln Cys 100 105 110 Ser Arg Phe His Gln Leu Ala Glu Phe Asp Gln Gly Lys Arg Ser Cys 115 120 125 Arg Arg Arg Leu Ala Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro 130 135 140 Ser Ser Leu Leu Thr Ser Arg Phe Ala Arg Leu Ser Ser Ser Val Phe145 150 155 160Gly Asn Ser Asp Arg Gly Gly Ser Phe Leu Met Glu Phe Ala Ser Asn 165 170 175 Pro Lys His Ser Leu Arg Asn Ser Pro Gly Asn Gln Thr Thr Ala Ile 180 185 190 Gly Trp Pro Trp Pro Gly Asn Thr Glu Ser Pro Ser Ser Asn Leu Phe 195 200 205 Leu Gln Gly Ser Val Gly Gly Thr Ser Phe Pro Gly Ala Arg His Pro 210 215 220 Pro Glu Glu Thr Tyr Thr Gly Val Thr Asp Ser Asn Cys Ala Leu Ser225 230 235 240Leu Leu Ser Asn Gln Thr Trp Gly Ser Gln Asn Thr Glu Pro Ser Pro 245 250 255 Gly Leu Asn Asn Met Leu Asn Phe Asn Gly Thr Pro Met Thr Gln Leu 260 265 270 Gly Thr Ser Ser His Gly Val Ala Met His Gln Ile Pro Asn Asn Tyr 275 280 285 Glu Val Val Pro Asp Leu Gly Arg Gly His Ile Leu His Pro Leu Gly 290 295 300 Ser Gln His Ser Gly Glu Leu Asp Leu Leu Gln Gln Gly Arg Arg His305 310 315 320Tyr Met Asp Val Glu His Ser Arg Ala Tyr Glu Ser Ser Gln Trp Ser 325 330 335 Leu
<210> 250<211> 1143<212> DNA
<213> Nicotiana bentamiana<400> 250
atggaacttc tggcttctgc ttcttcttct acttctacta attctacttc ccctgactct 60
cctcccaaca ctttaaaatt tggtcaaaaa atctactttg agcatgttgg acttcagcac 120
ctcaaatcag caactgggtc gtcgtcgtca tcgccgccgg tcatcggaac tccggcgccg 180
gcgatgtcca agaaaggaag agggggtggt gtagttcaag gtcggcaacc acctaggtgt 240
caagttgaag ggtgtgaagc agatctgagt gatgttaagg cttactattc aaggcacaaa 300
gtctgtgcta cacattctaa gtctcctgtg gtcattgttg ctggtcttga acaaagattt 360
tgtcaacagt gtagcaggtt tcatcggttg ccagaatttg accaagggaa acgcagttgc 420
cgcaggcgcc tagcaggcca taatgagcgt cggaggaaac ctccacctgg atctcttttg 480
tctaatcgct atggaagtct ttcttcatca atatttgaaa acaatggcag atctggaagt 540
tttctggttg acttcactgc atatccgaat ctcactggag gtgcatggcc aaatactaga 600
tcatctgatc gaggatggga taatcaatcc actgcgtcag ggaagcttct ccaaagtcat 660
tggctgaaca gttctgaaaa tccgacatcc gaccttgttc tgcaaggttc agttgctagg 720
ggtgccaatt attctggtcc tggtattatt ccttccggaa actgcttctc tggagtctca 780gattccaatg gtgctctctc tcttctgtca aatgagccat ggggctcgag gaaccaatcctctagcctcg gggttaacgg cttggtcaac actgatggcg gacataccgt tcacccatcgggttcccatg ctgctcctgt caatcactac tcaggccctc tatggggatt taaaggaaatgaagctagta gcagttcaca tgcaatacct cctgatctcg ggctgggtca catttctcaacatgctgtca atcagtactc tggtgagcct gggatggctc agcacagtgg aagacagtacatgggactgg agcattcaaa gggttataat tcttctgttc agaatgtgca ctggacactttga
<210> 251<211> 380<212> PRT
<213> Nicotiana bentamiana<400> 251
Met Glu Leu Leu Ala Ser Ala Ser Ser Ser Thr Ser Thr Asn Ser Thr1 5 10 15 Ser Pro Asp Ser Pro Pro Asn Thr Leu Lys Phe Gly Gln Lys Ile Tyr 20 25 30 Phe Glu His Val Gly Leu Gln His Leu Lys Ser Ala Thr Gly Ser Ser 35 40 45 Ser Ser Ser Pro Pro Val Ile Gly Thr Pro Ala Pro Ala Met Ser Lys 50 55 60 Lys Gly Arg Gly Gly Gly Val Val Gln Gly Arg Gln Pro Pro Arg Cys65 70 75 80Gln Val Glu Gly Cys Glu Ala Asp Leu Ser Asp Val Lys Ala Tyr Tyr 85 90 95 Ser Arg His Lys Val Cys Ala Thr His Ser Lys Ser Pro Val Val Ile 100 105 110 Val Ala Gly Leu Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His 115 120 125 Arg Leu Pro Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu 130 135 140 Ala Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Ser Leu Leu145 150 155 160Ser Asn Arg Tyr Gly Ser Leu Ser Ser Ser Ile Phe Glu Asn Asn Gly 165 170 175 Arg Ser Gly Ser Phe Leu Val Asp Phe Thr Ala Tyr Pro Asn Leu Thr 180 185 190 Gly Gly Ala Trp Pro Asn Thr Arg Ser Ser Asp Arg Gly Trp Asp Asn 195 200 205 Gln Ser Thr Ala Ser Gly Lys Leu Leu Gln Ser His Trp Leu Asn Ser 210 215 220 Ser Glu Asn Pro Thr Ser Asp Leu Val Leu Gln Gly Ser Val Ala Arg225 230 235 240Gly Ala Asn Tyr Ser Gly Pro Gly Ile Ile Pro Ser Gly Asn Cys Phe 245 250 255 Ser Gly Val Ser Asp Ser Asn Gly Ala Leu Ser Leu Leu Ser Asn Glu 260 265 270 Pro Trp Gly Ser Arg Asn Gln Ser Ser Ser Leu Gly Val Asn Gly Leu 275 280 285 Val Asn Thr Asp Gly Gly His Thr Val His Pro Ser Gly Ser His Ala 290 295 300 Ala Pro Val Asn His Tyr Ser Gly Pro Leu Trp Gly Phe Lys Gly Asn305 310 315 320Glu Ala Ser Ser Ser Ser His Ala Ile Pro Pro Asp Leu Gly Leu Gly 325 330 335 His Ile Ser Gln His Ala Val Asn Gln Tyr Ser Gly Glu Pro Gly Met 340 345 350 Ala Gln His Ser Gly Arg Gln Tyr Met Gly Leu Glu His Ser Lys Gly 355 360 365 Tyr Asn Ser Ser Val Gln Asn Val His Trp Thr Leu 370 375 380 <210> 252 <211> 1254
<212> DNA<213> Oryza sativa<400> 252
atggagatgg ccagtggagg aggcgccgcc gccgccgccg gcggcggagt aggcggcagc 60
ggcggcggtg gtggtggagg ggacgagcac cgccagctgc acggtctcaa gttcggcaag 120
aagatctact tcgaggacgc cgccgcggca gcaggcggcg gcggcactgg cagtggcagt 180
ggcagcgcga gcgccgcgcc gccgtcctcg tcttccaagg cggcgggtgg tggacgcggc 24 0
ggagggggca agaacaaggg gaagggcgtg gccgcggcgg cgccaccgcc gccgccgccg 300
ccgccgcggt gccaggtgga ggggtgcggc gcggatctga gcgggatcaa gaactactac 360
tgccgccaca aggtgtgctt catgcattcc aaggctcccc gcgtcgtcgt cgccggcctc 420
gagcagcgct tctgccagca gtgcagcagg ttccacctgc tgcctgaatt tgaccaagga 480
aaacgcagct gccgcagacg ccttgcaggt cataatgagc gccggaggag gccgcaaacc 540
cctttggcat cacgctacgg tcgactagct gcatctgttg gtgagcatcg caggttcaga 600
agctttacgt tggatttctc ctacccaagg gttccaagca gcgtaaggaa tgcatggcca 660
gcaattcaac caggcgatcg gatctccggt ggtatccagt ggcacaggaa cgtagctcct 720
catggtcact ctagtgcagt ggcgggatat ggtgccaaca catacagcgg ccaaggtagc 780
tcttcttcag ggccaccggt gttcgctggc ccaaatctcc ctccaggtgg atgtctcgca 840
ggggtcggtg ccgccaccga ctcgagctgt gctctctctc ttctgtcaac ccagccatgg 900
gatactacta cccacagtgc cgctgccagc cacaaccagg ctgcagccat gtccactacc 960
accagctttg atggcaatcc tgtggcaccc tccgccatgg cgggtagcta catggcacca 1020
agcccctgga caggttctcg gggccàtgag ggtggtggtc ggagcgtggc gcaccagcta 1080
ccacatgaag tctcacttga tgaggtgcac cctggtccta gccatcatgc ccacttctcc 1140
ggtgagcttg agcttgctct gcaggggaac ggtccagccc cagcaccacg catcgatcct 1200
gggtccggca gcaccttcga ccaaaccagc aacacgatgg attggtctct gtag 1254<210> 253<211> 417<212> PRT
<213> Oryza sativa<400> 253
Met Glu Met Ala Ser Gly Gly Gly Ala Ala Ala Ala Ala Gly Gly Gly1 5 10 15 Val Gly Gly Ser Gly Gly Gly Gly Gly Gly Gly Asp Glu His Arg Gln 20 25 30 Leu His Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu Asp Ala Ala 35 40 45 Ala Ala Ala Gly Gly Gly Gly Thr Gly Ser Gly Ser Gly Ser Ala Ser 50 55 60 Ala Ala Pro Pro Ser Ser Ser Ser Lys Ala Ala Gly Gly Gly Arg Gly65 70 75 80Gly Gly Gly Lys Asn Lys Gly Lys Gly Val Ala Ala Ala Ala Pro Pro 85 90 95 Pro Pro Pro Pro Pro Pro Arg Cys Gln Val Glu Gly Cys Gly Ala Asp 100 105 110 Leu Ser Gly Ile Lys Asn Tyr Tyr Cys Arg His Lys Val Cys Phe Met 115 120 125 His Ser Lys Ala Pro Arg Val Val Val Ala Gly Leu Glu Gln Arg Phe 130 135 140 Cys Gln Gln Cys Ser Arg Phe His Leu Leu Pro Glu Phe Asp Gln Gly145 150 155 160Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg Arg Arg 165 170 175 Arg Pro Gln Thr Pro Leu Ala Ser Arg Tyr Gly Arg Leu Ala Ala Ser 180 185 190 Val Gly Glu His Arg Arg Phe Arg Ser Phe Thr Leu Asp Phe Ser Tyr 195 200 205 Pro Arg Val Pro Ser Ser Val Arg Asn Ala Trp Pro Ala Ile Gln Pro 210 215 220 Gly Asp Arg Ile Ser Gly Gly Ile Gln Trp His Arg Asn Val Ala Pro225 230 235 240His Gly His Ser Ser Ala Val Ala Gly Tyr Gly Ala Asn Thr Tyr Ser 245 250 255 Gly Gln Gly Ser Ser Ser Ser Gly Pro Pro Val Phe Ala Gly Pro Asn 260 265 270 Leu Pro Pro Gly Gly Cys Leu Ala Gly Val Gly Ala Ala Thr Asp Ser275
280
290
295
305
310
325
330
Tyr Met Ala Pro Ser Pro Trp Thr Gly Ser Arg
340
345
Gly Arg Ser Val Ala His Gln Leu Pro His Glu
355
360
370
375
385
390
285Pro Trp Asp 300 Ala Ala Met315 Ser Ala MetArg Gly HisGlu Val Ser 365Phe Ser Gly 380 Ala Pro Arg395 Asn Thr Met
410
405Leu
<210> 254<211> 1182<212> DNA<213> Oryza sativa<400> 254
atggcgaccg gcggcagcgg cggcggcggc ggaggtggaggggctcaagt tcggcaagaa gatctacttc gagcaggacggcggcggtgg agtcgtcgtc gacgtcgtcg ggcggaggcggcggcggcgg cggcgccccc gccgccgctg ccgccgaggtgtggatctga gcggcgtcaa gccgtactac tgccgccacaaaggagccca tcgtcgtcgt cgccggcctc gagcagcgctttccaccaat tacctgaatt tgatcaagaa aaaaaaagctcacaatgaac gccggaggaa gccgacacct ggacctctttgctgcatcct ttcatgaaga gccaggcagg tccagaagctccaagggttc caagcagtgt gagggatgcg tggcctgctatccggttcaa tccagtggca agggggccat gaactccatcggatacagtg atcaccatgc gttcagcagc catggtggctctccaccacc cagcctttga gctcacctca ggtggatgtctccagctgtg ctctctctct tctgtcaact cagccatgggagccacaacc ggtccccgcc aatgtcgtca acggccagcgccggtgtcgc cctcggtcat ggcaagcaac tacatggcggtccagccggg gccatgacgg cgccaggaac gtgcacctgcctgaacgagg tccctccggg ctctgtccac cacggccattgcactgcagg gaggtgcccc gtccaaccgg ccggaagccggccttcagcc actccaccaa tgccatgaac tggtctctgt<210> 255<211> 393<212> PRT
<213> Oryza sativa<400> 255
Met Ala Thr Gly Gly Ser Gly Gly Gly Gly Gly1 5
Thr Thr Thr
Ser Thr Thr320
Ala Gly Ser
335Glu Gly Gly350
Leu Asp Glu
Glu Leu Glu
Ile Asp Pro400
Asp Trp Ser415
gtggtggtgacggcggcgtcgcaagaaggggccaggtggaaggtgtgctatctgccaacagccgcagacgcttctcgctattgtggtagattcagcccagctcaccgcagcagcggctggtcgcgggagtatactacccaccttcggaggcgagccccggcgccaccgcatctccggcgaagcatggctcag
cgatgtccacggcgtcggcggaagggcgtggggttgcggccatgcacgccgtgcagcaggccttgcaggttggccggctttttctcataccgatcgcatgcgcagttgcgggcaccaatgcgccaccgacaagcaccagccggcaacaacctggaacagccggggttgtggctcgagctccggcagcggc
10
Gly
Asp Asp Val His Gly Leu Lys Phe Gly Lys Lys Ile
20 25
Asp Ala Ala Ala Ser Ala Ser Ala Ala Ala Val Glu
35
40
Gly
Tyr
Ser45
Gly
Phe
30
Ser
Gly Gly15
Glu GlnSer Thr
Ser Ser Gly Gly Gly Gly Lys Lys Gly Lys Gly Val Ala Ala Ala Ala 50 55 60 Ala Pro Pro Pro Pro Leu Pro Pro Arg Cys Gln Val Glu Gly Cys Gly65 70 75 80Val Asp Leu Ser Gly Val Lys Pro Tyr Tyr Cys Arg His Lys Val Cys 85 90 95 Tyr Met His Ala Lys Glu Pro Ile Val Val Val Ala Gly Leu Glu Gln 100 105 110 Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Pro Glu Phe Asp
601201802403003604204805406006607207808409009601020108011401182115
120
125
Gln Glu Lys Lys Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg 130 135 140 Arg Arg Lys Pro Thr Pro Gly Pro Leu Ser Ser Arg Tyr Gly Arg Leu145 150 155 160Ala Ala Ser Phe His Glu Glu Pro Gly Arg Ser Arg Ser Phe Val Val 165 170 175 Asp Phe Ser Tyr Pro Arg Val Pro Ser Ser Val Arg Asp Ala Trp Pro 180 185 190 Ala Ile Gln Pro Ser Asp Arg Met Ser Gly Ser Ile Gln Trp Gln Gly 195 200 205 Gly His Glu Leu His Pro His Arg Ser Ala Val Ala Gly Tyr Ser Asp 210 215 220 His His Ala Phe Ser Ser His Gly Gly Ser Ala Ala Gly Ala Pro Met225 230 235 240Leu His His Pro Ala Phe Glu Leu Thr Ser Gly Gly Cys Leu Ala Gly 245 250 255 Val Ala Thr Asp Ser Ser Cys Ala Leu Ser Leu Leu Ser Thr Gln Pro 260 265 270 Trp Asp Thr Thr Gln Ser Thr Ser Ser His Asn Arg Ser Pro Pro Met 275 280 285 Ser Ser Thr Ala Ser Ala Phe Gly Gly Gly Asn Asn Pro Val Ser Pro 290 295 300 Ser Val Met Ala Ser Asn Tyr Met Ala Ala Ser Pro Gly Trp Asn Ser305 310 315 320Ser Ser Arg Gly His Asp Gly Ala Arg Asn Val His Leu Pro Pro Pro 325 330 335 His Gly Val Val Leu Asn Glu Val Pro Pro Gly Ser Val His His Gly 340 345 350 His Phe Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly Gly Ala Pro Ser 355 360 365 Asn Arg Pro Glu Ala Glu His Gly Ser Gly Ser Gly Ala Phe Ser His
370
375
380
Ser Thr Asn Ala Met Asn Trp Ser Leu
385 390
<210> 256
<211> 1119
<212> DNA
<213> Solanum tuberosum<400> 256
atggaactgg gttcagtttc ttcttctggtttgaagtttg gtaagaaaat ctactttggaggaagtgggt cgtcgccggt gaccggagataagaggggga ggggtgggtt ggtgcagggttgtcaggcag atctgagtga tgctaaggctcactctaagt ctcctactgt tgttgttgctagcaggttcc atcaattaac tgaattcgacgcatgccata atgagcgtcg taggaagcctgggaatcttt cttcatcaat atttgaaaatgacttcagct cacaccaaaa tgtcaatgatcaaggatggg atcatcaatc atcagggaaggaaaatgctg ccagtgagct tgttttgcaagttccttctg gagactattt tcctggagtctcaaatcggt cctggggatc aaggaatcgacacattgatg gggtacacac cattcaacctttctcaagcc cttcattgag ttttaaaggacctcctgatc tcggtttggg tcaaatgttacttgggatgg ctcagcatgg tgatggacgatatcatcctt ctgttcagaa tgtgcactgg<210> 257<211> 372<212> PRT
<213> Solanum tuberosum
aattcaagctaatgtgggtggggaacatgcggtcatccactactattcaaggtcttgaaccaggggaaaaccatctggataatagcagcaagttcatggcttccttcaacggttcagctatcagattcaatctccaagtctcaggttctcaatgaagctacaagcttctgcaatacatggactctttga
catctgattcttggagttcacaccggctccctaggtgtcaggcataaagtagaggttttgggagttgccgctcttttctcgatccggaagcaaatactcggtccttggctccaggaccaggtggtgctctttggggttaaatggtgcaccgcagcagttcataatccataaactggacca
tttgaatggtggtcaagaatggcgacgactagttgaaggtttgtggtatgccaacagtgtcaggagactgtacacactacctttctggtcagcatctgaagaataactctttatcctagtctctcttctgcagccaagtttaccaatcacacatgagatgctgtggcgaggtccaagggt
60120180240300360420480540600660720780840900960102010801119<400> 257
Met Glu Leu Gly Ser Val Ser Ser Ser Gly Asn Ser Ser Ser Ser Asp15 10 15
Ser Leu Asn Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Gly Asn Val
20 25 30
Gly Val Gly Val Gln Val Lys Asn Gly Ser Gly Ser Ser Pro Val Thr
35 40 45
Gly Asp Gly Asn Met Pro Pro Ala Pro Ala Thr Thr Lys Arg Gly Arg
50 55 60
Gly Gly Leu Val Gln Gly Gly His Pro Pro Arg Cys Gln Val Glu Gly65 70 75 80
Cys Gln Ala Asp Leu Ser Asp Ala Lys Ala Tyr Tyr Ser Arg His Lys
85 90 95
Val Cys Gly Met His Ser Lys Ser Pro Thr Val Val Val Ala Gly Leu
100 105 110
Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu Thr Glu
115 120 125
Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Cys His Asn
130 135 140
Glu Arg Arg Arg Lys Pro Pro Ser Gly Ser Leu Phe Ser Thr His Tyr145 150 155 160
Gly Asn Leu Ser Ser Ser Ile Phe Glu Asn Asn Ser Ser Arg Ser Gly
165 170 175
Ser Phe Leu Val Asp Phe Ser Ser His Gln Asn Val Asn Asp Ser Ser
180 185 190
Trp Pro Asn Thr Arg Ala Ser Glu Gln Gly Trp Asp His Gln Ser Ser
195 200 205
Gly Lys Phe Leu Gln Arg Pro Trp Leu Asn Asn Ser Glu Asn Ala Ala
210 215 220
Ser Glu Leu Val Leu Gln Gly Ser Ala Thr Arg Thr Ser Tyr Pro Ser225 230 235 240
Val Pro Ser Gly Asp Tyr Phe Pro Gly Val Ser Asp Ser Ser Gly Ala
245 250 255
Leu Ser Leu Leu Ser Asn Arg Ser Trp Gly Ser Arg Asn Arg Ser Pro
260 265 270
Ser Leu Gly Val Asn Ser Gln Val His Ile Asp Gly Val His Thr Ile
275 280 285
Gln Pro Ser Gly Ser His Gly Ala Pro Thr Asn His Phe Ser Ser Pro
290 295 300
Ser Leu Ser Phe Lys Gly Asn Glu Ala Ser Ser Ser Ser His Glu Met305 310 315 320
Pro Pro Asp Leu Gly Leu Gly Gln Met Leu Gln Ala Ser Asp Asn Pro
325 330 335
Tyr Cys Gly Glu Leu Gly Met Ala Gln His Gly Asp Gly Arg Gln Tyr
340 345 350
Met Glu Leu Asp Gln Ser Lys Gly Tyr His Pro Ser Val Gln Asn Val
355 360 365
His Trp Thr Leu
370<210> 258<211> 1140<212> DNA
<213> Vitis vinifera<400> 258
atggaaaggg gttcgagctc tttgaccgtt tccagctctt cggccaactc gtctgagtcg 60ctcaacgggt tgaaatttgg gcagaagata tattttgaag atttgggcgt tggagctccg 120gccaaatcgg gaaccggctc ctcctcctcc tcctctgccg ccggctccgg tggtcgccca 180cctccggcgc cgccaaagaa ggtaagaggt agtggggttg ttcagggagg ccaaccaccg 240aggtgtcaag ttgaagggtg taaactagat ctgagtgatg ccaaagctta ctattcaagg 300cataaagtgt gtggtatgca ttcgaagtct ccaacggtca ttgttgcggg ccttgagcag 360aggttttgcc agcagtgtag cagatttcat cagcttgccg aatttgacca aggaaaacga 420agttgtcgta ggcgcctggc tggtcataat gagcgtcgca ggaagccacc acctggatct 480ttattgtcct cacgctatgg gcgactttct tcatccattt ttgaaaacag cagcagggtg 540ggaggaggct ttctgatgga ctttgctgca tacccaaggc atcccgagag ggatacttgg 600ccaactacaa gagcatctga tcgggtacct ggaaatcaaa ccactgcgat gggaaggttt 660cttccacatc catggcagag caactctgag aatcctctct ttctgcaagg ttcagccggc 720gggaccagct ttcatggtcc tggaattcct tcaggagaat gtttcacagg ggcctccgac 780tcaagctgtg ctctctctct tctgtcaaat cagccatgga gctccaggaa tcgagcatct 840ggtcttggag caaacagctt catgaatcct gaaggggcat ccatggcgca acccacagct 900cctcatagtg cagctatcaa tcacttccca agcacctcgt gggatttcaa gggcaatgaa 960ggtagtagca gttcgcagga gatgccacct gatcttggtc ttggtcaaat ttcacagcct 1020attaatagcc agttctcagg tgggggcgag ttgccccaac agagtggaag gcaatacatg 1080gaactcgagc actccagggc ttatgacact tccactcagc agatgcactg gtcactttag 1140<210> 259<211> 379<212> PRT<213> Vitis vinifera<400> 259
Met Glu Arg Gly Ser Ser Ser Leu Thr Val Ser Ser Ser Ser Ala Asn15 10 15
Ser Ser Glu Ser Leu Asn Gly Leu Lys Phe Gly Gln Lys Ile Tyr Phe
20 25 30
Glu Asp Leu Gly Val Gly Ala Pro Ala Lys Ser Gly Thr Gly Ser Ser
35 40 45
Ser Ser Ser Ser Ala Ala Gly Ser Gly Gly Arg Pro Pro Pro Ala Pro
50 55 60
Pro Lys Lys Val Arg Gly Ser Gly Val Val Gln Gly Gly Gln Pro Pro65 70 75 80
Arg Cys Gln Val Glu Gly Cys Lys Leu Asp Leu Ser Asp Ala Lys Ala
85 90 95
Tyr Tyr Ser Arg His Lys Val Cys Gly Met His Ser Lys Ser Pro Thr
100 105 110
Val Ile Val Ala Gly Leu Glu Gln Arg Phe Cys Gln Gln Cys Ser Arg
115 120 125
Phe His Gln Leu Ala Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg
130 135 140
Arg Leu Ala Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Ser145 150 155 160
Leu Leu Ser Ser Arg Tyr Gly Arg Leu Ser Ser Ser Ile Phe Glu Asn
165 170 175
Ser Ser Arg Val Gly Gly Gly Phe Leu Met Asp Phe Ala Ala Tyr Pro
180 185 190
Arg His Pro Glu Arg Asp Thr Trp Pro Thr Thr Arg Ala Ser Asp Arg
195 200 205
Val Pro Gly Asn Gln Thr Thr Ala Met Gly Arg Phe Leu Pro His Pro
210 215 220
Trp Gln Ser Asn Ser Glu Asn Pro Leu Phe Leu Gln Gly Ser Ala Gly225 230 235 240
Gly Thr Ser Phe His Gly Pro Gly Ile Pro Ser Gly Glu Cys Phe Thr
245 250 255
Gly Ala Ser Asp Ser Ser Cys Ala Leu Ser Leu Leu Ser Asn Gln Pro
260 265 270
Trp Ser Ser Arg Asn Arg Ala Ser Gly Leu Gly Ala Asn Ser Phe Met
275 280 285
Asn Pro Glu Gly Ala Ser Met Ala Gln Pro Thr Ala Pro His Ser Ala
290 295 300
Ala Ile Asn His Phe Pro Ser Thr Ser Trp Asp Phe Lys Gly Asn Glu305 310 315 320
Gly Ser Ser Ser Ser Gln Glu Met Pro Pro Asp Leu Gly Leu Gly Gln
325 330 335
Ile Ser Gln Pro Ile Asn Ser Gln Phe Ser Gly Gly Gly Glu Leu Pro
340 345 350
Gln Gln Ser Gly Arg Gln Tyr Met Glu Leu Glu His Ser Arg Ala Tyr
355 360 365
Asp Thr Ser Thr Gln Gln Met His Trp Ser Leu370 375<210> 260<211> 1209<212> DNA<213> Zea mays<400> 260
atggagtccg gcggtggcgg ggacgaccagtacttcgagg acgccgccgg ctccagcagcgcgcctccag cgacgcagca gccgtcgccgggcggcagga ggggcagggc cgcggccggcgcgcgctgcc aggtcgacgg ctgcaacgtttgccgccaca aggtgtgcaa aatgcactccgagcagcgct tctgccagca gtgcagcaggaagaagagct gccgcaaacg cctcgcaggcggaccccttg cgtcacgata cggccgtcacagaagcttca tgctggattt ctcgtacccgcccgcggtga gggccggtgg tgaaagggtggatcctcgtc accaccaagg cgcggtcgcgggtagctcgt cgtcggcgag gccgccggtgtgccttgcag gagtccccgc ggactccagctgggatgctg cccacagcca cagccacagcggcagccctg tggcgccctc cctcatggcgaccgagaccg actcctgggg ccacgaaggcgacgtccccc tcggcgaggt gcactccggcgagctcgagc tcgccctgca gggaaacaggccgcgcaata atcagggctc cgcgggcacgtcgctctag<210> 261<211> 402<212> PRT<213> Zea mays<400> 261
Met Glu Ser Gly Gly Gly Gly Asp Asp Gln Leu His Gly Leu Lys Phe
1 5 10 15 Gly Lys Lys Ile 20 Tyr Phe Glu Asp Ala 25 Ala Gly Ser Ser Ser 30 Gly SerSer Ser Gly 35 Gly Gly Ser Ala Pro 40 Ala Pro Pro Ala Thr 45 Gln Gln ProSer Pro Pro Ala Ala Ser Pro Arg Ala Pro Ala Gly Gly Gly Arg Arg 50 55 60 Gly Arg Ala Ala Ala Gly Gly Ala Gly Pro Ser Thr Ala Pro Ala Pro65 70 75 80Ala Arg Cys Gln Val 85 Asp Gly Cys Asn Val 90 Asp Leu Thr Asp Val 95 LysPro Ala Tyr Tyr 100 Cys Arg His Lys Val 105 Cys Lys Met His Ser 110 Lys GluPro Arg Val 115 Leu Val Asn Gly Leu 120 Glu Gln Arg Phe Cys 125 Gln Gln CysSer Arg 130 Phe His Gln Leu Pro 135 Glu Phe Asp Gln Leu 140 Lys Lys Ser CysArg Lys Arg Leu Ala Gly His Asn Glu Arg Arg Arg Arg Pro Pro Pro145 150 155 160Gly Pro Leu Ala Ser 165 Arg Tyr Gly Arg His 170 Ala Ala Ser Leu Gly 175 GluPro Gly Arg Leu 180 Arg Ser Phe Met Leu 185 Asp Phe Ser Tyr Pro 190 Arg ValSer Ser Ala 195 Met Arg Gly Gly Phe 200 Pro Ala Val Arg Ala 205 Gly Gly GluArg Val 210 Pro Gly Gly Ile Gln 215 Trp Gln Ala Gly Leu 220 Asp Pro Arg HisHis Gln Gly Ala Val Ala Gly Tyr Gly Ala His Tyr Gly Ser Glu Gly225 230 235 240Gly Ser Ser Ser Ser 245 Ala Arg Pro Pro Val 250 Phe Pro Gly Pro Glu 255 Leu
ctgcacggcc tcaagttcgg caagaagatc 60ggcagcagca gcggcggtgg cagcgcgccc 120ccggccgctt cgcctagggc cccggccggc 180ggcgcgggcc cctcgacggc gcccgcgccc 240gacctcaccg acgtcaagcc cgcctactac 300aaggagcccc gcgtcctcgt caacggcctc 360ttccaccagc tgcctgaatt cgaccagcta 420cacaacgagc gccggaggag gccgccgcct 480gctgcgtcgc tcggcgagcc cggcaggctc 540agggtctcaa gcgccatgag gggtgggttt 600cctggcggga tccagtggca agcgggcttg 660ggatacggcg cccactatgg gagcgagggt 720ttccctggcc cggagctgcc cccaggtgga 780tgtgctctct ctcttctgtc aactcagcca 840cacgctgcgc caacagcggg tttcgacggc 900gcgagtagct acatcgcgcc gagcccctgg 960gggcggagcg tgcctcagct gccacctgac 1020tcgagcagcc accacggcca gttctcaggt 1080ccagcgccag ggtcggcggc accgccagcg 1140ttcgaccagg ctggcaacac gatggactgg 1200 1209Pro Pro Gly Gly Cys Leu Ala Gly Val Pro Ala Asp Ser Ser Cys Ala
260 265 270
Leu Ser Leu Leu Ser Thr Gln Pro Trp Asp Ala Ala His Ser His Ser
275 280 285
His Ser His Ala Ala Pro Thr Ala Gly Phe Asp Gly Gly Ser Pro Val
290 295 300
Ala Pro Ser Leu Met Ala Ala Ser Ser Tyr Ile Ala Pro Ser Pro Trp305 310 315 320
Thr Glu Thr Asp Ser Trp Gly His Glu Gly Gly Arg Ser Val Pro Gln
325 330 335
Leu Pro Pro Asp Asp Val Pro Leu Gly Glu Val His Ser Gly Ser Ser
340 345 350
Ser His His Gly Gln Phe Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly
355 360 365
Asn Arg Pro Ala Pro Gly Ser Ala Ala Pro Pro Ala Pro Arg Asn Asn
370 375 380
Gln Gly Ser Ala Gly Thr Phe Asp Gln Ala Gly Asn Thr Met Asp Trp385 390 395 400
Ser Leu
<210> 262<211> 1137<212> DNA<213> Zea mays<400> 262
atggcgaccg gcggcggcag cagcaggagc gacgacgtgc gcgggctcaa gtttggcaag 60aagatctact tcgagcagga cggcgggagc gggagcgggg cgggggcggt gggcggcagg 120aaggggaagg gcgtggccac cggtggcgcg aggccggcgt ccgccgcctc cgcagcccag 180ccgccgaggt gccaggtgga cgggtgcggc gtggatctga gcgccgtcaa gcagtactac 240tgccggcaca aggtgtgcaa catgcactcc aaggagccgc gcgtcttcgt cgccggcatc 300gagcagcgct tctgccaaca gtgcagcagg ttccaccagc tacatgaatt tgaccaaggg 360aaacgtagct gccgccgccg cctcatcggt cacaacgagc gccggaggaa gccaccacct 420ggacctctca cttcacgata tggccggctc gctgcatcac ttcaagagcc tggcaggttc 480agaagcttcc tgctcgactt ctcgtaccca agggttccaa gcagcgtgag ggatgcgtgg 54 0ccaggaatcc agcacggtgg cgacaggatg ctgggcaccg tccagtggca tgggcaccaa 600gaacctcctc acccacaccg cagtgcagct gctggctatg gcaaccatgc tgcatacaac 660tgccatggcg gcttggtagc aggcggggcc ccaatgctct cctctgccgc ctttgagctc 720ccgcctggcg gatgtgtcgc gggagttgcc gccgactcca gctgtgctct ctctcttctg 780tcaactcagc catgggacac gacctcccac gaccaccggt ccccagcaat gcccgcggcc 840ggcgccttcg acggcacccc ggtggcgccg tccgtcatgg cgagcagcta cgcggcgtcg 900agcgcctgga cgggctcgcg ggaccccgct gccgacggcg ccaggaacgc gcagcgtctc 960gacgatgctc tgcacctggt ccacccaggc tccgcggcgg tccacttctc cggcgagctc 1020gagctcgccc tgcagggaag cggcgggccg ccacacctgc cgcgcgtcga ccatggcggc 1080tccggcggcg gcaccttcaa ccattccacc accagcgcga tgaactggtc cctgtag 1137
<210> 263<211> 378<212> PRT<213> Zea mays<400> 263
Met Ala Thr Gly Gly Gly Ser Ser1 5
Lys Phe Gly Lys Lys Ile Tyr Phe20
Gly Ala Gly Ala Val Gly Gly Arg
35 40
Gly Ala Arg Pro Ala Ser Ala Ala
50 55
Gln Val Asp Gly Cys Gly Val Asp65 70
Cys Arg His Lys Val Cys Asn Met85
Val Ala Gly Ile Glu Gln Arg Phe100
Arg Ser Asp Asp Val Arg Gly Leu
10 15
Glu Gln Asp Gly Gly Ser Gly Ser25 30
Lys Gly Lys Gly Val Ala Thr Gly45
Ser Ala Ala Gln Pro Pro Arg Cys60
Leu Ser Ala Val Lys Gln Tyr Tyr
75 80
His Ser Lys Glu Pro Arg Val Phe
90 95
Cys Gln Gln Cys Ser Arg Phe His105 110Gln Leu His Glu Phe Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu
115 120 125
Ile Gly His Asn Glu Arg Arg Arg Lys Pro Pro Pro Gly Pro Leu Thr
130 135 140
Ser Arg Tyr Gly Arg Leu Ala Ala Ser Leu Gln Glu Pro Gly Arg Phe145 150 155 160
Arg Ser Phe Leu Leu Asp Phe Ser Tyr Pro Arg Val Pro Ser Ser Val
165 170 175
Arg Asp Ala Trp Pro Gly Ile Gln His Gly Gly Asp Arg Met Leu Gly
180 185 190
Thr Val Gln Trp His Gly His Gln Glu Pro Pro His Pro His Arg Ser
195 200 205
Ala Ala Ala Gly Tyr Gly Asn His Ala Ala Tyr Asn Cys His Gly Gly
210 215 220
Leu Val Ala Gly Gly Ala Pro Met Leu Ser Ser Ala Ala Phe Glu Leu225 230 235 240
Pro Pro Gly Gly Cys Val Ala Gly Val Ala Ala Asp Ser Ser Cys Ala
245 250 255
Leu Ser Leu Leu Ser Thr Gln Pro Trp Asp Thr Thr Ser His Asp His
260 265 270
Arg Ser Pro Ala Met Pro Ala Ala Gly Ala Phe Asp Gly Thr Pro Val
275 280 285
Ala Pro Ser Val Met Ala Ser Ser Tyr Ala Ala Ser Ser Ala Trp Thr
290 295 300
Gly Ser Arg Asp Pro Ala Ala Asp Gly Ala Arg Asn Ala Gln Arg Leu305 310 315 320
Asp Asp Ala Leu His Leu Val His Pro Gly Ser Ala Ala Val His Phe
325 330 335
Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly Ser Gly Gly Pro Pro His
340 345 350
Leu Pro Arg Val Asp His Gly Gly Ser Gly Gly Gly Thr Phe Asn His
355 360 365
Ser Thr Thr Ser Ala Met Asn Trp Ser Leu
370 375
<210> 264<211> 403<212> DNA
<213> Sorghum propinquum<400> 264
atggagtccg gtggcgccag tggcggcggc ggcggggacg accagctgca cggcctcaag 60ttcggcaaga agatctactt cgaggacgcc gccgcggtcg gctccagcag cggtggcggt 120ggcggtggca gtggcagtgc tagcgcgacc cccgcgcctc cagcgacgca gcagccgtcc 180ccgccgcagg ccgcttcgcc cagggcagcc agcggcggcg gcggcaggag gggcagggcc 240gcgggcggcc cctccccggc gcccgcgccc gcgcgctgcc aggtcgacgg ctgcaacgtg 300gacctcaccg acgtcaagcc ctactactgc cgccacaagg tctgcaaaat gcactccaag 360gagccccgcg tcgtcgtcaa cggcctcgag cagcgcttct gcc 403
<210> 265<211> 134<212> PRT
<213> Sorghum propinquum<400> 265
Met Glu Ser Gly Gly Ala Ser Gly Gly Gly Gly Gly Asp Asp Gln Leu15 10 15
His Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu Asp Ala Ala Ala
20 25 30
Val Gly Ser Ser Ser Gly Gly Gly Gly Gly Gly Ser Gly Ser Ala Ser
35 40 45
Ala Thr Pro Ala Pro Pro Ala Thr Gln Gln Pro Ser Pro Pro Gln Ala
50 55 60
Ala Ser Pro Arg Ala Ala Ser Gly Gly Gly Gly Arg Arg Gly Arg Ala65 70 75 80
Ala Gly Gly Pro Ser Pro Ala Pro Ala Pro Ala Arg Cys Gln Val Asp85 90 95Gly Cys Asn Val Asp Leu Thr Asp Val Lys Pro
100 105
Lys Val Cys Lys Met His Ser Lys Glu Pro Arg
115 120
Leu Glu Gln Arg Phe Cys
130<210> 266<211> 732<212> DNA<213> Allium cepa<400> 266
atggaaatgg gttcgagctc tgagccaatt tctgactctcgaaaaaattt actttgaaga ttccactacc agtactgcaagctgctcctc ccaaaaaggg aaaatcttta gcttcttcgtcagcaacaaa taagcatacc tagatgccag gttgaaggatgctaaagcct attactgcag gcataaggtt tgcggagttcgtggttgctg gaattgaaca gaggttttgt cagcagtgcagaatttgacc aaggaaaaag aagctgccgc agacgcctagagaaagccgc ctccaggccc ttcccgttat ggaaggatgtagtaacagat tcagaggatt cctgatggac ttcagttaccccaggagatc atctatggcc tagactgtcc aacattccatactgcatcta acattcatgt tgctcaaccg tacatgcatggagcttccac acaggaatac atggtctggc gtctgcgactctgtcactca ac<210> 267<211> 244<212> PRT<213> Allium cepa<400> 267
Met Glu Met Gly Ser Ser Ser Glu Pro Ile Ser1 5 10
Tyr Tyr Cys Arg His110
Val Val Val Asn Gly125
tcgatgggct cacattcggcgtactactag caatacaattccactaatat caactctaat
gcaaagttgaattcaaaatcgcaggttccactggacacaacatcatctgtcgaggcccatcatacccagccaatgaatcatgagctgtgc
tttgactggaaccaaaagttccagttgcaatgagcgtcgtctatgatggcacagcctcctaaacccaaacctacagttcctctctctctt
Asp Ser
Leu Thr Phe Gly Glu Lys Ile Tyr Phe Glu Asp Ser Thr
20
25
Ala Ser Thr Thr Ser Asn Thr Ile Ala Ala Pro
35
40
Ser Leu Ala Ser Ser Ser Thr Asn Ile Asn Ser
50
55
Ser Ile Pro Arg Cys Gln Val Glu Gly Cys Lys
Pro Lys45
Asn Gln60
Val Asp
65
70
75
Ala Lys Ala Tyr Tyr Cys Arg His Lys Val Cys Gly Val
85 90
Ser Pro Lys Val Val Val Ala Gly Ile Glu Gln Arg Phe
100
105
Cys Ser Arg Phe His Gln Leu Gln Glu Phe Asp
115
120
Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg
130
135
Pro Gly Pro Ser Arg Tyr Gly Arg Met Ser Ser
145
150
155
Ser Asn Arg Phe Arg Gly Phe Leu Met Asp Phe
165 170
Ile Gln Pro Pro Pro Gly Asp His Leu Trp Pro
180 185
Pro Ser Tyr Pro Ala Asn Pro Asn Thr Ala Ser
195 200
Gln Pro Tyr Met His Ala Met Asn His Tyr Ser
210 215
Arg Asn Thr Trp Ser Gly Val Cys Asp Leu Ser225 230 235
Leu Ser Leu Asn
Gln Gly125Arg Arg140
Ser Val
Ser Tyr
Arg Leu
Asn Ile205Ser Glu220
Cys Ala
Leu Asp Gly15
Thr Ser Thr30
Lys Gly Lys
Gln Gln Ile
Leu Thr Gly80
His Ser Lys95
Cys Gln Gln110
Lys Arg Ser
Lys Pro Pro
Tyr Asp Gly160
Pro Arg Pro175
Ser Asn Ile190
His Val Ala
Leu Pro His
Leu Ser Leu240
60120180240300360420480540600660720732
<210> 268<211> 969<212> DNA
<213> Antirrhinum majus<400> 268
tcagctgctg gtggagcaga ggaatctctc aatgggttga agtttggcaa gaaaatatac 60
tttgaggagg ctaaggcaaa gaaagggaag agtaccggtg gggtggttag gtgccaggtg 120
gaggggtgtg aggtagatct gagtgatgct aaggcttact atttgagaca caaagtttgt 180
agtatgcatt caaagtctcc aaaggtcatt gttgctggaa tagaacaaag gttttgccag 240
cagtgcagca ggttccatca attgcctgaa tttgaccaag gaaaacggag ttgccgcaga 300
cgccttgcag gccacaacga acgtcggagg aagccatctc caggatctat gatgtctcct 360
tactatggaa gtctttctcc aaccttattt gataaccaaa atagaactgg aggctttttg 420
atggacttca gcacttaccc aaatctcgct gggaaagatt catggccaaa tacaataccc 480
gaacgaggat tgggaggtcc agcaagtcca tggcagagcg acatgcaaaa tcctgtacct 540
gagtttttgc gaggtacaac aaataggcca agtttttctg gtcttggagt atcttccgaa 600
gaatgtttta gcggagtctc taattccagc actgctctct ctcttctgtc aaatcagtcc 660
tggggctcca gaaactcgaa caattttctt ggtaccaatg gaaacgggcc aaccatagtt 720
cagccgtcta ttaaccctgg tgccacaatt ggacagttta cctgtccctc ttggggtttt 780
ggaggcaacc cagctgataa cacctcccat gatatgcctc ccaatctgaa tttaggacaa 840
ttttctcact ccagtaacag tcactatact ggagagcctg gggtagtcca actgagccac 900
ggacaattcc aggacctcga tcactcaaga ggctatgatt cttccgttca ggacatgcat 960
tggtcactt 969<210> 269<211> 323<212> PRT
<213> Antirrhinum majus<400> 269
20
25
35
40
50
55
65
70
85
100
105
115
120
130
135
145
150
165
Asn Pro Val Pro Glu Phe Leu Arg Gly Thr Thr
180
185
Ser Gly Leu Gly Val Ser Ser Glu Glu Cys Phe
195
200
Ser Ser Thr Ala Leu Ser Leu Leu Ser Asn Gln
210
215
Asn Ser Asn Asn Phe Leu Gly Thr Asn Gly Asn
225
230
Gln Pro Ser Ile Asn Pro Gly Ala Thr Ile Gly245
260
265
275
280
290
295
Leu Asn Gly Leu Lys Phe Gly10 15 Ala Lys Lys Gly Lys Ser Thr 30 Gly Cys Glu Val â R Asp Leu SerLys Val Cys Ί -J Ser Met His Ser 60 Ile Glu Gln Arg Phe Cys Gln 75 80Glu Phe Asp Gln Gly Lys Arg90 95 Asn Glu Arg Arg Arg Lys Pro 110 Tyr Gly Ser Leu Ser Pro Thr 125 Gly Phe Leu Met Asp Phe Ser 140 Ser Trp Pro Asn Thr Ile Pro 155 160Pro Trp Gln Ser Asp Met Gln170 175 Thr Thr Asn Arg Pro Ser Phe 190 Cys Phe Ser Gly Val Ser Asn 205 Asn Gln Ser Trp Gly Ser Arg 220 Gly Asn Gly Pro Thr Ile Val 235 240Ile Gly Gln Phe Thr Cys Pro250 255 Asp Asn Thr Ser His Asp Met 270 Ser His Ser Ser Asn Ser His 285 Leu Ser His Gly Gln Phe Gln 300Asp Leu Asp His Ser Arg Gly Tyr Asp Ser Ser Val Gln Asp Met His305 310 315 320
Trp Ser Leu
<210> 270<211> 633
<212> DNA
<213> Brassica napus<400> 270
gacttggaga aaagaagttg tagaagacgt ctagcttgtcccccaagcaa caacagcagc tcttttggct tctggttacttacggaagcg ttttgggaga tcctacaacg tggtcaaccgtccgcaccgt gggatagcca tcaactgatg aacgttttgtagtataacat acccagagat ggtgaacaat aatagcacagcttctgtcaa actcaaacac aactcagcag cagcagcagaatggacgcag aaagggttac aatggctaag tcaccgcctgtcgaaacaaa cctgggagtt catgtcaggc gaaaagagcacctgttttgg gactgagaca aatctctgag ccagatgatgaatggcacca caatgggtgg attcgagctg aacctacagctactcttcta ctcaaaattt tacttggcct ctt
<210> 271<211> 211<212> PRT
<213> Brassica napus<400> 271
ataacgaaagctagaatcgccaagatctgtcacagggaagactcaagctgcatcaaccaatttcagtacaattggccttgacctccagttaggagcaggt
aagaagaaagtccatctcttgatgggacggttcaaggttttgctctctcttgcttacttgcaatcagtactgtgtcgtcccctgatgagctctgaggcaa
Asp Leu Glu Lys Arg Ser Cys Arg Arg Arg Leu Ala Cys His Asn Glu1 5 10 15 Arg Arg Arg Lys 20 Pro Gln Ala Thr Thr 25 Ala Ala Leu Leu Ala 30 Ser GlyTyr Ser Arg 35 Ile Ala Pro Ser Leu 40 Tyr Gly Ser Val Leu 45 Gly Asp ProThr Thr 50 Trp Ser Thr Ala Arg 55 Ser Val Met Gly Arg 60 Ser Ala Pro TrpAsp Ser His Gln Leu Met Asn Val Leu Ser Gln Gly Ser Ser Arg Phe65 70 75 80Ser Ile Thr Tyr Pro 85 Glu Met Val Asn Asn 90 Asn Ser Thr Asp Ser 95 SerCys Ala Leu Ser 100 Leu Leu Ser Asn Ser 105 Asn Thr Thr Gln Gln 110 Gln GlnGln Thr Ser 115 Thr Asn Ala Tyr Leu 120 Met Asp Ala Glu Arg 125 Val Thr MetAla Lys 130 Ser Pro Pro Val Ser 135 Val His Asn Gln Tyr 140 Ser Lys Gln ThrTrp Glu Phe Met Ser Gly Glu Lys Ser Asn Trp Pro Cys Val Ser Ser145 150 155 160Pro Val Leu Gly Leu 165 Arg Gln Ile Ser Glu 170 Pro Asp Asp Asp Leu 175 GlnPhe Leu Met Ser 180 Asn Gly Thr Thr Met 185 Gly Gly Phe Glu Leu 190 Asn LeuGln Gln Glu 195 Gln Val Leu Arg Gln 200 Tyr Ser Ser Thr Gln 205 Asn Phe Thr
Trp Pro Leu210<210> 272<211> 852<212> DNA
<213> Saccharum officinarum<400> 272
ctcgtcgtca acggcctcga gcagcgcttc tgccagcagtcctgaatttg accaactaaa gaaaagctgc cgcagacgtccggaggaggc cacctcctgg acctcttgca tcacgatatgggtgagcccg gcaggttccg aagctttatg ttggatttctaccatgaggg atgggtttcc ggcagttcga cctggcgaaa
gcagcaggttttgcaggccagtcgccttgccatacccaaggggtgcctgg
ccaccagctgcaatgaacgctgcatcatttggttccaggctagtatccag
60120180240300360420480540600633
60120180240300tggcaagcgg gcttagatcc tcatcatcat caaagcgcggtcatatggga gccagggtag ctcgtcgtcg tcaaggccacctccccccag gtggatgtct tgcaggagtc ccctcggactctgtcaactc agccatggga tactacccac agcgccggcccctgcaacag caggttttga cggcaaccct gtggcaccctattgcgccaa gcccctggac tgactcccgg ggccatgaagttgccacctg acgtccccct cagcgaggtg cactctggctttctcaggtg agctcgagct tgccctgcag ggaaacaggcgcgccgcgca atgatcaggg ctccacgggc acgttcgacctggtcgctct ag<210> 273<211> 283<212> PRT
<213> Saccharum officinarum<400> 273
Leu Val Val Asn Gly Leu Glu Gln Arg Phe Cys15 10
Phe His Gln Leu Pro Glu Phe Asp Gln Leu Lys
20 25
Arg Leu Ala Gly His Asn Glu Arg Arg Arg Arg
35 40
Leu Ala Ser Arg Tyr Gly Arg Leu Ala Ala Ser
50 55
Arg Phe Arg Ser Phe Met Leu Asp Phe Ser Tyr65 70 75
Thr Met Arg Asp Gly Phe Pro Ala Val Arg Pro
tcgcaggatacggtgttcccctagctgtgcacagccatgcccctcatggcgcgggcggaacaagcagccacagcaccaggagtccggcaa
cggtgcccactggtccagagtctctctctttggatcaatggagtagctaccgtgcctcagtcacggccaggtcagcgccacacaatggac
60
85
90
Gly Ser Ile Gln Trp Gln Ala Gly Leu Asp Pro
100
105
Ala Val Ala Gly Tyr Gly Ala His Ser Tyr Gly
115
120
140
Cys Ala
Ser Ser Ser Arg Pro Pro Val Phe Pro Gly Pro
130 135
Gly Cys Leu Ala Gly Val Pro Ser Asp Ser Ser145 150 155
Leu Ser Thr Gln Pro Trp Asp Thr Thr His Ser Ala Gly
Gly Asn
Gln Cys Ser Arg 15 Ser Cys Arg Arg 30 Pro Pro Gly Pro45 Gly Glu Pro GlyArg Val Pro Gly 80Glu Arg Val Pro 95 His His Gln Ser 110 Gln Gly Ser Ser125 Leu Pro Pro Gly
165
170
Ala Gly Ser Met Pro Ala Thr Ala Gly Phe Asp
180 185
Pro Ser Leu Met Ala Ser Ser Tyr Ile Ala Pro Ser Pro195 200 205
Ser Arg Gly His Glu Gly Gly Arg Asn Val Pro Gln Leu
210 215 220
Val Pro Leu Ser Glu Val His Ser Gly Ser Ser Ser His225 230 235
Phe Ser Gly Glu Leu Glu Leu Ala Leu Gln Gly Asn Arg
245 250
Gly Ser Ala Pro Ala Pro Arg Asn Asp Gln Gly Ser Thr
260 265
Asp Gln Ser Gly Asn Thr Met Asp Trp Ser Leu
275 280
<210> 274<211> 647<212> DNA
<213> Festuca arundinacea<400> 274
ggcacgaggg tggatctgag cggctccaag acctactact gccgccacaaatgcactcca aggcgccccg cgtcgtcgtc gccggcctcg agcagcgctttgcagcaggt tccaccagtt gcctgaattt gacaatggaa aacgcagctgctcgcaggtc acaatgaacg ccgtaggaag ccgcctcctg gccctctggcggccgactcg ctgcatcctt tgaagaaccg ggcaggtaca gaagctttcttcctacccaa gggttccgag cagcgtgcgg gatgcttggc ctgcagttcgcgtatgccca gtgaaatcca gtggcaaggg aacctagacc tgcgtcctca
Leu Ser Leu160
His Ser His
175Pro Val Ala190
Trp Thr Asp
Pro Pro Asp
His Gly Gln240
Pro Ala Pro
255Gly Thr Phe270
ggtctgctccctgccagcagccgcagacgtgtcacgctatgttagatttcaccaggctaccacgggttat
360420480540600660720780840852
60120180240300360420ggcccacatg catatggcag ccacggcttc cccggtccag agctccctcc aggcgggtgt 4 80ctcacagggg tcgccaccga ctccagctgt gctctctctc ttctgtcaac tcagccatgg 540gataccacca cccacggtgc cagccacgac catcggtctg cggccatgtc cgcggccgcg 600ggcttcgacg gcagccctgc ggcagtgtca ccctccatca tggcgag 647
<210> 275<211> 215<212> PRT
<213> Festuca arundinacea<400> 275
Gly Thr Arg Val Asp Leu Ser Gly Ser Lys Thr Tyr Tyr Cys Arg His1 5 10 15 Lys Val Cys Ser 20 Met His Ser Lys Ala 25 Pro Arg Val Val Val 30 Ala GlyLeu Glu Gln 35 Arg Phe Cys Gln Gln 40 Cys Ser Arg Phe His 45 Gln Leu ProGlu Phe 50 Asp Asn Gly Lys Arg 55 Ser Cys Arg Arg Arg 60 Leu Ala Gly HisAsn Glu Arg Arg Arg Lys Pro Pro Pro Gly Pro Leu Ala Ser Arg Tyr65 70 75 80Gly Arg Leu Ala Ala Ser Phe Glu Glu Pro Gly Arg Tyr Arg Ser Phe 85 90 95 Leu Leu Asp Phe 100 Ser Tyr Pro Arg Val 105 Pro Ser Ser Val Arg 110 Asp AlaTrp Pro Ala 115 Val Arg Pro Gly Tyr 120 Arg Met Pro Ser Glu 125 Ile Gln TrpGln Gly 130 Asn Leu Asp Leu Arg 135 Pro His Thr Gly Tyr 140 Gly Pro His AlaTyr Gly Ser His Gly Phe Pro Gly Pro Glu Leu Pro Pro Gly Gly Cys145 150 155 160Leu Thr Gly Val Ala 165 Thr Asp Ser Ser Cys 170 Ala Leu Ser Leu Leu 175 SerThr Gln Pro Trp Asp Thr Thr Thr His Gly Ala Ser His Asp His Arg 180 185 190 Ser Ala Ala 195 Met Ser Ala Ala Ala 200 Gly Phe Asp Gly Ser 205 Pro Ala AlaVal Ser 210 Pro Ser Ile Met Ala 215 <210> 276
<211> 11<212> PRT
<213> Seqüência artificial<220>
<223> motivo 1<220>
<221> VARIANTE<222> (1) .. (1)<223> /substituir = "Thr"<220>
<221> VARIANTE<222> (3)..(3)
<223> /substituir = "Arg" /substituir = "Met" /substituir = "Gln"<220>
<221> VARIANTE<222> (6)..(6)
<223> /substituir = "Gln" /substituir = "Arg"<220>
<221> VARIANTE<222> (7)..(7)
<223> /substituir = "Arg" /substituir = "Glu"<220>
<221> VARIANTE<222> (8) . . (8)<223> /substituir = "Vai""Gly"
<220>
<221> VARIANTE<222> (11)..(11)<223> /substituir<400> 276
Gly Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu15 10
<210><211><212><213><220>
<223> DomínioArath_SPL15<400> 277
Thr Ala Arg Cys Gln Val Glu Gly Cys
277
78
PRT
Seqüência
artificial
SPL de lugação de DNA (DBD) do fator de transcrição de
1
Lys
Ala Tyr
Tyr Ser Arg20
Ile Val Ser
Ser Lys Val35
Ser Arg Phe His Gln Leu50
Arg Arg Arg Leu Ala Cys
70
His Lys Val25
Gly Leu His40
Arg Met Asp Leu10
Cys Cys Ile His
Ser Asn Val15
Ser Lys Ser30
Gln Gln Cys
Gln Arg Phe Cys45
Ser Glu Phe Asp Leu Glu Lys Arg Ser Cys55 60
His Asn Glu Arg Arg Arg Lys Pro75
65
<210> 278<211> 11<212> PRT
<213> Seqüência artificial<220>
<223> motivo 2<220>
VARIANTE(3) . . (3)
/substituir = "Asn" /substituir = "Thr"
VARIANTE(4) . . (4)
/substituir = "Gly" /substituir = "Arg"VARIANTE
(H) · · (H)
/substituir = "Thr"278
Cys Ala Leu Ser Leu Leu Ser Asn5 10
Ser
<221><222><223><220><221><222><223><220><221><222><223><400>Asp Ser1
<210> 279
<211> 1130
<212> DNA
<213> Oryza sativa
<400> 279
catgcggcta atgtagatgc tcactgcgct agtagtaaggtatacaaagc tgtaatactc gtatcagcaa gagagaggcacaggattaga aaaacgggac gacaaatagt aatggaaaaacatggcaata taaatggaga aatcacaaga ggaacagaatgtactcgtac gtaaaaaaaa gaggcgcatt catgtgtggagatttgaaac cactcaaatc caccactgca aaccttcaaatagaaagcac aggtaagaag cacaacgccc tcgctctccagcacctcgcg gatcggtgac gtggcctcgc cccccaaaaaacaccccggg cccacccacc tgtcacgttg gcacatgttgcaaaatatca acgcggcgcg gcccaaaatt tccaaaatccgccgctcttc cacccaggtc cctctcgtaa tccataatggtgtacgtggg cgggttaccc tgggggtgtg ggtggatgac
tactccagta cattatggaa 60cacaagttgt agcagtagca 120caaaaaaaaa caaggaaaca 180ccgggcaata cgctgcgaaa 240cagcgtgcag cagaagcagg 300cgaggccatg gtttgaagca 360ccctcccacc caatcgcgac 420tatcccgcgg cgtgaagctg 480gttatggttc ccggccgcac 540cgcccaagcc cctggcgcgt 600cgtgtgtacc ctcggctggt 660gggtgggccc ggaggaggtc 720cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgcgaaaattcaa attaggaggt ggggggcggg gcccttggagtgcccctgac ttggcttggc tcctcttctt cttatcccttttctctcctc tcctcttctc ttctcttctc tggtggtgtgctccttcctc ctctcctttc ccctcctctc ttcccccctcgactctcccc aggtgaggtg agaccagtct ttttgctcgagcctcgcgcg gatctgaccg cttccctcgc ccttctcgca<210> 280<211> 56<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: prm07277<400> 280
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga<210> 281<211> 51<212> DNA
<213> Seqüência artificial<220>
<223> iniciador: prm07278<400> 281
ggggaccact ttgtacaaga aagctgggtt gatgaagatc<210> 282<211> 1110<212> DNA
<213> Brassica rapa<400> 282
atggataggg gttccaactc gggtcttggt cttggtccagtcatccactg agtcatcctc tttaagtgga gggctcatgtgaggacgctg gaggtggaac cgggtcttct tcctccggcgggaagcgggt cgggtccttc gggtcagata ccaaggtgtcgatctaacca atgcaaaggg ttattacacg aggcatagagacaccaaaag tcattgtcgc tggtatagaa caaaggttttcatcagcttc cggaatttga cctagagaaa aggagttgccaatgagagac gaaggaagcc acagcctgcg tctctatctgaggatcactc cttctctata cggaaatggt gaaactacaatcccaagaaa tgggttggaa tagtgcaaga acgttggataccgtcgtggc agatcaatcc tatgaatgtg tttagtcatgggaggaggga taagcttctc atctccagag attatggacaggaattggca gcgactcaaa ctgtgctctc tctcttctgtgacaacaaca acagcaacaa cacatggaga acttcttcggacaatggctc agccaccacc tgcacctagc cagcagcatcgtattcaagg acgatgataa tagctgtccg aatgatatgtcggttcaccg agacagagat aagcggtgga acgactttggcatcatcatc agaataggag gcagtacatg gaaagtgagatcttcacacc ataacaactg gtctctctga<210> 283<211> 369<212> PRT
<213> Brassica rapa<400> 283
Met Asp Arg Gly Ser Asn Ser Gly Leu Gly Leu15 10
Glu Ser Gly Gly Ser Ser Thr Glu Ser Ser Ser
20 25
Met Phe Gly Gln Arg Ile Tyr Phe Glu Asp Ala
35 40
Ser Ser Ser Ser Gly Gly Ser Asn Arg Arg Val
50 55
Gly Pro Ser Gly Gln Ile Pro Arg Cys Gln Val65 70 75
Asp Leu Thr Asn Ala Lys Gly Tyr Tyr Thr Arg
gaaaaggaggaataagcggagtcctcgcaaggtgtgtccctcacaagagattcgacgcgcggattcagcc
cgatcggtacatcgcagataccccgcttcctgtctcccctgagagcgccactttcacgcc
gttgttaatg tgttcg
ttaaaaggtg a
gccagacagattggccagagggtcaaacagaagtggaaggtttgtggaatgtcaacagtggtaggagacttgttgtcttctgaatgggagcaagagtgatgatcagtaagctaaaccagacaaacccacagttttggtccagtatctgaactcctgttttgtgagttcgaacacaagggc
gtcgggtggtgatctacttcaagggtacgtttgtggaatggcactctaaacagcaggtttcgctggtcattcgttatgggctttcttggtgagacggccatggaggaggagagctacaagtcagccacatgatgacggttcccgccttgggaatcttggtgttatctgacttatggctct
Gly Pro Gly Gln Thr15
Leu Ser Gly Gly Leu30
Gly Gly Gly Thr Gly45
Arg Gly Ser Gly Ser60
Glu Gly Cys Gly Met80
His Arg Val Cys Gly
780840900960102010801130
56
51
60120180240300360420480540600660720780840900960102010801110Met His Ser Lys100
Phe Cys Gln Gln115
Glu Lys Arg Ser130
Arg Lys Pro Gln145
Arg Ile Thr Pro
Ser Phe Leu Gly180
Asp Thr Arg Val195
Asn Val Phe Ser210
Ser Phe Ser Ser225
Gly Ile Gly Ser
His Gln Pro His260
Ser Gly Phe Gly275
Pro Ser Gln Gln290
Asp Asp Asn Ser305
Arg Phe Thr Glu
Glu Leu Ser Asp340
Glu Asn Thr Arg355
Leu
85
Thr Pro Lys Val
Cys Ser Arg Phe120
Cys Arg Arg Arg135
Pro Ala Ser Leu150
Ser Leu Tyr Gly165
Ser Gln Glu Met
Met Arg Arg Pro200
His Gly Ser Val215
Pro Glu Ile Met230
Asp Ser Asn Cys245
Asp Asn Asn Asn
Pro Met Thr Val280
His Gln Tyr Leu295
Cys Pro Asn Asp310
Thr Glu Ile Ser325
His His His Gln
Ala Tyr Gly Ser360
90
Ile Val Ala Gly105
His Gln Leu Pro
Leu Ala Gly His140
Ser Val Leu Ser155
Asn Gly Glu Thr170
Gly Trp Asn Ser185
Pro Ser Trp Gln
Ser Gly Gly Gly220
Asp Thr Lys Pro235
Ala Leu Ser Leu250
Ser Asn Asn Thr265
Thr Met Ala Gln
Asn Pro Pro Trp300
Met Ser Pro Val315
Gly Gly Thr Thr330
Asn Arg Arg Gln345
Ser Ser His His
95
Ile Glu Gln Arg110
Glu Phe Asp Leu125
Asn Glu Arg Arg
Ser Arg Tyr Gly160
Thr Met Asn Gly175
Ala Arg Thr Leu190
Ile Asn Pro Met205
Gly Gly Gly Ile
Glu Ser Tyr Lys240
Leu Ser Asn Pro255
Trp Arg Thr Ser270
Pro Pro Pro Ala285
Val Phe Lys Asp
Leu Asn Leu Gly320
Leu Gly Glu Phe335
Tyr Met Glu Ser350
Asn Asn Trp Ser365
<210> 284
<211> 1080
<212> DNA
<213> Glyc
<400> 284
atggcttcag
aaaatctatt
tcttcttctt
tctgttcaac
gatgcaaaag
gtcattgttg
cctgagtttg
cggagaaagc
gcttttgata
cttagtctga
acctccacac
tcggtgggtg
gtcaccgaca
acagcaccaa
cttgctgcat
aagggcattg
atttcacagc
aggcattata
<210> 285
<211> 359
<212> PRT
me max
acgccaaactttgaggatgtctgctgctaccagctcaacccttactattcctggtcttcaatcaaggaaaccccaacaagatagtggcaggaaattcactttagctggaaggacaagcttcgagctgtgcgtcttgggttcatctcatggattctggtaactctcaatagtggatctaga
ctcctcttcttggtcttgcttgttacttcttcccaggtgttagacacaagacaaaggtttaagaagttgcctccctcttaaggtagcaactccaactccttggcaactcacgccagcccgtctctctcttgagtaacatgtgcatcaatcctgttcgcccccaacttcatacagtccagg
gagtccctcaactccagccatcttcttcttcaagttgaaggtctgtggcatgtcaacagtcgtaggcgacacctctcgcttttctgatggagatcatctggagacatcatggacatcctcctgtcaaatcataaatttcacatcaacttc
acggtttgaacctctcttaccaaggaaaggggtgcaaagttgcactctaagtagcaggtttagctggccaatgccagactaattgacttcagctagctccctgaccttttcaggggaaagaaacatggggacgggacacccaaatacctc
gaggtggtcc ctgatctaggggtgagctgg acctgtcccagcatatgaat ctgctcattg
attcggccaattcttcttctaagaggtgggagatctgagtatccccttcatcatcagctttaatgaacgtttcttcgtctatacccaaagtggaaatcaacttgcaaggtttacattgggttctagaaaccttgacacaagtggtttttctctcggtcagacagggcagggtcactttaa
6012018024030036042048054060066072078084090096010201080<213> Glycine max<400> 285
Met Ala Ser Asp Ala Lys Leu Ser Ser Ser Glu Ser Leu Asn Gly Leu1 5 10 15
Lys Phe Gly Gln Lys Ile Tyr Phe Glu Asp Val Gly Leu Ala Thr Pro
20 25 30
Ala Thr Ser Leu Thr Ser Ser Ser Ser Ser Ser Ser Ala Ala Thr Val
35 40 45
Thr Ser Ser Ser Ser Ser Arg Lys Gly Arg Gly Gly Ser Val Gln Pro
50 55 60
Ala Gln Pro Pro Arg Cys Gln Val Glu Gly Cys Lys Val Asp Leu Ser65 70 75 80
Asp Ala Lys Ala Tyr Tyr Ser Arg His Lys Val Cys Gly Met His Ser
85 90 95
Lys Ser Pro Ser Val Ile Val Ala Gly Leu Gln Gln Arg Phe Cys Gln
100 105 110
Gln Cys Ser Arg Phe His Gln Leu Pro Glu Phe Asp Gln Gly Lys Arg
115 120 125
Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu Arg Arg Arg Lys Pro
130 135 140
Pro Thr Ser Ser Leu Leu Thr Ser Arg Tyr Ala Arg Leu Ser Ser Ser145 150 155 160
Ala Phe Asp Asn Ser Gly Arg Gly Ser Asn Phe Leu Met Glu Leu Thr
165 170 175
Ser Tyr Pro Lys Leu Ser Leu Arg Asn Ser Leu Pro Thr Pro Arg Ser
180 185 190
Ser Glu Leu Ala Pro Gly Asn Gln Thr Ser Thr Leu Ser Trp Asn Gly
195 200 205
Asn Ser Glu Thr Ser Ser Asp Leu Phe Leu Gln Gly Ser Val Gly Gly
210 215 220
Thr Ser Phe Ala Ser Pro Gly His Pro Pro Gly Glu Ser Tyr Ile Gly225 230 235 240
Val Thr Asp Thr Ser Cys Ala Leu Ser Leu Leu Ser Asn Gln Thr Trp
245 250 255
Gly Ser Arg Asn Thr Ala Pro Ser Leu Gly Leu Ser Asn Met Ile Asn
260 265 270
Phe Asn Gly Thr Pro Leu Thr Gln Leu Ala Ala Ser Ser His Gly Ala
275 280 285
Ser Ile His Gln Leu Pro Asn Thr Ser Trp Phe Phe Lys Gly Ile Asp
290 295 300
Ser Gly Asn Cys Ser Pro Glu Val Val Pro Asp Leu Gly Leu Gly Gln305 310 315 320
Ile Ser Gln Pro Leu Asn Ser Gln Leu His Gly Glu Leu Asp Leu Ser
325 330 335
Gln Gln Gly Arg Arg His Tyr Met Asp Leu Glu Gln Ser Arg Ala Tyr
340 345 350
Glu Ser Ala His Trp Ser Leu
355<210> 286<211> 1128<212> DNA
<213> Populus tremuloides<400> 286
atggaaatgg attcaggctc cctaaccgag tcagctactt ccaatgcaac ttctccgcca 60
gctgagtctg ttaatggatt gaaatttggt aagaagattt actttgagga tcacgtgggg 120gtcggtgctc cggctaagag cggaactggg tcatcctcat ccggttccgg gtcagggtca 180tctaggaagg ctcaaggtgg acagcaccag cagccaccaa ggtgtcaagt tgaagggtgc 240aaagtagatc tgagtgatgc taagacttac tattcaaggc acaaagtttg tagtatgcac 300tccaagtctc ctagagttat tgttgctggt ttggtgcaaa gattttgcca gcaatgtagc 360agatttcatc tacttcctga atttgaccaa ggaaaacgaa gttgccgcag gcgcctagct 420ggccataatg agcgacggag gaagccacca tctggatcgg tgttgtccgc tcgccatggc 480cgattctctc cctctttgtt tgataatagc agcagagctg gaggccttct tgtggacttt 540agtgcatatc caaggcatac tgggagagat ggatggcctg cagcaaggtc ttctgagctt 600acccccggga atgatactgc tgccacagga aggtctatat ctcatatgtg gcagataagc 660tcccagaatc ctccatccaa cctttgcttg caaggctcaa ctggcgggac tggccttttc 720agttcaggaa ttcctccggg agaatgcttc acaggagttg ctgtttcaga ctcgagctgt 780gctctctctc ttctgtcaaa tcaaccatgg ggctccacaa accgagcatc aagtcttgcg 840gtgaatgact tgtttagtgc cgaagaggca cccgtggttc aatcaacagc tcaccatggt 900gcggctgtca atcagtatcc aatcccttgg agcttcaaga gcaatgaagg aagtaacagt 960tcacatgaga tgtgccctga tctaggtctg ggtcaaattt caatgcctct caacagtcaa 1020cttgctggtc agctcgagca gtctcaacag aataggaggc aatacatgga cctcgagcat 1080tccagggctt atgactcttc aacccagcac atccactggt cactttaa 1128
<210> 287<211> 375<212> PRT
<213> Populus tremuloides<400> 287
Met Glu Met Asp Ser Gly Ser Leu Thr Glu Ser Ala Thr Ser Asn Ala1 5 10 15
Thr Ser Pro Pro Ala Glu Ser Val Asn Gly Leu Lys Phe Gly Lys Lys
20 25 30
Ile Tyr Phe Glu Asp His Val Gly Val Gly Ala Pro Ala Lys Ser Gly
35 40 45
Thr Gly Ser Ser Ser Ser Gly Ser Gly Ser Gly Ser Ser Arg Lys Ala
50 55 60
Gln Gly Gly Gln His Gln Gln Pro Pro Arg Cys Gln Val Glu Gly Cys65 70 75 80
Lys Val Asp Leu Ser Asp Ala Lys Thr Tyr Tyr Ser Arg His Lys Val
85 90 95
Cys Ser Met His Ser Lys Ser Pro Arg Val Ile Val Ala Gly Leu Val
100 105 110
Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His Leu Leu Pro Glu Phe
115 120 125
Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly His Asn Glu
130 135 140
Arg Arg Arg Lys Pro Pro Ser Gly Ser Val Leu Ser Ala Arg His Gly145 150 155 160
Arg Phe Ser Pro Ser Leu Phe Asp Asn Ser Ser Arg Ala Gly Gly Leu
165 170 175
Leu Val Asp Phe Ser Ala Tyr Pro Arg His Thr Gly Arg Asp Gly Trp
180 185 190
Pro Ala Ala Arg Ser Ser Glu Leu Thr Pro Gly Asn Asp Thr Ala Ala
195 200 205
Thr Gly Arg Ser Ile Ser His Met Trp Gln Ile Ser Ser Gln Asn Pro
210 215 220
Pro Ser Asn Leu Cys Leu Gln Gly Ser Thr Gly Gly Thr Gly Leu Phe225 230 235 240
Ser Ser Gly Ile Pro Pro Gly Glu Cys Phe Thr Gly Val Ala Val Ser
245 250 255
Asp Ser Ser Cys Ala Leu Ser Leu Leu Ser Asn Gln Pro Trp Gly Ser
260 265 270
Thr Asn Arg Ala Ser Ser Leu Ala Val Asn Asp Leu Phe Ser Ala Glu
275 280 285
Glu Ala Pro Val Val Gln Ser Thr Ala His His Gly Ala Ala Val Asn
290 295 300
Gln Tyr Pro Ile Pro Trp Ser Phe Lys Ser Asn Glu Gly Ser Asn Ser305 310 315 320
Ser His Glu Met Cys Pro Asp Leu Gly Leu Gly Gln Ile Ser Met Pro
325 330 335
Leu Asn Ser Gln Leu Ala Gly Gln Leu Glu Gln Ser Gln Gln Asn Arg
340 345 350
Arg Gln Tyr Met Asp Leu Glu His Ser Arg Ala Tyr Asp Ser Ser Thr
355 360 365
Gln His Ile His Trp Ser Leu370 375
<210> 288<211> 1059<212> DNA
<213> Citrus Clementina<400> 288
atggaactgg gttcagacta tttggctgaa tcaggtggtg gctccggctc cggctcaggc 60
tccggcttat catccgctga gccatcactt aatggtttga agtttggcaa aaaaatctat 120
tttgaggatg tcggtactgc cggagctcca tttccaggat ctgggtcatc atctgggtcc 180
gggtcagggt caggttcagg gtcagggagg aaggtgaggg gtgttggcgg tggtatggtt 240
actagtgggc agcagccacc aaggtgccaa gtggaggggt gtaaagttga tctgagtgat 300
gccaaagctt actattcaag gcacaaagtt tgtggcatgc attcaaagtc tcctgttgtc 360
actgttgccg gccttgagca gaggttttgc cagcaatgta gcagatttca tcagcttccg 420
gagtttgacc aaggaaaacg aagttgccgc aggcgcctgg caggccataa tgagcgccgg 480
aggaagccaa cttctggacc atttttgggc actcgttatg gcaggctctc ttcctctgtc 540
attgagaaca gcagccaagg tggaggattt ctgatcgact tcagtgcata tcagatggtt 600
ggtgggaggg atggatggcc agtgacaagt gtctccaagc aggtatctgg aaatcaaacc 660
actgtcacag caaggcatct tcctcagcca ctatggcaaa accactctca ggatcctcca 720
cctgatcgtt accttcagtg ttcaacagct gggactggtt tctctggtcc tggaattcct 780
tgtggaggat gcttcacagg agttgctgac tcaaactgtg ctctctctct tctgtcaaat 840
caaccatggg gctctaagaa cccgacaccg ggtcatggag tgggtgactt aatgcatgcc 900
cataccaaat ccgtcactca accagtatcg ccccatggag cagctattaa tcaatatcca 960
aacatgtcat ggggggttca agggcaatgc aacctggtag cagttccaca ccaaatggcc 1020
ccccaaatgg ggtttgggtt caacattccg gcccattaa 1059
<210> 289<211> 352<212> PRT
<213> Citrus Clementina<400> 289
Met Glu Leu Gly Ser Asp Tyr Leu Ala Glu Ser1 5
Gly Gly
Ser Gly Ser Gly Ser Gly Leu Ser Ser Ala Glu Pro Ser
10
20
25
Leu Lys Phe Gly Lys Lys Ile Tyr Phe Glu Asp
35 40 Ala Pro Phe Pro Gly Ser Gly Ser Ser Ser Gly 50 55 Gly Ser Gly Ser Gly Arg Lys Val Arg Gly Val65 70 75Thr Ser Gly Gln Gln Pro Pro Arg Cys Gln Val 85 90 Asp Leu Ser Asp Ala Lys Ala Tyr Tyr Ser Arg 100 105 Met His Ser Lys Ser Pro Val Val Thr Val Ala 115 120 Phe Cys Gln Gln Cys Ser Arg Phe His Gln Leu 130 135 Gly Lys Arg Ser Cys Arg Arg Arg Leu Ala Gly145 150 155Arg Lys Pro Thr Ser Gly Pro Phe Leu Gly Thr 165 170 Ser Ser Ser Val Ile Glu Asn Ser Ser Gln Gly 180 185 Asp Phe Ser Ala Tyr Gln Met Val Gly Gly Arg 195 200 Thr Ser Val Ser Lys Gln Val Ser Gly Asn Gln 210 215 Arg His Leu Pro Gln Pro Leu Trp Gln Asn His225 230 235Pro Asp Arg Tyr Leu Gln Cys Ser Thr Ala Gly 245 250 Pro Gly Ile Pro Cys Gly Gly Cys Phe Thr Gly 260 265 Cys Ala Leu Ser Leu Leu Ser Asn Gln Pro Trp 275 280
Val Gly
45Ser Gly60
Gly Gly
Glu Gly
His Lys
Gly Leu125Pro Glu140
His Asn
Arg Tyr
Gly Gly
Asp Gly205Thr Thr220
Ser Gln
Thr Gly
Val Ala
Gly Ser285
Gly Ser Gly15
Leu Asn Gly30
Thr Ala Gly
Ser Gly Ser
Gly Met Val80
Cys Lys Val95
Val Cys Gly110
Glu Gln Arg
Phe Asp Gln
Glu Arg Arg160
Gly Arg Leu
175Phe Leu Ile190
Trp Pro Val
Val Thr Ala
Asp Pro Pro240
Phe Ser Gly
255Asp Ser Asn270
Lys Asn ProThr Pro Gly His Gly Val Gly Asp Leu Met His
290 295
Val Thr Gln Pro Val Ser Pro His Gly Ala Ala305 310 315
Asn Met Ser Trp Gly Val Gln Gly Gln Cys Asn
325 330
His Gln Met Ala Pro Gln Met Gly Phe Gly Phe340 345
<210> 290<211> 565<212> DNA
<213> Beta vulgaris<400> 290
atggatacgg gttcaaatta tccgaccgtt aaggggtcatgggttgtcgg attctttaaa tgggctgaaa tttgggcaaaggtggtgttg gaacttccgg caagtcttcc gtcgccggaaagggccggaa aaggggtggt gcaaagtggg caaccaccaaaagatagatc ttagtgatgc taaaacttat tattctaggctctaaatctt ctgttgttat tgttgctggt cttgagcaacagatttcatc ggcttcctga gtttgaccaa gggaaacgaaggtcataatg agcgtcgaag aaaaccacca cctgggtcttcgtctctctt catccctttt tggtgataac accggcggaattctcttcgt atccacggca ttctg<210> 291<211> 188<212> PRT
<213> Beta vulgaris<400> 291
Met Asp Thr Gly Ser Asn Tyr Pro Thr Val Lys15 10
Ser Ser Ser Ser Gly Leu Ser Asp Ser Leu Asn
20 25
Gln Lys Ile Tyr Phe Glu Asp Val Gly Gly Val
35 40
Ser Ser Val Ala Gly Ser Gly Gly Ala Pro Ala
50 55
Gly Val Val Gln Ser Gly Gln Pro Pro Arg Cys65 70 75
Lys Ile Asp Leu Ser Asp Ala Lys Thr Tyr Tyr
Ala His Thr Lys Ser300
Ile Asn Gln Tyr Pro320
Leu Val Ala Val Pro335
Asn Ile Pro Ala His350
catcaacctcaaatatacttgtggtggtgcggtgtcaagtataaagtttggtttttgccagttgtcgcagtgttatcatcgtggtggatt
ttcatcatcttgaagatgtgtccggcgaaaagaagggtgttggtatgcacgcagtgcagcacgccttgctacgtttgggacttattggac
85
90
Cys Gly Met His Ser Lys Ser Ser Val Val Ile
100
105
Gln Arg Phe Cys Gln Gln Cys Ser Arg Phe His
115 120
Asp Gln Gly Lys Arg Ser Cys Arg Arg Arg Leu
130 135
Arg Arg Arg Lys Pro Pro Pro Gly Ser Leu Leu145 150 155
Arg Leu Ser Ser Ser Leu Phe Gly Asp Asn Thr
165 170
Phe Leu Leu Asp Phe Ser Ser Tyr Pro Arg His180 185
<210> 292<211> 536<212> DNA
<213> Hevea brasiliensis<400> 292
atggaaatgg gttcgggctc tttgacagag tcaggtacctgctgagtcaa taaatgggtt gaaatttggc caaaaaatctaagactccgg ccaaatctgc acccgggtct tcatcttccgaaggttcacg gtgggcagca gcagcagcca cccaggtgtcgatctgagtg atgctaaggc ttattattcg aggcacaaagtctcctaagg tcattgttgc tggtttggag caaagatttt
Gly Ser Ser Ser Thr 15 Gly Leu Lys Phe Gly 30 Gly Thr Ser Gly Lys 45 Lys Arg Ala Gly Lys60 Gln Val Glu Gly Cys 80Ser Arg His Lys Val 95 Val Ala Gly Leu Glu 110 Arg Leu Pro Glu Phe 125 Ala Gly His Asn Glu140 Ser Ser Arg Leu Gly 160Gly Gly Ser Gly Gly 175 Ser
60120180240300360420480540565
ccaacgccac ttctccacct 60attttgagaa tgcgggggct 120ggtccggggc cccgtccagg 180aagttgaggg atgtaaagtg 240tttgtggtat gcactctaag 300gccagcagtg tagtagattt 360catcagcttc ctgaatttga ccaaggaaaa cgaagttgccaatgaacggc ggaggaagcc accaactgga tcagtgctgtttttcaacaa tttttgataa cagcagccga gctgggggca<210> 293<211> 177<212> PRT
<213> Hevea brasiliensis<400> 293
gcagacgcct agctggtcat 420catctcgcta taacagactt 480ttcttgtgga tttcag 536
20
25
35
40
50
55
65
70
85
100
105
115
120
130
135
145
Asp
150
165
Glu Ser Gly Thr Ser Asn Ala10 15 Gly Leu Lys Phe Gly Gln Lys 30 Thr Pro Ala Lys Ser Ala Pro 45 Pro Ser Arg Lys Val His Gly 60 Gln Val Glu Gly Cys Lys Val 75 80Ser Arg His Lys Val Cys Gly90 95 Val Ala Gly Leu Glu Gln Arg 110 Gln Leu Pro Glu Phe Asp Gln 125 Ala Gly His Asn Glu Arg Arg 140 Ser Ser Arg Tyr Asn Arg Leu 155 160Arg Ala Gly Gly Ile Leu Val170 175
<210> 294
<211> 1130
<212> DNA
<213> Oryza sativa
<400> 294
catgcggcta atgtagatgc tcactgcgcttatacaaagc tgtaatactc gtatcagcaacaggattaga aaaacgggac gacaaatagtcatggcaata taaatggaga aatcacaagagtactcgtac gtaaaaaaaa gaggcgcattgatttgaaac cactcaaatc caccactgcatagaaagcac aggtaagaag cacaacgcccgcacctcgcg gatcggtgac gtggcctcgcacaccccggg cccacccacc tgtcacgttgcaaaatatca acgcggcgcg gcccaaaattgccgctcttc cacccaggtc cctctcgtaatgtacgtggg cgggttaccc tgggggtgtgcggccccgcg cgtcatcgcg gggcggggtggaaaattcaa attaggaggt ggggggcgggtgcccctgac ttggcttggc tcctcttcttttctctcctc tcctcttctc ttctcttctcctccttcctc ctctcctttc ccctcctctcgactctcccc aggtgaggtg agaccagtctgcctcgcgcg gatctgaccg cttccctcgg<210> 295<211> 2194<212> DNA
<213> Oryza sativa<400> 295
aatccgaaaa gtttctgcac cgttttcaccaaatataaaa tgagacctta tatatgtagc
agtagtaagggagagaggcaaatggaaaaaggaacagaatcatgtgtggaaaccttcaaatcgctctccacccccaaaaagcacatgttgtccaaaatcctccataatggggtggatgactagcgggtgcgcccttggagcttatccctttggtggtgtgttcccccctcttttgctcgaccttctcgca
tactccagtacacaagttgtcaaaaaaaaaccgggcaatacagcgtgcagcgaggccatgccctcccacctatcccgcgggttatggttccgcccaagcccgtgtgtaccgggtgggcccgaaaaggaggaataagcggagtcctcgcaaggtgtgtccctcacaagagattcgacgcgcggattcagcc
cattatggaaagcagtagcacaaggaaacacgctgcgaaacagaagcagggtttgaagcacaatcgcgaccgtgaagctgccggccgcaccctggcgcgtctcggctggtggaggaggtccgatcggtacatcgcagataccccgcttcctgtctcccctgagagcgccactttcacgcc
60120180240300360420480540600660720780840900960102010801130
ccctaactaa caatataggg aacgtgtgctgctgataact agaactatgc aagaaaaact
60120catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194<210> 296<211> 1149<212> DNA<213> Zea mays<220>
<221> misc_feature<222> (157)..(157)<223> η é a, c, g, ou t<220>
<221> misc_feature<222> (894)..(894)<223> η é a, c, g, ou t<220>
<221> misc_feature<222> (954)..(954)<223> η é a, c, g, ou t<400> 296
atgcacaact gcaaagaaac cagcaagaat gcgccggcgg tttatagttc cccgctactg 60
caccgctctc tgctgcaggc tgcagctttg actaccaact catacagtac tagtactata 120
ctagagtact actacgccat tagcacggtg gttgcantag gccgtggtct ggaggtctct 180
ctcagctcag acgaggatcg tcggagcaag cagcagcgcg tgcagcctct gggagaccct 240
ggcggcgtcg acgccgatcc tggggctgag cgcctgcgag tggacggtgt agaatatctt 300
gtccccgatg acggagaagc tggcgctgac cacctcggcg ccctcctgct ccagcacggt 360
gatgacctcg tgcagcttga agggcctggc ggcctcgctg atgagcacca cgtccagcgt 420
cccgtcctgg caccgcacct cgatgaccgg catgcgcacg cctccgccgc cgccggtgga 480
cccggccgcc gccgttgcag cctccgtggc cgcgccgccg ccgttgcagc agcccgcctt 540
ccgctgcttc agcgcctcga tccgctcctt gagctgcttg atgtacgccg ccgcgctgtc 600
cagctggtcc agctgcgtca ccgcgtcctg cttgttgccg ggattggagg acaccgccgc 660cgacgcggcg tcggagagga gggaggcgtg cgtggcggcg gcggcggcgg cgggagggat 720gagggaggag agcttgaggc agaggccctt catgtgcagc ctccggttct tctccacgtc 780cttcctctcc agcttgcacc ccccgccgct gctgtgcgcg ttcctctccc ccgcggcgca 840ggcgcccgag ctgcccccgc tgctctgcct ccggctcttc atctcgatcg accngaccgg 900tctgcagatc tctccttggc tgttctcgtc gctgctcctg ccgggcgtga agcngcgcag 960cctttggttg ggacttggga gggacaagtt gcaacagcac ccacgggcca cggcacggag 1020ggggcgaaag gcaaggaggc caggacaaga cgagagaaat acaggccggg ggagatggct 1080ccgtggcgcg tacgtgtgtc tacctgcatg ttggttgatc cgattgcatc tgctgtaacc 1140atatattaa 1149
<210> 297<211> 382<212> PRT<213> Zea mays<220>
<221> INSEGURO<222> (53)..(53)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 297
Met His Asn Cys Lys Glu Thr Ser Lys Asn Ala Pro Ala Val Tyr Ser15 10 15
Ser Pro Leu Leu His Arg Ser Leu Leu Gln Ala Ala Ala Leu Thr Thr
20 25 30
Asn Ser Tyr Ser Thr Ser Thr Ile Leu Glu Tyr Tyr Tyr Ala Ile Ser
35 40 45
Thr Val Val Ala Xaa Gly Arg Gly Leu Glu Val Ser Leu Ser Ser Asp
50 55 60
Glu Asp Arg Arg Ser Lys Gln Gln Arg Val Gln Pro Leu Gly Asp Pro65 70 75 80
Gly Gly Val Asp Ala Asp Pro Gly Ala Glu Arg Leu Arg Val Asp Gly
85 90 95
Val Glu Tyr Leu Val Pro Asp Asp Gly Glu Ala Gly Ala Asp His Leu
100 105 110
Gly Ala Leu Leu Leu Gln His Gly Asp Asp Leu Val Gln Leu Glu Gly
115 120 125
Pro Gly Gly Leu Ala Asp Glu His His Val Gln Arg Pro Val Leu Ala
130 135 140
Pro His Leu Asp Asp Arg His Ala His Ala Ser Ala Ala Ala Gly Gly145 150 155 160
Pro Gly Arg Arg Arg Cys Ser Leu Arg Gly Arg Ala Ala Ala Val Ala
165 170 175
Ala Ala Arg Leu Pro Leu Leu Gln Arg Leu Asp Pro Leu Leu Glu Leu
180 185 190
Leu Asp Val Arg Arg Arg Ala Val Gln Leu Val Gln Leu Arg His Arg
195 200 205
Val Leu Leu Val Ala Gly Ile Gly Gly His Arg Arg Arg Arg Gly Val
210 215 220
Gly Glu Glu Gly Gly Val Arg Gly Gly Gly Gly Gly Gly Gly Arg Asp225 230 235 240
Glu Gly Gly Glu Leu Glu Ala Glu Ala Leu His Val Gln Pro Pro Val
245 250 255
Leu Leu His Val Leu Pro Leu Gln Leu Ala Pro Pro Ala Ala Ala Val
260 265 270
Arg Val Pro Leu Pro Arg Gly Ala Gly Ala Arg Ala Ala Pro Ala Ala
275 280 285
Leu Pro Pro Ala Leu His Leu Asp Arg Pro Asp Arg Ser Ala Asp Leu
290 295 300
Ser Leu Ala Val Leu Val Ala Ala Pro Ala Gly Arg Glu Ala Ala Gln305 310 315 320
Pro Leu Val Gly Thr Trp Glu Gly Gln Val Ala Thr Ala Pro Thr Gly
325 330 335
His Gly Thr Glu Gly Ala Lys Gly Lys Glu Ala Arg Thr Arg Arg Glu
340 345 350
Lys Tyr Arg Pro Gly Glu Met Ala Pro Trp Arg Val Arg Val Ser Thr355 360 365
Cys Met Leu Val Asp Pro Ile Ala Ser Ala Val Thr Ile Tyr
370 375 380
<210> 298<211> 660<212> DNA<213> Zea mays<400> 298
atggagatga gagcgaagaa gagcagcaga agcagcacga gcaacaccagacgaccacgg cggtggagag gaaggagatc gagaggagga ggaggcagcactctgcgcca agctcgcctc cctcatcccg aaagaacact actcctccaaacccagctgg gtagcctaga cgaggcagcc acgtacataa agagactcaagaggagctgc ggcacaagag cgcctctgca cggctcttgg ccgctggcagcgaggcggag gaggaggagg cgcctccaca tcgtcggcag cgacgaccacggcgcaggat catctgaaga agccggccgg cgggaggacg acatgccgccgaggttcggc agcacaatga cgggtcaagc ctggacgtgg tgctcatcagcgacccttca agctgcacga ggtggtcacc gtgctggagg aagaaggcgcaacgccaacc tctccgtcgc cggcaccaaa atcttctaca ccatccactgtgcccaagaa tcggtataga tgtttcaaga gtttctgaaa gattaagagc<210> 299<211> 219<212> PRT<213> Zea mays<400> 299
Met Glu Met Arg Ala Lys Lys Ser Ser Arg Ser
cggcagcacggatgaagagcggatgctatgggagagggtgtggcacgagaggcgagcggtggcggtggtacagcgcggcgcgagaccgaccaaggcctttattgggatga
Ser Thr
Ser Gly Ser Thr Thr Thr Thr Ala Val Glu Arg Lys Glu
10
20
25
Arg Arg Arg Gln Gln Met Lys Ser Leu Cys Ala
35
40
Ile Pro Lys Glu His Tyr Ser Ser Lys Asp Ala
50
55
Ser Leu Asp Glu Ala Ala Thr Tyr Ile Lys Arg
Lys Leu
45Met Thr60
Leu Lys
65
70
75
Glu Glu Leu Arg His Lys Ser Ala Ser Ala Arg Leu Leu
Ala Ser
85
90
Ser Gly Thr Arg Arg Gly Gly Gly Gly Gly Gly
100 105
Ala Ala Thr Thr Thr Ala Ser Gly Gly Ala Gly Ser Ser115 120 125
Gly Arg Arg Glu Asp Asp Met Pro Pro Ala Val Val Glu
130 135 140
His Asn Asp Gly Ser Ser Leu Asp Val Val Leu Ile Ser145 150 155
Arg Pro Phe Lys Leu His Glu Val Val Thr Val Leu Glu
165 170
Ala Glu Thr Asp Asn Ala Asn Leu Ser Val Ala Gly Thr
180 185
Tyr Thr Ile His Cys Lys Ala Phe Cys Pro Arg Ile Gly195 200 205
Ser Arg Val Ser Glu Arg Leu Arg Ala Leu Gly
210 215
<210> 300<211> 669<212> DNA<213> Glycine max<400> 300
atgggtcaac aacaacaggg aagtcaacct tctccaacca aagtcgaaaggagaaaaaca ggagaagcca gatgaagaac ctctattccg aactcaactcacccgtaatc ccaaggaagc gatgtcactg cctgatcaaa tagatgaagcatcaaaagcc tagagacaaa agtgaagctg gagcaggaga agaaagaaagaggaagagaa ctcgtggtgg ctgttcgagt tcttctgaag cacaaggaagccaaatatcc agattcacga aacgggaaat ttgcttgaag tcattctaac
Ser Asn Thr15
Ile Glu Arg30
Ala Ser Leu
Gln Leu Gly
Glu Arg Val80
Ala Ala Gly95
Thr Ser Ser110
Glu Glu Ala
Val Arg Gln
Ser Ala Ala160
Glu Glu Gly175
Lys Ile Phe190
Ile Asp Val
aaagattgtatcttctccctaatcaactatgttaaaggaacctgaaatcgatgtggggtc
60120180240300360420480540600660
60120180240300360gatagccagt tcatgttctg tgaaattatt cgaattttgc atgaagagaa cgtcgaggtc 420
atcaatgcca attcttcaat ggtcggagat ttagtgattc atgttgtgca cggggaggtt 480
gagccatcta tctatcaatt cggagcgacc aaagtgagtg agaagctgaa atggtttatg 540
aacggatcct tcagtgatgt ggaaatggag cctgaattaa tgtggaattt taaaattgat 600
gctactgagc cgtgggggct tctagatgat cttacactgg acaatgtctt accaccaaat 660
actttgtaa 669
<210> 301
<211> 222
<212> PRT
<213> Glycine max
<400> 301
Met Gly Gln Gln Gln Gln Gly Ser Gln Pro Ser Pro Thr Lys Val Glu1 5 10 15
Arg Lys Ile Val Glu Lys Asn Arg Arg Ser Gln Met Lys Asn Leu Tyr
20 25 30
Ser Glu Leu Asn Ser Leu Leu Pro Thr Arg Asn Pro Lys Glu Ala Met
35 40 45
Ser Leu Pro Asp Gln Ile Asp Glu Ala Ile Asn Tyr Ile Lys Ser Leu
50 55 60
Glu Thr Lys Val Lys Leu Glu Gln Glu Lys Lys Glu Arg Leu Lys Glu65 70 75 80
Arg Lys Arg Thr Arg Gly Gly Cys Ser Ser Ser Ser Glu Ala Gln Gly
85 90 95
Ser Leu Lys Ser Pro Asn Ile Gln Ile His Glu Thr Gly Asn Leu Leu
100 105 110
Glu Val Ile Leu Thr Cys Gly Val Asp Ser Gln Phe Met Phe Cys Glu
115 120 125
Ile Ile Arg Ile Leu His Glu Glu Asn Val Glu Val Ile Asn Ala Asn
130 135 140
Ser Ser Met Val Gly Asp Leu Val Ile His Val Val His Gly Glu Val145 150 155 160
Glu Pro Ser Ile Tyr Gln Phe Gly Ala Thr Lys Val Ser Glu Lys Leu
165 170 175
Lys Trp Phe Met Asn Gly Ser Phe Ser Asp Val Glu Met Glu Pro Glu
180 185 190
Leu Met Trp Asn Phe Lys Ile Asp Ala Thr Glu Pro Trp Gly Leu Leu
195 200 205
Asp Asp Leu Thr Leu Asp Asn Val Leu Pro Pro Asn Thr Leu210 215 220
Claims (139)
1. Método para melhorar características relacionadas arendimento em plantas em relação a plantas de controle, caracterizado pelofato de compreender aumentar preferencialmente expressão de um ácidonucleico codificando um polipeptídeo HAL3 no broto de uma planta, eopcionalmente selecionar plantas tendo rendimento aumentado.
2. Método de acordo com a reivindicação 1, caracterizado pelofato de que dita expressão aumentada é efetuada introduzindo umamodificação genética, preferivelmente no locus de um gene codificando umpolipeptídeo HAL3.
3. Método de acordo com a reivindicação 2, caracterizado pelofato de que dita modificação genética é efetuada por qualquer um ou mais de:ativação de T-DNA5 TILLING e recombinação homóloga.
4. Método de acordo com a reivindicação 2, caracterizado pelofato de que dita modificação genética é efetuada por qualquer um ou mais de:ativação de T-DNA, TILLING e recombinação homóloga.
5. Método de acordo com a reivindicação 1, caracterizado pelofato de que dita expressão aumentada é efetuada introduzindo e expressandoem uma planta um ácido nucleico codificando um polipeptídeo HAL3.
6. Método de acordo com a reivindicação 5, caracterizado pelofato de que dito ácido nucleico codificando uma proteína HAL3 érepresentado por qualquer um dos ácidos nucleicos SEQ ID NOs dados emTabela A, ou uma porção destes, ou uma seqüência capaz de hibridizar comqualquer um dos ácidos nucleicos SEQ ID NOs dados em Tabela A.
7. Método de acordo com a reivindicação 5, caracterizado pelofato de que dito ácido nucleico codificando uma proteína HAL3 codifica umortólogo ou parálogo de qualquer dos ácidos nucleicos SEQ ID NOs dados emTabela A.
8. Método de acordo com qualquer das reivindicações 1 a 7,caracterizado pelo fato de que ditas características relacionadas a rendimentomelhoradas compreendem rendimento aumentado e/ou vigor precoce.
9. Método de acordo com a reivindicação 8, caracterizado pelofato de que dito rendimento aumentado é rendimento aumentado de sementes.
10. Método de acordo com a reivindicação 9, caracterizadopelo fato de que dito rendimento aumentado de sementes é uma ou mais de: a)biomassa aumentada de sementes; b) índice de colheita aumentado; e c)número aumentado de sementes (cheias).
11. Método de acordo com a reivindicação 9, caracterizadopelo fato de que dito aumento em rendimento de sementes é de pelo menos 10% em relação a plantas de controle.
12. Método de acordo com qualquer das reivindicações 5 a 11,caracterizado pelo fato de que dito ácido nucleico codificando uma proteínaHAL3 é operavelmente ligado a um promotor específico de broto,preferivelmente a um promotor de beta expansina.
13. Método de acordo com qualquer das reivindicações 5 a 12,caracterizado pelo fato de que dito ácido nucleico codificando uma proteínaHAL3 é de origem vegetal, preferivelmente de uma planta dicotiledônea,ainda preferivelmente da família Brassicaceae, mais preferivelmente dogênero Arabidopsis, mais preferivelmente de Arabidopsis thaliana.
14. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer reivindicação precedente, em que dita planta ou parte da mesmacompreende um ácido nucleico recombinante codificando um polipeptídeoHAL3.
15. Construção, caracterizada pelo fato de compreender:(a) um ácido nucleico codificando um polipeptídeo HAL3;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a) preferencialmente emtecido de broto de uma planta; e opcionalmente(c) uma seqüência de término de transcrição.
16. Construção de acordo com a reivindicação 15,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor específico de broto, preferivelmente um promotor debeta expansina.
17. Uso de uma construção como definida na reivindicação 15ou 16 caracterizado pelo fato de ser para estimular características relacionadasa rendimento em plantas, preferivelmente para aumentar rendimento e/ouvigor, em relação a plantas de controle.
18. Uso de acordo com a reivindicação 17, caracterizado pelofato de que dito rendimento é rendimento aumentado de sementes.
19. Uso de acordo com a reivindicação 17, caracterizado pelofato de que dito vigor é vigor precoce.
20. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com a construção como definida nasreivindicações 15 ou 16.
21. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(i) introduzir e aumentar preferencialmente expressão notecido de broto de uma planta de um ácido nucleico codificando umpolipeptídeo HAL3; e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.
22. Planta transgênica, caracterizada pelo fato tercaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, ditas características relacionadas a rendimento melhoradasresultando de aumento de expressão de um polipeptídeo HAL3preferencialmente no broto.
23. Planta transgênica de acordo com a reivindicação 14, 20 ou-22, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamonocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia.
24. Partes colhiveis de uma planta como definida em qualqueruma das reivindicações 14, 20, 22 ou 23, caracterizadas pelo fato de que ditaspartes colhíveis preferivelmente são sementes.
25. Produtos, caracterizados por serem derivados de umaplanta como definida na reivindicação 23 e/ou de partes colhíveis de umaplanta como definida na reivindicação 24.
26. Uso de um ácido nucleico codificando um polipeptídeoHAL3, cujo ácido nucleico é operavelmente ligado a um promotor específicode broto, caracterizado pelo fato de ser para melhorar característicasrelacionadas a rendimento em plantas.
27. Uso de acordo com a reivindicação 26, caracterizado pelofato de que ditas características relacionadas a rendimento abrangemrendimento de sementes e/ou vigor precoce.
28. Método para melhorar características relacionadas arendimento em plantas, caracterizado pelo fato de compreender modular,preferivelmente aumentar, expressão em uma planta de um ácido nucleicocodificando uma proteína MADS15.
29. Método de acordo com a reivindicação 28, caracterizadopelo fato de que dita proteína MADS15 compreende qualquer um ou mais dosseguintes motivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQID NO: 51.
30. Método de acordo com a reivindicação 28 a 29,caracterizado pelo fato de que dita expressão modulada é efetuada porqualquer um ou mais de identificação por ativação de T-DNA, TILLING,mutagênese dirigida a sítio, evolução dirigida ou recombinação homóloga.
31. Método de acordo com qualquer uma das reivindicações 28 a 29, caracterizado pelo fato de que dita expressão modulada é efetuadaintroduzindo e expressando em uma planta um ácido nucleico codificandoproteína MADS15, e em que a seqüência de aminoácidos de dita proteínaMADS15 compreende qualquer um ou mais dos seguintes motivos: SEQ IDNO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51.
32. Método de acordo com a reivindicação 31, caracterizadopelo fato de que dito ácido nucleico codificando uma proteína MADS15 équalquer um dos ácidos nucleicos SEQ LD NOs dados em Tabela D ou umaporção destes ou uma seqüência capaz de hibridizar com qualquer um dosácidos nucleicos SEQ ID NOs dados em Tabela D.
33. Método de acordo com a reivindicação 31, caracterizadopelo fato de que dito ácido nucleico codificando uma proteína MADS15codifica um ortólogo ou parálogo de qualquer dos ácidos nucleicos SEQ IDNOs dados em Tabela D.
34. Método de acordo com qualquer uma das reivindicações 28 a 33, caracterizado pelo fato de que dita característica relacionada arendimento melhorada é biomassa de raiz.
35. Método de acordo com qualquer das reivindicações 31 a 34, caracterizado pelo fato de que dito ácido nucleico codificando umaproteína MADS15 é operavelmente ligado a um promotor constitutivo,preferivelmente a um promotor GOS2.
36. Método de acordo com qualquer uma das reivindicações 31 a 35, caracterizado pelo fato de que dito ácido nucleico codificando umaproteína MADS15 é de origem vegetal, preferivelmente de uma plantamonocotiledônea, ainda preferivelmente da família Poaceae, maispreferivelmente do gênero Oryza, mais preferivelmente de Oryza sativa.
37. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 28 a 36, em que dita planta ou parte damesma compreende um ácido nucleico recombinante codificando umaproteína MADS15.
38. Construção, caracterizada pelo fato de compreender:(a) ácido nucleico codificando uma proteína MADS15, emque a seqüência de aminoácidos de dita proteína MADS15 compreendequalquer um ou mais dos seguintes motivos: SEQ ID NO: 48, SEQ ID NO:49, SEQ ID NO: 50, SEQ ID NO: 51;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(c) uma seqüência de término de transcrição.
39. Construção de acordo com a reivindicação 38,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor GOS2.
40. Uso de uma construção como definida na reivindicação 38ou 39, caracterizado pelo fato de ser para fazer plantas tendo característicasrelacionadas a rendimento melhoradas, particularmente rendimentoaumentado de raízes, em relação a plantas de controle.
41. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com uma construção como definida nareivindicação 38 ou 39.
42. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(i) introduzir e expressar em uma planta um ácido nucleicocodificando uma proteína MADS15, em que a seqüência de aminoácidos dedita proteína MADS15 compreende qualquer um ou mais dos seguintesmotivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51;e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.
43. Planta transgênica, caracterizada pelo fato de que temrendimento aumentado em relação a plantas de controle, dito rendimentoaumentado resultando de expressão aumentada de um ácido nucleicocodificando uma proteína MADS15, em que a seqüência de aminoácidos dedita proteína MADS15 compreende qualquer um ou mais dos seguintesmotivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51;ou uma célula de planta transgênica derivada de dita planta transgênica.
44. Planta transgênica de acordo com a reivindicação 37, 41 ou43, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamònocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia, ou uma célula de planta transgênica derivadade dita planta transgênica.
45. Partes colhíveis de uma planta como definido nareivindicação 44, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são raízes.
46. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 44 e/ou de partes colhíveis de umaplanta como definida na reivindicação 45.
47. Uso de um ácido nucleico codificando uma proteínaMADS15, caracterizado pelo fato de ser para melhorar característicasrelacionadas a rendimento em plantas, em que a seqüência de aminoácidos dedita proteína MADS15 compreende qualquer um ou mais dos seguintesmotivos: SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51.
48. Uso de acordo com a reivindicação 47, caracterizado pelofato de que dita característica relacionada a rendimento melhorada é biomassaaumentada de raízes em relação a plantas de controle.
49. Método para melhorar características relacionadas arendimento em plantas em relação a plantas de controle adequadas,caracterizado pelo fato de compreender preferencialmente reduzir expressãode um gene MADS15 endógeno em dita planta.
50. Método de acordo com a reivindicação 49, caracterizadopelo fato de que dita proteína MADS15 compreende qualquer um ou mais dosseguintes motivos: SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 116,SEQ ED NO: 117.
51. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada porregulagem negativa mediada por RNA de expressão de gene.
52. Método de acordo com a reivindicação 51, caracterizadopelo fato de que dita regulagem negativa mediada por RNA é efetuada por co-supressão.
53. Método de acordo com a reivindicação 51, caracterizadopelo fato de que dita regulagem negativa mediada por RNA é efetuada poruso de seqüências de ácidos nucleicos anti-sentido de MADS15.
54. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada usando umarepetição invertida de um gene MADS15 ou fragmento deste, preferivelmentecapaz de formar uma estrutura em forma de grampo.
55. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada usandoribozimas com especificidade para um ácido nucleico MADS15.
56. Método de acordo com a reivindicação 49 ou 50,caracterizado pelo fato de que dita expressão reduzida é efetuada pormutagênese por inserção.
57. Método de acordo com qualquer uma das reivindicações-49 a 56, caracterizado pelo fato de que dito gene MADS15 endógeno é umgene MADS15 como encontrado em uma planta em sua forma natural ou éum ácido nucleico MADS15 isolado subseqüentemente introduzido em umaplanta.
58. Método de acordo com a reivindicação 57, caracterizadopelo fato de que dito ácido nucleico MADS15 introduzido é operavelmenteligado a um promotor constitutivo, preferivelmente um promotor GOS2.
59. Método de acordo com a reivindicação 57 ou 58,caracterizado pelo fato de que dito ácido nucleico MADS15 introduzido é deuma fonte vegetal ou fonte artificial, preferivelmente em que plantas sãotransformadas com um ácido nucleico MADS15 homólogo ao gene MADS15endógeno, mais preferivelmente em que seqüências de ácidos nucleicos deMADS15 de plantas monocotiledôneas são usadas para transformação deplantas monocotiledôneas, além de preferivelmente em que seqüências deMADS15 da família Poaceae são usadas para transformação em plantas dafamília Poaceae, mais preferivelmente em que seqüências de ácidos nucleicosde MADS15 de arroz são usadas para transformar plantas de arroz.
60. Método de acordo com a reivindicação 59, caracterizadopelo fato de que dita seqüência de ácidos nucleicos de MADS15 de arrozcompreende um comprimento suficiente de nucleotídeos substancialmentecontíguos de SEQ ID NO: 109 (OsMADS 15) ou compreende umcomprimento suficiente de nucleotídeos substancialmente contíguos de umaseqüência de ácidos nucleicos codificando um ortólogo ou parálogo deOsMADS 15 (SEQ ID NO: 110).
61. Método de acordo com a reivindicação 60, caracterizadopelo fato de que ditos ortólogos ou parálogos de OsMADS 15 sãorepresentados por SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 151,SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159 eSEQ ID NO: 161.
62. Método de acordo com a reivindicação 60 ou 61,caracterizado pelo fato de que ditos nucleotídeos substancialmente contíguosda seqüência de ácidos nucleicos codificando um ortólogo ou parálogo deOsMADS 15 (SEQ LD NO: 110) são nucleotídeos substancialmente contíguosde seqüências de ácidos nucleicos representados por SEQ ID NO: 146, SEQID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ IDNO: 156, SEQ ID NO: 158 e SEQ ID NO: 160.
63. Método de acordo com qualquer uma das reivindicações 49 a 62, caracterizado pelo fato de que ditas características relacionadas arendimento melhoradas compreende rendimento aumentado, preferivelmenterendimento aumentado de sementes e/ou biomassa aumentada.
64. Método de acordo com a reivindicação 63, caracterizadopelo fato de que dito rendimento aumentado de sementes é selecionada apartir de um ou mais dos seguintes: a) biomassa aumentada de sementes (pesode semente); b) número aumentado de flores por planta; e c) númeroaumentado de sementes (cheias).
65. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 49 a 64, em que dita planta ou parte deplanta compreende um ácido nucleico MADS15 recombinante.
66. Construção, caracterizada pelo fato de compreender:(i) um ácido nucleico MADS15 capaz de silenciar um geneMADS15 endógeno;(ii) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(iii) uma seqüência de término de transcrição.
67. Construção de acordo com a reivindicação 66,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor GOS 2.
68. Uso de uma construção como definida na reivindicação 66ou 67, caracterizado pelo fato de ser para fazer plantas tendo característicasrelacionadas a rendimento melhoradas, particularmente rendimento e/oubiomassa aumentada de sementes, em relação a plantas de controle.
69. Planta, parte de planta ou célula de planta caracterizadapelo fato de ser transformada com a construção como definida nareivindicação 66 ou 67.
70. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(i) introduzir e expressar em uma planta um ácido nucleicoMADS15 capaz de silenciar um gene MADS15 endógeno; e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.
71. Planta transgênica, caracterizada pelo fato de tercaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, ditas características relacionadas a rendimento melhoradasresultando de expressão diminuída de um ácido nucleico codificando umaproteína MADS15, em que a seqüência de aminoácidos de dita proteínaMADS15 compreende qualquer um ou mais dos seguintes motivos: SEQ IDNO: 114, SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117; ou umacélula de planta transgênica derivada de dita planta transgênica.
72. Planta transgênica de acordo com a reivindicação 65, 69 ou 71, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamonocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia, ou uma célula de planta transgênica derivadade dita planta transgênica.
73. Partes colhíveis de uma planta como definida nareivindicação 72, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.
74. Produtos, caracterizados por serem derivados de umaplanta como definida na reivindicação 72 e/ou de partes colhíveis de umaplanta como definida na reivindicação 73.
75. Uso de um ácido nucleico codificando MADS15 paramelhorar características relacionadas a rendimento em plantas, caracterizadopelo fato de que a seqüência de aminoácidos de dita proteína MADS15compreende qualquer um ou mais dos seguintes motivos: SEQ ID NO: 114,SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117.
76. Uso de acordo com a reivindicação 75, caracterizado pelofato de que ditas características relacionadas a rendimento melhoradascompreendem rendimento aumentado de sementes.
77. Método para aumentar rendimento de planta em relação aplantas de controle adequadas, caracterizado pelo fato de compreenderaumentar expressão em uma planta de um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT, e opcionalmente selecionar plantastendo rendimento aumentado.
78. Método para aumentar resistência a estresse abiótico emplantas em relação a plantas de controle, caracterizado pelo fato decompreender aumentar expressão em um a planta de um ácido nucleicocodificando um polipeptídeo de fator de transcrição PLT, e opcionalmenteselecionar plantas tendo resistência aumentada a estresse abiótico.
79. Método de acordo com a reivindicação 78, caracterizadopelo fato de que dita resistência aumentada a estresse abiótico é eficiênciaaumentada de absorção de nutrientes, em relação a plantas de controle.
80. Método de acordo com qualquer das reivindicações 77 a-79, caracterizado pelo fato de que dita expressão aumentada é efetuadaintroduzindo e expressando em uma planta, parte de planta ou célula de plantaum ácido nucleico codificando um polipeptídeo de fator de transcrição PLT.
81. Método de acordo com a reivindicação 80, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcrição PLTé qualquer um dos ácidos nucleicos SEQ ID NOs dados em Tabela I ou umaporção destes ou uma seqüência capaz de hibridizar com qualquer um dosácidos nucleicos SEQ ED NOs dados em Tabela I.
82. Método de acordo com a reivindicação 80, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcrição PLTcodifica um ortólogo ou parálogo de qualquer dos ácidos nucleicos SEQ IDNOs dados em Tabela D.
83. Método de acordo com qualquer das reivindicações 77, 80, 81 e 82, caracterizado pelo fato de que dito rendimento aumentado érendimento aumentado de sementes.
84. Método de acordo com a reivindicação 83, caracterizadopelo fato de que dito rendimento de sementes é selecionada a partir de um oumais de: a) biomassa aumentada de sementes; b) número aumentado de florespor planta; c) número aumentado de sementes (cheias); d) taxa aumentada deenchimento de grãos; e) índice de colheita aumentado; f) Peso de MilSementes (TKW) aumentado; g) área de semente aumentada; h) comprimentode semente aumentado; e i) largura de semente aumentada.
85. Método de acordo com qualquer uma das reivindicações 80 a 84,caracterizado pelo fato de que dito ácido nucleico é operavelmenteligado a um promotor constitutivo, preferivelmente um promotor GOS2.
86. Método de acordo com qualquer uma das reivindicações 80 a 84, caracterizado pelo fato de que dito ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT é de origem vegetal, preferivelmentede uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae,mais preferivelmente do gênero Arabidopsis, mais preferivelmente deArabidopsis thaliana.
87. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 77 a 86, em que dita planta ou parte damesma compreende um ácido nucleico codificando um polipeptídeo de fatorde transcrição PLT, cujo ácido nucleico é operavelmente ligado a umpromotor constitutivo.
88. Construção, caracterizada pelo fato de compreender:(i) um ácido nucleico codificando um polipeptídeo de fator detranscrição PLT;(ii) uma ou mais seqüências de controle, capazes de dirigirexpressão da seqüência de ácidos nucleicos of (i); e opcionalmente(iii) uma seqüência de término de transcrição.
89. Construção de acordo com a reivindicação 88,caracterizada pelo fato de que dito promotor constitutivo é um promotor GOS2.
90. Uso de uma construção como definida na reivindicação 88ou 89 caracterizado pelo fato de ser para fazer plantas tendo rendimentoaumentado, particularmente rendimento aumentado de sementes e/ouresistência aumentada a estresse abiótico, em relação a plantas de controle.
91. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com a construção como definida nareivindicação 88 ou 89.
92. Método para a produção de uma planta transgênica tendorendimento aumentado e/ou resistência aumentada a estresse abiótico,caracterizado pelo fato de compreender:(i) introduzir e expressar um ácido nucleico codificando umpolipeptídeo de fator de transcrição PLT em uma célula de planta; e(ii) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.
93. Planta transgênica, caracterizada pelo fato de terrendimento aumentado e/ou resistência aumentada a estresse abiótico emrelação a plantas de controle, resultando de expressão aumentada de um ácidonucleico codificando um polipeptídeo de fator de transcrição PLT5 ou célulade planta derivada de dita planta transgênica.
94. Planta transgênica de acordo com a reivindicação 87, 91 ou-93, caracterizada pelo fato de que dita planta é uma planta de cultivo ou umamonocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto,centeio, triticale, sorgo e aveia, ou uma célula de planta transgênica derivadade dita planta transgênica.
95. Partes colhíveis de uma planta como definida nareivindicação 94, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.
96. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 94 e/ou de partes colhíveis de umaplanta como definida na reivindicação 93.
97. Uso de um ácido nucleico codificando um polipeptídeo defator de transcrição PLT, ou uso de um polipeptídeo de fator de transcriçãoPLT, caracterizado pelo fato de ser para aumentar resistência a estresseabiótico e/ou para melhorar rendimento de planta, especialmente rendimentode sementes, em relação a plantas de controle.
98. Método para melhorar características relacionadas arendimento em plantas, caracterizado pelo fato de compreender modularexpressão em uma planta de um ácido nucleico codificando um fator detranscrição bHLH representado por qualquer um de SEQ ID NO 213, SEQ IDNO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO:-297, SEQ ID NO: 299, SEQ ID NO: 301, ou ortólogos ou parálogos dequalquer dos mencionados acima.
99. Método de acordo com a reivindicação 98, caracterizadopelo fato de que dita expressão modulada é efetuada por qualquer um ou maisde identificação por ativação de T-DNA, TILLING, ou recombinaçãohomóloga.
100. Método de acordo com a reivindicação 98, caracterizadopelo fato de que dita expressão modulada é efetuada introduzindo eexpressando em uma planta um ácido nucleico codificando um fator detranscrição bHLH representado por qualquer um de SEQ ID NO 213, SEQ EDNO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO:- 297, SEQ ID NO: 299, SEQ ID NO: 301, ou ortólogos ou parálogos dequalquer das SEQ ID NOs mencionadas acima.
101. Método de acordo com qualquer uma das reivindicações- 98 a 100, caracterizado pelo fato de que dita característica relacionada arendimento melhorada é vigor precoce.
102. Método de acordo com a reivindicação 100, caracterizadopelo fato de que dito ácido nucleico é operavelmente ligado a um promotorconstitutivo, preferivelmente a um promotor GOS2.
103. Método de acordo com qualquer uma das reivindicações- 100 a 102, caracterizado pelo fato de que dito ácido nucleico é uma porção de,ou uma variante alélica de, ou uma variante de união de, ou uma seqüênciacapaz de hibridizar com uma seqüência de ácidos nucleicos de acordo comqualquer um de SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ IDNO: 226 e SEQ ID NO: 228, SEQ ID NO: 296, SEQ ID NO: 298, SEQ IDNO: 300, em que dita porção, variante alélica, variante de união ou seqüênciade hibridização codifica um fator de transcrição bHLH.
104. Método de acordo com qualquer uma das reivindicações- 98 a 103, caracterizado pelo fato de que dito ácido nucleico codificando umfator de transcrição bHLH é de origem vegetal, preferivelmente de uma plantamonocotiledônea, ainda preferivelmente da família Poaceae, maispreferivelmente do gênero Oryza, mais preferivelmente de Oryza sativa.
105. Planta ou parte da mesma incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 98 a 104, em que dita planta ou parte damesma compreende um ácido nucleico codificando um fator de transcriçãobHLH.
106. Polipeptídeo isolado, caracterizado pelo fato decompreender:(i) uma seqüência de aminoácidos representada por qualquerum de SEQ ED NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301;(ii) uma seqüência de aminoácidos tendo (a) em ordemcrescente de preferência, pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%,85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais identidade de seqüência comqualquer uma das seqüências de aminoácidos representadas por SEQ ID NO:297, SEQ ID NO: 299 e SEQ ID NO: 301, e (b) um domínio bHLH.;(iii) derivados de qualquer das seqüências de aminoácidosdadas em (i) ou (ii) acima.
107. Molécula isolada de ácido nucleico, caracterizada pelofato de compreender:(i) um ácido nucleico representado por qualquer um de SEQID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;(ii) o complemento de um ácido nucleico representado porqualquer um de SEQ ID NO: 296, SEQ ID NO: 298 e SEQ ID NO: 300;(iii) um ácido nucleico codificando um fator de transcriçãobHLH tendo (a) em ordem crescente de preferência, pelo menos 50%, 55%,60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou maisidentidade de seqüência com a seqüência de aminoácidos representada porqualquer uma de SEQ ID NO: 297, SEQ ID NO: 299 e SEQ ID NO: 301, e(b) um domínio bHLH.
108. Construção, caracterizada pelo fato de compreender:(a) ácido nucleico codificando um fator de transcrição bHLHrepresentado por qualquer um de SEQ ID NO 213, SEQ ID NO 215, SEQ IDNO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO: 297, SEQ ID NO:- 299, SEQ ID NO: 301, ou ortólogos ou parálogos de qualquer das SEQ IDNOs mencionadas acima;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(c) uma seqüência de término de transcrição.
109. Construção de acordo com a reivindicação 108,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor GOS2.
110. Uso de uma construção como definida na reivindicação 108 ou 109, caracterizado pelo fato de ser para fazer plantas tendocaracterísticas relacionadas a rendimento melhoradas, particularmente vigorprecoce, em relação a plantas de controle.
111. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com uma construção como definida nareivindicação 108 ou 109.
112. Método para a produção de uma planta transgênica tendocaracterísticas relacionadas a rendimento melhoradas em relação a plantas decontrole, caracterizado pelo fato de compreender:(d) introduzir e expressar em uma planta um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer um deSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima; e(e) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.
113. Planta transgênica, caracterizada pelo fato de terrendimento aumentado em relação a plantas de controle, dito rendimentoaumentado resultando de expressão aumentada de um ácido nucleicocodificando um fator de transcrição bHLH representado por qualquer um deSEQ ID NO 213, SEQ ID NO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQID NO 225, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301 ouortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima, ouuma célula de planta transgênica derivada de dita planta transgênica.
114. Planta transgênica de acordo com a reivindicação 105, 111 ou 113, caracterizada pelo fato de que dita planta é uma planta de cultivoou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia, ou uma célula de planta transgênicaderivada de dita planta transgênica.
115. Partes colhíveis de uma planta como definida nareivindicação 114, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.
116. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 114 e/ou de partes colhíveis deuma planta como definida na reivindicação 115.
117. Uso de um ácido nucleico codificando um fator detranscrição bHLH representado por qualquer um de SEQ ID NO 213, SEQ IDNO 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO 225, SEQ ID NO:- 297, SEQ ID NO: 299, SEQ ID NO: 301 ou ortólogos ou parálogos dequalquer dos mencionados acima, caracterizado pelo fato de ser para melhorarcaracterísticas relacionadas a rendimento em plantas.
118. Uso de acordo com a reivindicação 117, caracterizadopelo fato de que dita característica relacionada a rendimento melhorada évigor precoce.
119. Método para aumentar rendimento em plantas em relaçãoa plantas de controle adequadas, caracterizado pelo fato de compreenderaumentar expressão em uma planta de um ácido nucleico codificando umpolipeptídeo fator de transcrição SPL15, e opcionalmente selecionar plantastendo rendimento aumentado.
120. Método de acordo com a reivindicação 119, caracterizadopelo fato de que dita expressão aumentada é efetuada por qualquer um oumais de: ativação de T-DNA, TILLING, mutagênese dirigida a sítio, evoluçãodirigida e recombinação homóloga.
121. Método de acordo com a reivindicação 119 caracterizadopelo fato de que dita expressão aumentada é efetuada introduzindo eexpressando em uma planta um ácido nucleico codificando um polipeptídeofator de transcrição SPLl5.
122. Método de acordo com a reivindicação 121, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcriçãoSPL15 é qualquer um dos ácidos nucleicos SEQ ID NOs dados em Tabela Nou uma porção destes ou uma seqüência capaz de hibridizar com qualquer umdos ácidos nucleicos SEQ ID NOs dados em Tabela N.
123. Método de acordo com a reivindicação 121, caracterizadopelo fato de que dito ácido nucleico codificando um fator de transcriçãoSPL15 codifica um ortólogo ou parálogo de qualquer dos ácidos nucleicosSEQ ID NOs dados em Tabela N.
124. Método de acordo com qualquer uma das reivindicações119 a 123, caracterizado pelo fato de que dito rendimento aumentado érendimento aumentado de sementes.
125. Método de acordo com a reivindicação 124, caracterizadopelo fato de que dito rendimento aumentado de sementes compreende um oumais de: a) biomassa acima da terra aumentada b) número aumentado deflores por planta; c) rendimento aumentado de sementes; d) númeroaumentado de sementes (cheias)); e) Peso de Mil Sementes (TKW)aumentado; e f) índice de colheita aumentado.
126. Método de acordo com qualquer uma das reivindicações-121 a 125, caracterizado pelo fato de que dito ácido nucleico é operavelmenteligado a um promotor constitutivo, preferivelmente a um promotor HMGB(grupo B de alta mobilidade) ou um promotor GOS2, ainda preferivelmente aum promotor HMGB de arroz ou um promotor GOS2 de arroz.
127. Método de acordo com qualquer uma das reivindicações-121a 126, caracterizado pelo fato de que dito ácido nucleico codificando umpolipeptídeo fator de transcrição SPL15 é de origem vegetal, preferivelmentede uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae,mais preferivelmente de Arabidopsis thaliana.
128. Planta ou parte da mesma, incluindo sementes,caracterizada pelo fato de ser obtenível por um método como definido emqualquer uma das reivindicações 119 a 127, em que dita planta ou parte damesma compreende um ácido nucleico recombinante codificando um fator detranscrição SPL15.
129. Construção, caracterizada pelo fato de compreender:(a) um ácido nucleico codificando um polipeptídeo fator detranscrição SPL15;(b) uma ou mais seqüências de controle capazes de dirigirexpressão da seqüência de ácidos nucleicos de (a); e opcionalmente(c) uma seqüência de término de transcrição.
130. Construção de acordo com a reivindicação 129,caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelomenos um promotor constitutivo, preferivelmente um promotor HMGB ouum promotor GOS2.
131. Uso de uma construção como definida na reivindicação-129 ou 130, caracterizado pelo fato de ser para fazer plantas tendo rendimentoaumentada, em relação a plantas de controle.
132. Planta, parte de planta ou célula de planta, caracterizadapelo fato de ser transformada com uma construção como definida nareivindicação 129 ou 130.
133. Método para a produção de uma planta transgênica tendorendimento aumentado em relação a plantas de controle, caracterizado pelofato de compreender:(f) introduzir e expressar um ácido nucleico codificando umpolipeptídeo fator de transcrição SPL15 em uma célula de planta; e(g) cultivar a célula de planta em condições que promovemcrescimento e desenvolvimento vegetal.
134. Planta transgênica, caracterizada pelo fato de terrendimento aumentado em relação a plantas de controle, dito rendimentoaumentado resultando de expressão aumentada de um ácido nucleicocodificando um fator de transcrição SPLl 5.
135. Planta transgênica de acordo com a reivindicação 128,132 ou 134, caracterizada pelo fato de que dita planta é uma planta de cultivoou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada,milheto, centeio, triticale, sorgo e aveia, ou uma célula de planta transgênicaderivada de dita planta transgênica.
136. Partes colhíveis de uma planta como definida nareivindicação 135, caracterizadas pelo fato de que ditas partes colhíveispreferivelmente são sementes.
137. Produtos, caracterizados pelo fato de serem derivados deuma planta como definida na reivindicação 135 e/ou de partes colhíveis deuma planta como definida na reivindicação 136.
138. Uso de um ácido nucleico codificando um polipeptídeofator de transcrição SPLl 5, caracterizado pelo fato de ser para aumentarrendimento em uma planta em relação a plantas de controle.
139. Uso de acordo com a reivindicação 138, caracterizado pelofato de que dito rendimento aumentado é rendimento aumentado de sementes.
Applications Claiming Priority (21)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US60/ | 2002-10-30 | ||
| EP06075822 | 2006-03-31 | ||
| EP06075823 | 2006-03-31 | ||
| EP06075823.2 | 2006-03-31 | ||
| EP06075822.4 | 2006-03-31 | ||
| US79011606P | 2006-04-07 | 2006-04-07 | |
| US79015106P | 2006-04-07 | 2006-04-07 | |
| US60/790151 | 2006-04-07 | ||
| US60/790116 | 2006-04-07 | ||
| EP06075918.0 | 2006-04-10 | ||
| EP06075918 | 2006-04-10 | ||
| US79222506P | 2006-04-14 | 2006-04-14 | |
| US60/792225 | 2006-04-14 | ||
| EP06075957.8 | 2006-04-27 | ||
| EP06075957 | 2006-04-27 | ||
| US79860206P | 2006-05-08 | 2006-05-08 | |
| US60/798602 | 2006-05-08 | ||
| EP06114140.4 | 2006-05-18 | ||
| EP06114140 | 2006-05-18 | ||
| US80168706P | 2006-05-19 | 2006-05-19 | |
| PCT/EP2007/053081 WO2007113237A2 (en) | 2006-03-31 | 2007-03-30 | Plants having enhanced yield-related traits and a method for making the same |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0709258A2 true BRPI0709258A2 (pt) | 2011-06-28 |
Family
ID=44189248
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0709258-0A BRPI0709258A2 (pt) | 2006-03-31 | 2007-03-30 | métodos para melhorar caracterìsticas relacionadas a rendimento em plantas, para a produção de uma planta transgênica, para aumentar rendimento de planta em relação a plantas de controle adequadas e para aumentar resistência a estresse abiótico em plantas em relação a plantas de controle, planta ou parte da mesma, construção, uso de uma construção, planta, parte de planta ou célula de planta, planta transgênica, partes colhìveis de uma planta, produtos, usos de um ácido nucleico, polipeptìdeo isolado, e, molécula isolada de ácido nucleico |
Country Status (1)
| Country | Link |
|---|---|
| BR (1) | BRPI0709258A2 (pt) |
-
2007
- 2007-03-30 BR BRPI0709258-0A patent/BRPI0709258A2/pt not_active IP Right Cessation
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2004829B1 (en) | Plants having enhanced yield-related traits and a method for making the same | |
| CN101415829B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
| KR101255415B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| EP2508610A1 (en) | Plants having enhanced yield-related traits and a method for making the same | |
| MX2011002675A (es) | Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas. | |
| KR101429468B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| BRPI0718977A2 (pt) | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico | |
| BRPI0721100A2 (pt) | Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos | |
| MX2011001475A (es) | Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas. | |
| CN101969759A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
| MX2013009749A (es) | Plantas que tienen rasgos relacionados con rendimiento mejorado y metodos para producir los mismos. | |
| US20130019347A1 (en) | Plants having enhanced yield-related traits and a method for making the same | |
| CN101778942A (zh) | 产率相关性状增强的植物及制备其的方法 | |
| MX2013009997A (es) | Plantas que tienen rasgos relacionados con rendimiento mejorado y metodos para producir los mismos. | |
| CN101595222B (zh) | 具有改良的种子产量相关性状的植物及其制备方法 | |
| AU2008327899A1 (en) | Plants having increased yield-related traits and a method for making the same | |
| AU2006311005B2 (en) | Plants having improved growth characteristics and a method for making the same | |
| MX2014006326A (es) | Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas. | |
| BRPI0709258A2 (pt) | métodos para melhorar caracterìsticas relacionadas a rendimento em plantas, para a produção de uma planta transgênica, para aumentar rendimento de planta em relação a plantas de controle adequadas e para aumentar resistência a estresse abiótico em plantas em relação a plantas de controle, planta ou parte da mesma, construção, uso de uma construção, planta, parte de planta ou célula de planta, planta transgênica, partes colhìveis de uma planta, produtos, usos de um ácido nucleico, polipeptìdeo isolado, e, molécula isolada de ácido nucleico | |
| BRPI0718898A2 (pt) | Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] | ||
| B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |