BRPI0718977A2

BRPI0718977A2 - Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico

Info

Publication number: BRPI0718977A2
Application number: BRPI0718977-0A
Authority: BR
Inventors: Valerie Frankard; Ana Isabel Sanz Molinero; Yves Hatzfeld
Original assignee: Cropdesign Nv
Priority date: 2006-11-24
Filing date: 2007-11-22
Publication date: 2014-02-04
Also published as: EP2599871A2; US8350119B2; US20110016586A1; EP2599871A3; AR063972A1; MX2009005280A; WO2008062049A1; CA2664987A1; US20130180011A1; EP2084284A1

Description

"MÉTODO PARA AUMENTAR RENDIMENTO DE SEMENTES EM PLANTAS EM RELAÇÃO ÀS PLANTAS DE CONTROLE, CONSTRUÇÃO, USO DA MESMA, PLANTA, PARTE DE PLANTA OU CÉLULA DE PLANTA, MÉTODO PARA A PRODUÇÃO DE UMA PLANTA TRANSGÊNICA TENDO RENDIMENTO AUMENTADO DE SEMENTES EM RELAÇÃO ÀS PLANTAS DE CONTROLE, PLANTA TRANSGÊNICA, PARTES COLHÍVEIS DE UMA PLANTA, PRODUTOS, E, USO DE UM ÁCIDO NUCLEICO"

A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar várias características relacionadas ao rendimento economicamente importantes em plantas. Mais especificamente, a presente invenção se relaciona a um método para melhorar várias características relacionadas ao rendimento economicamente importantes em plantas em relação às plantas de controle, aumentando expressão em uma planta de uma seqüência de ácido nucleico codificando um Polipeptídeo que Aumenta Rendimento (YEP). O YEP pode ser um polipeptídeo TCP de Classe I ou um CAH3 ou um ÇlavataJ. (CLVl) com um domínio C-terminal não funcional. A presente invenção também se relaciona a plantas tendo expressão aumentada de uma seqüência de ácido nucleico codificando um YEP, cujas plantas têm características relacionadas ao rendimento melhoradas em plantas em relação às plantas de controle. A invenção também fornece construções úteis nos métodos da invenção.

A sempre crescente população mundial e a oferta minguante de terra arável disponível para agricultura impulsionam pesquisa para aumentar a eficiência de agricultura. Meios convencionais para reprodução de planta e horticulturas utilizam técnicas de melhoramento seletivo para identificar plantas tendo características desejáveis. Entretanto, tais técnicas de melhoramento seletivo têm diversas desvantagens, quer dizer que estas técnicas são tipicamente de trabalho intensivo e resultam em plantas que freqüentemente contêm componentes genéticos heterogêneos que podem nem sempre resultar na característica desejável sendo passada adiante a partir de plantas parentais. Avanços em biologia molecular permitiram ao ser humano modificar o germoplasma de animais e plantas. Engenharia genética de plantas exige o isolamento e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a subseqüente introdução de tal material genético em uma planta. Tal tecnologia tem a capacidade de gerar cultivos ou plantas tendo várias características econômicas, agronômicas ou horticulturas melhoradas.

Uma característica de particular interesse econômico é

rendimento aumentado. Rendimento normalmente é definido como o rendimento mensurável de valor econômico de um cultivo. Isto pode ser definido em termos de quantidade e/ou qualidade. Rendimento é diretamente dependente de diversos fatores, por exemplo, o número e tamanho dos órgãos, arquitetura de planta (por exemplo, o número de galhos), rendimento de sementes, senescência foliar e mais. Desenvolvimento de raiz, absorção de nutrientes, tolerância a estresse e vigor inicial também podem ser fatores importantes para determinar rendimento. Aperfeiçoar os fatores mencionados acima pode, portanto, contribuir para aumentar rendimento de cultivo. A capacidade de aumentar rendimento de planta teria muitas

aplicações em áreas tais como agricultura, incluindo na produção de plantas ornamentais, arboricultura, horticultura e silvicultura. Aumentar rendimento também pode encontrar uso na produção de algas para uso em biorreatores (para a produção biotecnológica de substâncias tais como produtos farmacêuticos, anticorpos ou vacinas, ou para a bioconversão de resíduo orgânico) e outras tais áreas.

Dependendo do uso final, a modificação de certas características relacionadas ao rendimento pode ser favorecida sobre outras. Por exemplo, para aplicações tal como produção de forragem ou madeira, ou recurso de biocombustível, um aumento nas partes vegetativas de uma planta pode ser desejável, e para aplicações tal como produção de trigo, amido ou óleo, um aumento em parâmetros de semente pode ser particularmente desejável. Mesmo entre os parâmetros de semente, alguns podem ser favorecidos sobre outros, dependendo da aplicação. Vários mecanismos podem contribuir para aumentar rendimento de sementes, quer isto seja na forma de tamanho de semente aumentado ou número de sementes aumentado.

Rendimento de sementes é uma característica particularmente importante, uma vez que as sementes de muitas plantas são importantes para nutrição humana e animal. Cultivos tal como, milho, arroz, trigo, canola e soja respondem por mais da metade do consumo calórico humano total, quer através de consumo direto das próprias sementes ou através de consumo de produtos de carne criados com sementes processadas. Elas também são uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais. Sementes contêm um embrião (a fonte de novas partes aéreas e raízes) e um endosperma (a fonte de nutrientes para crescimento de embrião durante germinação e durante crescimento inicial de plântulas). O desenvolvimento de uma semente envolve muitos genes, e requer a transferência de metabólitos das raízes, talos, folhas e caules para a semente em crescimento. O endosperma, em particular, assimila os precursores metabólicos de carboidratos, óleos e proteínas e sintetiza estes em macromoléculas de armazenamento para preencher o grão.

Outra importante característica para muitas cultivos é vigor inicial. Melhorar vigor inicial é um importante objetivo de programas modernos de melhoramento de arroz tanto em cultivares de arroz temperadas como tropicais. Raízes longas são importantes para ancoramento apropriado ao solo em arroz semeado em água. Onde arroz é semeado diretamente em campos alagados, e onde plantas devem emergir rapidamente através de água, partes aéreas maiores estão associadas com vigor. Onde sementeira em sulcos é praticada, mesocótilos e coleóptilos maiores são importantes para boa emergência de plântula. A capacidade de manipular vigor inicial em plantas seria de grande importância em agricultura. Por exemplo, vigor inicial fraco tem sido uma limitação para a introdução de híbridos de milho (.Zea mays L.)

baseados em germoplasma de Cinturão do Milho no Atlântico Europeu.

Uma característica importante adicional é aquela de tolerância melhorada a estresse abiótico. Estresse abiótico é uma causa primária de perda de cultivo ao redor do mundo, reduzindo produções médias para a maioria das principais cultivares em mais do que 50% (Wang et al., Planta (2003) 218: 1-14). Estresses abióticos podem ser causados por seca, salinidade, extremos de temperatura, toxicidade química e estresse oxidativo. A capacidade de melhorar tolerância de planta a estresse abiótico seria de grande vantagem econômica para fazendeiros ao redor do mundo e iria permitir o cultivo de cultivos durante condições adversas e em territórios onde cultivo de cultivos não pode ser possível de outra maneira.

Outra característica economicamente importante é aquela de biomassa aumentada. Biomassa de planta é rendimento para cultivos de forragem como alfafa, milho de silagem e feno. Muitos substitutos para rendimento foram usados em cultivos de grãos. Importantes entre estes são estimativas de tamanho de planta. Tamanho de planta pode ser medido de muitas maneiras dependendo de espécie e estágio de desenvolvimento, mas inclui peso seco total de planta, peso seco de parte aérea, peso fresco de parte aérea, área foliar, volume de caule, altura da planta, diâmetro da roseta, comprimento de folha, comprimento de raiz, massa de raiz, número de rebentos e número de folhas. Muitas espécies mantêm uma proporção conservativa entre o tamanho de diferentes partes da planta em um dado estágio de desenvolvimento. Estas relações alométricas são usadas para extrapolar a partir de uma destas medidas de tamanho para outra (e.g. Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Tamanho de planta em um estágio de desenvolvimento inicial tipicamente irá se correlacionar com tamanho de planta posterior em desenvolvimento. Uma planta maior com uma área foliar maior tipicamente pode absorver mais luz e dióxido de carbono do que uma planta menor e, portanto provavelmente irá ganhar um peso maior durante o mesmo período (Fasoula & Tollenaar 2005 Maydica 50:39). Isto é em adição à continuação potencial da vantagem microambiental ou genética que a planta teve para atingir o maior tamanho inicialmente. Existe um forte componente genético para tamanho de planta e taxa de crescimento (e.g. ter Steege et al 2005 Plant Physiology 139:1078), e assim para uma variedade de diversos genótipos tamanho de planta em uma condição ambiental é provável de se correlacionar com tamanho em outra (Hittalmani et al 2003 Theoretical Applied Genetics 107:679). Desta maneira um ambiente padrão é usado como um substituto para ambientes diversos e dinâmicos encontrados em diferentes localizações e tempos por cultivos no campo.

índice de colheita, a proporção de rendimento de sementes sobre peso seco de parte aérea, é relativamente estável em muitas condições ambientais e assim como uma correlação robusta entre tamanho de planta e rendimento de grãos pode ser freqüentemente obtida (e.g. Rebetzke et al 2002 Crop Science 42:739). Estes processos são intrinsecamente ligados pelo fato da maioria de biomassa de grãos ser dependente de produtividade fotossintética atual ou armazenada pelas folhas e caule da planta (Gardener et al 1985 Physiology of Crop Plants. Iowa State University Press, pp68-73). Portanto, selecionar para tamanho de planta, mesmo em estágios iniciais de desenvolvimento, foi usado como um indicador para rendimento futuro potencial (e.g. Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Ao testar para o impacto de diferenças genéticas em tolerância a estresse, a capacidade de padronizar propriedades do solo, temperatura, água e disponibilidade de nutrientes e intensidade luminosa é uma vantagem intrínseca de ambientes de estufa ou câmara de crescimento de planta comparados com o campo. Entretanto, limitações artificiais em rendimento devido à fraca polinização devido à ausência de vento ou insetos, ou espaço insuficiente para raiz madura ou crescimento de dossel, podem restringir o uso destes ambientes controlados para testar diferenças de rendimento. Portanto, medidas de tamanho de planta em desenvolvimento inicial, em condições padronizadas em uma câmara de crescimento ou estufa, são práticas padrão para fornecer indicação de vantagens genéticas potenciais para rendimento.

Uma abordagem para aumentar rendimento (rendimento e/ou

biomassa de sementes) em plantas pode ser através de modificação dos mecanismos de crescimento inerentes de uma planta, tal como o ciclo celular ou várias vias de sinalização envolvidas em crescimento de planta ou em mecanismos de defesa. Foi descoberto agora que várias características relacionadas ao

rendimento podem ser melhoradas em plantas modulando expressão em uma planta de um ácido nucleico codificando um Polipeptídeo que Aumenta Rendimento (YEP) em uma planta, caracterizado pelo fato de que o YEP é ou um polipeptídeo TCP de Classe I ou um CAH3 ou um Clavatal (CLVl) com um domínio C-terminal não funcional. INTRODUÇÃO TCP

Fatores de transcrição normalmente são definidos como proteínas que mostram afinidade de ligação de DNA específica de seqüência e que são capazes de ativar e/ou reprimir transcrição. O genoma de Arabidopsis thaliana codifica para pelo menos 1533 reguladores transcricionais, respondendo por -5,9% de seu número total estimado de genes (Riechmann et al. (2000) Science 290: 2105-2109). A família TCP de fatores de transcrição é nomeada depois de seus primeiros membros caracterizados (teosinte- branchedl (TB 1), çycloidea (CYC) e fator PCNA (PCF); Cubas P et al. (1999) Plant J 18(2): 215-22). Em Arabidopsis thaliana, mais do que 20 membros dos polipeptídeos de família TCP foram identificados, e classificados baseado em similaridade de seqüência no domínio TCP em fatores de transcrição de Classe I (também chamado Grupo I ou grupo PCF) que regulam positivamente expressão gênica, e fatores de transcrição de Classe II (também chamado Grupo II ou grupo CYC-TB1) que regulam negativamente proliferação. Todos os fatores de transcrição TCP são caracterizados por um Hélice-Alça-Hélice básico (bHLH) não canônico previsto, que é requerido tanto para ligação de DNA como homo e heterodimerização (veja Cubas et al. acima).

Um polipeptídeo TCP de Classe I, AtTCP20 (também chamado ortólogo PCF1), se liga ao promotor de genes de ciclo celular e proteína ribossômica, como relatado em Li et al. (2005) PNAS 102(36): 12978-83). Pedido de Patente Internacional W00036124 fornece uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I (chamado VBDBP) e a seqüência de polipeptídeos correspondente. Vetores de expressão e plantas transgênicas compreendendo a seqüência de ácido nucleico VBDBP mencionada acima são descritos. Em Pedido de Patente Internacional W02004031349, plantas transgênicas de Arabidopsis thaliana superexpressando (usando um promotor 3 5CaMV) uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I (chamado G193 8) são caracterizadas. Taxa de crescimento de planta e desenvolvimento retardado são observados. CAH3

Anidrase carbônica catalisa a reação reversível H2CO3 Δ H2O + CO2. Há 3 classes de anidrases carbônicas (alfa, beta e gama), não relacionadas filogeneticamente, mas compartilhando algumas similaridades no sítio ativo. Em plantas, todas as três classes existem. Anidrases carbônicas estão presentes em cloroplastos, mitocôndrias (principalmente classe gama) e citosol, e podem representar até 2% do total de proteínas solúveis em folhas. Anidrase carbônica é importante para assegurar fotossíntese eficiente mantendo concentração de CO2 em células em um nível adequado. Sabe-se que em pressão atmosférica de O2 e CO2, ribulose bisfosfato carboxilase (Rubisco) funciona em 30% de sua capacidade total, portanto existe interesse em melhorar o mecanismo de absorção de CO2 em plantas. Expressão de anidrase carbônica é co-regulada com a expressão de Rubisco, e plantas geralmente mantêm uma proporção constante de anidrase carbônica versus Rubisco. Além disso, é relatado que anidrase carbônica também pode limitar fotorrespiração fornecendo esqueletos de C para assimilação de nitrogênio em certas condições. Em plantas com um tipo C3 de fotossíntese, a maior parte da atividade de anidrase carbônica é localizada para o estroma dos cloroplastos de mesófilo, ao passo que em plantas C4, a maior parte da anidrase carbônica é encontrada no citoplasma de células de mesófilo.

A idéia de usar anidrase carbônica para aumentar assimilação de CO2 foi formulada muitas vezes. Em Patente Internacional 9511979, é postulado que transformando uma planta monocotiledônea com uma anidrase carbônica de uma planta monocotiledônea a capacidade de fixação de dióxido de carbono seria melhorada e iria resultar em crescimento de planta acelerado. Outros documentos descrevem métodos para mimetizar uma fotossíntese tipo C4 em plantas C3 com isso melhorando a eficiência de fotossíntese (por exemplo, Patente Norte-Americana 6.610.913, Patente Norte-Americana 6.831.217 ou Patente Norte-Americana 20030233670). Nestas abordagens, uma via tipo C4 é introduzida em plantas C3 introduzindo e expressando uma combinação de várias atividades enzimáticas (tal como fosfoenolpiruvato carboxilase (PEPC) ou piruvato ortofosfato diquinase (PPDK)) de plantas C4 para aumentar fixação de CO2; expressão destes genes está sob controle de seqüências reguladoras de C4, tipicamente seus promotores nativos. Embora previsto, estas tentativas ainda não resultaram em plantas com rendimento

aumentado.

CLAVATA

Receptores do tipo quinase com repetições ricas em leucina (LRR-RLKs) são polipeptídeos envolvidos em duas funções biológicas em plantas, i.e., crescimento e desenvolvimento por um lado, e resposta de defesa pelo outro. LRR-RLKs são polipeptídeos transmembrana envolvidos em transdução de sinal, com de término N a término C: (i) um peptídeo sinal para direcionamento subcelular de ER; (ii) um domínio de receptor extracelular para perceber sinais; (iii) um domínio transmembrana; e (iv) um domínio de serina/treonina quinase intracelular citoplasmático que pode fosforilar proteínas alvo posteriores, ser fosforilado por si mesmo (autofosforilação) ou por outras quinases, ou ser desfosforilado por fosfatases.

LRR-RLKs compreendem o maior grupo dentro da superfamília de quinase tipo receptor (RLK) de plantas, e o genoma de Arabidopsis sozinho contém por volta de 200 genes de LRR-RLK. Membros desta família foram categorizados em subfamílias baseado tanto na identidade dos domínios extracelulares como nas relações filogenéticas entre os domínios de quinase de membros da subfamília (Shiu & Bleecker (2001) Proc Natl Acad Sc USA 98(19): 10763-10768). A subfamília LRR XI compreende um dos LRR-RLK mais estudados, ClavataI (CLV1; Leyser et al., (2002) Development 116:397-403), envolvido no controle de tamanho de parte aérea, inflorescência, e meristema floral.

O meristema apical de parte aérea pode iniciar órgãos e meristemas secundários ao longo da vida de uma planta. Algumas células localizadas na zona central do meristema atuam como células-tronco pluripotentes. Elas se dividem lentamente, com isso deslocando células filhas para a periferia onde elas eventualmente se tornam incorporadas em primórdios de órgãos e se diferenciam. A manutenção de um meristema funcional requer coordenação entre a perda de células-tronco do meristema através de diferenciação e substituição de células através de divisão. Em Arabidopsis, os genes de Clavata (CLV1, CLV2, e CLV3) podem desempenhar um papel crítico neste processo, limitando o tamanho do conjunto de células-tronco nestes meristemas.

Clavatal mutantes foram identificados em Arabidopsis (Leyser et al. veja acima; Clark et al., (1993) Development 119: 397-418; Diévart et al., (2003) Plant Cell 15: 1198-1211), em arroz (Suzaki et al., (2004) Development 131: 5649-5657), e em milho (Bommert et al., (2004) Development 132: 1235-1245). Todos os mutantes presentes em alargamento dos meristemas aéreos de todos os tipos (vegetativo, inflorescência, floral) devido à acumulação ectópica de células-tronco, freqüentemente levando a filotaxia anormal, fasciação de inflorescência e órgãos extraflorais e verticilos. Esta severidade fenotípica varia entre os diferentes mutantes de Arabidopsis, os alelos mais fracos apresentando apenas um pequeno aumento em número de células-tronco, ao passo que os alelos mais fortes têm mais do que 1000 vezes mais células-tronco comparados com o tipo selvagem (Dievart et al., (2004) supra). O número de carpelos formados por flor e o grau de crescimento dos verticilos ectópicos são indicadores sensíveis de severidade de mutante clvl (Clarke et al., (1993) Development 119: 397-418). Dois mutantes fracos de Arabidopsis, clvl-6 e clvl-7, contêm lesões depois do domínio transmembrana, deixando a possibilidade de que os polipeptídeos que estes alelos codificam sejam na verdade expressos e localizados na membrana plasmática (Clarke et al., (1993) supra). Plantas transgênicas de Arabidopsis expressando a seqüência

de ácido nucleico codificando o polipeptídeo CLVl de comprimento completo sob o controle do promotor ERECTA (ER; para ampla expressão dentro dos meristemas e primórdio de órgão em desenvolvimento) não apresentam um meristema rompido (Clarke et al., (1993) supra). Patente Norte-Americana concedida 5.859.338 sustenta uma seqüência de ácido nucleico isolado codificando uma proteína Clavatal, e seqüências modificadas de ácidos nucleicos codificando uma proteína Clavatal modificada, e descreve vetores de expressão compreendendo as seqüências isoladas de ácidos nucleicos mencionadas acima, e plantas e células de planta compreendendo as seqüências isoladas de ácidos nucleicos mencionadas acima. Definições

Polipeptídeo(s)/Proteína(s) Os termos "polipeptídeo" e "proteína" são usados

permutavelmente neste lugar e se referem a aminoácidos em uma forma polimérica de qualquer comprimento, unidos por ligações peptídicas. Polinucleotídeo(sVÁcido(s) nucleicofsVSeqüênciafs) de ácidos nucleicos/seqüênciafs) de nucleotídeos Os termos "polinucleotídeo(s)", "seqüência(s) de ácidos

nucleicos", "seqüência(s) de nucleotídeos", "ácido(s) nucleico(s)", "molécula de ácido nucleico" são usados permutavelmente neste lugar e se referem a nucleotídeos, ou ribonucleotídeos ou desoxirribonucleotídeos ou uma combinação de ambos, em uma forma polimérica não ramificada de qualquer comprimento.

Seqüência de codificação

Uma "seqüência de codificação" é uma seqüência de ácido nucleico, que é transcrita em mRNA e/ou traduzida em um polipeptídeo quando colocada sob o controle de seqüências reguladoras apropriadas. Os limites da seqüência de codificação são determinados por um códon de início de tradução no término 5' e um códon de parada de tradução no término 3'. Uma seqüência de codificação pode incluir, mas não é limitada a mRNA, cDNA, seqüências de ácidos nucleicos recombinantes ou DNA genômico, quer com ou sem. Plantais) de controle

A escolha de plantas de controle adequadas é uma parte de rotina de uma estrutura experimental e pode incluir plantas tipo selvagem correspondentes ou plantas correspondentes sem o gene de interesse. A planta de controle é tipicamente da mesma espécie de planta ou mesmo da mesma variedade do que a planta a ser verificada. A planta de controle também pode ser um nulizigoto da planta a ser verificada. Nulizigotos são indivíduos carecendo do transgene por segregação. Uma "planta de controle" como usado neste lugar se refere não apenas a plantas inteiras, mas também a partes de planta, incluindo sementes e partes de sementes. Homólogo(s)

"Homólogos" de uma proteína abrangem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácidos em relação à proteína não modificada em questão e tendo atividade biológica e funcional similar à proteína não modificada da qual eles são derivados.

Uma deleção se refere à remoção de um ou mais aminoácidos de uma proteína.

Uma inserção se refere a um ou mais resíduos de aminoácidos sendo introduzidos em um sítio pré-determinado em uma proteína. Inserções podem compreender fusões N-terminais e/ou C-terminais assim como inserções intra-seqüência de aminoácidos únicos ou múltiplos. Geralmente, inserções dentro da seqüência de aminoácidos serão menores do que fusões N- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos de proteínas ou peptídeos de fusão N- ou C-terminais incluem o domínio de ligação ou domínio de ativação de um ativador transcricional como usado no sistema de dois híbridos de levedura, proteínas de revestimento de fago, etiqueta de (histidina)-ó, etiqueta de glutationa S-transferase, proteína A, proteína de ligação de maltose, dihidrofolato redutase, epítopo Etiqueta· 100, epítopo c-myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligação calmodulina), epítopo HA, epítopo de proteína C e epítopo VSV.

Uma substituição se refere à substituição de aminoácidos da proteína por outros aminoácidos tendo propriedades similares (tal como hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou quebrar estruturas α-helicoidais ou estruturas de folha β). Substituições de aminoácidos tipicamente são de resíduos únicos, mas podem ser agrupadas dependendo de restrições funcionais colocadas no polipeptídeo; inserções normalmente serão da ordem de cerca de 1 a 10 resíduos de aminoácidos. As substituições de aminoácidos são preferivelmente as substituições de aminoácidos conservativas. Tabelas de Substituição Conservativa são bem conhecidas na arte (veja, por exemplo, Creighton (1984) Proteins. W.H. Freeman and Company e Tabela 1 abaixo).

Tabela 1: Exemplos de substituições conservadas de aminoácidos

Resíduo Substituições Conservativas Resíduo Substituições Conservativas Ala Ser Leu lie; Val Arg Lys Lys Arg; Gln Asn Gln; His Met Leu; Ile Asp Glu Phe Met; Leu; Tyr GIn Asn Ser Thr; Gly Cys Ser Thr Ser; Val Glu Asp Trp Tyr Gly Pro Tyr Trp; Phe His Asn; Gln Val lie; Leu Ile Leu, Val

Substituições, deleções e/ou inserções de aminoácidos podem

ser prontamente feitas usando técnicas de peptídeo sintético bem conhecidas na arte, tal como síntese de peptídeo em fase sólida e os semelhantes, ou por manipulação de DNA recombinante. Métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na arte. Por exemplo, técnicas para fazer mutações por substituição em sítios pré-determinados em DNA são bem conhecidas por aqueles versados na arte e incluem mutagênese M13, mutagênese in vitro T7-Gen (USB, Cleveland, OH), mutagênese dirigida por sítio QuickChange (Stratagene, San Diego, CA), mutagênese dirigida por sítio mediada por PCR ou outros protocolos de mutagênese dirigida por sítio. Derivados

"Derivados" incluem peptídeos, oligopeptídeos, polipeptídeos que, comparados com a seqüência de aminoácidos da forma naturalmente ocorrente da proteína, tal como a proteína de interesse, podem compreender substituições de aminoácidos com resíduos de aminoácidos não naturalmente ocorrentes, ou adições de resíduos de aminoácidos não naturalmente ocorrentes. "Derivados" de uma proteína também abrangem peptídeos, oligopeptídeos, polipeptídeos que compreendem resíduos de aminoácidos naturalmente ocorrentes alterados (glicosilados, acilados, prenilados, fosforilados, miristoilados, sulfatados etc.) ou resíduos de aminoácidos não naturalmente alterados comparado com a seqüência de aminoácidos de uma forma naturalmente ocorrente do polipeptídeo. Um derivado também pode compreender um ou mais substituintes ou adições de não aminoácidos comparado com a seqüência de aminoácidos da qual ele é derivado, por exemplo, uma molécula repórter ou outro ligante, covalentemente ou não covalentemente ligado à seqüência de aminoácidos, tal como uma molécula repórter que é ligada para facilitar sua detecção, e resíduos de aminoácidos não naturalmente ocorrentes em relação à seqüência de aminoácidos de uma proteína não naturalmente ocorrente. Além disso, "derivados" também incluem fusões da forma naturalmente ocorrente da proteína com peptídeos de identificação tal como FLAG, HIS6 ou tiorredoxina (para uma revisão de peptídeos de identificação, veja Terpe, Appl. Microbiol. Biotechnol. 60, 523- 533,2003).

Ortólogo(s)/Parálogo(s)

Ortólogos e parálogos abrangem conceitos evolutivos usados para descrever as relações ancestrais de genes. Parálogos são genes dentro da mesma espécie que se originaram através de duplicação de um gene ancestral; ortólogos são genes de organismos diferentes que se originaram através de especiação, e também são derivados de um gene ancestral comum. Domínio

O termo "domínio" se refere a um conjunto de aminoácidos conservados em posições específicas ao longo de um alinhamento de seqüências de proteínas evolutivamente relacionadas. Enquanto que aminoácidos em outras posições podem variar entre homólogos, aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que provavelmente são essenciais na estrutura, estabilidade ou função de uma proteína. Identificados por seu alto grau de conservação em seqüências alinhadas de uma família de homólogos de proteína, eles podem ser usados como identificadores para determinar se qualquer polipeptídeo em questão pertence a uma família de polipeptídeo previamente identificada. Motivo/Seqüência consenso/Assinatura O termo "motivo" ou "seqüência consenso" ou "assinatura" se

refere a uma região conservada curta na seqüência de proteínas evolutivamente relacionadas. Motivos freqüentemente são partes altamente conservadas de domínios, mas também podem incluir apenas parte do domínio, ou estarem localizados fora de domínio conservado (se todos os aminoácidos do motivo caem fora de um domínio definido). Hibridização

O termo "hibridização" como definido neste lugar é um processo caracterizado pelo fato de que seqüências de nucleotídeos complementares substancialmente homólogas se anelam uma a outra. O processo de hibridização pode ocorrer inteiramente em solução, i.e. ambos os ácidos nucleicos complementares estão em solução. O processo de hibridização também pode ocorrer com um dos ácidos nucleicos complementares imobilizado a uma matriz tal como microesferas magnéticas, microesferas de Sepharose ou qualquer outra resina. O processo de hibridização, além disso, pode ocorrer com um dos ácidos nucleicos complementares imobilizado a um suporte sólido tal como uma membrana de nitrocelulose ou de náilon ou imobilizado por e.g. fotolitografia a, por exemplo, um suporte de vidro silicioso (o último conhecido como arranjos ou microarranjos de ácido nucleico ou como chips de ácido nucleico). A fim de permitir que hibridização ocorra, as moléculas de ácidos nucleicos geralmente são termicamente ou quimicamente desnaturadas para derreter uma dupla fita em duas fitas simples e/ou para remover estruturas em grampo ou outras estruturas secundárias de ácidos nucleicos de fita simples. O termo "estringência" se refere às condições nas quais uma

hibridização ocorre. A estringência de hibridização é influenciada por condições tal como temperatura, concentração salina, força iônica e composição de tampão de hibridização. Geralmente, condições de baixa estringência são selecionadas para ser cerca de 3 0°C menores do que o ponto de fusão térmica (Tm) para a seqüência específica em uma força iônica e pH definidos. Condições de média estringência são quando a temperatura é 20°C abaixo de Tm, e condições de alta estringência são quando a temperatura é 10°C abaixo de Tm. Condições de hibridização de alta estringência tipicamente são usadas para isolar seqüências hibridizantes que têm alta similaridade de seqüência com a seqüência de ácido nucleico alvo. Entretanto, ácidos nucleicos podem desviar em seqüência e ainda codificar um polipeptídeo substancialmente idêntico, devido à degenerescência do código genético. Portanto condições de hibridização de média estringência podem ser algumas vezes necessárias para identificar tais moléculas de ácidos nucleicos. A Tm é a temperatura em força iônica e pH definidos, na qual

50% da seqüência alvo hibridiza com uma sonda perfeitamente compatível. A Tm é dependente das condições de solução e da composição de base e comprimento da sonda. Por exemplo, seqüências maiores hibridizam especificamente em temperaturas superiores. A taxa máxima de hibridização é obtida a partir de cerca de 16°C até 32°C abaixo de Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre as duas fitas de ácidos nucleicos com isso promovendo formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4M (para concentrações maiores, este efeito pode ser ignorado). Formamida reduz a temperatura de fusão de duplexos DNA-DNA e DNA-RNA com 0,6 a 0,7°C para cada formamida percentual, e adição de 50% de formamida permite que hibridização seja realizada a 30 a 45°C, embora a taxa de hibridização seja diminuída. Pareamento incorreto de bases reduz a taxa de hibridização e a estabilidade térmica dos duplexos. Em média e para sondas grandes, a Tm diminui cerca de 1°C por % de pareamento incorreto de bases. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:

1) Híbridos de DNA-DNA (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):

Tm= 81,5°C + 16,6xlogio[Na+]a + 0,41x%[G/Cb] - SOOx^]"1 - 0,6 lx% formamida

2) Híbridos de DNA-RNA ou RNA-RNA:

Tm= 79,8 + 18,5 (logio[Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2

- 820/Lc

3) Híbridos de oligo-DNA ou oligo-RNAd:

Para <20 nucleotídeos: Tm= 2 (In)

Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)

a ou para outro cátion monovalente, mas apenas acurado no intervalo 0,01-0,4 M.

b apenas acurado para %GC no intervalo de 30% a 75%.

0 L = comprimento de duplex em pares de bases.

d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador = 2x(no. de G/C)+(no. de A/T).

Ligação não específica pode ser controlada usando qualquer uma das diversas técnicas conhecidas tal como, por exemplo, bloqueando a membrana com soluções contendo proteína, adições de RNA, DNA, e SDS heterólogo ao tampão de hibridização, e tratamento com Rnase. Para sondas não homólogas, uma série de hibridizações podem ser realizadas variando um de (i) diminuindo progressivamente a temperatura de anelamento (por exemplo, de 68°C para 42°C) ou (ii) diminuindo progressivamente a concentração de formamida (por exemplo, de 50% para 0%). O artesão versado está ciente de vários parâmetros que podem ser alterados durante hibridização e que irão ou manter ou mudar as condições de estringência. Além das condições de hibridização, especificidade de

hibridização tipicamente também depende da função de lavagens pós hibridização. Para remover antecedentes resultando de hibridização não específica, amostras são lavadas com soluções salinas diluídas. Fatores críticos de tais lavagens incluem a força iônica e temperatura da solução de lavagem final: quanto menor a concentração salina e maior a temperatura de lavagem, maior é a estringência da lavagem. Condições de lavagem são tipicamente realizadas em ou abaixo de estringência de hibridização. Uma hibridização positiva gera um sinal que é pelo menos duas vezes aquele do antecedente. Geralmente, condições estringentes adequadas para ensaios de hibridização de ácidos nucleicos ou procedimentos de detecção de amplificação de gene são como apresentados acima. Condições mais ou menos estringentes também podem ser selecionadas. O artesão versado está ciente de vários parâmetros que podem ser alterados durante lavagem e que irão ou manter ou mudar as condições de estringência. Por exemplo, condições de hibridização de alta estringência

típicas para híbridos de DNA maiores do que 50 nucleotídeos abrangem hibridização a 65°C em Ix SSC ou a 42°C em Ix SSC e 50% formamida, seguido por lavagem a 65°C em 0,3x SSC. Exemplos de condições de hibridização de média estringência para híbridos de DNA maiores do que 50 nucleotídeos abrangem hibridização a 50°C em 4x SSC ou a 40°C em 6x SSC e 50% fonnamida, seguido por lavagem a 50°C em 2x SSC. O comprimento do híbrido é o comprimento antecipado para o ácido nucleico hibridizante. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento de híbrido pode ser determinado alinhando as seqüências e identificando as regiões conservadas descritas neste lugar. IxSSC é 0,15M de NaCl e 15mM de citrato de sódio; a solução de hibridização e soluções de lavagem podem incluir adicionalmente 5 χ de reagente de Denhardt, 0,5-1,0% de SDS, 100 μg/ml de DNA de esperma de salmão fragmentado desnaturado, 0,5% de piro fosfato de sódio.

Para os propósitos de definir o nível de estringência, referência pode ser feita a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York ou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 e atualizações anuais). Variante de união

O termo "variante de união" como usado neste lugar abrange variantes de uma seqüência de ácido nucleico nas quais íntrons e/ou éxons selecionados foram cortados, substituídos, deslocados ou adicionados, ou nas quais íntrons foram encurtados ou alongados. Tais variantes serão umas nas quais a atividade biológica da proteína é substancialmente mantida; isto pode ser atingido mantendo seletivamente segmentos funcionais da proteína. Tais variantes de união podem ser encontradas na natureza ou podem ser feitas pelo homem. Métodos para predizer e isolar tais variantes de união são bem conhecidos na arte (veja, por exemplo, Foissac and Schiex, BMC Bioinformatics. 2005; 6: 25). Variante alélica

Alelos ou variantes alélicas são formas alternativas de um dado gene, localizados na mesma posição cromossômica. Variantes alélicas abrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos. Embaralhamento de gene/Evolução dirigida

Embaralhamento de gene ou evolução dirigida consiste de repetições de embaralhamento de DNA seguido por triagem e/ou seleção apropriada para gerar variantes de ácidos nucleicos ou porções destes codificando proteínas tendo uma atividade biológica modificada (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).

Elemento regulador/Seqüência de controle/Promotor

Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e devem ser adotados em um amplo contexto para se referir a seqüências reguladoras de ácidos nucleicos capazes de efetuar expressão das seqüências aos quais eles são ligados. Seqüências de controle podem ser promotores, acentuadores, silenciadores, seqüências intrônicas, regiões 3'UTR e/ou 5'UTR e/ou elementos estabilizantes de RNA.

O termo "promotor" tipicamente se refere a uma seqüência de controle de ácido nucleico localizada antes do início transcricional de um gene e que está envolvida em reconhecimento e ligação de RNA polimerase e outras proteínas, com isso dirigindo transcrição de um ácido nucleico operacionalmente ligado. Abrangidas pelos termos mencionados acima são seqüências reguladoras transcricionais derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para iniciação acurada de transcrição, com ou sem uma seqüência de caixa CCAAT) e elementos reguladores adicionais (i.e. seqüências situadas acima dos promotores gênicos, acentuadores e silenciadores) que alteram expressão gênica em resposta a desenvolvimento e/ou estímulos externos, ou de uma maneira tecido específica. Também incluída dentro do termo é uma seqüência reguladora transcricional de um gene procariótico clássico, em cujo caso ela pode incluir uma seqüência de caixa -35 e/ou seqüências reguladoras transcricionais de caixa -10. O termo "elemento regulador" também abrange uma molécula de fusão sintética ou derivado que confere, ativa ou acentua expressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.

Um "promotor de planta" compreende elementos reguladores, que mediam a expressão de um segmento de seqüência de codificação em células de planta. Por conseguinte, um promotor de planta não precisa ser de origem de planta, mas pode se originar de vírus ou microorganismos, por exemplo, de vírus que atacam células de planta. O "promotor de planta" também pode se originar de uma célula de planta, e.g. da planta que é transformada com a seqüência de ácido nucleico a ser expressa no processo inventivo e descrito neste lugar. Isto também se aplica a outros sinais reguladores "de planta", tal como terminadores "de planta". Os promotores antes das seqüências de nucleotídeos úteis nos métodos da presente invenção podem ser modificados por uma ou mais substituição(ões), inserção(ões) e/ou deleção(ões) de nucleotídeos sem interferir na funcionalidade ou atividade de qualquer dos promotores, o quadro aberto de leitura (ORF) ou a região reguladora 3' tal como terminadores ou outras regiões reguladoras 3' que estão localizadas fora do ORF. Além disso, é possível que a atividade dos promotores seja aumentada por modificação de sua seqüência, ou que eles sejam completamente substituídos por promotores mais ativos, mesmo promotores de organismos heterólogos. Para expressão em plantas, a molécula de ácido nucleico, como descrito acima, deve ser operacionalmente ligada a ou compreender um promotor adequado que expressa o gene no momento certo e com o padrão de expressão espacial requerido. Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como rRNA de 18S, usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por "promotor fraco" é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por "nível baixo" é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos a cerca de 1/500.0000 transcritos por célula. Inversamente, um "promotor forte" dirige expressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1.000 transcritos por célula. Operacionalmente ligado

O termo "operacionalmente ligado" como usado neste lugar se refere a uma ligação funcional entre a seqüência de promotor e o gene de interesse, de forma que a seqüência de promotor é capaz de iniciar transcrição do gene de interesse. Promotor constitutivo

Um "promotor constitutivo" se refere a um promotor que é transcricionalmente ativo durante a maioria, mas não necessariamente todas, fases de crescimento e desenvolvimento e na maioria das condições ambientais, em pelo menos uma célula, tecido ou órgão. Tabela 2 abaixo fornece exemplos de promotores constitutivos.

Tabela 2a: Exemplos de promotores constitutivos

Fonte Gênica Referência Actina McElroy et al, Plant Cell, 2: 163-171, 1990 HMGP Patente Internacional 2004/070039 CAMV 35S Odell et al, Nature, 313:810-812, 1985 CaMV 19S Nilsson et al., Physiol. Plant. 100:456-462, 1997 GOS2 de Pater et al, Plant J Nov;2(6):837-44, 1992, Patente Internacional 2004/065596 Ubiquitina Christensen et al, Plant Mol. Biof 18: 675-689, 1992 Cielofilina de arroz Buchholz et al, Plant Mol Biol. 25(5): 837-43, 1994 Histona H3 de milho Lepetit et al, Mof Gen. Genet. 231:276-285, 1992 Histona H3 de alfafa Wu et al. Plant Mof Biol. 11:641 -649, 1988 Aetina 2 Anetaf Plant J. 10(1); 107-121, 1996 34S FMV Sanger et af, Plant. Mof Biol., 14, 1990: 433-443 Subunidade pequena de rubisco Patente Norte-Americana 4.962.028 OCS Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553 SADl Jain et af, Crop Science, 39 (6), 1999: 1696 SAD2 Jain et af, Crop Science, 39 (6), 1999: 1696 nos Shaw et af (1984) Nucleic Acids Res. 12(20):7831-7846 V-ATPase Patente Internacional 01/14572 Super promotor Patente Internacional 95/14098 Proteínas G-box Patente Internacional 94/12015

Promotor ubíquo

Um promotor ubíquo é ativo em substancialmente todos os

tecidos ou células de um organismo.

Promotor regulado por desenvolvimento

Um promotor regulado por desenvolvimento é ativo durante certos estágios de desenvolvimento ou em partes da planta que passam por mudanças evolutivas. Promotor induzível

Um promotor induzível tem início de transcrição induzido ou 10

15

aumentado em resposta a um estímulo químico (para uma revisão veja Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental ou físico, ou pode ser "induzível por estresse", i.e. ativado quando uma planta é exposta a várias condições de estresse, ou um "induzível por patógeno" i.e. ativado quando uma planta é exposta à exposição a vários patógenos. Promotor Órgão específico/Tecido específico

Um promotor órgão específico ou tecido específico é um que é capaz de iniciar preferencialmente transcrição em certos órgãos ou tecidos, tal como as folhas, raízes, tecido de semente etc. Por exemplo, um "promotor raiz específico" é um promotor que é transcricionalmente ativo predominantemente em raízes de planta, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta. Promotores capaz de iniciar transcrição em certas células apenas são referidos neste lugar como "célula específicos".

Exemplos de promotores raiz específicos são listados em Tabela 2b abaixo:

Tabela 2b: Exemplos de promotores raiz específicos _

Fonte Gênica

RCc3

Arabidopsis PHT1

Referência

Plant Mol Biol. 1995 Jan;27(2):237-48

Kovama et ai., 2005; Mudge et al. (2002, Plant J. 31:341)

Transportador de fosfato de Medicago

Xiao et al., 2006

Arabidopsis PyklO

Nitz et al. (2001) Plant Sci 161(2): 337-346

Genes exprimíveis em raiz

Gene induzível por auxina de tabaco

Tingey et al., EMBO J. 6: 1, 1987.

Van der Zaal et al., Plant Mol. Biol. 16, 983, 1991.

β-tubulina

Genes específicos de raiz de tabaco

Oppenheimer, et al., Gene 63: 87, 1988.

Conkling, et al., Plant Physiol. 93: 1203, 1990.

Gene Gl-3b de B. napus

Patente Norte-Americana No. 5.401.836

SbPRPl

Suzuki et al., Plant Mol. Biol. 21: 109-119, 1993.

LRXl

Baumberger et al. 2001, Genes & Dev. 15:1128

BTG-26 de Brassica napus

Patente Norte-Americana 20050044585

LeAMTl (tomate)

Lauter et al. (1996, PNAS 3:8139)

TheLeNRTl-I (tomate)

Lauter et al. (1996, PNAS 3:8139)

Gene de patatina classe I (batata) KDC1 (Daucus carota)_

Liu et al., Plant Mol. Biol. 153:386-395, 1991.

Downey et al. (2000, J. Biol. Chem. 275:39420)

Gene TobRB7

W Song (1997) PhD Thesis, North Carolina State University, Raleigh, NC USA_

OsRAB5a (arroz)

Wang et al. 2002, Plant Sei. 163:273

ALF5 (Arabidopsis)

Diener et al. (2001, Plant Cell 13:1625)

NRT2;lNp (N. plumbaginifolia)

Quesada et al. (1997, Plant Mol. Biol. 34:265) Um promotor semente específico é transcricionalmente ativo predominantemente em tecido de semente, mas não necessariamente em tecido de semente (em casos de expressão evasiva). O promotor semente específico pode estar ativo durante desenvolvimento de semente e/ou durante germinação. O promotor semente específico pode ser endosperma e/ou aleurona e/ou embrião específico. Exemplos de promotores semente específicos (endosperma/aleurona/embrião específicos) são mostrados em Tabelas 2c-f abaixo. Exemplos adicionais de promotores semente específicos são dados em Qing Qu e Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004), cuja descrição é incorporada por referência neste lugar como se completamente apresentada.

Tabela 2c: Exemplos de promotores semente específicos

Fonte Gênica Referência Genes semente específicos Simon et al., Plant Mol. Biol. 5: 191, 1985; Scofield et al., J. Biol. Chem. 262: 12202, 1987.; Baszczynski et al., Plant Mol. Biol. 14: 633, 1990. Albumina de castanha do Pará Pearson et al., Plant Mol. Biol. 18: 235-245, 1992. legumina Ellis et al., Plant Mol. Biol. 10: 203-214, 1988. glutelina (arroz) Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986; Takaiwa et al., FEBS Letts. 221: 43-47, 1987. zeína Matzke et al Plant Mol Biol, 14(3):323-32 1990 napA Stalberg et al, Planta 199: 515-519, 1996. LMW e HMW glutenina-1 de trigo Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989 SPA de trigo Albani et al, Plant Cell, 9: 171-184, 1997 a, β, γ-gliadinas de trigo EMBO J. 3:1409-15, 1984 Promotor Itrl de cevada Diaz et al. (1995) Mol Gen Genet 248(5):592-8 Hordeína B1, C, D de cevada Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996 DOF de cevada Mena et al, The Plant Journal, 116(1): 53-62, 1998 blz2 Patente Européia 99106056.7 Promotor sintético Vicente-Carbajosaetal., Plant J. 13: 629-640, 1998. prolamina NRP33 de arroz Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 a-globulina Glb-I de arroz Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 OSHl de arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117-8122, 1996 α-globulina REB/OHP-1 de arroz Nakase et al. Plant Mol. Biol. 33: 513-522, 1997 ADP-glicose pirofosforilase de arroz Trans Res 6:157-68, 1997 Família gênica ESR de milho PlantJ 12:235-46, 1997 α-cafirina de sorgo DeRose et al., Plant Mol. Biol 32:1029-35, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 Oleosina de arroz Wu et al, J. Biochem. 123:386, 1998 Oleosina de girassol Cummins et al., Plant Mol. Biol. 19: 873-876, 1992 PROOl 17, proteína ribossômica 40 S putativa de arroz Patente Internacional 2004/070039 PROO136, alanina aminotransferase de arroz Não publicado PROO147, inibidor de tripsina ITRl (cevada) Não publicado PROO151, WSI18 de arroz Patente Internacional 2004/070039 PROO175, RAB21 de arroz Patente Internacional 2004/070039 PR0005 Patente Internacional 2004/070039 PR00095 Patente Internacional 2004/070039 α-amilase (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Aead Sci USA 88:7266-7270, 1991 Gene de catepsina tipo β Cejudo et al, Plant Mol Biol 20:849-856, 1992 Ltp2 de cevada Kalla et al., Plant J. 6:849-60, 1994 Chi26 Leah et al., Plant J. 4:579-89, 1994 B-Peru de milho Selingeretal., Genetics 149;1125-38,1998

Tabela 2d: Exemplos de promotores endosperma específicos:

Fonte Gênica

Referência

glutelina (arroz)

Takaiwa et al. (1986) Mol Gen Genet 208:15-22; Takaiwa et al. (1987) FEBS Letts. 221:43-47

zeina

Matzke etal., (1990) PlantMol Biol 14(3): 323-32

LMW e HMW glutenina-1 de trigo_

Colot et al. (1989) Mol Gen Genet 216:81-90, Anderson et al. (1989) NAR 17:461-2_

SPA de trigo

Albani et al. (1997) Plant Cell 9:171-184

gliadinas de trigo

Rafalski et al. (1984) EMBO 3:1409-15

promotor Itrl de cevada

Diaz et al. (1995) Mol Gen Genet 248(5):592-8

Hordeína B1, C, D de cevada

Cho et al. (1999) Theor Appl Genet 98:1253-62; Muller et al. (1993) Plant J 4:343-55; Sorenson et al. (1996) Mol Gen Genet 250:750-60_

DOF de cevada

Mena etal, (1998) PlantJ 116(1): 53-62

blz2

Onate et al. (1999) J Biol Chem 274(14):9175-82

Promotor sintético

Vicente-Carbajosa et al. (1998) Plant J 13:629-640

prolamina NRP33 de arroz

Wu et al, (1998) Plant Cell Physiol 39(8) 885-889

globulina Glb-I de arroz

Wu et al. (1998) Plant Cell Physiol 39(8) 885-889

globulina REB/OHP-1 de arroz

ADP-glicose pirofosforilase de arroz

Nakase etal. (1997) PlantMolec Biol 33: 513-522

Família gênica ESR de milho

Russell et al. (1997) Trans Res 6:157-68

cafirina de sorgo

Opsahl-Ferstad et al. (1997) Plant J 12:235-46

DeRose etal. (1996) PlantMol Biol 32:1029-35

Tabela 2e: Exemplos de promotores embrião específicos:

Fonte Gênica Referência OSHl de arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117-8122, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 PROOl 51 Patente Internacional 2004/070039 PROO175 Patente Internacional 2004/070039 PR0005 Patente Internacional 2004/070039 PR00095 Patente Internacional 2004/070039

Tabela 2f: Exemplos de promotores aleurona específicos:

Fonte Gênica Referência α-amilase (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 Gene de catepsina tipo β Cejudo et al, PIant Mol Biol 20:849-856, 1992 Ltp2 de cevada Kalla et al., PIant J. 6:849-60, 1994 Chi26 Leahetal., Plant J. 4:579-89, 1994 B-Peru de milho Selinger et al., Genetics 149;1125-38,1998 Um promotor tecido verde específico como definido neste lugar é um promotor que é transcricionalmente ativo predominantemente em tecido verde, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta.

Exemplos de promotores tecido verde específicos que podem ser usados para realizar os métodos da invenção são mostrados em Tabela 2g abaixo.

Tabela 2g: Exemplos de promotores tecido verde específicos

Gene Expressão Referência Ortofosfato diquinase de milho Folha específica Fukavama et al., 2001 Fosfoenolpiruvato carboxilase de milho Folha específica Kausch et al., 2001 Fosfoenolpiruvato carboxilase de arroz Folha específica Liu et al., 2003 Rubisco de subunidade pequena de arroz Folha específica Nomura et al., 2000 beta expansina EXBP9 de arroz Parte aérea específica Patente Internacional 2004/070039 Rubisco de subunidade pequena de guandu Folha específica Panguluri et al., 2005 RBCS3A de ervilha Folha específica

Outro exemplo de um promotor tecido específico é um

promotor meristema específico, que é transcricionalmente ativo predominantemente em tecido meristemático, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta.

Exemplos de promotores meristema verde específicos que podem ser usados para realizar os métodos da invenção são mostrados em Tabela 2h abaixo. Tabela 2h: Exemplos de promotores meristema específicos

Fonte gênica Padrão de expressão Referência OSHl de arroz Meristema apical de parte aérea, de estágio de embrião globular até estágio de plântula Sato et al. (1996) Proc. Natl. Acad. Sei. USA, 93: 8117-8122 Metalotioneína de arroz Meristema específica BAD87835.1 WAKl & WAK 2 Meristemas apicais de partes aéreas e raízes, e em folhas em expansão e sépalas Wagner & Kohorn (2001) Plant Cell 13(2): 303-318

Terminador

O termo "terminador" abrange uma seqüência de controle que é uma seqüência de DNA na extremidade de uma unidade transcricional que sinaliza processamento 3' e poliadenilação de um transcrito primário e término de transcrição. O terminador pode ser derivado do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. O terminador a ser adicionado pode ser derivado, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico. Modulação

O termo "modulação" significa em relação à expressão ou expressão gênica, um processo no qual o nível de expressão é alterado por expressão gênica em comparação com a planta de controle, o nível de expressão é aumentado pode ser aumentado ou diminuído. A expressão original não modulada pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com subseqüente tradução. O termo "modular a atividade" deve significar qualquer mudança da expressão das seqüências de ácidos nucleicos inventivas ou proteínas codificadas, que leva ao rendimento aumentado e/ou crescimento aumentado das plantas. Expressão

O termo "expressão" ou "expressão gênica" significa a transcrição de um gene específico ou genes específicos ou construções genéticas específicas. O termo "expressão" ou "expressão gênica" em particular significa a transcrição de um gene ou genes ou construção genética em RNA estrutural (rRNA, tRNA) ou mRNA com ou sem subseqüente tradução do ultimo em uma proteína. O processo inclui transcrição de DNA e processamento do produto de mRNA resultante. Expressão aumentada/superexpressão

O termo "expressão aumentada" ou "superexpressão" como usado neste lugar significa qualquer forma de expressão que é adicional ao nível de expressão original de tipo selvagem.

Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou acentuadores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico codificando o polipeptídeo de interesse. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula de planta na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida (UTR) ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de expressão de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral veja: The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

Gene endógeno

Referência neste lugar a um gene "endógeno" se refere não apenas ao gene em questão como encontrado em uma planta em sua forma natural (i.e., sem haver qualquer intervenção humana), mas também se refere ao mesmo gene (ou um ácido nucleico/gene substancialmente homólogo) em uma forma isolada subseqüentemente (re)introduzido em uma planta (um transgene). Por exemplo, uma planta transgênica contendo um tal transgene pode confrontar uma redução substancial da expressão de transgene e/ou redução substancial de expressão do gene endógeno. O gene isolado pode ser isolado de um organismo ou pode ser fabricado pelo homem, por exemplo, por síntese química. Expressão diminuída

Referência neste lugar a "expressão diminuída" ou "redução ou eliminação substancial" de expressão é adotada para significar uma diminuição em expressão de gene endógeno e/ou níveis de polipeptídeo e/ou atividade de polipeptídeo em relação às plantas de controle. A redução ou eliminação substancial é em ordem crescente de preferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%, 80%, 85%, 90%, ou 95%, 96%, 97%, 98%, 99% ou mais reduzida comparada com aquela de plantas de controle.

Para a redução ou eliminação substancial de expressão um gene endógeno em uma planta, um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácido nucleico é requerido. A fim de realizar silenciamento gênico, isto pode ser tão pouco quanto 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 ou menos nucleotídeos, alternativamente isto pode ser tanto quanto o gene inteiro (incluindo a 5' e/ou 3' UTR, ou em parte ou inteira). O trecho de nucleotídeos substancialmente contíguos pode ser derivado do ácido nucleico codificando a proteína de interesse (gene alvo), ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse. Preferivelmente, o trecho de nucleotídeos substancialmente contíguos é capaz de formar ligações de hidrogênio com o gene alvo (ou fita sentido ou antisentido), mais preferivelmente, o trecho de nucleotídeos substancialmente contíguos tem, em ordem crescente de preferência, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100%) de identidade de seqüência com o gene alvo (ou fita sentido ou antisentido). Uma seqüência de ácido nucleico codificando um polipeptídeo (funcional) não é um requerimento para os vários métodos discutidos neste lugar para a redução ou eliminação substancial de expressão de um gene endógeno.

Esta redução ou eliminação substancial de expressão pode ser atingida usando ferramentas e técnicas de rotina. Um método preferido para a redução ou eliminação substancial de expressão de gene endógeno é introduzir e expressar em uma planta uma construção genética na qual o ácido nucleico (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo de qualquer uma das proteínas de interesse) é clonado como uma repetição invertida (em parte ou completamente), separada por um espaçador (DNA não codificante).

Em um tal método preferido, expressão do gene endógeno é reduzida ou substancialmente eliminada através de silenciamento mediado por RNA usando uma repetição invertida de um ácido nucleico ou uma parte deste (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse), preferivelmente capaz de formar uma estrutura em forma de grampo. A repetição invertida é clonada em um vetor de expressão compreendendo seqüências de controle. Uma seqüência de ácido nucleico de DNA não codificante (um espaçador, por exemplo, um fragmento de região de acoplamento de matriz (MAR), um íntron, um poliligante, etc.) está localizado entre os dois ácidos nucleicos invertidos formando a repetição invertida. Depois de transcrição da repetição invertida, um RNA quimérico com uma estrutura auto-complementar é formado (parcial ou completo). Esta estrutura de RNA dupla fita é referida como o RNA em forma de grampo (hpRNA). O hpRNA é processado pela planta em siRNAs que são incorporados em um complexo de silenciamento induzido por RNA (RISC). O RISC adicionalmente cliva os transcritos de mRNA, com isso reduzindo substancialmente o número de transcritos de mRNA a serem traduzidos em polipeptídeos. Para detalhes gerais adicionais veja, por exemplo, Grierson et al. (1998) Patente Internacional 98/53083; Waterhouse et al. (1999) Patente Internacional 99/53050).

Desempenho dos métodos da invenção não se fia em introduzir e expressar em uma planta uma construção genética na qual o ácido nucleico é clonado como uma repetição invertida, mas qualquer um ou mais de diversos métodos bem conhecidos de "silenciamento gênico" podem ser usados para atingir os mesmos efeitos.

Um tal método para a redução de expressão de gene endógeno é silenciamento mediado por RNA de expressão gênica (regulação de forma negativa). Silenciamento neste caso é desencadeado em uma planta por uma seqüência de RNA dupla fita (dsRNA) que é substancialmente similar ao gene endógeno alvo. Este dsRNA é adicionalmente processado pela planta em cerca de 20 a cerca de 26 nucleotídeos chamados RNAs de interferência curtos (siRNAs). Os siRNAs são incorporados em um complexo de silenciamento induzido por RNA (RISC) que cliva o transcrito de mRNA do gene endógeno alvo, com isso reduzindo substancialmente o número de transcritos de mRNA a serem traduzidos em um polipeptídeo. Preferivelmente, a seqüência de RNA dupla fita corresponde a um gene alvo.

Outro exemplo de um método de silenciamento de RNA envolve a introdução de seqüências de ácidos nucleicos ou partes destas (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse) em uma orientação sentido em uma planta. "Orientação sentido" se refere a uma seqüência de DNA que é homóloga a um transcrito de mRNA deste. Deve ser introduzida em uma planta, portanto, pelo menos uma cópia da seqüência de ácido nucleico. A seqüência de ácido nucleico adicional irá reduzir expressão do gene endógeno, gerando um fenômeno conhecido como co-supressão. A redução de expressão gênica será mais pronunciada se diversas cópias adicionais de uma seqüência de ácido nucleico são introduzidas na planta, pois existe uma correlação positiva entre altos níveis de transcrito e o desencadeamento de co-supressão.

Outro exemplo de um método de silenciamento de RNA envolve o uso de seqüências de ácidos nucleicos antisentido. Uma seqüência de ácido nucleico "antisentido" compreende uma seqüência de nucleotídeos que é complementar a uma seqüência de ácido nucleico "sentido" codificando uma proteína, i.e. complementar à fita de codificação de uma molécula de cDNA dupla fita ou complementar a uma seqüência de transcrito de mRNA. A seqüência de ácido nucleico antisentido preferivelmente é complementar ao gene endógeno a ser silenciado. A complementaridade pode estar localizada na "região de codificação" e/ou na "região não codificante" de um gene. O termo "região de codificação" se refere a uma região da seqüência de nucleotídeos compreendendo códons que são traduzidos em resíduos de aminoácidos. O termo "região não codificante" se refere a seqüências 5' e 3' que flanqueiam a região de codificação que são transcritas, mas não traduzidas em aminoácidos (também referidas como regiões 5' e 3' não traduzidas).

Seqüências de ácidos nucleicos antisentido podem ser construídas de acordo com as regras de pareamento de bases de Watson e Crick. A seqüência de ácido nucleico antisentido pode ser complementar à seqüência de ácido nucleico inteira (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse), mas também pode ser um oligonucleotídeo que é antisentido para apenas uma parte da seqüência de ácido nucleico (incluindo a UTR 5' e 3' de mRNA). Por exemplo, a seqüência de oligonucleotídeos antisentido pode ser complementar à região circundando o sítio de início de tradução de um transcrito de mRNA codificando um polipeptídeo. O comprimento de uma seqüência de oligonucleotídeos antisentido adequada é conhecido na arte e pode começar de cerca de 50, 45, 40, 35, 30, 25, 20, 15 ou nucleotídeos de comprimento ou menos. Uma seqüência de ácido nucleico antisentido de acordo com a invenção pode ser construída usando reações de síntese química e ligação enzimática usando métodos conhecidos na arte. Por exemplo, uma seqüência de ácido nucleico antisentido (e.g., uma seqüência de oligonucleotídeos antisentido) pode ser quimicamente sintetizada usando nucleotídeos naturalmente ocorrentes ou nucleotídeos modificados de forma variada construídos para aumentar a estabilidade biológica das moléculas ou para aumentar a estabilidade física do duplex formado entre as seqüências de ácidos nucleicos antisentido e sentido, e.g., derivados de fosforotioato e nucleotídeos substituídos com acridina podem ser usados. Exemplos de nucleotídeos modificados que podem ser usados para gerar as seqüências de ácidos nucleicos antisentido são bem conhecidos na arte. Modificações conhecidas de nucleotídeos incluem metilação, ciclização e 'caps' e substituição de um ou mais dos nucleotídeos naturalmente ocorrentes por um análogo tal como inosina. Outras modificações de nucleotídeos são bem conhecidas na arte.

A seqüência de ácido nucleico antisentido pode ser produzida biologicamente usando um vetor de expressão no qual uma seqüência de ácido nucleico foi subclonada em uma orientação antisentido (i.e., RNA transcrito a partir do ácido nucleico inserido será de uma orientação antisentido para um ácido nucleico alvo de interesse). Preferivelmente, produção de seqüências de ácidos nucleicos antisentido em plantas ocorre por meio de uma construção de ácido nucleico estavelmente integrada compreendendo um promotor, um oligonucleotídeo antisentido operacionalmente ligado, e um terminador.

As moléculas de ácido nucleico usadas para silenciamento nos métodos da invenção (quer introduzidas em uma planta ou geradas in situ) hibridizam com ou se ligam a transcritos de mRNA e/ou DNA genômico codificando um polipeptídeo para com isso inibir expressão da proteína, e.g., inibindo transcrição e/ou tradução. A hibridização pode ser por complementaridade convencional de nucleotídeos para formar um duplex estável, ou, por exemplo, no caso de uma seqüência de ácido nucleico antisentido que se liga a duplexos de DNA, através de interações específicas na principal fenda da dupla hélice. Seqüências de ácidos nucleicos antisentido podem ser introduzidas em uma planta por transformação ou injeção direta em um sítio de tecido específico. Alternativamente, seqüências de ácidos nucleicos antisentido podem ser modificadas para direcionar células selecionadas e então sistemicamente administradas. Por exemplo, para administração sistêmica, seqüências de ácidos nucleicos antisentido podem ser modificadas de forma que elas se liguem especificamente a receptores ou antígenos expressos em uma superfície celular selecionada, e.g., ligando a seqüência de ácido nucleico antisentido a peptídeos ou anticorpos que se ligam a receptores ou antígenos de superfície celular. As seqüências de ácidos nucleicos antisentido também podem ser liberadas para células usando os vetores descritos neste lugar.

De acordo com um aspecto adicional, a seqüência de ácido nucleico antisentido é uma seqüência de ácido nucleico α-anomérica. Uma seqüência de ácido nucleico α-anomérica forma híbridos dupla fita específicos com RNA complementar nos quais, ao contrário das unidades b usuais, as fitas correm paralelas uma a outra (Gaultier et al. (1987) Nucl Ac Res 15: 6625-6641). A seqüência de ácido nucleico antisentido também pode compreender um 2'-o-metilribonucleotídeo (Inoue et al. (1987) Nucl Ac Res 15, 6131-6148) ou um análogo quimérico de RNA-DNA (Inoue et al. (1987) FEBS Lett. 215, 327-330).

A redução ou eliminação substancial de expressão de gene endógeno também pode ser realizada usando ribozimas. Ribozimas são moléculas catalíticas de RNA com atividade de ribonuclease que são capazes de clivar uma seqüência de ácido nucleico de fita simples, tal como um mRNA, ao qual elas têm uma região complementar. Assim, ribozimas (e.g., ribozimas cabeça-de-martelo (descritas em Haselhoff and Gerlach (1988) Nature 334, 585-591) podem ser usadas para clivar cataliticamente transcritos de mRNA codificando um polipeptídeo, com isso reduzindo substancialmente o número de transcritos de mRNA a serem traduzidos em um polipeptídeo. Uma ribozima tendo especificidade para uma seqüência de ácido nucleico pode ser construída (veja, por exemplo: Cech et al. Patente Norte-Americana No. 4.987.071; e Cech et al. Patente Norte-Americana No. 5.116.742). Alternativamente, transcritos de mRNA correspondendo a uma seqüência de ácido nucleico podem ser usados para selecionar um RNA catalítico tendo uma atividade específica de ribonuclease a partir de um conjunto de moléculas de RNA (Bartel and Szostak (1993) Science 261, 1411-1418). O uso de ribozimas para silenciamento de genes em plantas é conhecido na arte (e.g., Atkins et al. (1994) Patente Internacional 94/00012; Lenne et al. (1995) Patente Internacional 95/03404; Lutziger et al. (2000) Patente Internacional 00/00619; Prinsen et al. (1997) Patente Internacional 97/13865 e Scott et al. (1997) Patente Internacional 97/38116).

Silenciamento gênico também pode ser atingido por mutagênese por inserção (por exemplo, inserção de T-DNA ou inserção de transposon) ou por estratégias como descrito por, entre outros, Angell and Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS Patente Internacional 98/36083), ou Baulcombe (Patente Internacional 99/15682).

Silenciamento gênico também pode ocorrer se existe uma mutação em um gene endógeno e/ou uma mutação em um gene/ácido nucleico isolado subseqüentemente introduzido em uma planta. A redução ou eliminação substancial pode ser causada por um polipeptídeo não funcional. Por exemplo, o polipeptídeo pode ser ligar a várias proteínas de interação; uma ou mais mutação(ões) e/ou truncamento(s) pode(m), portanto, fornecer um polipeptídeo que ainda é capaz de se ligar a proteínas de interação (tal como proteínas receptoras), mas que não pode exibir sua função normal (tal como ligante de sinalização).

Uma abordagem adicional para silenciamento gênico é direcionar seqüências de ácidos nucleicos complementares à região reguladora do gene (e.g., o promotor e/ou acentuadores) para formar estruturas de tripla hélice que previnem transcrição do gene em células alvo. Veja Helene, C., Anticancer Drug Res. 6, 569-84, 1991; Helene et al., Ann. N.Y. Acad. Sei. 660, 27-36 1992; e Maher, L.J. Bioassays 14, 807-15, 1992.

Outros métodos, tal como o uso de anticorpos dirigidos a um polipeptídeo endógeno para inibir sua função em planta, ou interferência na via de sinalização na qual um polipeptídeo está envolvido, serão bem conhecidos por alguém versado. Em particular, pode ser contemplado que moléculas fabricadas podem ser úteis para inibir a função biológica de um polipeptídeo alvo, ou para interferir na via de sinalização na qual o polipeptídeo alvo está envolvido.

Alternativamente, um programa de triagem pode ser ajustado para identificar em uma população de planta variantes naturais de um gene, cujas variantes codificam polipeptídeos com atividade reduzida. Tais variantes naturais também podem ser usadas, por exemplo, para realizar recombinação homóloga.

MicroRNAs (miRNAs) artificiais e/ou naturais podem ser usados para nocautear expressão gênica e/ou tradução de mRNA. miRNAs endógenos são RNAs pequenos de fita simples de tipicamente 19-24 nucleotídeos de comprimento. Eles funcionam primariamente para regular expressão gênica e/ ou tradução de mRNA. A maioria de microRNAs (miRNAs) de plantas tem complementaridade perfeita ou quase perfeita com suas seqüências alvo. Entretanto, há alvos naturais com até cinco pareamentos errôneos. Eles são processados a partir de RNAs não codificantes maiores com estruturas reversas características por RNases de dupla fita específicas da família Dicer. Mediante processamento, eles são incorporados no complexo de silenciamento induzido por RNA (RISC) se ligando a seu componente principal, uma proteína Argonauta. MiRNAs servem como os componentes de especificidade de RISC, uma vez que eles pareiam bases com ácidos nucleicos alvo, principalmente mRNAs, no citoplasma. Eventos reguladores subseqüentes incluem clivagem de mRNA alvo e destruição e/ou inibição transducional. Efeitos de superexpressão de miRNA são assim freqüentemente refletidos em níveis diminuídos de mRNA de genes alvo.

MicroRNAs artificiais (amiRNAs), os quais são tipicamente de 21 nucleotídeos de comprimento, podem ser geneticamente manipulados especificamente para regular negativamente expressão gênica de um ou múltiplos genes de interesse. Determinantes de seleção de alvo de microRNA de planta são bem conhecidos na arte. Parâmetros empíricos para reconhecimento de alvo foram definidos e podem ser usados para auxiliar a concepção de amiRNAs específicos, (Schwab et al., Dev. Cell 8, 517-527, 2005). Ferramentas convenientes para concepção e geração de amiRNAs e seus precursores também estão disponíveis para o público (Schwab et al., Plant Cell 18, 1121-1133,2006).

Para desempenho ótimo, as técnicas de silenciamento gênico usadas para reduzir expressão em uma planta de um gene endógeno requerem o uso de seqüências de ácidos nucleicos de plantas monocotiledôneas para transformação de plantas monocotiledôneas, e de plantas dicotiledôneas para transformação de plantas dicotiledôneas. Preferivelmente, uma seqüência de ácido nucleico de qualquer dada espécie de planta é introduzida naquela mesma espécie. Por exemplo, uma seqüência de ácido nucleico de arroz é transformada em uma planta de arroz. Entretanto, não é um requerimento absoluto que a seqüência de ácido nucleico a ser introduzida se origine da mesma espécie de planta que a planta na qual ela será introduzida. E suficiente que exista uma homologia substancial entre o gene endógeno alvo e o ácido nucleico a ser introduzido.

São descritos acima exemplos de vários métodos para a redução ou eliminação substancial de expressão em uma planta de um gene endógeno. Uma pessoa versada na arte deve ser prontamente capaz de adaptar os métodos mencionados acima para silenciamento de forma a atingir redução de expressão de um gene endógeno em uma planta inteira ou em partes desta através do uso de um promotor apropriado, por exemplo. Marcador selecionável (geneVGene repórter

"Marcador selecionável", "gene marcador selecionável" ou "gene repórter" inclui qualquer gene que confere um fenótipo em uma célula na qual ele é expresso para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Estes genes marcadores possibilitam a identificação de uma transferência bem sucedida das moléculas de ácido nucleico através de uma série de princípios diferentes. Marcadores adequados podem ser selecionados a partir de marcadores que conferem resistência a antibiótico ou herbicida, que introduzem uma nova característica metabólica ou que permitem seleção visual. Exemplos de genes marcadores selecionáveis incluem genes conferindo resistência a antibióticos (tal como nptll que fosforila neomicina e canamicina, ou hpt, fosforilando higromicina, ou genes conferindo resistência a, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina), a herbicidas (por exemplo, bar que fornece resistência a Basta®; aroA ou gox fornecendo resistência contra glifosato, ou os genes conferindo resistência a, por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou genes que fornecem uma característica metabólica (tal como manA que permite que plantas usem manose como única fonte de carbono ou xilose isomerase para a utilização de xilose, ou marcadores antinutritivos tal como a resistência a 2- deoxiglicose). Expressão de genes marcadores visuais resulta na formação de cor (por exemplo, β-glucuronidase, GUS ou β-galactosidase com seus substratos coloridos, por exemplo, X-Gal), luminescência (tal como o sistema de luciferina/luciferase) ou fluorescência (Proteína Fluorescente Verde, GFP, e derivados deste). Esta lista representa apenas um pequeno número de possíveis marcadores. O trabalhador versado é familiar com tais marcadores. Diferentes marcadores são preferidos, dependendo do organismo e do método de seleção.

Sabe-se que mediante integração estável ou transiente de ácidos nucleicos em células de planta, apenas uma minoria das células absorve o DNA exógeno e, se desejado, o integra em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar estes integrantes, um gene codificando para um marcador selecionável (tal como aqueles descritos acima) normalmente é introduzido nas células hospedeiras junto com o gene de interesse. Estes marcadores podem ser, por exemplo, usados em mutantes nos quais estes genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico codificando um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência codificando os polipeptídeos da invenção ou usados nos métodos da invenção, ou ainda em um vetor separado. Células que foram estavelmente transfectadas com o ácido nucleico introduzido podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem ao passo que as outras células morrem).

Uma vez que os genes marcadores, particularmente genes para resistência a antibióticos e herbicidas, não são mais requeridos ou são indesejados na célula hospedeira transgênica uma vez os ácidos nucleicos tenham sido introduzidos com sucesso, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que possibilitam a remoção ou excisão destes genes marcadores. Um tal método é o que é conhecido como co-transformação. O método de co-transformação emprega dois vetores simultaneamente para a transformação, um vetor carregando o ácido nucleico de acordo com a invenção e um segundo carregando o(s) gene(s) marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes), ambos os vetores. Em caso de transformação com Agrobactérias, os transformantes normalmente recebem apenas uma parte do vetor, i.e. a seqüência flanqueada pelo T-DNA, que normalmente representa a gaveta de expressão. Os genes marcadores podem ser subseqüentemente removidos da planta transformada realizando cruzamentos. Em outro método, genes marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecida como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico conferindo expressão de uma transposase, transientemente ou estavelmente. Em alguns casos (aprox. 10%), o transposon pula fora do genoma da célula hospedeira uma vez que transformação tenha ocorrido com sucesso e é perdido. Em diversos casos adicionais, o transposon pula para uma localização diferente. Nestes casos o gene marcador deve ser eliminado realizando cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tornam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional se fia no que é conhecido como sistemas de recombinação; cuja vantagem é de que eliminação por cruzamento pode ser dispensada. O sistema mais conhecido deste tipo é o que é conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene marcador está integrado entre as seqüências IoxP, ele é removido uma vez que transformação tenha ocorrido com sucesso, por expressão da recombinase. Sistemas de recombinação adicionais são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio específica no genoma de planta das seqüências de ácidos nucleicos de acordo com a invenção é possível. Naturalmente, estes métodos também podem ser aplicados a microorganismos tal como levedura, fungos ou bactérias. Transgênico/Transgene/Recombinante

Para os propósitos da invenção, "transgênico", "transgene" ou "recombinante" significa com relação a, por exemplo, uma seqüência de ácido nucleico, uma gaveta de expressão, construção gênica ou um vetor compreendendo a seqüência de ácido nucleico ou um organismo transformado com as seqüências de ácidos nucleicos, gavetas de expressão ou vetores de acordo com a invenção, todas estas construções causadas por métodos recombinantes nos quais ou (a) as seqüências de ácidos nucleicos codificando proteínas úteis nos métodos da invenção, ou

(b) seqüência(s) de controle genético que é(são) operacionalmente ligada(s) com a seqüência de ácido nucleico de acordo com

a invenção, por exemplo, um promotor, ou

(c) a) e b)

não estão localizadas em seu ambiente genético natural ou foram modificadas por métodos recombinantes, sendo possível para a modificação tomar a forma de, por exemplo, uma substituição, adição, deleção, inversão ou inserção de um ou mais resíduos de nucleotídeos. O ambiente genético natural é entendido como significando o locus genômico ou cromossômico natural na planta original ou a presença em uma biblioteca genômica. No caso de uma biblioteca genômica, o ambiente genético natural da seqüência de ácido nucleico é preferivelmente mantido, pelo menos em parte. O ambiente flanqueia a seqüência de ácido nucleico pelo menos em um lado e tem um comprimento de seqüência de pelo menos 50 bp, preferivelmente pelo menos 500 bp, especialmente preferivelmente pelo menos 1000 bp, mais preferivelmente pelo menos 5000 bp. Uma gaveta de expressão naturalmente ocorrente - por exemplo, a combinação naturalmente ocorrente do promotor natural das seqüências de ácidos nucleicos com a seqüência de ácido nucleico correspondente codificando um polipeptídeo útil nos métodos da presente invenção, como definido acima - se torna uma gaveta de expressão transgênica quando esta gaveta de expressão é modificada por métodos não naturais, sintéticos ("artificiais") tal como, por exemplo, tratamento mutagênico. Métodos adequados são descritos, por exemplo, em Patente Norte-Americana 5.565.350 ou Patente Internacional 00/15815.

Uma planta transgênica para os propósitos da invenção é assim entendida como significando, como acima, que os ácidos nucleicos usados no método da invenção não estão em seu locus natural no genoma de dita planta, sendo possível para os ácidos nucleicos serem expressos homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, enquanto os ácidos nucleicos de acordo com a invenção ou usados no método inventivo estão em sua posição natural no genoma de uma planta, a seqüência foi modificada com relação à seqüência natural, e/ou que as seqüências reguladoras das seqüências naturais foram modificadas. Transgênica é preferivelmente entendido como significando a expressão dos ácidos nucleicos de acordo com a invenção em um locus não natural no genoma, i.e. expressão homóloga ou, preferivelmente, heteróloga dos ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar. Transformação

O termo "introdução" ou "transformação" como referido neste lugar abrange a transferência de um polinucleotídeo exógeno para uma célula hospedeira, independente do método usado para transferência. Tecido de planta capaz de subseqüente propagação clonal pode ser transformado, quer por organogênese ou embriogênese, com uma construção genética da presente invenção e uma planta inteira regenerada a partir daí. O tecido particular escolhido irá variar dependendo dos sistemas de propagação clonal disponíveis para, e melhor adequados para, a espécie particular sendo transformada. Alvos de tecido exemplares incluem discos foliares, pólen, embriões, cotilédones, hipocótilos, megagametófitos, tecido de calo, tecido meristemático existente (e.g., meristema apical, gemas axilares, e meristemas de raiz), e tecido de meristema induzido (e.g., meristema de cotilédone e meristema de hipocótilo). O polinucleotídeo pode ser transientemente ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Alternativamente, ele pode ser integrado no genoma hospedeiro. A célula de planta transformada resultante pode então ser usada para regenerar uma planta transformada de uma maneira conhecida por pessoas versadas na arte.

A transferência de genes exógenos para o genoma de uma planta é chamada transformação. Transformação de espécies de planta é agora uma técnica bastante rotineira. Vantajosamente, qualquer dos diversos métodos de transformação pode ser usado para introduzir o gene de interesse em uma célula ancestral adequada. Os métodos descritos para a transformação e regeneração de plantas a partir de tecidos de planta ou células de planta podem ser utilizados para transformação transiente ou estável. Métodos de transformação incluem o uso de lipossomos, eletroporação, produtos químicos que aumentam absorção de DNA livre, injeção do DNA diretamente na planta, bombardeamento por pistola de partícula, transformação usando vírus ou pólen e microprojeção. Métodos podem ser selecionados a partir do método de cálcio/polietilenoglicol para protoplastos (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099- 1102); microinjeção em material de planta (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeamento de partícula revestida de DNA ou RNA (Klein TM et al., (1987) Nature 327: 70) infecção com (não integrativa) vírus e os semelhantes. Plantas transgênicas, incluindo plantas de cultivo transgênicas, preferivelmente são produzidas através de transformação mediada por Agrobacterium. Um método de transformação vantajoso é a transformação in planta. Para esta finalidade, é possível, por exemplo, permitir que as agrobactérias atuem em grãos de planta ou inocular o meristema de planta com agrobactérias. Provou-se particularmente adequado em conformidade com a invenção permitir que uma suspensão de agrobactérias transformadas atue na planta intacta ou pelo menos nos primórdios florais. A planta é subseqüentemente cultivada até que as sementes da planta tratada sejam obtidas (Clough and Bent, Plant J. (1998) 16, 735-743). Métodos para transformação mediada por Agrobacterium de arroz incluem métodos bem conhecidos para transformação de arroz, tal como aqueles descritos em qualquer dos seguintes: pedido da Patente Européia EP 1198985 Al, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), cujas descrições são incorporadas por referência neste lugar como se completamente apresentadas. No caso de transformação de milho, o método preferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et al. (Plant Physiol 129(1): 13-22, 2002), cujas descrições são incorporadas por referência neste lugar como se completamente apresentadas. Ditos métodos são adicionalmente descritos como forma de exemplo em B. Jenes et al., Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção a ser expressa é preferivelmente clonada em um vetor, que é adequado para transformar Agrobacterium tumefaciens, por exemplo, pBinl9 (Bevan et al., Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um tal vetor podem ser então usadas de uma maneira conhecida para a transformação de plantas, tal como plantas usadas como um modelo, como Arabidopsis (Arabidopsis thaliana está dentro do escopo da presente invenção não considerada como uma planta de cultivo), ou plantas de cultivo tal como, como forma de exemplo, plantas de tabaco, por exemplo, imergindo folhas machucadas ou folhas picadas em uma solução agrobacteriana e então as cultivando em meio adequado. A transformação de plantas por meio de Agrobaeterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer em Nucl. Acid Res. (1988) 16, 9877 ou é conhecida entre outras maneiras a partir de F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38. Em adição à transformação de células somáticas, que então têm que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas de planta e em particular aquelas células que se desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento de planta natural, gerando plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas a partir das plantas em desenvolvimento das quais uma certa proporção é transformada e assim transgênica [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. Métodos alternativos são baseados na remoção repetida das inflorescências e incubação do sítio de excisão no centro da roseta com agrobactérias transformadas, através do que sementes transformadas podem da mesma maneira ser obtidas em um momento posterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Entretanto, um método especialmente efetivo é o método de infiltração a vácuo com suas modificações tal como o método de "botão floral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso do método de "botão floral" o tecido floral em desenvolvimento é incubado brevemente com uma suspensão agrobacteriana tratada com surfactante [Clough, SJ and Bent, AF (1998). The Plant J. 16, 735-743]. Uma certa proporção de sementes transgênicas são coletadas em ambos os casos, e estas sementes podem ser distinguidas de sementes não transgênicas cultivando nas condições seletivas descritas acima. Em adição, a transformação estável de plastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmente reduzindo ou eliminando o risco de fluxo de transgene através de pólen na maioria das cultivos. A transformação do genoma de cloroplasto geralmente é atingida por um processo que foi esquematicamente apresentado em Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente as seqüências a serem transformadas são clonadas junto com um gene marcador selecionável entre seqüências flanqueadoras homólogas ao genoma de cloroplasto. Estas seqüências flanqueadoras homólogas dirigem integração sítio específica no plastoma. Transformação plastidial foi descrita para muitas espécies de plantas diferentes e uma visão geral é dada em Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28. Progresso biotecnológico adicional foi recentemente relatado em forma de transformantes de plastídeos livres de marcador, que podem ser produzidos por um gene marcador co-integrado transiente (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).

Identificação por ativação de T-DNA

Identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), envolve inserção de T-DNA, normalmente contendo um promotor (também pode ser um acentuador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb antes ou depois da região de codificação de um gene em uma configuração de forma que o promotor dirige expressão do gene dirigido. Tipicamente, regulação de expressão do gene dirigido por seu promotor natural é interrompida e o gene cai sob o controle do promotor recentemente introduzido. O promotor é tipicamente embebido em um T-DNA. Este T-DNA é aleatoriamente inserido no genoma de planta, por exemplo, através de infecção por Agrobacterium e leva a expressão modificada de genes perto do T-DNA inserido. As plantas transgênicas resultantes mostram fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.

TILLING O termo “TILLING” é uma abreviação de “Lesões Locais Induzidas Dirigidas em Genomas” e se refere a uma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicos codificando proteínas com expressão e/ou atividade modificada. TILLING também permite seleção de plantas carregando tais variantes mutantes. Estas variantes mutantes podem exibir expressão modificada, ou em força ou em localização ou em momento (se as mutações afetam o promotor, por exemplo). Estas variantes mutantes podem exibir atividade maior do que aquela exibida pelo gene em sua forma natural. TILLING combina mutagênese de alta densidade IO com métodos de triagem rápida. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e combinação de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e anelamento para permitir formação de heteroduplexos; (e) DHPLC, onde a presença de um heteroduplex em uma combinação é detectada como um pico extra no cromatograma; (f) identificação do mutante individual; e (g) seqüenciamento do produto de PCR mutante. Métodos para TILLING são bem conhecidos na arte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50).

Recombinação homóloga

Recombinação homóloga permite introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciências biológicas para organismos inferiores tal como levedura ou o musgo Physcomitrella. Métodos para realizar recombinação homóloga em plantas foram descritos não apenas para plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84), mas também para plantas de cultivo, por exemplo, 5 arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida and Terada (2004) Curr Opin Biotech 15(2): 132-8), e há métodos que geralmente são aplicáveis independente do organismo alvo (Miller et al, Nature Biotechnol. 25, 778-785, 2007).

Rendimento

O termo “rendimento” em geral significa uma rendimento

mensurável de valor econômico, tipicamente relacionada a um cultivo especificado, a uma área, e a um período de tempo. Partes de planta individuais contribuem diretamente para rendimento baseado em seu número, tamanho e/ou peso, ou a rendimento atual é a rendimento por metro quadrado 15 para um cultivo e ano, que é determinada dividindo rendimento total (inclui tanto produção coletada como avaliada) por metros quadrados plantados. O termo “rendimento” de uma planta pode se referir à biomassa vegetativa (biomassa de raiz e/ou parte aérea), a órgãos reprodutivos, e/ou a propágulos (tal como sementes) de tal planta.

Vigor inicial

Vigor inicial se refere a crescimento bem equilibrado saudável ativo especialmente durante estágios iniciais de crescimento de planta, e pode resultar de aptidão de planta aumentada devido a, por exemplo, as plantas serem melhor adaptadas a seu ambiente (i.e. aperfeiçoando o uso de recursos 25 energéticos e particionamento entre parte aérea e raiz). Plantas tendo vigor inicial também mostram uma sobrevivência de plântula aumentada e um melhor estabelecimento do cultivo, o que freqüentemente resulta em campos altamente uniformes (com o cultivo crescendo de maneira uniforme, i.e. com a maioria das plantas atingindo os vários estágios de desenvolvimento substancialmente ao mesmo tempo), e freqüentemente rendimento melhor e maior. Portanto, vigor inicial pode ser determinado medindo vários fatores, tal como peso de mil sementes, porcentagem de germinação, porcentagem de emergência, crescimento de plântula, altura de plântula, comprimento de raiz, 5 biomassa de raiz e parte aérea e muito mais.

Aumento/Melhora/Acentuação

Os termos “aumento”, “melhora” ou “acentuação” são permutáveis e devem significar no sentido do pedido pelo menos uns 3%, 4%, 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, 10 mais preferivelmente 25%, 30%, 35% ou 40% mais rendimento e/ou crescimento em comparação com plantas de controle como definido neste lugar.

Rendimento de sementes

Rendimento aumentado de sementes pode ser manifestado como um ou mais dos seguintes: a) um aumento em biomassa de semente (peso total de semente) que pode ser em uma base de semente individual e/ou por planta e/ou por metro quadrado; b) número aumentado de flores por planta; c) número aumentado de grãos (cheios); d) taxa aumentada de enchimento de grãos (que é expressa como a proporção entre o número de grãos cheios dividido pelo número total de grãos); e) índice de colheita aumentado, que é expresso como proporção do rendimento de partes colhíveis, tal como sementes, dividida pela biomassa total; e f) Peso de Mil Sementes (TKW) aumentado, que é extrapolado a partir do número de grãos cheios contados e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado, e também pode resultar de um aumento em tamanho de embrião e/ou endosperma.

Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente. Além disso, um aumento em rendimento de sementes também pode ser manifestado como um aumento em área de semente e/ou comprimento de semente e/ou largura de semente e/ou perímetro de semente. Rendimento aumentada também pode resultar em arquitetura modificada, ou pode ocorrer por causa de arquitetura modificada. índice Verde

O “índice verde” como usado neste lugar é calculado a partir de imagens digitais de plantas. Para cada pixel pertencendo ao objeto de planta na imagem, a proporção do valor de verde versus o valor de vermelho (no modelo RGB para codificar cor) é calculada. O índice verde é expresso como a porcentagem de pixéis para a qual a proporção de verde para vermelho excede um dado limiar. Em condições normais de crescimento, em condições de crescimento com estresse salino, e em condições de crescimento com disponibilidade reduzida de nutrientes, o índice verde de plantas é medido no último tratamento de imagens antes de florescimento. Em contraste, em condições de crescimento com estresse por seca, o índice verde de plantas é medido no primeiro tratamento de imagens depois de seca.

Planta

O termo “planta” como usado neste lugar abrange plantas inteiras, ancestrais e progênie das plantas e partes de planta, incluindo sementes, partes aéreas, caules, folhas, raízes (incluindo tubérculos), flores, e tecidos e órgãos, caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse. O termo “planta” também abrange células de planta, cultivos em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen e micrósporos, de novo caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse.

Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, cultivos alimentares, árvores ou arbustos selecionados a partir da lista compreendendo Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, 5 Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagus offieinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa earambola, Bambusa sp., Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassiea spp. (e.g. Brassiea napus, Brassiea rapa ssp. [canola, colza, nabo]), Cadaba farinosa, 10 Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceibapentandra, Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus sp., Coriandrum sativum, Corylus spp., 15 Crataegus spp., Crocus sativus, Cucurbita spp., Cucumis spp., Cynara spp., Daueus carota, Desmodium spp., Dimocarpus longart, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (e.g. Elaeis guineensis, Elaeis oleifera), Eleusine coracana, Erianthus sp., Eriobotrya japoniea, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, 20 Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. (e.g. Glycine max, Soja hispida ou Soja max), Gossypium hirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (e.g. Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens eulinaris, Linum usitatissimum, Litchi 25 chinensis, Lotus spp., Luffa aeutangula, Lupinus spp., Luzula sylvatica, Lycopersicon spp. (e.g. Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon pyrifomie), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Miseanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nieotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (e.g. Oryza sativa, Oryza latifolia), Panieum miliaeeum, Panieum virgatum, Passifora edulis, Pastinaea sativa, Pennisetum sp., Persea spp., Petroselinum erispum, Phalaris arundinaeea, Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Puniea granatum, Pyrus eommunis, Quereus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Rieinus eommunis, Rubus spp., Saceharum spp., Salix sp., Sambueus spp., Seeale eereale, Sesamum spp., Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium ou Solanum lyeopersicum), Sorghum bieolor, Spinaeia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Tritieum spp. (e.g. Tritieum aestivum, Tritieum durum, Tritieum turgidum, Tritieum hybernum, Tritieum maeha, Tritieum sativum ou Tritieum vulgare), Tropaeolum minus, Tropaeolum majus, Vaeeinium spp., Vicia spp., Vigna spp., Viola odor ata, Vitis spp., Zea mays, Zizaniapalustris, Ziziphus spp., entre outras.

Descrição detalhada da invenção TCP de Classe I

Surpreendentemente, foi descoberto agora que aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um YEP, cujo YEP é um polipeptídeo TCP de Classe I, gera plantas tendo rendimento aumentado de sementes em relação às plantas de controle. O tipo particular de polipeptídeos TCP de Classe I adequado para aumentar o rendimento de sementes em plantas é descrito em detalhe abaixo.

A presente invenção fornece um método para aumentar rendimento de sementes em plantas em relação às plantas de controle, compreendendo aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um polipeptídeo TCP de Classe I. No contexto desta forma de realização, qualquer referência a um “polipeptídeo útil nos métodos da invenção” é adotada para significar um polipeptídeo TCP de Classe I como definido neste lugar. Qualquer referência daqui por diante a uma “seqüência de ácido nucleico útil nos métodos da invenção” é adotada para significar uma seqüência de ácido nucleico capaz de codificar um tal polipeptídeo TCP de Classe I.

Os termos “polipeptídeo” e “proteína” são usados permutavelmente neste lugar e se referem a aminoácidos em uma forma polimérica de qualquer comprimento. Os termos também são definidos na seção “Definições” neste lugar. Os termos “polinucleotídeo(s)”, “seqüência(s) de ácidos nucleicos”, “seqüência(s) de nucleotídeos” também são definidos na seção “Definições” neste lugar

O aumento em rendimento de sementes atingido realizando os métodos da invenção é um aumento em relação às plantas de controle. O termo “plantas de controle” é definido na seção “Definições” neste lugar.

Um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I útil nos métodos da invenção como definido abaixo.

A seqüência de ácido nucleico a ser introduzida em uma planta (e, portanto útil para realizar os métodos da invenção) é qualquer seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I, daqui por diante também chamada “seqüência de ácido nucleico de TCP de Classe I” ou “gene de TCP de Classe I”. Um “polipeptídeo TCP de Classe I” como definido neste lugar se refere a um polipeptídeo compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%), 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65.

A presença de um domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) foi determinada como mostrado em Exemplos 2, 3, 4, e 5. O cálculo de identidade percentual de aminoácidos de SEQ ID NO: 66 com o domínio conservado de TCP de polipeptídeos TCP de Classe I úteis para realizar os métodos da invenção é mostrado em Exemplo 3 (Tabela BI).

Dentro do motivo 1 consenso C-terminal como representado por SEQ ID: 65, pode haver uma ou mais mudanças conservativas em qualquer posição, e/ou uma, duas ou três mudança(s) não conservativa(s) em qualquer posição. A presença deste motivo foi determinada como mostrado em Exemplo 2. Por “C-terminal” é pretendido neste lugar a metade da seqüência de polipeptídeo compreendendo o término carbóxi (C) (a outra metade compreendendo o término amino (N)). Por “motivo 1 consenso C- terminal” é neste lugar adotado para significar que o motivo 1 consenso é compreendido com a metade C-terminal da seqüência de polipeptídeo.

Adicionalmente, o polipeptídeo TCP de Classe I pode compreender uma região rica em HQ (H sendo histidina, Q glutamina), entre o motivo 1 conservado C-terminal e a extremidade C-terminal do polipeptídeo. A região rica em HQ compreende pelo menos quatro, preferivelmente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais ou de apenas resíduos de H, ou de apenas resíduos de Q, ou de uma combinação de resíduos de H e Q (em qualquer proporção). A presença deste motivo foi determinada como descrito em Exemplos 2 e 4. Por “extremidade C-terminal“ do polipeptídeo neste lugar é adotado para significar o último resíduo de aminoácido da seqüência de polipeptídeo.

Alternativamente ou adicionalmente, um “polipeptídeo TCP de Classe I” como definido neste lugar se refere a qualquer seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP.

Uma pessoa versada na arte pode determinar prontamente se qualquer seqüência de polipeptídeo em questão cai dentro da definição de um “polipeptídeo TCP de Classe I” usando técnicas conhecidas e aplicativo computacional para a criação de uma tal árvore filogenética, tal como um pacote GCG, EBI ou CLUSTAL, usando parâmetros padrão. Qualquer agrupamento de seqüências dentro do ciado compreendendo SEQ ID NO: 2 (circundada em Fig. 1) deve ser considerado como caindo dentro da definição mencionada acima de um polipeptídeo TCP de Classe I, e deve ser considerado adequado para uso nos métodos da invenção.

Exemplos de polipeptídeos úteis nos métodos da invenção e seqüências de ácidos nucleicos codificando os mesmos são como dado abaixo em Tabela A de Exemplo 1.

Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1, o termo “homólogo” sendo como definido na seção “Definições” neste lugar.

Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídeos dados em Tabela A de Exemplo I. O termo “Derivados” é como definido na seção “Definições” neste lugar.

A invenção é ilustrada transformando plantas com a seqüência de ácido nucleico de Arabidopsis thaliana representada por SEQ ID NO: 1, codificando a seqüência de polipeptídeo de SEQ ID NO: 2, entretanto desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizados usando qualquer seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I útil nos métodos da invenção como definido neste lugar, incluindo ortólogos e parálogos, tal como qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1.

As seqüências de polipeptídeos dadas em Tabela A de Exemplo 1 podem ser consideradas como sendo ortólogos e parálogos do polipeptídeo TCP de Classe I representado por SEQ ID NO: 2. Os termos “Ortólogos” e “parálogos” são como definido neste lugar.

Ortólogos e parálogos podem ser facilmente encontrados realizando uma assim chamada busca blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo, usando qualquer das seqüências listadas em Tabela A de Exemplo 1) contra qualquer banco de dados de seqüências, tal como o banco de dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência de polipeptídeo. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: I ou SEQ ID NO: 2, o segundo BLAST deve, portanto, ser contra seqüências de Arabidopsis thalianà). Os resultados do primeiro e segundo BLAST são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retomo então idealmente resulta na seqüência de consulta como maior acerto; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retomo na seqüência de consulta estando entre os maiores acertos.

Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). Computação do valor E é bem conhecida na arte. Em adição a valores E, comparações também são pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos.

Tabela A de Exemplo 1 fornece exemplos de ortólogos e parálogos do polipeptídeo TCP de Classe I representado por SEQ ID NO 2. Ortólogos e parálogos adicionais podem ser prontamente identificados usando o procedimento BLAST descrito acima. Os métodos da invenção podem ser vantajosamente realizados usando qualquer seqüência de ácido nucleico codificando qualquer dos polipeptídeos TCP de Classe I como dado em Tabela A ou ortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima.

Os polipeptídeos da invenção são identificáveis pela presença de um domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) (mostrado em Figura 3A). O termo “domínio” é como definido na seção “Definições” neste lugar.

O termo “motivo”, ou “seqüência consenso”, ou “assinatura” é como definido na seção “Definições” neste lugar.

Também existem bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleie Aeids Res 30, 242-244, InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proeeedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para análise em silício de seqüências protéicas está disponível no servidor de proteômica ExPASY (hospedado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)).

Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos, ortólogos e parálogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.).

5 Edição manual secundária pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar seqüências de comprimento completo para a identificação de homólogos, domínios específicos (tal como

o domínio conservado de TCP, ou um dos motivos definidos acima) também 10 podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo em Exemplo 3 como uma porcentagem foram determinados ao longo da seqüência inteira de ácidos nucleicos ou de polipeptídeos (Tabela B), e/ou ao longo de domínios selecionados ou motivo(s) conservado(s) (Tabela BI), usando os programas mencionados acima usando os parâmetros padrão.

Além disso, a presença de regiões ricas em aminoácidos

específicos (tal como a região HQ) pode ser identificada usando algoritmos computacionais ou simplesmente por inspeção visual. Para o anterior, composição primária de aminoácidos (em %) para determinar se uma região de polipeptídeo é rica em aminoácidos específicos pode ser calculada usando 20 programas de aplicativos computacionais do servidor ExPASy, em particular a ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: the proteomics server for in-depth protein knowledge and analysis. Nucleic Acids Res 31:3784-3788). A composição do polipeptídeo de interesse pode ser então comparada com a composição média de aminoácidos (em %) no banco de 25 dados Swiss-Prot Protein Sequence. Por exemplo, neste banco de dados, o conteúdo médio de histidina é de 2,27%, o conteúdo médio de glutamina é de 3,93%. Uma região de polipeptídeo é rica em um aminoácido específico se o conteúdo daquele aminoácido específico naquele domínio está acima da composição media do aminoácido (em %) no banco de dados Swiss-Prot Protein Sequence. Uma região rica em HQ, portanto, tem ou um conteúdo de H acima de 2,27%, e/ou um conteúdo de G acima de 3,93%. Para o último, inspeção visual do alinhamento múltiplo de seqüências de polipeptídeos TCP de Classe I de Tabela A, mostra uma região rica em HQ (H sendo histidina, Q 5 glutamina), entre o motivo 1 conservado C-terminal e a extremidade C- terminal dos polipeptídeos. A região rica em HQ compreende pelo menos quatro, preferivelmente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais ou de apenas resíduos de H, ou de apenas resíduos de Q, ou de uma combinação de resíduos de H e Q (em qualquer proporção). A presença deste 10 motivo foi determinada como mostrado em Exemplos 2 e 4.

Além disso, polipeptídeos TCP de Classe I (pelo menos em sua forma nativa) tipicamente têm atividade de DNA. Detalhes adicionais sobre verificação para esta atividade específica de ligação de DNA são fornecidos em Exemplo 6.

Seqüências de ácidos nucleicos codificando polipeptídeos TCP

de Classe I úteis nos métodos da invenção não precisam ser seqüências de ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. Exemplos de seqüências de ácidos nucleicos 20 adequadas para uso para realizar os métodos da invenção incluem as seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, mas não são limitadas àquelas seqüências. Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluem porções de seqüências de ácidos 25 nucleicos codificando um polipeptídeo TCP de Classe 1, seqüências de ácidos nucleicos hibridizando com seqüências de ácidos nucleicos codificando um TCP de Classe I, variantes de união de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I, variantes alélicas de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I, variantes de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I que são obtidas por embaralhamento de gene, ou variantes de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I que são obtidas por mutagênese dirigida por sítio. Os termos porção, seqüência hibridizante, variante de união, variante alélica, variante obtida por embaralhamento de gene, e variante obtida por mutagênese dirigida por sítio serão descritos agora e também são definidos na seção “Definições” neste lugar.

De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou uma porção de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1.

Porções úteis nos métodos da invenção codificam um polipeptídeo caindo dentro da definição de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar e tendo substancialmente a mesma atividade biológica que as seqüências de polipeptídeos dadas em Tabela A de Exemplo 1. Preferivelmente, a porção é uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo I. A porção é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1. Preferivelmente, a porção codifica uma seqüência de polipeptídeo TCP de Classe 1 compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%), 80%), 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a porção codifica uma seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a porção é uma porção da seqüência de ácido nucleico de SEQ ID NO: 1.

Uma porção de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar pode ser preparada, por exemplo, fazendo uma ou mais deleções à seqüência de ácido nucleico. As porções podem ser usadas em forma isolada ou elas podem ser fusionadas com outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir um polipeptídeo que combina diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de polipeptídeo TCP de Classe I.

Outra variante de ácido nucleico útil nos métodos da invenção é uma seqüência de ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar, ou com uma porção como definido neste lugar.

De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou com uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das 5 seqüências de polipeptídeos dadas em Tabela A de Exemplo 1.

Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo tendo um domínio conservado de TCP (veja o alinhamento de Fig. 2) e tendo substancialmente a mesma atividade biológica que o polipeptídeo TCP de Classe I representado por qualquer uma das 10 seqüências de polipeptídeos dadas em Tabela A de Exemplo I. A seqüência hibridizante é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 15 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou com uma porção de qualquer uma destas 20 seqüências, uma porção sendo como definido acima. Ainda preferivelmente, a seqüência hibridizante codifica uma seqüência de polipeptídeo TCP de Classe

I compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP 25 (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência hibridizante codifica uma seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a seqüência hibridizante é capaz de hibridizar com uma seqüência de ácido nucleico como representado por SEQ ID NO: 1 ou com uma porção deste.

O termo “hibridização” é como definido neste lugar.

Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de união codificando um polipeptídeo TCP de Classe I como definido acima. O termo “variante de união” é como definido na seção “Definições” neste lugar.

De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma variante de união de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou uma variante de união de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1.

Preferivelmente, a seqüência de polipeptídeo TCP de Classe I codificada pela variante de união compreende de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%), 95%) ou 98%> ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C- terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela variante de união codifica uma seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP. Variantes de união mais preferidas são variantes de união de uma seqüência de ácido nucleico representada por SEQ ID NO: 1 ou uma variante de união de uma seqüência 5 de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2.

Outra variante de ácido nucleico útil para realizar os métodos da invenção é uma variante alélica de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima. O termo “variante alélica” é como definido na seção “Definições” neste lugar. As 10 variantes alélicas úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica que o polipeptídeo TCP de Classe I de SEQ ID NO: 2.

De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir 15 e expressar em uma planta uma variante alélica de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de 20 Exemplo 1.

Preferivelmente, a seqüência de polipeptídeo TCP de Classe I codificada pela variante alélica compreende de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98%o ou mais identidade de seqüência com o domínio conservado de 25 TCP (compreendendo um FIélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela variante de união, quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo representada por SEQ ID NO: 2 (circundada em Fig. 2) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 1 ou uma variante 5 alélica de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2.

Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de gene. Embaralhamento de gene ou evolução dirigida é definido na seção “Definições” neste lugar.

De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo 15 introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1, cuja seqüência de variante de ácido nucleico é obtida por embaralhamento de gene.

Preferivelmente, a seqüência de ácido nucleico variante obtida 20 por embaralhamento de gene codifica uma seqüência de polipeptídeo compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado 25 por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela seqüência de ácido nucleico variante obtida por embaralhamento de gene, quando usada na construção de uma árvore filogenética de TCP tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo representada por SEQ ID NO: 2 (circundada em Fig. 2) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a seqüência de ácido nucleico variante obtida por embaralhamento de gene é uma variante de 5 SEQ ID NO: 1 ou uma variante de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2, obtida por embaralhamento de gene.

Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese dirigida por sítio. Diversos métodos estão disponíveis para atingir mutagênese dirigida por sítio, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).

De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de 15 ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1, cuja seqüência de ácido nucleico variante é obtida por mutagênese dirigida por 20 sítio.

Preferivelmente, a seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio codifica uma seqüência de polipeptídeo TCP de Classe I compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou 25 mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio, quando usada na construção de uma árvore filogenética de TCP tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo representada por SEQ ID NO: 2 ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio é uma variante de SEQ ID NO: 1 ou uma variante de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2, obtida por mutagênese dirigida por sítio.

As seguintes variantes de ácidos nucleicos codificando um polipeptídeo TCP de Classe I são exemplos de variantes adequadas para praticar os métodos da invenção:

(i) uma porção de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I;

(ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe i;

(iii)uma variante de união de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I;

(iv) uma variante alélica de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I;

(v) uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I obtida por embaralhamento de gene;

(vi) uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I obtida por mutagênese dirigida por sítio.

Seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I podem ser derivadas de qualquer fonte natural ou artificial. A seqüência de ácido nucleico pode ser modificada a partir de sua forma nativa em composição e/ou ambiente genômico através de deliberada manipulação humana. Preferivelmente a seqüência de ácido nucleico codificando o polipeptídeo TCP de Classe I é de uma planta, ainda preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente a seqüência de ácido nucleico é de Arabidopsis thaliana.

Qualquer referência neste lugar a um polipeptídeo TCP de Classe I é, portanto, adotada para significar um polipeptídeo TCP de Classe I como definido acima. Qualquer seqüência de ácido nucleico codificando um tal polipeptídeo TCP de Classe I é adequada para uso para realizar os métodos da invenção.

A presente invenção também abrange plantas ou partes destas (incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima.

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de ácidos nucleicos úteis nos métodos de acordo com a invenção, em uma planta. As construções genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção gênica como definido neste lugar nos métodos da invenção.

Mais especificamente, a presente invenção fornece uma construção compreendendo

(a) seqüência de ácido nucleico codificando polipeptídeo TCP de Classe I como definido acima;

(b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácido nucleico de (a); e opcionalmente

(c) uma seqüência de término de transcrição.

Uma construção preferida é uma onde a seqüência de controle é um promotor constitutivo, preferivelmente um promotor GOS2. A invenção também fomece plantas, partes de planta, ou células de planta transformadas com uma construção como definido acima.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., uma seqüência de ácido nucleico codificando um 5 polipeptídeo TCP de Classe I como definido neste lugar. O artesão versado está ciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a 10 um promotor). Os termos “elemento regulador”, “seqüência de controle” e “promotor” são como definidos na seção “Definições” neste lugar. O termo “operacionalmente ligado” é como definido na seção “Definições”.

Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão de a seqüência de ácido nucleico. O termo “promotor” e “Promotor de planta” são definidos na seção “Definições” neste lugar e diversos exemplos de promotores também são descritos.

Preferivelmente o promotor é derivado de uma planta, mais preferivelmente uma planta monocotiledônea.

O promotor pode ser um promotor constitutivo. Adicionalmente ou alternativamente, o promotor pode ser um promotor órgão-específico ou tecido-específico.

Em uma forma de realização, a seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I é operacionalmente ligada a um promotor constitutivo, o termo “promotor constitutivo” é como definido na 25 seção “Definições” neste lugar. Um promotor constitutivo é um que também é substancialmente expresso ubiquamente. Preferivelmente o promotor constitutivo é derivado de uma planta, mais preferivelmente uma planta monocotiledônea. Ainda preferivelmente o promotor constitutivo é um promotor GOS2 (de arroz), por exemplo, como representado por uma seqüência de ácido nucleico substancialmente similar a SEQ ID NO: 67, mais preferivelmente o promotor constitutivo é como representado por SEQ ID NO: 67. Deve ser claro que a aplicabilidade da presente invenção não é restrita à seqüência de ácido nucleico como representado por SEQ ID NO: 1, 5 nem é a aplicabilidade da invenção restrita a expressão de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I quando dirigida por um promotor GOS2. Exemplos de outros promotores constitutivos que também podem ser usados para dirigir expressão de uma seqüência de ácido nucleico codificando um. polipeptídeo TCP de Classe I são mostrados na 10 seção “Definições” neste lugar.

Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do 15 gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de 20 referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA da seqüência de ácido nucleico usada nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como 18S rRNA, 25 usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor” fraco é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou a cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por 5 célula.

Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. O termo “terminador” é como definido na seção “Definições” neste lugar. Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como 10 transducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras que podem ser adequadas para uso para realizar a invenção. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.

Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico até 1000 vezes (Buchman and Berg, Mol. Cell biol. 8:4395- 4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal estimulação intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral, veja The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colEl.

Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estas seqüências de ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os termos “marcador selecionável”, “gene marcador selecionável” ou “gene repórter” são definidos na seção “Definições” neste lugar.

A invenção também fornece um método para a produção de plantas transgênicas tendo rendimento aumentado de sementes em relação às plantas de controle, compreendendo introdução e expressão em uma planta de qualquer seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima.

Os termos “transgênico”, “transgene” ou “recombinante” são como definido neste lugar

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo rendimento aumentado de sementes em relação às plantas de controle, cujo método compreende:

(i) introduzir e expressar em uma planta ou célula de planta uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I; e

(ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta.

A seqüência de ácido nucleico pode ser introduzida diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De 5 acordo com uma característica preferida da presente invenção, a seqüência de ácido nucleico é preferivelmente introduzida em uma planta por transformação.

O termo “introdução” ou “transformação” é definido na seção “Definições” neste lugar.

As células de planta geneticamente modificadas podem ser

regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.

Geralmente depois de transformação, células de planta ou

agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o

material de planta obtido na transformação é, como uma regra, sujeito a condições seletivas de forma que plantas transformadas podem ser distinguidas de plantas não transformadas. Por exemplo, as sementes obtidas da maneira descrita acima podem ser plantadas e, depois de um período inicial de crescimento, sujeitas a uma seleção adequada por pulverização.

Uma possibilidade adicional consiste em cultivar as sementes, se apropriado depois de esterilização, em placas de ágar usando um agente de seleção adequado de forma que apenas as sementes transformadas podem crescer até plantas. Alternativamente, as plantas transformadas são triadas para a presença de um marcador selecionável tal como aqueles descritos acima. Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo, usando análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.

As plantas transformadas geradas podem ser propagadas por uma variedade de maneiras, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser autofecundada e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 então podem ser adicionalmente propagadas através de técnicas clássicas de melhoramento.

Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e.g., todas as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado em uma prole não transformada).

A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes de planta e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo uma seqüência isolada de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima. Células hospedeiras preferidas de acordo com a invenção são células de planta.

5 Plantas hospedeiras para as seqüências de ácidos nucleicos ou

o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.

A invenção também se estende a partes colhíveis de uma 10 planta tal como, mas não limitado a sementes, folhas, frutos, flores, caules, rizomas, raízes, tubérculos e bulbos. A invenção, além disso, se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.

Métodos para aumentar expressão de seqüências de ácidos

nucleicos ou genes, ou produtos de gene, são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Seqüências isoladas de ácidos nucleicos que servem como elementos promotores ou 20 acentuadores podem ser introduzidas em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte- Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores 25 isolados podem ser introduzidos em uma célula de planta na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.

O termo “expressão” ou “expressão gênica” é como definido na seção “Definições” neste lugar. O termo “aumentar expressão” deve significar um aumento da expressão da seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I, cujo aumento em expressão leva ao rendimento aumentado de sementes das plantas em relação às plantas de controle. Preferivelmente, o aumento em expressão da seqüência de ácido nucleico é 1,25, 1,5, 1,75, 2, 5, 7,5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais vezes a expressão da seqüência endógena de ácido nucleico de planta codificando um polipeptídeo TCP de Classe I como definido acima.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3’ de uma região de codificação de um polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. A seqüência de extremidade 3’ a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico.

Uma seqüência intrônica também pode ser adicionada como

descrito acima.

Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA.

Como mencionado acima, um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I; entretanto os efeitos de realizar o método, i.e. aumentar rendimento de sementes também pode ser atingidos usando outras técnicas bem conhecidas. Uma descrição de algumas destas técnicas seguirá agora.

Uma tal técnica é identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), que é descrita na seção “Definições” neste lugar.

Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Dirigidas em Genomas). Veja a seção “Definições” neste lugar para uma descrição de esta técnica.

Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga, que é descrita na seção “Definições” neste lugar.

Desempenho dos métodos da invenção Iead to um aumento em rendimento de sementes em relação às plantas de controle. O termo “rendimento de sementes” é definido na seção “Definições” neste lugar. Os termos “aumento”, “acentua” ou “melhora” também são definidos na seção “Definições”.

Rendimento aumentado de sementes pode se manifestar como um ou mais dos seguintes:

(i) rendimento de sementes total aumentado, o que inclui um aumento em biomassa de semente (peso de semente) e que pode ser um aumento no peso de semente por planta ou em uma base de semente individual;

(ii) número aumentado de panículas por planta

(iii) número aumentado de flores (“floretes”) por panícula

(iv) taxa de enchimento de grãos aumentada

(v) número aumentado de grãos (cheios);

(vi) tamanho aumentado de semente (comprimento, área de largura, perímetro), o que também pode influenciar a composição de sementes;

(vii) volume aumentado de semente, o que também pode influenciar a composição de sementes; (viii) índice de colheita aumentado, que é expresso como uma proporção da rendimento de partes colhíveis, tal como sementes, sobre a biomassa total; e

(ix) Peso de Mil Sementes (TKW) aumentado, que é 5 extrapolado a partir do número de grãos cheios contados e seu peso total. Um

TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado. Um TKW aumentado pode resultar de um aumento em tamanho de embrião e/ou tamanho de endosperma.

Um aumento em tamanho de semente, volume de semente, área de semente, perímetro de semente, largura de semente ou comprimento de semente pode ser devido a um aumento em partes específicas de uma semente, por exemplo, devido a um aumento no tamanho do embrião e/ou endosperma e/ou aleurona e/ou escutelo, ou outras partes de uma semente.

Em particular, rendimento aumentado de sementes é selecionado a partir de um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; e (iii) TKW aumentado.

Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente, o que também pode influenciar a composição de sementes (incluindo teor total e/ou composição de óleos, proteínas e carboidratos).

Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de fileiras, número de 25 sementes por fileira, peso de semente, Peso de Mil Sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos 5 (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), aumento em Peso de Mil Sementes, entre outros.

Uma vez que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado de sementes, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos 10 parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um 15 ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento 20 e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode permitir vigor melhorado. Taxa de crescimento aumentada pode 25 ocorrer durante desenvolvimento de semente (taxa de crescimento reprodutivo), enquanto que a taxa de crescimento vegetativo não é modificada ou até reduzida. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de 5 arroz adicionais todas dentro de um período de cultivo convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies de planta diferentes. Tempos de colheita adicionais do mesmo porta-enxerto no caso de algumas plantas de cultivo também podem ser possíveis. Alterar o ciclo de colheita de 10 uma planta pode levar a um aumento em produção anual de biomassa por acre (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma 15 vez que as limitações territoriais para cultivar um cultivo freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de 20 crescimento, tais parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90%> de seu tamanho máximo), entre outros.

De acordo com uma característica preferida da presente invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa 25 de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas em relação às plantas de controle, cujo método compreende aumentar expressão em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar. Preferivelmente, a taxa de crescimento aumentada ocorre durante desenvolvimento de semente (taxa de crescimento reprodutivo), a taxa de crescimento vegetativo sendo não modificada ou até reduzida.

Um aumento em rendimento e/ou taxa de crescimento ocorre quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%), 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas de cultivo cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido à seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos.

Em particular, os métodos da presente invenção podem ser realizados em condições sem estresse ou em condições de seca branda para gerar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade de planta.

5 Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol. (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou 10 salinização são manifestadas primariamente como estresse osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses 15 ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, regulagem positiva de antioxidantes, acumulação de solutos compatíveis e suspensão de crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. 20 Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.

Desempenho dos métodos da invenção gera plantas cultivadas em condições sem estresse ou em condições de seca branda com rendimento aumentado em relação às plantas de controle adequadas cultivadas em 25 condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda, cujo método compreende aumentar expressão em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I. Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. O termo “planta” é como definido na seção “Definições” neste lugar. Também são descritas plantas que são particularmente úteis nos métodos da invenção.

De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Exemplos de plantas de cultivo incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia.

A presente invenção também abrange uso de seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I como descrito neste lugar e uso destes polipeptídeos TCP de Classe I para aumentar rendimento de sementes em plantas. Preferivelmente, rendimento aumentado de sementes é selecionada a partir de um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.

Seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I descritos neste lugar, ou os próprios polipeptídeos TCP de Classe I, podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene codificando polipeptídeo TCP de Classe I. As seqüências de ácidos nucleicos/genes, ou os próprios polipeptídeos TCP de Classe I podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo rendimento aumentado de sementes como definido acima nos métodos da invenção.

Variantes alélicas de uma seqüência de ácido nucleico/gene codificando um polipeptídeo TCP de Classe I também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento inutagênico das plantas, usando, por exemplo, mutagênese EMS;

5 alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram rendimento aumentado. Seleção 10 tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, 15 para fazer uma combinação de características fenotípicas interessantes.

Seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I também podem ser usadas como sondas para mapear geneticamente e fisicamente os genes dos quais elas são uma parte de, e como marcadores para características ligadas a tais genes. Tal informação pode ser 20 útil em reprodução de planta a fim de desenvolver linhagens com fenótipos desejados. Tal uso de seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. As seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I podem ser usadas como 25 marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de planta digerido por restrição podem ser sondados com as seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I. Os padrões de bandeamento resultantes podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, as seqüências de ácidos nucleicos podem ser usadas para sondar Southern blots 5 contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição da seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I no mapa genético previamente obtido usando 10 esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).

A produção e uso de sondas derivadas de genes de planta para uso em mapeamento genético é descrita em Bematzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones específicos de cDNA usando a metodologia 15 descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por versados na arte.

As sondas de ácido nucleico também podem ser usadas para

mapeamento físico (i.e., alocação de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas neste).

Em outra forma de realização, as sondas de ácido nucleico 25 podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores. Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando as seqüências de ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.

Os métodos de acordo com a presente invenção resultam em plantas tendo rendimento aumentado de sementes, como descrito acima. Estas características também podem ser combinadas com outras características economicamente vantajosas, tal como características acentuadoras de rendimento, tolerância a outros estresses abióticos e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.

Descrição detalhada da invenção CAH3

Surpreendentemente, foi descoberto agora que modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo YEP gera plantas tendo características relacionadas ao rendimento melhoradas sem efeitos em biomassa vegetativa, em relação às plantas de controle, caracterizado pelo fato de que o YEP é um CAH3. A classe 5 particular de polipeptídeos CAH3 adequados para melhorar características relacionadas ao rendimento em plantas é descrita em detalhe abaixo.

A presente invenção fornece um método para melhorar características relacionadas ao rendimento em plantas em relação às plantas de controle, compreendendo modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo CAH3. O termo “planta de controle” é como definido na seção “Definições” neste lugar.

No contexto da forma de realização se referindo a CAH3, qualquer referência daqui por diante a uma “proteína útil nos métodos da invenção” é adotada para significar um polipeptídeo CAH3 como definido 15 neste lugar. Qualquer referência daqui por diante a um “ácido nucleico útil nos métodos da invenção” é adotada para significar um ácido nucleico capaz de codificar um tal polipeptídeo CAH3. Os termos “polipeptídeo” e “proteína” são como definidos na seção “Definições” neste lugar. Os termos “polinucleotídeo(s)”, “seqüência(s) de ácidos nucleicos”, “seqüência(s) de 20 nucleotídeos” são como definidos na seção “Definições” neste lugar.

Um método preferido para modular (preferivelmente, aumentar) expressão de um ácido nucleico codificando uma proteína útil nos métodos da invenção é introduzir e expressar em uma planta um ácido nucleico codificando uma proteína útil nos métodos da invenção como definido abaixo.

O ácido nucleico a ser introduzido em uma planta (e, portanto útil para realizar os métodos da invenção) é qualquer ácido nucleico codificando o tipo de proteína que será agora descrito, daqui por diante também chamado “ácido nucleico CAH3” ou “gene CAH3”. Um polipeptídeo “CAH3” como definido neste lugar se refere a qualquer proteína tendo atividade de anidrase carbônica (EC 4.2.1.1). Anidrase carbônica também é conhecida como carbonato desidratase (nome aceito de acordo com Nomenclatura de Enzima de IUBMB), anidrase, carbonato anidrase, anidrase de ácido carbônico, carboxianidrase, e anidrase carbônica A. Métodos para ensaiar atividade enzimática de anidrase carbônica são conhecidos na arte; veja a Seção de Exemplos para detalhes adicionais.

Preferivelmente, a seqüência de aminoácidos da anidrase carbônica útil nos métodos da presente invenção compreende um ou mais dos seguintes motivos:

Motivo 1: (S/T)E(H/N)X(L/I/V/M)XXXX(F/Y/L/H)XX(E/D) X(H/Q)(L/I/V/M/F/A)(L/I/V/M/F/A) (SEQ ID NO: 203).

Preferivelmente, X em posição 4 em motivo 1 é um de: T, S, E, F, A, H, L; X em posição 6 preferivelmente é um de: N, D, S, Η, A, Μ; X em posição 7 preferivelmente é N ou G; X em posição 8 preferivelmente é um de: K, R, T, Q, E, V, A, K; X em posição 9 é preferivelmente um de: R, K, Q, L, Η, I, S; X em posição 11 preferivelmente é um de: V, A, D, N, P; X em posição 12 preferivelmente é um de: L, Μ, A; X em posição 14 é preferivelmente um de Q, E, L, A, V. Ainda preferivelmente, o resíduo em posição 16 é um de M, L, ou V; o resíduo em posição 17 é L ou V. Mais preferivelmente, a seqüência de motivo 1 é SEHAMDGRRYAMEAHLV.

Motivo 2: (L/N/Y/M/T/F/A/R)(A/V/S)V(V/I/L/T)(A/T/G/S) (F/V/I/L/S/T)(L/F/V/M) (SEQ ID NO: 204).

Preferivelmente, motivo 2 tem a seqüência (L/F/A/R)(A/V/S)V(V/I/L/T)(A/G/S)(F/V/I/L/T)(L/F/V/M). Mais

preferivelmente, motivo 2 tem a seqüência LAVLGIM.

Motivo 3: (Y/F) (Y/F/V/G/ A) (R/E/G/T /H) (Y/F )XG S (L/F/Y) T(T/V/A)PPC(S/T/G/D/A)(E/Q)(N/G/D/R) (SEQ ID NO: 205)

Preferivelmente, X é um de L, I, T, R, M, G, A, D, E, P. Mais preferivelmente, motivo 3 tem a seqüência FVHYPGSLTTPPCSEG. Preferivelmente, o polipeptídeo “CAH3” como definido neste lugar se refere a uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7 A, tende a se agrupar com a classe de polipeptídeos CAH3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 ao invés de com a classe beta ou gama.

Uma pessoa versada na arte pode determinar prontamente se qualquer seqüência de aminoácidos em questão cai dentro da definição de um polipeptídeo “CAH3” usando técnicas conhecidas e aplicativo computacional para a criação de uma tal árvore filogenética, tal como um pacote GCG, EBI ou CLUSTAL, usando parâmetros padrão. Qualquer agrupamento de seqüências dentro do grupo compreendendo SEQ ID NO: 81 deve ser considerado como caindo dentro da definição mencionada acima de um polipeptídeo CAH3, e deve ser considerado adequado para uso nos métodos da invenção.

Exemplos de proteínas úteis nos métodos da invenção e ácidos nucleicos codificando as mesmas são como dado abaixo em Tabela B na Seção de Exemplos.

Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de aminoácidos dadas em Tabela B. “Homólogos” de uma proteína são como definidos na seção “Definições” neste lugar.

Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídeos dados em Tabela B neste lugar ou ortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima. “Derivados” são definidos na seção “Definições” neste lugar.

A invenção é ilustrada transformando plantas com a seqüência de ácido nucleico de Chlamydomonas reinhardtii representada por SEQ ID NO: 80, codificando a seqüência de polipeptídeo de SEQ ID NO: 81, entretanto desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizados usando qualquer ácido nucleico codificando uma proteína útil nos métodos da invenção como 5 definido neste lugar, incluindo ortólogos e parálogos, tal como qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B neste lugar.

As seqüências de aminoácidos dadas em Tabela B de Exemplo

14 podem ser consideradas como sendo ortólogos e parálogos do polipeptídeo CAH3 representado por SEQ ID NO: 81. Ortólogos e parálogos são como definidos na seção “Definições” neste lugar.

Ortólogos e parálogos podem ser facilmente encontrados realizando uma assim chamada busca blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo, usando qualquer das seqüências listadas em Tabela B 15 neste lugar) contra qualquer banco de dados de seqüências, tal como o banco de dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré- determinados padrão) ao iniciar de uma seqüência protéica. Os resultados de 20 BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: 80 ou SEQ ID NO: 81, o segundo BLAST deve, portanto, ser contra 25 seqüências de Chlamydomonas reinhardtii). Os resultados do primeiro e segundo BLAST são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retorno então idealmente resulta na seqüência de consulta como maior acerto; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retorno na seqüência de consulta estando entre os maiores acertos.

Tabela B neste lugar fornece exemplos de ortólogos e parálogos da proteína CAH3 representada por SEQ ID NO 81. Ortólogos e parálogos adicionais podem ser prontamente identificados usando o procedimento BLAST descrito acima.

As proteínas da invenção são identificáveis pela presença do domínio conservado de anidrase carbônica (entrada Pfam PFOO194, InterPro IPROOl 148) (mostrado em Figura 6) e/ou por um dos motivos listados acima. O termo “domínio” é definido na seção “Definições” neste lugar. Veja a seção “Definições” para uma definição do termo “motivo” ou “seqüência consenso” ou “assinatura”.

Também existem bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244, InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., 5 Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para análise em silício de seqüências protéicas está disponível no servidor de proteômica ExPASY (hospedado pelo Swiss Institute of Bioinformatics 10 (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)).

Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos 15 incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) 20 calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento 25 de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Edição manual secundária pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar 5 seqüências de comprimento completo para a identificação de homólogos, domínios específicos (tal como um domínio de anidrase carbônica, ou um dos motivos definidos acima) também podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo na Seção de Exemplos como uma porcentagem foram determinados ao longo da seqüência inteira de ácidos 10 nucleicos ou de aminoácidos, e/ou ao longo de domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrão.

Além disso, proteínas CAH3 (pelo menos em sua forma nativa) tipicamente têm atividade de anidrase carbônica. Ensaios para

anidrase carbônica são bem conhecidos na arte e incluem ensaios titrimétricos e ensaios espectrofotométricos, veja, por exemplo, Karlsson et al. (Plant Physiol. 109: 533-539, 1995). Detalhes adicionais são fornecidos na Seção de Exemplos.

Ácidos nucleicos codificando proteínas úteis nos métodos da 20 invenção não precisam ser ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. Exemplos de ácidos nucleicos adequados para uso para realizar os métodos da invenção incluem as seqüências de ácidos nucleicos dadas em Tabela B neste lugar, 25 mas não são limitadas àquelas seqüências. Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluem porções de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, ácidos nucleicos hibridizando com ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes de união de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes alélicas de ácidos nucleicos codificando uma proteína útil nos métodos da invenção e variantes de ácidos nucleicos codificando uma proteína útil nos métodos da invenção que são obtidas por embaralhamento de gene. Os termos porção, seqüência hibridizante, variante de união, variante alélica e embaralhamento de gene serão descritos agora e também são definidos na seção “Definições” neste lugar.

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B neste lugar, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela B.

Porções úteis nos métodos da invenção codificam um polipeptídeo caindo dentro da definição de um ácido nucleico codificando uma proteína útil nos métodos da invenção como definido neste lugar e tendo substancialmente a mesma atividade biológica que as seqüências de aminoácidos dadas em Tabela B. Preferivelmente, a porção é uma porção de qualquer um dos ácidos nucleicos dados em Tabela B. A porção é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B. Mais preferivelmente a porção é uma porção do ácido nucleico de SEQ ID NO: 80. Preferivelmente, a porção codifica uma seqüência de aminoácidos compreendendo (qualquer um ou mais de) domínio de anidrase carbônica como definido neste lugar. Preferivelmente, a porção codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo 5 de proteínas CAH3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.

Uma porção de um ácido nucleico codificando uma proteína CAH3 como definido neste lugar pode ser preparada, por exemplo, fazendo uma ou mais deleções ao ácido nucleico. As porções podem ser usadas em 10 forma isolada ou elas podem ser fusionadas com outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de proteína 15 CAH3.

Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com um ácido nucleico codificando uma proteína CAH3 como definido neste lugar, ou com 20 uma porção como definido neste lugar. O termo “hibridização” é como definido na seção “Definições” neste lugar.

Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo tendo um domínio de anidrase carbônica (veja o alinhamento de Fig. 7) e tendo substancialmente a mesma atividade biológica 25 que a proteína CAH3 representada por qualquer uma das seqüências de aminoácidos dadas em Tabela B. A seqüência hibridizante é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com qualquer um dos 5 ácidos nucleicos dados em Tabela B, ou com uma porção de qualquer uma destas seqüências, uma porção sendo como definido acima. Mais preferivelmente, a seqüência hibridizante é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 80 ou com uma porção deste. Preferivelmente, a seqüência hibridizante codifica uma seqüência de 10 aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência hibridizante codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAH3 alfa compreendendo a seqüência de 15 aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico 20 capaz de hibridizar com qualquer um dos ácidos nucleicos dados na Tabela B, ou compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B.

Outra variante de ácido nucleico útil nos métodos da invenção

é uma variante de união codificando uma proteína CAH3 como definido acima. O termo “variante de união” sendo como definido neste lugar

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de união de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B, ou uma variante de união de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas 5 em Tabela B.

Variantes de união preferidas são variantes de união de um ácido nucleico representado por SEQ ID NO: 80 ou uma variante de união de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 81. Preferivelmente, a seqüência de aminoácidos codificada pela variante de 10 união compreende qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência de aminoácidos codificada pela variante de união, quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAH3 alfa compreendendo a seqüência de 15 aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.

Outra variante de ácido nucleico útil para realizar os métodos da invenção é uma variante alélica de um ácido nucleico codificando uma proteína CAH3 como definido acima. O termo “variante alélica” é como 20 definido neste lugar. As variantes alélicas úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica que a proteína CAH3 de SEQ ID NO: 81.

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, 25 compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados em Tabela B, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela B. Preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 80 ou uma variante alélica de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 81. Preferivelmente, a seqüência de aminoácidos codificada pela variante alélica compreende qualquer um ou 5 mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência de aminoácidos codificada pela variante alélica, quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAH3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 10 ao invés de com qualquer outro grupo.

Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de gene. Embaralhamento de gene ou evolução dirigida é como definido neste lugar

De acordo com a presente invenção, é fornecido um método

para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B, ou compreendendo introduzir e expressar em uma planta uma variante de um 20 ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela B, cujo ácido nucleico variante é obtido por embaralhamento de gene.

Preferivelmente, o ácido nucleico variante obtido por embaralhamento de gene codifica uma seqüência de aminoácidos 25 compreendendo qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência codificada de aminoácidos pelo ácido nucleico variante obtido por embaralhamento de gene, quando usada na construção de uma árvore filogenética de CAFI3 tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAFI3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.

Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese dirigida por sítio. Diversos métodos estão disponíveis 5 para atingir mutagênese dirigida por sítio, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).

Ácidos nucleicos codificando proteínas CAH3 podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente 10 genômico através de deliberada manipulação humana. Preferivelmente o ácido nucleico codificando CAH3 é de uma planta, ainda preferivelmente de uma alga, mais preferivelmente da família Chlamydomonadaceae, mais preferivelmente o ácido nucleico é de Chlamydomonas reinhardtii.

Qualquer referência neste lugar a uma proteína CAH3 é, portanto, adotada para significar uma proteína CAH3 como definido acima. Qualquer ácido nucleico codificando uma tal proteína CAH3 é adequado para uso para realizar os métodos da invenção.

A presente invenção também abrange plantas ou partes destas (incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico codificando uma proteína CAH3 como definido acima.

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de ácidos nucleicos úteis nos métodos de acordo com a invenção, em uma planta. As construções 25 genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção gênica como definido neste lugar nos métodos da invenção. Mais especificamente, a presente invenção fornece uma construção compreendendo

(a) ácido nucleico codificando proteína CAH3 como definido

acima;

(b) uma ou mais seqüências de controle capazes de dirigir

expressão da seqüência de ácido nucleico de (a); e opcionalmente (c) uma seqüência de término de transcrição.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo 10 CAH3 como definido neste lugar. O artesão versado está ciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos “elemento 15 regulador”, “seqüência de controle” e “promotor” são como definidos na seção “Definições” neste lugar. O termo “operacionalmente ligado” também é definido neste lugar.

Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão da seqüência de ácido nucleico. O termo “promotor” e 20 “Promotor de planta” são definidos na seção “Definições” neste lugar. O promotor pode ser um promotor constitutivo, como definido neste lugar. Alternativamente, o promotor pode ser um promotor induzível, também definido neste lugar. Adicionalmente ou alternativamente, o promotor pode ser um promotor órgão-específico ou tecido-específico, como definido neste 25 lugar.

Preferivelmente, o ácido nucleico CAH3 ou variante deste é operacionalmente ligado a um promotor específico de tecido verde jovem. Um promotor específico de tecido verde jovem como definido neste lugar é um promotor que é transcricionalmente ativo predominantemente em tecido verde jovem, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta. O promotor específico de tecido verde jovem é preferivelmente um promotor de protoclorofilida redutase (PcR), mais preferivelmente o promotor de protoclorofilida redutase representado por uma seqüência de ácido nucleico substancialmente similar a SEQ ID NO: 206, mais preferivelmente o promotor é como representado por SEQ ID NO: 206.

Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico codificando CAH3 representado por SEQ ID NO: 80, nem é a aplicabilidade da invenção restrita a expressão de um tal ácido nucleico codificando CAH3 quando dirigida por um promotor de protoclorofilida redutase. Exemplos de outros promotores específicos de tecido verde jovem que também podem ser usados para realizar os métodos da invenção são mostrados em Tabela 2g na seção “Definições” neste lugar.

Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como 18S rRNA, usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor” fraco é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido 5 em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por célula.

Opcionalmente, uma ou mais seqüências terminadoras podem

ser usadas na construção introduzida em uma planta, o termo “terminador” sendo como definido neste lugar. Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como transducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras 15 que podem ser adequadas para uso para realizar a invenção. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.

Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a 20 quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico até 1000 vezes (Buchman and Berg, Mol. Cell Biol. 8:4395- 4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal estimulação 25 intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral, veja The Maize Handbook, Chapter 1 16, Freeling and Walbot, Eds., Springer, N.Y. (1994). Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitados a, a fl-ori e colEl.

Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Veja seção “Definições” neste lugar para uma definição dos termos “marcador selecionável”, “gene marcador selecionável” ou “gene repórter”.

A invenção também fornece um método para a produção de plantas transgênicas tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle, compreendendo introdução e expressão em uma planta de qualquer ácido nucleico codificando uma proteína CAH3 como definido acima.

Para os propósitos da invenção, "transgênico", “transgene” ou “recombinante” são como definidos neste lugar na seção “Definições”. Uma “planta transgênica” é como definido na seção “Definições” neste lugar.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo rendimento aumentado, cujo método compreende: (i) introduzir e expressar em uma planta ou célula de planta um ácido nucleico CAH3 ou variante deste; e

O ácido nucleico pode ser introduzido diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.

O termo “introdução” ou “transformação” como referido neste lugar é como definido na seção “Definições”. As células de planta geneticamente modificadas podem ser regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hõfgen and Willmitzer.

Geralmente depois de transformação, células de planta ou agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material de planta obtido na transformação é, como uma regra, sujeito a condições seletivas de forma que plantas transformadas podem ser distinguidas de plantas não transformadas. Por exemplo, as sementes obtidas da maneira descrita acima podem ser plantadas e, depois de um período inicial de crescimento, sujeitas a uma seleção adequada por pulverização. Uma possibilidade adicional consiste em cultivar as sementes, se apropriado depois de esterilização, em placas de ágar usando um agente de seleção adequado de forma que apenas as sementes transformadas podem crescer até plantas. Alternativamente, as plantas transformadas são triadas para a presença de um marcador selecionável tal como aqueles descritos acima.

Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo, usando 5 análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.

As plantas transformadas geradas podem ser propagadas por

uma variedade de maneiras, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser autofecundada e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 então 15 podem ser adicionalmente propagadas através de técnicas clássicas de melhoramento.

Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e.g., todas 20 as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado em uma prole não transformada).

A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer dos métodos descritos neste lugar, 25 e a todas as partes de planta e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.

A invenção também inclui células hospedeiras contendo um ácido nucleico isolado codificando uma proteína CAH3 como definido acima.

Células hospedeiras preferidas de acordo com a invenção são células de planta.

Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.

A invenção também se estende a partes colhíveis de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores, caules, rizomas, raízes, tubérculos e bulbos. A invenção, além disso, se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte 15 colhível de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.

De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Os termos “expressão aumentada/superexpressão” são como definidos neste lugar.

Como mencionado acima, um método preferido para modular

(preferivelmente, aumentar) expressão de um ácido nucleico codificando uma proteína CAH3 é introduzir e expressar em uma planta um ácido nucleico codificando uma proteína CAH3; entretanto os efeitos de realizar o método, i.e. melhorar características relacionadas ao rendimento também pode ser 25 atingido usando outras técnicas bem conhecidas. Uma descrição de algumas destas técnicas seguirá agora.

Uma tal técnica é identificação por ativação de T-DNA, que é detalhada na seção “Definições” neste lugar. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Dirigidas em Genomas), também detalhada na seção “Definições” neste lugar.

Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga, que também é detalhada na seção 5 “Definições” neste lugar.

Referência neste lugar a características relacionadas ao rendimento melhoradas é adotada para significar um aumento em biomassa (peso) de uma ou mais partes de uma planta, o que pode incluir partes (aptas para corte) acima do solo e/ou partes (aptas para corte) abaixo do solo. Em 10 particular, tais partes colhíveis são sementes, e desempenho dos métodos da invenção resulta em plantas tendo rendimento aumentado de sementes em relação ao rendimento de sementes de plantas de controle adequadas.

O termo “rendimento” e “rendimento de sementes” são definidos na seção “Definições” neste lugar. Os termos “aumento”, “acentua” ou “melhora” também são definidos neste lugar.

Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de fileiras, número de 20 sementes por fileira, peso de semente, Peso de Mil Sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais 25 dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), aumento em Peso de Mil Sementes, entre outros.

Uma vez que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode permitir vigor melhorado. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de arroz adicionais todas dentro de um período de cultivo convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies de planta diferentes (por exemplo, a semeadura e colheita de plantas de milho seguido por, por exemplo, a semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo porta-enxerto no caso de algumas plantas de cultivo também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento em produção anual 5 de biomassa por acre (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma vez que as limitações territoriais para 10 cultivar um cultivo freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de crescimento, tais 15 parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% de seu tamanho máximo), entre outros.

De acordo com uma característica preferida da presente invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa 20 de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, cujo método compreende modular expressão, preferivelmente aumentar expressão, em uma planta de um ácido nucleico codificando uma proteína CAH3 como definido neste lugar.

Um aumento em rendimento e/ou taxa de crescimento ocorre

quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas de cultivo cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido á seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos. Em particular, os métodos da presente invenção podem ser

realizados em condições sem estresse ou em condições de seca branda para gerar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e 25 moleculares que afetam adversamente crescimento e produtividade de planta. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, 5 salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, regulagem positiva de antioxidantes, acumulação de solutos compatíveis e suspensão de 10 crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.

Desempenho dos métodos da invenção gera plantas cultivadas 15 em condições sem estresse ou em condições de seca branda rendimento aumentado em relação às plantas de controle adequadas cultivadas em condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda, cujo método 20 compreende aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo CAH3.

Em uma forma de realização preferida da invenção, o aumento em rendimento e/ou taxa de crescimento ocorre de acordo com os métodos da presente invenção em condições sem estresse.

Os métodos da invenção são vantajosamente aplicáveis a

qualquer planta, o termo “planta” é definido neste lugar e exemplos de plantas úteis nos métodos da invenção também são fornecidos.

De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. E’xemplos de plantas de cultivo incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia.

A presente invenção também abrange uso de ácidos nucleicos codificando a proteína CAH3 descrita neste lugar e uso destas proteínas CAH3 para melhorar características relacionadas ao rendimento em plantas.

Ácidos nucleicos codificando a proteína CAH3 descrita neste lugar, ou as próprias proteínas CAH3, podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene codificando CAH3. Os ácidos nucleicos/genes, ou as próprias proteínas CAH3 podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo características relacionadas ao rendimento melhoradas como definido acima nos métodos da invenção.

Variantes alélicas de um ácido nucleico/gene codificando proteína CAH3 também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram rendimento aumentado. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.

5 Ácidos nucleicos codificando proteínas CAH3 também podem

ser usados como sondas para mapear geneticamente e fisicamente os genes dos quais elas são uma parte de, e como marcadores para características ligadas a tais genes. Tal informação pode ser útil em reprodução de planta a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos 10 nucleicos codificando proteína CAH3 requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificando proteína CAH3 podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A 15 Laboratory Manual) de DNA genômico de planta digerido por restrição podem ser sondados com os ácidos nucleicos codificando proteína CAH3. Os padrões de bandeamento resultantes podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em 20 adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico codificando proteína CAH3 25 no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).

A produção e uso de sondas derivadas de genes de planta para uso em mapeamento genético é descrita em Bematzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones específicos de cDNA usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por versados na arte.

As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., alocação de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas neste).

Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.

Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de 5 ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.

Os métodos de acordo com a presente invenção resultam em plantas tendo características relacionadas ao rendimento melhoradas, como descrito acima. Estas características também podem ser combinadas com 10 outras características economicamente vantajosas, tal como características acentuadoras de rendimento adicionais, tolerância a outros estresses abióticos e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.

Descrição detalhada da invenção CLAVATA

Surpreendentemente, foi descoberto agora que aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um YEP, cujo YEP é um polipeptídeo com um domínio C-terminal não funcional, gera plantas tendo características relacionadas ao rendimento melhoradas em 20 relação às plantas de controle. A classe particular de polipeptídeos CLVl adequados para interromper a função biológica do domínio C-terminal para o propósito de melhorar características relacionadas ao rendimento em plantas em relação às plantas de controle é descrito em detalhe abaixo.

A presente invenção fornece um método para melhorar 25 características relacionadas ao rendimento em plantas em relação às plantas de controle, compreendendo aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional. O termo “planta de controle” é como definido na seção “Definições” neste lugar. Qualquer referência daqui por diante a uma “proteína útil nos métodos da invenção” é adotada para significar um polipeptídeo CLVl com um domínio C-terminal não funcional como definido neste lugar. Qualquer referência daqui por diante a uma “seqüência de ácido nucleico útil nos métodos da invenção” é adotada para significar uma seqüência de ácido nucleico capaz de codificar um tal polipeptídeo CLV1 com um domínio C- terminal não funcional. Os termos “polipeptídeo” e “proteína” são como definidos neste lugar e os termos “polinucleotídeo(s)”, “seqüência(s) de ácidos nucleicos”, “seqüência(s) de nucleotídeos” também são definidos na seção “Definições” neste lugar.

Um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional, é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido abaixo.

A seqüência de ácido nucleico a ser introduzida em uma planta (e, portanto útil para realizar os métodos da invenção) é qualquer seqüência de ácido nucleico codificando o tipo de polipeptídeo que será agora descrito.

Polipeptídeos CLV1 são bem conhecidos na arte e são facilmente identificáveis pela presença de término N a término C de: (i) um peptídeo sinal para direcionamento subcelular de ER; (ii) um domínio LRR extracelular compreendendo 20, 21, ou 22 LRRs; (iii) um domínio transmembrana; e (iv) um domínio intracelular de serina/treonina quinase (veja Figuras IOa e 11, e Exemplo 28). Além disso, um polipeptídeo CLVl pode compreender adicionalmente uma seqüência de aminoácidos com 50%, 60%, 70%, 80%, 90%, 95%, 98% ou mais identidade com SEQ ID NO: 212 (Exemplo 27).

Adicionalmente, um polipeptídeo CLVl pode compreender de término N a término C um ou ambos de: (i) Motivo 1 como representado por SEQ ID NO: 237; ou (ii) Motivo 2 como representado por SEQ ID NO: 238. Preferivelmente Motivo 1 e Motivo 2 são compreendidos entre o peptídeo sinal e o domínio LRR. A presença de Motivo 1 e Motivo 2 foi determinada como descrito em Exemplo 26.

5 Os aminoácidos mais conservados dentro de motivo 1 são

LXDW, e dentro de motivo 2 XHCXFXGVXCD (onde X é um subconjunto especificado de aminoácidos diferindo para cada posição, como apresentado em SEQ ID NO: 237 e SEQ ID NO: 238). Dentro de Motivo 1 e Motivo 2, são permitidas uma ou mais mudança conservativa em qualquer posição. 10 Alternativamente ou adicionalmente, dentro de Motivo 1 é permitida uma mudança não conservativa em qualquer posição, dentro de Motivo 2 são permitidas uma, duas ou três mudança(s) não conservativa(s) em qualquer posição.

Alternativamente ou adicionalmente, um polipeptídeo CLVl 15 como definido neste lugar se refere a qualquer polipeptídeo que quando usado na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de 20 polipeptídeos LRR-RLK.

Uma pessoa versada na arte pode determinar prontamente se qualquer seqüência de aminoácidos em questão cai dentro da definição de um polipeptídeo “CLV1” usando técnicas conhecidas e aplicativo computacional para a criação de uma tal árvore filogenética, tal como um pacote GCG, EBI 25 ou CLUSTAL, usando parâmetros padrão. Qualquer agrupamento de seqüências de aminoácidos dentro do grupo compreendendo SEQ ID NO: 212 deve ser considerado como caindo dentro da definição mencionada acima de um polipeptídeo CLV1, e deve ser considerado adequado para uso nos métodos da invenção. Tais métodos são descritos em Exemplo 25. Qualquer polipeptídeo CLVl é tomado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal deste polipeptídeo CLV1. Tais métodos (para interromper a função biológica) são bem conhecidos na arte e incluem: remoção, substituição e/ou inserção de 5 aminoácidos do domínio C-terminal do polipeptídeo CLV1. Exemplos de tais métodos são descritos em Exemplo 31. Um ou mais aminoácido(s) do domínio C-terminal de um polipeptídeo CLVl pode(m) ser removido(s), substituído(s) e/ou inserido(s).

Para os propósitos deste pedido, o domínio C-terminal de um polipeptídeo CLVl é adotada para significar a seqüência de aminoácidos seguindo a seqüência de aminoácidos codificando o domínio transmembrana (de término N a término C) (veja Figuras 10 e 11), e compreende: (i) o domínio de quinase; e (ii) um ou mais aminoácido(s) fosforilatável(eis).

Um exemplo de um polipeptídeo CLV1 tendo um domínio Ο- Ι 5 terminal não funcional é o polipeptídeo representado por SEQ ID NO: 210, com seqüência codificante de ácido nucleico representada por SEQ ID NO: 209. A seqüência de aminoácidos começando o resíduo de Arg (R) do motivo RLL de subdomínio IV de quinase (veja Figura 11) e terminando no término C do polipeptídeo CLVl de comprimento completo (como representado por 20 SEQ ID NO: 212) foi removida.

Exemplos de polipeptídeos CLVl são dados em Tabela C na Seção de Exemplos neste lugar; estas seqüências são tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo, por exemplo, usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de aminoácidos dadas em Tabela C neste lugar, o termo “Homólogos” sendo como definido neste lugar.

Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídeos dados em Tabela C ou ortólogos ou parálogos de qualquer das SEQ ID NOs dadas em Tabela C. “Derivados” também são definidos neste lugar.

A invenção é ilustrada transformando plantas com a seqüência de ácido nucleico de Arabidopsis thaliana representada por SEQ ID NO: 209 (compreendida em SEQ ID NO: 211), codificando a seqüência de polipeptídeo de SEQ ID NO: 210 (compreendida em SEQ ID NO: 212), entretanto desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizados usando qualquer seqüência de ácido nucleico codificando um polipeptídeo CLVl tendo um domínio C-terminal não funcional como definido neste lugar, incluindo ortólogos e parálogos, tal como qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C de Exemplo 25, tendo um domínio C-terminal não funcional, por exemplo, usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

As seqüências de aminoácidos dadas em Tabela C neste lugar podem ser consideradas como sendo ortólogos e parálogos do polipeptídeo CLVl representado por SEQ ID NO: 212. Ortólogos e parálogos sendo como definidos neste lugar.

Ortólogos e parálogos podem ser facilmente encontrados

realizando uma assim chamada busca blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo, usando qualquer das seqüências listadas em Tabela C) contra qualquer banco de dados de seqüências, tal como o banco de dados 25 publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência protéica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: 211 ou SEQ ID NO: 212, o segundo BLAST deve, portanto, ser contra seqüências de Arabidopsis). Os resultados do primeiro e segundo BLAST são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retomo então idealmente resulta na seqüência de consulta como maior acerto; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retomo na seqüência de consulta estando entre os maiores acertos.

Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). Computação do valor E é bem conhecida na arte. Em adição a valores E, comparações também são pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos. Seqüências assim identificadas podem ser subseqüentemente tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo, por exemplo, usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

Tabela C de Exemplo 25 fornece exemplos de ortólogos e parálogos do polipeptídeo CLVl representado por SEQ ID NO 212. Ortólogos e parálogos adicionais podem ser prontamente identificados usando o procedimento BLAST descrito acima. Seqüências assim identificadas são subseqüentemente tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo, por exemplo, 5 usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

As proteínas da invenção são identificáveis pela presença de domínios específicos, o termo “domínio” sendo como definido neste lugar. O termo “motivo” ou “seqüência consenso” ou “assinatura” também é definido neste lugar.

Também existem bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), 15 Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., 20 Nucl. Acids. Res. 32:D134-D137, (2004), ou PFam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para análise em silício de seqüências protéicas está disponível no servidor de proteômica ExPASY (hospedado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomies server for in-depth protein 25 knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Em Exemplo 28, são listados os números de acesso de entrada dos diferentes domínios identificados realizando uma tal análise. Por exemplo, uma repetição rica em leucina tem um número de acesso de InterPro IPROO1611, um número de acesso de Prints PROOO19, e um número de acesso de PFam PF00560. O domínio LRR compreende 20, 21 ou 22 tais repetições ricas em leucina (LRR)s. O domínio de quinase é identificado por número de acesso de InterPro IPR000719, um número de acesso de PFam PF00069, um número de acesso de Prosite PS50011 e um número de acesso de ProDom PD000001.

5 Em adição, o sítio ativo de domínio de quinase também é identificado, como IPR008271. Mutação(ões) dentro deste sítio pode(m) ser introduzida(s) para abolir (ou reduzir) atividade de quinase, que é um método de interromper a função biológica o domínio C-terminal de um polipeptídeo CVLl útil para realizar os métodos da invenção.

Algoritmos de aplicativos computacionais estão disponíveis

para predizer localização subcelular de um polipeptídeo, ou para predizer a presença de domínios transmembrana. Em Exemplo 30, o algoritmo TargetP 1.1 e o algoritmo TMFIMM2.0 são respectivamente usados para predizer que o polipeptídeo CLVl como representado por SEQ ID NO: 212 15 apresente em seu término N um peptídeo sinal para direcionamento de ER (retículo endoplasmático), e compreenda um domínio transmembrana (através da membrana plasmática). Além disso, o algoritmo TMHMM2.0 prediz que o domínio LRR esteja localizado fora da célula (para atuar como um receptor extracelular), ao passo que o domínio de quinase esteja localizado dentro da 20 célula (para atuar como um transdutor de sinal).

Domínios e motivos também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o 25 algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Edição manual secundária pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar seqüências de comprimento completo para a identificação de homólogos, domínios específicos (tal como o domínio LRR ou o domínio de quinase, ou um dos motivos definidos neste lugar) também podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo em Exemplo 3 como uma porcentagem foram determinados ao longo da seqüência inteira de ácidos nucleicos ou de aminoácidos, e/ou ao longo de domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrão. Preferivelmente, um polipeptídeo CLVl tem 50%, 60%, 70%), 80%), 90%o, 95%, 98% ou mais identidade de seqüência de aminoácidos com SEQ ID NO: 212 (Exemplo 27). Depois de sua identificação, um polipeptídeo CLVl é tornado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo como descrito neste lugar.

Em algumas instâncias, parâmetros padrão podem ser ajustados para modificar a estringência da busca. Por exemplo usando BLAST, o limiar de signifícâneia estatística (chamado valor “esperado”) para relatar pareamentos contra seqüências de banco de dados pode ser aumentado para mostrar pareamentos menos estringentes. Desta maneira, pequenos pareamentos praticamente exatos podem ser identificados. Motivo 1 como representado por SEQ ID NO: 237 e Motivo 2 como representado por SEQ ID NO: 238 ambos compreendidos em polipeptídeos CLVl úteis nos métodos da invenção podem ser identificados desta maneira (Figura 11, Exemplo 26). Preferivelmente Motivo 1 e Motivo 2 são compreendidos entre o peptídeo sinal e o domínio LRR.

Os aminoácidos mais conservados dentro de motivo 1 são LXDW, e dentro de motivo 2 XHCXFXGVXCD (onde X é um subconjunto especificado de aminoácidos diferindo para cada posição, como apresentado em SEQ ID NO: 237 e SEQ ID NO: 238). Dentro de Motivo 1 e Motivo 2, são permitidas uma ou mais mudança conservativa em qualquer posição. Alternativamente ou adicionalmente, dentro de motivo 1 é permitida uma mudança não conservativa em qualquer posição, dentro de motivo 2 são permitidas uma, duas ou três mudança(s) não conservativa(s) em qualquer posição.

Polipeptídeos CLVl em sua forma nativa tipicamente têm atividade de quinase e são capazes de autofosforilação. Ensaios de quinase são facilmente realizados e são bem conhecidos na arte. Além disso, polipeptídeos CLVl são capazes de interagir com outros polipeptídeos in planta (CLV3, KAPP e mais) e in vitro (tal como com KAPP em um ensaio de dois híbridos em levedura; Trotochaud et al. (1999) Plant Cell 11, 393- 406). Depois de sua identificação, um polipeptídeo CLVl é tornado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo. Detalhes adicionais são fornecidos em Exemplo 31.

Seqüências de ácidos nucleicos codificando proteínas úteis nos métodos da invenção não precisam ser seqüências de ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. Exemplos de seqüências de ácidos nucleicos adequadas para uso para realizar os métodos da invenção incluem as seqüências de ácidos 5 nucleicos dadas em Tabela C, mas não são limitadas àquelas seqüências. Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluem porções de seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, seqüências de ácidos nucleicos hibridizando com 10 seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes de união de seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes alélicas de seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção e variantes de seqüências de ácidos nucleicos codificando uma proteína útil nos 15 métodos da invenção que são obtidas por embaralhamento de gene. Os termos porção, seqüência hibridizante, variante de união, variante alélica, variante obtida por embaralhamento de gene, e variante obtida por mutagênese dirigida por sítio serão descritos agora.

De acordo com a presente invenção, é fornecido um método 20 para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou uma porção de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela 25 C de Exemplo 25. Depois de sua identificação, um polipeptídeo CLVl é tomado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo.

Porções úteis nos métodos da invenção codificam um polipeptídeo caindo dentro da definição de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido neste lugar. A porção tipicamente carece da seqüência de ácido nucleico codificando o domínio C-terminal ou partes deste (de término N a término C, a seqüência de ácido nucleico depois da seqüência 5 de ácido nucleico codificando o domínio transmembrana). Preferivelmente, a porção é uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C de Exemplo 25. Mais preferivelmente, a porção é uma porção da seqüência de ácido nucleico de SEQ ID NO: 211. Mais preferivelmente, a porção é como representado por SEQ ID NO: 209.

Uma porção de uma seqüência de ácido nucleico codificando

um polipeptídeo CLVl com um domínio C-terminal não funcional como definido neste lugar pode ser preparada, por exemplo, fazendo uma ou mais deleções à seqüência de ácido nucleico. As porções podem ser usadas em forma isolada ou elas podem ser fusionadas a outras seqüências de 15 codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de polipeptídeo CLV1.

Outra variante de ácido nucleico útil nos métodos da invenção

é uma seqüência de ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com uma seqüência de ácido nucleico codificando um polipeptídeo CLVl como definido neste lugar, ou com uma porção como definido neste lugar. O termo “hibridização” é como definido neste lugar.

Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo CLVl como representado por qualquer uma das seqüências de aminoácidos dadas em Tabela C de Exemplo 25. A seqüência hibridizante é tipicamente de pelo menos 500 ou 1000 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 1500 ou 2000 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 2500 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 2900 nucleotídeos consecutivos de comprimento, os nucleotídeos 5 consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou com uma porção de qualquer uma destas seqüências, uma porção sendo como definido acima. Mais preferivelmente, a seqüência 10 hibridizante é capaz de hibridizar com uma seqüência de ácido nucleico como representado por SEQ ID NO: 211 ou com uma porção desta. Preferivelmente, a seqüência hibridizante codifica uma seqüência de aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência hibridizante codifica 15 uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. 20 Tais seqüências hibridizantes são úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

De acordo com a presente invenção, é fornecido um método 25 para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar com qualquer uma das seqüências de ácidos nucleicos dados na Tabela C, ou compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C. Tais seqüências hibridizantes são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo 5 codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de união codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional. O termo “variante de união” sendo como definido neste lugar.

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de união de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou 15 uma variante de união de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C. Tais variantes de união são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C- terminal do polipeptídeo codificado, por exemplo usando qualquer dos 20 métodos (para interromper a função biológica) discutidos neste lugar.

Variantes de união preferidas são variantes de união de uma seqüência de ácido nucleico representada por SEQ ID NO: 211 ou uma variante de união de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 212. Preferivelmente, a seqüência de 25 aminoácidos codificada pela variante de união, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes de união são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

5 Outra variante de ácido nucleico útil para realizar os métodos

da invenção é uma variante alélica de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional. Alelos ou variantes alélicas são formas alternativas de um dado gene, localizadas na mesma posição cromossômica. Variantes alélicas existem 10 na natureza, e abrangido dentro dos métodos da presente invenção é o uso destes alelos naturais. Variantes alélicas abrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de 15 seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos.

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de 20 qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou compreendendo introduzir e expressar em uma planta uma variante alélica de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C. Tais variantes alélicas são tomadas úteis nos métodos da invenção 25 rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

Preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 211 ou uma variante alélica de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 212. Preferivelmente, a seqüência de aminoácidos codificada pela variante alélica, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo 5 a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes alélicas são tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a 10 função biológica) discutidos neste lugar.

Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de gene. Embaralhamento de gene ou evolução dirigida também podem ser usados para gerar variantes de seqüências de ácidos nucleicos codificando um 15 polipeptídeo CLVl com um domínio C-terminal não funcional. Isto consiste de repetições de embaralhamento de DNA seguido por triagem e/ou seleção apropriada para gerar variantes de seqüências de ácidos nucleicos ou porções destas codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima (Castle et al., (2004) Science 304(5674): 20 1151-4; PatentesNorte-Americanas 5.811.238 e 6.395.547).

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou 25 compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C, cuja seqüência de variante de ácido nucleico é obtida por embaralhamento de gene.

Preferivelmente, a seqüência de aminoácidos codificada pela seqüência de ácido nucleico variante obtida por embaralhamento de gene, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes obtidas por embaralhamento de gene são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese dirigida por sítio. Diversos métodos estão disponíveis para atingir mutagênese dirigida por sítio, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds). Alvos de mutagênese dirigida por sítio com o objetivo de gerar variantes de seqüência de ácido nucleico codificando um polipeptídeo CLYl com um domínio C-terminal não funcional, são descritos em Exemplo 31.

De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C, cuja seqüência de ácido nucleico variante é obtida por mutagênese dirigida por sítio.

Preferivelmente, a seqüência de aminoácidos codificada pela seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes obtidas por 5 mutagênese dirigida por sítio são tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.

As seguintes variantes de ácidos nucleicos codificando um polipeptídeo CLVl com um domínio C-terminal não funcional, são exemplos de variantes adequadas para praticar os métodos da invenção:

(i) uma porção de uma seqüência de ácido nucleico codificando um CLV1; ou

(ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico codificando um polipeptídeo CLV1; ou

(iii)uma variante de união de uma seqüência de ácido nucleico codificando um polipeptídeo CLV1; ou

(iv) uma variante alélica de uma seqüência de ácido nucleico codificando um CLV1; ou

(v) uma seqüência de ácido nucleico codificando um

polipeptídeo CLV1 obtida por embaralhamento de gene; ou

(vi) uma seqüência de ácido nucleico codificando um polipeptídeo CLVl obtida por mutagênese dirigida por sítio;

caracterizado pelo fato de que a seqüência de ácido nucleico em (i) a (vi) codifica um polipeptídeo CLVl com um domínio não funcional.

Seqüências de ácidos nucleicos codificando um polipeptídeo CLVl com um domínio C-terminal não funcional podem ser derivadas de qualquer fonte natural ou artificial. A seqüência de ácido nucleico pode ser modificada a partir de sua forma nativa em composição e/ou ambiente genômico através de deliberada manipulação humana. Preferivelmente uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional é de uma planta, ainda preferivelmente de uma dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente a seqüência de ácido nucleico é de Arabidopsis thaliana.

Qualquer referência neste lugar a um polipeptídeo CLV1 com um domínio C-terminal não funcional é portanto adotada para significar um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido acima. Qualquer seqüência de ácido nucleico codificando um tal polipeptídeo 10 CLVl com um domínio C-terminal não funcional é adequada para uso para realizar os métodos da invenção.

A presente invenção também abrange plantas ou partes destas (incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima.

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de ácidos nucleicos úteis nos métodos de acordo com a invenção, em uma planta. As construções 20 genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção como definido neste lugar nos métodos da invenção.

Mais especificamente, a presente invenção fornece uma

construção compreendendo

(a) uma seqüência de ácido nucleico codificando polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima;

(c) uma seqüência de término de transcrição.

Em uma forma de realização, a seqüência de controle de uma construção é um promotor tecido específico para expressão em tecidos jovens em expansão. Um exemplo de um promotor tecido específico para expressão em tecidos jovens em expansão é o promotor de beta-expansina.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido 10 neste lugar. O artesão versado está ciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos “elemento regulador”, “seqüência de 15 controle” e “promotor” são como definidos neste lugar. O termo “operacionalmente ligado” também é definido neste lugar.

Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão da seqüência de ácido nucleico. O temo “promotor” e “Promotor de planta” são como definidos neste lugar.

O promotor pode ser um promotor constitutivo, como definido

neste lugar. Alternativamente, o promotor pode ser um promotor induzível, como definido neste lugar. Adicionalmente ou alternativamente, o promotor pode ser um promotor órgão-específico ou tecido-específico, como definido neste lugar.

Em uma forma de realização, uma seqüência de ácido

nucleico codificando polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima, tal como a seqüência de ácido nucleico como representada por SEQ ID NO: 209, é operacionalmente ligada a um promotor capaz de expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão, ou no meristema apical. Preferivelmente, o promotor capaz de expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão tem um perfil de expressão comparável com um promotor de beta-expansina. Mais especificamente, o promotor capaz de 5 expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão é um promotor capaz de dirigir expressão na zona de expansão celular de uma parte aérea ou raiz. Mais preferivelmente, o promotor capaz de expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão é o promotor de beta-expansina (SEQ ID NO: 241).

Para a identificação de promotores funcionalmente

equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado por exemplo ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos 15 adequados incluem por exemplo beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). 20 Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA da seqüência de ácido nucleico usada nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como 18S rRNA, usando métodos conhecidos na arte, tal como Northern blotting com análise 25 densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor” fraco é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou a cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por célula.

5 Opcionalmente, uma ou mais seqüências terminadoras podem

ser usadas na construção introduzida em uma planta, o termo “terminador” sendo como definido neste lugar. Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como transducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras 10 que podem ser adequadas para uso para realizar a invenção. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.

Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a 15 quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico até 1000 vezes (Buchman and Berg, Mol. Cell Biol. 8:4395- 4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal estimulação 20 intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral, veja The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

Outras seqüências de controle (além de promotor, acentuador,

silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte. As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitados a, a fl-ori e colEl.

Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estas seqüências de ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Veja a seção “Definições” neste lugar para uma descrição dos termos “marcador selecionável”, “gene marcador selecionável” ou “gene repórter”.

A invenção também fornece um método para a produção de plantas transgênicas tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle, compreendendo introdução e expressão em uma planta de qualquer seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido acima. Os significados de termos “transgênico”, “transgene” ou “recombinante” são definidos neste lugar.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo características relacionadas ao rendimento melhoradas, cujo método compreende:

(i) introduzir e expressar em uma planta ou célula de planta uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional, ou variante deste; e

(ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta. A seqüência de ácido nucleico pode ser introduzida diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, a seqüência de ácido nucleico é preferivelmente introduzida em uma planta por transformação. O termo “introdução” ou “transformação” é como definido neste lugar.

As células de planta geneticamente modificadas podem ser regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hofgen and Willmitzer.

Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo usando análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.

A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes de planta e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.

A invenção também inclui células hospedeiras contendo uma seqüência isolada de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima. Células hospedeiras preferidas de acordo com a invenção são células de planta.

Plantas hospedeiras para as seqüências de ácidos nucleicos ou o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.

Uma planta para os propósitos da invenção é assim entendida como significando, como acima, que as seqüências de ácidos nucleicos usadas no método da invenção não estão em seu locus natural no genoma de dita planta, sendo possível para as seqüências de ácidos nucleicos serem expressas homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, embora as seqüências de ácidos nucleicos de acordo com a invenção ou usadas no método inventivo estejam em sua posição natural no genoma de uma planta, a seqüência foi modificada em relação à seqüência natural, e/ou que as seqüências reguladoras das seqüências naturais foram modificadas. Transgênica é preferivelmente entendida como significando a expressão das seqüências de ácidos nucleicos de acordo com a invenção em um locus não natural no genoma, i.e. expressão homóloga ou, preferivelmente, heteróloga das seqüências de ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar.

A invenção também se estende a partes colhíveis de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores, caules, rizomas, raízes, tubérculos e bulbos. A invenção além disso se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.

Métodos para aumentar expressão de seqüências de ácidos nucleicos ou genes, ou produtos de gene, são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Seqüências isoladas de ácidos nucleicos que servem como elementos promotores ou acentuadores podem ser introduzidas em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte- Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula de planta na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.

Uma seqüência intrônica também pode ser adicionada como

descrito acima.

Como mencionado acima, um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional; entretanto os efeitos de realizar o método, i.e. melhorar características relacionadas ao rendimento também pode ser atingido usando outras técnicas bem conhecidas. Exemplos de tais técnicas incluem identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), como descrito na seção “Definições” neste lugar. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Dirigidas em Genomas). Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga. Para detalhes destas técnicas, veja a seção “Definições” neste lugar.

Referência neste lugar a características relacionadas ao rendimento melhoradas é adotada para significar um aumento em biomassa (peso) de uma ou mais partes de uma planta, o que pode incluir partes (aptas para corte) acima do solo e/ou partes (aptas para corte) abaixo do solo.

Em particular, tais partes colhíveis são sementes, e desempenho dos métodos da invenção resulta em plantas tendo rendimento aumentado de sementes em relação ao rendimento de sementes de plantas de controle adequadas.

Os termos “rendimento” e “rendimento de sementes” são como definidos na seção “Definições” neste lugar. Os termos “aumento”, “melhorar” ou “melhora” também são descritos neste lugar.

(ii) número aumentado de panículas por planta

(iii)número aumentado de flores (“floretes”) por panícula

(iv) taxa de enchimento de grãos aumentada

(v) número aumentado de grãos (cheios);

(vii) volume aumentado de semente, o que também pode influenciar a composição de sementes;

(viii) índice de colheita aumentado, que é expresso como uma proporção do rendimento de partes colhíveis, tal como sementes, sobre a biomassa total; e

(ix)Peso de Mil Sementes (TKW) aumentado, que é extrapolado a partir do número de grãos cheios contados e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado. Um TKW aumentado pode resultar de um aumento em tamanho de embrião e/ou tamanho de endosperma.

Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente. Além disso, um aumento em rendimento de sementes também pode ser manifestado como um aumento em área de semente e/ou comprimento de semente e/ou largura de semente e/ou perímetro de semente. Rendimento aumentado também pode resultar em arquitetura modificada, ou pode ocorrer por causa de arquitetura modificada.

Em particular, características relacionadas ao rendimento melhoradas é adotado para significar um ou mais dos seguintes: (i) aumento em biomassa aérea; (ii) aumento em biomassa de raiz; (iii) aumento em biomassa de raízes finas; (iv) número aumentado de panículas primárias; (v) número aumentado de flores por panícula; (vi) rendimento de sementes total aumentado; (vii) número aumentado de grãos cheios; (viii) número total de sementes aumentado; ou (ix) índice de colheita aumentado. Portanto, de acordo com a presente invenção, é fornecido um método para melhorar uma ou mais dos seguintes características relacionadas ao rendimento: (i) aumento em biomassa aérea; (ii) aumento em biomassa de raiz; (iii) aumento em biomassa de raízes finas; (iv) número aumentado de panículas primárias; (v) número aumentado de flores por panícula; (vi) rendimento de sementes total aumentado; (vii) número aumentado de grãos cheios; (viii) número total de sementes aumentado; ou (ix) índice de colheita aumentado, em relação às plantas de controle, cujo método compreende aumentar expressão, em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional.

Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de fileiras, número de sementes por fileira, peso de semente, Peso de Mil Sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), aumento em Peso de Mil Sementes, entre outros.

Uma vez que as plantas transgênicas de acordo com a presente invenção têm características relacionadas ao rendimento melhoradas, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes 5 maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo 10 de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode permitir vigor melhorado. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido 15 com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de arroz adicionais todas dentro de um período de cultivo convencional). 20 Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies de planta diferentes (por exemplo a semeadura e colheita de plantas de milho seguido por, por exemplo, a semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo porta-enxerto no 25 caso de algumas plantas de cultivo também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento em produção anual de biomassa por acre (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma vez que as limitações territoriais para cultivar um cultivo freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% de seu tamanho máximo), entre outros.

De acordo com uma característica preferida da presente invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas em relação às plantas de controle, cujo método compreende aumentar expressão, em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 como definido neste lugar.

Um aumento em rendimento e/ou taxa de crescimento ocorre quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%), 12%, 11%) ou 10%> ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas de cultivo cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável 5 para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido à seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por 10 um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos.

Em particular, os métodos da presente invenção podem ser realizados em condições sem estresse ou em condições de seca branda para 15 gerar plantas tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade de planta. Seca, salinidade, temperaturas extremas e estresse 20 oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse 25 osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, regulagem positiva de antioxidantes, acumulação de solutos compatíveis e suspensão de crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.

Desempenho dos métodos da invenção gera plantas cultivadas em condições sem estresse ou em condições de seca branda características relacionadas ao rendimento melhoradas em relação às plantas de controle adequadas cultivadas em condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda, cujo método compreende aumentar expressão em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional.

Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. O termo “planta” é definido na seção “Definições” neste lugar e exemplos de plantas adequadas úteis na presente invenção também são descritos.

De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Exemplos de plantas de cultivo incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia. A presente invenção também abrange uso de seqüências de ácidos nucleicos codificando um polipeptídeo CLVl com um domínio C- terminal não funcional como descrito neste lugar, e uso destes polipeptídeos CLVl com um domínio C-terminal não funcional para melhorar 5 características relacionadas ao rendimento em plantas.

Seqüências de ácidos nucleicos codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional descrito neste lugar, ou os próprios polipeptídeos CLVl com um domínio C-terminal não funcional, podem encontrar uso em programas de melhoramento nos quais é identificado 10 um marcador de DNA que pode ser geneticamente ligado a um gene codificando um polipeptídeo CLVl com um domínio C-terminal não funcional. Os genes/seqüências de ácidos nucleicos, ou os próprios polipeptídeos CLVl com um domínio C-terminal não funcional podem ser usados para definir um marcador molecular. Este marcador de DNA ou 15 proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo características relacionadas ao rendimento melhoradas como definido acima nos métodos da invenção.

Variantes alélicas de um gene/seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não 20 funcional, também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada 25 origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram características relacionadas ao rendimento melhoradas. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.

Seqüências de ácidos nucleicos codificando polipeptídeos CLV1 com um domínio C-terminal não funcional também podem ser usadas como sondas para mapear geneticamente e fisicamente os genes dos quais elas são uma parte de, e como marcadores para características ligadas a tais genes. Tal informação pode ser útil em reprodução de planta a fim de desenvolver linhagens com fenótipos desejados. Tal uso de seqüências de ácidos nucleicos codificando polipeptídeos CLVl requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificando polipeptídeos CLV1 podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de planta digerido por restrição podem ser sondados com as seqüências de ácidos nucleicos codificando polipeptídeos CLV1. Os padrões de bandeamento resultantes podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics I: 174- 181) a fim de construir um mapa genético. Em adição, as seqüências de ácidos nucleicos podem ser usadas para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição da seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).

A produção e uso de sondas derivadas de genes de planta para uso em mapeamento genético é descrita em Bernatzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem 5 mapeamento genético de clones específicos de cDNA usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas IO por versados na arte.

Em outra forma de realização, as sondas de ácido nucleico

podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 20 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.

Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando as seqüências de ácidos nucleicos. Exemplos incluem amplificação alelo 25 específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nueleie Aeid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.

Os métodos de acordo com a presente invenção resultam em plantas tendo características relacionadas ao rendimento melhoradas, como descrito acima. Estas características também podem ser combinadas com outras características economicamente vantajosas, tal como características acentuadoras de rendimento adicionais, tolerância a outros estresses abióticos e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.

Descrição de figuras

A presente invenção será agora descrita com referência às figuras seguintes nas quais:

Fig. 1 mostra uma árvore filogenética de todos os polipeptídeos TCP de Arabidopsis thaliana de acordo com o Arabidopsis Database for Transcription factors, disponível no Center for Bioinformatics(CBI), Peking University, China. O ciado de interesse, compreendendo dois parálogos de Arabidopsis At3g27010 (também chamado AtTCP20 ou PCF1) e At5g41030 (também chamado TCP 6), foi circulado.

Fig. 2 mostra um alinhamento múltiplo de diversos polipeptídeos TCP de Classe I de planta de Tabela A (quando de seqüências de ácidos nucleicos de comprimento completo), usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma penalidade de extensão de 0,05). O domínio conservado de TCP 5 (compreendendo o bHLH) dentro das seqüências de polipeptídeos úteis para realizar os métodos da invenção é expressivamente encaixotado. Os resíduos básicos (em negrito na linha consenso) as seqüências de Hélice-Alça-Hélice (HLH) são ligeiramente encaixotados, assim como o motivo consenso C- terminal PGLEL(G/R/A)LSQX,_5G(V/L)L, onde X é qualquer aminoácido 10 (SEQ ID NO: 65). A região rica em HQ (H sendo histidina, Q glutamina) é igualmente ligeiramente encaixotada.

Fig. 3 A) mostra um alinhamento das seqüências de polipeptídeos TCP de Classe I de Tabela A codificando a estrutura de Hélice- Alça-Hélice básico (bHLH). Ao considerar a seqüência de polipeptídeo de 15 término N a término C, os resíduos básicos precedem o Hélice-Alça-Hélice. 3B) é um desenho representando a estrutura primária das seqüências de polipeptídeos úteis para realizar os métodos da invenção, de término N a término C: um domínio conservado de TCP compreendendo o Hélice-Alça- Hélice básico (bHLH), um motivo consenso C-terminal, e uma região rica em 20 HQ.

Fig. 4 mostra o vetor binário para expressão aumentada em Oryza sativa de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I sob o controle de um promotor GOS2.

Fig. 5 detalha exemplos de seqüências de TCP de Classe I úteis para realizar os métodos de acordo com a presente invenção.

Fig. 6 mostra a estrutura de domínio do polipeptídeo CAH3 apresentado em SEQ ID NO: 81.0 domínio de anidrase carbônica (entrada de Pfam PFOO194) é indicado em negrito sublinhado.

Fig. 7 mostra respectivamente uma árvore filogenética construída a partir das seqüências listadas em Figura 9 (A), e um alinhamento múltiplo de seqüências de proteína CAH3 pertencendo à classe alfa (B).

Fig. 8 mostra o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico codificando proteína CAH3 de Chlamydomonas reinhardtii sob o controle de um promotor de protoclorofilida redutase (PcR).

Fig. 9 detalha exemplos de seqüências de CAH3 úteis para realizar os métodos de acordo com a presente invenção.

Fig. 10 (A) mostra a estrutura de domínio prevista de um polipeptídeo LRR-RLK tal como representado por SEQ ID NO: 212; de término N a término C: (i) SP, peptídeo sinal; (ii) 21 LRRs, as 21 repetições ricas em leucina; (iii) TM, domínio transmembrana; e (iv) o domínio de quinase. A linha vertical em negrito é colocada na extremidade do domínio transmembrana. De acordo com Bommert et al. (2004) Development 132: 1235-1245.

Fig. 10 (B) mostra uma árvore filogenética como descrito em Bommert et al. (2004). Seqüências de polipeptídeos úteis para realizar os métodos da invenção devem se agrupar com o ciado compreendendo o polipeptídeo CLYl (chamado “subfamília” A), como delimitado na figura pelo colchete. CLVl é como representado por SEQ ID NO: 212.

Fig. 11 Mostra um alinhamento múltiplo de diversas seqüências de polipeptídeos CLVl de Tabela C (quando de seqüências de ácidos nucleicos de comprimento completo), usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma penalidade de extensão de 0,05). O peptídeo sinal e o domínio transmembrana são encaixotados em negrito. O começo e o final do domínio LRR (com as 21 LRR numeradas e sublinhadas em preto), do domínio de quinase (com os 11 subdomínios numerados e sublinhados duplamente), e do domínio C-terminal são marcados com um colchete (cada). Motivo I (SEQ ID NO: 237) e Motivo

2 (SEQ ID NO: 238) também são encaixotados. Dentro de motivo 2, o primeiro par de cisteína é marcado, como é o segundo par de cisteína (entre o domínio LRR e o domínio transmembrana). A glicina conservada com subdomínio IX (SDIX) do domínio de quinase também é marcada. A linha vertical dentro de subdomínio IV (SDIV) do domínio de quinase marca o final do polipeptídeo CLVl com um domínio C-terminal não funcional como representado por SEQ ID NO: 210.

Fig. 12 mostra o vetor binário para expressão aumentada em Oiyza sativa de uma seqüência de ácido nucleico de Arabidopsis thaliana codificando polipeptídeo CLVl com um domínio C-terminal não funcional, sob o controle de um promotor de beta-expansina (para expressão em tecidos jovens em expansão).

Fig. 13 detalha exemplos de seqüências de CLVl úteis para realizar os métodos de acordo com a presente invenção.

A presente invenção será agora descrita com referência aos exemplos seguintes, que são como forma de ilustração apenas. Os exemplos seguintes não são pretendidos para definir completamente ou de outra maneira limitar o escopo da invenção.

Exemplos: PCFl

Exemplo 1: Identificação de seqüências relacionadas à SEQ ID NO: I e SEQ ID NO: 2

Seqüências de ácidos nucleicos (cDNA de comprimento completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 1 e/ou seqüências de polipeptídeos relacionadas à SEQ ID NO: 2 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de 5 seqüências e calculando a signifícância estatística de pareamentos. O polipeptídeo codificado por SEQ ID NO: 1 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade 10 (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as 15 duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.

Em adição às publicamente disponíveis seqüências de ácidos nucleicos disponíveis em NCBI, bancos de dados privados de seqüências também foram procurados seguindo o mesmo procedimento como descrito neste lugar acima.

Tabela A fornece uma lista de seqüências de ácidos nucleicos e polipeptídeos relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 1 e à seqüência de polipeptídeo representada por SEQ ID NO: 2.

Tabela A: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 1) úteis nos métodos da presente invenção, e os

polipeptídeos deduzidos correspondentes. Nome Estado Nome Número de N úmero Número ID acesso de ID de seqüência banco de dados seqüência polipeptídeo de ácido nucleico Arath_TCP20 comprimento Arabidopsis thaliana AKl 18178 1 2 completo At3g27010 Arath TCP6 comprimento Arabidopsis thaliana At5g41030 3 4 completo Aqufo Class I comprimento Aquilegia formosa x DR95I658 5 6 TCP completo Aquilegia pubescens DT754291 GIyma Class I comprimento Glycine max AI736626.1 7 8 TCP completo BI4 70329.1 BG044313.1 CA784744.1 BF424472.1 Goshi Class 1 comprimento Gossypium hirsutum DT574583 9 10 TCP completo DW499958 Lyces Class I comprimento Lycopersicon esculentum BW688913 U 12 TCP completo BP878035.1 BI931745.1 Maldo Class I comprimento Malus domestica EB153444 13 14 TCP completo CN895103 Medtr Class 1 comprimento Medicago Iruneatula CG926048.1 15 16 TCP completo CA921765.1 Niebe Class 1 comprimento Nieotiana benthamiana CK296978 17 18 TCP completo Oeiba CIass I comprimento Ocimum basilieum DY322462 19 20 TCP completo Orysa PCFl comprimento Oryza saliva NM 00105178 21 22 completo 2 0s01g0924400 Poptr Class 1 comprimento Populus tremuloides CX 169560.1 23 24 TCP completo DT515387.1 Saeof Class I comprimento Saccharum officinarum SCJLRT1023A 25 26 TCP completo 09.g Soltu Class I comprimento Solanum tuberosum CK271473.1 27 28 TCP completo BQ507674.2 Sorbi Class I comprimento Sorghum bieolor CLASS162154 29 30 TCP completo .1 ED507285.1 CW333599.1 Vitvi Class 1 comprimento Vitis vinifera CB972449 31 32 TCP completo EC971921 Zeama Class I comprimento Zea mays DR826915.1 33 34 TCP 1 completo DR794438.1 Zeama Class I comprimento Zea mays DR963477.1 35 36 TCP 2 completo EE022629.1 AIIee CIass I parcial Allium cepa CF439613 37 38 TCP partial 5' Bradi CIass I parcial Brachypodium distachvon DV480032 39 40 TCP partial 5' Braol Class I parcial Drassica oleracea BZ446639.1 41 42 TCP partial 5' BH464032.1 BZ445385.1 Brara Class I parcial Brassica rapa DX909657.1 43 44 TCP partial 3' DUl 15108.1 Cofca_ Class 1 parcial Coffea canephora DV701323 45 46 TCP partial middle Helan_ Class I parcial Helianthus annuus DY906028 47 48 TCP partial 3' & petiolaris DY940311.1 Horvu_ Class 1 parcial Hordeum vulgare DNl 81323 49 50 TCP partial 3' Linus_ Class 1 parcial L in mn us it a tis si mum Contig 51 52 TCP partial LU04MC0334 middle 2 61667197 Lotco Class í parcial Lotus corniculatus BW630043.1 53 54 TCP partial 5' Pethy_ Class T parcial Petunia hyhrida CY296461 55 56 TCP partial CV297628 middle Prupe Class I parcial Prunus pérsica BU044166. 57 58 TCP partial 3' Ricco Class I parcial Ricinus communis EG685326.1 59 60 TCP partial 3’ EG671551 Salmi Class I parcial Salvia miítiorrhiza CV163534 61 62 TCP partial 3’ Zinel Class 1 parcial Zinnia elegans AU307217 63 64 TCP partial middle Cieen Class I parcial Cichorium endivia, EL361878; 70 71 TCPpartial 3’ Cichorium intybus EH709336 Frave Class I parcial Fragaria vesca EX657224 72 73 TCP partial Jugsp Class 1 parcial JugIans hindsii x EL896093 74 75 TCP partial Juglans regia middle Pangi Class I parcial Panax ginseng CN846083 76 77 TCP partial 3’ Pontr Class 1 parcial Poncirus trifoliata CX644761 78 79 TCPpartial 3’ Exemplo 2: Alinhamento de seqüências de polipeptídeos relevantes

AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 5 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados). Em algumas instâncias, ajuste manual é necessário para aperfeiçoar melhor o alinhamento entre as seqüências de polipeptídeos, em particular no caso de alinhamento de motivo.

Em Figura 1 é fornecida uma árvore filogenética de TCP de acordo com o Arabidopsis Database for Transcription factors, disponível no 5 Center for Bioinformatics(CBI), Peking University, China. O ciado de interesse, compreendendo dois parálogos de Arabidopsis At3g27010 (também chamado AtTCP20 ou PCF1) e At5g41030 (também chamado TCP 6), foi circulado. Qualquer polipeptídeo caindo dentro deste ciado (depois de uma nova etapa de alinhamento múltiplo como descrito acima) é considerado 10 como sendo útil para realizar os métodos da invenção como descrito neste lugar.

O resultado do alinhamento múltiplo de seqüências de polipeptídeos TCP de Classe I de Tabela A (quando de seqüências de ácidos nucleicos de comprimento completo) úteis para realizar os métodos da 15 invenção é mostrado em Figura 2 do presente pedido. O domínio conservado de TCP (compreendendo o bHLH (Hélice-Alça-Hélice básico)) dentro das seqüências de polipeptídeos úteis para realizar os métodos da invenção é expressivamente encaixotado. Os resíduos básicos (em negrito na linha consenso) as seqüências de Hélice-Alça-Hélice (HLH) são ligeiramente 20 encaixotados, assim como o motivo consenso C-terminal PGLEL(G/R/A)LSQXi_5G(V/L)L, onde X é qualquer aminoácido (SEQ ID NO: 65). A região rica em HQ (H sendo histidina, Q glutamina) é igualmente ligeiramente encaixotada.

Dentro deste motivo, pode haver uma ou mais mudança(s) conservativa(s) em qualquer posição, e/ou uma ou três mudança(s) não conservativa(s) em qualquer posição.

Exemplo 3: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção

Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application 5 that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos 10 pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha 15 divisora e identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.

Parâmetros usados na comparação foram:

Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2

Resultados da análise de aplicativo computacional são mostrados em Tabela Al para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.

A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 29 % de identidade de aminoácidos comparada com SEQ ID NO: 2.

Tabela Al: Resultados de MatGAT para similaridade e identidade global no comprimento completo das seqüências de polipeptídeos.

Comprimento 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 completo 1. Aqufo 46,4 35,3 52,6 60,6 48,8 57 50,3 47,9 56,3 39,5 55.9 38.7 48.4 38.8 64.6 37,1 39 CLASS I TCP 2. Arath 62.1 40,4 52,1 57,4 48,4 56,2 49,2 46,9 53,7 41,6 54,1 41.3 51.2 41,6 58,8 42.6 43,1 TCP20TCP 3. Arath 48.5 52.2 32,1 34,8 31,3 33,4 33,7 30,9 35,4 30.2 32.6 30.3 34.2 29.8 35.5 30,4 30.8 TCP6 4. Glyma 61,2 64,1 43,8 68 52,6 68.2 54.9 55.5 61.3 40,4 64.6 37,1 56,3 39,3 73,2 38,4 39,1 CLASS I TCP 5. Goshi 70,2 68,8 50,3 73 62,5 75,2 58,1 59,4 68,1 41,4 74,4 41,8 62,7 41,4 84,3 40,8 41,3 CLASS1 TCP 6. Lyces 61,2 61,5 49,3 61,2 73,3 57.4 50.7 69,4 56,9 37,9 54.7 37.5 91.8 37.9 63 37,8 38,4 CLASS I TCP 7. Maldo 67,3 67,9 46,4 74,5 82,9 67 55 57.6 63 42,7 73,4 41,2 58,3 42,9 80,6 42,7 44,1 CLASS I TCP 8. Medtr 63,1 62,7 51,1 63,2 72 67,3 66,7 50,8 56,3 39.4 56,1 39,3 50,7 40,5 60,4 38,5 39,8 CLASS I TCP 9. Niebe 60,2 60,8 45,8 65,8 71,7 77,3 67,3 64,4 56,3 37,9 54,4 35,3 71 36 64,7 34,1 35,6 CLASS I TCP 10. Oeiba 68,6 65,3 50,8 70,7 80 71,7 73,5 70,7 70,4 39 62,5 38,5 57,6 39,7 70,6 41 41,4 CIjASS 1 TCP 11. Ory sa 52,7 57,4 46,4 53,6 54,9 49,8 53,9 52,1 52,7 51,1 41,1 69,6 38,2 70,6 41,8 68,4 69,3 PCFl 12. Poptr 70,6 68,1 46,6 74,8 82,8 65,9 83,2 67,5 68,8 74,4 55.3 42,5 55,8 42,5 73,6 42,5 43 CLASS1 TCP 13. Saeof 53,5 53,5 45,5 50,1 55,8 52,3 53,9 53,9 52,3 54,2 79,2 55.9 37,5 87,5 38,9 84,9 83,9 CLASS I TCP 14. Soltu 60,5 62,4 49,5 64,3 73,7 94 67 66,5 79 71,4 48,9 69.7 51,9 37,9 65,9 37,6 37 CLASS I TCP 15. Sorbi 53,2 55,4 44,3 51,6 55,4 52 56,9 53,5 51,4 55,7 80 56.6 90.5 51.1 40,9 86,1 89,4 CLASS I TCP 16. Vitvi 73,5 71 50,3 76,5 92 72,6 85,4 74,3 78 81,8 53.9 82.2 53,9 76.7 53,8 40,1 41,4 CLASS I TCP 17. Zeama 53,1 54 43,8 55,7 54,6 51,2 55,6 52,8 52,2 56,2 78,4 57,4 88.6 49,7 90.5 53.7 84,9 CLASS ITCPl 18. Zeama 54,3 57,5 43,2 53 57,1 53 59,2 57,5 51,7 60,3 78,5 58,4 89,2 52,1 90,5 56,5 87,7 CLASS 1 TCP2 A identidade percentual pode ser substancialmente aumentada

se o cálculo de identidade é realizado no domínio conservado de TCP (compreendendo o bííLH, em 69 aminoácidos contíguos totais, por exemplo 5 para SEQ ID NO: 2, o domínio conservado de TCP é como representado por SEQ ID NO: 66) dentro dos polipeptídeos úteis para realizar os métodos da invenção, como mostrado em Tabela A2. Identidade percentual no domínio conservado de TCP dentro das seqüências de polipeptídeos úteis para realizar os métodos da invenção varia entre 65 % e 100% de identidade de 10 aminoácidos.

Tabela A2: Resultados de MatGAT para similaridade e identidade global no domínio conservado de TCP (em 69 aminoácidos contíguos totais) dentro das

seqüências de polipeptídeos.

Domínio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 conservado de TCP 1. Aqufo 91.3 68,1 91.3 89,9 91,3 88,4 91.3 89,9 89,9 88.4 91,3 88,4 91,3 88,4 91,3 88,4 88,4 PCFI CD 2. Arath 95.7 68,1 94,2 95,7 95,7 91.3 95.7 94,2 97,1 91.3 94,2 91,3 95.7 91,3 94,2 91,3 91,3 PCFl CD 3. Arath 84,1 84,1 66,7 66,7 66,7 65,2 66,7 66,7 66,7 65.2 66,7 65,2 66,7 65,2 66,7 65,2 65,2 TCP6 CD 4. Glyma 94,2 98,6 82,6 98.6 98,6 97,1 95.7 95,7 97,1 89,9 100 89,9 98,6 89,9 100 89,9 89.9 PCFl CD 5. Goshi 94.2 98,6 84,1 100 97,1 95,7 94,2 94,2 98.6 88,4 98,6 88,4 97,1 88,4 98,6 88.4 88,4 PCFl CD 6. Lyces 95,7 100 82,6 98,6 98,6 95,7 94,2 97.1 98,6 91.3 98,6 91,3 100 91,3 98,6 91,3 91,3 PCFl CD 7. Maldo 92,8 97,1 81,2 98,6 98,6 97,1 92.8 94,2 94,2 89,9 97,1 89,9 95,7 89,9 97,1 89,9 89,9 PCFl CD 8. Medtr 94.2 98,6 82,6 100 100 98.6 98,6 92.8 92,8 89.9 95.7 89,9 94.2 89.9 95,7 89,9 89.9 PCFl CD 9. Nicbe 94,2 97,1 79,7 95,7 95,7 97,1 94,2 95,7 95,7 91,3 95,7 91,3 97,1 91,3 95,7 91,3 91,3 PCFl CD 10. Ociba 95,7 100 84,1 98,6 98,6 100 97,1 98,6 97,1 89,9 97,1 89,9 98,6 89,9 97,1 89,9 89,9 PCFl CD I 1. Orysa 94,2 98,6 82,6 97,1 97,1 98,6 95,7 97,1 95.7 98,6 89.9 100 91,3 100 89,9 100 100 PCFl 12. Poptr 94,2 98,6 82,6 100 100 98,6 98,6 100 95,7 98,6 97.1 89,9 98.6 89,9 100 89,9 89,9 PCFl CD 13. Sacof 94,2 98,6 82,6 97,1 97,1 98,6 95,7 97,1 95,7 98,6 100 97,1 91,3 100 89,9 100 100 PCFl CD 14. Soltu 95,7 100 82,6 98,6 98.6 100 97,1 98.6 97,1 100 98,6 98,6 98,6 91,3 98,6 91,3 91,3 PCFl CD 15. Sorbi 94.2 98,6 82,6 97.1 97,1 98,6 95,7 97,1 95,7 98,6 100 97,1 100 98,6 89,9 100 100 PCFl CD 16. Vitvi 94,2 98,6 82,6 100 100 98,6 98,6 100 95,7 98,6 97,1 100 97,1 98,6 97,1 89,9 89,9 PCFl CD 17. Zeama 94,2 98,6 82,6 97,1 97,1 98,6 95,7 97.1 95,7 98,6 100 97,1 100 98,6 100 97,1 100 PCFl I CD 18. Zeama 94,2 98,6 82,6 97.1 97,1 98,6 95,7 97,1 95,7 98,6 100 97,1 100 98.6 100 97,1 100 PCFl 2 CD Exemplo 4: Identificação de domínios compreendidos em seqüências de

polipeptídeos úteis para realizar os métodos da invenção O banco de dados Integrated Resource of Protein Families,

Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica sobre 10 proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no European Bioinformatics Institute no Reino Unido.

Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 2 são apresentados em Tabela A3.

Tabela A3: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 2

Banco de dados Número de acesso Nome de acesso InterPro ÍPR005333 Fator de transcrição de TCP PFAM PF03634 TCP O domínio de TCP compreende o Hélice-Alça-Hélice básico (bEILH). O domínio de TCP de SEQ ID NO: 2 é como representado por SEQ ID NO: 66.

Composição primária de aminoácidos (em %) para determinar

se uma região de polipeptídeo é rica em aminoácidos específicos (por exemplo em uma caixa ácida) pode ser calculada usando programas de aplicativos computacionais do servidor ExPASy, em particular a ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: the proteomics server for in- 15 depth protein knowledge and analysis. Nucleic Acids Res 31:3784-3788). A composição da seqüência de polipeptídeo de interesse pode ser então comparada com a composição média de aminoácidos (em %) no banco de dados Swiss-Prot Protein Sequence.

Inspeção visual do alinhamento múltiplo de seqüências dos 20 polipeptídeos úteis para realizar os métodos da invenção mostra que, entre o motivo C-terminal conservado e a extremidade C-terminal do polipeptídeo, reside uma região rica em histidina (His ou H) e glutamina (Gin ou Q), a região rica em HQ. Esta região HQ de baixa complexidade compreende pelo menos quatro, preferivelmente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 25 19, 20 ou mais ou de apenas resíduos H, ou de apenas resíduos Q, ou de uma combinação de resíduos HeQ (em qualquer proporção) A região HQ é encaixotada em Figura 2.

Exemplo 5: Predição da estrutura secundária das seqüências de polipeptídeos úteis para realizar os métodos da invenção

Um Hélice-Alça-Hélice básico (bHLH) não canônico previsto é encontrado em ambas as classes de fatores de transcrição TCP, como descrito por Cubas et al. (1999) Plant J 18(2): 215-222. A posição desta 5 estrutura secundária prevista é mostrada em Figura 3A. Ao considerar a seqüência de polipeptídeo de término N a término C, os resíduos básicos precedem o Hélice-Alça-Hélice.

Figura 3B é um desenho representando a estrutura primária das seqüências de polipeptídeos úteis para realizar os métodos da invenção, de término N a término C: um domínio conservado de TCP compreendendo o Hélice-Alça-Hélice básico (bHLH), um motivo consenso C-terminal 1, e uma região rica em HQ.

Exemplo 6: Ensaio relacionado às seqüências de polipeptídeos úteis para realizar os métodos da invenção A seqüência de polipeptídeo como representada por SEQ ID

NO: 2 é um fator de transcrição com atividade de ligação de DNA. Seqüências de ligação de DNA consenso destas duas classes foram identificadas: GGNCCCAC para classe 1, e GTGGNCCC para classe II. A capacidade de um fator de transcrição de se ligar a uma seqüência específica 20 de DNA pode ser testada por ensaios de alteração da mobilidade eletroforética (EMSAs; também chamados ensaios de retardamento em gel), o que é bem conhecido na arte, e relatado especificamente para TCPs por Kosugi & Ohashi (2002) Plant J 30: 337-348, e por Li et al. (2005) PNAS 102(36): 12978-83. Também relatados por Kosugi & Ohashi são métodos para detector 25 parceiros de dimerização e especificidade, usando por exemplo, o sistema de dois híbridos em levedura, enquanto que Li et al. descrevem experimentos de imunoprecipitação de cromatina para caracterizar os promotores aos quais TCPs se ligam. Os experimentos descritos em ambos os artigos são úteis para caracterizar fatores de transcrição TCP de classe I, e são bem conhecidos na arte.

Exemplo 7: Clonagem de seqüência de ácido nucleico como representada por SEQ ID NO: 1

A menos que de outra maneira determinado, técnicas de DNA 5 reeombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrão para trabalho molecular com planta são 10 descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).

A seqüência de ácido nucleico usada nos métodos da invenção foi amplificada por PCR usando como modelo uma biblioteca de cDNA de 15 plântula de Arabidospis thaliana (em pCMV Sport 6.0; Invitrogen, Paisley, UK). PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão, usando 200 ng de modelo em uma mistura de PCR de 50 μΐ. Os iniciadores usados foram

- prm01501 SEQ ID NO: 68; sentido, sítio AttBl em letras minúsculas:

5 ’-ggggacaagtttgtacaaaaaagcaggcttcacaATGGATCCCAAGAACCTAA-3 ’; e

- prm01502 (SEQ ID NO: 69; reverso, complementar, sítio AttB2 em letras minúsculas:

5’-ggggaccactttgtacaagaaagctgggtTTTTAACGACCTGAGCCTT-3’,

o que inclui os sítios AttB para recombinação Gateway. O 25 fragmento amplificado de PCR foi purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”. Plasmídeo pDONR2Ql foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway©. Exemplo 8: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada por SEQ ID NO: 1

O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T- DNA: um marcador selecionável de planta; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüênçia de ácido nucleico de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 67) para expressão constitutiva foi localizado antes desta gaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressão resultante (Figura 4) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.

Exemplo 9: Transformação de planta Transformação de arroz

A Agrobacterium contendo o vetor de expressão foi usada para transformar plantas de Ory^za sativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbare foram descascadas. Esterilização foi realizada incubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com água destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois de incubação no escuro por quatro semanas, calos embriogênicos derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados por subcultura no mesmo meio por outras 2 semanas. Pedaços de calo embriogênico foram sub-cultivados em meio fresco

3 dias antes de co-cultivo (para estimular atividade de divisão celular).

Linhagem LBA4404 de Agrobacterium contendo o vetor de expressão foi usada para eo-eultivo. Agrobacterium foi inoeulada em meio AB com os antibióticos apropriados e cultivada por 3 dias a 28°C. As bactérias foram então coletadas e suspensas em meio de co-cultivo líquido para uma densidade (ODóOO) de cerca de 1. A suspensão foi então transferida 5 para uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calos foram então secados em um papel filtro e transferidos para um meio de co-cultivo solidificado e incubados por 3 dias no escuro a 250C. Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, 10 ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depois de transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e partes aéreas se desenvolveram nas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calos e incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qual 15 elas foram transferidas para o solo. Partes aéreas endurecidas foram cultivadas em alta umidade e dias curtos em uma estufa.

Aproximadamente 35 transformantes TO de arroz independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultivo de tecido para uma 20 estufa. Depois de uma análise de PCR quantitativo para verificar número de cópias do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibem tolerância ao agente de seleção foram mantidas para colheita de semente Tl. Sementes foram então coletadas três a cinco meses depois de transplante. O método produziu transformantes de locus único em uma taxa 25 de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei et al. 1994). Exemplo 10: Procedimento de avaliação fenotípica

10.1 Configuração de avaliação

Aproximadamente 35 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmara de cultivo de tecido para uma estufa para cultivo e colheita de semente Tl. Seis eventos, dos quais a progênie Tl segregou 3:1 para presença/ausência do transgene, foram mantidos. Para cada um destes eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero e homozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. Condições de estufa foram de dias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidade relativa de 70%.

Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.

10.2 Análise estatística: teste F

Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas de planta. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e para verificar por um efeito geral do gene, também conhecido como efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em 5%> de nível de probabilidade para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a mera presença ou a posição do gene que está causando as diferenças em fenótipo.

10.3 Paramêtros medidos

Medidas de parâmetros associados à biomassa

A parte aérea de planta (ou biomassa de folhas) foi determinada contando o número total de pixéis nas imagens digitais de partes aéreas de planta discriminadas do fundo. Foi tirada a média deste valor para as fotos tiradas no mesmo momento dos diferentes ângulos e foi convertido para um valor de superfície física expresso em mm quadrados por calibração. Experimentos mostram que a parte aérea de planta medida desta maneira se correlaciona com a biomassa de partes aéreas de planta. A área acima do solo é o momento no qual a planta atingiu sua biomassa máxima de folhas. O vigor inicial é a área acima do solo de planta (plântula) três semanas após germinação. Aumento em biomassa de raiz é expresso como um aumento em biomassa total de raiz (medida como biomassa máxima de raízes observada durante o tempo de vida de uma planta); ou como um aumento no índice raiz/parte aérea (medido como a proporção entre massa radicular e massa de parte aérea no período de crescimento ativo de raiz e parte aérea).

Medidas de parâmetros associados a sementes

As panículas primárias maduras foram coletadas, contadas, 20 ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas 25 em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. O rendimento total de sementes foi medido pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contados e seu peso total. O índice de Colheita (HI) na presente invenção é definido como a proporção entre o rendimento total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por

panícula como definido na presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de grãos como definida na presente invenção é a proporção (expressa como uma %) do número de grãos cheios sobre o número total de sementes (ou floretes).

Exemplo 11: Resultados da avaliação fenotípica das plantas transgênicas

Os resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção são apresentados em Tabela A4. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.

índice raiz/parte aérea, rendimento de sementes, índice de colheita e Peso de Mil Sementes (TKW) são significativamente aumentados nas plantas transgênicas expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos).

Tabela A4: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção.

Característica % de aumento em geração Tl Area acima do solo -J índice raiz/parte aérea 4 Rendimento total de sementes 7 índice de colheita 9 TKW 6 Exemplo 12: Transformação de outras cultivos

Transformação de milho

Transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. Transformação é dependente de genótipo em milho e apenas genótipos específicos são receptivos para transformação e regeneração. A linhagem natural A188 (University of Minnesota) ou híbridos com A188 como um ancestral são boas fontes de material doador para transformação, mas outros genótipos também podem ser usados com sucesso. Espigas são coletadas de planta de milho aproximadamente 11 dias depois de polinização (DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm. Embriões imaturos são co-cultivados com Agrobacterlum tumefaciens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Embriões excisados são cultivados em meio de indução de calo, então meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que partes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cada embrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3 semanas, até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.

Transformação de trigo

Transformação de trigo é realizada com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite (disponível a partir de C1MMYT, México) é comumente usada em transformação. Embriões imaturos são co-cultivados com Agrobaeterium tumefaciens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Depois de incubação com Agrobaeterium, os embriões são cultivados in vitro em meio de indução de calo, então meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que partes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cada embrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T- DNA.

Transformação de soja

Soja é transformada de acordo com uma modificação do método descrito na Patente Norte-Americana de Texas A&M 5.164.310. Diversas variedades comerciais de soja são receptivas para transformação por este método. A cultivar Jack (disponível a partir da Illinois Seed foundation) é comumente usada para transformação. Sementes de soja são esterilizadas para semeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados a partir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédone remanescente são adicionalmente cultivados para desenvolver nós axilares. Estes nós axilares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co-cultivo, os explantes são lavados e transferidos para meio de seleção. Partes aéreas regeneradas são excisadas e colocadas em um meio de prolongamento de parte aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio de enraizamento até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.

Transformação de colza/canola

Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6 dias de idade são usados como explantes para cultivo de tecido e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para transformação, mas outras variedades também podem ser usadas. Sementes de canola são esterilizadas em superfície para semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone acoplado são excisados das plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor de expressão) banhando a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são então cultivados por 2 dias em meio MSBAP-3 contendo 3 mg/l de BAP, 3 % de sacarose, 0,7 % de Phytagar a 23 °C, 16 h de luz. Depois de dois dias de co-cultivo com Agrobacterium, os explantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e então cultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina e agente de seleção até regeneração de parte aérea. Quando as partes aéreas estão com 5-10 mm de comprimento, elas são cortadas e transferidas para meio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l de B AP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para o meio de enraizamento (MSO) para indução de raiz. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.

Transformação de alfafa

Um clone regenerante de alfafa (Medicago sativa) é transformado usando o método de (McKersie et al., 1999 Plant Physiol 119: 839-847). Regeneração e transformação de alfafa é dependente de genótipo e portanto uma planta regenerante é requerida. Métodos para obter plantas regenerantes foram descritos. Por exemplo, estas podem ser selecionadas a partir da cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade comercial de alfafa como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para uso em cultivo de tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolo são co-cultivados com um cultivo noturno de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ L de tioprolina, 4,35 g/ L de K2S04, e 100 μηι de acetoseringona. Os explantes são lavados em meio Murashige-Skoog com meia força (Murashige and Skoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringona mas com um agente de seleção adequado e antibiótico adequado para inibir crescimento de Agrobaeterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento BOÍ2Y não contendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L de sacarose. Embriões somáticos são subseqüentemente germinados em meio Murashige-Skoog com meia força. Plântulas enraizadas foram transplantadas em potes e cultivadas em uma estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.

Transformação de algodão

Algodão é transformado usando Agrobaeterium tumefaciens de acordo com o método descrito em Patente Norte-Americana 5.159.135. Sementes de algodão são esterilizadas em superfície em solução de hipoclorito de sódio a 3% durante 20 minutos e lavadas em água destilada com 500 μg/ml de cefotaxima. As sementes são então transferidas para meio SH com 50μg/ml de benomil para germinação. Hipocótilos de plântulas de 4 a

6 dias são removidos, cortados em pedaços de 0,5 cm e são colocados em ágar 0,8%. Uma suspensão de Agrobacterium (aprox. 108 células por ml, diluída a partir de um cultivo noturno transformado com o gene de interesse e marcadores de seleção adequados) é usada para inoculação dos explantes de hipocótilo. Depois de 3 dias em temperatura ambiente e iluminação artificial, os tecidos são transferidos para um meio sólido (1,6 g/l de Gelrite) com sais Murashige e Skoog com vitaminas B5 (Gamborg et al., Exp. Cell Res. 50:151-158 (1968)), 0,1 mg/l de 2,4-D, 0,1 mg/l de 6-furfurilaminopurina e 750 μg/ml de MgCL2, e com 50 a 100 μg/ml de cefotaxima e 400-500 μg/ml de carbenicilina para matar bactérias residuais. Linhagens celulares individuais são isoladas depois de dois a três meses (com subculturas a cada quatro a seis semanas) e são adicionalmente cultivadas em meio seletivo para amplificação de tecido (30°C, fotoperíodo de 16 hr). Tecidos transformados são subseqüentemente cultivados adicionalmente em meio não seletivo durante 2 a 3 meses para gerar embriões somáticos. Embriões aparentemente saudáveis de pelo menos 4 mm de comprimento são transferidos para tubos com meio SH em vermiculita fina, suplementado com 0,1 mg/l de ácido indolacético, 6 fúrfurilaminopurina e ácido giberélico. Os embriões são cultivados a 3 0°C com um fotoperíodo de 16 h, e plântulas no estágio de 2 a 3 folhas são transferidas para potes com vermiculita e nutrientes. As plantas são endurecidas e subseqüentemente movidas para a estufa para cultivo adicional. Exemplo 13 Exemplos de triagens de estresse abiótico Triagem de seca

Plantas de um número selecionado de eventos são cultivadas em solo de vaso em condições normais até elas terem atingido o estágio de espigamento. Elas são então transferidas para uma seção “seca” onde irrigação é retida. Sondas de umidade são inseridas em potes aleatoriamente escolhidos para monitorar o teor hídrico do solo (SWC). Quando SWC fica abaixo de certos limiares, as plantas são automaticamente re-irrigadas continuamente até que um nível normal seja novamente atingido. As plantas são então re-transferidas para condições normais. O resto do cultivo (maturação de planta, coleta de sementes) é o mesmo que para plantas não cultivadas em condições de estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições normais.

Triagem de estresse salino

Plantas são cultivadas em um substrato feito de fibras de coco e argex (proporção de 3 para I). Uma solução nutritiva normal é usada durante as primeiras duas semanas depois de transplantar as plântulas para a estufa. Depois das primeiras duas semanas, 25 mM de sal (NaCl) é adicionado à solução nutritiva, até as plantas terem sido colhidas. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições normais.

Triagem de disponibilidade reduzida de nutriente (nitrogênio)

Plantas de seis eventos (sementes T2) são cultivadas em solo de vaso em condições normais exceto para a solução nutritiva. Os potes são irrigados de transplante até maturação com uma solução nutritiva específica contendo teor reduzido de nitrogênio N (N), normalmente entre 7 a 8 vezes menos. O resto do cultivo (maturação de planta, coleta de sementes) é o mesmo que para plantas não cultivadas em condições de estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições nonnais. Exemplos: CAH3

Exemplo 14: Identificação de seqüências relacionadas à SEQ ID NO: 80 e SEQ ID NO: 81

Seqüências (cDNA de comprimento completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 80 e/ou seqüências de proteínas relacionadas à SEQ ID NO: 81 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a signifícância estatística de identidades. O polipeptídeo codificado por SEQ ID NO: 80 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.

Tabela B fornece uma lista de seqüências de ácidos nucleicos e proteínas relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 80 e à seqüência de proteína como representada por SEQ ID NO: 81.

Tabela B: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 80) úteis nos métodos da presente invenção, e os polipeptídeos deduzidos correspondentes.

Nome Organismo fonte Ácido nucleico Polipeptídeo Acesso de banco Estado SEQ ID NO: SEQ ID NO: de dados CrC AH3 Chlamydomonas 80 81 / Comprimento completo reinhardtii C'rCAH3-2 CMamydomonas 82 83 U40871 Comprimento completo reinhardtii A1CAH3 Arabidopsis thaliana 84 85 NP 001031206 Comprimento completo MtCAH3 Medicago Iruncatula 86 87 ABE93115 Comprimento completo MtCAH3-2 Medicago truneatula 88 89 ABE93118 Comprimento completo AtCAH3-2 Arabidopsis thaliana 90 91 Atlg70410 Comprimento completo OsCAH3 Otyza saliva 92 93 0s09g0464000 Comprimento completo OsCAH3-2 Oryza saliva 94 95 NP 001065776 Comprimento completo DsCAi 13 DunaIieIIa salina 96 97 AF190735 Comprimento completo DsCAI 13-2 Dunaliella salina 98 99 AAF22644 Comprimento completo CrCAH3-3 Chlamydomonas 100 101 P24258 Comprimento completo reinhardtii CrCAH3-4 Chlamydomonas 102 103 BAA14232 Comprimento completo reinhardtii PpCAII 3 Physcomitrella 104 105 CAH58714 Comprimento completo patens AtCAI 13-3 Arabidopsis thaliana 106 107 At5g 14740 Comprimento completo DsCAI 13-3 Dunaliella salina 108 109 P54212 Comprimento completo AtCAH3-4 Arabidopsis thaliana 110 111 At3g52720 Comprimento completo AtCAH3-5 Arabidopsis thaliana 112 113 At5g56330 Comprimanto completo AICAH3-6 Arabidopsis thaliana 1!4 115 At5g04180 Comprimento completo NICAH3 Nicotiana 116 117 Q84UV8 Comprimento completo langsdorffli x Nicotiana sanderae FbCAf 13 Flaveria bidentis 118 119 P46510 Comprimento completo FIvCAH3 Hordeum vulgare 120 121 P40880 Comprimento completo CrCAH3-5 Chlamydomonas 122 123 AAB19183 Comprimento completo reinhardtii OsCAH3-3 Oryza saliva 124 125 0s01g0639900 Comprimento completo AtCAH3-7 Arabidopsis thaliana 126 127 At3g0l500 Comprimento completo FpCAH3 Flaveria pringlei 128 129 P46281 Comprimento completo FICAH3 Flaveria Iinearis 130 131 P46512 Comprimento completo FbrCAH3 Flaveria brownii 132 133 P46511 Comprimento completo NpCAI 13 Nicotiana paniculata 134 135 BAA25639 Comprimento completo NtCAH 3 Nicotiana tabaeum 136 137 P27141 Comprimento completo PtCAH 3 Populus Iremula x 138 139 AAC49785 Comprimento completo Populus Iremuloides PtCAH3-2 Populus tremula x 140 141 AAB65822 Comprimento completo Populus tremuloides AtCAH3-8 Arabidopsis thaliana 142 143 ATI G23730 Comprimento completo SoCAH3 Spinaeia oleracea 144 145 P16016 Comprimento completo PsCAH3 Pisum sativum 146 147 CAA36792 Comprimento completo MtCAH3-3 Medicago Iruncatula 148 149 ABE84842 Comprimento completo MtC AH 3-4 Medieago truncatula 150 151 ABE93117 Comprimento completo AICAH3-9 Arabidopsis thaliana 152 153 At1g08080 Comprimento completo FpCAH 3-2 Flaveria pringlei 154 155 ABC41658 Comprimento completo F1CAH3-2 Flaveria Iine a ris 156 157 ABC4165 9 Comprimento completo AtCAH3-10 Arabidopsis lhaliana 158 159 Atlgl9580 Comprimento completo GhCAH3 Gossypium hirsutum 160 161 DT561379 Comprimento completo LeCAI 13 Lycopersicon 162 163 BTO143 70 Comprimento completo esculentum ZmCAI 13 Zea mays 164 165 IJ08403 Comprimento completo ZmCAI 13-2 Zea mays 166 167 U08401 Comprimento completo UpCAH3 Uroehloa panieoides 168 169 U19741 Comprimento completo UpCAH3-2 llroehloa panieoides 170 171 U19739 Comprimento completo CrCAI 13-6 Chlamydomonas 172 173 AAR82948 Comprimento completo reinhardtii C.1-CAH3-7 Chlumydomonas 174 175 AAS48197 Comprimento completo reinhardtii OsCAH3-4 Otyza saliva 176 177 AKI03904 Comprimento completo OsCAI 13-5 Oryza saliva 178 179 0s08g0470200 Comprimento completo DcCAH3 Dioscorea cayertensis 180 181 Χ76187 Comprimento completo D5CAII3 Dioscorea batatas 182 !83 AB178473 Comprimento completo DaCAH3 Dioseorea alata 184 185 AF243526 Comprimento completo OsCAI 13-6 Oryza saliva 186 187 0s08g0423500 Comprimento completo OsCAII3-7 Oryza sativa 188 189 Osl 2g0153500 Comprimento compldo AtCAH3-l 1 Arahidopsis thaliana 190 191 At4g20990 Comprimento completo AtCAl 13-12 Arabidopsis thaliana 192 193 Atlg08065 Comprimento completo AaCAH3 Adonis aestivalis 194 / Comprimento completo GmCAH3 Glyeine max 195 / Comprimento completo BnCAl 13 Rrassiea napus 196 / Comprimento completo ZmCAH3-3 Zea mays 197 / Comprimento completo TaCAI 13 Tritieum aestivum 198 / Comprimento completo GmCAI 13-2 Glyeine max 199 / Comprimento completo HvCAH3-2 Hordeum vulgare 200 / Comprimento completo ZmCAI 13-4 Zea mays 201 / Comprimento completo BnCATI3-2 Brassiea napus 202 / Comprimento completo Exemplo 15: Alinhamento de seqüências de polipeptídeos relevantes

AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 5 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados).

O resultado do alinhamento múltiplo de seqüências usando 10 polipeptídeos CAH3 tipo alfa relevantes para identificar aqueles úteis para realizar os métodos da invenção é mostrado em Figura 7. Alinhamentos múltiplos similares podem ser criados para polipeptídeos CAH3 tipo beta e gama usando as seqüências listadas em Fig. 9. Um alinhamento múltiplo de todas as seqüências de CAH3 foi usado como dado de entrada para calcular a árvore filogenética.

Exemplo 16: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.

Parâmetros usados na comparação foram:

Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2

Resultados da análise de aplicativo computacional são mostrados em Tabela Bl para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos CAH3 tipo alfa (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.

A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 16 % de identidade de aminoácidos comparada com SEQ ID NO: 81. Tabela BI: Resultados de MatGAT para similaridade e identidade global no comprimento completo das seqüências de polipeptídeos.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 I. SEQID81 28,3 27,2 25,2 29,4 24,7 25,9 25,6 26,8 28,2 27,1 18,7 24,9 24,0 24,8 16,0 23,5 23,0 18,6 19,1 19,1 2. SEQID105 43,5 29,9 32,7 33,7 27,9 30,1 31,2 31,2 33,5 31,8 19,4 30,3 29,4 33,7 22,0 25,6 23,8 15,7 17,4 17,4 3. SEQIDl 15 44,2 45,8 40,4 37,5 37,7 35,2 35,7 40,4 41,3 38,8 21,6 37,6 33,4 33,7 23,3 21,5 21,9 15,9 15,4 18,4 4. SEQID179 45,5 46,5 58,5 56,2 42,1 44,8 44,0 46,2 44,6 49,1 27,5 45,7 33,1 39,2 22,5 22,7 24,0 15,8 15,9 16,7 5. SEQID187 44,5 50,4 54,5 74,6 45,7 46,0 46,0 40,6 43,7 42,9 24,3 37,9 32,6 36,1 23,2 23,3 22,3 17,7 17,4 18,2 6. SEQID185 39,7 48,0 55,6 62,2 61,2 67,5 67,8 37,8 38,3 39,4 24,9 41,7 31,6 35,8 26,1 23,2 22,3 15,9 15,2 16,2 7. SEQID181 42,3 48,7 55,6 64,4 60,1 84,2 91,6 36,2 42,3 42,0 26,5 39,9 31,7 36,5 22,9 22,1 20,7 15,1 15,7 17,0 8. SEQID183 41,6 49,8 55,2 62,2 60,5 83,5 93,8 36,2 41,3 43,1 26,0 40,7 32,5 37,3 22,9 21,7 21,9 14,8 14,6 17,0 9. SEQIDl91 41,6 49,4 59,6 61,1 59,4 59,0 59,7 59,3 42,1 46,2 24,8 43,5 35,3 34,3 25,4 23,9 23,8 15,6 15,8 15,0 10. SEQIDl 17 44,2 50,7 59,2 65,8 60,9 59,1 62,4 60,9 64,6 46,8 27,4 40,3 34,1 34,7 22,4 18,8 18,5 15,2 15,8 16,8 11. SEQIDl53 43,9 48,0 58,8 69,5 62,0 64,7 64,4 65,5 64,4 69,1 33,8 51,8 35,3 39,0 24,7 20,9 20,7 15,6 15,9 17,0 12. SEQIDl 13 32,6 31,7 38,3 42,9 40,6 41,4 42,3 42,3 40,0 43,7 48,6 36,8 20,9 24,2 14,5 14,7 11,6 15,8 15,1 12,2 13. SEQID193 38,4 48,7 55,6 65,8 57,6 61,2 61,9 63,1 62,5 63,1 68,7 48,6 35,8 36,7 24,4 20,4 21,7 15,3 16,5 18,7 14. SEQIDl 11 41,3 45,8 54,6 53,9 54,2 54,6 51,8 52,8 54,9 57,7 57,7 40,6 54,2 36,7 27,0 18,7 21,1 14,4 14,0 15,5 15. SEQID189 41,3 46,6 55,2 59,1 54,8 55,2 54,8 54,4 53,7 55,5 56,9 36,6 52,7 56,7 41,3 22,8 22,1 16,3 17,0 20,2 16. SEQID95 28,1 32,0 39,4 40,0 35,5 40,7 39,2 39,2 40,1 36,1 38,5 23,4 38,4 39,8 48,8 15,6 15,4 13,8 14,1 13,5 17. SEQID101 36,8 38,2 36,3 37,9 37,1 34,2 35,3 33,7 33,7 34,5 32,1 30,3 33,9 33,7 35,3 23,9 91,9 16,7 19,3 19,1 18. SEQID103 36,6 35,0 38,5 38,2 36,3 32,6 34,7 34,2 34,0 35,3 34,7 24,9 34,2 35,0 37,7 24,9 95,0 16,5 19,1 19,5 19. SEQID109 27,0 23,8 24,1 23,6 25,6 22,6 24,3 23,6 23,6 24,3 26,1 25,8 24,3 23,4 25,0 19,4 27,8 28,9 43,4 32,4 20. SEQID99 26,3 26,3 27,4 25,6 26,1 24,5 25,2 24,5 23,6 24,9 27,0 24,7 25,2 25,6 26,1 19,8 31,0 29,7 60,1 31,3 21. SEQID97 26,9 26,3 30,1 28,5 28,5 25,5 28,3 27,1 27,1 26,7 27,5 24,3 27,7 29,5 27,7 19,5 33,7 33,5 46,2 46,5 184 10

15

20

Exemplo 17: Identificação de domínios compreendidos em seqüências de polipeptídeos úteis para realizar os métodos da invenção

O banco de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no European Bioinformatics Institute no Reino Unido.

Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 81 são apresentados em Tabela F2.

Tabela B2: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 81

Banco de dados Número de acesso Nome de acesso PRODOM PD000865 Q39588 CHLRE Q39588 PANTHER PTHRl 8952 CARBONIC ANHYDRASE PFAM PFOO194 Carb anhydrase PROFILE PSOO162 ALPHA CA 1 PROFILE PS51144 ALPHA CA 2 SUPERFAM1LY SSF51069 Carbonic anhydrase 25

Exemplo 18: Predição de topologia das seqüências de polipeptídeos úteis para realizar os métodos da invenção (localização subcelular, transmembrana...)

TargetP 1.1 prediz a localização subcelular de proteínas eucarióticas. A designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a predição final está baseada não são probabilidades realmente, e eles não necessariamente adicionam a uma. Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a predição. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a predição mais forte. TargetP é mantido no servidor da Technical University of Denmark.

Para as seqüências previstas conterem uma pré-seqüência N-

terminal um sítio de clivagem potencial também pode ser previsto.

Diversos parâmetros foram selecionados, tal como grupo de organismo (não planta ou planta), conjuntos de atalhos (nenhum, conjunto pré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e o cálculo de predição de sítios de clivagem (sim ou não).

Os resultados de análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 81 são apresentados em Tabela B3. O grupo de organismo “planta” foi selecionado, nenhum atalho definido, e o comprimento previsto do peptídeo de trânsito requisitado. A 15 localização subcelular da seqüência de polipeptídeo como representada por SEQ ID NO: 81 é prevista como sendo mitocondriana, mas em Chlamydomonas reinhardtii ela foi mostrada sendo uma enzima cloroplástica. O comprimento previsto do peptídeo de trânsito putativo é de 13 aminoácidos começando do término N (não tão confiável quanto a predição da própria 20 localização subcelular, pode variar em comprimento de alguns aminoácidos). Tabela B3: Análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 81

Comprimento (AA) 310 Peptídeo de trânsito cloroplástico 0,308 Peptídeo de trânsito mitocondriano 0,800 Peptídeo sinal de via secretora 0,004 Outro direcionamento subcelular 0,046 Localização Prevista mitocondriana Classe de confiança 3 Comprimento previsto de peptídeo de trânsito 13 Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:

· ChloroP 1.1 hospedado no servidor da Technical University of Denmark; • Protein Prowler Subcellular Localisation Predictor versão

1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Austrália;

• PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no servidor da University of Alberta, Edmonton, Alberta, Canadá;

• TMHMM, hospedado no servidor da Technical University

o f Denmark

Exemplo 19: Ensaio relacionado às seqüências de polipeptídeos úteis para realizar os métodos da invenção

Seqüência de polipeptídeo como representada por SEQ ID NO: 81 é uma enzima com, de acordo com Enzyme Commission (EC; classificação de enzimas pelas reações que elas catalisam), número EC 4.2.2.1 para anidrase carbônica. O ensaio funcional pode ser um ensaio para atividade CA baseado em um ensaio titrimétrico, como descrito por Karlsson et al. (Plant Physiol. 109: 533-539, 1995). Resumidamente, atividade CA é eletroquimicamente determinada medindo o tempo para que o pH diminua de 8,0 a 7,2, a 2°C, em uma amostra de 4 ml de 20 mM de tampão veronal, pH 8,3, mediante adição de 2 ml de H2O destilada congelada saturada com CO2. Um WAU (Wilbur-Anderson Unit; Wilbur and Anderson, J Biol Chem 176: 147-154, 1948; Yang et al., Plant Cell Physiol 26: 25-34, 1985) de atividade é definido como: WAU = (t0-t)/t, onde t0 é o tempo para a mudança de pH com controles de tampão e t é o tempo obtido quando amostras contendo CA são adicionadas.

Exemplo 20: Clonagem de seqüência de ácido nucleico como representada por SEO ID NO: 80

A menos que de outra maneira determinado, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrão para trabalho molecular com planta são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).

O gene CAH3 de Chlamydomonas reinhardtii foi amplificado por PCR usando como modelo uma biblioteca de cDNA de Chlamydomonas reinhardtii (Invitrogen, Paisley, UK). Iniciadores prm8571 (SEQ ID NO: 207; sentido, códon de início em negrito, sítio AttBl em itálico: 5’- ggggacaagtttgtacaaaaaag caggcttaaacaatgcgctcagccgttc-3’) e prm8572 (SEQ ID NO: 208; reverso, complementar, sítio AttB2 em itálico: 5’- ggggaccactttgtacaagaaagctgggtctcactg accctagcacactc-3’), o que inclui os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão. Um fragmento de PCR compreendendo o CDS de CAH3, incluindo sítios attB, foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”, pCAH3. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.

Exemplo 21: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada por SEQ ID NO: 80

O clone de entrada pCAH3 foi subseqüentemente usado em uma reação LR com pPCR, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável de planta; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor de protoclorofilida redutase de arroz (PcR, SEQ ID NO: 206) para expressão constitutiva foi localizado antes desta gaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressão

resultante pPCR::CAH3 (Figura 8) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.

Exemplo 22 Transformação de planta

Veja Exemplo 9 acima para detalhes de transformação de arroz e veja Exemplo 12 acima para detalhes de transformação de milho, trigo, soja, canola/colza, alfafa e algodão.

Exemplo 23: Procedimento de avaliação fenotípica

Veja Exemplo 10 acima para detalhes.

Exemplo 24: Resultados da avaliação fenotípica das plantas transgênicas Os resultados da avaliação de plantas transgênicas de arroz

expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção são apresentados em Tabela B4. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.

Rendimento total de sementes, número de grãos cheios, taxa

de enchimento de grãos e índice de colheita são significativamente aumentados nas plantas transgênicas expressando uma seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos).

Tabela B4: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da

Característica % de aumento em geração Tl % de aumento em geração T2 Faxa de enchimento 91 13 índice de colheita 19,4 18,3 Exemplos: CLAVATA Exemplo 25: Identificação de seqüências relacionadas à SEO ID NO: 209, SEQ ID NO: 210. SEO ID NO: 211 e SEO ID NO: 212

Seqüências de ácidos nucleicos (cDNA de comprimento completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 209 ou SEQ ID NO: 211, e/ou seqüências de polipeptídeos relacionadas à SEQ ID NO: 210 e SEQ ID NO: 212 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a significância estatística de identidades. O polipeptídeo codificado por SEQ ID NO: 209 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.

Em adição às publicamente disponíveis seqüências de ácidos nucleicos disponíveis em NCBI, bancos de dados privados de seqüências também foram procurados seguindo o mesmo procedimento como descrito neste lugar acima. Tabela C fomece uma lista de seqüências de ácidos nucleicos e aminoácidos relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 211 e à seqüência de aminoácido representada por SEQ ID NO: 212. A seqüência de ácido nucleico como representada por SEQ ID NO: 5 209 está compreendida em SEQ ID NO 211. Entretanto, um códon de parada prematura foi introduzido através de PCR em posição 2251 da seqüência de ácido nucleico como representada por SEQ ID NO: 211, substituindo a A por uma T (mudando de um códon AGA para um códon de parada TGA).

Tabela C: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 211) úteis nos métodos da presente invenção, e os

polipeptídeos deduzidos correspondentes.

Nomc Oreanismo fonte Aeido Polipeptídeo Número Estado Arath CLAVATAl Arabidopsis thaliana 212 213 ATU96879 Comprimento completo Brana LRR-RLK Brassica napus 214 215 AY283519 Comprimento completo Eucgr LRR-RLK Eucalvptus grandis 216 217 AAA79716 Comprimento completo Glyma CLVlA GIycine max 218 219 AF197946 Comprimento completo Glyma NARK GIyeine max 220 221 AF197947 Comprimento completo CLVlB Lotja IlARl Lotus japonicus 222 223 AB092810.1 Comprimento completo Medtr SUNN Medieago Iruneatida 224 225 ΛΥ769943 Comprimento completo Orysa FONl Oiyza sativa 226 227 AB1823 88 Comprimento completo Pissa SYM29 Pisuni sativa 228 229 PSA495759 Comprimento completo Poptr LRR-RLK I Populus tremuloides 230 231 scaff 1514.1 Comprimento completo Poptr LRR-RLK II Populus tremuloides 232 233 scaff 11.178 Comprimento completo Zeama K IN 5 Zea mays - 234 Bommert et al. Comprimento completo tipo Ipoba CLVl Ipomoea batatas 235 236 ΛΒ162660.1 Parcial Exemplo 26: Alinhamento de seqüências de polipeptídeos relevantes

AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo Clustal de alinhamento progressivo (Thompson et al. (1997) 15 Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados). 20 O resultado do alinhamento múltiplo de seqüências usando

polipeptídeos relevantes para identificar aqueles úteis para realizar os métodos da invenção é mostrado em Figura 11. As seguintes características são identificadas, de término N a término C:

- um peptídeo sinal previsto (identificado como em Exemplo

30);

- Motivo 1 como representado por SEQ ID NO: 237

- Motivo 2 como representado por SEQ ID NO: 238, compreendendo um par de cisteínas conservado;

- um domínio de repetição rica em leucina (LRR), compreendendo 21 LRRs (veja Exemplo 28);

- um segundo par de cisteínas conservado;

- um domínio transmembrana previsto (identificado como em

Exemplo 30);

- um domínio de quinase, compreendendo 11 subdomínios conservados (veja Exemplo 28); dentro deste domínio de quinase, o sítio ativo

de quinase previsto é identificado.

Exemplo 27: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção

Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os 20 métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado 25 por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.

Parâmetros usados na comparação foram:

Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2

Resultados da análise de aplicativo computacional são mostrados em Tabela Cl para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.

A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 51 % de identidade de aminoácidos comparada com SEQ ID NO: 212.

Tabela Cl: Resultados de MatGAT para similaridade e identidade global no

comprimento completo das seqüências de polipeptídeos.

1 2 3 4 5 6 7 8 9 10 11 12 I. Arath CLAVATA1VFL 87,1 61,8 61,6 60,3 60,2 61,2 55,9 60,9 68,2 66,7 54,2 2. Brana RLK 92,6 60,8 61,2 60,4 60,8 59,9 55,6 61 69,2 67,5 54,1 3. Eucgr RLK 76,8 75,1 59,7 58,8 60,8 58,6 53,4 58,8 63,2 62,7 53,3 4. Glyma NARK CLVlB 75.3 75,9 74.5 90,2 78 75,2 53,5 74,6 64,6 63,5 53,5 5. Glyma RLK CLVlA 75,6 75,5 73,9 94,3 77 75,1 52,8 74,7 63,8 63 52,4 6. Lotja RLK\HAR1 76,8 77,1 74,8 88 86 79,2 52,9 78 64,9 64,9 52,8 7. Medtr SUNN 75,5 75,2 73,9 85,1 84,6 88,1 52 86,2 63,5 64,2 52 8. Orysa FON1 70,7 71 69,5 67,8 67,9 69,1 67,7 51.9 55,8 56,2 77,2 9. Pissa LRR-RLK 75,5 74,8 74,3 85 84,5 88 91,9 66,8 64 64,2 51 10. Poptr RLKM 80,9 81,3 77,1 78,9 77,9 77,8 77 71,1 77,4 86,8 54,6 11. Poptr RLKMI 79,8 80,5 76,7 77,8 77 78,2 77,1 71,3 76,5 92,2 55,1 12. Zeama K1N5 69,7 68,8 68,7 67,4 66,9 68,1 66,9 85,9 66,2 71,5 70,7 Exemplo 28: Identificação de domínios compreendidos em seqüências de

polipeptídeos úteis para realizar os métodos da invenção

O banco de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica 5 sobre proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE (acessos PS), TrEMBL, PRlNTS (acessos PR), ProDom (acessos PD) e Pfam (acessos PF), Smart (acessos SM), e TIGRFAMs. InterPro é hospedado no European Bioinformatics Institute no Reino 10 Unido.

Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 212 são apresentados em Tabela C2 e em Figura 11. O domínio de repetição rica em leucina compreende um total de 21 cópias in tandem de repetições ricas em leucina 15 (LRRs) de 23-25 resíduos de aminoácidos de comprimento, e é flanqueado por pares de resíduos de cisteína espaçados necessários para ligação dissulfeto com outras proteínas (por exemplo com Clavata 2). Baseado na classificação de Shiu e Bleecker (2001) Proc Natl Acad Sc 98(19): 10763-10768), a seqüência de polipeptídeo como representada por SEQ ID NO: 212 pertence à 20 subfamília LRR XI. O domínio LRR é seguido por um domínio transmembrana previsto correspondendo aos resíduos de aminoácidos 641 a 659 na seqüência de polipeptídeo como representada por SEQ ID NO: 212 (veja Exemplo 30). Depois do domínio transmembrana está o domínio de quinase intracelular compreendendo os 11 subdomínios característicos com 25 todos os resíduos de aminoácidos invariantes conservados em comparação com outras proteínas quinases eucarióticas (Hank and Quinn 1 (1991) Methods Enzymol 200:38-62). Um sítio ativo de quinase também é previsto durante a varredura de InterPro.

Tabela C2: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 212

Número de acesso de Números de acesso Nome de acesso InterPro integrado IPR000719 PD000001 Proteína quinase PF00069 PS50011 IPROO1245 SM00219 Tirosina proteína quinase IPROOl611 PR00019 Repetição rica em Leucina PF00560 IPR002290 SM00220 Serina/treonina proteína quinase IPR003591 SM00369 Repetição rica em Leucina, subtipo típico IPR008271 PS00108 Serina/treonina quinase, sítio ativo IPROl 1009 SSF56112 Tipo proteína quinase 1PR013210 PF08263 Repetição rica em Leucina, N-terminal Exemplo 29: Predição de sítios de fosforilação compreendidos nas seqüências de polipeptídeos úteis para realizar os métodos da invenção

O estado de fosforilação/desfosforilação do polipeptídeo como representado por SEQ ID NO: 212 está diretamente relacionado à ativação/inativação do polipeptídeo (Trotochaud et al., (1999) Plant Cell 11: 393-405). Uma proteína fosfatase, KAPP, se liga de uma maneira 'dependente de fosforilação ao domínio de quinase de SEQ ID NO: 212, com isso inativando a transdução de sinal. Substituindo os aminoácidos fosforiláveis pelo domínio de quinase de aminoácidos não fosforiláveis, a atividade da seqüência de polipeptídeo como representada por SEQ ID NO: 212 é abolida. E possível identificar sítios de predição de fosforilação de serina (S), treonina (T) e tirosina (Y) usando algoritmos tal como NetPhos 2.0, hospedado no servidor da Technical University of Denmark. O servidor NetPhos 2.0 produz previsões de redes neurais para sítios de fosforilação de serina, treonina e tirosina em proteínas eucarióticas.

Os resultados de análise NetPhos 2.0 da seqüência de polipeptídeo como representada por SEQ ID NO: 212 são apresentados abaixo. O domínio de quinase de SEQ ID NO: 212 foi sublinhado, e sítios de 20 fosforilação S, T, e Y preditos compreendidos dentro deste domínio foram encaixotados. Estes podem ser mutados para aminoácidos não fosforiláveis por técnicas bem conhecidas na arte, tal como mutagênese dirigida por sítio. Seqüência de polipeptídeo de SEQ ID NO: 212

MAMRLLKTHLLFLHLYLFFSPCFAYTDMEVLLNLKSSMIGPKGHGLHDWIHSSSPDAHCSFSGVSCDDDARVISLNVSFT 80

PLFGTISPEIGMLTHLVNLTLAANNFTGELPLEMKSLTSLKVLNISNNGNLTGTFPGEILKAMVDLEVLDTYNNNFNGKL 160

PPEMSELKKLKYLSFGGNFFSGEI PESYGDIQSLEYLGLNGAGLSGKSPAFLSRLKNLREMYIGYYNSYTGGVPREFGGL 2 40

T KLEIL DMAS CTLT GE I PTSLSNLKHLHTLFLHINNLTGHIPPELSGLVSLKSLDLSINQLTGEI PQS FINLGNI TL INL 320

FRNNLYGQI PEAIGELPKLEVFEVWEINNFTLQLPANLGRNGNLI KLDVSDNHLTGLI PKDLCRGEKLEMLILSNNFFFGP 400

IPEELGKCKSLTKIRIVKNLLNGTVPAGLFNLPLVTIIELTDNFFSGELPVTMSGDVLDQIYLSNNWFSGEIPPAIGNFP 480

NLQTLFLDRNRFRGNIPREIFELKHLSRINTSANNITGGIPDSISRCSTLISVDLSRNRINGEIPKGINNVKNLGTLNIS 5 60

GNQLTGSIPTGIGNMTSLTTLDLSFNDLSGRVPLGGQFLVFNETSFAGNTYLCLPHRVSCPTRPGQTSDHNHTALFSPSR 64 0

IVITVIAAITGLILISVAIRQMNKKKNQKSLAWKLTAFQKLDFKSEDVLECLKEENIIGKGGAGIVYRGSMPNNVDVAIK 720

RLVGRGTGRSDHGFT AEIQTLGRIRHRHIVRLLGYVANKDTNLLLYEYMPNGSLGELLHGSKGGHLQWETRHRVAVEAAK 800

GLC YLHHDCS PLILHRDVKSNNILLDSDFEAHVADFGLAKFLVDGAASECMSSIAGS YGYIAPEYA YTLKVDEKSDVYSF 880

GVVLLELi AGKKPVGEFGEGVDIVRWVRNTEEEITQPSDAAIVVAIVDPRLTGYPLTSVIHVFKIAMMCVEEEAAARPTM 960 RE V VHMLTN P PKS VANLIAF 1040

Sítios de fosforilação preditos correspondentes

........................Y...........S................S..........S..............................80

......................................S..................................................................................160

...........Y.S............SY................S. .S................................................................240

...................S.............................S............................................................320

.....Y....................................................................................................................................................400

.............................................S...............Y....................................480

..........................S. ..T.............S. .S.......S................................................560

.......................S..........................................TS........S. . . 640

.....................................................................S....................720

......T...........................Y..........................................................................................800

...............................................S................Y. .T......S..........880

.............................T.....................T..........................T. 960

S..............1040

Ser Thr Tyr Sítios de fosforilação preditos 22 7 7 Sítios de fosforilação preditos 3 5 2 compreendidos no domínio de quinase Exemplo 30: Predição de topologia das seqüências de polipeptídeos úteis para realizar os métodos da invenção (localização subcelular, transmembrana...)

TargetP 1.1 prediz a localização subcelular de proteínas 5 eucarióticas. A designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a predição final está baseada não são probabilidades realmente, e eles não necessariamente adicionam a uma.

Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a predição. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a predição mais forte. TargetP é mantido no servidor da Technical University of Denmark.

Para as seqüências previstas conterem uma pré-seqüência N- terminal um sítio de clivagem potencial também pode ser previsto.

Os resultados de análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 212 são apresentados em Tabela C3. O grupo de organismo “planta” foi selecionado, nenhum atalho definido, e o comprimento previsto do peptídeo de trânsito requisitado. A localização subcelular da seqüência de polipeptídeo como representada por SEQ ID NO: 210 é a via secretora (retículo endoplasmático ou ER), e o comprimento previsto do peptídeo sinal é de 24 aminoácidos começando do término N (não tão confiável quanto a predição da própria localização subcelular, pode variar em comprimento de alguns aminoácidos).

Tabela C3: Análise 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 210

Comprimento (AA) 980 Peptídeo de trânsito cloroplástico 0,001 Peptídeo de trânsito mitocondriano 0,113 Peptídeo sinal de via secretora 0.973 Outro direcionamento subcelular 0,018 Localização Prevista Secretora (retículo endoplasmático ou ER) Classe de confiança 1 Comprimento de peptídeo sinal previsto 24 Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:

• ChloroP 1.1 hospedado no servidor da Technical University of Denmark;

• Protein Prowler Subcellular Localisation Predictor versão 1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Austrália;

· TMHMM, hospedado no servidor da Technical University

of Denmark. O resultado de algoritmo TMHMM2.0 na seqüência de polipeptídeo de SEQ ID NO: 212 é dado na Tabela C4 abaixo. Duas regiões hidrofóbicas são identificadas, que correspondem a: (i) um peptídeo sinal para direcionamento subcelular de ER; e (ii) um domínio transmembrana.

Tabela C4: Resultado de algoritmo TMHMM2.0 na seqüência de polipeptídeo de SEQ ID NO: 212

Posição relativa à membrana Aminoácidos de término N Domínio correspondente na plasmática a término C de SEQ ID seqüência de polipeptídeo de SEQ NO: 212 ID NO: 212 Seqüência fora de célula 1-640 Domínio LRR extracelular Hélice transmembrana 641-659 Domínio transmembrana Seqüência dentro de célula 660-980 Domínio de quinase intracelular Exemplo 31: Ensaio relacionado às seqüências de polipeptídeos úteis para realizar os métodos da invenção, e métodos de interromper a função biológica do domínio C-terminal

Em uma primeira etapa, atividade dos polipeptídeos úteis para

realizar os métodos da invenção é identificada por sua capacidade de se ligar a seus interactores naturais, tal como em Trotochaud et al. (1999; Plant Cell 11: 393-406), usando os métodos descritos neste. Um ensaio de atividade de CLVl é verificar a interação física de KAPP com o domínio de quinase do polipeptídeo CLVl usando o sistema de dois híbridos de levedura.

Em uma segunda etapa, os polipeptídeos CLVl identificados são tornados úteis para os métodos da invenção interrompendo a função biológica do domínio C-terminal. Tais métodos (para interromper a função biológica) são bem conhecidos na arte e incluem: remoção, substituição e/ou 25 inserção de aminoácidos do domínio C-terminal. Um ou mais aminoácido(s) do domínio C-terminal pode(m) ser removido(s), substituído(s) e/ou inserido(s), normalmente usando técnicas baseadas em PCR, por exemplo:

(i) remoção, substituição e/ou inserção de aminoácidos compreendendo todo ou parte do domínio C-terminal (neste exemplo particular (i), adotado para significar a seqüência de aminoácidos seguindo a

seqüência de aminoácidos codificando o domínio transmembrana (de término N a término C)); ou

(ii) substituir aminoácidos conservados (tal como o sítio ativo de quinase como mostrado em Figura 2 e Exemplo 28 (envolvido em sítio de ligação de ATP de substrato), ou o G conservado em subdomínio IX de

quinase (envolvido em autofosforilação), ou as cisteínas conservadas no segundo par (envolvido em homo e heterodimerização)) por alanina, etc.; ou

(iii) inserir aminoácidos no sítio ativo de quinase, por exemplo, para interromper ligação de substrato;

(iv) substituir aminoácidos fosforiláveis (tal como serina, treonina ou tirosina) por aminoácidos não fosforiláveis (para interação com

outras proteínas, por exemplo);

(v) ou qualquer outro método para interromper a função biológica conhecido na arte.

Um exemplo de interrupção da função biológica do domínio 20 C-terminal de um polipeptídeo CLVl compreende introduzir um códon de parada prematura (no iniciador reverso, SEQ ID NO: 240) através de PCR em posição 2251 da seqüência de ácido nucleico como representada por SEQ ID NO: 211, substituindo a A por uma T (mudando um códon AGA para um códon de parada TGA).

Exemplo 32: Clonagem de seqüência de ácido nucleico como representada por SEO ID NO: 209

A menos que de outra maneira determinado, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratoiy Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, CuiTent Protocols. Materiais e métodos padrão para trabalho molecular com planta são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).

A seqüência de ácido nucleico de Arabidopsis thaliana codificando o polipeptídeo CLVl com um domínio não funcional de SEQ ID NO: 210 foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântulas de Arabidopsis thaliana (Invitrogen, Paisley, UK). Os seguintes iniciadores os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR:

1) prm8591 (SEQ ID NO: 239; sentido, códon de início em negrito, sítio AttBl em itálico):

5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgatgagacttttgaag-

3’;e

2) prm8592 (SEQ ID NO: 240; reverso, complementar, sítio AttB2 em itálico):

5 ’-ggggaccactttgtacaagaaagctgggtcgctacgtaaccaagaagtcac-3 ’).

PCR foi realizado usando Hifl Taq DNA polimerase em condições padrão. Um fragmento de PCR foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®. Exemplo 33: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada por SEQ ID NO: 209

O clone de entrada contendo a seqüência de ácido nucleico codificando o polipeptídeo CLYl de SEQ ID NO: 210 foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável de planta; uma 5 gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor de beta-expansina de arroz (SEQ ID NO: 241) para expressão em tecidos jovens em expansão, foi localizado antes desta gaveta Gateway.

Depois da etapa de recombinação LR, o vetor de expressão

resultante compreendendo a seqüência de ácido nucleico para o promotor de beta-expansina promoter antes da seqüência de ácido nucleico codificando Arath_CLVl com um domínio C-terminal não funcional (Figura 12) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.

Exemplo 34 Transformação de planta

Exemplo 35: Procedimento de avaliação fenotípica

Veja Exemplo 10 acima para detalhes.

Exemplo 36: Resultados da avaliação fenotípica das plantas transgênicas

Os resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção são apresentados em Tabela C5. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.

Biomassa aérea, biomassa total de raízes, biomassa de raízes finas, número de panículas primárias, número de flores por panícula, rendimento total de sementes, número de grãos cheios, número total de sementes, e índice de colheita são significativamente aumentados nas plantas transgênicas expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos).

Tabela C5: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da

invenção.

Característica % de aumento em geração T1 Biomassa aérea 5 Biomassa total de raízes 2 Biomassa de raízes finas 2 Número de panículas primárias 8 Número de flores por panícula 6 Rendimento total de sementes 9 Número de grãos cheios 12 Número total de sementes 14 índice de colheita 5 TKW -3 I LISTAGEM DE SEQÜÊNCIAS

110> CropDesign N.V.

<120> Plantas tendo características relacionadas ao rendimento

melhoradas e um método para fazer as mesmas

<130> PF58581

<150> EP 06124785.4

<151> 2006-11-24

<150> US 60/868,381

<151> 2006-12-04

<150> EP 06125156.7

<151> 2006-11-30

<150> US 60/883,166

<151> 2007-01-03

<150> EP 06126018.8

<151> 2006-12-13

<150> US 60/883,170

<151> 2007-01-03

<160> 241

<170> PatentIn version 3.3 <210> 1 <211> 945 <212> DNA

<213> Arabidopsis thaliana <4 00> 1

atggatccca agaacctaaa tcgtcaccaa gtaccaaatt tcttgaaccc accaccacca ccgcgaaatc agggtttggt agatgatgat gctgcttctg ctgttgtttc cgacgagaat cgcaaaccaa caactgagat taaagatttc cagatcgtgg tctctgcttc cgacaaagaa ccaaacaaga agagtcagaa tcagaaccag cttggtccta agagaagctc taacaaagac agacacacta aagtcgaagg tagaggtcga cgaattcgga tgcctgctct ttgtgctgct aggatttttc aattgactag agaattgggt cataaatctg atggtgaaac tatccagtgg ctgcttcaac aagctgagcc atcgattatt gcagctactg gttcaggaac tataccggcc tctgctttag cttcttcagc tgcaacctct aaccatcatc aaggtgggtc tcttactgct ggtttaatga tcagtcatga cttagatggt gggtctagta gtagtggtag accattaaat tgggggattg gtggcggtga aggagtttct aggtcaagtt taccaactgg gttatggcca aatgtagctg ggtttggttc tggtgtgcca accactggtt taatgagtga aggagctggt tatagaattg ggtttcctgg ttttgatttt cctggtgttg gtcatatgag ttttgcatct attttgggtg ggaatcataa tcagatgcct ggacttgagt taggcttgtc tcaagaaggg aatgttggtg ttttgaatcc tcagtctttt actcagattt atcaacagat gggtcaggct caggctcaag ctcaaggtag ggttcttcac catatgcatc ataaccatga agaacatcag caagagagtg gtgagaaaga tgattctcaa ggctcaggtc gttaa 945

<210> 2 <211> 314 <212> PRT

<213> Arabidopsis thaliana <4 00> 2

Met Asp Pro Lys Asn Leu Asn Arg His Gln Val Pro Asn Phe Leu Asn 10 15

Pro Pro Pro Pro Pro Arg Asn Gln Gly Leu Val Asp Asp Asp Ala Ala 20 25 30

Ser Ala Val Val Ser Asp Glu Asn Arg Lys Pro Thr Thr Glu He Lys 35 40 45

Asp Phe Gln He Val Val Ser Ala Ser Asp Lys Glu Pro Asn Lys Lys 50 55 60

Ser Gln Asn Gln Asn Gln Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp 65 70 7 5 80

Arg His Thr .Lys Val Glu Gly Arg Gly Arg Arg He Arg Met Pro Ala 8 5 90 95

Leu Cys Ala Ala Arg He Phe Gln Leu Th.r Arg Glu Leu Gly His Lys 100 105 110

Ser Asp Gly Glu Thr He Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser 115 120 125

60 120 180 240 300 360 420 480 540 600 6 60 720 780 840 900 Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala Leu Ala 130 135 140 Ser Ser Ala Ala Thr Ser Asn His His Gln Gly Gly Ser Leu Thr Ala 145 150 15 5 160 Gly Leu Met Ile Ser His Asp Leu Asp Gly Gly Ser Ser Ser Ser Gly 165 170 175 Arg Pro Leu Asn Trp Gly Ile Gly Gly Gly Glu Gly Val Ser Arg Ser 180 185 190 Ser Leu Pro Thr Gly Leu Trp Pro Asn Val Ala Gly Phe Gly Ser Gly 195 200 205 Val Pro Thr Thr Gly Leu Met Ser Glu Gly Ala Gly Tyr Arg Ile Gly 210 215 220 Phe Pro Gly Phe Asp Phe Pro Gly Val Gly His Met Ser Phe Ala Ser 225 230 235 240 Ile Leu Gly Gly Asn His Asn Gln Met Pro Gly Leu Glu Leu Gly Leu 245 250 255 Ser Gln Glu Gly Asn Val Gly VaI Leu Asn Pro Gln Ser Phe Thr Gln 260 265 270 Ile Tyr Gln Gln Met Gly Gln Ala Gln Ala Gln Ala Gln Gly Arg Val 275 280 285 Leu His His Met His His Asn His Glu Glu His Gln Gln Glu Ser Gly 290 295 300 Glu Lys Asp Asp Ser Gln Gly Ser Gly Arg 305 310

<210> 3 <211> 732 <212> DNA

<213> Arabidopsis thaliana <4 00> 3

atggtcatgg agcccaagaa gaaccaaaat ctaccaagtt tcttaaaccc atcacgacag aatcaggaca acgacaagaa gaggaaacaa acagaggtta aaggtttcga cattgtggtc ggcgaaaaga ggaagaagaa ggagaatgaa gaggaagacc aagaaattca gattctttat gagaaggaga agaagaaacc aaacaaagat cgtcacctta aagttgaagg aagaggtcgt agagttaggt tacctccact ctgtgcagca aggatttatc aattgactaa agaattaggt cacaaatcag atggtgagac tcttgaatgg ttgcttcaac atgctgagcc atcgatactc tctgctactg taaatggtat caaacccact gagtctgttg tttctcaacc tcctctcacg gctgatttga tgatttgtca tagcgttgaa gaagcttcaa ggactcaaat ggaggcaaat gggttgtgga gaaatgaaac aggacagacc attggagggt ttgatctgaa ttacggaatt gggtttgatt tcaatggtgt tccagagatt ggttt.tggag ataatcaaac gcctggactt gaattaaggc tgtctcaagt tggggttttg aatccacagg tttttcaaca aatgggtaaa gaacagttca gggttcttca tcatcattca catgaagatc agcagcagag tgcagaggaa aatggttcat aa 732

<210> 4 <211> 243 <212> PRT

<213> Arabidopsis thaliana <4 00> 4

Met Val Met Glu Pro Lys Lys Asn Gln Asn Leu Pro Ser Phe Leu Asn 1 5 10 15 Pro Ser Arg Gln Asn Gln Asp Asn Asp Lys Lys Arg Lys Gln Thr Glu 20 25 30 Val Lys Gly Phe Asp Ile Val Val Gly Glu Lys Arg Lys Lys Lys Glu 35 40 45 Asn Glu Glu Glu Asp Gln Glu Ile Gln Ile Leu Tyr Glu Lys Glu Lys 5 0 55 60 Lys Lys Pro Asn Lys Asp Arg His Leu Lys Val Glu Gly Arg Gly Arg 65 70 75 80 Arg Val Arg Leu Pro Pro Leu Cys Ala Ala Arg Ile Tyr Gln Leu Thr 8 5 90 95 Lys Glu Leu G1 y His Lys Ser Asp Gly Glu Thr Leu Glu Trp Leu Leu 100 105 110 Gln His Ala Glu Pro Ser Ile Leu Ser Ala Thr Val Asn Gly Ile Lys 115 120 125

60

120

180

240

300

360

420

480

540

600

660

720 Pro Thr Glu Ser VaI Val Ser Gln Pro Pro Leu Thr Ala Asp Leu Met 130 135 140 Ile Cys His Ser Val Glu Glu Ala Ser Arg Thr Gln Met Glu Ala Asn 145 150 155 160 Gly Leu Trp Arg Asn Glu Thr Gly Gln Thr Ile Gly Gly Phe Asp Leu 165 170 175 Asn Tyr Gly Ile Gly Phe Asp Phe Asn Gly Val Pro Glu Ile Gly Phe 180 185 190 Gly Asp Asn Gln Thr Pro Gly Leu Glu Leu Arg Leu Ser Gln Val Gly 195 200 205 Val Leu Asn Pro Gln Val Phe Gln Gln Met Gly Lys Glu Gln Phe Arg 210 215 220 Val Leu His His His Ser His Glu Asp Gln Gln Gln Ser Ala Glu Glu 225 230 235 240 Asn Gly Ser <210> 5 < 211> 930 <212> DNA

<213> Aquilegia formosa χ Aquilegia pubescens <400> 5

atggatgatc ttaagaattc atcaaagcaa ccacaagaag tagtaacaag tttcttgaga

cattcttcac aacaagagat gggaggagga ggaggagaga ataaacaaac agaaatcaga

gattttcaaa tctcaacagt tgttgcagat aaagatggtg gtaagaagca gttagcacca

aaaagaactt caaataaaga tagacatact aaggtagatg gaagaggtag aaggataagg

atgccagctt tatgtgcagc tagaattttt cagttaacaa gagaattggg tcataaatct

gatggagaaa ctatacaatg gttattacaa catgctgaac catcaataat tgccgctaca

ggtactggaa ctataccagc ttcagcttta gttcaatcta gtagctcagt ttcacaacag

gggaattctg tttcagttgg tttacaaaca aagatcagtg aattgggaca tgaaattggg

tccagtagta gtaggaccaa ttggaatttg gttagatccc cagtaacaac aagtttatgg

ccctctgtca gtggttatgt accagggttt catccttctt caggccaacc gacatcgaat

ctgagtagtg atggtttgaa ttatttgcct aaattcggta ttcatggttt cgaaatgcct

ggatcaaatt taggtacaat gaatttaaat tcattcatgg gggttggtaa taatcaacaa

cttcctggat tggaattagg attatctcaa gatgtgcata ccggggtatt gaatcctcaa

gctttacagt tttatcagca gatggttcaa tcaagaggag ttgtcatgca tcaacaacag

cagcaccagc aacaacaaca acaacaacag cagcagcagc agcaaccaca tgatgatgat

gaggatgatt ctcaaggttc aagacattaa 930 <210> 6 <211> 309 <212> PRT

<213> Aquilegia formosa x Aquilegia pubescens <4 00> 6

Met Asp Asp Leu Lys Asn Ser Ser Lys Gln Pr o Gln Glu Val Val Thr 1 5 10 15 Ser Phe Leu Arg His Ser Ser Gln Gln Glu Met Gly Gly Gly Gly Gly 20 25 30 Glu Asn Lys Gln Thr Glu Ile Arg Asp Phe Gln Ile Ser Thr Val Val 35 40 45 Ala Asp Lys Asp GSly Gly Lys Lys Gln Leu Ala Pro Lys Arg Thr Ser 50 55 60 Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg 65 70 75 80 Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu 85 90 95 Gl y His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln His Ala 100 105 110 Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser 115 120 125 Al a Leu Val Gln Ser Ser Ser Ser Val Ser Gln Gln Gly Asn Ser Val 130 13 5 140 Ser Va 1 Gly Leu Gln Thr Lys Ile Ser Glu Leu Giy His Glu IIe GIy 145 150 155 160 Ser Ser Ser Ser Arg Thr Asn Trp Asn Leu VaI Arg Ser Pro Val Thr 165 170 175

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900 Thr Ser Leu Trp Pro Ser Val Ser Gly Tyr Val Pro Gly Phe His Pro 180 185 190 Ser Ser Gly Gln Pro Thr Ser Asn Leu Ser Ser Asp Gly Leu Asn Tyr 195 200 205 Leu Pro Lys Phe Gly Ile His Gly Phe Glu Met Pro Gly Ser Asn Leu 210 215 220 Gly Thr Met Asn Leu Asn Ser Phe Me t: Gly Val Gly Asn Asn Gln Gln 225 230 235 240 Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Val His Thr Gly Val 245 250 255 Leu Asn Pro Gln Ala Leu Gln Phe Tyr Gln Gln Met Val Gln Ser Arg 260 265 270 Gly Val Val Met His Gln Gln Gln Gln His Gln Gln Gln Gln Gln Gln 275 280 285 Gln Gln Gln Gln Gln Gln Gln Pro His Asp Asp Asp Glu Asp Asp Ser 290 295 300

Gln Gly Ser Arg His 305

<210> 7 <211> 1038 <212> DNA <213> Glycine max <4 00> 7

atggatccca agggctcaaa gcagcagcca cagcaatcac aggaggtggt accaaacttc ctcagcctcc cccaacagca acaagggaat accaacaaca acaacatggg agagaacaaa cctgcagagg tgaaggattt ccagatagtg gtagctgaga acaaggaaga gagcaagaaa cagcagcaac agttggcacc aaagaggagt tccaacaagg acaggcacac caaggttgaa ggcaggggaa ggaggataag gatgcctgct ctctgcgcag ccagaatctt ccagttgacc agggaattgg gtcacaaatc tgatggggaa accatccagt ggctcctcca gcaggctgag ccatccatca tagctgccac tgggactggc acaataccag catctgctct tgctgctgct ggaaactcac tctcaccaca agctgcttct ctttcatcat ccttgcacca acatcaacaa aagattgatg aattgggtgg gtcagggggg agtagtagta gggccagctg gcaaatggtt ggggggaatt tggggagacc ccatttgggt gtgggtgtgg ccacagcagc aggcctatgg ccccctcatg tcagtggatt tggatttcaa acaccaccaa caacaacaac accaacaaca acaacatcat catctggtcc atctaatgcc accttagcca ctgagagctc caattacctt cagaaaattg cattccctgg ctttgacttg cctacttctg ccactaacat gatgggtcac atgagtttca cctcaatttt gggtggaggt gggggtggtg gggcccagca tatgcctggc ttggagcttg gtctttccca ggatggccat attggggtgt tgaatcaaca ggccttgaac cagatttatc agcagatgaa tcaggctggt agagtgcatc atcatcagca tcagcatcat catcagcatc atcagcagca acaacaccat cagcaaactc ctgctaagga tgattctcaa ggctcaggag gacagtag 1038

<210> 8 <211> 345 <212> PRT <213> Glycine max <4 00> 8

Met Asp Pro Lys Gly Ser Lys Gln Gln Pro Gln Gln Ser Gln Glu Val 1 5 10 15 Val Pro Asn Phe Leu Ser Leu Pro Gln Gln Gln Gln Gly Asn Thr Asn 20 25 30 Asn Asn Asn Met Gly Glu Asn Lys Pro Ala Glu Val Lys Asp Phe Gln 35 4 0 4! c; Ile Val Val Ala Glu Asn Lys Glu Glu Ser Lys Lys Gln Gln Gln Gln 50 5 5 60 Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu 65 70 7 5 80 Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile 8 5 90 95 Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile 100 10 5 110 Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly 115 120 125 Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly Asn Ser Leu 60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020 130 135 140

Ser Pro Gln Ala Ala Ser Leu Ser Ser Ser Leu His Gln His Gln Gln 145 150 155 160 Lys Ile Asp Glu Leu Gly Gly Ser Gly Gly Ser Ser Ser Arg Ala Ser 165 170 175 Trp Gln Met Val Gly Gly Asn Leu Gly Arg Pro His Leu Gly Val Gly 180 185 190 Val Ala Thr Ala Ala Gly Leu Trp Pro Pro His Val Ser Gly Phe Gly 195 200 205 Phe Gln Thr Pro Pro Thr Thr Thr Thr Pro Thr Thr Thr Thr Ser Ser 210 215 220 Ser Gly Pro Ser Asn Ala Thr Leu Ala Thr Glu Ser Ser Asn Tyr Leu 225 230 235 240 Gln Lys Ile Ala Phe Pro Gly Phe Asp Leu Pro Thr Ser Ala Thr Asn 245 250 255 Met Met Gly His Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Gly Gly 260 265 270 Gly Gly Ala Gln His Met Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp 275 280 285 Gly His IIe Gly Val Leu Asn Gln GIn AIa Leu Asn Gln Ile Tyr Gin 290 295 300 Gln Met Asn Gln Ala Gly Arg Val His His His Gln His Gln His His 305 310 315 320 His Gln His His Gln Gln Gln Gln His His Gln Gln Thr Pro Ala Lys 325 330 335 Asp Asp Ser Gln Gly Ser Gly Gly Gln 340 345

<210> 9 <211> 903 <212> DNA

<213> Gossypium hirsutum <4 00> 9

atggatccca agggcgccaa gcagcctcca gaggaagtag ccaacttgtt gagcctgcca ccccaacccc aacagcaaca gcctcaaaac atgggagaga ataaagcagc agaaatcaag gatttccaga ttgtggttgc agataaagga gaagggaaga agcaacagtt ggccccaaag agaagttcta acaaagacag gcacaccaaa gttgaaggaa gaggtagaag gataaggatg cctgctttat gtgctgctag aatctttcag ttgaccaggg aattgggtca caagtctgat ggggaaacca tacagtggct gttacaacaa gctgaaccat ccataattgc cgccactggg agcggaacaa ttccagcatc agctttggct gcagctggag gctcagtttc acagccaggg gcctctctat cagcagggtt gcaccaaaag atggaagatt taggggggtc cagtataggg tcagggagca gtaggaccag ttggacaatg gttggtggca atttgggaag accccatcat gtggcgaccg ggttatggcc accagtcagt ggttttgggt ttcagtcatc atctggtccg tctacaacaa atttaggcag tgatagttcc aattatctgc aaaagcttgg gtttccaggt tttgatttgc cagctagtaa catgggtcag ataagtttca cctcaatctt gggcggagct aatcagcagc tcccgggttt ggaacttggg ttatctcaag atggtcatat tggggtctta aatcctcatg ctttgaacca gatttatcag cagatggagc aagctcggat gcaaccccaa catcagcatc agcaccagca acaaccccct gctaaggatg actcccaagg atcgggccag taa 903

<210> 10 <211> 300 <212> PRT

<213> Gossypium hirsutum <4 00> 10

Met Asp Pro Lys Gly Ala Lys Gln Pro Pro Glu Glu Val Ala Asn Leu 1 5 10 15 Leu Ser Leu Pro Pro Gln Pro Gln Gln Gln Gln Pro Gln Asn Met Gly 20 25 30 Glu Asn Lys Ala Ala Glu Ile Lys Asp Phe Gln Ile Val Val Ala Asp 35 40 4 5 CO Gly Glu Gly Lys Lys Gln Gln Leu Ala Pr ο Lys Arg Ser Ser Asn 5 0 5 5 60 Lys Asp Arg His Thr Lys Val Glu Gily Arg Gly Arg Arg Ile Arg Met 65 7 0 7 5 8 0

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900 Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly 85 90 95 His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu 100 105 110 Pro Ser Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala 115 120 125 Leu Ala Ala Ala Gly Gly Ser Val Ser Gln Pro Gly Ala Ser Leu Ser 130 135 140 Ala Gly Leu His Gln Lys Met Glu Asp Leu Gly Gly Ser Ser Ile Gly 145 150 155 160 Ser Gly Ser Ser Arg Thr Ser Trp Thr Met Val Gly Gly Asn Leu Gly 165 17 0 175 Arg Pro His His Val Ala Thr Gly Leu Trp Pro Pro Val Ser Gly Phe 180 185 190 Gly Phe Gln Ser Ser Ser Gly Pro Ser Thr Thr Asn Leu Gly Ser Asp 195 200 205 Ser Ser Asn Tyr Leu Gln Lys Leu Gly Phe Pro Gly Phe Asp Leu Pro 210 215 220 Ala Ser Asn Met Gly Gln Ile Ser Phe Thr Ser Ile Leu Gly Gly Ala 225 230 235 240 Asn Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His 245 250 255 Ile Gly Val Leu Asn Pro His Ala Leu Asn Gln Ile Tyr Gln Gln Met 260 265 270 Glu Gln Ala Arg Met Gln Pro Gln His Gln His Gln His Gln Gln Gln 275 280 285 Pro Pro Ala Lys Asp Asp Ser Gln Gly Ser Gly Gln 290 295 300 <210> 11 <211> 819 <212> DNA <213> Lycopersicon esculentum <4 00> 11 atggatccca aacaggctaa ccacaacaat attaagccta

ttgcagattt tgaaaaatga tgaaacgaac aaggtggctg

catacaaaag ttgaaggtag agggaggaga atacgtatgc

atcttccagc ttacgcgcga attgggtcat aaatctgatg

ctgcagcaag ccgagccttc gattattgct gctactggca

gctttagctg cagcagcctc tgtttctcaa caggggatct

attgaatcgg gggcgaatat cgcggggtct ggtagcagta

aattggccaa tgatctgtgg gaattttgga agaccccatt

cctgcccctg cccctgttgt cactagtttt gggtttcaat

gcgagtttag gtagtgatag ttcaaattat tacttacaga

gatctgcctg cagctacaag tatgaatccg atgtgtttta

aatcagcaac tgccaggatt ggaactggga ttatctcaag

aaccagatat accagcaggc aagaatgcaa catccgcagc

caatctccgg aggaggattc tcaaggatca ggacattaa <210> 12 <211> 272 <212> PRT

<213> Lycopersicon esculentum <4 00> 12

ctcatgatca

ctcccaaaag

cggcgctctg

gtgagacaat

cagggacaat

ctgtatcagc

gaagtagtaa

tggctacagc

cctcatctgc

aaattgggtt

cttcaattct

agggtcattt

agcaacatca

gataaaagag

aaaagatagg

tgcagcaaga

tcagtggctg

acctgcctcg

tggtttaatg

tagtaggacc

aggaatgtgg

tccatcaagc

tcctggattt

tggtggaagt

aggggttttg

3.C3.3.C3.3.C3.3

819

Met Asp Pro Lys Gln Ala Asn His Asn Asn Ile Lys Pro Thr His Asp 1 5 10 15 Gln Ile Lys Glu Leu Gln Ile Leu Lys Asn Asp Glu Thr Asn Lys Val 20 25 30 Ala Ala Pro Lys Arg Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly 35 40 45 Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu 50 5 5 60 Thr Arg Glu Ijeu Gly Hi. s Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu 65 7 0 75 80 Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr 60

120

180

240

300

360

420

480

540

600

660

720

780 85 90 95

Ile Pro Ala Ser Ala Leu Ala Ala Ala Ala Ser Val Ser Gln Gln Gly 100 105 110 Ile Ser Val Ser Ala Gly Leu Met Ile Glu Ser Gly Ala Asn Ile Ala 115 120 125 Gly Ser Gly Ser Ser Arg Ser Ser Asn Ser Arg Thr Asn Trp Pro Met 130 135 140 Ile Cys Gly Asn Phe Gly Arg Pro His Leu Ala Thr Ala Gly Met Trp 145 150 155 160 Pro Ala Pro Ala Pro Val Val Thr Ser Phe Gly Phe Gln Ser Ser Ser 165 170 175 Al a Pro Ser Ser Ala Ser Leu Gly Ser Asp Ser Ser Asn Tyr Tyr Leu 180 185 190 Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Ala Thr Ser Met 195 200 205 Asn Pro Met Cys Phe Thr Ser Ile Leu Gly Gly Ser Asn Gln Gln Leu 210 215 22 0 Pro Gly Leu Glu Leu Gly Leu Ser Gln Glu Gly His Leu Gly Val Leu 225 230 235 240 Asn Gln Ile Tyr Gln Gln Ala Arg Met Gln His Pro Gln Gln Gln His 245 250 255 Gln Gln Gln Gln Gln Ser Pro Glu Glu Asp Ser Gln Gly Ser Gly His 260 265 270

<2 10> 13 <211> 966 <212> DNA

<213> Malus domestica <400> 13

atggatccca agggctcaaa gcagacacaa gacataccca gcttcttgag ccttccccca 60 caatcacaac cacaacctga gcagcagcag caaccacaac aacaacctca acccaacaac 120 aacatgagcg acaacaaacc tgctgaaatc aaagacttcc agattgtaat cgccgacaaa 180 gatgagtcgg gaaagaagca gttggcgccc aagagaagct ccaacaaaga cagacacact 240 aaagtcgaag gcaggggaag gaggatacgg atgccggccc tctgcgccgc cagaatcttt 300 caattgacca gagagttggg tcacaaatcc gatggggaaa caatccagtg gctcctccag 360 caggccgagc cgtcgattgt tgccaccacc gggaccggga cgattccggc gtcggctttg 420 gcggcggcag gtggctctgt ttcgcaacag gggacttctt tatcagctgg attgcaccaa 480 aagatcgatg aattgggggg gtccagtggg ggtaggacca gttgggcaat ggtgggcggg 540 aatttgggga gaccccatgt ggcaggggtg ggcgggctat ggccccctgt cagtagcttt 600 gggttccagt catcatctgg tcctccatcg gccaccacaa atctgggcac tgagagttca 660 aattacctgc aaaaaattgg gtttcctggc tttgacttgc ctgtctctaa catgggtccg 720 atgagtttta cttcaatttt gggtgggggc aatcagcagc agcagcagca gcttcctggg 780 ttggaacttg ggttgtcaca ggatggacat attggggttc tgaactctca ggctttgagc 840 cagatttacc agcagatggg gcatgttaga gtgcaccagc agccgccgca gcaccaccac 900 cagcaacacc accaccacca gcagcaaccg ccttccaagg acgattctca aggatccgga 960 cagtag 966

<210> 14 <211> 321 <212> PRT

<213> Malus domestica <4 00> 14

Met Asp Pro Lys Gly Ser Lys Gln Thr Gln Asp Ile Pro Ser Phe Leu 1 5 10 15 Ser Leu Pro Pro Gln Ser Gln Pro Gln Pro Glu Gln Gln Gln Gln Pro 20 25 30 Gln Gln Gln Pro Gln Pro Asn Asn Asn Met Ser Asp Asn Lys Pro Ala 35 40 45 Glu Ile Lys Asp Phe Gln Ile Val Ile Ala Asp Lys Asp Glu Ser Gly 50 55 60 Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr 65 7 0 75 80 Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala 85 9 0 95 Ala Arg Ile Phe Gln Leu Thr Arg G Iu Leu Gly His Lys Ser Asp Gly 100 105 110

Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu

115 120 125 Thr Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala

130 135 140

Gly Ser Val Ser Gln Gln Gly Thr Ser Leu Ser

145 150 155 160

Lys Ile Asp Glu Leu Gly Gly Ser Ser Gly Gly

165 170 175

Met Val Gly Gly Asn Leu Gly Arg Pro His Val

180 185 190

Leu Trp Pro Pro Val Ser Ser Phe Gly Phe Gln

195 200 205

Pro Ser Ala Thr Thr Asn Leu Gly Thr Glu Ser

210 215 220

Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Val

225 230 235 240

Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Asn

245 250 255

Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln

260 265 270

Val Leu Asn Ser Gln Ala Leu Ser Gln Ile Tyr

275 280 285

Val Arg Val His Gln Gln Pro Pro Gln His His

290 295 300

His His Gln Gln Gln Pro Pro Ser Lys Asp Asp

Pro Ser Ile Leu Ala Ala Ala Gly Leu Arg Thr Ser Ala Gly Val Ser Ser Ser Ser Asn Tyr Ser Asn Met Gln Gln Gln Asp Gly His Gln Gln Met His Gln Gln Ser Gln Gly

Val Ala Ala Gly His Gln Trp Ala Gly Gly Gly Pro Leu Gln Gly Pro Gln Gln Ile Gly Gly His His His Ser Gly

305 Gln <210> <211> <2 12> <213> <400>

310

315

320

15 855 DNA

Medicago truncatula 15

atggatccca aaaactcaaa gcaacaatca caactctcaa tcagagacaa aaaatcttca aattgtgtta tctgaaacaa aaacaactag caccaaaaag aacatcaaac aaagacagac ggaagaagaa taaggatgcc agctttatgt gcagcaagaa ttaggtcata aatcagatgg tgaaacaatt caatggcttt atcatagctg caacaggaac aggaacaata ccagcttcag actttgacac cacaaggttc atctttgtct tctggtttac tgggctcaga cccatcaagc ccatcaggcc catcagggcc ttatggccac atcatcatgt tggtggattt ggatttcatc ttagtagcta ctactgttgg tgaaaataat agtggaaatt tctggatttg atatgccaac aggaacaaat ttgggagtgg attttggggg gtgcaaatca gcagatgcct ggtttggaat catattggtg tgttgaatca acaagcttta actcagattt caaactaggg ttcagcacca gaatcagcag aataataata agttcagaac agtag E

<210> 16 <211> 284 <212> PRT

<213> Medicago truncatula <4 00> 16

Met Asp Pro Lys Asn Ser Lys Gln Gln Ser Gln

10 15

Glu Asn Lys Glu Ser Glu Thr Lys Asn Leu Gln

25 30

Thr Thr Thr Lys Asp Glu Thr Lys Lys Gln Leu

40 45

Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly

50 55 60

Arg Met Pro Ala Leu Gys Ala Ala Arg Ile Phe 65 7 0 7 5 8 0

acatgggaga caacaaaaga acacaaaagt tctttcagct tacaacaatc ctttagcttc agttgaatga atcatgttag aatcatcatc attttcagaa gagggatgag tagggttgtc atcagcagat ctactaagga 55

gaacaaagaa tgaaacaaag tgaaggaaga aacaagagag tgaaccatca ttctggtaat taggaatact ttctacaagt atctggtggt aattgggttt ttttacttca acaagatgga tggtcaaaat tgattctcac

Leu Ser Asn Met Gly Ile Val Leu Ser Glu Ala Pro Lys Arg Thr Arg Gly Arg Arg Ile Gln Leu Thr Arg Glu

60 120 180 240 300 360 420 480 540 600 660 720 780 840 Ile Gln

Gly Thr

Leu Thr

Arg Asn

Leu Gly His Lys Ser Asp Gly

85 90

Ser Glu Pro Ser Ile Ile Ala

100 105

Ser Ala Leu Ala Ser Ser Gly

115 120

Leu Ser Ser Gly Leu Gln Leu

135 140

Ala His Gln Ala His Gln

150 155

Pro His His His Val Gly Gly 165 170 175

Gly Gly Leu Val Ala Thr Thr 185 190

Gln Lys Ile Gly Phe Ser Gly Phe

200 205

Gly Val Gly Gly Met Ser Phe Thr

130 His Gln 145

Leu Trp Ser Ser

Glu Thr 95

Ala Thr 110 Asn Thr 125

Asn Asp

Gly

His 160 Phe

Val

His Gly Gly

Asn

Thr

180 Tyr Phe 195 Asn

Leu

210 Ala Asn 225 His

Ile

Ile Gly

Gln

Gly 245 Gln

215 Gln Met 230 Val

Pro

Leu

Asn

260 Thr Thr

Asn

Lys

17

275 <210> <211> <212> <2 13> <4 00> atggatccca gttgagtaca caattggttc cgtatgcctg tctgatggag accgggacag tcccaacaga aatatagtcg atgatgattg actcctgttg ttgggtagtg cctgcagcca ccaggtttgg ggcttgagcc catgagcatc <210> <211> <2 12> <213>

Asn 250 Gln Thr

265 Asp Asp 280

220 Gly Leu 235

Gln Gln Arg Val

Ser

Glu

Ala 255 Gln 270 His Ser

Leu 240 Leu

Gly

Thr

His Gln

Ser Glu

Trp Leu Gly Thr Pro Gln Thr Trp Val Ser Phe His Glu Asn Asp Met Ser Ile Leu Ser Gln Ile Asn Gln Gln

Leu Gln Gln Ile Pro Ala Gly Ser Ser Ala Gln Thr Ser Thr Ser Gln Ser Ser Asn Ser Gly Pro Thr Gly Leu Gly Gly Gln Asp Gly Tyr Gln Gln Gln Asn Asn

Pro

5 Ile

<4 00> Met Asp 1

Asn Asn 20

Asp Asp Glu

35 Arg His 50

Leu Cys 65

Ser Asp

DNA

Nicotiana benthamiana

17

agcagccgcc agcgcagtct ataagcctgt tcatgatcaa ctaaaagaaa agataggcac ctctttgcgc tgctaggatt agacaatcca gtggctgctg ggaccatccc tgcctcggct ggacctctgt atctgctggt ggtccgctag tatatgtagt ggaattttgg aagaccccat tcaatagttt cgcgttacag aaagttccaa ttattaccta ccaatatgag ttttacttca agcttggatt atctcaagac agatatacca ggctagaatt tatctcccga ggatgattct

18 295 PRT

Nicotiana benthamiana 18

Lys Gln

aacgctatca ataaaagatg acaaaagttg ttccaactca cagcaagccg ttagctgtag ttgcataaaa agtagtagta ttggccacag acagcactga caaaagattg attctaggtt aggggtcata cataatcaac cacggatcag

acattaacaa atgaaaccaa aaggcagagg cccgcgaatt agccctccat cagccgctgg aaatggatga ctagtagggc caggaatatg ctcctggatc gctttcctgg ccagtaataa taggggtttt agcagcacca gacactaa

caatattatg gaagcggcag gaggaggata aggtcataaa atttgcggcc cccctctgtt attgggagcg cagttggcca gcccggacct aagcaccaat atttgatctg ccagcaattg aaactctcaa gcaaaatcag

Pro Pro Ala Gln Ser Asn 15

Met Val Glu Tyr Asn Lys Pro Val

30

Thr Lys Lys Arg Gln Gln Leu Val

40 45

Lys Val Glu Gly Arg Gly Arg Arg

55 60

Ala Arg Ile Phe Gln Leu Thr Arg 70 75 80

Gly Glu Thr Ile Gln Trp Leu Leu Gln 85 90 95

Thr

Ala

Ala Ile Asn Ile Asn His Asp Gln Ile Lys Pro Lys Arg Lys Asp Ile Arg Met Pro Ala Glu Leu Gly His Lys Gln Ala Glu Pro Ser

60 120 180 240 300 360 420 480 540 600 660 720 780 840 Ile Phe Ala Ala Thr Gly Thr Gly Thr Ile Pro

100 105 110

Val Ala Ala Ala Gly Pro Ser Val Ser Gln Gln

115 120 125

Ala Gly Leu His Lys Lys Met Asp Glu Leu Gly

130 135 140

Ser Ala Ser Ile Cys Ser Ser Ser Ser Thr Ser

145 150 155 160

Met Met Ile Gly Asn Phe Gly Arg Pro His Leu

165 170 175

Trp Pro Gly Pro Thr Pro Val Val Asn Ser Phe

180 185 190

Leu Thr Pro Gly Ser Ser Thr Asn Leu Gly Ser

195 200 205

Tyr Leu Gln Lys Ile Gly Phe Pro Gly Phe Asp

210 215 220

Asn Met Ser Phe Thr Ser Ile Leu Gly Ser Ser

225 230 235 240

Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Arg

245

250

255

Leu Asn Ser Gln Gly Leu Ser Gln Ile Tyr Gln

260 265 270

Gln Gln Gln His Gln Gln Asn Gln His Glu His

275 280 285

Asp Ser His Gly Ser Gly His

290 295

<210> 19 <211> 894 <212> DNA

<213> Ocimum basilicum <400> 19

atggatccga agagctcgaa gcagccgcag gaggtttcga ttaggcgaaa acaaagcagc ggaaatcaag gattttcaga gattcgaaga agctagccct agctccgaag cgaagctcca gtggaaggcc gcggccggcg aattcggatg ccggcgctct ttgacccgag aattagggca caaatccgat ggcgagacca gccgagccgt cgatcatcgc cgccacgggg agcggcacca gcagccgccg gctcgatttc tcagcaaggt agctcgattt atcgaggatt taggcgcttc tatgggtggt ggtgggggca ggtgggaatc tgagtagacc acatgtgggc gcaagcacag ttcggcttcc agacggcgtc gtcttcttcc tcgtctggtc cctaattatc tccagaaaat ggggtttgct ggatttgagc atgagtttca cctccatctt aagcggcggc gggcagcagc ctttcacaag atggaaatat tggggttttg aatccgcaag cagattaatc cggcggcgcg tgtggttaac gcacatcaaa catcagcagc cattgtcgtc gaaagatgat gattctcaag <2 10> 20 <211> 297 <212 > PRT

<213> Ocimum basilicum <4 00> 20

Met Asp Pro Lys Ser Ser Lys Gln Pro Gln Glu

10 15

Asn Thr Asn Ser Leu Gly Glu Asn Lys Ala Ala

25 30

Gln Ile Val Val Ala Glu Lys Asp Asp Ser Lys

40 45

Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr

50 55 60

Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala 65 7 0 7 5 8 0

Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly 85 90 95

Ala Ser Arg Thr Ala Asn Arg Ala Ala Thr Ala Leu Glu Ser Leu Pro Asn Asn Gly His Ala Arg Leu Ser

Ala Leu Ala Ser Val Ser Ile Val Gly Ser Trp Pro Ala Gly Ile Gln Thr Ala Ser Asn Tyr Ala Ala Thr Gln Gln Leu Ile Gly Val Ile His Asn Pro Glu Asp

atcacagcaa ttgtagttgc acaaggaccg gcgccgccag tccagtggct tccccgcctc cgtctggact ggaatccctg gattatggcc cgtcaatcgc tgcccgggaa tgcccggatt cttttgggca atcaccacca aatcaggaca

caccaacagc ggagaaggat ccacaccaag aatcttccaa cctccagcaa cgccctcgcc ccatcagaaa gcctatgatt tcccactgga ggcggagaat tatcgggcag ggagctcggc gatttatcag acaacaccac gtag 8Í

Val Ser Asn His Ser Glu Ile Lys Asp Phe Lys Leu Ala Leu Ala Lys Val Glu Gly Arg Ala Arg Ile Phe Gln Glu Thr Ile Gln Trp

60 120 180 240 300 360 420 480 540 600 660 720 780 840 Leu

Thr

Gln

Leu Gln 100 Ile Pro 115

Gly Ser

Gln

Ala

Ser

Ala Glu

105 Ser Ala 120

Ile Ser

130

135

Pro

Leu

Ser 14

Ser Ile Ile Ala 110

Ala Ala Ala Ala 125

Gly Leu His Gln

Gly Ala Ser Met Gly Gly Gly Gly Gly Arg Asn

145

Gly Gly Asn 165

Pro Pro Thr 180

Gly Pro Ser 195

Phe Ala Gly 210

150 Leu

Gly

Ile

Phe

Ser Arg 170 Phe Gly

185 Ala Ala 200

Glu Leu

155 Pro

Phe

Glu

Pro

160

His Val Gly Ala 175

Gln Thr Ala Ser 190

Asn Pro Asn Tyr 205

Gly Asn Ile Gly

215

220

Ser Ile Leu Ser Gly Gly Gly Gln Gln Leu Pro 225 230 235 240

Leu Ser Gln Asp Gly Asn Ile Gly Val Leu Asn

Gln

245 Ile Tyr 260 Asn His 275

Gln

His

250 Gln Ile

265 Gln Gln 280

Asn

His

255 Pro Ala

270 His His 285

Ala Arg

Gln Gln

Asp Asp Asp Ser Gln Glu Ser Gly Gln

290 <210> <21i> <212> <213> <4 00>

295

<210> <2 11> <212> <213> <400> Met Asp 1

sativa

Thr

Gln

22 317 PRT Oryza 22

Pro Lys Phe 5

Thr Thr 20 His Arg 35

Thr Thr 25

Leu Gln 40

Pro 10 Asn

Ile

Pro

Gln

Gln 45

Pro Pro 15

Gln His 30

Val His

Pro Leu

His His

Pro Gln

Asp Gly Gly Gly Gly Gly Gly Lys Asp GJ.η Gln

50 55 60

Gln Val Val Val Ala Ala Ala Ala Gly Glu Arg 65 7 0 7 5 8 0

Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg His

Ala Thr Gly Ser Lys Ile Pro Trp Ser Thr Ser Ser Leu Gln Gln Met Gly Leu Pro Gln Va1 Val Pro Leu

Gly Ser Gly Ile Ser Gln Glu Asp Leu Pro Met Ile Gly Leu Trp Ser Ser Ser Lys Met Gly Ser Phe Thr Glu Leu Gly Ala Phe Gly Asn Ala His Ser Ser Lys

21 954 DNA

Oryza sativa 21

atggacccca aattcccccc acccccaccg ctaaacaaaa accaaccagc agcatcacca cgatgagcag cagcagcagc catcctcagc agcaggagca gcaggatgga ggtggaggag cagcagcaga tgcaggtggt ggttgcggcg gcggcggggg gggccgaagc ggagctcgaa caaggaccgc cacaccaagg atccggatgc cggcgctgtg cgccgcccgg atcttccagc aagtccgacg gcgagaccgt ccagtggctg ctccagcagg gccacgggga ccgggaccat cccggcgtcc gcgctcgcct tcccccaact ccgccctctc caggtcgcac caccaccacc ccgcccacgg cgtccgccgg gttcgccggt gcagggttct atcggcggga tcatgcagcg gatggggatc cccgccggga gcgggggggt tggggggtgg gggtggcggc ggcggtggcc ttcgccagcc acgcggcggc ggcggcggcc atgccggggc gacggccaca tcggcgtgct cgccgcgcag tcgctcagcc gccgccggtc agctgcagca ccagcaccag catcaccatc gacggggagg acaaccgcga cgacggcgag tccgatgagg

cggagcccac atcgcctcca gagggaagga agaggaggat tggacgggcg tcacgcggga cggagccggc ccgtcgcccc accacatgtg ccggcgccga tcgagctcca acatcgggtt tagagctagg agttctacca agcagcagca agtccgggca

caccaccacc 60

gattcaagtt 120

tcagcagcag 180

gcaggggcta 240

ggggcggcgg 300

gctcggccac 360

catcgtcgcc 420

ctccctccct 480

ggcggcagcg 54 0

ctccggggtg 600

gggcggggga 660

cgcgcccatg 720

gctctcgcag 780

ccaggtcggc 840

gcagcagcag 900 gtag 954

Asn Lys Thr GJ.u Pro

Asp Glu Gln Gln Gln

Gln Gln Glu Gln Gln

Gln Gln Gln Gln Met

Arg Met Gln Gly Leu

Thr Lys Val Asp Gly Arg Gly Arg Arg 100

Gln Leu Thr

115 Trp Leu

130 Gly Thr 145 Ser

Arg

Leu Gln

90

Ile Arg

105 Glu Leu 120 Gln

Met

Pro

Trp Ala

Ile

Asn 165 Ala

135 Pro Ala 150

Ser Ala Ala Pro

Ala

Ser

Leu 170 Pro

Gly

125 Glu Pro

140 Ala Leu 155

Ser Arg Thr Ala

95

Pro Ala 110 His Lys

Leu

Ser

Cys Asp

Ala Ile Val

Ala

Ser 175 Ser

Ser 160 His

Val

His

Ala Gly

Phe

Gly

180 Ser Gly 195

Ile Pro

Ala

185 Asp Ser 200

Gly Ile

210

215

190

Gly Val Ile Gly Gly 205

Glu Leu Gln Gly Gly 220

Gly Gly Gly Gly Gly Gly Gly Gly Gly His Ile

225 Phe

Ala

Ser 245 Leu Ser 260

Gln Phe 275

Gln His 290 Asn Arg Asp 305

Gly

Ser

His

230 His

Gln

Tyr

Ala Ala 250 Asp Gly

265 His Gln 280 His

<210> <211> <212> <213> <4 00> atggatccca acccaccctt catagccaaa tttcagattg tcaaacaaag ctttgtgcag acaatacagt actatacctg ctttctgctg agttgggcaa tggcccccag acaaatatag tttccagggt ggtgggggta ggggttttga caccagcagc tga

His

295 Asp Gly 310

23 963 DNA

Populus 23

agggctctaa ctcctcctca accaacaaca tagtagctga acagacacac cgagaatctt ggcttctaca catcagcttt gtttgcatca tgttaggtgg ttggaggtta ggactgaagc ttgacttgcc cccagcagtt gtccacaagc agcatcagca

235 Ala

His

Val

Gln Gln

Ala Ala 255 Ile Gly

270 Gly Ala 285 Gln

240

Ala

Met

Val Leu

Ala Gly

Gln Gln Gln

Glu

300 Ser Asp 315

Glu Glu Ser

Ala Ala Gly Glu Ala Ala Ala Pro His His Phe Ala Ile Met Gly Ala Gly Phe Pro Gly Ala Ala Gln Leu Gln Asp Gly Gln

Arg Ile Phe Thr Val Gln Thr Gly Thr Ser Leu Pro His His Met Gly Ala Gly Gln Arg Met Gly Gly Leu Ala Pro Met Leu Glu Leu Gln Ser Leu Gln His Gln Gly Glu Asp

tremuloides

ctcaaaaaac tcctcctcca acccaacatg caaagaagag aaaagttgaa tcaattgaca acaagctgaa agcagctgct aaagattgat caatttaggg tgggttccag tgctgctgct gggtaacaac accaggattg tttgaatcag acaaaatcct

ccacatgagt caacctcatc ggagacaaca caaaagaaac ggtagaggta agagaattgg ccatctataa ggcggtgcaa gatttaggtg agaccccatc tcatcatcta ggtggttcta atggggccta gaacttgggt atttatcagc tctaaagatg 963

tacccacttt ttcaacaacc aaccagcaga agttagcacc gaaggataag gtcacaaatc ttgcagcaac tttcacaaca ggtccagtag atgttactac attccactgg gttatttgca tgagttttac tgtcacagga agatggggca attcacaagg

cttgacccac acaacaactc aatcaaagac aaagagaagc gatgccagct tgatggagag tgggactggt aggagcttct tagtagggcc tgcaggatta tccatcaaca aaaactcggg ttcaatttta cgggcatatt tgctagagtg atcaggccag

<210> <211> <212> <2 13> <4 0 0> Met Asp

24

320

PRT

Populus 24

tremuloides

1

Phe His

Pro

5

Leu Thr 20 Leu Gln 35

Lys Gly

His

Gln

Thr 25 Pro 40

Ser 10 His

Gln

Asn Ser Lys 15

Ser Pro

Pro

30 Leu

Asn Met Gly Asp Asn Lys

Gln

45

Pro Ala

Asn Pro His Glu Leu Pro Thr

Pro His Pro Pro Pro Gln Pro

His Ser Gln Asn Gln Gln Gln Pro

Glu Ile Lys Asp Phe Gln Ile Val

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 50 55 60 Val Ala Asp Lys Glu Glu Gln Lys Lys Gln Leu Ala Pro Lys Arg Ser 65 7 0 75 80 Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile 85 90 95 Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu 100 105 110 Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln 115 120 125 Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala 130 135 1' 10 Ser Ala Leu Ala Ala Ala Gly Gly Ala Ile Ser Gln Gln Gly Ala Ser 145 150 155 160 Leu Ser Ala 165 Gly Leu His 170 Gln Lys Ile 175 Asp Asp Leu Gly Gly Ser Ser Ser Ser Arg Ala Ser Trp Ala Met Leu Gly Gly Asn Leu Gly Arg Pro 1! 30 lí 35 190 His His Val Thr Thr Ala Gly Leu Trp Pro Pro Val Gly Gly Tyr Gly 195 200 205 Phe Gln Ser Ser Ser Asn Ser Thr Gly Pro Ser Thr Thr Asn Ile Gly 210 215 220 Thr Glu Aia Ala Ala Ala Gly Gly Ser Ser Tyr Leu Gln Lys Leu Gly 225 230 235 240 Phe Pro Gly 245 Phe Asp Leu 250 Pro Gly Asn 255 Asn Met Gly Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Thr Gln Gln Leu Pro Gly Leu Glu Leu 260 265 270 Gly Leu Ser Gln Asp Giy His Ile Giy Val Leu Ser Pro Gin Ala Leu 275 280 285 Asn Gln Ile Tyr Gln Gln Met Gly His Ala Arg Val His Gln Gln Gln 290 295 300 His Gln Gln Gln Asn Pro Ser Lys Asp Asp Ser Gln Gly Ser Gly Gln 305 310 315 320 <210> 25 <2 11> 933 <212 > DNA <213> Saccharum officinarum <220> <221> mi sc feature <222> (699 ) · · ( 701) <223> η é a, c / ou t <4 00> 25

atggacccca agttccccac acccccaccg ctaaacaaaa cggagcccac caccgcgacg 60

accaccacca ccacctcgac cgcgcagcag ctggatccta aggactacca gcagcagcag 12 0

ccggcgcagc accacctgca aatccaaatc caccagccgc cgcagcagga cgggggcggc 180

ggagggaagg agcaacagca gcagctgcag gtggtggcgc agcccgggga gcggaggcag 2 4 0

cagccgctcg cgcccaagcg gagctccaac aaggaccgcc acaccaaggt cgatggcagg 300

ggccgccgga tccggatgcc cgcgctgtgc gccgcgcgga tcttccagct cacgcgggag 360

ctcggccaca agtccgacgg cgagaccgtg cagtggctgc tgcagcaggc cgagccggcc 420

atcgtcgccg ccaccggcac gggcaccata ccggcgtccg cgctcgcatc cgtcgcgccc 480

tcgctcccgt cgcccacctc cgggctcgcc aggccgcacc accaccacca tccgcaccac 540

atgtgggcgc cttccgccgc gtccgcgggt ttctcctcgc cctccttcct caattccgcc 600

gccgcaggca cgggagacgc cgctggtatc ggcggcatca tgcagcggat ggggatcccc 660

gcgggcctcg agctgccggg agggggcgcc gctggggcnn ncggctttgc gcccatgttc 720

gctgaacacc ccgcggccat tccggggctc gagcttgccc tctcgcagga cggccacatc 780

gggttgctcg ccgcgcagtc gatcacccag ttctaccacc aggtgggtgc tgccggcggc 840

agcggccaga tgcagcaccc tcacggccac cagcaggagg acggggagga cgaccgcgag 900 qacggcgagt ccgatgatga gtctgggcag tag 933 <210> 26 <211> 310 <212> PRT

<213> Saccharum officinarum < 2 2 0 > <2 21> INCERTO <222> (234 ) . . (234)

<223> Xaa pode ser qualquer aminoácido oco <4 00> 26

Met Asp Pro Lys Phe Pro Thr Pro Pro Pro Leu

10 15

Thr Thr Ala Thr Thr Thr Thr Thr Thr Ser Thr

25 30

Pro Lys Asp Tyr Gln Gln Gln Gln Pro Ala Gln

40 45

Gln Ile His Gln Pro Pro Gln Gln Asp Gly Gly

50 55 60

Gln Gln Gln Gln Leu Gln Val Val Ala Gln Pro 65 70 75 80

Gln Pro Leu Ala Pro Lys Arg Ser Ser Asn Lys

85 90 95

Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro

100 105 110

Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His

115 120 125

Thr Val Gln Trp Leu Leu Gln Gln Ala Glu Pro

130 135 140

Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu 145

Ser Leu

His

Ser

Pro 165 Pro His 180

150

Ser Pro

155 160

Thr Ser Gly Leu Ala Arg 170 175

His Met Trp Ala Pro Ser Ala Ala 185 190

Pro Ser Phe Leu Asn Ser Ala Ala Ala Gly 195 200 205

Gly Ile Gly Gly Ile Met Gln Arg Met: Gly Ile

210 215 220

Leu Pro Gly Gly Gly Ala Ala Gly Ala Xaa Gly 225 230 235 240

Ala Glu His Pro Ala Ala Ile Pro Gly Leu Glu

245 250 255

Asp Gly His Ile Gly Leu Leu Ala Ala Gln Ser

260 265 270

His Gln Val Gly Ala Ala Gly Gly Ser Gly Gln

275 280 285

Gly His Gln Gln Glu Asp Gly Glu Asp Asp Arg

290 295 300

Asp Asp Glu Ser Gly Gln 305 310

<210> 27 <211> 846 <212> DNA

<213> Solanum tuberosum <4 00> 27

atggatccca agcagcctaa caacaaaaat ttgcagattt tgaaaaatga tgaaaccaag aaagataggc ataccaaagt tgaaggtaga gcagcaagaa tctttcaact tacgcgcgaa cagtggctgc tgcagcaagc cgagccttcg cctgcatcgg ctttagctgc agcagcatct ggtttaatga ttgaatcggg ggcgaatatc agtaggacca attggccaat gatctgtggg aattttggaa ggaatatggc ctgcccctgc ccctgttgtc actagttttg ccatcaagcg ccagtttaga cagtgaaagt cctggatttg atctgcctgc agctacaaat ggtggaagta accagcaact gccaggattg ggggttttga accagatata ccagcaggaa gatcagcatc agcatcagca tcaacaacaa

rrendo naturalmente Asn Lys Thr Glu Pro Ala Gln Gln Leu Asp His His Leu Gln Ile Gly Gly Gly Lys Glu Gly Glu Arg Arg Gln Asp Arg His Thr Lys Ala Leu Cys Ala Ala Lys Ser Asp Gly Glu Ala Ile Val Ala Ala Ala Ser Val Ala Pro Pro His His His His Ser Ala Gly Phe Ser Thr Gly Asp Ala Ala Pro Ala Gly Leu Glu Phe Ala Pro Met Phe Leu Ala Leu Ser Gln Ile Thr Gln Phe Tyr Met Gln His Pro His Glu Asp Gly Glu Ser

attaagccta aaacagcagc gggaggagga ttgggtcata attattgctg gtttctcaac gcggggtcag

tcaaactatt atgaatccta gagcttggat agaatgcaac tctccggagg

ctcatgatca aggtggctgc tacgtatgcc aatctgatgg ctactggcac aggggatctc gtagcagtag gaccccattt ggtttcagtc acttacagaa tgagttttac tatctcaaga atccgcagca atgattctca

gataaaagac tcctaaaaga tgctctatgt tgagacaatt agggacaatt tgtatcagct aagtagtaat ggctacagta ctcatct gct aattgggttt: ttcaattctt gggtcattta gcaacaacaa aggatcagga

60 120 180 240 300 360 420 480 54 0 600 660 720 780 840 cattaa 846

<210> 28 <211> 2.81 <212> PRT

<213> Solanum tuberosum <4 00> 28

Met Asp Pro Lys Gln Pro Asn Asn Lys Asn Ile

10 15

Gln Ile Lys Asp Leu Gln Ile Leu Lys Asn Asp

25 30

Gln Gln Val Ala Ala Pro Lys Arg Lys Asp Arg

40 45

Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu

50 55 60

Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser 65 70 75 80

Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile

85 90 95

Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala

100 105 110

Gln Gln Gly Ile Ser Val Ser Ala Gly Leu Met

115 120 125

Asn Ile Ala Gly Ser Gly Ser Ser Arg Ser Ser

130 135 140

Trp Pro Met Ile Cys Gly Asn Phe Gly Arg Pro

145

150

155 160

Gly Ile Trp Pro Ala Pro Ala Pro Val Val Thr

165 170 175

Ser Ser Ser Ala Pro Ser Ser Ala Ser Leu Asp

180 185 190

Tyr Tyr Leu Gln Lys Ile Gly Phe Pro Gly Phe

195 200 205

Thr Asn Met Asn Pro Met Ser Phe Thr Ser Ile

210 215 220

Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser 225 230 235 240

Gly Val Leu Asn Gln Ile Tyr Gln Gln Glu Arg

245 250 255

Gln Gln Gln Gln Asp Gln His Gln His Gln His

260 265 270

Glu Asp Asp Ser Gln Gly Ser Gly His

275 280

<210> 29 <211> 978 <212> DNA

<213> Sorghum bicolor <400> 29

atggacccca agttccccac acccccaccg ctaaacaaaa accaccacca cctcgaccgc gcagcagcag cagcagcagc cagccggcgc agcagcacca cctgcaaatc caaatccacc cagcagcagg acggaggcaa ggagcagcag ctgcaggtgg aggcagcagg cgctcgcgcc caagcggagc tccaacaagg ggcaggggcc gccggatccg gatgcccgcg ctgtgcgccg cgggaactcg gccacaagtc cgacggcgag accgtgcagt ccggccatcg tcgccgccac cggcaccggc accataccgg gcgccctcgc tcccgtcgcc cacctccggg ctcgccaggc caccacatgt gggcgccgtc cgccgcgtcc gcgggtttct tccgccgccg cgggcacggg agacgccgct. ggtatcggcg atccccgcgg gtctcgagct gccgggaggc ggcgccgctg ggccacatcg gctttgcgcc catgttcgct ggacacgccg ctcggcctct cgcaggacgg ccacatcggc gtgctcgcag taccaccaag tgggtgctgc tggcggcagc ggccagatgc catcaccatc atcagcagca ggaggacggg gaggacgacc

Lys Pro Glu Thr His Thr Cys Ala Asp Gly Ile Ala Ala Ala Ile Glu Asn Ser His Leu Ser Phe Ser Glu Asp Leu Leu Gly Gln Glu Met Gln Gln Gln

Thr His Asp Lys Lys Gln Lys Val Glu Ala Arg Ile Glu Tlir Ile Ala Thr Gly Ser Val Ser Ser Gly Ala Arg Thr Asn Ala Thr Val Gly Phe Gln Ser Ser Asn Pro Ala Ala Gly Ser Asn Gly His Leu His Pro Gln Gln Ser Pro

cggagcccac tggatcctaa agccgccgcc tggcgcagcc accgccacac cgcggatctt ggctgctgca cgtccgcgct cgcaccacca cctcgccctc gactcatgca gaggcaccct cggccatgcc cgcagtcgat agcacc.cgca gcgaggacgg

caccgcgacg ggactaccag gcagcagcag cggggagcgg caaggtcgac ccagctcacg gcaggccgag cgcatccgte ccaccacccg cttcctcaat gcggatgggg cggcgctggc ggggctcgag cagccagttc cggccaccag cgagtccgat

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 gacgagtctg ggcagtag

978

<210> <211> <212> <213> <4 00> Met Asp

30

325

PRT

Sorghum bícolor 30

1

Thi

Th 20

Gln Leu Asp 35

Gln Ile Gln 50

Gly Gly Lys 65

Pro Lys 5

Ala Thr

Phe

Thr 25

Pro 10 Thr

fhr

Pro 40

Ile Hi

55 Glu 70

Thr Ala

Gln Pro Ala

Pro Pro Pro Leu 15

Thr Thr Se. 30

Lys Asp Tyr Glr 45

Gln Pro Pro Pro Gln Gln 60

Gln Gln Leu Gln Val Val Ala 75 80

Arg Gln Gln Ala Leu Ala Pro Lys Arg Ser Ser

85 90 95

Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg

100 105 110

Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu

115 " 120 125

Gly Glu Thr Val Gln Trp Leu Leu Gln Gln Ala

130 135 140

Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser

145 Ala

His

Phe

Pro Ser 165 His His 180 Ser Ser 195

150 155 160

Leu Pro Ser Pro Thr Ser Gly Leu

170 175

Pro His His Met Trp Ala Pro Ser

185 190

Pro Ser Phe Leu Asn Ser Ala Ala 200 205

Ala Ala Gly Ile Gly Gly Leu Met Gln Arg Met

210 215 220

Leu Glu Leu Pro Gly Gly Gly Ala Ala Gly Gly 225 230 235 240

Gly His Ile Gly Phe Ala Pro Met Phe Ala Gly

245 250 255

Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly

260 265 270

Ala Ala Gln Ser Ile Ser Gln Phe Tyr His Gln

275 280 285

Gly Ser Gly Gln Met Gln His Pro His Gly His

290 295 300

Gln Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu 305 310 315 320

Asp Glu Ser Gly Gln

325 <210> 31 <211> 891 <212> DNA

<213> Vitis vinífera <4 00> 31

atggatccca agggctcaaa gcagccgcag ccaaacatgg gagagaacaa gccagctgaa aaggaagagg gtaagaagca gttggccccc aaggttgaag gcagagggag gagaataagg cagttgacta gggaattggg tcacaaatct caggccgagc cgtccataat agcggccact gcggcggcag gaggctctgt: gtcgcaacag ggaacttcta aagattgatg aattgggggg gtccagtatt gggtcaggga atggtaggtg caaatttggg gagaccccat ggttttgggt ttcagtcatc: atctggacca

Asn Lys Gln Gln Gln Gln Gln Gln Gli1 Pro Asn Lys Met Pro Gly His Glu Pro Ala Leu Ala Arg Ala Ala Ala Gly Gly Ile Thr Leu His Ala His Ile Val Gly Gln His Asp Gly

Thr Glu Pro Gln Gln Gln His His Leu Gln Gln Asp Gly Glu Ary Asp Arg His Ala Leu Cys Lys Ser Asp Ala Ile Val Ala Ser Val Pro His His Ser Ala Gly Thr Gly Asp Pro Ala Gly Gly Ala Gly Ala Ala Met Gly Val Leu Ala Ala Gly His His His Glu Ser Asp

gaggtaccaa gtgaaggact aagaggagct atgccggctc gacggggaaa ggtactggga

gtggccacag tcaaccacca

acttcttgag ttcagattgt caaacaagga tttgtgcagc ccatacagtg caataccggc tatcagcagg gtagtaggac ggctatggcc atttggggaa

cctacctcag 60

gattgcagat 120

caggcacacc 180

cagaattttt 240

gttgttgcag 300

gtcggcttta 3 60

attgcatcaa 420

cagttgggca 480

cccagtcagt 54 0

tgaaagttcc 600 aattatctgc aaaaaattgc cttccctggg tttgacttgc

atgagtttta cttcaatttt gggtgggagt aaccagcagc

ctatcacagg atggtcatat tggggttttg aactcacaag

cagatggggc aggccagggt gcaccagcaa cagcagcatc

catcaacagc aacctcctgc taaggatgat tctcaaggtt

ctgcaacaaa tctgggtcct ttcctggttt ggagctgggc ccttaagcca gatttaccag aacatcagca tcagcatcag cagggcagta g 891

<210> <211> <212> <213> <4 00> Met Asp

32

296

PRT

Vítis vinifera 32

Pro Lys

1

Sei

5

Leu Pro 20

Asp Phe Gln 35

3 In

Ser 10

Pro Asn 25

jys G

Met

Ile

Val 40

Il'

η Pro Gln 15

Gly Glu Asn 30

Asp Ly

Glu Lys Clu Glu

Ala 45

Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His

50 55 60

Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys 65 7 0 7 5 8 0

Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp

85

90

Trp Leu Leu Gln Gln Ala Glu

100

Gly Thr Ile 115

105

95

Pro Ser 110

Ile Ile

Pro Ala Ser Ala Leu Ala Ala Ala 125

120

Gln Gln Gly Thr Ser Ile Ser Ala Gly Leu His

130 135 140

Leu Gly Gly Ser Ser Ile Gly Ser Gly Ser Ser 145 150 155 160

Met Val Gly Ala Asn Leu Gly Arg Pro His Val

165 170 175

Pro Pro Val Ser Gly Phe Gly Phe Gln Ser Ser

180 185 190

Thr Asn Leu Gly Asn Glu Ser Ser Asn Tyr Leu

195 200 205

Pro Gly Phe Asp Leu Pro Ala Thr Asn Leu Gly

210 215 220

Ser Ile Leu Gly Gly Ser Asn Gln Gln Leu Pro 225 230 235 240

Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn

245 250 255

Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg Val

260 265 270

His Gln His Gln His Gln His Gln His Gln Gln

275 280 285

Asp Asp Ser Gln Gly Ser Gly Gln

Val Pro Pro Ala Gly Lys Thr Lys Ala Ala Gly Glu Ala Ala Gly Gly Gln Lys Arg Thr Ala Thr Ser Gly Gln Lys Pro Met Gly Leu Ser Gln His Gln Gln Pro

Asn Phe Leu Glu Val Lys Lys Gln Leu Val Glu Gly Arg Ile Phe Thr Ile Gln Thr Gly Thr Ser Val Ser Ile Asp Glu Ser Trp Ala Gly Leu Trp Pro Ser Thr Ile Ala Phe Ser Phe Thr Glu Leu Gly Ala Leu Ser Gln Gln Gln Pro Ala Lys

290 <2 10> <211> <212> <213> <4 00>

2 95

3 3 97 5 DNA

Zea mays 33

atggacccca agttccccac

accaccacca cctcgaccgc

acggcgcagc accaggagca

caccagccgc cgccgccgcc

ctgcaggtgg tggcgcagcc

tccaacaagg accgccacao

ctctgcgccg cgcggatctt

actgtgcagt ggctgctgca

accataccgg cgtccgcgct

ctcgccaggc cgcaccacca

acccctagcg gcagcatcat gcagcagcac gcaggac.ggg cggggatcgg caaggtcgac ccagctcacg gcaggccgag cgcctccgtc ccacccgcac

ctaaacaaaa cagctggatc caccatcacc ggcggcggag aggcagcagg ggcaggggcc cgggagctcg ccggccatcg gcgccctcgc cacatgtggg

cggagcccac ctaaggacta cccacctgca tgaaggagca cgctcgcccc gccggatccg gccacaagtc tcgccgccac tcccgtogcc cgccgtccgc

caccgcgacg ccagcagcag aatccaaatc gcagcagctg caagcggagc gatgccggcg cgacggcgag cggcacgggc tacctccggg cggcttctcc

660 720 780 840

60 120 180 240 300 360 420 480 540 600 tcgccctcct tcctgaattc cgcgggcgcg ggcgacggca ccggtatcgg cggcatcatg 660 cagcggatgg gggtccccgc gggcctggag ctgccgggag gcggcgccgc cggcggccac 720 atcggctttg cgcccatgtt cgctggacac gccgcggcca tgccggggct cgagctcggc 780 ctctcgcagg acggtcacat cggcgtgctc gccgcgcagt cgatcagcca gttctaccac 840 caggtgggtg ccgctgccgg cggcagtggc cagatgcagc acccgcacgg gcaccagcat 900 caccatcatc agcagcagga ggacggggag gacgaccgcg aggacggcga gtctgatgac 960 gagtctgggc agtag 975

<210> 34 <211> 324 <212> PRT <213> Zea mays <4 00> 34

Met Asp Pro Lys Phe Pro Thr Pro Leu Ala Leu Asn Lys Thr Glu Pro 10 15

Thr Thr Ala Thr Thr Thr Thr Thr Ser Thr Ala Gln IIis IIis Gln Leu

25 30

Asp Pro Lys Asp Tyr Gln Gln Gln Thr Ala Gln His Gln Glu Gln Gln

40 45

Gln His His His His Pro His Leu Gln Ile Gln Ile His Gln Pro Pro

50 55 60

Pro Pro Pro Gln Asp Gly Gly Gly Gly Val Lys Glu Gln Gln Gln Leu 65 70 75 80

Leu Gln Val Val Ala Gln Pro Gly Asp Arg Arg Gln Gln Ala Leu Ala

85 90 95

Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg

100 105 110

Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln

115 120 125

Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val Gln Trp

130 135 140

Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly Thr Gly 145 150 155 160

Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu Pro Ser

165 170 175

Pro Thr Ser Gly Leu Ala Arg Pro His His His His Pro His His Met

180 185 190

Trp Ala Pro Ser Ala Gly Phe Ser Ser Pro Ser Phe Leu Asn Ser Ala

195 200 205

Gly Ala Gly Asp Gly Thr Gly Ile Gly Gly Ile Met Gln Arg Met Gly

210 215 220

Val Pro Ala Gly Leu Glu Leu Pro Gly Gly Gly Ala Ala Gly Gly His 225 230 235 240

Ile Gly Phe Ala Pro Met Phe Ala Gly His Ala Ala Ala Met Pro Gly

245 250 255

Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu Ala Ala

260 265 270

Gln Ser Ile Ser Gln Phe Tyr His Gln Val Gly Ala Ala Ala Gly Gly

275 280 285

Ser Gly Gln Met Gln His Pro His Gly His Gln His His His His Gln

290 295 300

Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu Asp Gly Glu Ser Asp Asp 305 310 315 320

Glu Ser Gly Gln

<210> 35 < 211> 948 <212> DNA <213> Zea mays <4 00> 35

atggacccca agttcccccc acccccaccg ctaaacaaaa cggagcccac caccgcgacg 60 accaccacca cctcgaccgc gcagcagcag cagcagcagc tggatcctaa ggactaccag 12 0 cagcagcagc agcagccggc gcagcacctg caaatccaaa tccaccagtc gcagcaggac 180 ggaggcggcg gagggaagga gcagcagcag ctgcaggtgg tggcgcagcc cggggagagg 240 aggcagcagg ggcaggggcc cgggaactcg ccggccatcg gcgccctcgc ccgtccgccg gccgccggta gccgccggag cacgccgccg ctcgccgcgc ggccagatgc gaggacgacc

cgctcgcgcc caagcggagc ggcggatccg gatgcccgcg gccacaagtc cgacggcgag tcgccgccac cggcacgggc tcccgtcgcc cacctccggg gcttctcctc gccctccttc tcatgcagcg gatggggatc ccaccctcgg cgccggcggc ccatgccggg gctcgagctc agtcgatcag ccagttctac

atcacgcgca gcgaggacgg

cgggcaccat cgagtccgat

tccaacaagg ctctgcgccg accgtccagt accataccgg ctcgccaggc ctgaactctg cccgcgggct cacatcggct gggctatcgc caccaggtgg catcaccatc gacgagtctg

accgacacac cgcggatctt ggctgctgca cgtccgcgct cgcaccacca ccgccgcggg tcgagctgcc ttgcgcccat aggacggcca gtgctgccgc accagcagca ggcagtag

caaggtcgac ccagctcacg gcaggccgag cgcctccgtc catgtgggcg cacgggcgat gggagcctcc gttcgctgga catcggcgtg cggcggcggc ggaggacggg 948

<210> <211> <212 > <213> <400> Met Asp 1

Thr

Gln

His 5( Gly 65 Arg

Thr

Ala

Gly

36 315 PRT Zea 36 Pro 5

Thr Ala 20 Leu Asp

mays

Lys Phe

Thr

Thr 25

Pro Lys 40

Gln Ile Gln 55

Lys Glu Gln Gln 70

Gln Ala Leu 85

35 Leu

Gln

Pro 10 Thr

Asp

Ile

Pro

Thr

Gln 75

Ala Pro 90

Tyr

45

His Gln 60

Leu Gln

Pro Pro

15 Thr Ser 30 Gln

Pro Leu

Thr Ala

Gln Gln Gln

Ser Gln Gln

Val 80

Lys Arg 95

Val Ala

Ser Ser

Lys Val 100 Ala Arg 115

Glu

Asp Gly Arg Gly Arg Arg Ile Arg

Thr

130 Ala Ala 145 Ala

Thr

Pro

His

Ser

Gly

Ser 165 Met Trp 180 Ala Ala 195

Ile Pro

Ile

120 Val Gln

135 Gly Thr 150 Leu

105 Phe Gln

Ala

Pro

Pro Ii Gly 200 Gly

Trp

Gly

Ser 170 Ser !5

Thr Phe

Leu

125 Leu Leu

140 Thr Ile 155

Pro Thr

110 Thr Arg

Glu Leu

Gln Gln Ala

Pro

Ser 175 Phe

Ala 160 Gly

Ser

Leu

Ser Ser

210 Thr Leu 225 His

215

Ala Gly

190

Gly Asp Ala Ala Gly 205

Glu Leu Pro Gly Ala 220

Gly Ala Gly Gly His Ile Gly

Ala

His

Val

His

Ala 245 Ile Gly 260 Gly Ala 275 His

230 Ala

Val

Ala

His His

Met

235 Gly

Leu

Glu 255 Ser

Phe 240 Leu

Ala

Gly

Ile Ser

290 Glu Asp 305 <210> <211> <212 > < 213 > <400>

Gly

295 Glu Ser 310

Pro 250

Leu Ala Ala Gln

265 270

Ala Gly Gly Gly Gly Gln Met 285

His Gln Gln Gln Glu Asp 300

Asp Asp Glu Ser Gly Gln 315

280 His

Asn Lys Gln Gln Gln Gln Asp Gly Gln Pro Asn Lys Met Pro Gly His Glu Pro Ala Leu Ala Arg Pro Ser Ile Met Ser Ala Pro Met Leu Ser Gln Phe His His Gly Glu

Thr Glu Pro Gln Gln Gln Pro Ala Gln Gly Gly Gly Gly Glu Arg Asp Arg His Ala Leu Cys Lys Ser Asp Ala Ile Val Ala Ser Val Pro His His Phe Leu Asn Gln Arg Met Ala Gly Ala Phe Ala Gly Gln Asp Gly Tyr His Gln Ala His Gly Asp Asp Arg

37

648

DNA

Allium 37

cepa

300 360 420 480 540 600 660 720 780 840 900

atggatccaa aagaatccca acccaactcg gatcgtcaat tgatgaccca aaccgaatcc

60 attcaagacc cacaccaaag atcttccagc ctgcatcatg gctttagctt ttatggggag aataatggag atgagtgggc gggcttcagt aaccattttt <210> <211> <212 > <213> <400> Met Asp 1

Gln Thr 20

Lys Arg Thr 3 5

Arg Arg 50

Thr Arg

cgcaaaaaag ttgacggccg tgacccgaga cagaacctgc cttctcaggc gttttaattc tcggccctag acatgagctt tagggctgtc atcaacagat 38 216 PRT

Allium cepa 38

Pro Lys Glu 5

Glu

agcccttctt cggccggagg actcggccat catcatcgcc gatgccgaac

gccccaaaac attcgcatgc aaatccgacg gctaccgggt tctaagcccg

cggatttatg aattccaata ctcgagcaat ttagggtttg

tacttcaatg tcaagatggg gggtcataat

ctgggagggc catattgggg gttagggttg

ggacctccaa ccgctctctg gcgagaccgt cgggtaccat acaacagttg atagcagtaa tggggatgga agcctgggcc ttttgaatac gaaatggg

caaagaccgc cgccgccaga tcagtggctt acccgcatcc ggctgttggg caacaacaat gatgacaggg acaaatgccc acaagggttg 648

Ile

Ser Ile

25

Ser Asn 40

Arg Met

Ser 10 Gln

Gln

Asp

Ser Asp Lys Arg

Glu

65 Leu

Ile

Pro

Phe

His

55 Leu 70 His Ala

Gly

Glu

Pro Asn

15 Pro Gln 30

Lys Asp Arg His Thr Lys 4 5

Pro Ala Leu Cys Ala Ala 60

His Lys

75 Pro Ala

85 Pro Ala 100 Asp Asn 115 Met

Ser

Asn Ser

90

Ala Leu

105 Trp Ala 120 Asn

Ala

Val

Asn Ser

Ser Asp 80

Ile Ile 95

Ser Ser 110 Gly Leu 125 Ser

Gly Glu

Ala Ala

Gln Ala

Trp Gly

Asn Asn Asn

130 Gly Pro 145

Met Ser Pro Gln

Ser

Gly 165 Met

135 Ser Ser 150 His

Pro

Met

Gly

180 Val Leu 195 Asn

Val

His

210 <210> <211> <212> <2 13> <4 00> atggacccca acgaccacca cagcagcacc aaggagcagc ctggggccga cggatccgga cacaagtcgg gccgccacag ccttcgccca gcggcggggt ggcggcctcg ggcggtggtg gc.ggccatgc

<210> 40 <211> 243

Gly 1!

Asn Thr 200 Arg Val 215

Asn

Ser 170 Leu !5

Gln

140 Leu Gly 155 Phe

Thr

Gln Leu

Phe

Ser 175 Gly

Gly

Gly Asn

190 Leu Asn 205 Gly

Val Gly 160

Met Leu Leu Ser His Phe

Arg Gln Ala Leu Val Asp Arg Ile Thr Val Thr Gly Met Pro Gly Phe Asn Asn Met Glu Gly Gly Gln Asp Tyr Gln

Leu Met Thr Leu Ala Pro Gly Arg Gly Phe Gln Leu Gln Trp Leu Ser Gly Thr Asn Ser Lys Asn Ser Gly Asn Gly Val Met Thr Gly Gln Pro Gly Gly His Ile Gln Met Gly

39

731

DNA

Brachypodium distachyon 39

agtttcctcc tcccccaccg ctaaacaaaa ccaccacgac ctcccagcag cagctggatc tgcaaatcca agtgcaccag cagcagcagg agcagcaggt ggtggcggcg gcgggggcgg agcggagctc caacaaggac cggcacacca tgccggcgct gtgcgcggcg cggatcttcc acggggagac ggtccagtgg ctgctgcagc ggtccggcac cataccggcg tccgcgctcg cctccgcgct cgccaggccg caccaccacc tctccccggc cgggttcatg aactcggccc gcgggcttat gcagaggata gggcttcccg gggggcacat cgggttcgcg cccatgttcg c 73

cggagcccac acgagcagta aggaagatgg gggagaggag aggtggacgg agctgacgcg aggcggagcc cctccgtcgc accacctctg cagccggcgc ccgggatgga ccagccacgc

120 180 240 300 360 420 480 540 600

caccggcgtg tcaccagccg cggcggggga ggtgcagggg gcgggggcgg ggagctgggg ggccatcgtc gccctcgctg ggggccctcg tgactctggg gctccctggc ggcggcggcg

60 120 180 240 300 360 420 480 540 600 660 720 <212> PRT

<213> Brachypodium distachyon <4 00> 40

Met Asp Pro Lys Phe Pro Pro Pro Pro Pro Leu Asn Lys Thr Glu Pro 1 5 10 15

Thr Thr Gly Val Thr Thr Thr Thr Thr Thr Thr Ser Gln Gln Gln Leu

25 30

Asp His Glu Gln Tyr His Gln Pro Gln Gln His Leu Gln Ile Gln Val

40 45

His Gln Gln Gln Gln Glu Glu Asp Gly Gly Gly Gly Lys Glu Gln Gln

50 55 60

Gln Gln Val Val Ala Ala Ala Gly Ala Gly Glu Arg Arg Val Gln Gly 65 70 75 80

Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp

85 90 95

Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile

100 105 110

Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val

115 120 125

Gln Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly

130 135 140

Ser Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu 145 150 155 160

Pro Ser Pro Thr Ser Ala Leu Ala Arg Pro His His His His His Leu

165 170 175

Trp Gly Pro Ser Ala Ala Gly Phe Ser Pro Ala Gly Phe Met Asn Ser

180 185 190

Ala Pro Ala Gly Ala Asp Ser Gly Gly Gly Leu Gly Gly Leu Met Gln

195 200 205

Arg Ile Gly Leu Pro Ala Gly Met Glu Leu Pro Gly Gly Gly Gly Gly

210 215 220

Gly His Ile Gly Phe Ala Pro Met Phe Ala Ser His Ala Ala Ala Ala 225 230 235 240

Ala Ala Met

<210> <211> <212> <213> <400> atggatccca ccgagagatg gacaaagaac gacagacaca gcaaggattt tggctgcttc gcctctgctt gctggtttga ccaagttggg tttcccggat ggtggtggta gttggggtct ggtagggttc <210> <211> <212> <213> <4 00> Met Asp 1

Pro Pro Asp

41 768 DNA

Brassica oleracea

41

agaacccaaa tccacaccaa gtaccaaact cttccgatga caacaaagaa gtaaatgatt cgaacagtaa cggtaagaag cagcttgccc ccaaagtgga aggtcgcggt cggagaatca ttcaactgac cagagaattg ggtcacaaat aacaagccga accgtcgctt atcgcagcca tagcctcagc tgcttctgct gtagtctcta tgatcagtca tcatgactta gactgtggtg gagaaggagg aggagaagta tggccaaatg ttgattttcc tggtggagct atgagttttg atggtaatca gatgcttgga cttgagttag tgaatcaaca gatttatcaa cagatggctc ttcaccatac tcttcatcat aatccaggac

42 256 PRT

Brassica oleracea 42

Pro Lys Asn Pro Asn Pro His

10 15

Pro Gln Pro Arg Asp Ala Ser 25 30

Phe Gln Ile Val Val Ala Ser

tcttgatacc ttcagatcgt ccaagagaag ggatgcctgc cagacggtga ccggttcagg accaaggcgg gtgggtctag gagctggtta cttccatttt ggttgtctca aagctcaggc atgaagag

accaccacaa ggtcgcttcc ctcaaacaaa tctctgcgcg aacaatccag aactgtaccg gtctctcact tagtggtaga cagaattggg tggtgctagt ggtagggaat tcaggctcag 768

Gln Val Pro Asn Phe Leu Ile Asp Asp Asn Lys Glu Val Asn Asp Lys Glu Pro Asn Ser Asn Gly

60 120 180 240 300 360 420 480 540 600 660 720 35 40 45 Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr 50 55 60 Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala 65 7 0 75 80 Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly 85 90 95 Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Leu Ile Ala 100 105 110 Ala Thr 115 Gly Ser Gly 120 Thr Val Pro 125 Ala Ser Ala Leu Ala Ser Ala Ala Ser Ala Val Val Ser Asn Gln Gly Gly Ser Leu Thr Ala Gly Leu Met 130 135 140 Ile Ser His His Asp Leu Asp Cys Gly Gly Gly Ser Ser Ser Gly Arg 145 150 155 160 Pro Ser Trp 165 Gly Glu Gly 170 Gly Gly Glu 175 Val Trp Pro Asn Gly Ala Gly Tyr Arg Ile Gly Phe Pro Gly Phe Asp Phe Pro Gly Gly Ala Met Ser lí 30 1! 35 190 Phe Ala 195 Ser Ile Phe 200 Gly Ala Ser 205 Gly Gly Gly Asn Gly Asn Gln Met Leu Gly Leu Glu Leu Gly Leu Ser Gln Val Gly Asn Val Gly Val Leu 210 215 220 Asn Gln Gln Ile Tyr Gln Gln Met Ala Gln Ala Gln Ala Gln Ala Gln 225 230 235 240 Gly Arg Val 245 Leu His His 250 Thr Leu His 255 His Asn Pro Gly His Glu Glu

<210> 43

<211 > 723

<212> DNA

<213> Brassica rapa

<4 00> 43

agaagctcaa acaaagacag acacatcaaa gtggaaggca cctgctctct gcgccgctag gatcttccag ttgactagag ggcgagacaa tccagtggct gcttcagcag gctgagccgt tcaggaacta taccggcctc tgctttagcc tcagccgctg cttcagggtg gtgggtctct cactgctggt ttgatgatca tctagtagtg ggagaccaaa ttggggtgtt ggcgggggag ttaccaactg ggctgtggcc aaatgtagct gggtttggag gatggaggtg gttacaggat tgggtttcct gggtttgatt tttgcgtcca ttcttggtgg tggtagtaac aatcagatgc gctcaggaag ggaatgttgg tgtcttgaat cctcagtctt cagatgagtc aggctcaagc tcagggtagg gttcttcacc tcacatgagg agcatcagca agagagtggt gagaaagatg

ggggtcggag aattgggtca cgattatcgc ctgctgtatc gtcatgagtt atggagggtc ctggggtgca atcctggtgg ctggacttga ttgcacagat atactcttca attctcaagg

aatcaggatg caaatccgac agccaccggt gagccaccat ggatggtggg taggtcgagt gaccatgagt agctatgagt gttagggttg ttatcagcag gcataaccca gtcagggcgt

taa <210> <2 11 > <212> <213> <4 00> Arg 1

Ara

723

44

240

PRT

Brassica 44

rapa

Ser Ser Asn Lys Asp Arg His Ile Lys Val

10 15

Ile Arg Met Pro Ala Leu Cys Ala Ala Arg 25 30

Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr

40 45

Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr

50 55 60

Pro Ala Ser Ala Leu Ala Ser Ala Ala Ala Ala 65 70 75 80

Leu Gln Gly Gly Gly Ser Leu Thr Ala Gly Leu

85 90 95

Leu Asp Gly Glv Ser Ser Ser Gly Arg Pro Asn

Glu Gly Arg Gly Arg Ile Phe Gln Leu Thr Ile Gln Trp Leu Leu Gly Ser Gly Thr Ile Val Ser Ser His His Met Ile Ser His Glu Trp Gly Val Gly Gly

60 120 180 240 300 360 420 480 54 0 600 660 720 100 IC 5 110 Gly Asp Gly Gly Ser Arg Ser Ser Leu 115 120 125 Val Ala Gly Phe Gly Ala Gly Val Gln 130 135 14 0 Tyr Arg Ile Gly Phe Pro Gly Phe Asp 145 150 155 Phe Ala Ser Ile Leu Gly Gly Gly Ser 165 170 175 Glu Leu Gly Leu Ala Gln Glu Gly Asn lí 30 ιε ;5 190 Ser Phe Ala Gln Ile Tyr Gln Gln Gln 195 200 205 Gly Arg Val Leu His His Thr Leu Gln 210 215 220 His Gln Gln Glu Ser Gly Glu Lys Asp 225 230 235 <210> 45 <211> 696

160

Lys Asp Asp Ser Gln Gly Ser Gly Arg 240

<212> <213> <220> <22i> <222> <223> <220> <22 1> <222> <223> <400>

DNA

Coffea canephora

misc feature (56lT..(561) η é a, c, g, ou t

misc feature (622) .. (622) η é a, c, g, ou t 45

attttccagc tcaccagaga attgggtcac aaatccgatg gagaaaccat ccaatggctg

ttacagcagg ctgaaccatc cattatagcc gccacgggga cggggaccat accggcctcc

gctctagccg ctgcggccgc tggagcaggg ggctctgttt ccatgtcagc tgggctgcat

cctccaaaga tcagtgctga attgggtgca caccaccccc cacacatgga tattgccggg

tcaggtcaag gagcgggtag caccggtgct agtaggacca attggccaat ggtcggcggg

agtttgttac gagcccccca tatgggaatg cccactacaa ctgcagggat atggccccct

acttctgctt ctggtgctgt cagtggtttc gggttccagt catcatcctc ccctgctcca

gcagccacca gtttgggcac tgaaagttca aattacctac acaagcttgg gtttcctggt

tttgacttgc cagctgcaac taacaacttg ggtcctatga gtttcacctc catcgtgggg

gctgctactg accagcagca ncaccttcct ggattggagc tggggctatc acaagatggt

catgttgggg ttttgaaccc tncaaccttg agccagattt atcagcatat ggggcaggct

cgagcgcacc agcacaacac agcacgagac cacagc 696

<210> <211> <2 12> <213> <220> <22 1> <222> <223> <220> <22 1> < 2 2 2 > < 2 2 3 > <4 00> Ile Phe Gln Leu

46

232 PRT

Coffea canephora

INCERTO (187)..(187)

Xaa pode ser qualquer aminoácido ocorrendo naturalmente

1

INCERTO (208) . . (208)

Xaa pode ser qualquer aminoácido ocorrendo naturalmente 4 6

Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr 15

Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr

25

Gly Thr Gly Thr Ile

4 0

Ala Gly Gly Ser Val 50 55

30

Pro Ala Ser Ala Leu Ala Ala Ala Ala Ala Gly 45

Ser Met Ser Ala Gly Leu His Pro Pro Lys Ile 60

60 120 180 240 300 360 420 480 540 600 660 Ser Ala Glu Leu Gly Ala His His Pro Pro His 65 7 0 7 5 8 0

Ser Gly Gln Gly Ala Gly Ser Thr Gly Ala Ser 85 90 95

Val Gly Gly Ser Leu Leu Arg Ala Pro His

Met

Thr

100 Thr Ala

115 Gly Phe

130 Leu Gly 145

Phe Asp

Gly

Thr

Leu 165

Gly

120 Phe Gln

135 Glu Ser 150

Pro Ala

105 Ile Trp

110 Pro Thr

Ser Ala

Ser

Ala 170

Pro

125

Ser Ser Ser Pro Ala 140

Asn Tyr Leu

155 Thr

Asn

Ser Ile Val Gly Ala Ala Thr 180 185

Asp

Asn 175 Gln

His 160 Leu

Lys Gly

Gln Xaa

190

Ser

Glu Leu Gly Leu Ser Gln Asp Gly His Val Gly 200 205

Gln Ile Tyr Gln His Met Gly Gln 215 220

Thr Ala Arg Asp His Ser 230

47 993 DNA

Helianthus annuus & petiolaris

47

gacccaaagg ctcaaaccta catcatcctc ccttcttagc ccacccaaac cccaccacaa acatcaacac caacaacctc aacaaacttt ctgacaaaca agagtctgct accaagaaac aagacaggca caccaaggtt gaaggaagag ctgcaagaat ctttcagctc actagagagt aatggctgct acagcaagct gagccttcca cggcttctgt gttagccgcc actggggcgg tgcaacaaaa gattgatgaa ttaagcggga ctggtgtcaa ctgtaggacc agttggccaa ccactaccca tatggctacg cctacggcta cctcttcttc gtccccaggt ccatcgggca tgcaaaagat ggcgttttcc gggtttgatt tttcttcgat tttgggtaat cataatcata ggctggagct tggactgtcc caggatggtc atcagatata ccaaatggac cagaccagaa ctcaaggttc agaggggcag tag

48 329 PRT

Helianthus annuus & petiolaris 48

Pro Lys Gly Ser Asn Leu His 15

Ala Ser Ser Ser Thr Phe Leu Ala

30

Asn Met Gly Asp His Asn Asn Asn

40 45

Lys Leu Ser Glu Ile Lys Asp Phe

55 60

Glu Ser Ala Thr Lys Lys Gln Gln 7 0 7 5 8 0

Thr Ser Asn Lys Asp Arg His Thr Lys Val Glu

85 90 95

Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile 100 105 110

195 Thr Leu 210 His Asn 225 <210> <211> <212> <213> <4 00>

tcggccgggg tcaagttcaa aacaacaata attacagttt acctccaata gctttatgtg gaaactattc gggacaatcc tcggttggct aatattaata gtgggtagac gggttccagt tcgaattact cagatgagtt cagcttcctg caggctttga aatgataatt <210> <211> <212> <213> <400> Ser Ala Gly Gly 1 5

Pro His Glu 20

Thr Thr Asp 35

Asn Leu Asn 50

Asp Lys Gln 65

Met Asp Ile Arg Thr Asn Met Gly Met Ser Gly Ala Pro Ala Ala Leu Gly Phe Pro Met Ser His Lcu Pro Val Leu Asn Ala Arg Ala

Ala Gly Trp Pro Pro Thr Val Ser Thr Ser Pro Gly Phe Thr Gly Lcu Pro Xaa His Gln

aacagcagcc cagacaacat ctgaaatcaa aacagttagc gtaggaggat taggtaacaa ttatagccgc cttcacacgg gtaataataa tggttggtcc tctggcccgc acaatttggg tgcccggttc atcataatca atttaggggt tgcaacaaca 9

acatgaggcc gggagatcac agatttccag ccccaaaaga aaggatgcct atctgatggt caccggaacc ggtctcgatt cagtaatagt agctttgggt tgctggattc cgtcgaaagt taatatgggt tcatcagcag tttgaatcaa gcagacttca 93

His Pro Gln Gln Gln His Pro Asn Pro Thr Asn Ile Asn Thr Asn Gln Ile Thr Val Ser Leu Ala Pro Lys Arg Gly Arg Gly Arg Arg Phe Gln Leu Thr Arg

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 Glu Leu Gly Asn Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln

115 120 125

Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro

130 135 140

Ala Ser Val Leu Ala Ala Thr Gly Ala Ala Ser His Gly Val Ser Ile 145 150 155 160

Ser Val Gly Leu Gln Gln Lys Ile Asp Glu Leu Ser Gly Ser Asn Asn

165 170 175

Asn Ser Asn Ser Asn Ile Asn Thr Gly Val Asn Cys Arg Thr Ser Trp

180 185 190

Pro Met Val Gly Pro Ala Leu Gly Val Gly Arg Pro Thr Thr His Met

195 200 205

Ala Thr Pro Thr Ala Ile Trp Pro Ala Ala Gly Phe Gly Phe Gln Ser

210 215 220

Ser Ser Ser Ser Pro Gly Pro Ser Gly Asn Asn Leu Gly Val Glu Ser 225 230 235 240

Ser Asn Tyr Leu Gln Lys Met Ala Phe Ser Gly Phe Asp Leu Pro Gly

245 250 255

Ser Asn Met Gly Gln Met Ser Phe Ser Ser Ile Leu Gly Asn His Asn

260 265 270

His Asn His Asn His His Gln Gln Gln Leu Pro Gly Leu Glu Leu Gly

275 280 285

Leu Ser Gln Asp Gly His Leu Gly Val Leu Asn Gln Gln Ala Leu Asn

290 295 300

Gln Ile Tyr Gln Met Asp Thr Arg Met Gln Gln Gln Gln Thr Ser Asn 305 310 315 320

Asp Asn Ser Gln Gly Ser Glu Gly Gln

325 <210> 49 <211> 345 <212> DNA

<213> Hordeum vulgare <4 00> 49

atcggcggcc tcatgcagcg gatcggcctc cccgccggga tcgagctgcc gggcggcggc 60 gcggggggca tgggcgggca catcgggttc gcgcccatgt tcgccagcca cgcggcggcc 120 gcaataccgg ggctggagct cggcctgtcg caggagggcc acatcggggt gctcagccag 180 ttctaccacc aggtcggcgg cgccggggcc agcgggcagc tgcagcaccc gcaccctcat 240 cagcaccacc accacgaaca gcaccaccat caccagcagc agcagcagga ggaggacggg 300 gaggaggagc gcgaggacgg cgactccgag gaggagtccg gccag 345

<210> 50 <211> 115 <212> PRT

<213> Hordeum vulgare <4 00> 50

Ile Gly Gly Leu Met Gln Arg Ile Gly Leu Pro Ala Gly Ile Glu Leu

10 15

Pro Gly Gly Gly Ala Gly Gly Met Gly Gly His Ile Gly Phe Ala Pro

25 30

Met Phe Ala Ser His Ala Ala Ala Ala Ile Pro Gly Leu Glu Leu Gly

40 45

Leu Ser Gln Glu Gly His Ile Gly Val Leu Ser Gln Phe Tyr His Gln

50 55 60

Val Gly Gly Ala Gly Ala Ser Gly Gln Leu Gln His Pro His Pro His 65 7 0 7 5 8 0

Gln His His His His Glu Gln His His His His Gln Gln Gln Gln Gln

85 90 95

Glu Glu Asp Giy Glu Glu Glu Arg Glu Asp Gly Asp Ser Glu Glu Glu

100 105 110

Ser Gly Gln

115 < 210 > 51 <211 > 521 <212 > DNA <213> Linum usitatissimuin <4 00> 51

atcatcatca cccatctatt ctcttgtcta

gtgcttatgg aacaacaaca acaacaacca

caaaacagca acaaccctct ttcggcaatg

aacagcagta caaagaagca gcagagttta

cacaagaaag tggacggaag agggagaagg atcaggatgc

atcttccagc tgactcgaga attgggtcac aaatccgacg

ctgaaccaat ctgagccgtc catcattgca

gctcttgccg ctgcagggtc ctctgtttct

ttctctgctg ggaacaattg ggcagccttg

tcctctctcc aaggtcccaa aaagacgttc ggtccgaaga

gccaccggca aattcggaga atgaatgcca

cctgcagctc accaccttga aaatcacatc ggagttcgaa cagctttatg gcgagaccat ccgggacaat tgcaggggag a

ttcttatctt tgatccacac acttgttcca caaggacagg cgccgctagc ccagtggctt tccggcctct ctctgtttct 521

<210> < 211 > <212> <213> <4 00> Ile Ile 1

Ser Ser 20

52

173

PRT

Linum usítatissímum 52

Thr His

Ile 5

Tyr Leu Val 25

Leu Phe Ser Cys Leu Ser 15

Leu Met Glu Gln Gln Gln 30

Pro Asn His Leu Asp Asp Pro His Gln Asn Ser

40 45

Ala Met Lys Asp Val Gln Ile Thr Ser Leu Val

50 55 60

Lys Lys Gln Gln Ser Leu Gly Pro Lys Arg Ser 65 70 75 80

His Lys Lys Val Asp Gly Arg Gly Arg Arg Ile

85 90 95

Cys Ala Ala Ser Ile Phe Gln Leu Thr Arg Glu

100 105 110

Asp Gly Glu Thr Ile Gln Trp Leu Leu Asn Gln

115 120 125

Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala

130 135 140

Ala Gly Ser Ser Val Ser Asn Ser Glu Met Gln 145 150 155 160

Phe Ser Ala Gly Asn Asn Trp Ala Ala Leu Met

165 170

<210> 53 <211> 441 <212> DNA

<213> Lotus corniculatus <4 00> 53

atggatccca agggctcaaa gcagcagaac caggaggttg caacaacaag ggaacaacaa caacaacatg ggagagaaca ttccagattg tgattgctga gaaagatgag agcaagaagc tccaacaagg acagacacac aaaagttgaa ggcaggggaa ctgtgtgcag caagaatctt ccagttgacc agagaattag accatccagt. ggcttctgca gcaggctgag ccatcaatca acaatcccag catctgcttt agcttctgct gctggtaact tctttatctg ctggtttgca c <210> 54 <211> 147 < 212 > PRT

<213> Lotus corniculatus <4 00> 54

Met Asp Pro Lys Gly Ser Lys Gln Gln Asn Gln

10 15

Phe Leu Gln Gln Gln Gln Gln Gly Asn Asn Asn

25 30

Asn Lys Pro Ser Glu Val Lys Asp Phe Gln Ile

4 0 4 5

Asp Glu Ser Lys Lys Gln Leu Ala Pro Lys Arg

Ser Leu Gln Gln Asn Asn Pro Asn Ser Asn Arg Met Leu Gly Ser Glu Ser Ala Gly Ser Asn Ala

Pro Cys Ser Pro Lys Val Pro Leu Ser Ser Ser Thr Lys Asp Arg Pro Ala Leu His Lys Ser Pro Ser Ile Leu Ala Ala Ser Val Ser

ttccaaactt aaccatccga agttggcacc ggaggataag gtcacaaatc tagcagccac ctgtttcaca 441

ccttcaacaa ggttaaggat aaagaggacc gatgccagct tgatggtgaa tggaactgga acaggggacc

Glu Val Val Pro Asn Asn Asn Met Gly Glu Val Ile Ala Glu Lys Thr Ser Asn Lys Asp

60 120 180 240 300 360 420 480

60 120 180 240 300 360 420 50 55

Arg His Thr Lys 65 7 0

Leu Cys Ala Ala 85

60

Arg

75 Ile Phe

90

Ser Asp Gly Glu Thr Ile Gln

Ala

120 Gly Asn 135

Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala

Thr Arg Glu Leu Gly His Lys

Leu Gln Gln Ala Glu Pro Ser

Ala Ser Ala Leu Ala Thr Ser Leu Ser Ala

105 Thr Gly

Thr

Ser Val

80

Gln Leu 95

Trp Leu 110 Gly Thr 125

Ser Gln

Ile Pro

Gln Gly

100

Ile Ile Ala 115

Ser Ala Ala

130 135 140

Gly Leu His 145

<210> 55 <211> 668 <212> DNA

<213> Petunia hybrida <4 00> 55

gcggcgtcta aatatggatc cccgggctgc aaacaattag ctccaaaaag aagttcaaac ggtagaagaa ttcgtatgcc agctttatgt ttgggtcata aaactgatgg tgaaacaatt attattgctg ctactgggac tggtactatt tctgtttctg aacaggggaa ctctgtttct tatggtttgt ttagagctaa ttgggctaat tcttggccta gttttggatc aggatttgtg ttgagttctg ttccaagatt tggctttgag aatcaaaatg ttcctggttt agaacttgga aattttcaat ctttacaaca gttttatcag gctcgagg <210> 56 <211> 222 <212> PRT

<213> Petunia hybrida <400> 56

Ala Ala Ser Lys Tyr Gly Ser Pro Gly Cys Arg

10 15

Glu Ser Ser Lys Lys Gln Leu Ala Pro Lys Arg

25 30

Arg His Lys Lys Val Asp Gly Arg Gly Arg Arg

40 45

Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg

50 5 5 60

Thr Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln 65 7 0 7 5 8 0

Ile Ile Ala Ala Thr Gly Thr Gly Thr IIe Pro

85 90 95

Ala Ala Thr Ser Ser Val Ser Glu Gln Gly Asn

100 105 110

Ser Leu His Ser Arg Ile Asp Asp Tyr Gly Leu

aggaatcggc aaagataggc gctgcaagaa caatggctgt cctgcttcag gctacttctt ttaagtagac caaaattcaa tttactcaaa ttatctcaag caaatagcta 668

115 Ala Asn

130 Phe Gly 145

Leu Ser Gly Phe

Leu

Ser

Ser 165 Asn

120 Ser Arg

135 Gly Phe 150 Val

Gln 180

Gln GIu GIy Arg 195

Pro

Asn

Ile 200

Pro

Val

Arg 170 Gln

5

Giy

12 5 Gln Met

140 Gln Asn 155

Phe Gly Asn Val

Ser

Phe 175 Pro

Ser 160 Glu

Asn

190 Leu Asn 205

acgagagaga ataaaaaagt ttttccaatt tacaacaagc ttcttgcagc tacattcaag cccagatgcc gtaatttgag attcattggg agggtcgaat cacaaagtgg

aagtagcaag agatggtaga gactcgtgaa tgagccttca tgctacttcc aattgatgat tgtttctggt tactcaaatg at ttaatcag tgggaacttg agatgctgct

Pro Val Ser

Asn

Phe

Gly Leu

Phe Gln

Tyr Gln Gln Ile Ala Thr Gln Ser Gly Asp Ala 210 215 220

Asn Arg His Ser Ser Asn Ile Arg Met Glu Leu Gly Gln Ala Glu Ala Ser Val Ser Val Ser Phe Arg Ala Gly Ser Trp Leu Ser Thr Thr Gln Asn Glu Leu Gly Ser Leu Gln Ala Ala Arg

Glu Arg Lys Asp Pro Ala His Lys Pro Ser Leu Ala Ala Thr Asn Trp Pro Ser Gln Met Ser Leu Leu Ser Gln Phe

60 120 180 240 300 360 420 480 540 600 660 <210> 57 <211> 294 <212> DNA

<213> Prunus pérsica <4 00> 57

gagttcaaat tacatgcaaa agatggcttt ggtcctatga gtttcacctc aattttgggt gagcttgggt tgtctcagga tggtcatatt: atttaccagc agatggggca tgctagagta caccagcacc agcaaccccc tgctaaggat

cctggctttg ggtgggagta ggggttttga caccagcacc gactctcaag

acttgcctgt ctccaacatg 60 accaacagct tcctggcttg 120 actcacaagc cttgagccag 180 agcaccagca ccagcaccag 24 0 gctcaggaca gtag 294

<210> 58 <211> 97 <212> PRT

<213> Prunus pérsica <4 00> 58

Glu Phe Lys Leu His Ala Lys Asp Gly Phe Pro

10 15

Val Ser Asn Met Gly Pro Met Ser Phe Thr Ser

25 30

Ser Asn Gln- Gln Leu Pro Gly Leu Glu Leu Gly

40 45

His Ile Gly Val Leu Asn Ser Gln Ala Leu Ser

50 55 60

Met Gly His Ala Arg Val His Gln His Gln His 65 70 75 80

His Gln His Gln Gln Pro Pro Ala Lys Asp Asp 85 90 95

Gln

Gly Phe Asp Leu Pro Ile Leu Gly Gly Gly Leu Ser Gln Asp Gly Gln Ile Tyr Gln Gln Gln His Gln His Gln Ser Gln Gly Ser Gly

<210> <211> <212> <2 13> <4 00> aacccacatg caacaaccac aataaaccag aaacagttag gggaggagga ttgggtcata ataattgctg tcagtttcac ggtgggtcca aatttaggga ggattccagt tctagttatt cctatgagtt cttgggttgt tatcagcaga cctgctaagg <210> < 2 11 > <212 > <2 13> <4

59

936

DNA

Ricinus communis

59

aattacctaa cttcttgact caccctcctc aaccagccct acagcaacaa 60

aacaagaaca acaacatcaa aaccagaaac aacagacaaa catgggagag 120

cagaaatcaa agatttccag attgttattg cagataaaga agagcagaag 180

caccaaaaag aagctcaaac aaagacagac atacgaaagt tgaaggaaga 240

taaggatgcc agcactttgt gcagcaagaa tctttcaatt gacaagagaa 300

aatctgatgg ggaaacaata cagtggttat tacaacaagc tgaaccatct 360

caactgggac aggaacgata ccagcatcag ctttggtagc tgctggtgga 420

agcaagggac ttctctatca gctggattac accaaaagat tgatgattta 480

gtagtattac tagtagtaat agtaggacaa gttgggcaat ggtaggtggc 540

gaccccatca tgtggcaaca acagggttat ggcccccagt tggtggtttt 600

catcatctac tactactggt ccagtaacat caaatttggg aaatgaaagt 660

tgcaaaaaat tgggtttcct gggtttgatt tgccagggaa taatatggga 720

ttacctcaat cttgggtggg actagcaacc agcagatacc tggtttggag 780

cacaagatgg tcatattggg gttttgaatt cacaagcttt tagtcagatt 840

tggggcaggc cagagtgcag caccagcacc agcaccagca ccagcaaaat 900

atgattctca agggtcagga cagtaa 936

60 311 PRT

Ricinus communis

Asn 1

Leu

Lys

Phe 50

J> Pro

60 His 5

Gln Gln 20 Gln Gln 3 5

GIn Ile

Glu Leu

Gln

Thr

Gln 25 Asn 4 0

Val Ile 55

Pro 10 Gln

Met

Ala

Asn

Pro

Gly 45

Asp Lys 60

Phe Leu 15

Gln Gln 30

Glu Asn

Thr His Pro Pro Gln Pro Ala Glu Gln Gln His Gln Asn Gln Lys Pro Ala Glu Ile Lys Asp Giu Glu Gln Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg 65 70 75 80

Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln

85 90 95

Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp

100 105 110

Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly

115 120 125

Thr Ile Pro Ala Ser Ala Leu Val Ala Ala Gly Gly Ser Val Ser Gln

130 135 140

Gln Gly Thr Ser Leu Ser Ala Gly Leu His Gln Lys Ile Asp Asp Leu 145 150 155 160

Gly Gly Ser Ser Ser Ile Thr Ser Ser Asn Ser Arg Thr Ser Trp Ala

165 170 175

Met Val Gly Gly Asn Leu Gly Arg Pro His His Val Ala Thr Thr Gly

180 185 190

Leu Trp Pro Pro Val Gly Gly Phe Gly Phe Gln Ser Ser Ser Thr Thr

195 200 205

Thr Gly Pro Val Thr Ser Asn Leu Gly Asn Glu Ser Ser Ser Tyr Leu

210 215 220

Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Gly Asn Asn Met Gly 225 230 235 240

Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Thr Ser Asn Gln Gln Ile

245 250 255

Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu

260 265 270

Asn Ser Gln Ala Phe Ser Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg

275 280 285

Val Gln His Gln His Gln His Gln His Gln Gln Asn Pro Ala Lys Asp

290 295 300

Asp Ser Gln Gly Ser Gly Gln 305 310

<210> 61 <211> 231 <212> DNA

<213> Salvia miltiorrhiza <400> 61

agtttcacct caattttgag cggcggcgct cagcagctgc ccggattgga gcttggccta 60 tcacaagatg gaaatattgg cgtgctcaat cctcaagcat tcgggcagtt ttatcagcag 120 atggcaccgg cggcgcgtgt tgcccaccac catcagcagc aacaccacca ccaccatcag 180 cagcagcctt tgtcgcccaa ggatgatgat tctcaagaat caggacagta g 231

<210> 62 <211> 76 <212> PRT

<213> Salvia miltiorrhiza <4 00> 62

Ser Phe Thr Ser Ile Leu Ser Gly Gly Ala Gln Gln Leu Pro Gly Leu 10 15

Glu Leu Gly Leu Ser Gln Asp Gly Asn Ile Gly Val Leu Asn Pro Gln

25 30

Ala Phe Gly Gln Phe Tyr Gln Gln Met Ala Pro Ala Ala Arg Val Ala

40 45

His His His Gln Gln Gln His His His His His Gln Gln Gln Pro Leu

50 55 60

Ser Pro Lys Asp Asp Asp Ser Gln Glu Ser Gly Gln 6 5 7 0 7 5

<210> 63 < 211> 598 <212> DNA

<213> Zinnia elegans <4 00> 63

cacacaaagg ttaaaggaag aggtagaaga attaggatgc cagctttatg tgctgcaaga 60 atctttcaac tcactaggga gttaggtaac aaatctgatg gggaaacaat ccagtggctg 12 0 ctacagcagg ccgagccatc tatcatagca gccactggca gtgttagcca ccaccggagc ggcttcacac ggagtctcga aagattgatg tattaggtag tgggaatagt aacactagta agtaatatct gtggcaacaa ctgtaggacc agttggccta atggccacgc ctactacagg tatatggccc gcaatgggat ggcaacaatt taggggttga aagctcgaat tacctgcaaa gaattgcctg ggtctaatat gggtcagatg agtttttcgt catgatcatc atcagcagca gcagcttcct gggttggaac <210> 64 < 211> 199 <212> PRT

<213> Zinnia elegans <4 00> 64

His Thr Lys Val Lys Gly Arg Gly Arg Arg Ile

10 15

Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu

25 30

Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln

40 45

Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala

50 55 60

Thr Gly Ala Ala Ser His Gly Val Ser Ile Ser 65 7 0 7 5 8 0

Lys Ile Asp Val Leu Gly Ser Gly Asn Ser Asn

85 90 95

Ser Asn Ser Asn Ser Asn Ile Cys Gly Asn Asn 100 105 110

Pro Met 115 Trp Pro

130 Gly Val 145

GIu Leu

Gly Arg Pro Thr Thr His Met AIa Thr

120 125

Ala Met Gly Tyr Gly Ser Ser Gly Pro

Glu

Pro 165

135 Ser Ser 150

Gly Ser

Asn

Asn 170

140 Tyr Leu 155 Met

Gln

Gly

Gly Asn His Asn His Asp

180 185

Glu Leu Gly Leu Ser Gln

195 <210> <2 11> <2 12> <213> <22 0> <223> <220> <22 1> <222> <223> <220> < 2 21 > <222>

< 2 2 3 > <220> <22 1> <222>

< 2 2 3 >

< 4 0 0 > Pro Gly 1

<2 10>

< 211 > < 212 >

His

Asp

Gln 175 His Gln 190

Lys Met 160

Met Ser Gln Gln

65 13 PRT

Seqüência artificial

motivo 1 C-terminal de consenso

VARIANTE (6) . . (6)

/substituir="Arg" /substituir="Ala"

INCERTO (10) . . (10) Xaa pode ser

ccgggactat tttcggtagg ttagtaatag tgggtagacc acgggtcttc agatggcgtt cgattttagg ttgggttgtc

cccggcttcc 180 attgcaacat 240 taacagtaat cacaacccat gggtccctcg ttccgggttt taatcataat ccaagatg

300 360 420 480 540 598

Arg Met Leu Gly Ala Glu Ser Val Val Gly Thr Ser Cys Arg Pro Thr Ser Gly Ala Phe Phe Ser Gln Leu

Pro Ala Leu Asn Lys Ser Pro Ser Ile Leu Ala Thr Leu Gln His Ile Ser Asn Thr Ser Trp Thr Gly Ile Asn Asn Leu Ser Gly Phe Ser Ile Leu Pro Gly Leu

uma extensão de 1 a 5 aminoácidos ocorrendo naturalmente

VARIANTE (12) . . (12) /substituir="Leu"

65

Leu Glu Leu Gly Leu 10

66 69 PRT

Ser Gln Xaa Gly Val Leu < 213 > <220> <223> <4 00> Lys Asp Arg 1 5

Pro Ala Leu 20 Lys 35 Ser

Seqüência artificial

Domínio 66

TCP conservado de SEQ ID NO

)2

His Thr

Cys Ala

25

Lys 10 Ala

Glu Gly Arg Gly 15

Arg

His

Ser

Pro

50 Leu Ala 65 <210> <211> <212> <213> <4 00> aatccgaaaa aaatataaaa catccaccta tttccttagt tctgtcatga aaaaaatctt atgaagatat ttgtgcattc ttagtaatta gtacttacgc tcaactagca tgaattcaag aattttacag aaaaaaagaa acagagtggc tccgcaacaa aaccaagcat ggaggcatcc cgaccgcctt cacctcctcc tgtagtacgg gatttgggat ggttttcaat gattttgtga aataaaagta ctatcctttg atgagattga acagtagtcc cctgttcttc ctttctggtt gctgtagttc tttctgatct attatttttt tgtcctcaat cctgtagaag agctgtaatc tggtgtagct <210> <2 11> <212> <213> <22 0> < 2 2 3 > <4 00>

Ser Asp Gly Glu 40

Ile Ile Ala Ala

55 Ser

Ile 30 Thr Ile 45

Thr Gly 60

Phe Gln

Arg Arg Ile Arg Met

Thr Arg Glu Leu Gly

Gln Trp Leu Leu Gln Gln Ala Glu

Ser Gly Thr Ile Pro Ala Ser Ala

Ala

67

2193 DNA Oryza 67

sativa

gtttctgcac cgttttcacc. ccctaactaa caatataggg aacgtgtgct 60

tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140

tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200

gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260

agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320

cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380

gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440

cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500

tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560

atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620

ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680

cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740

cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800

agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860

ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920

ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980

tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040

tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100

gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160

tgccactttc accagcaaag ttc 2193

68 53 DNA

Seqüência artificial

iniciador: 68

prmO15 01 ggggacaagt ttgtacaaaa aagcaggctt cacaatggat cccaagaacc taa

53

<2 10> <211> <212> <213> <220> <223> <4 00>

69 48 DNA

Seqüência artificial

iniciador: prm01502 69

ggggaccact ttgtacaaga aagctgggtt tttaacgacc <210> 70 <211> 924 <212> DNA

<213> Cichorium endivia <400> 70

cggggggatc cagagttcaa gcaacaacat cctcaacagc ttcttaagca tcccgcaacc caccagcaac aacatgggag tctgaaatca aagatttaca gattgtaatt cccgacaagg caattagcac ccaaacgcac atccaacaaa gacaggcata cgcaggatta ggatgcccgc tctctgtgct gcaagaatct ggtcataaat ccgatgggga aacaatccag tggctcctac atcgccgcca ccggaactgg aactatcccg gcttcggtgt tcacatgggg tttcgacttc ggcgggatta caacagaaac ggaaatacta gtgacagctg taggaccagt tggccgattg cccgcaaccc acatggccac tcctttaggt atgtggccaa cagtcgcctc cgtcgtcctc tggtccatca tcggccaaca aattacttgc aaaagattgc attttctggg tttgatctgc atgagttttt cttcgatttt gggtaatcat catcaacagc ggactgtcac aagatggtca cataggggtc ttgaatcaac cagatgggtc aggccagaat gcaccatcaa caacaacaac tctcaaggtt cagggggaca atag <210> 71 <211> 307 <212> PRT

<213> Cichorium endivia <4 00> 71

Arg Gly Asp Pro Glu Phe Lys Gln Gln His Pro

10 15

Glu Val Ser Ser Phe Leu Ser Ile Pro Gln Pro

25 30

Gly Asp Asn Asp Asn Ser Lys Pro Ser Glu Ile

40 45

Val Ile Pro Asp Lys Glu Thr Ser Lys Lys Gln

50 55 60

Lys Arg Thr Ser Asn Lys Asp Arg His Thr Lys 65 7 0 7 5 8 0

Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala

85 90 95

Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu

100 105 110

Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala

115 120 125

Ile Pro Ala Ser Val Leu Ala Thr AIa Gly Ala

130 135 140

Ser Thr Ser Ala Gly Leu Gln Gln Lys Leu Asp 145 150 155 160

Gly Asn Thr Ser Asp Ser Gys A.rg Thr Ser Trp

165 170 175

Gly Val Gly Arg Pro Ala Thr His Met Ala Thr

180 185 190

Pro Thr Thr Thr Gly Phe Gly Phe GIn Ser Pro

195 200 205

Pro Ser Ser Ala Asn Asn Leu Gly Ile Glu Ser 210 215 220

tgagcctt

48

agccatatga ataacgacaa aaaccagcaa caaaggttga ttcagctgac agcaggccga tagccacagc ttgacgaatt ttggtccggg ccacaaccgg atttgggcat ccggttctaa aacttcccgg aagcgctgaa atcaaacttc 924

ggtttcaagc cagcaagcct gaagcaacaa aggccgaggt tcgagaatta gccttccatt cggcgcagtt agttggtgtg ggtgggtaga atttgggttt cgaaagctcc tctgggcccg gttggagctg ccagatttac taaggatgat

Gln Gln Thr Ser Lys Asp Gln Gln Vai Glu Arg Ile Thr Ile Thr Gly Vai Ser Glu Leu Pro Ile Pro Leu Pro Ser Ser Asn

Gln Pro Tyr Asn Asn Met Leu Gln IIe Leu Ala Pro Gly Arg Gly Phe Gln Leu Gln Trp Leu Thr Gly Thr His Gly Val Val Gly Val Val Gly Pro Gly Met Trp Ser Ser Gly Tyr Leu Gln

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 Phe Asp Leu 235

Leu Gly Asn 255

Ser Gln Asp

270 Ile Tyr Gln 285

Gln Thr Ser 300

Gly

Pro 240

His His Gly His Met Gly

Lys Ile Ala Phe Ser Gly 225 230

Met Ser Phe Ser Ser Ile 245 250

Gly Leu Glu Leu Gly Leu

260 265

Gln Gln Ala Leu Asn Gln

275 280

His Gln Gln Gln Gln His

290 295

Gly Gly Gln 305

<210> 72 <211> 585 <212> DNA

<213> Fragaria vesca <400> 72

accaccggca ccgggacgat cccggcgtcg gctctagcgg cagcagggga gttcaatatc agctggcttg tatcaaaaga ggaggtagga ccagttgggc tatggtggga gggaatttag gcaactgggc tatggccccc tgctgggttt ggtttttctt ccatctacta caaatctggg agggactgag agcagctcca cttcctgggt ttgacttgcc agtcaccaac atgggaccta ggtgggggaa gtcaacagct gcctggtttg gaacttgggt ggggttttga attctcaggc ttaccagatt taccagcaga caccatcaac agcagcaaca gcaacaccac cagcagcagc caagctccgt cttctaagga tgattctcaa ggctcaggac <210> 73 <211> 194 <212> PRT

<213> Fragaria vesca <4 00> 73

Thr Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala

10 15

Gly Ser Val Ser Gln Gln Gly Ser Ser Ile Ser

25 30

Lys Thr Asp Asp Leu Gly Ser Ser Gly Gly Arg

40 45

Val Gly Gly Asn Leu Gly Arg Pro His Val Ala

50 55 60

Trp Pro Pro Ala Gly Phe Gly Phe Ser Ser Gln 65 7 0 7 5 8 0

Pro Ser Thr Thr Asn Leu Gly Gly Thr Glu Ser

Ser Asn Leu Gly Pro Gln Gln Gln Leu Pro Ile Gly Val Leu Asn Gln Ala Arg Met His Lys Asp Asp Ser Gln Gly Ser

85

Gin Lys Ile Gly 100

Pro Met Ser Phe 115

130 Ser Gln 145 His

Gln

Gly

His

Gln lí Gln

Ala Tyr Gln Ile 150

Gln Gln Gln Gln 165 170

Gln Gln Gln Ala iO 185

< 2 1 O > 74 <211> 818 <212> DNA

<213> Juglans hindsii χ Juglans regia

< 4 O O > 7 4

cggcaggagg cagatgattt ggaggcccca cacagtcatc attacctcca tgagcttcac tgtctcaaga tgggccatgc accaacacca agtag

gtctgtatcg 60

agggtccagt 120

tgtggctgca 180

ttcatctggt 240

aaagattggc 300

ttcaattctg 360

tggccatctt 420

tagagtgcac 480

gcaacagcag 540 585

90 95

Leu Pro Gly Phe Asp Leu Pro

105 110

Thr Ser Ile Leu Gly Gly Gly 120 125

Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His

140

Tyr Gln Gln Met Gly 155 160

Gln Gln His His Gln 175

Pro Ser Ser Lys Asp 190

Leu Ala Ala Gly Thr Ser Ala Ala Ser Ser Ser Ser Val Thr Ser Gln Leu Gly His Ala Gln Gln Asp Ser

Ala Ala Gly Leu Tyr Gln Trp Ala Met Thr Gly Leu Ser Ser Gly Asn Tyr Leu Asn Met Gly Gln Leu Pro Val Leu Asn Arg Val His His Gln His Gln Gly Ser ccaagggctc aacaacagca aagcagccac aacaagtacc aaccacaaca acaacctaac atgggtgaga acaagcctgc ttgtgattgc tgacaaagaa gagggcaaga agcagttggc aagaccggca caccaaagtt gaaggcaggg gaaggagaat cagcgaggat: ttttcaattg accagagaat tgggccacaa acagcaggct gagccatcga taatagcagc tttagcagcg gcagggggtt ctgtatcaca ctggattgca ccaaaagatt gatgatttgg gggggtccag ccagttgggc aatggtaggt gggaatttag ggagacccca ccccggtcag tgggtttggg tttcagtcat catctggtcc gtgagagttc aaattacctg caaaagattg gcttccctgg ctatgagttt; cacctcaata ttgggtggga ataatcagca gcttatccca agatggtcat atcggggttt tgaacccaca aacagatggg gcaggctaga gtgcagcagc aacagcaa

agtggctgtt: cggcttcagc

aaacttcttg tgaaatcaaa ccccaagaga aaggatgcca atctgatgga cactgggact gcagggggcc tatcgggtta tgtggccaca atcgactgcg ctttgacttg gctaccggga agcct tgagt

agcctcccac gacttccaga agctcaaaca gctctttgtg gaaaccatac ggaaccatac tctctatcag gggagtagga gggctatggc aatttgggaa ccagccaccc ttggagctcg cagatttatc 818

<210> <211> <212> <213> <4 00>

75

272

PRT

Juglans hindsíí χ Juglans regia 7 5

Lys Gly Ser Thr Thr Ala Lys Gln Pro Gln Gln

10 15

Ser Leu Pro Gln Pro Gln Gln Gln Pro Asn Met

25 30

Ala Glu Ile Lys Asp Phe Gln Ile Val Ile Ala

40 45

Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn

50 55 60

Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met 65 70 75 80

Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly

85 90 95

Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu

100 105 110

Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala

115 120 125

Gly Ser Val Ser Gln Gln Gly Ala Ser Leu Ser

130 135 140

Lys Ile Asp Asp Leu Gly Gly Ser Ser Ile Gly 145 150 155 160

Ser Trp Ala Met Val Gly Gly Asn Leu Gly Arg

165 170 175

Gly Leu Trp Pro Pro Val Ser Gly Phe Gly Phe

180 185 190

Pro Ser Thr Ala Asn Leu Gly Ser Glu Ser Ser

195 200 205

Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Thr

210 215 220

Ser Ile Leu Gly Gly Asn Asn Gln Gln Leu Pro 225 230 235 240

Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn

245 250 255

Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg Val

260 265 270

<210> 76 <211> 474 <212> DNA <213> Panax ginseng <4 00> 76

tcagcagggc tgtatcagaa aattgatgaa ttgggcgggt ccaatggttg gtgggaattt gggaagaccc catatggcca gctgcagtcg gtggctatgg gtttcagtca tcatcatctg ggacatgaaa gttcaaatta cttgcaaaaa attgggtttt accaatttgg gtcctatgag ttttgcctca attttgggtg

Val Pro Gly Glu Asp Lys Lys Asp Pro Ala His Lys Pro Ser Leu Ala Ala Gly Leu Gly Pro His Gln Ser Asn Tyr Pro Met Gly Leu Pro Gln Gln Gln

Asn Phe Leu Asn Lys Pro Glu Glu Gly Arg His Thr Leu Cys Ala Ser Asp Gly Ile Ile Ala Ala Ala Gly Leu His Gln Ser Arg Thr Val Ala Thr Ser Ser Gly Leu Gln Lys Ser Phe Thr Glu Leu Gly Ala Leu Ser Gln Gln Gln

60 120 180 240 300 360 420 480 540 600 660 720 780

ctagtagtag gagcagttgg cagcaggatt atggcccgct gtccatcgac aaccaatttg ctgggtttga cttgccagcc caagtaatca gcagctccct

60 120 180 240 300 ggtttggagc ttggcctctc acaagatgga catattgggg

acccagattt accagcagat gggaaatgat agaatgcacc

cggaatcacc agcaggcatc tcccaaggat gaatctcaag

<210> 77

<211> 157

<212> PRT

<213> Panax ginseng

<4 00> 77

Ser Ala Gly Leu Tyr Gln Lys Ile Asp Glu Leu

10 15

Arg Ser Ser Trp Pro Met Val Gly Gly Asn Leu

25 30

Ala Thr Ala Gly Leu Trp Pro Ala Ala Ala Val

40 45

Gln Ser Ser Ser Scr Gly Pro Ser Thr Thr Asn

50 55 60

Ser Asn Tyr Leu Gln Lys Ile Gly Phe Ser Gly 65 70 75 80

Thr Asn Leu Gly Pro Met Ser Phe Ala Ser Ile

85 90 95

Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser

100 105 110

Gly Val Leu Cys Pro Gln Ala Leu Thr Gln Ile

115 120 125

Asn Asp Arg Met His Gln Gln Gln Gln Gln Gln

130 135 140

Gln Ala Ser Pro Lys Asp Glu Ser Gln Gly Ser

ttttgtgccc tcaagccttg 360 agcaacagca acaacagcac 420 ggtcaggaga gtag 474

Gly Gly Gly Arg Gly Gly Leu Gly Phe Asp Leu Gly Gln Asp Tyr Gln His Arg Gly Glu

Ser Ser Ser Pro His Met Tyr Gly Phe IIis Glu Ser Leu Pro Ala Ala Ser Asn Gly His Ile Gln Met Gly Asn His Gln

145 150 155

<210> 78 <211> 582 <212> DNA

<213> Poncirus trifoliata <4 00> 78

gaaccatcta tcatcgctgc tacaggaact gggactattc gcaggggcct ctgtttctga acaggggaac tctgtttcag gaagggttgg gaccaggtgt tgggtccatt aatagggcca aattttggaa ggtctcaaat tccaagtgga gtttggccaa gggtttattc aaaattctgg ccagttgact tcaaattttg aatccaaaat ttgggttcca cgggattgaa tttccaaata ttctcctcta tgttgagcgg tgctagccat caaattcctg caggatgcgc atgtgggggt gatgaattct caagctataa gggcatcaca gaagcgcttc aggatccttg aatcagcagc tctgataagg atgattctca gggatcagga tcaaagcagt <210> 79 <211> 193 <212> PRT

<213> Poncirus trifoliata <4 00> 79

Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly

10 15

Met Leu Ala Ala Ala Gly Ala Ser Val Ser Glu

25 30

Ser Ala Gly Leu His Thr Lys Ile Glu Gly Leu

40 45

Ser Ile Asn Arg Ala Asn Trp Thr Met Met Ser

50 55 60

Ser Gln Ile Pro Ser Gly Val Trp Pro Asn Ile 65 70 75 80

Gly Phe Ile Gln Asn Ser Gly Gln Leu Thr Ser

85 90 95

Asn Leu Ser Ala Asn Pro Lys Phe Gly Phe His

100 105 110

Asn Met Asn Met Gly Leu Met Ser Phe Ser Ser

cagcctctat caggcttgca actggacaat atataaatgg gaagtgaaaa tgaatatggg gcttggagct gccagttcta atcagcatca ag

gcttgcagct tacaaaaata gatgagtgca aactgggtct tttgagtgca tttgatgagt tggtctctca tcaacagatg gcaacaaatt 582

Thr Ile Gln Gly Gly Pro Ala Asn Asn Gly Asn Phe Gly Ile Met Leu

Pro Ala Ser Asn Ser Val Gly Val Gly Phe Gly Arg Thr Gly Ser Gly Ser Glu Glu Phe Pro Ser Gly Ala

60 120 180 240 300 360 420 480 540 115

Ser His Gln 130

Val Gly Val 145

Gly His His 165

120 Ile Pro

135 Met Asn 150

Arg Ser Ala 170

Ser

125

Gly Leu Glu Leu Gly Leu 140

Gln Ala Ile Ser Gln 155 160

Ser Gly Ser Leu Asn 175

Ser Gln

Gln Gln Gln Ile Ser Asp Lys Asp Asp 180 185 190

Gln

80 933 DNA

Chlamydomonas reínhardti i 80

ccgttctaca acgcggccag gcgcggcgag gcgtggattc gctgccctcg gtcagctcct gaccggtgct tgtgcaagcc tggggaggca caacctggaa gggtgtgtgt acacatcggc gccgaaggtc tcgagaagtg cgacgtgctg gcaacctggc gttcattggc cctcggagca cgccatggat ataaaagcac cggcaaccta agaacccggc gctgtccact cctcgcccaa gggcatcaac ggccgttcgt gcactaccct ggtttgtgtt catgcagccc tcgtgggcga caacaagaca gcctggtcga atacgagctg

81 310 PRT

Chlamydomonas reinhardtii 81

Met Arg Ser Ala Val Leu Gln Arg Gly Gln Ala

10 15

Arg Val Arg Ala Asp Gly Ser Gly Val Asp Ser

Ser Gln Asp Ala His Phe Tyr Gln Gln Met Gln Gln His Gln His Gly Ser Gly Ser Lys

<210> <211> <212 > <213> < 4 0 0 > atgcgctcag gatggttcgg attgatcgcc ccttgccccc gcgggtccgc atcccgttga tacggcagct ttccccgctg ttccacgcgc gtgcacaaga ggcctgatca gccaagaagc gccgggacac ggggtggact ttcatgcgct ctcaacagcc <210> <211> <212> <213> <4 00>

accagcgcca gctgcgtcgg aaggccgcag gcgacgggca gacgcggaga aacacgggac aacatggagc ggccgccgtt gctgtgctgg gctctggagg cccgtcatgc ggctcgctta atcaaggtgc tacgccacca tga

tgtcttgccg ggttcgggcg 60

gcagcagcgc acgccctctc 120

tcataacctt cgttggctgc 180

cttggaacta tggcgaagtt 240

agcgccagtc gcccatcaac 300

tgggcgaatt cgatttcgcc 360

acagcaccat gcaggtgaac 420

tggagctgct gcagttccac 480

acgccatgga ggcgcatctg 540

gcattatgct ggagcccggc 600

tggcgcccga ggtgcccctg 660

tgctgcccaa gaagagcaag 720

ccacgccccc gtgttcggag 780

ccgacagcca gatcctggac 840

acacgcggcc actgcagctg 900 933

20

25

30

Ala Ser Ser Ser Ala Arg Pro Leu Ile Asp Arg

4 0 4 5

Gly Ala Ala Ala Ser Val Ile Thr Phe Val Gly

50 Cys Lys 65 Ala

Gly

Trp Cys Ala

85

Ser Pro Ile 100

Glu Met Gly Glu 115

Val Leu Asn

55 60

Pro Gly Glu Ala Lys Ala Ala Ala

70 75 80

Pro Pro Thr Trp Lys Gly Val 90 95

Asn Ile Pro Leu Asn Thr Ser Ala 105 110

Phe Asp Phe Ala Tyr Gly Ser 120 125

Gly His Ser Thr Met Gln Val

Thr

130

135

140

Asn Leu Ala Phe Ile Gly Asn Met Glu Leu Glu 145 150 155 160

Phe His Ala Pro Ser Glu His Ala Met Asp Gly

165

Glu Ala His 180

Leu Gly Ile 195

Ser Thr Ala

170 175

Leu Val His Lys Asn Lys

185 190

Met Leu Glu Pro Gly Gly

200 205

Leu Glu Val Ala Pro Glu

Ser Thr

Leu Ile

Val Pro

Arg Arg Val Leu Pro Ser Arg Gln Leu Cys Pro Cys Asn Tyr Gly Thr Gly Lys Pro Lys Val Phe Glu Lys Asn Phe Pro Leu Leu Gln Arg Arg Tyr Gly Asn Leu Lys Asn Pro Leu Ala Lys

Ser Cys Thr Ser Leu Thr Pro Leu Glu Val Arg Gln Asp Ala Cys Asp Ala Gly Phe His Ala Met Ala Val Ala Leu Lys Pro 210 215 220

Ser Pro Lys Gly lie Asn Pro Val Met Leu Leu 225 230 235 240

Ala Gly Thr Arg Pro Phe Val His Tyr Pro Gly

245 250 255

Pro Cys Ser Glu Gly Val Asp Trp Phe Val Phe

260 265 270

Val Pro Asp Ser Gln Ile Leu Asp Phe Met Arg

275 280 285

Lys Thr Tyr Ala Thr Asn Thr Arg Pro Leu Gln

290 295 300

Leu Val Glu Tyr Glu Leu 305 310

<210> 82 <211> 1383 <212> DNA

<213> Chlamydomonas reínhardtii <4 00> 82

cttttgtaga cccacttgtc agtgggcact gcccctagaa gatgcgctca gccgttctac aacgcggcca ggcgcggcga ggatggttcg ggcgtggatt cgctgccctc gaccagcgcc cattgatcgc cgtcagctcc tgaccggtgc tgctgcgtcg cccttgcccc ctgtgcaagc. ctggggaggc aaaggccgca tgcgggtccg ccaacctgga agggtgtgtg tgcgacgggc catcccgttg aacacatcgg cgccgaaggt cgacgcggag ctacggcagc ttcgagaagt gcgacgtgct gaacacggga cttccccgct ggcaacctgg cgttcattgg caacatggag cttccacgcg ccctcggagc acgccatgga tggccgccgt ggtgcacaag aataaaagca ccggcaacct agctgtgctg cggcctgatc aagaacccgg cgctgtccac tgctctggag ggccaagaag ccctcgccca agggcatcaa ccccgtcatg ggccgggaca cggccgttcg tgcactaccc tggctcgctt gggggtggac tggtttgtgt tcatgcagcc catcaaggtg cttcatgcgc ttcgtgggcg acaacaagac atacgccacc gctcaacagc cgcctggtcg aatacgagct gtgagcggac gagcagcgtg tgaacatgaa gattacaagt ttgctgacag gcatcgcatc gtaacagccc gcgaagtacg acttaacatg tattgactgg tttggcccac ggtggggaag gcgtacgcgc ggggaggcat: cgccttgcac gcacttgccg tatgtaggcg ggcgagagac ccgcgaacta aacttaagta gattacccat gtgccctctc aattggggca ccgatgcagg ggctggaagg tca 1383

<210> 83 <211> 310 <212> PRT

<213> Chlamydomonas reinhardtí i <4 00> 83

Met Arg Ser Ala Val Leu Gln Arg Gly Gln Ala

10 15

Arg Val Arg Ala Asp Gly Ser Gly Val Asp Ser

25 30

Ala Ser Ser Ser Ala Arg Pro Leu Ile Asp Arg

40 45

Gly Ala Ala Ala Ser Val Ile Thr Phe Val Gly

50 55 60

Cys Lys Pro Gly Glu Ala Lys Ala Ala Ala Trp 65 70 75 80

Ala Gly Pro Pro Thr Trp Lys Gly Val Cys Ala

85 90 95

Ser Pro Ile Asn Ile Pro Leu Asn Thr Ser Ala

100 105 110

Glu Met Gly Glu Phe Asp Phe Ala Tyr Gly Ser 115 120 125

Pro Lys Lys Ser Lys Ser Leu Thr Thr Pro Met Gln Pro Ile Lys Phe Val Gly Asp Asn Leu Leu Asn Ser Arg

gcggcttctt gtgtcttgcc agcagcagcg gtcataacct gcttggaact aagcgccagt atgggcgaat cacggcacca ctggagctgc tacgccatgg ggcattatgc gtggcgcccg ctgctgccca accacgcccc cccgacagcc aacacgcggc acgagtgtgc agagcgggcg acataaaagt ggttccatca tgctggtgaa gtatccttta ccccgtgtaa

gaccagagaa gggttcgggc cacgccctct tcgttggctg atggcgaagt cgcccatcaa tcgatttcgc tgcaggtgaa tgcagttcca aggcgcatct tggagcccgg aggtgcccct agaagagcaa cgtgttcgga agatcctgga cactgcagct tagggtcagt gagtgcccat gcaatgcgca agcagccttt tgaggtatgg tttggcttgc cacatgacac

Arg Arg Leu Pro Arg Gln Cys Pro Asn Tyr Thr Gly Pro Lys Phe Glu

Val Ser Cys Ser Thr Ser Leu Leu Thr Cys Pro Leu Gly Glu Val Lys Arg Gln Val Asp Ala Lys Cys Asp

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 Val Leu Asn Thr Gly His Gly Thr Met Gln Val

130 135 140

Asn Leu Ala Phe Ile Gly Asn Met Glu Leu Glu 145 150 155 160

Phe His Ala Pro Ser Glu His Ala Met Asp Gly

165 170 175

Glu Ala His Leu Val His Lys Asn Lys Ser Thr

180 185 190

Leu Gly Ile Met Leu Glu Pro Gly Gly Leu Ile

195 200 205

Ser Thr Ala Leu Glu Val Ala Pro Glu Val Pro

210 215 220

Ser Pro Lys Gly Ile Asn Pro Val Met Leu Leu 225 230 235 240

Ala Gly Thr Arg Pro Phe Val His Tyr Pro Gly

245 250 255

Pro Cys Ser Glu Gly Val Asp Trp Phe Val Phe

260 265 270

Val Pro Asp Ser Gln Ile Leu Asp Phe Met Arg

275 280 285

Lys Thr Tyr Ala Thr Asn Thr Arg Pro Leu Gln

290 295 300

Leu Val Glu Tyr Glu Leu

305 <210> <2 11> <2 12> <2 13> <4 00>

310

Asn Phe Leu Leu Arg Arg Gly Asn Lys Asn Leu Ala Pro Lys Ser Leu Met Gln Phe Val Leu Leu

Pro Ala Gly Gln Phe His Tyr Ala Met Leu Ala Val Pro Ala Leu Lys Lys Pro Lys Ser Lys Thr Thr Pro Pro Ile Lys Gly Asp Asn Asn Ser Arg

1244 DNA

Arabidopsis thaliana 84

caaaattcat gtgttagttc ttcttcttta caaaattgag atccaaatga ggaatcactt tgcactatta atagaaaata aagatactat aatagtagag atcaaagacc tgagcaaaaa aaaaaaaaga cttctcctca aaaatggcgt ttacactagg tctctgcaac atcagttcat caaaatggtt gcttacacaa atcggtttca gcttggtgaa gcaaaagcaa taagattact tttggtcttt atagttcttt aaaaaaaaaa gtgaatcaaa ctgttttttt gtatcatagg agaacaaaca tggttcaaga ttatggatct aaacagagaa acagagacaa gttatgattt gatttctgaa attcaagaga caaaagtatc taccggagat ccatagctca atcaccaaag gtaatggtga taggatgtgc cttatgtact aggatttcaa cctggtgaag cttttactat ttaccccggt tcagaatgga ccaacagaaa ccaactcggc ctcttcaggt tgagaacatt atagttatgg gtcatagcaa ttatgagtca tcaaaaccac caagggcaac actctagttt atgggaaagc cgctaagtta agaacacaat tagcttcatc aatgcagaaa ctgtgagaag gaatctataa aggattctgt catggataag agatagagta aagagaggtg aagtcaagat tgtcagattg tagtcttgag aagtggagat taagttcaga atatttcaga cagagagata tggagttgag taaatattga tcagatgtat ctttgtacat acgaaatgat atttacacaa <2 10> <2il> <212> <213> <4 00>

tttaaactgt atacacaacc ctgaaagaaa tggaagagct actgcaacaa acccaggtga gaataaagac attaggaatc tctggatgaa agaaaagttt agattcaagg ccgaaatgtc tcttgagttt ttgtggagga agtagaaagg acatttatcc gatgaatttg tcatggatgt caagactaac acaatcctca ttgg

tttattacta 60 aaacatctaa 120 aaaaaaaaaa 180 cgtcgtctag 240 attggatcgg 300 taagataaag 360 agagattact 420 agggaagaat 480 atgagacaca 540 aaagctttgg 600 gtatgtccat 660 gccaatctcg 720 gcggtcacca 780 attgcagcac 840 tgggttatga 900 tttgatgaac 960 ataacttatt 1020 tattacaatt 1080 tatggattct 1140 gttctaatat 1200 1244

85 286 PRT

Arabidopsis thaliana 8 5

Met Ala Phe Thr Leu Gly Gly Arg Ala Arg Arg

10 15

Ser Val His Gln Asn Gly Cys Leu His Lys Leu

25 30

Asp Arg Phe Gln Leu Gly Glu Ala Lys Ala Ile

40 45

Arg Thr Asn Met Val Gln Glu Leu Gly Ile Arg 50 55 60

Leu Val Ser Ala Thr Gln Gln Ile Gly Ser Arg Leu Leu Pro Arg Glu Glu Phe Met Asp Leu Asn Arg Glu Thr Glu Thr Ser Tyr Asp Phe

65 7 0 7 5 8 0

His Arg Phe Leu Lys Phe Lys Arg Gln Lys Tyr

lie

85 90

Lys Phe Lys Ala Leu Ala

100 105

Gly Cys Ala Asp Ser Arg Val

115

Pro Gly Glu 130

Val Gln Asn 145

Thr Thr Leu 165

120 Ala Phe

135 Gly Pro 150

Gln Val

Gly Gly Ile Ala Ala Leu

180 185

Ser Arg Trp Val Met

95

Ala Gln Ser Pro 110

Cys Pro Ser Tyr 125

Ile Arg Asn Val Ala 140

Glu Thr Asn 155

Asn Ile Ile 175

Met Ser His Gln Asn 190

Asn Gly Lys Ala Ala Lys

205

Ser Phe Asp Glu Gln Cys 220

Met Asn

Thr

Glu 170

Ser Ala 160

Val Met

195 200

Ala Ser Ser His Leu

210 215

Glu Ser Ile Lys Asp Ser Val Met Asn Leu Ile 225 230 235 240

Arg Asp Arg Val Lys Arg Gly Glu Val Lys Ile

245 250 255

Asn Leu Ser Asp Cys Ser Leu Glu Lys Trp Arg

260 265 270

Thr Asn Tyr Gly Phe Tyr Ile Ser Asp Arg Glu

275 280 285

<210> 86 <211> 801 <212> DNA

<213> Medicago truncatula <400> 86

atggcaaatc aatcatctga gctagccatt gaacaactga gaggaactta atggggtggc cacagcaaaa attgagcagc tgtcatccaa atccaattga acctgctgat cagagaatca aagctcaaca atttcaacaa gaacccggaa ctgtatgatc cccaagttta tggtatttgc ttgttccgac tctcgagtga tttcaacctg gtgaagcttt catggttcga aacattgcta cagttaagat acagtggagt tggtgcaacc cttgagtatg gagaacatct tggttattgg acatagtcgc tgcggcggaa ccagaggatg gttctgctcc atatgacttc atagatgatt tccaaagtca aggttttgaa agaacatgaa cgctgtgatt tgtgaaatgg aatcagtgaa taactcatta gtgaacctga agagaaataa ggaacaagaa cttagctctg ttgggaggtt gaattcaagc tttggaagta taagaatcat gtcactgaac ggccttgaca tgaccatcta a <210> 87 <211> 266 <212> PRT

<213> Medicago truncatula <400> 87

Met Ala Asn Gln Ser Ser Glu Leu Ala Ile Glu

10 15

Leu Arg Glu Lys Glu Glu Leu Asn Gly Val Ala

25 30

Gln Leu Ile Val Glu Leu Gln Gly Cys His Pro

40 45

Ala Asp Gln Arg Ile Ile Asp Gly Phe Thr Tyr

50 55 60

Phe Asn Lys Asn Pro Glu Leu Tyr Asp Arg Leu 65 70 75 80

Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser

Leu Asp Leu Pro Lys Val Val Leu Asn Leu Leu Glu Gly His His Gln Leu Arg Arg Asn Thr Tyr His Gly Leu Ser Ile Trp

Glu Met Arg Glu Ile Glu Met Val Ile Gly Phe Gln Val Thr Pro Phe Ala Val Ser Asn Cys Gly Gln His Thr Gln Leu Cys Glu Lys Ser Trp Ile Cys Tyr Tyr Ser Asp Lys Ser

agaagcttct ttatagttga ttgatggttt gacttgctaa gtccctctgt acatggtccc ctattacagc tctcaaggct gggtgaaaat tcaaagaaca agacatatcc actatgattt ctgttaccat 801

cagagagaag attacaggga tacgtacttc aggccagtct tatcctgaac tccatttaat tctaaaggtg tatgaatcat tggtttatct atgcaaattc atatgttgat tgtgagtgga ccctctaaaa

Gln Leu Lys Lys Leu Thr Ala Lys Ile Glu Asn Pro Ile Glu Pro Phe Lys Leu Asn Asn Ala Lys Gly Gln Ser Arg Val Ser Pro Ser

60 120 180 240 300 360 4 20 480 540 600 660 720 780 85 90 95 Val Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe

100 105 110

Ala Asn Met Val Pro Pro Phe Asn Gln Leu Arg

115 120 125

Ala Thr Leu Glu Tyr Ala Ile Thr Ala Leu Lys

130 135 140 Val Ile Gly His Ser Arg Cys Gly Gly Ile Ser

145 150 155 160

Pro Glu Asp Gly Ser Ala Pro Tyr Asp Phe Ile

165 170 175

Ile Gly Leu Ser Ser Lys Val Lys Val Leu Lys

180 185 190

Asp Phe Lys Glu Gln Cys Lys Phe Cys Glu Met

195 200 205

Ser Leu Val Asn Leu Lys Thr Tyr Pro Tyr Val

210 215 220

Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr Tyr

225 230 235 240

Glu Phe Lys Leu Trp Lys Tyr Lys Asn His Val

245 250 255

Ile Pro Leu Lys Gly Leu Asp Met Thr Ile

260 265

88

774

DNA

Medicago truncatula

Met Val Tyr Ser Val Glu Arg Leu Asp Asp Glu His Glu Ser Asp Arg Asp Phe Thr Glu

Arg Asn Ile Gly Val Gly Asn Ile Leu Met Asn His Trp Val Lys Glu Arg Cys Val Asn Asn Glu Ile Arg Val Ser Gly Pro Val Thr

<210> <211> <2 12> <213> <4 00> 88

atggcaaatc aatcatctga gctagccatt gaacaactga gaggaactta atgaggtggc cactgcaaaa attgaggaaa tgtcatccac aaccaattga tcctgctgag cagagaatca aagctcaaca atttcgacaa ggaccggaaa ttgtatgatc cccaagttta tggtatttgc ttgttctgac tctagagtga tttcaacctg gagaagcttt: catggtccga aacattgcta cagttaagat acagtggagt tggtgcaacc cttgagtatg gagaacatct tggttattgg acatagtcgc tgcggcggta ccagaggatg gttctgctcc atatgacttc atagatgatt tctaaagtca aggtcctgaa agaacataaa ttctgtgatt tgtgaaatgg aatcagtgaa taactcatta gtgaaccttc gcagaaataa ggaacaagaa cttagcacta ttggggggtt gaattcaagt tttggaagta taagactcat attactgaac <210> 89 <211> 257 <212> PRT

<213> Medicago truncatula <4 00> 89

Met Ala Asn Gln Ser Ser Glu Leu Ala Ile Glu

1 5 10 15

Leu Arg Glu Lys Glu Glu Leu Asn Glu Val Ala

25 30

Glu Ile Ile Val Glu Leu Gln Gly Cys His Pro

40 45

Ala Glu Gln Arg Ile Ile Asp Gly Phe Thr Tyr

50 55 60

Phe Asp Lys Asp Arg Lys Leu Tyr Asp Arg Leu 65 70 75 80

Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser

85 90 95

Ile Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe

100 105 110

Ala Asn Met Val Pro Pro Phe Asn Gln Leu Arg

115 120 125

Ala Thr Leu Glu Tyr Ala Ile Thr Ala Leu Lys

agaagcttct ttatagttga ttgatggttt gacttgctaa gtccctctat acatggtccc ctattacagc tatcaaggct gggtgaaaat tcgagcaaca agacatatcc actatgactt ccattacaat

cagagagaaa 60

gttgcaggga 120

tacttacttc 180

aggacaatcc 240

tatcctgaac 300

tccatttaat 360

tctaaaggtg 420

tatgagtcat 480

tggtttacct 540

atgtgaattt 600

atatgttgat 660

tgtgagtgga 720 ctga 774

Gln Leu Lys Thr Ala Lys Gln Pro Ile Phe Lys Leu Ala Lys Gly Arg Val Ser Met Val Arg Tyr Ser Gly Val Glu Asn

Lys Leu Ile Glu Asp Pro Asn Asn Gln Ser Pro Ser Asn Ile Val Gly Ile Leu 130

135

140

Val Ile Gly His Ser Arg Cys Gly Gly Ile Ser Arg Leu Met Ser His 145 150 155 160 Pro Glu Asp 165 Gly Ser Ala 170 Pro Tyr Asp 175 Phe Ile Asp Asp Trp Val Lys Ile Gly Leu Pro Ser Lys Val Lys Val Leu Lys Glu His Lys Phe Cys Ii 30 185 190 Asp Phe 195 Glu Gln Gln 200 Cys Glu Phe 205 Cys Glu Met Glu Ser Val Asn Asn Ser Leu Val Asn Leu Gln Thr Tyr Pro Tyr Val Asp Ala Glu Ile Arg 210 215 220 Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr Tyr Asp Phe Val Ser Gly 225 230 235 240 Glu Phe Lys 245 Phe Trp Lys 250 Tyr Lys Thr 255 His Ile Thr Glu Pro Ile Thr

Ile <2 10> <211> <212> <213> <4 00> ttcttcgata atcctttaag caatgatctt gttgacggcg gaccggtttt tcttgccaag tccatctcac tatggttcca agttgtacat taagggactc ttgggtgaag ctacgatgat gctttcgtac tcactacaat tgcttttgcc aaaaagacac ctttgatttc aacaataaag aagatttgaa <210> ■ <211> <2 12> <213> <4 00> Met Ala

1

Ser Lys

Pro 5

Pro Glu 20 Gly Leu 35 Ala

90 1100 DNA

Arabidopsis

90

aggattttac gaaaaagacg ctcagtacga gagctaaagg actcaattca actcagaccc atcttgaatt ccttttgacc ctcaaggtgg atgtccattg ataggcgcat caatgcaaca ccattcgtga ttcgtcaaag ttctcttaag tttgactcat tttttgttaa ctgtaaccaa ctttccttct

91 280 PRT

Arabidopsis 91

Ala Phe

thaliana

tctccagaga aaatggcaac aagcggatct agcttgactc aaaccgagaa caaagtttct tccaacctgg agaagagaca agaacatttt aagatgatgc cagcgaggaa agtgtgagaa gagctgaggt gaacgtttga aaagaaagct ctttcttcat ttcaaaactt cgtttgaaac

thaliana

aagaaaaaaa ggaatcgtac cggaaacgtc aagcaattca atatttgaag ggtgtttgct tgaggctttt ctctggagtt ggtgataggc tgccccaact caagatcaag ggaagctgtg ggtgaagaac tctctgggag accggaacat tctctcatgt caactttgct ttctatattt

aaacctcctc gaagccgcca gccgccgcga gacgcaattg aatagtactt tgctctgatt gttgtcagaa ggcgccgccg catagctgct caaagtgact gaggaacata aacgtatcgc acacttgcaa ctcgatttca ataaaactct tgatgattcc gcttctattt gtctaattga 1100

tgcttttgtg 60 ttaaaggact 120 agatcaaagc 180 aacgaatcaa 240 tgttcaatca 300 ctcgagtttg 360 acatagccaa 420 ttgaatacgc 480 gtggtggtat 540 tcattgaaaa 600 aagacttgag 660 ttggaaactt 720 taagaggagg 780 agaccactcc 840 tttgagataa 900 tctccaactt 960 caaaagctca 1020 tgtttgaacg 1080

Gly Lys 10

Ala

Ala 50

Ser Ser Asn

Lys Asp 25

Asn Asp 40

Lys Ile

Glu

Leu

Lys

65 Phe

Lys

5 Ser 70 Thr Glu

Asp Lys

Ala

75 Tyr Leu

Met

30

Leu Ser 45

Ala Leu 60 Ile

Cys Phe 15

Ala Thr

Glu

Ala Lyi

HD Thr

Gln

Arg

Va J

100 Val Cys 115

Val Arg

130

90

Thr Pro 105

Pro Ser His 120

Asn Ile Ala 135

Lys 95

Phe Leu 110 Leu Asn 125

Asn Met Val

Lys

Ile

Met Phe Cys Cys Ala Lys Thr Glu Ser Tyr Glu Ala Ala Ile Thr Lys Ala Asp Leu Gly Asn Val Thr Ala Glu Leu Lys Glu Leu Asp Ile Lys Thr Gly Phe Thr Gln Ser Thr Leu Phe Asn His Leu Val Phe Ala Cys Ser Asp Ser Phe Gln Pro Gly Glu Ala Phe Pro Pro Phe Asp Gln Lys Arg

Arg

80 Asn

14 0 His Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val Val His Leu Lys 145 150 155 160 Val Glu Asn Ile Leu Val Ile Gly His Ser Cys Cys Gly Gly Ile Lys 165 170 175 Gly Leu Met Ser Ile Glu Asp Asp Ala Ala Pro Thr Gln Ser Asp Phe lí 30 lí 35 190 Ile Glu Asn Trp Val Lys Ile Gly Ala Ser Ala Arg Asn Lys Ile Lys 195 200 205 Glu Glu His Lys Asp Leu Ser Tyr Asp Asp Gln Cys Asn Lys Cys Glu 210 215 220 Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Ser Tyr Pro Phe 225 230 235 240 Val Arg Ala Glu Val Val Lys Asn Thr Leu Ala Ile Arg Gly Gly His 245 250 255 Tyr Asn Phe Val Lys Gly Thr Phe Asp Leu Trp Glu Leu Asp Phe Lys 260 265 270 Thr Thr Pro Ala Phe Ala Phe Ser

275 <210> <211> <212> <213> <4 00> atcatttttc cgtgctcgct ttccctccca gacatcctca cccccaccgc cgctcagcgt tggcctcaag tagatgagat tcaagcacag caccaaagtt ggtttcagcc agcatggtgc agaatgtatt aaagtaagca agagtgcaag aacattgtga tagagaaaag attgcacatt atgccataaa ttcactctgc ttgcactttg ctgttacggt gttgtatgtt gactaggctg ggcagcaaag Ctgtattatt taccaaaaac tgtaattgca atataataat ttttgtcg <2 10> <211> <2 12> <213>

92

17 4 8 DNA Oryza 92

280

sativa

taaaaaagaa gcctcgctct caaatgcccg catggctcct cgacggcccc ttccctgcgt agatcattct agatggggaa gaattgtgtg catggtggtt cggggaagca ttcagagact agtggtaggt agatgattcg gttaagtacg aaaggaatca ggtgaatgaa cgagaagtgg gaataggact cccctgcagt ctccattgtg gttgttggta atcagcttca cagttgagcg tgaaagtttg ttctgcttag atgtacgatc aaaataagat tctcaaatag

aatcgctgcc accccgtaaa agaccccgac agtctgctcc ggccggagcc gtgggaggat ggtttgactc catgatccat gataatattt gcttgtgctg tttactgtcc agcgctgcac cacagccgtt caatctagaa gaagcagcag attaatagct ggaactttga aaattagtat acctggtctt ttagcatggt gtattgacat ccattgatta cagaggtaca aaaccacaat tcaaactgcc aagcatcata ttgccacatt agagctttgt ttgaaacaat

tcgacctcgg atcccccccg cacgacgacc gccccgcctc gctccgctgt ctagccggag gacagctttt tcatggagtt ctaactatca attctagggt gtaatatagc tggagttcgc gtggtggtat gctttatcag ctggaaattt cactgttgaa gccttcatgg accgccaagg gatcaagagg tttgctttgc tctgcaagaa acataacact tgtggcactt ggagtgaagt ggggacaaag ttaattcaat tggcaaatta aatctggtgt gttgtgttta 1748

tttctccgtc gccgttgccg accacccgcg cccgtgcctc gacgatcggt ggactttccg agattttcaa gaaagcaagg aaatcttgct atgtccttca aaatttggta tgtcaacaca ccaagcacta agattgggtg gaattttgaa cttgttaaca gggctattac gttggaaggt cattgcttac cactgtgctg cgagtcccag tgacggccat taacagttat gcaacagaaa tgaattttgt aagctgcaaa ttgtgttgta gccgggcagc aagttcaatc

gcatcgccgt cgcgaagctt cgagcaccgg aacctcgcgc ggttcgaggc tgtaccacaa catggtacag ttcatggact cagcagcaaa agtgttttgg ccaccatatc ctagaggtag atgagtatga tcaat tgcaa ttacagtgca tacccttgga aattttattg ggaagcaagt ctgggtaaat tccattttca tatcaagtca acttggtcat ttgatacagt tgaacattat ccaaatatcc ctcatattca tcatttatcg tgctgtatca tttactgttc

<4 00> Met Ala

1

Pro

93

306

PRT

Oryza sativa 93

Pro Ser Leu

D

Thr

Gly

Pro 20 Gly Ser

Leu 10

Ala Asp Gly 25

Arg Pro Leu

Arg

Pro

Ser

Pro Ala 15

Gly Arg 30

Val Ser

Ser Pro Gys Leu Asn Leu Ala Ser Arg Ser Ala Val Thr Ile Leu Arg Val Gly Gly Ser Ser

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 35

Arg Arg Asp

50 55

Leu Thr Arg Gln 70

Gly Glu His

85 Lys His 100 Gln Gln

40 Phe Pro

Leu

65 Asp

Phe

Arg

Ala

Arg

115 Val 130 Thr Val 145 Ser

Glu

Cys Arg

Gln

Pro

Asp 90

Asn Cys

105 Thr Pro 120 Ser

Cys

60

Leu Asp

75 Pro Phe

45 Thr Thr

Met Ala Ser

Phe

Val

Lys

Glu

Leu

Thr 165 Val 0

Ser

Asn

1

Met 195

Ile Arg Asp 210 Ala Ala Ala 225 Lys

135 Asn Ile 150 Ser

Leu

Ala

Met

Ile

Tyr

Glu Ser 245 Glu Lys 260 Asn Phe

Val lí Lys 200 Trp Val

215 Gly Asn 230 Ile

Ser

Ala

Ala 170 Val

5

Ser

Val

14 0 Asn Leu 155 Leu

Gln 80

Met Glu

95

Asp Asn 110 Phe Met 125 Leu

His

Leu

Gly Lys

Ile Ser

Val Val

Gly Phe Gln

Val

Glu

Pro 160 Ala

Pro

Val

Gly Lys

Ser Ile Ala

Phe 17 5

His Ser Arg Cys 190

Gln Asp Asp Ser 205

Lys Ser Ala

Asn

Arg Val

Leu

Ser 250 Asn

220 Asn Phe 235 Ser

Leu

Glu Gly

Glu

Leu 255 Thr

Leu 240 Asn

Gln

Leu

Gln

Leu

275 Gly 290 Trp Ser 305 <2 10> <211> <2 12> <213> <4 00> agcagcaatg cctctcatac ggcggactac cccggcgtac gcaggccatc caccctcgtc tacctacatt ct cattcata tgccatgtca acgtgatatg gaaataaatt aaataaaaaa atttttgcat atatgtcact aatttgacta gtataagaat tgattttttt cccccgaggg gcagagattt ggtggggacg gccgtcggag tgccgccgac cttctacttc

2 65 27 0

Ile Asp Cys Thr Phe Glu

280 285

Glu Gly Gly Ser Lys 295 300

Leu Ser

Lys Trp

Tyr Ala Ile

94

1997 DNA Oryza 94

s ativa

gtgtcctccc ggtgaggcgg gggtacgcgg aagctgtgcg tccaacccca aacaacggca gggatttttt ttttcaatat gtctgaatac ttattttacc taagaaaggt aaatt ctcca gtcacttaaa tqacaataca tgaatagaac tttaacttgc tttaattttt acaaaaatcc gattgattgg gtgacggtga cacaccatca ggcagcctcg cagctcaaga

atgcagccat: cgccgaagat cggggagcaa gcgacggcaa acctcgactc aggacatctt ttgaatttgt ctgaaccttt acggtgtggt atggtaggca ttgtttttga ttgggaaaac aagtcattaa tattcaaatt gcataattca gtgtctgtga cgataacgtt acttcccctg catatcgaac acggcaaggt acggggagaa cegtcatcgc ggaagctcgc

Arg Asp Thr Val Ala Arg Asn Tyr Ala Cys Pro Gly Tyr Gln Asn Thr Gly Gly Gln Ser Arg Leu Cys Lys Leu Thr Leu His Lys Leu Lys Asn

His Ser Gly Asp Glu Ile Phe Met Asp Gln Asn Leu Ala Asp Ser Glu Ala Phe His Gly Ala Leu Glu Val Ile Gln Ala Arg Ser Phe Ser Thr Glu His Cys Glu Tyr Pro Trp Gly Gly Tyr Val Tyr Arg Arg Thr Thr

cgtcttcttc gacggcggtg gctggggccg gaagcagtcg actcaaccgc ggcaagccat ttttattttt tgaccacggg agaaataaat ggttggcgtg aataaaaaaa tctattcatc aaattttgaa caacttgtac cggttaaatt aaagatatat ttgaacgtca cattgttgca catggcgcag gtacagcttc gcacccgctg catcctctac cgagctcgcc

ctcgtcgccg gcggcggact gagaactggg cccatcgaca acctacaccg ctaacctaac aattctaaaa ttggcgtggc tttcatgctg gccaaaagat tttagaaaag ccttcaagag aaaatttagt atatagaaac tattattttt catatattga tgcacaaaac ttatccaatg atggagttcg aggcgggtgc gagctccaga aagtacggcg gccgacggct

cgtcgtcgct 60 acgggtaccc 120 ggaagctgag 180 tcgtcaccaa 240 cctccgacgg 300 tagctagacc 360 acaaacattt 420 aaaataatac 480 gttttaggtg 540 tcagattttg 600 ttcaagaaaa 660 atatcccctt 720 agcatatgta 780 aaaaataaca 840 gtttcgaatt 900 tctatcttga 960 gagaggatgt 1020 gagctagcta 1080 agccagacaa 1140 actggcacgc 1200 tggtgcacgc 1260 ccccggactc 1320 gcagcttcgg 1380 cgaggagaac gcccaggtcg ggggagctac ttccgctacg ctggagcgtg ctcggcaaga gctgctcccc gccggcggcg

ctacaacccg tttggcccat tgaaggatct tgcttagata tttggaaaca gcacttgttt gagctgattt <210> <211> <212> <213> <400> Met Ala

cccaacagca ttatatatac caatttttga ggcccttatc tggttgctta ttcattcaaa gaatttt

ccctcggcct ccggctcgct. tcaggcagat cgaggccgac ccatctcctt tatatgggtt gatttttctt tatagtatag tcctcacttg cattagcctg

cgtccacctc gacggcgccg cagccaggag gcagccgctc caaggtctag gcattgggct gtttctggag taacatatgt gaattaggct tcgcatagat

cgctcgctgc ccgtgcaccg caggtcgccc aacggccgca tagccccagg gcacaggccc aaaaaaaatt atatgaattt tttaaaagtc agtctttttc 1997

agaagcggac aggacgtctt tcatcaccgc ccgtgcagtt cccaatgggc tgaaattgat catgtactgt aattttagga gagcacatgt ttaataatta

1

Asn Glu

Gly

20

His Thr 35 Ala

95 182 PRT

Oryza satíva 95

Gln Met Glu 5

Lys Val

Ile

His

50 Tyr Gly 65 Glu

Ala

Leu

Ala 55 Pro 70

Ala Ala

Ala

Tyr

25 Asn :0

Asp Asp Asp

Phe 10 Ser

Gly

C-Iy

Ala

Tyr

Val

85

Leu Gly 100 Phe Arg 115 Phe

Ser

75 Gly Cys 90

Glu Pro Asp Lys Val 15

Phe Arg Arg Val His 30

Glu Lys His Pro Leu

45 Ser Leu 60 Phe

Ala Val Ile

Tyr

Phe 80 Phe

Gln Leu

Leu

Tyr

Trp

Leu

Val His

105 Ala Gly 120

Val Leu

Leu

Ser

Ser 95

Arg Ser 110 Leu Thr 12 5 Lys

130 Val Ala 145

Gln Pro Thr Ile

<210> <211> <212> <213> <4 00> atggcgcgcc gggtcacctg caagggcctc gcggcttcca

Ser Val Leu Gly

135 140

Ile Thr Ala Leu Leu Pro 150 155

Leu Asn Gly Arg Thr Val Gln 165 170 175

Ser Phe Lys Val 180 96

1497 DNA

Dunaliella salina 96

tcgcgctgtt aggcgccgcg aggggcatgg cactaagact ataccaacag cgaccccccc gttcaagtgc cgaaattact ggacatgcag

Gly Glu

Leu Gln

Ala Pro

Ile Arg Gln

Ala 160 Phe

Gly Tyr

ccagtggccg actgtgatgg gcagacccga ctgaccgcag

gattttgtgc gacgcgccca cagcccatcc taccctcttg atcggcacca gttgaggatg gacatggaga tacgacggca agccccagga caccccaatg gtctaccgct gagctgtctt

tgcgaagcaa cgtccggcaa agctttactt atgcccacct tgtataagta cacttgagga

cggcgtgt ct cgtcaagttg cctgcccacc ccaccacttt tgtcatggct tggcaatggc gcgtgatgat

tcagcccgaa agaccatgtc gcctgaccac ccctccctgc

ccatctccat aagccatccc acgaggctac ctcccacgac

cgaecagctg caccaacaac agccatggat cgtcacagca

Gly Thr Val Trp His Ala Glu Leu Gln Ala Ile Leu Lys Arg Lys Glu Asn Ala Lys Arg Thr Pro Cys Thr Ile Ser Gln Gly Ala Arg Asn Pro Pro

Thr Val Pro Ser Met Val Tyr Lys Leu Ala Gln Val Gly Ser Glu Asp Glu Gln Pro Thr Asn Ser

ctactatgcg gagatgatgg tacaactaca gagctgtgcg agcccaatca ggcatcaacc aacatcgagc atcatgatcg gccagtgagc tcccttgatg gatgacttcc gtgtcttacg ctgccccagt agtgaggtgg aagacatttg cgcgtgatcc gactccggcg acctacgaca

ccctggcggt gcgctggaag actgccatgg acagcccagc acatcgtgac tgagaggcat aagacatgaa acggcacaga acaccatcaa accccaacca tggcgcgcct gcagcaaaga cctccctgga tgaagtggca agagggtctc agcctctcgg atggcaccgg tcatggtctc

1440 1500 1560 1620 1680 1740 1800 1860 1920 1980

ctcgacgcaa 60 gctgctccag 120 ctttgactgg 180 atcaagtttt 240 gagcgagctt 300 gggctcctcg 360 gatcagctgg 420 gcagcgattc 480 tgggcagctc 540 gctggctgtc 600 gttcggcaag 660 agtgccaatt 720 gtacgctggc 780 cgtgttcacc 840 cttcaacgcg 900 caccacjggct 960 caacgctgac 1020 aggcaccgct 1080 agcagcctgg cggacatgtt caacaatgga gctcgtctgg acaatggcgg ttttggtcct 1140 gatgaccagg cagaggctga cctgctgcgc cagatccagc ggcgtgcacg tgcaaactct 1200 ggtgctgaag gcgctgaggt ggtccgcatg atgaagttca cagctgccct tggccgtcgc 1260 aggctcaacc agcagggcgc ggcagcagag atggacatca ggtactactt tgagggtagc 1320 accgatcaag aagaggctac atcagctgtg aatggcatga acccctcttc gctgggcagc 1380 tccagcagtg gcctgactga tgtgcagcag actgaggtaa cctcttctgc cagcagcctg 1440 cgtgctggcc tgggcttggt tgtggcagcc ttcttcggtg ctgcattggc actgtga 1497 <210> 97 <211> 498 <212> PRT

<213> Dunaliella salina <4 00> 97

Met Ala Arg Leu Ala Leu Leu Gly Ala Ala Leu Leu Cys Ala Leu Ala 10 15

Val Ser Thr Gln Gly Ser Pro Glu Gly His Gly Thr Lys Thr Glu MeL

25 30

Met Gly Ala Gly Arg Leu Leu Gln Gln Gly Pro His Thr Asn Ser Asp

40 45

Pro Pro Tyr Asn Tyr Asn Cys His Gly Phe Asp Trp Ala Ala Ser Ser

50 55 60

Ser Ser Ala Glu Ile Thr Glu Leu Cys Asp Ser Pro Ala Ser Ser Phe 65 70 75 80

Pro Val Ala Asp Cys Asp Gly Asp Met Gln Ser Pro Ile Asn Ile Val

85 90 95

Thr Ser Glu Leu Ala Asp Pro Thr Asp Arg Ser Gly Val Ser Gly Ile

100 105 110

Asn Leu Arg Gly Met Gly Ser Ser Asp Phe Val Leu Arg Ser Asn Val

115 120 125

Lys Leu Asn Ile Glu Gln Asp Met Lys Ile Ser Trp Asp Ala Pro Thr

130 135 140

Ser Gly Asn Leu Pro Thr Ile Met Ile Asp Gly Thr Glu Gln Arg Phe 145 150 155 160

Gln Pro Ile Gln Leu Tyr Phe His His Phe Ala Ser Glu His Thr Ile

165 170 175

Asn Gly Gln Leu Tyr Pro Leu Asp Ala His Leu Val Met Ala Ser Leu

180 185 190

Asp Asp Pro Asn Gln Leu Ala Val Ile Gly Thr Met Tyr Lys Tyr Gly

195 200 205

Asn Gly Asp Asp Phe Leu Ala Arg Leu Phe Gly Lys Val Glu Asp Ala

210 215 220

Leu Glu Glu Arg Asp Asp Val Ser Tyr Gly Ser Lys Glu Val Pro Ile 225 230 235 240

Asp Met Glu Ile Ser Pro Lys Asp His Val Leu Pro Gln Ser Ser Leu

245 250 255

Glu Tyr Ala Gly Tyr Asp Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu

260 265 270

Val Val Lys Trp His Val Phe Thr Ser Pro Arg Thr Ile Ser Ile Asp

275 280 285

Gln Leu Lys Thr Phe Glu Arg Val Ser Phe Asn Ala His Pro Asn Glu

290 295 300

Ala Ile Pro Thr Asn Asn Arg Val Ile Gln Pro Leu Gly Thr Arg Ala 305 310 315 320

Val Tyr Arg Tyr Glu Ala Thr Ala Met Asp Asp Ser Gly Asp Gly Thr

325 330 335

Gly Asn Ala Asp Glu Leu Ser Ser Pro Thr Thr Val Thr Ala Thr Tyr

340 345 350

Asp Ile Met Val Ser Gly Thr Ala Ser Ser Leu Ala Asp Met Phe Asn

355 360 365

Asn Gly Ala Arg Leu Asp Asn Gly Gly Phe Gly Pro Asp Asp Gln Ala

370 375 380

Glu Ala Asp Leu Leu Arg Gln Ile Gln Arg Arg Ala Arg Ala Asn Ser 385 390 395 400

Gly Ala Glu Gly Ala Glu Val Val Arg Met Met Lys Phe Thr Ala Ala 405 410 415

Leu Gly Arg Arg Arg Leu Asn Gln Gln Gly Ala

420 425 430

Ile Arg Tyr Tyr Phe Glu Gly Ser Thr Asp Gln

435 440 445

Ala Val Asn Gly Met Asn Pro Ser Ser Leu Gly

450 455 460

Leu Thr Asp Val Gln Gln Thr Glu Val Thr Ser 465 470 475 480

Arg Ala Gly Leu Gly Leu Val Val Ala Ala Phe 485 490 495

Ala Leu <210> 98 <211> 1668 <212> DNA

<213> Dunaliella salina <4 Θ0> 98

atggcgaggc tcgtcctgct aggggcgttg ctcggcgcgc ggctccctgg atggctctca ggttgaggcg ggtctaggaa ccccatgagt acaactacaa cagacatggc atcgactgga tgcgctggct ccatgcagag ccccatcaac atcgacatgg gagcgcagcg atgtgagcgg cctctacctc aatggcctcg gccgccgacg tgacagtgaa cgcggagcag gacatgaaga cagaacaaca tgcctgccat caagatcgac ggcagcgaca ctgcacttcc accacttcct cagcgagcac gccatcaacg gcgcaccttg tgatggggga cgcaagcggc aacaccaacc atgtaccagt acggcgagca gcctgacgac ttcgtccggc gatgagatcg cgaccaacgg tgctgggtac ggagagactg gtgaacatca tgaaggatgt gctgcccccc acccaccaca agcctgacca cgcccccgtcj cgatgagagg gtgaagtggc accatcacaa ctgggcagct ggagaagttc ctgatgatca gcgatcgtca ccaacaaccg catcgtgcag cccattggca cccacacccg ccagctacaa ctacgcgcgc aagggcattg gacaactgtg ctggtgacag gcagagcccc atcaacattg ggcgctgtct ctggcatcag cctgaacggc ctggagtcac gcctacgtga acctggagca ggacatgaag gtcagcttca cccactgtca acatcgatgg gaacgacgag tcgttcaggc cacttctcca gcgagcacac cgtggatggc atgatctacc atggcatccc aggccgagaa cagcaaccag ctggcagtca ggcagtgagg ctgatgactt cctgaccagg ctgcacaccg ggcaacgcca actggggcga caacaacgtg cccatcaacc gatttgatgc ccagcagtac tgagcactgg gcctatgagg tgcgatgaga gggtgaggtg gattgtgatg aaggagccca atggagacct tcaagactgc caccgtgaac gcccactacg cgcgcgattc aggagcgcaa cagcaggcct attagcagta <210> 99 <211> 555 <212> PRT

<213> Dunaliella salina <4 00> 99

Met Ala Arg Leu Val Leu Leu Gly Ala Leu Leu

10 15

Thr Ala Val Gln Gly Ser Leu Asp Gly Ser Gln

25 30

Gly Arg Gln Leu Thr Gln Asp Lys Pro His Glu

40 45

His Gly Ile Asp Trp Arg Asp Glu Gly Leu Asp

50 55 60

Met Gln Ser Pro Ile Asn Ile Asp Met Ala Thr 65 7 0 7 5 8 0

Glu Arg Ser Asp Val Ser Gly Leu Tyr Leu Asn

85 90 95

Ala Tyr Asp Val Ala Ala Asp Val Thr Val Asn

Ala Ala Glu Met Asp Glu Glu Ala Thr Ser Ser Ser Ser Ser Gly Ser Ala Ser Ser Leu Phe Gly Ala Ala Leu

tgtgtgccac ggcagctcac gggacgaggg ccactttgaa cctcgcccgc tcaccttcaa tgctcttcaa gcgcgcacta agctggcggt gcttgcagac tgaacgtcac actacgtggg acgtgttcac caaagcgcgg ggcctctgta actggaggga acacaaccga agagcttcac ccgcccccac ccatccagct ccctggaggc ttgccatctt aggccatcag tgcccatcac gcagcttgac ggaccaccac ctgccgagat tcccttaa

ggctgttcaa acaggacaag cctggacaac ccgtggcgag ctacgatgtc ggacgtcgcg gcccgtgcag ccctctggag gctgggcatc gaagaccatt cgacttgtct ctacgacggg cgagcccagg ccacactgat ccactacaag ggctggcctg tctccaacct attcaccgac aaacaacctg gcacttccac ccaccttgtg ctaccagtac cgctcagcaa cttcgccacg caccccacct tgctgagcag tgtcaacaac 1668

Gly Ala Leu Cys Ala Val Glu Ala Gly Leu Tyr Asn Tyr Asn Arg Asn Cys Ala Gly Ser Leu Asn Arg Gly Glu Gly Leu Ala Ser Pro Ala Glu Gln Asp Met

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 100 105 110

Lys Ile Thr Phe Lys Asp Val Ala Gln Asn Asn Met Pro Ala Ile Lys

115 120 125

Ile Asp Gly Ser Asp Met Leu Phe Lys Pro Val Gln Leu His Phe His

130 135 140

His Phe Leu Ser Glu His Ala Ile Asn Gly Ala His Tyr Pro Leu Glu 145 150 155 160

Aia His Leu Val Met Gly Asp Ala Ser Gly Asn Thr Asn Gln Leu Ala

165 170 175

Val Leu Gly Ile Met Tyr Gln Tyr Gly Glu Gln Pro Asp Asp Phe Val

180 185 190

Arg Arg Leu Gln Thr Lys Thr Ile Asp Glu Ile Ala Thr Asn Gly Ala

195 200 205

Gly Tyr Gly Glu Thr Val Asn Val Thr Asp Leu Ser Val Asn Ile Met

210 215 220

Lys Asp Val Leu Pro Pro Thr His His Asn Tyr Val Gly Tyr Asp Gly 225 230 235 240

Ser Leu Thr Thr Pro Pro Cys Asp Glu Arg Val Lys Trp His Val Phe

245 250 255

Thr Glu Pro Arg Thr Ile Thr Thr Gly Gln Leu Glu Lys Phe Leu Met

260 265 270

Ile Thr Lys Arg Gly His Thr Asp Ala Ile Val Thr Asn Asn Arg Ile

275 280 285

Val Gln Pro Ile Gly Arg Pro Leu Tyr His Tyr Lys Pro Thr Pro Ala

290 295 300

Ser Tyr Asn Tyr Ala Arg Lys Gly Ile Asp Trp Arg Glu Ala Gly Leu 305 310 315 320

Asp Asn Cys Ala Gly Asp Arg Gln Ser Pro Ile Asn Ile Asp Thr Thr

325 330 335

Asp Leu Gln Pro Gly Ala Val Ser Gly Ile Ser Leu Asn Gly Leu Glu

340 345 350

Ser Gln Ser Phe Thr Phe Thr Asp Ala Tyr Val Asn Leu Glu Gln Asp

355 360 365

Met Lys Val Ser Phe Thr Ala Pro Thr Asn Asn Leu Pro Thr Val Asn

370 375 380

Ile Asp Gly Asn Asp Glu Ser Phe Arg Pro Ile Gln Leu His Phe His 385 390 395 400

His Phe Ser Ser Glu His Thr Val Asp Gly Met Ile Tyr Pro Leu Glu

405 410 415

Ala His Leu Val Met Ala Ser Gln Ala Glu Asn Ser Asn Gln Leu Ala

420 425 430

Val Ile Ala Ile Phe Tyr Gln Tyr Gly Ser Glu Ala Asp Asp Phe Leu

435 440 445

Thr Arg Leu His Thr Glu Ala Ile Ser Ala Gln Gln Gly Asn Ala Asn

450 455 460

Trp Gly Asp Asn Asn Val Pro Ile Asn Leu Pro Ile Thr Phe Ala Thr 4 65 470 47 5 480

Asp Leu Met Pro Ser Ser Thr Glu His Trp Ala Tyr Glu Gly Ser Leu

485 490 495

Thr Thr Pro Pro Cys Asp Glu Arg Val Arg Trp Ile Val Met Lys Glu

500 505 510

Pro Arg Thr Thr Thr Ala Glu Gln Met Glu Thr Phe Lys Thr Ala Thr

515 520 525

Val Asn Ala His Tyr Ala Ala Glu Ile Val Asn Asn Arg Ala Ile Gln

530 535 540

Glu Arg Asn Ser Arg Pro Ile Ser Ser Ile Pro 545 550 55 5

<210> 100 < 211> 1125 <212 > DNA

<213> Chlamydomonas reínhardtii <4 00> 100

atggcgcgta ctggcgctct actcctggcc gcgctggcgc ttgcgggctg cgcgcaggct tgcatctaca agttcggcac gtcgccggac tccaaggcca gatcatagtc tcaatggcga gaactgggag ggcaaggacg tgcaagactg gccgcaagca gtcgcccatc aacgtgcccc aagggttcca agattgccac cggcctgcag acccagtggt aacggcagct cggttcaagt catcaacaac ggccacacca gactacgccg gccatgccac catcgccatc cctgccatgc gtggacgtgc tggagatgcg ccccaacgac gcctccgacc cagttccact tccactccac ctcggagcac ctgctggcgg ttgcacattg tgcacaaggt gactgacaag ctagaggcct gtcaccggca tcctgttcca gctcgacaac ggccccgata cgcgagggca ccttcaccaa cctgccggcg ggcaccacca cccagcgacc gcgactacgt cacctacgag ggcagcctca ggcctgctgt ggcacgtcat gacccagccg cagcgcatca taccgcctgg ctgtgggcga gaaggagtgc aactccacgg gacgccggcc atcatcacca ccaccaccgc cgcctgctgc gaggtgcctg ccgccacctc cgagcccaag cactacttcc gagaaccccg atgcttacac ctgcacgacc gttgcctttg cagtacgcca acggccgcac catcaagctg gcccgctacg <210> 101 <211> 380 <212> PRT

<213> Chlamydomonas reinhardtií <4 00> 101

Met Ala Arg Thr Gly Ala Leu Leu Leu Ala Ala

10 15

Cys Ala Gln Ala Cys Ile Tyr Lys Phe Gly Thr

25 30

Ala Thr His Thr Gly Asp His Trp Asp His Ser

40 45

Trp Glu Gly Lys Asp Gly Ala Gly Asn Pro Trp

50 55 60

Arg Lys Gln Ser Pro Ile Asn Val Pro Gln Tyr 65 70 75 80

Lys Gly Ser Lys Ile Ala Thr Gly Leu Gln Thr

85 90 95

Asp Leu Met Ser Asn Gly Ser Ser Val Gln Val

100 105 110

Thr Ile Gln Val Gln Trp Thr Tyr Asp Tyr Ala

ctcacacagg gcgcgggcaa agtaccatgt cgtaccctga tccaggtgca gcaaccagag gcgtgactgc gcaagatctt gcaagggcgg acgagctgct tcaagctggg ccaccccgcc gcttcggcca agaccgatgc acaaceacgc gccgcgtgat gccagaactt agtaa

egaecactgg cccctgggtc cctggacggg cctgatgtcc gtggacctac caaccgcatc cgtgcccacc tcctcttgag ctgcttcagc tgagcccacg tgagctgctg ctgcagcgag gtggaaccgc tgcccacgcg gcacctggag ggaggagacc ccgcaacgcc 1125

115 Ala Ile

130 Glu Met 145 Gln

120 125

Pro Ala Met Arg Asn Gln Ser Asn Arg

135 140

Arg Pro Asn Asp Ala Ser Asp Arg Val

Phe

Ala

Asp

Phe

Pro IE Cys 195

His 165 Leu 0

Lys

150 Phe

His

Glu

Ser 170 Leu His 185

Gly Gly Cys 200

155 Thr

Ile

Phe

Ser Glu 175 Val His

190 Ser Val 205

160 His

Leu

Lys Val Thr Gly

210 Pro Thr 225

Asn Gly Pro Asp Asn Glu Leu Leu Glu Pro 215 220

Glu Gly Thr Phe Thr Asn Leu Pro 230 235 240

Arg

Lys Leu Giy Glu Leu Leu Pro Ser Asp Arg Asp

245

Gly Ser Leu 260 Met Thr Gln

275

Leu Ala Val 290

250

Thr Thr Pro

265 Pro Gln Arg 280 Gly Glu Lys 2 95

Pro

Ile

255 Cys Ser

270 Ser Phe

Glu Gly Gly Gln

His Ala Asp Ala GIy His 305 310

285 Glu Cys

300 His His 315

Asn Ser Thr

His

His 320

His

Leu Ala Leu Ser Pro Asp Leu Asn Gly Val Cys Lys His Val Leu Gln Trp Ser Ile Asn Asn Gly His Ala Ile Val Asp Thr Ala Val Leu Ala Gly Thr Asp Lys Ile Leu Phe Ile Phe Ala Ala Gly Thr Tyr Val Thr Leu Leu Trp Trp Asn Arg Glu Thr Asp Arg Arg Leu

Ala Gly Ser Lys Glu Asn Thr Gly Asp Gly Tyr Pro Gly His Thr Ile Val Leu Pro Thr Lys Ile Leu Glu Gln Leu Asn Met Thr Ile Tyr Glu His Val Tyr Arg Ala Ala Leu His

120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 Asn His Ala His Leu Glu Glu Val Pro Ala Ala Thr Ser Glu Pro Lys

325 330 335

His Tyr Phe Arg Arg Val Met Glu Glu Thr Glu Asn Pro Asp Ala Tyr

340 345 350

Thr Cys Thr Thr Val Ala Phe Gly Gln Asn Phe Arg Asn Ala Gln Tyr

355 360 365

Ala Asn Gly Arg Thr Ile Lys Leu Ala Arg Tyr Glu

370 375 380

<210> 102 <211> 1134 <212> DNA

<213> Chlamydomonas reinhardtii <4 00> 102

atggcgcgta ctggcgctct actcctggtc gcgctggcgc tgcatctaca agttcggcac gtcgccggac tccaaggcca gaccatggcc tcaacggcga gaactgggag ggcaaggacg tgcaagactg gccgcaagca gtcgcccatc aacgtgcccc aagggttcca agattgccaa cggcctgcag acccagtggt aacggcacct cggtccaagt catcaacaac ggccacacca aactacgccg gccatgccac catcgccatc cctgccatgc gtggacgtgc tggagatgcg ccccaacgac gccgccgacc cagttccact tccactccac ctcggagcac ctgctggcgg ttgcacattg tgcaccaggt gactgagaag ctggaggcct gtcaccggca tcctgttcca gctcgacaac ggccccgata tttgcgaaca tgccctcgcg cgagggcacc ttcagcaacc aagctgggtg agctgctgcc cagcgaccgc gactacgtaa accccgccct gcagcgaggg cctgctgtgg cacgtcatga ttcggccagt ggaaccgcta ccgcctggct gtgggcctga accgccgcgg acgccggcca ccaccaccac caccgccgcc ctggaggagg tgcctgccgc cacctccgag cccaagcact gccgagtccg cgaaccccga tgcctacacc tgcaaggccg cgcaaccccc agtacgccaa cggccgcacc atcaagctgg <210> 103 <211> 37 7 <212> PRT

<213> Chlamydomonas reinhardtii <4 00> 103

Met Ala Arg Thr Gly Ala Leu Leu Leu Val Ala 10 15

Cys Ala Gln Ala Cys lie Tyr Lys Phe Gly Thr

25 30

Ala Thr Val Ser Gly Asp His Trp Asp His Gly

40 45

Trp Glu Gly Lys Asp Gly Ala Gly Asn Ala Trp

50 55 60

Arg Lys Gln Ser Pro Ile Asn Val Pro Gln Tyr 65 70 75 80

Lys Gly Ser Lys Ile Ala Asn Gly Leu Gln Thr

85 90 95

Asp Leu Met Ser Asn Gly Thr Ser Val Gln Val

100 105 110

Thr Ile Gln Val Gln Trp Thr Tyr Asn Tyr Ala

115 120 125

Ala Ile Pro Ala Met His Asn Gln Thr Asn Arg

130 135 140

Glu Met Arg Pro Asn Asp Ala Ala Asp Arg Val

ttgcgggctg ccgtttcggg gcgcaggcaa agtaccaggt cgtaccctga tccaggtgca acaaccagac gcgtgactgc gcaagatcta gcaagggcgg acgagctgct tgccggcggg cgtacgaggg cccagccgca aggagtgcaa tgctgcacaa acttccgccg ttgcctttgg cccgctatca

cgcgcaggct 60 tgatcactgg 120 cgcctgggtt 180 cctggacggg 240 cctgatgtcc 300 gtggacttac 360 caaccgcatc 420 cgtgcccacc 480 tccccttgag 540 ctgcttcagc 600 tgagcccatc 660 caccaccatc 720 cagcctcacc 780 gcgcatcagc 840 ctccacggag 900 ccacgcgcac 960 cgtgatgctg 1020 ccagaacttc 1080 ctaa 11 34

145

150

155

160

Gln Phe His Phe His Ser Thr Ser Glu His Leu

165

170

17 5

Tyr Pro Leu Glu Leu His Ile Val His Gln Val 180 185 190

Phe Ser Val Thr Gly 205

Ala Cys Lys Gly Gly Cys 195 200

Leu Ala Ser Pro Leu Asn Val Cys Gln Val Gln Trp Ile Asn Gly His Ile Val Thr Ala Leu Ala Thr Glu Ile Leu

Leu Ala Gly Asp Ser Lys Gly Glu Asn Lys Thr Gly Leu Asp Gly Ser Tyr Pro Asn Gly His Ala Thr Ile Asp Val Leu Val Pro Thr Gly Lys Ile Lys Leu Glu Phe Gln Leu 270

Ie Ser Phe Gly Gln 285

Asp Asn Gily Pro Asp Asn Glu Leu Leu Glu Pro

210 215 220

Pro Ser Arg Glu Gly Thr Phe Ser Asn Leu Pro 225 230 235 240

Lys Leu Gly Glu Leu Leu Pro Ser Asp Arg Asp

245 250 255

Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Gly

260 265

Met Thr Gln Pro Gln Arg

275 280

Leu Ala Val Gly Leu Lys Glu Cys Asn Ser Thr

290 295 300

Ala Gly His His His His His Arg Arg Leu Leu 305 310 315 320

Leu Glu Glu Val Pro Ala Ala Thr Sei Glu Pro

325 330 335

Arg Val Met Leu Ala Glu Ser Ala Asn Pro Asp

340 345 350

Ala Val Ala Phe Gly Gln Asn Phe Arg Asn Pro

355 360 365

Arg Thr Ile Lys Leu Ala Arg Tyr His

370 375

<210> 104 <211> 810 <212> DNA

<213> Physcomitrella patens <4 00> 104

atggcgagcc aacttgtgca ggcagtggcc gctgttgtgg agctgggttg gcgcgtgggc aggatcggct caggctgagg gactacagcg gtgggtcgca tgggccaggt ggctggggtg gtgtgcaagt cgggcagccg gcagtccccg atcgccatca gaccgcagtc tggggaagct ggatgccaag taccggaaga aacagcgggc atggggctga ggtgagcatg ccagccggct ggcgagacgt accgacccgt ccagttccac atccacatgc aaccagagtt tcccgctgga gctccacttg gtgcacaagt gtgatcgggt tcctgtttga ggaaggaggc gagagcgaat gaggtgccat cgtcaaatag cccaggcgtg aaggtcgact aagccggaga ggaactacgg cacttacatg ggatccctca ggtgtcacct ggattctgtc gttgttcaac tttcaaacgg aagctccggg cttctgtgcc gaagggacac aacaaccgtc aggggtttcc gcatgcgcac caacgcttga <210> <211> <212> <213> <4 00>

Ile Phe Ala Ala Gly Thr Tyr Val Thr Leu Leu Trp Trp Asn Arg Glu Thr Ala His Asn His Lys His Tyr Ala Tyr Thr Gln Tyr Ala

Asn Met Thr Ile Tyr Glu His Val Tyr Arg Ala Asp Ala His Phe Arg Cys Lys Asn Gly

ttctgcaatg gaggtgacga acctgaaggc cggcgctcga gagttcatgc cgggacgctt ccagcgagca ccgatgatgg tcctggccca tggggcacat ccaccccacc cgtccgcgga caaccttcgg 810

catctccgca ggtgcactgg cgagtggggt cctggtcaca cactctttac gaggatcggt cacaatcatg gaagcttgcg gttcgcacat caagatgatg atgcgcggag acagctggct cagcgccgga

105 269 PRT

Physcomitrella patens 105

Met Ala Ser Gln Leu Val Gln Ala Val Ala Ala

10 15

Cys Ile Ser Ala Ser Trp Val Gly Ala Trp Ala

25 30

Glu Gly Gly Asp Glu Val His Trp Asp Tyr Ser

40 45

Pro Gly Gly Trp Gly Asp Leu Lys Ala Glu Trp

50 55 60

Gly Ser Arg Gln Ser Pro Ile Ala Ile Thr Ala 65 70 75 80

Asp Arg Ser Leu Gly Lys Leu Asp Ala Lys Tyr

85 90 95

Ala Thr Leu Tyr Asn Ser Gly His Gly Ala Glu

100 105 110

Gly Ser Gly Arg Leu Arg Ile Gly Gly Glu Thr

115 120 125

Phe His Ile His Met Pro Ser Glu His Thr Ile

Val Val Gly Ser Gly Gly Gly Val Leu Asp Arg Lys Val Ser Tyr Arg Met Asn

Val Leu Gln Ala Gln Ala Ser His Gly Cys Lys Ser Leu Val Thr Arg Val His Met Pro Ala Pro Val Gln Gln Ser Phe

60 120 180 240 300 360 420 480 540 600 660 720 780 130

Pro Leu Glu 145 Val

Gln

Asp

Tyr

Ile Gly 165 Phe Ala 180 Leu Gly 195 Met

135 Leu Hls 150 Phe

His

210 Ile Leu 225

Lys Leu

Gly

Ser

Leu

Glu l: Ile 200 Leu

Ser

215 Leu Phe 230

Ala Ser

Leu

Phe 17 0 Val 55

Lys Thr Asn

140 Val His 155 Glu

Glu

Pro

Met

Gly 175 Ser Ser

190 Met Lys 205 Pro

Gly Ser

<210> <211> <212> <213> <4 00> aaatagagaa gggagaaat t tttagttctc tgatagtata attcaatttt actacagttt gccacaaaac ctcttcccgt ttcaaacttg ctctcaagaa agaagatcac tcgaacgaat ctttgtatgg actcacgagt gtaatatcgc ccattgaata catgtggtgg tcatagagga aaagttcagc tagcaaacct tgaagggagg gaatttcccc catcacaaac tactcttatt ttcattatcc gctgaagttg <210> <211> <212> <213> <4 00> Met Gly

Val 250

Gly Arg Gly 2 65

Arg 245 Ala 260 106 1519 DNA

Arabidopsís 106

gctcttcaag gcatgtgtaa ttcttcttct attaagttgt; gtaaagaagc ctcgaaatgg agtataaata tccatttatc gtataaactg gcttctcatt ggcggagctt: taaggaaggc tgagctcgcc gtgcccatca caatatggtt cgctgtcttg catcaagggg ttgggtcaaa atttgaagac. attgacatat ctactatgac cgttcattct atcatcatcg taattgctac agttataaaa ctttgattt 107 259 PRT

Arabidops is 107

Glu Ser

Thr 220 Phe Gln 235

Pro Lys Phe Arg

Lys Ser Asp Asp Gly Lys Leu Ala 160

Gly Glu Ser Glu Phe Leu Ala Asn Ser Pro Gly Val Lys Val Pro Glu Arg Asn Tyr Gly Thr Pro Cys Ala Glu Gly Val Thr Trp Ser Ala Glu Gln Leu Ala Asn Asn Arg Pro Thr Phe Arg Thr Asn Ala

Thr

Gly 255 Met

Ala 240 His

thaliana

tatccgatgt tcataaaatg tttttcgtca ttgtaataat tctacatgtt ctcatcagac tccttctctt cgcaaacgga agaaggatgg gagaaggatg caggcagcct ttcgtcacct aaaggtcaaa cacgtactag cctccttttg caccttaagg cttatgtcat atctgtttac caatgtggcc ccatttgtga tttgttaatg atatgaacta tcgtcatcat ttgtaatggt taaataaata

thalíana

ttttgtttaa tagatgttag ttacaatctc ctgtacaaag ccttgctctg tcagagacga cgtccctctc gcttgttttc gaaacgaatc atctgaagga cgtcatcgga tcaagaagga gcccaaagta acttccatcc acaaggtcaa tggaaaacat ttcctcttga cagcaaagtc gatgcgaaag gagaaggagt gctcctttga acacatcacc catgatcagc atacatttac aatcatgttt

tcaacaagag cttcgtcgtt tttcttaatt atgttgtgtt taaacatggt ctctccaatc atcgcctgtc ggtgcacctg atatgaagac tgtagctgcg cagcaaatct gaaatacgag catggtgttt tggagatgcc atatgcagga tgtggtgata cggaaacaac aaaagttttg ggaggcagtg tgtgaaagga gctttgggag atcaccatcg atcttcatat ttgcgatgag actttcacag 1519

gcggagatac tttactatag tacttcttct ctcataaaaa ccccttttgg tgcttcaaaa tctcctcttc cttcagccac gccatcgaag gccaaggtga tttgatcccg accaatcctg gcttgttcgg ttcgtggttc gttggagccg gggcacagtg tctactgact gcagaaagtg aatgtgtcac acacttgctt ctccagtttg ctaccaccac ataaatgttt cttcttttcc atatcgtttt

1

Leu Lys

Ile

Asn

5

Glu

Lys

Phe 50

Glu Lys 65

20 Ile Thr 35

Asp Pro

Tyr

10

Asp Asp

25

Ala Glu Leu 40

Val Glu

Glu

Leu

Asp Ala 15

Lys Asp 30

Tyr

Glu 70

Thr

Arg

Asn 75

Gln Ala 45

Ile Lys 60

Pro Ala

Ile Glu Ala Leu Lys Lys Leu Val Ala Ala Ala Lys Val Lys Ala Ser Ser Ser Asp Ser Lys Ser Val Thr Phe Lys Lys Glu Leu Ala Lys Gly

Glu

Leu 80

Gly Phe Tyr Gly

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 Gln Ser Pro 85

Pro Ser His 100

Asn Ile Ala 115

Val Gly Ala

130 Ile Val Val 145

Ser Phe Pro 165

Val Lys Ile 180

Ser Ser Ala 195

Asn Val Ser 210 Val Val Lys 225

Asn Gly Ser 245

His Ser Ile

Lys Tyr Met 90

Val Leu Asp 105

Asn Met Val 120

Ala Ile Glu

135 Ile Gly His 150

Leu Asp Gly 170

Cys Leu Pro

185

Phe Glu Asp 200

Leu Ala Asn

215 Gly Thr Leu 230

Phe Glu Leu 250

Val Phe Ala 95

Phe His Pro 110 Pro Pro Phe 125

Tyr Ala Val

140 Ser Ala Cys 155

Asn Asn Ser 175

Ala Lys Ser 190

Gln Cys Gly 205

Leu Leu Thr 220 Ala Leu Lys 235

Trp Glu Leu 255

Cys Ser

Gly Asp

Asp Lys

Leu His

Gly Gly 160

Thr Asp

Lys Val

Arg Cys

Tyr Pro

Gly Gly 240

Gln Phe

Asp Ser Ala Phe Val Lys Leu Lys Ile Lys Phe Ile Leu Ala Glu Arg Phe Val Tyr Tyr Gly Ile

Arg Val Cys Val Val Arg Tyr Ala Gly Val Glu Asn Gly Leu Met Glu Asp Trp Glu Ser Glu Glu Ala Val Arg Glu Gly Asp Phe Val Ser Pro Val

<210> <211> <212> <213> <400> atgggatccc gaagggcgta gtgagctctg tacaactatg agcaagcaga gggaccgcgg

108

1770

DNA

Dunaliella salina 108

gccgcatcac ccctgcttac tggtagctgg agaaagttgg gcccaatcaa atgacacttc

ctgaccagcg aagtggcaat gatgaagact tgcctcaact

cctcttgggg acacaacctg ttctgcaggc ctttgattgg cattgagact acgcctggcc caacctggag tactattggt cagcgagcac ccagaatgac agatcctttc aaatgtggag cctgacctac gtggcatgtg

atccactttc accactttgc gcccacatgg tgatggcatc atgtacaagt acggggaaga aatggcgaag ctgccgacaa gatttgctgc ctgagtcaga ggttgtgatg agcgagtgaa cagctcaagg tgttttcaga ggtcacgctg aaccgtgtca ttcagccgct caatggcagg gacaagtaca actatgtcca gcatggcttt gctggcgacg tccagagccc tattgacatc cggagtgatg tttctagtgt caacctgaat ggcaacactg tgaatattgg gcaaggcatg gacctgcccg tcatcagaat tggtactagg tggcacttct ttttgagtga gcacactgtg attgttatga aggacaatga caaccttggt attatgtaca agtacggcga tgcagacccc gataaaattg catcaggtgc catcacctat gatgatccct tcaatgtcaa catcaagaat ggctacgatg gcagcctgac cacccctcct ctggagccta ggactgtttc agtggagcag tctaatccag gtgcgaccgt gacaaccaac gtgtacggat ataacggtgc tgctgcttaa

< 210 > 109 <211> 589

< 212 > PRT

<213> Dunaliella salina

gctctgttcg aaggccgagg aggcagttgc acgggggggg gacagcctgg ttgaagggcc caggatatgc ggggttgtcc gctattgacg ggctctgacc ctcaaaaggc ctgaactcgt tatggatatg ttcaaggagg gctgcccacc aaggtctacg gactggcgcg gtgaccagca gacttgaaca caaatcaatt gacgtcactt gatggagtgc gattctgccg ttcattactg ggacaatcag aatttcctgc tgctctgaga atggaggtct: cgaatgatcc

ctgtcctggc ctgctgagac tggtgagtga tctgcgtcaa ctgaggaatc tactgtcttc agttttcttt acaccttcaa gccagcttta agcttgctgt tgcaagaaac tttccatcaa ■atggtagctt caaggactgt ctgaagctac agtacaaggg ataatggctt ctttgcaagc ccgacgcgtt ttggtgaccc tcaggcccct actaccccct gccagcttgc atatgcagaa gagtgtctct cctctgagct ttgtgaagtg ttgcagatgt agccactgga 17 7 0

ggtcgcaatc agtggatgca gcctcacgac taccgggacc agagaggctg atcctaccag taatgcgcct gcctgtgcaa tcctcttgag cattggcatc tgcacagagc tgtggccagg gactaccccc ctcagtggcg ggttaccaac tgaacccaac ggatagctgt tggatcttct cacgctgacc ccctgcgggt ccaggtgcac ggaagctcat tgtcatcggt gagggtgtca gaacaatcct tggatatgct gcatgtgttc gactctgaac gggtaggact

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 <4 00> 109

Met Gly Ser Arg Arg Ile Thr Leu Leu Gly Ala Leu Phe Ala Val Leu 1 5 10 15

Ala Val Ala Ile Glu Gly Arg Thr Leu Leu Thr His Asn Leu Lys Ala

25 30

Glu Ala Ala Glu Thr Val Asp Ala Val Ser Ser Val Val Ala Gly Ser

40 45

Ala Gly Arg Gln Leu Leu Val Ser Glu Pro His Asp Tyr Asn Tyr Glu

50 55 60

Lys Val Gly Phe Asp Trp Thr Gly Gly Val Cys Val Asn Thr Gly Thr 65 7 0 7 5 8 0

Ser Lys Gln Ser Pro Ile Asn Ile Glu Thr Asp Ser Leu Ala Glu Glu

85 90 95

Ser Glu Arg Leu Gly Thr Ala Asp Asp Thr Ser Arg Leu Ala Leu Lys

100 105 110

Gly Leu Leu Ser Ser Ser Tyr Gln Leu Thr Ser Glu Val Ala Ile Asn

115 120 125

Leu Glu Gln Asp Met Gln Phe Ser Phe Asn Ala Pro Asp Glu Asp Leu

130 135 140

Pro Gln Leu Thr Ile Gly Gly Val Val His Thr Phe Lys Pro Val Gln 145 150 155 160

Ile His Phe His His Phe Ala Ser Glu His Ala Ile Asp Gly Gln Leu

165 170 175

Tyr Pro Leu Glu Ala His Met Val Met Ala Ser Gln Asn Asp Gly Ser

180 185 190

Asp Gln Leu Ala Val Ile Gly Ile Met Tyr Lys Tyr Gly Glu Giu Asp

195 200 205

Pro Phe Leu Lys Arg Leu Gln Glu Thr Ala Gln Ser Asn Gly Glu Ala

210 215 220

Gly Asp Lys Asn Val Glu Leu Asn Ser Phe Ser Ile Asn Val Ala Arg 225 230 235 240

Asp Leu Leu Pro Glu Ser Asp Leu Thr Tyr Tyr Gly Tyr Asp Gly Ser

245 250 255

Leu Thr Thr Pro Gly Cys Asp Glu Arg Val Lys Trp His Val Phe Lys

260 265 270

Glu Ala Arg Thr Val Ser Val Ala Gln Leu Lys Val Phe Ser Glu Val

275 280 285

Thr Leu Ala Ala His Pro Glu Ala Thr Val Thr Asn Asn Arg Val Ile

290 295 300

Gln Pro Leu Asn Gly Arg Lys Vai Tyr Glu Tyr Lys Gly Giu Pro Asn 305 310 315 320

Asp Lys Tyr Asn Tyr Val Gln His Gly Phe Asp Trp Arg Asp Asn Gly

325 330 335

Leu Asp Ser Cys Ala Gly Asp Val Gln Ser Pro Ile Asp Ile Val Thr

340 345 350

Ser Thr Leu Gln Ala Gly Ser Ser Arg Ser Asp Val Ser Ser Val Asn

355 360 365

Leu Met Thr Leu Asn Thr Asp Ala Phe Thr Leu Thr Gly Asn Thr Val

370 375 380

Asn Ile Gly Gln Gly Met Gln Ile Asn Phe Gly Asp Pro Pro Ala Gly 385 390 395 400

Asp Leu Pro Val Ile Arg Ile Gly Thr Arg Asp Val Thr Phe Arg Pro

405 410 415

Leu Gln Val His Trp His Phe Phe Leu Ser Glu His Thr Val Asp Gly

420 425 430

Val His Tyr Pro Leu Glu Ala His Ile Val Met Lys Asp Asn Asp Asn

435 440 445

Leu Gly Asp Ser Ala Gly Gln Leu Ala Val Ile Gly Ile Met Tyr Lys

450 455 460

Tyr Gly Asp Ala Asp Pro Phe Ile Thr Asp Met Gln Lys Arg Val Ser 465 470 475 480

Asp Lys Ile Ala Ser Gly Ala Ile Thr Tyr Gly Gln Ser Gly Val Ser 485 490 495 Leu Asn Asn

500 Leu Pro Ser

515 Pro Pro Cys

530 Thr Val Ser 545

Ser Asn

Pro Asp Asp Pro Phe Asn

505 510

Glu Leu Gly Tyr Ala Gly

520 Ser Glu

535 Val Glu 550 Gly

525

Ile Val Lys 540

Gln Met Glu

555 Thr Val Thr 570

Val Tyr Gly Tyr Asn 585

Ala

Pro 565

Glu Gly Arg Thi

580 <210> 110 <211> 693 <212> DNA

<213> Arabidopsis thaliana <400> 110

Val Asn Ile Lys Asn Asn Phe Tyr Asp Gly Ser Leu Thr Thr Trp His Val Phe Leu Glu Pro Arg Ala Asp Val Thr Leu Asn Arg Met Ile Gln Pro Leu Gly Ala Ala Ala

Val

Thr

575

Phe 560 Asn

atgaagatta tgatgatgat cctgcagatg ctcagacaga caatggggac acttaaaccc attgatattc aaaggaggca tactacttca caaacgcaac gagggagcag gagatgtgat cacactcctt ctgaacatca caccaagcaa aagatggaag gagcctttcc tctctcagat gggaaccaca cagcacaagt actcgaaagt actacagata tcttggacca tccttggcaa <210> <211> <212> <213> <4 00> Met Lys 1

taagctctgc aggagtagtg tcacttcacc aatattttac actagtgaac aatagaaaac cctccatgga ctttgctgtg gaaggagaaa ggaagtagga cattggttca ggtaatcttt

ttcttctcca tttggatata acatgcgcgg aaccacaaat cacgtctgta aagaactata gtccaatatg gtggcaagtc ttggtgaagc agaatcgaca ctcactactc taa

Tyr

115 His Gly

130 Asp Gly 145 Glu

Glu

100

Thr Leu

Pro

Asp

Val

Ser

Phe 165 Leu

iO

Arg

Arg 1

Thr 195 Gly Ser 210 Leu Gly Lys

105

Leu Gln Met 120

Gln Tyr Ala 135

Phe Ala Val 150

Leu Ser Gln 170

Lys Gly Asn

His

125 Ala Glu

140 Val Ala 155

Met Lys

110 Trp His

Ser

Leu 160 Lys

Leu

tgtccctcat aaggcaaaaa tcggtaaatt tgaattcaat atgttgccat ccttactgca cagctgagct tcttcaaaat taaaggaaga caagacacat ctccttgctc 6

ctgcattgca tggaccaaac gcaatctcca acaccgtgaa gttcttcggg aatgcattgg gcacatggta cggcactgaa gagactcaaa tgaacgtaag cgagaacgtt 93

111 284 PRT

Arabidopsis thaliana 111

Ile Met Met Met Ile Lys Leu Cys Phe 10 15

Ile Cys Ile Ala Pro Ala Asp Ala Gln Thr Glu

25 30

Tyr Lys Gly Lys Asn Gly Pro Asn Gln Trp Gly

4 0 4 5

Phe Thr Thr Cys Ala Val Gly Lys Leu Gln Ser

50 55 60

Arg Arg Gln Ile Phe Tyr Asn His Lys Leu Asn 65 70 75 80

Tyr Tyr Phe Thr Asn Ala Thr Leu Val Asn His

85 90 95

Met Phe Phe Gly Glu Gly Ala Gly Asp Val Ile

Thr Pro

Leu His Met

Phe

Leu

Glu 175

His Thr Ala Gln Val 185 190

His Ile Glu Arg Lys Thr Arg Lys

200 205

Thr Thr Pro Pro Cys Ser Glu Asn

215 220

Val Arg Ser Met Ser Lys Glu Gln

Phe Ser Met Gly Val Val His Leu Asn Pro Ile Asp Ser Ile His Val Cys Asn Ile Glu Asn Ser Glu His Val His Gln Lys Ile Gly Val Lys Leu Glu Val Gly Tyr Tyr Arg Val Ser Trp Val Glu Leu

Ser Leu Phe Gly Pro His Ile Gln Arg Glu Val Ala Lys Asn His Leu Ala Lys Thr Glu Lys Glu Arg Ile Tyr Ile Thr Ile Leu Arg

60 120 180 240 300 360 420 480 540 600 660 225 Ser

Pro

230 Asp

235 Phe

Lys

Glu

Lys

Asn 255 Met Phe

270 Lys Lys

Leu Asp Thr Ser 245 250

Leu Asn Gly Arg Arg Val

260 265

Lys Lys Glu Thr Gly Asn

275 280

<210> 112 <211> 1053 < 212 > DNA

<213> Arabidopsís thalíana <400> 112

atgaagatat catcactagg atgggtctta tcgagtgcac cagcacctaa aaacctaagc ccacaccagc cctcctaaac ctaagcctgc cctacacctc ctaaacctaa ccagcaccta cacctcctaa aaacctaaac ctgcacctaa agctacgaga cgaaaggaaa aaaatgtgtg gaataggcaa gttagtaata aatttggatt: aacagaggtc atgatatcat atccgtggta ctagatatca atcaatggca aaaggtttgc tacgctgttg tcgcattctt gaaaaacaat tgaagaagat tcaagtaaac aagtgaagct aggccgcttc aagcagtcaa atgaagaaat actgtaatat <210> 113 <211> 350 <212> PRT <213> Arabidopsis <4 0 0> 113 Met Lys Ile Ser Ser 1

Ile

240 Asn

Ser

His Asp Lys Pro

Arg Pro Cys Gln Pro His Glu Arg Val Asp Asn

acctcctaaa acctacacct accagcacct gcccaaacca acctaagcct accagcacca caaggggcca aatgcaatct gcttcgtagc gttgaaattc acttcaacaa gctagaggaa atacaatctc aactgataca tctccgtgtg taagcgcaag aagttcttac

thaliana

gtccttatct cctaagcctg cctaaaccta acacctccta gcacctacac gcaccagcac ggtggagaag gcgaaatggg cctattgatc cagtatctgc aaaggaggaa cttcattggc cacttggttc ggagcatctg catgcgtccg gctgtacacg gtatatttat tag

tcatctctat caccagcacc agcccaaacc aacctaagcc ctcctaat cc cagcaccaac ttgaggacga gaacactaga ttcgggacaa cttctaatac ataaaggtat actctccttc atgagagcaa acccttttct aggaacatat atgcttcaga acaaaccaaa

1053

ta ccattgtt 60 tacacctcct 120 agcacctaca 180 cgcaccagca 240 taagcccaca 300 accagcaccg 360 aaccgagttt 420 tgcagagtgg 480 aaatgtggta 540 caccattaag 600 tggtgtcact 660 cgaacataca 720 agataaacgc 780 cttttcgttg 840 tcgcactgtg 900 ttcaaatgcc 960 ggttaagtta 1020

Ile 5

Thr Ile 20

Pro Ala Pro 35

Pro Pro

55

AIa Pro 70

Thr Pro Pro 85

Pro Lys Pro 100 Pro Ala

Thr

50 Lys Pro 65 Pro

Val Ser 25

Ala Pro 40

Lys Pro

Ala

Leu Gly Trp Val Leu Val 15

Ser Ala Pro Ala 30

Thr Pro Pro Lys Pro 45

Lys Pro Lys 60

Thr Pro

Pro Lys Lys Pro Ala Pro

Ala

115

Ala Pro Gly 130

Lys Gly Asn 145 Lys

Lys

Leu

Thr

Pro

Lys

Met Cys 165 Asn Val 180 Pro Ser 195

Phe Lys

Lys

90

Pro Ala

105 Thr Pro 120

Gly Glu Val

135 Lys Gly 150 Gly

Pro

75 Pro Lys

Pro 80 Lys

Pro

Ala

Pro

Ile

Glu

140 Ala Lys 155 Lys

Pro 95

Thr Pro 110 Pro Lys 125 Asp

Lys Pro

Pro Ala

Pro

Lys Lys

Glu Thr Glu

Trp

Val

210

Val

lí

Asn Thr 200 Gly Gly 215

Gly Lys Met Gln 17 0 17 5

Ser Asn Lys Phe 190

Thr Ile Lys Asn 205

Asn Lys Gly Ile 220

Gly 160 Ser

Thr

Pro

Leu

Gly Arg

Gly Val

Gly

Leu Ile Pro Pro Pro Thr Thr Pro Lys Pro Pro Thr Pro Lys Pro Ala Phe Ser Leu Asp Ile Asp Leu Arg His Asp Thr Ile

Phe Ile Ser Lys Pro Lys Pro Ala Pro Pro Lys Pro Ala Pro Ala Pro Pro Asn Pro Ala Pro Pro Lys Pro Tyr Glu Thr Ala Glu Trp Leu Arg Asp Ser Gln Tyr Ile Met Leu Arg Gly Thr Arg Tyr Gln Leu Gln Gln Leu His Trp His Ser

225 230 235 240

Ile Asn Gly Lys Arg Phe Ala Leu Glu Glu His

245 250 255

Lys Asp Lys Arg Tyr Ala Val Val Ala Phe Leu

260 265 270

Ser Asp Pro Phe Leu Phe Ser Leu Glu Lys Gln

275 280 285

Asp Thr His Ala Ser Glu Glu His Ile Arg Thr

290 295 300

Val Lys Leu Leu Arg Val Ala Val His Asp Ala

305 310 315 320

Arg Pro Leu Gln Ala Val Asn Lys Arg Lys Val

Pro Ser Glu His Thr Leu Val His Glu Ser Tyr Asn Leu Gly Ala Leu Lys Lys Ile Thr Val Ser Ser Lys Gln Ser Asp Ser Asn Ala Tyr Leu Tyr Lys Pro

325

330

335

Lys Val Lys Leu Met Lys Lys Tyr Cys Asn Ile Ser Ser Tyr

340 345 350

<210> 114 <211> 834 <212> DNA

<213> Arabídopsis thaliana <4 00> 114

atgaaaacca ttatcctttt tgtaacattt cttgctcttt gagacagaga ctgaatttca ttacaaaccc ggtgagatag agtatcaagg ctgaatggaa aatttgcggg acagggaaga actccaaaaa tagctcgcat tgttcacaat tctacagaga cctgtagagg ctattcttaa gaaccgtgga ttcgacatga gcagggaaga tcgtgatcaa tgataccgac tataaattgg ccttcagagc attttctcga tggacagagg ttggcaatgg agtgtagaag ggcacttggc agtgattgga gttctcttca ttcatttcgc ggatcatgga caagatccat aagatcgcag agcatcggaa agatagatcc aagagaattt ggatgggatc agaggttctc tcacgactcc tccttgcacg gaagatgtca gtggggactg tttcacgtga gcaaattgat gtattgacag gagaagaacg cgagaccagc tcaacctctg aacggacgtc tccagtccaa gtccaactcc acggctaaga ataccacgag <210> <211> <212> <213> <4 00>

cttcttcatc ccgatccctc ggcaatcgcc ttcttcagac aggttaagtg ttcaaagcca aacttcacat gagaaggaga acgtacaaga ttacaaagtt tgtggaccat atgctcgtcg tggtttattt ttggtccggt

tctagccgat gaaatggagc aatcaatctt atattacaaa ggaagacgat ctggcacgca ggtacacaaa accaaatgct tggagaggtc ttatgaatac catcaacaag cggtggttat aaacgagcag ctaa

60 120 180 240 300 360 420 480 540 600 660 720 780

834

115 277 PRT

Arabídopsis thaliana 115

Met Lys Thr Ile Ile Leu Phe Val Thr Phe Leu

10 15

Ser Leu Ala Asp Glu Thr Glu Thr Glu Phe His

25 30

Ile Ala Asp Pro Ser Lys Trp Ser Ser Ile Lys

40 45

Cys Gly Thr Gly Lys Arg Gln Ser Pro Ile Asn

50 55 60

Ala Arg Ile Val His Asn Ser Thr Glu Ile Leu 65 70 75 80

Pro Val Glu Ala Ile Leu Lys Asn Arg Gly Phe

85 90 95

Trp Glu Asp Asp Ala Gly Lys Ile Val Ile Asn

100 105 110

Leu Val Gln Ser His Trp His Ala Pro Ser Glu

115 120 125

Gln Arg Leu Ala Met Glu Leu His Met Val His

130 135 140

His Leu Ala Val Ile Gly Val Leu Phe Arg Glu 145 150 155 160

Phe Ile Ser Arg Ile Met Asp Lys Ile His Lys

165 170 175

Asp Gly Glu Val Ser Ile Gly Lys Ile Asp Pro

Ala Leu Tyr Lys Ala Glu Leu Thr Gln Thr Asp Met Asp Thr His Phe Lys Ser Gly Glu Ile Ala A.rg Glu

Ser Ser Ser Pro Gly Glu Trp Lys Ile Pro Lys Ile Tyr Tyr Lys Lys Val Lys Asp Tyr Lys Leu Asp Gly Val Glu Gly Pro Asn Ala Asp Val Gln Phe Gly Trp Asp

Lys

180 Leu Thr 195

Cys Thr Glu 210 Ser Arg Glu 225

Lys Asn 245 Asn Glu 260 Val Gly 275 <210> 116 <211> 825 <212> DNA

<213> Nicotiana langsdorffii χ <400> 116

Glu

Leu

Arg

185 Phe Tyr 200 Asp Val Met 215

Gln Ile Asp 230

Arg Pro 250 Ser Ser

265 Val

Ala

Gln

190

Glu Tyr Arg Gly Ser Leu Thr Thr Pro Pro 205

Trp Thr Ile Ile Asn Lys Val Gly Thr Val 220

Val Leu Thr Asp Ala Arg Arg Gly Gly Tyr 2 35 24 0

Ala Gln Pro Leu Asn Gly Arg Leu Val Tyr 255

Pro Ser Pro Thr Pro Arg Leu Arg Ile Pro 270

Pro

Nicotiana sanderae

atgaggatgg cagcaataac tttcttgcaa ggtccggaga gagaatggac cagctaattg ttgcagtctc ctattgatat cttcaaaagg actacaaacc ttgagattgg atgatggagg ttgcattggc acacaccttc catttggtac: atgaaagtaa ggattatggc ctgatccctt aaaaaaggta tagagagagg aaaaaatatt ttaggtatat tggataattg atagaaaggt gctgttcatg atggatttga atcaactcaa cataccattc <210> <211> <212> <213> <4 00>

caaaatgttg agttgatgat gggcaatatt ttttgacttg atcgaatgcc atacttgaag tgaacacact taatggaaag cttatctatg cattggaatt tggctcact L aaaaactgta aaccaacgct ctttggtatt 117 274 PRT

Nicotiana langsdorffii χ

ttcatttcgt gagagtgaat cgtccagatt agggctgaag actctcttga ataaatgaaa atcaatggag tttgttgtca atagagaacg attgatccaa acaacacctc accagaagac agaccaactc gaaaagcagc

ttcttttcct ttcaagtgta 60

ttagttacga tgaaaaaagt 120

ggaaagaatg tagtggcaaa 180

tagtttcaaa cttgagaata 240

acagaggtca tgatataatg 300

ctcaatatca actcaagcaa 360

aaaggtttaa tttggaggct 420

ttggaatagt ctacgagatc 480

atttgaaagt tcctgctaat 540

atcaaataaa attggatggc 600

cttgcaccga aggtgttgtc 660

aaataaaact actccaagaa 720

aaccagaaaa cgaacgttat 780

agtga

825

Nicot iana sanderae

Leu Phe Ile Ser Phe Leu Phe

117

Met Arg Met Ala Ala Ile Thr Lys Met

10 15

Leu Ser Ser Val Phe Leu Ala Arg Ser Gly Glu Val Asp Asp Glu Ser

25 30

Glu Phe Ser Tyr Asp Glu Lys Ser Glu Asn Gly Pro Ala Asn Trp Gly

40 45

Asn Ile Arg Pro Asp Trp Lys Glu Cys Ser Gly Lys Leu Gln Ser Pro

50 55 60

Ile Asp Ile Phe Asp Leu Arg Ala Glu Val Val Ser Asn Leu Arg Ile 65 70 75 80

Leu Gln Lys Asp Tyr Lys Pro Ser Asn Ala Thr Leu Leu Asn Arg Gly

85 90 95

His Asp Ile Met Leu Arg Leu Asp Asp Gly Gly Tyr Leu Lys Ile Asn

100 105 110

Glu Thr Gln Tyr Gln Leu Lys Gln Leu His

115 120 125

His Thr Ile Asn Gly Glu Arg Phe Asn Leu

130 135 140

Glu Ser Asn Asn Gly Lys Phe Val Val Ile 145 150 155 160

Gly Leu Trp Pro Asp Pro Phe Leu Ser Met

165 170 175

Val Pro Ala Asn Lys Lys Gly Ile Glu Arg

180 185 190

Pro Asn Gln Ile Lys Leu Asp Gly Lys Lys 195 200 205

Trp His Thr Pro Ser Glu Glu Ala His Leu Val His Gly Ile Val Tyr Glu Ile Ile Glu Asn Asp Leu

Gly Tyr

Ile

Gly Phe Arg Tyr

Ile Ile

Ile

Lys Asp Gly Ser Leu Thr Thr Pro Pro Cys Thr Glu Gly Val Val Trp Ile Ile Asp

210 215 220

Arg Lys Val Lys Thr Val Thr Arg Arg Gln Ile Lys Leu Leu Gln Glu 225 230 235 240

Ala Val His Asp Gly Phe Glu Thr Asn Ala Arg Pro Thr Gln Pro Glu

245 250 255

Asn Glu Arg Tyr Ile Asn Ser Thr Tyr His Ser Phe Gly Ile Glu Lys

260 265 270

Gln Gln

<210> <211> <212> <213> <400> atgtcggccg aagaaagcgt tcgtcgtcgt gctgctcccg

118 993 DNA

Flavería bídentís 118

cctctgcttt ctacttcagc cgtcttcgtc cgcccatcat

gaagccattg acgcgctcaa gctacaagaa tcgaccaaat gaccctgttg agaggatcaa aacccagcct tgtacgatga tgctcagact cgcgtgtttg gttgttcgta acgttgccaa

ggagctgctg catagccgtt accgatttca gaacacaacg gtgtcgcttg ctcgcgctca gactttgggc <210> <211> <212> <213> <4 00>

ttgagtatgc gtggaggaat tcgaagattg gcacacatct gaaacctgtt agggtggtca tttcgtctcc 119 330 PRT

Flaveria bídentís 119

cgccatgaat tagatctggt: tgcaactcct cacaccgaat gaaaacgctc cacagctcaa atccggcttc gcttgctaaa cccgtcacac catggtccct agttttgcat caagggtctc ggtgaaagtg tgatgatcaa gacataccca ctatgacttt tacctctgta

gcgccttcgt gtgttgtccg ccgagtctca tggaccgaag attgaaaagg gccgcagcac gtgaagttca ggccaaagcc gttcttgatt ccctttgaca ctaaaggtac atgactttcc tgtctccccg tgtgtactat tttgtaaggg gttaacggga tga

tcgtcaacgc ccagatttac ttcgtaacga acggaaatga gtgagttaga ccgacaccaa agacagagaa caaagttcat tccagcccgg agaccaaata aagaaatctt cagacgaagg cgaagtcaaa gtgaaaagga atggattgag cctttgagct

ttcgtcgctg gtgcaattcg gcctgttttc atcatacgaa accagttgcc agctccattt attcgtcaca ggtgtttgca tgaggcgttt ttctggagta tgtaattggg acctcactca agtggtagca agctgtgaac gaacaagaca gtgggcactt

993

Met Ser Ala Ala Ser Ala Phe Ala Met Asn Ala Pro Ser Phe Val Asn 1 5 10 15 Ala Ser Ser Leu Lys Lys Ala Ser Thr Ser Ala Arg Ser Gly Val Leu 20 25 30 Ser Ala Arg Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ser Ala 35 40 45 Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala 50 55 60 Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu 65 70 75 80 Glu Ala Ile Asp Ala Leu Lys Lys Thr Leu Ile Glu Lys Gly Glu Leu 85 90 95 Glu Pro Val Ala Ala Thr Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala 100 105 110 Ala Pro 115 Asp Thr Lys 120 Ala Pro Phe 125 Asp Pro Val Glu Arg Ile Lys Ser Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu 130 135 14 0 Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala 145 150 155 160 Cys Ser Asp 165 Ser Arg Val 17 0 Cys Pro Ser 175 His Val Leu Asp Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe IE iO l: 3 5 190 Asp Lys 195 Thr Lys Tyr 200 Ser Gly Val 205 Gly Ala Ala Val Glu Tyr Ala Val

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 Leu

Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys

215 220

Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser 230 235 240

Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser 250 255

Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val

260 265 270

Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr

275 280 285

Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Lys Thr Leu Ala Leu Lys

Leu His 210 Gly Gly Ile 225

Thr Asp Phe 245

290 295

Gly Gly His Tyr Asp

Phe

305 Asp

Phe

310 Leu

Ser

Ser 330

<210> <211> <212> <213> <4 00>

Gly 325 120 975 DNA

Hordeum vulgare 120

300 Val Asn 315

Pro Thr

Gly

Thr 320 Val

Phe Glu Leu Trp Ala Leu

atgtcgttgc aagcggcaac agcatgaaaa ccacgtacta ccccgtgccc gcctccttcc gcattgatgg gtctacgaca atggtgttcg ggtgaggcct tacgccggtg gtggtgattg gcagacgact aaggtgcaga gaggccgtca accaacggaa acatgggagc <2 10> <211 > <212> <213> <400>

agattgggcg tgctccatgg tcaatagcac cctcacacta gctcctccac gccccaagct acgccgccgt agaagcccga cgtgcgccga tcaccatccg ttggatcggc gccacagccg ccttccactt ctgagtgcgc acgtgtccct ccctcaagct agtaa 121 324 PRT

Hordeum vulgare 121

gacagagagg acggtgtagt ttgtacattg ctcgaccgcc catcgccgcc catcaggacc ggagcgcctc tttcttcgag ctcgcgtgtg caacatcgcc catcgaatac ctgcggtgga cgttgaggac ctccatgcct ccagaacctc cgtcggcggc

gcccggtccc cggtctttgt ctttgcacac 60

accatcgaca atgcaaattg cagcacctgc 120

acggccctgc cgattgccgc actgcctggg 180

gcggctaact ggtgctacgc aaccgtcgcg 240

agcctcggca cccccgcgcc ctcctcctcc 300

acccccgtcc aggccgcgcc cgtcgcacct 360

aagaccgggt tcgagaagtt caagaccgag 420

ccgctcaagg ccggccaggc gcccaagtac 480

tgcccgtcgg tcaccctggg ccttgagccc 540

aacatggtcc cggcctactg caagaacaag 600

gccgtctgcg cgctcaaggt tgaggtcatc 660

atcaaggctc tgctctcgct caaggatggc 720

tgggtcagga tcgggttccc ggccaagaag 780

ttcgatgacc agtgcaccgt cctggagaag 840

ttgacctacc cgttcgtcaa ggagggtgtg 900

cactacgact tcgtctccgg caagttcgaa 960 975

Met Ser Leu Gln Ile Gly Arg Thr Glu Arg Ala Arg Ser Pro Val Phe 1

Val Asp

10 15

Phe AIa His Lys Arg Gln Leu Leu His Gly Arg Cys Ser Thr Ile

Thr 50

Ser His 65 Pro

20 Asn Ala 35 Leu

Arg

Thr

5

Tyr Ser 70

Ala Arg

25

Asn Cys 40

Ala Leu

Ser

Pro

60

Ala Ala

7 5 Ser Thr

30 Thr Cys

45 Ile Ala

Ser Met Lys Ile Asn Ser Thr Cys Ala Leu Pro Gly Pro Arg Thr Thr

Ala

Asn 80 Ala

Pro

Val

Arg

85

Ser Ser 100 Gln Aia 115 Leu

130 Lys Pro 14 5

Lys Asp

Ser

Ala

Thr

90

Ala Ser

105 Pro Val 120

Gly Phe

Ile

95

Arg Pro 110

Ala Pro Ala 125

Lys Phe

Phe

Glu

Trp Cys Tyr Ala Thr Val Ala Ala Ser Leu Gly Thr Pro Ala Lys Leu Ile Arg Thr Thr Pro Leu Met Asp Ala Ala Val Glu Lys Thr Glu Val Tyr Asp Lys

135 Phe Phe 150

140

Glu Pro Leu Lys Ala Gly Gln Ala Pro Lys Tyr 155 160 Met Val Phe Ala Cys Ala Asp Ser Arg Val Cys 165 170 175 Gly Leu Glu Pro Gly Glu Ala Phe Thr Ile Arg lí 30 lí 35 190 Val Pro Ala Tyr Cys Lys Asn Lys Tyr Ala Gly 195 200 205 Glu Tyr Ala Val Cys Ala Leu Lys Val Glu Val 210 215 220 His Ser Arg Cys Gly Gly Ile Lys Ala Leu Leu 225 230 235 240 Ala Asp Asp Ser Phe His Phe Val Glu Asp Trp 245 250 255 Pro Ala Lys Lys Lys Val Gln Thr Glu Cys Ala 260 265 2 70 Asp Gln Cys Thr Val Leu Glu Lys Glu Ala Val 275 280 285 Asn Leu Leu Thr Tyr Pro Phe Val Lys Glu Gly 290 295 300 Leu Lys Leu Val Gly Gly His Tyr Asp Phe Val 305 310 315 320

Pro Ser Asn Ile Val Gly Ile Val Ser Leu Val Arg Ser Met Asn Val Val Thr Ser Gly

Val Thr Leu Ala Asn Met Ser Ala Ile Val Ile Gly Lys Asp Gly Ile Gly Phe Pro Phe Asp Ser Leu Gln Asn Gly Thr Lys Phe Glu

Thr Trp Glu Gln <210> 122

<211> <212 > <2 13> <400>

804 DNA

Chlamydomonas reínhardtii 122

atgtcgtcgc ggaatgtcgc taccgctctg cgcatgttcg gctggcgagg cctcggccat gatgggcacc ggctcggcgc gccctgggcg gcgcctcggc tgttaacaag ggctgcagct tgcatgggcg cgtgcatgcc gatgcgccac ctccacgccc cccgaccagg ccctggagta ccttcgcgag ggcaacaagc cacgactcgc accccacgcg caacctggac cgcgtcaagg cccttcgccg ccttcctgtc ctgcgccgac tcgcgcgtgc cagggcttcg gtgacgtgtt cgtgacgcgc gtggccggca acggcgtcgc tggagttcgg cacggccgtc ctgggctcca cacagcgctt gcggcgccgt ggcggccacc atgaacggcg tcctctctct actacagcat cagcccggcc tgcaagaagg ggtgccattg ccgagaacgt caaggtccag atggagcagc caggggctcg tgaaggaggg caagctcaag atcgtgggcg ggcaaggtga ccgagatcgc ctaa <210> 123 <211> 267 <212> PRT

<213> Chlamydomonas reinhardtii <400> 123

Met Ser Ser Arg Asn Val Ala Thr Ala Leu Arg

10 15

Gly Pro Ser Gln Ala Gly Glu Ala Ser Ala Met

25 30

Ala Leu Leu Ala Gln Arg Ala Ala Ala Leu Gly

40 45

Asn Lys Gly Cys Ser Cys Arg Cys Gly Arg Val

50 55 60

Cys Met Pro Met Arg His Leu His Ala His Pro 65 70 75 80

Pro Asp Gln Ala Leu Glu Tyr Leu Arg Glu Gly

85 90 95

Asn Asn Lys Pro His Asp Ser His Pro Thr Arg

100 105 110

Lys Ala Thr Ala Ala Gly Gln Lys Pro Phe Ala

115 120 125

Ala Asp Ser Arg Val Pro Val Glu Ile Ile Phe 130 135 14 0

cgaccctcgg tgctcgcgca gccgctgcgg accccaaccc gcttcgtgaa ccaccgccgc ctgtcgagat acatcgtgac aggtgctcat ccgccgtgcc ctcaggctgg tcaaggtgtc gcgtgtacga 804

tccgagccag gcgcgcggcc ccgcgtggcg gccctcggac caacaagccg gggccagaag catcttcgac caacgagatc ggtgctgggc tggcgtcatc cgacgttgac gcccgtgctg cctggccacc

Met Phe Met Gly Gly Ala Ala Cys Asn Pro Asn Lys Asn Leu Ala Phe Asp Gln

Ala Thr Leu Thr Gly Ser Ser Ala Val Met Gly Ala Pro Ser Asp Arg Phe Val Asp Arg Val Leu Ser Cys Gly Phe Gly

60 120 180 240 300 360 420 480 540 600 660 720 780 145 Thr

Met

150 155 160

Ala Ser Leu Glu Phe Gly Thr Ala Val

165 170 175

Val Leu Gly His Ser Ala Cys Gly Ala

Leu

Val

Asp Val Phe Val Thr Arg Val Ala Gly Asn Ile Val Thr Asn Glu Ile

Gly Ser Lys Val Leu

Ala Ala Thr Met Asn

Ser Leu Tyr Tyr Ser Ile Ser

Gly Asp Val Asp Gly Ala Ile Ala

Val Ser Pro Val Leu

Val Gly Gly Val Tyr

Gly

30 Ala

Cys

Val

1

Ala 195 Pro Ala 210 Glu Asn Val 225

Gln Gly Leu Val 245

li Pro 200 Lys Lys

215 Lys Val 230

Lys

5 Gly

Ala

Gln

Glu 250

Val

205 Gln Ala 220 Met Glu 235

Gly Lys

190 Ie Ser

Gln

Leu 255

Leu 240 Lys

Lys

Ile

Ile Ala

Asp Leu Ala Thr Gly Lys Val Thr Glu

260 265

<210> 124 <211> 846 <212> DNA <213> Oryza sativa <4 00> 124 ggagcgcgcc gtgcaccgcc agctggtgct tcgccactgt tccccatcac cgtcctcctc cgcccccgcc tcatccgcaa gacgccgccg tcgaccgcct aagaagccgg agctcttcga tcgtgcgccg actctcgcgt ttcaccgtcc gcaacatcgc gtcgggtcgg ccatcgagta ggccacagcc gctgcggtgg tccttccact tcgtcgagga accgagcacg cctcgctgcc aaccaatccc tggagaacct accctcaagc tcgtcggcgg ccctaa <210> 125 <211> 273 <212> PRT <213> Oryza sativa <4 00> 125

Met Ser Thr Ala Ala Ala Ala Ala Ala Ala Gln

10 15

Thr Val Thr Pro Arg Ser Arg Ala Thr Val Val

25 30

Pro Ser Pro Ser Ser Ser Ser Ser Ser Ser Ser

40 45

Pro Ala Pro Phe Arg Pro Arg Leu Ile Arg Asn

50 55 60

Ala Pro Val Ala Pro Ala Ala 65 7 0 7 5

Asp Gly Phe Ala Lys Phe Lys

tctcacaatg tcgaccgccg caccccgcgc tcccgcgcca ctcctcctcc tccaacagca cacccccgtc ttcgccgccc caaggatggg ttcgccaagt accgctcaag gccggccagg gtgcccgtcg gtgaccatgg caacatggtc ccagcttact cgccgtctgc gccctcaagg aatcaaggcc ctcctctcac. ctgggtcagg accggtttcc tttcgatgac caatgcgcca caagacctac ccgttcgtca ccactacgac ttcgtctccg 846

ccgccgccgc cagtcgtcgc gcaacctccc ccgtcgcccc tcaagaccga cacccaagta gcctggagcc gcaagatcaa tcgaactcat tcaaggatgg ccgccaagaa tcttggagaa aggaggggat gcaacttgga

cgctgcccag cagcctcgcc ggcccccttc cgccgcgatg gttctatgac catggtgttc cggcgaggcc gcacgctggc cgtggtgatt agcaccagac gaaggttcag ggaggccgtg cgccaacggc cttatgggag

Met

Leu

85

Phe Glu 100

Ser Cys Ala

115 Pro Gly

130 Tyr Cys 145

Val Cys

Pro

90

Leu Lys Ala 105

Asp 80

Thr Glu

95

Gly Gln 110

Ala Ala

Phe Tyr

Ala Pro

Glu

Lys

Ala 165

Asp Ser Arg Val Cys Pro Ser Val

120 125

Ala Phe Thr Val Arg Asn Ile Ala

135 140

Ile Lys His Ala Gly Val Gly Ser 150 ' 155 160

Leu Lys Val Glu Leu Ile Val Val 17 0 17 5

Ser Trp Ala Ser Asn Ser Thr Pro Val Asp Asp Lys Lys Tyr Thr Met Asn Met Ala Ile Ile Gly

Cys Phe Ala Leu Ala Ser Ser Asn Leu Val Phe Ala Arg Leu Lys Lys Pro Glu Met Val Phe Gly Leu Glu Val Pro Ala Glu Tyr AIa His Ser Arg

60 120 180 240 300 360 420 480 540 600 660 720 780 840 Cys Gly Gly 180 Ser Phe His

195 Lys Lys 210 Ala Ile

Ile

Val

Leu

225 Thr

Tyr

Val

Pro 245 Gly Gly 260

Pro <210> <211> <212> <213> <4 00> atggtcccct caatctgctt ctgtctctcc acctgcttca gccatcgaag gccaaggtga tttgatcccg accaatcctg gcttgttcgg ttcgtggttc gttggagccg gggcacagtg tctactgact gcagaaagtg gtgtcactag cttgctttga cagtttggaa <2 10> <211> <212>

Phe

200 Gln Thr

215 Glu Lys 230 Phe

Lys Ala

185 Val Glu

Leu

Glu

Val

His

Lys 250 Tyr Asp 265

Asp

205 His Ala 220 Ala Val 235 Glu

Leu Ser

190 Trp Val

Gly

Phe

Leu Lys Asp Gly Ala Pro Asp

Arg Thr Gly Phe Pro Ala Lys

Ser Leu Pro Phe Asp Asp Gln Cys

Asn Gln Ser Leu Glu Asn Leu Lys 240

Ala Asn Gly Thr Leu Lys Leu Gly Asn Leu Asp Leu Trp Glu

Ile 255 Val Ser 270

<213> <4 00> Met Ser

1

Ser Ala

Thr 5

Gln Ser 20 Cys Leu 35 Ser

126 993 DNA

Arabidopsis 126

tttggactac caaaagccac tcttcctctt gccacttcaa ctctcaagaa agaagatcac tcgaacgaat ctttgtatgg actcacgagt gtaatatcgc ccattgaata catgtggtgg tcatagagga aaagttcagc caaacctatt agggaggcta tttcccccgt 127 347 PRT

Arabidopsis 127

Ala Pro

thaliana

agtttctcga aaaacagtat cccgttccat acttgaactg gcttctcatt ggcggagctt taaggaaggc tgagctcgcc gtgcccatca caatatggtt cgctgtcttg catcaagggg ttgggtcaaa atttgaagac gacatatcca ctatgacttt tcattctata

thaliana

aatggctcat aaatatcctt ttatccgcaa agaaggatgg gagaaggatg caggcagcct ttcgtcacct aaaggtcaaa cacgtactag cctccttttg caccttaagg cttatgtcat atctgtttac caatgtggcc tttgtgagag gttaatggct tga

Ser 50

Ala Pro 65 Glu

Arg

Ser Leu 25

Pro Pro 40

Ser Val

Leu 10 Gln

Ala

Pro

Ser

Ala

Lys Glu

55 Pro 70 Tyr Asp 85 Glu

Ile

Glu

Lys

30 Ser Ser 45

Thr Leu 60 Ala

Gly Phe

15 Leu Ser

Phe Leu

Leu Arg

Ser Ser Ser

Ile Arg Asn

Ile 75

Ala Ile

Pro

Tyr 80 Ala

Trp Ser

Leu

Ala

Val

100 Ala Leu 115

Glu

Gln

Thr Ile

90

Lys Thr

105 Thr Gly 120 Lys

130 Glu Thr

145

Lys Tyr Val Leu

135

Asn Pro Ala 150

Val Phe

Met 165 Asp

Gln

Leu

Ala 170

Val

Thr

Gly 1' Tyr 155 Cys

Glu 95

Ala Ala 110 Ser Ser 125 Phe

Ile

Leu Ala Asp Lys

Lys Lys Lys Phe

Gly Glu

Ser

Asp

175

Leu Ala 160

Ser Arg

cagactcaga ctcttcgtcc acggagcttg gaaacgaatc atctgaagga cgtcatcgga tcaagaagga gcccaaagta acttccatcc acaaggtcaa tggaaaacat ttcctcttga cagcaaagtc gatgcgaaag aaggagttgt cctttgagct 9

gacgactctc ctctcatcgc ttttcggtgc atatgaagac tgtagctgcg cagcaaatct gaaatacgag catggtgttt tggagatgcc atatgcagga tgtggtgata cggaaacaac aaaagttttg ggcagtgaat gaaaggaaca ttgggagctc 93

Phe Gln Pro Gly Asp Ala Phe Val

Thr Ser Leu Thr Ser Ser Ser Ser Ser Glu Pro Val Glu Glu Met Lys Leu Leu Val Glu Gln Lys Ala Phe Lys Lys Glu Lys Gly Gln Val Cys Pro Val Arg Asn

Ser Pro Thr Val Ser Ser Phe Ala Gly Thr Ile Glu Ile Thr Asp Pro Lys Tyr Ser Pro Ser His Ile Ala

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1 c 30 185 190 Asn Met Val Pro Pro Phe Asp Lys Val Lys Tyr Gly Gly Val Gly Ala 195 200 205 Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile Val Val 210 215 22.0 Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro 225 230 235 240 Leu Asp Gly Asn Asn Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Ile 2.4 5 250 255 Cys Leu Pro Ala Lys Ser Lys Val Ile Ser Glu Leu Gly Asp Ser Ala 260 265 270 Phe Glu Asp Gln Cys Gly Arg Cys Glu Arg Glu Ala Val Asn Val Ser 275 280 285 Leu Ala Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu Val' Lys 290 295 300 Gly Thr Leu Ala Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ala 305 310 315 320 Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Glu Thr Ser Ser Val 325 330 335 Lys Asp Val Ala Thr Ile Leu His Trp Lys Leu

340

345

128 990 DNA

Flaveria pringleί 128

<2 10> <211> <2 12> <213> <4 00>

atgtcgaccg cctctgcttt cgccattaat gcgccttcgt aagaagtcgt cttcttcagc cagatctggt gtgttgtccg tcgtcgtctt cttcgtctgc tactcctccg agtctcattc gctccggctc ctatcatcac accgaattgg accgaagatg gccattgacg cactcaagaa aatgctcatt gaaaagggtg gcaagaatcg accaaatcac agctcaagcc gcagcacccg cctgttgaga ggatcaaatc cggcttcgtg aagttcaaga ccggtcttgt acgatgagct tgctaaaggc caaagcccaa tcagactcgc gtgtttgccc atcacacgtt cttgatttcc gtccgtaacg ttgccaacat ggtccctccc tttgacaaga gctgctgttg agtatgcagt tttgcatcta aaggtacaag agccgttgtg gagggatcaa gggtctcatg actttcccag gatttcatcg aagattgggt gaaagtatgt ctccccgcga cacaacggca cacatcttga tgatcaatgt gtactatgtg tcgcttggaa acctgttgac atacccattt gtaagggatg gcgctcaagg gtggtcacta tgactttgtt aacgggacct tttggccttt cgtctcctac ctctgtatga < 210 > 129 <211> 329 <212> PRT

<213> Flaveria pringlei <400> 129 Met Ser Thr Ala Ser

tcgtcaacgc ccagatttac gtaacgagcc gaaatgaatc agttagaacc acaccaaagc cagagaaatt agttcatggt agcccggtga ccaaatattc aaatatttgt acgaaggacc agtcaaaagt aaaaggaagc gattgaggaa ttgagctgtg 990

ttcgtcgctg gtgcaattcg tgttttcgct atacgaggaa agttgccgct tccatttgac cgtcacaaac gtttgcatgc ggcgtttgtt tggagtagga aattgggcat tcactcaacc ggtagcagaa tgtgaacgtg caatacactc ggcacttgac

1

Ala Ser

Pro

50 Ile Ile 65 Ala

Thr

5

Ser Ser 20 Ala Arg 35 Pro

Ser

Leu Lys 25

Phe Thr 40

Leu Ile

Ala 10 Lys

Cys

Arg

Phe

Ser

Thr

Ile

Pro Val

5 Pro 70

Asp Ala 85 Ala

Asn

Leu

Ala

Pro

100 Asp Thr

Lys

Trp 75

Lys Lys 90

Ala Arg Ile 105

Ala Pro Phe

Asn 45

Asn Glu 60 Thr

Ala Ile

15 Ser Ser 30 Ser

Glu

Met 95

Asp Gln 110 Asp Pro

Asn Ala Pro Ser Phe Val Asn Ser Ala Arg Ser Gly Val Leu Ser Ser Ser Ser Ser Ser Ala Thr Pro Val Phe Ala Ala Pro Ala Pro Gly Asn Glu Ser Tyr Glu Glu Ile Glu Lys Gly Glu Leu Glu Ile Thr Ala Gln Ala Ala Ala Val Glu Arg Ile Lys Ser Gly

Asp 80 Leu

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 115 Phe Val

130 Asp Glu 145 Ser

Asp

Glu Ala

Lys

His

Lys

Leu

Ser 165 Phe 180 Thr Lys 195 Leu

120 Phe Lys

135 Ala Lys 150 Arg

Val

Val Val

Tyr

210 Gly Ile 225 Asp

Phe

Val Val

Lys

Ile 245 Ala

Val

Thr

Gly

Cys 170 Arg 185 Ser Gly 200 Gln

125 Glu Lys

140 Gln Ser 155 Pro

Phe Val Thr

Ser

Asn Val

Pro

His 17 5 Ala

Lys 160 Val

Phe

Leu

Val

Glu Ile

190 Gly Ala 205 Phe

Asn Met

Ala Val

Val Ile Gly

215 Gly Leu 230

Glu Asp Glu His

Cys

Pro

260 Glu Lys 275 Phe

Glu

Met

Trp 250 Asn 265 Ala Val 280

220 Thr Phe 235 Val

Pro

Lys

Gly

Asn

Val 255 Thr His

270 Val Ser 285

Asp 240 Cys

Leu

Val

Tyr

290 Gly His 305

Phe Gly

<21 0> <211> <2 12> <213> <4 00> atgtcgaccg aagaagtcgt tcgtcgtcgt gctgccccgg gaagccattg gctgcaagaa gaccctgttg aacccagccc tgctcagact gttgtccgta ggagctgctg catagccgtt actgatttca gaacacaacg gtgtcgcttg ctcgcgctca gactttgggc <2 10> <2 11> < 212 > <2 13> <4 00>

Arg Asp Gly Leu Arg Asn Asn

295 300

Asp Phe Val Asn Gly Thr Phe 310 315 320

Ser Ser Pro Thr Ser Val

Glu Leu Asp Gly Thr Glu

1inearis

Met

1

Ala Leu

Thr

5 Ser

Thr

50 Pro Ile

Ser

Ser 20 Ser Ala 35

Pro Pro

Leu 32 5 130 993 DNA

Flaveria

130

cctctgcttt cgacttcttc cttcttcgtc cgcccatcat acgcactcaa tcgaccaaat agaggatcaa tgtacgatga cgcgtgtttg acgttgccaa ttgagtatgc gcggagggat tcgaagattg gcacacatct gaaacctgtt agggtggtca tttcgtctcc

131 330 PRT

Flaveria 131

Ala Ser

cgccattaac agccagatct tgcaactcct aacaccgaat gaaaatgctc cacagctcaa atccggcttc gcttgctaaa cccatcacac catggtccct agttttgcat caagggtctc ggtgaaagta tgatgatcaa gacataccca ctatgatttt tacctctgta

1inearis

Asn Pro Met Val Asp Phe Val Pro Glu Tyr His Ser Gly Pro Pro Ala Asp Gln Asn Leu Leu Ala Leu Trp

Val Leu Tyr Phe Ala Cys Gln Pro Gly Pro Phe Asp Ala Val Leu Arg Cys Gly His Ser Thr Lys Ser Lys Cys Val Leu Leu Thr Tyr Leu Lys Gly Ala Leu Asp

gcgccttcgt ggtgtgtrgt ccgagtctca tggaccgaag attgaaaagg gccgcagcac gtgaagttca ggccaaagcc gttcttgatt ccctttgaca ctaaaggtac atgactttcc tgcctccccg tgtgtacaat tttgtaaggg gttaacggga tga

tcgtcaacgc ccgccagatt ttcgtaacga acggaaatga gtgagttaga ccgacaccaa agacagagaa caaagttcat tccagcccgg agaccaaata aagaaatatt cagacgaagg caaagtcaaa gtgaaaagga atggtttgag cctttgagct

ttcatcgctg tacgtgcaat gcctgttttc atcatacgag acccgttgcc agctccattc attcgtaaca ggtgtttgca tgaggcgttt ttctggagta tgtaattggg acctcactca agtggtagca agctgtgaac gaacaataca gtgggcactt

993

Leu

Ala 10 Lys

Ile

Lys 25

Arg Phe 40

Ser Leu 55

Thr Pro Asn

Phe

Ser

Ala Ile 15

Ser Thr

Thr

Ile

30

Cys Asn 45

Arg Asn 60

Trp Thr

Asn Ala Pro Ser Phe Val Asn Ser Ser Ala Arg Ser Giy Val Ser Ser Ser Ser Ser Ser Ser Ala Glu Pro Val Phe Ala Ala Pro Ala Glu Asp Gly Asn Glu Ser Tyr Glu

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 65 '7 0 7 5 8 0

Glu Ala Ile Asp Ala Leu Lys Lys Met Leu Ile Glu Lys Gly Glu Leu

85 90 95

Glu Pro Val Ala Ala Ala Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala

100 105 110

Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser

115 120 125

Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu

130 135 140

Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala 145 150 155 160

Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro

165 170 175

Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe

180 185 190

Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val

195 200 205

Leu His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys

210 215 220

Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser 225 230 235 240

Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser

245 250 25 5

Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val

260 265 270

Gln Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr

275 280 28 5

Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Asn Thr Leu Ala Leu Lys

290 295 300

Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu 305 310 315 320

Asp Phe Gly Leu Ser Ser Pro Thr Ser Val

325 330

<210> 132 <211> 993 <212> DNA

<213> Flaveria browníi <4 00> 132

atgtcgaccg cctctgcttt cgccactaac gtgccttcgt tcgtcaacgc ttcatcgctg 60 aagaagtcgt ccacttcttc agccagatct ggtgtgttgt ccgccaaatt tacgtgcaat 120 tcgtcgtcgt cttcttcgtc tgcaactcct ccgagtctca ttcgtaacga gcctgttttc 180 gctgctccgg cgcccatcat cacaccgaat tggaccgaag acggaaatga atcatacgag 240 gaagccattg acgcactcaa gaaaatgctc attgaaaagg gtgagttaga accagttgcg 30 0 gctgcaagaa tcgaccaaat cacagctcaa gccgcggcac ccgacaccaa agctccattc 360 gaccctgttg agaggatcaa atccggcttc gtgaagttca agactgagaa attcgtaaca 420 aacccagccc tgtacgatga gcttgctaaa ggccaaagcc caaagttcat ggtgtttgca 480 tgctcagact cgcgtgtttg cccatcacac gttcttgatt tccagcccgg tgaggcgttt 540 gttgtccgta acgttgccaa catggtccct ccctttgaca agaccaaata ttctggagta 600 ggagctgctg ttgagtatgc agttttgcat ctgaaggtac aagaaatatt tgtaattggg 660 catagccgtt gcggagggat caagggtctc atgactttcc cagacgaagg acctcactca 720 accgatttca tcgaagattg ggtgaaagta tgcctccccg cgaagtcaaa agtggtagca 780 gaacacaacg gcacacatct tgatgatcaa tgtgtactat gtgaaaagga agctgtgaac 84 0 gtgtcgcttg gaaacctgtt gacataccca tttgtaaggg atggtttgag gaacaataca 900 ctcgcgctca agggtggtca ctatgatttt gttaacggga cctttgagct gtgggcactt 960 gactttgggc tttcgtctcctacctctgtatga 9 93

<210> 133 <211> 330 <212> PRT

<213> Flaveria browníi <4 00> 133

Met Ser Thr Ala Ser Ala Phe Ala Thr Asn Val Pro Ser Phe Val Asn 10 15

Ala Ser Ser Leu Lys Lys Ser Ser Thr Ser Ser Ala Arg Ser Gly Val 25 30

Leu Ser Ala Lys Phe Thr Cys Asn Ser Ser Ser

40 45

Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val

50 55 60

Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly 65 70 75 80

Glu Ala Ile Asp Ala Leu Lys Lys Met Leu Ile

85 90 95

Glu Pro Val Ala Ala Ala Arg Ile Asp Gln Ile

100 105 110

Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val

115 120 125

Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val

130 135 140

Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys

145 150 155 160

Cys Ser Asp Ser Arg Val Cys Pro Ser His Val

165 170 175

Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn

180 185 190

Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala

195 200 205

Leu His Leu Lys Val Gln Glu Ile Phe Val Ile

210 215 220

Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp

225 230 235 240

Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys

245

250

255

Lys Val Val Ala Glu His Asn Gly Thr His Leu

260 265 270

Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu

275 280 285

Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Asn

290 295 300

Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe 305 310 315 320

Asp Phe Gly Leu Ser Ser Pro Thr Ser Val

325 330

<210> 134 <211> 969 <212> DNA

<213> Nicotiana paniculata <4 00> 134

atgtcaactg cttccattaa cagttgcctt actatctccc aaaccaattc gtcctgttgc ttttgctagg cttagcaaca gttcccagtc tcatcagaaa cgagcccgtc ttcgccgccc attttgagag aagaaatggc aaaggaatcc tatgagcagg ctcctcagcg aaaaaggaga acttggacca attgctgcag gctgaattgc aatcatcaga tggcagcaaa ccattcgacc ggctttattc acttcaaaac tgagaaatac gagaagaacc tcaaaaggcc agagccccaa gttcatggtc tttgcctgct tcacatgttc tgaacttcca acctggtgag gctttcgtgg gtccccgctt atgacaagac cagatactct ggtgtcggag ctccacctta aggtagagaa cattgttgtc attggccaca ggtctcatgt ctctatctgc agatggttct gaatcaactg aaaattggtt tacctgccaa ggccaaggtg gagggtgaac gatcaatgca cagcttgtga gaaggaagct gtgaatgtgt tatccatttg tgagagaagg tttggtgaag aaaacactag gattttgtga atggaggatt tgagctgtgg ggacttgagt

Ser Ser Phe Ala Asn Glu Glu Lys Thr Ala Glu Arg Thr Asn Phe Met Leu Asp Met Val Val Glu Gly His Glu Gly Leu Pro Asp Asp Gly Asn Thr Leu Glu Leu

Ser Ser Ala Ala Pro Ala Ser Tyr Glu Gly Glu Leu Gln Ala Ala Ile Lys Ser Pro Ala Leu Val Phe Ala Phe Gln Pro Pro Pro Phe Tyr Ala Val Ser Arg Cys Pro Hls Ser Ala Lys Ser Gln Cys Val Leu Leu Thr Ala Leu Lys Trp Ala Leu

cagctcaagc cctcttcttc caactcccat ccattgctgc caagagttga ctgttgagca cagccttata ctgactctcg tccgaaacat cagctatcga gcgcatgtgg cctttattga acgcggataa cacttggaaa cattgaaggg tcggtctttc

ttcccttaag ttcttcttcc catcaacccc actcgagaaa ccagattaca catgaaagct tggggaacta agtgtgccca cgccaacatg atacgctgtt aggtatcaaa ggattgggtg atgttttgca tttgctgacc aggtcactat tccttctctt

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960

tccgtatga <210> 135 < 211> 322

969 <212> PRT

<213> Nicotiana paniculata <4 00> 135

Met Ser Thr Ala Ser Ile Asn Ser Cys Leu Thr Ile Ser 10 15

Ala Ser Leu Lys Lys Pro Ile Arg Pro Val Ala Phe Ala

25 30

Asn Thr Ser Ser Ser Ser Ser Ser Val Pro Ser Leu Ile

40 45

Pro Val Phe Ala Ala Pro Thr Pro Ile Ile Asn Pro Ile

50 55 60

Glu Met Ala Lys Glu Ser Tyr Glu Gln Ala Ile Ala Ala 65 70 75 80

Leu Leu Ser Glu Lys Gly Glu Leu Gly Pro Ile Ala Ala

85 90 95

Asp Gln Ile Thr Ala Glu Leu Gln Ser Ser Asp Gly Ser

100 105 110

Asp Pro Val Glu His Met Lys Ala Gly Phe Ile His Phe

115 120 125

Lys Tyr Glu Lys Asn Pro AIa Leu Tyr Gly Glu Leu Ser

130 135 140

Ser Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg 145 150 155 160

Ser His Val Leu Asn Phe Gln Pro Gly Glu Ala Phe Val

165 170 175

Ile Ala Asn Met Val Pro Ala Tyr Asp Lys Thr Arg Tyr

180 185 190

Gly Ala Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val

195 200 205

Val Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly

210 215 220

Leu Ser Ala Asp Gly Ser Glu Ser Thr Ala Phe Ile Glu 225 230 235 240

Lys Ile Gly Leu Pro Ala Lys Ala Lys Val Glu Gly Glu

245 250 255

Lys Cys Phe Ala Asp Gln Cys Thr Ala Cys Glu Lys Glu

260 265 270

Val Ser Leu Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg

275 280 285

Val Lys Lys Thr Leu Ala Leu Lys Gly Gly His Tyr Asp

290 295 300

Gly Gly Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser 305 310 315 320

Ser Val

Pro Ala Gln Arg Leu Ser Arg Asn Glu Leu Arg Glu Leu Glu Lys Ala Arg Val Lys Pro Phe Lys Thr Glu Lys Gly Gln Val Cys Pro Val Arg Asn Ser Gly Val Glu Asn Ile Leu Met Ser Asp Trp Val His Ala Asp Ala Val Asn Glu Gly Leu Phe Val Asn Pro Ser Leu

<210> 136 <211> 966 <212> DNA

<213> Nicotiana tabacum <4 00> 136

atgtcaactg cttccattaa cagttgcctt actatctccc ctgctcaagc ttcccttaag 60

aaaccaactc gtcctgttgc ttttgcaagg cttagcaact cttcttcttc tacttctgtt 120

cccagtctca tcagaaacga gcccgtcttc gccgccccta ctcccatcat caaccctatt 180

ttgagagaag aaatggcaaa ggaatcctat gagcaggcca ttgctgcact cgagaaactc 240

ctcagcgaaa aaggagaact tggaccaatt gctgcagcaa gagttgacca gattacagct 300

gaattgcaat catcagatgg cagcaaacca ttcgaccctg ttgagcacat gaaagctggc 360

tttattcact tcaaaactga gaaatacgag aagaacccag ccttatatgg ggaactatca 420

aaaggccaga gccccaagtt catggtcttt gcctgctctg actctcgagt gtgcccatca 480

catgtcctga acttccaacc tggtgaggct ttcgtggtcc gaaacatcgc caacatggtc 540

cctgcttatg acaagaccag atactccgga gtcggagcag ctatcgaata cgctgttctt 600

caccttaagg tagagaacat tgttgtcatt ggccatagcg catgtggagg tatcaaaggt 660

ctcatgtctt tacctgcaga tggttctgaa tcaactgcct tcattgagga ttgggtgaaa 720

attggtttac ctgccaaggc gaaggtgcag ggtgaacacg tggataaatg ttttgcagat 780 caatgcacag cttgtgagaa ggaagctgtg aatgtgtcac ttggaaattt gctgacctat 840

ccatttgtga gagaaggttt ggtgaagaaa acactagcat tgaagggagg tcactatgat 900

ttcgtgaatg gaggatttga gctgtgggga cttgagttcg gtctttctcc ttctctttcc 960

gtatga 966

<210> 137

<211> 321

<212> PRT

<213> Nicotiana tabacum

<4 00> 137 Met Ser Thr Ala Ser Ile Asn Ser Cys Leu Thr Ile Ser Pro Ala Gln 1 5 10 15 Ala Ser Leu Lys Lys Pro Thr Arg Pro Val Ala Phe Ala Arg Leu Ser 25 30 Asn Ser Ser Ser Ser Thr Ser Val Pro Ser Leu Ile Arg Asn Glu Pro 40 45 Val Phe Ala Ala Pro Thr Pro Ile Ile Asn Pro Ile Leu Arg Glu Glu 50 55 60 Met Ala Lys Glu Ser Tyr Glu Gln Ala Ile Ala Ala Leu Glu Lys Leu 65 7 0 75 8 0 Leu Ser Glu Lys Gly Glu Leu Gly Pro Ile Ala Ala Ala Arg Val Asp 85 90 95 Gln Ile Thr Ala Glu Leu Gln Ser Ser Asp Gly Ser Lys Pro Phe Asp 100 105 110 Pro Val Glu His Met Lys Ala Gly Phe Ile His Phe Lys Thr Glu Lys 115 120 125 Tyr Glu Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys Gly Gln Ser 130 135 140 Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser 14 5 150 155 160 His Val Leu Asn Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Ile 165 170 175 Ala Asn Met Val Pro Ala Tyr Asp Lys Thr Arg Tyr Ser Gly Val Gly If 30 Ii 35 190 Ala Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile Val 195 200 205 Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Leu 210 215 220 Pro Ala Asp Gly Ser Glu Ser Thr Ala Phe Ile Glu Asp Trp Val Lys 225 230 235 240 Ile Gly Leu Pro Ala Lys Ala Lys Val Gln Gly Glu His Val Asp Lys 245 250 255 Cys Phe Ala Asp Gln Cys Thr Ala Cys Glu Lys Glu Ala Val Asn Val 260 265 270 Ser Leu Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu Val 275 280 285 Lys Lys Thr Leu Ala Leu Lys Gly Gly His Tyr Asp Phe Val Asn Gly 290 295 300 Gly Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Pro Ser Leu Ser

305 310 315 320

Val

<210> 138 <211> 963 <212> DNA

<213> Populus tremula χ Populus tremuloides <4 00> 138

atgtcgactg cttcgattaa cagctggtgt ctcacctctg tctctgcctc taagaaatca 60 ctacccgcat tacgtccttc agtctttgca agcctcaact cctctgtttc tcctcctacc 120 cttatcagaa accagcctgt tttcgcagcc cctgctccta ttctctatcc acggagaggc 180 gaagaaatgg gaaacgacta caacgaggcc attgaatctc tcaagaaact cctcagtgac 240 aaggaagagc tgaaaactgt agcagctgcg aaagtggagc agataacagc tgaattacaa 300 accgtctcat cttctgaccc caaggcattc gatcctgttg agaagattaa atccggattc 360 attcacttca agaaggagaa atatgacaag aatccgggac tgtactccga gcttgccaaa 420 ggccaaagcc ccaagtttat ggtgtttgca tgctcggatt cccgggtttg cccgtcccat 480 gtgcttgatt tccaaccagg ggaagctttt gtggtccgca atgttgcgaa tatggtcccg 540 ccatacgata agactaagta cgctggagtt ggggcagcga tagagtacgc agttttgcat 600 ctgaaggtgg aatacattgt ggtcatcgga cacagcgcct gtggtggaat taagggcctc 660 atgtccttcc cgtatgatgg aacaacatca actgatttca tagaagactg ggtcaaagtc /20 tgctacaatg ccaagaccaa gattttagca gaacatgcca actcaccttt cccagacatg /80 tgtacacaat gtgaaaagga ggcagtgaac gtgtccatcg gacacttgct cacctacccg 840 tttgtgagag atggcttggt gaacaaaact ctaggactga agggtggtta ttatgatttt 900 gtcaaaggca gttttgagct ctgggggctt gagtacagcc tctccccctc tctctccgta 960 tga 963

<210> 139 <211> 320 <212> PRT

<213> Populus tremula χ Populus tremuloides <4 00> 139

Met Ser Thr Ala Ser Ile Asn Ser Trp Cys Leu Thr Ser Val Ser Ala 10 15

Ser Lys Lys Ser Leu Pro Ala Leu Arg Pro Ser Val Phe Ala Ser Leu

25 30

Asn Ser Ser Val Ser Pro Pro Thr Leu Ile Arg Asn Gln Pro Val Phe

40 45

Ala Ala Pro Ala Pro Ile Leu Tyr Pro Arg Arg Gly Glu Glu Met Gly

50 55 60

Asn Asp Tyr Asn Glu Ala Ile Glu Ser Leu Lys Lys Leu Leu Ser Asp 65 70 75 80

Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys Val Glu Gln Ile Thr

85 90 95

Ala Glu Leu Gln Thr Val Ser Ser Ser Asp Pro Lys Ala Phe Asp Pro

100 105 110

Val Glu Lys Ile Lys Ser Gly Phe Ile His Phe Lys Lys Glu Lys Tyr

115 120 125

Asp Lys Asn Pro Gly Leu Tyr Ser Glu Leu Ala Lys Gly Gln Ser Pro

130 135 140

Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His 145 150 155 160

Val Leu Asp Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala

165 170 175

Asn Met Val Pro Pro Tyr Asp Lys Thr Lys Tyr Ala Gly Val Gly Ala

180 185 190

Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Tyr Ile Val Val

195 200 205

Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro

210 215 220

Tyr Asp Gly Thr Thr Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Val 225 230 235 240

Cys Tyr Asn Ala Lys Thr Lys Ile Leu Ala Glu His Ala Asn Ser Pro

245 250 255

Phe Pro Asp Met Cys Thr Gln Cys Glu Lys Glu Ala Val Asn Val Ser

260 265 270

Ile Gly His Leu Leu Thr Tyr Pro Phe Val Arg Asp Gly Leu Val Asn

275 280 285

Lys Thr Leu Gly Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser

290 295 300

Phe Glu Leu Trp Gly Leu Glu Tyr Ser Leu Ser Pro Ser Leu Ser Val 305 310 315 320

<210> 140 <2 11> 963 < 212 > DNA

<213> Populus tremula χ Populus tremuloides <4 00> 140

atgtcgactg cttcgattaa cagctggtgt ctcacctctg tctctccctc taagaaatca 60 ctacccgcat tacgtccttc agtctttgca agcctcaact cctctgtttc tcctcctacc 120 cttatcagaa accagcctgt tttcgcagcc cctgctccta ttctctatcc acggagaggc 180 gaagaaatgg gaaacgacta caacgaggcc attgaatctc tcaagaaact cctcagtgat 240

aaggaggagc tgaaaactgt agcagctgcg aaagtggagc agataacagc tgaattacaa 300

accgtctcat cttctgaccc caaggcattc gatcctgttg agaagattaa atccggattc 3 60

attcacttca agaaggagaa atatgacaag aatccgggac tgtactccga gcttgccaaa 420

ggccaaagcc ccaagtttat ggtgtttgca tgctcggatt cccgggtttg cccgtcccat 480

gtgcttgatt tccaaccggg ggaagctttt gtggtccgca atgttgcgaa tatggtcccg 540

ccatacgata agactaagta cgctggagtt ggggcagcga tagagtacgc agttttgcat 600

ctgaaggtgg aatacattgt ggtcatcgga cacagcgcct gtggtggaat taagggcctc 660

atgtccttcc cgtatgatgg aacaacatca actgatttca tagaagactg ggtcaaagtc 720

tgctacaatg ccaagaccaa gattttagca gaacatgcca actcaccttt cccagacatg 780

tgtacacaat gtgaaaagga ggcagtgaac gtgtccctcg gacacttgct cacctacccg 840

tttgtgagag atggcttggt gaacaaaact ctaggcctta agggtggtta ttatgatttt 900

gtcaaaggaa gttttgagct ctggggcctt gagtacagcc tctctccctc tctctccgta 960

tga <210> <211> <212> <213> <4 00>

963

141 320 PRT

Populus tremula 141

Met Ser Thr Ala Ser Ile Asn Ser Trp Cys Leu 1 5 10 15 Ser Lys Lys Ser Leu Pro Ala Leu Arg Pro Ser 25 30 Asn Ser Ser Val Ser Pro Pro Thr Leu Ile Arg 40 45 Ala Ala Pro Ala Pro Ile Leu Tyr Pro Arg Arg 50 55 60 Asn Asp Tyr Asn Glu Aia Iie Glu Ser Leu Lys 65 70 75 80 Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys 85 90 95 Ala Glu Leu Gln Thr Val Ser Ser Ser Asp Pro 100 105 110 Val Glu Lys Ile Lys Ser Gly Phe Ile His Phe 115 120 125 Asp Lys Asn Pro Gly Leu Tyr Ser Glu Leu Ala 130 135 140 Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg 145 150 155 160 Vai Leu Asp Phe Gin Pro Gly Glu Ala Phe Val 165 170 175 Asn Met Val Pro Pro Tyr Asp Lys Thr Lys Tyr 1! 30 Ii 35 190 Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val 195 200 205 Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly 210 215 220 Tyr Asp Gly Thr Thr Ser Thr Asp Phe Ile Glu 225 230 235 240 Cys Tyr Asn Ala Lys Thr Lys Iie Leu Ala Glu 245 250 255 Phe Pro Asp Met Cys Thr Gln Cys Glu Lys Glu 260 265 270 Leu Gly His Leu Leu Thr Tyr Pro Phe Val Arg 275 280 285 Lys Thr Leu Gly Leu Lys Gly Gly Tyr Tyr Asp 290 295 300 Phe Glu Leu Trp Gly Leu Glu Tyr Ser Leu Ser 305 310 315 320 <2 10> 142 < 2 11 > 777 <2 12> DNA <2 13> Arabidopsis tha liana

Thr Ser Val Phe Asn Gln Gly Glu Lys Leu Val Glu Lys Ala Lys Lys Lys Gly Val Cys Val Arg Ala Gly Glu Tyr Leu Met Asp Trp His Ala Ala Val Asp Gly Phe Val Pro Ser

Val Ser Pro Ala Ser Leu Pro Val Phe Glu Met Gly Leu Ser Asp Gln Ile Thr Phe Asp Pro Glu Lys Tyr Gln Ser Pro Pro Ser His Asn Val Ala Val Gly Ala Ile Val Val Ser Phe Pro Val Lys Val Asn Ser Pro Asn Val Ser Leu Val Asn Lys Gly Ser Leu Ser Val <4 00> 142

atgtcgacag agtcgtacga agacgccatt aaaagactcg tcggatctcg ggaacgtggc agccgcaaag atcaagaagt cttgattcca acaagttaga tgccgtagaa cgaatcaaat actaataatt atgagaagaa tcctactttg tacaattcac aagtttttgg tgtttgcttg tgcggattca cgagttagtc caacttgggg aagccttcat cgttagaaac attgcaaaca acaaagcact ctaatgttgg tgcggccctt gaatatceaa aacattcttg ttattggaca cagctgttgt ggtggaataa gataatacag ctcccactaa gaccgagttc atagaaaact gccaagaaca ggatcaagca ggattgtaaa gacctaagct tgtgagaagg aagccgtgaa cgtgtccttg gggaatcttt gaaagagtgg tgaagaacaa gcttgccata agaggagctc acgtttgatc tttgggaact tgacttcaag actacccctg <210> 143 <211> 258 <212> PRT

<213> Arabidopsis thaliana <4 00> 143

Met Ser Thr Glu Ser Tyr Glu Asp Ala Ile Lys

10 15

Leu Ser Lys Lys Ser Asp Leu Gly Asn Val Ala

25 30

Lys Leu Thr Asp Glu Leu Glu Glu Leu Asp Ser

40 45

Val Glu Arg Ile Lys Ser Gly Phe Leu His Phe

50 55 60

Glu Lys Asn Pro Thr Leu Tyr Asn Ser Leu Ala 65 70 75 80

Lys Phe Leu Val Phe Ala Cys Ala Asp Ser Arg

85 90 95

Ile Leu Asn Phe Gln Leu Gly Glu Ala Phe Ile

100 105 110

Asn Met Val Pro Pro Tyr Asp Lys Thr Lys His

115 120 125

Ala Leu Glu Tyr Pro Ile Thr Val Leu Asn Val

130 135 140

Ile Gly His Ser Cys Cys Gly Gly Ile Lys Gly 145 150 155 160

Asp Asn Thr Ala Pro Thr Lys Thr Glu Phe Ile

165 170 175

Ile Cys Ala Pro Ala Lys Asn Arg Ile Lys Gln

180 185 190

Ser Phe Glu Asp Gln Cys Thr Asn Cys Glu Lys

195 200 205

Ser Leu Gly Asn Leu Leu Ser Tyr Pro Phe Val

210 215 220

Lys Asn Lys Leu Ala Ile Arg Gly Ala His Tyr 225 230 235 240

Thr Phe Asp Leu Trp Glu Leu Asp Phe Lys Thr 245 250 255

Leu Ser

gagagcttct taacggatga ccggatttct ttgccaagag catctcacat tggtgccacc ttacagtcct agggactcat ggatccagat ttgaagatca tgtcttaccc actatgattt cctttgcctt

cagtaagaaa gttagaggaa ccatttcaag ccagaccccc cttgaatttc ttatgacaag caacgtggag ggccattgaa ctgtgcaccg gtgcaccaac attcgtgaga cgtaaaagga gtcttaa

Arg Leu Ala Ala Asn Lys Lys Thr Lys Ser Val Ser Val Arg Ser Asn Glu Asn Leu Met Glu Asn Asp Cys Glu Ala Arg Glu Asp Phe Thr Pro

Gly Glu Leu Lys Ile Lys Leu Asp Ala Asn Asn Tyr Gln Thr Pro Pro Ser His Asn Ile Ala Val Gly Ala Ile Leu Val Ala Ile Glu Trp Ile Gln Lys Asp Leu Val Asn Val Arg Val Val Val Lys Gly Ala Phe Ala

60 120 180 240 300 360 420 480 540 600 660 720 777

<210> 144 <211> 960 <212> DNA

<213> Spinacia oleracea <4 00> 144

atgtctacta ttaacggctg cctcacctct atctctcctt cccgtactca attgaaaaat acctccactt taaggccaac tttcattgct aacagcaggg ttaacccttc ttcttctgtt cctccttccc ttattagaaa ccagcccgtt ttcgccgccc ccgcccctat catcacccct actttgaaag aagatatggc atacgaagaa gccatcgctg cccttaagaa gcttctaagc gagaagggag aacttgaaaa tgaagccgca tcaaaggtgg cacagataac atctgagtta

60 120 180 240 300 gccgacggtg gcacaccatc cgccagttac ccggttcaga aaattcaaga aggagaaata cgagaaaaat ccagcattgt caagctccca agtttatggt gtttgcgtgc tcagactccc ctagatttcc agcccggtga ggctttcatg gttcgcaaca tttgacaagg acaaatacgc tggagtcgga gcagccattg aaggtggaga acattgtcgt gattggacac agtgcttgtg tctttcccag atgcaggacc aaccacaact gattttattg ttgcctgcca agcacaaggt gttagccgag catggtaatg acccattgtg aaaaggaagc tgtgaatgta tctctcggaa gtaagagatg gtttggtgaa gaagactcta gctttgcagg aatggatcat tcgagctatg gggactcgaa tacggcctct <210> 145 <211> 319 <212> PRT

<213> Spinacia oleracea <4 00> 145

Met Ser Thr Ile Asn Gly Cys Leu Thr Ser Ile

10 15

Gln Leu Lys Asn Thr Ser Thr Leu Arg Pro Thr

25 30

Arg Val Asn Pro Ser Ser Ser Val Pro Pro Ser

40 45

Pro Val Phe Ala Ala Pro Ala Pro Ile Ile Thr

50 55 60

Asp Met Ala Tyr Glu Glu Ala Ile Ala Ala Leu 65 70 75 80

Glu Lys Gly Glu Leu Glu Asn Glu Ala Ala Ser

85 90 95

Thr Ser Glu Leu Ala Asp Gly Gly Thr Pro Ser

100 105 110

Gln Arg Ile Lys Glu Gly Phe Ile Lys Phe Lys

115 120 125

Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys

130 135 140

Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val 145 150 155 160

Leu Asp Phe Gln Pro Gly Glu Ala Phe Met Val

165 170 175

Met Val Pro Val Phe Asp Lys Asp Lys Tyr Ala

180 185 190

Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu

195 200 205

Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu

210 215 220

Ala Gly Pro Thr Thr Thr Asp Phe Ile Glu Asp 225 230 235 240

Leu Pro Ala Lys His Lys Val Leu Ala Glu His

245 250 255

Ala Glu Gln Cys Thr His Cys Glu Lys Glu Ala

260 265 270

Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Asp

275 280 285

Thr Leu Ala Leu Gln Gly Gly Tyr Tyr Asp Phe

290 295 300

Glu Leu Trp Gly Leu Glu Tyr Gly Leu Ser Pro

gaattaagga atggtgagct gtgtgtgtcc tcgccaacat aatacgcagt gtggaatcaa aggattgggt caactttcgc acttgttgac gtggttacta ctccttccca

agggtttatc ttctaagggc ctcgcacgta ggtgcc.agtg gttgcacctt ggggcttatg caaaatctgc tgaacaatgc ttacccattt cgattttgtc atctgtatga

Ser Pro Phe Ile Leu Ile Pro Thr Lys Lys Lys Val Ala Ser Lys Glu Gly Gln Cys Pro Arg Asn Gly Val Asn Ile Met Ser Trp Val Gly Asn Val Asn Gly Leu Val Asn Ser Gln

Ser Arg Thr Ala Asn Ser Arg Asn Gln Leu Lys Glu Leu Leu Ser Ala Gln Ile Tyr Pro Val Lys Tyr Glu Ala Pro Lys Ser His Val Ile Ala Asn Gly Ala Ala Val Val Ile Phe Pro Asp Lys Ile Cys Ala Thr Phe Val Ser Leu Val Lys Lys Gly Ser Phe Ser Val

315

305 310

<210> 146 <211> 987 <212 > DNA <213> Pisum satívuin <400> 146

atgtctacct cttcaataaa cggctttagt ctttcttctt accaaaagaa ctacattgag accctttgtt tctgoatctc

360 420 480 540 600 660 720 780 840 900 960

tgtcccctgc caaaacttct ttaacacttc ttcttcatct

60 120 tcttcctcga ctttcccttc tcttattcaa gacaagccgg atcatcaccc cagttttgag agaagaaatg ggaaagggct ctccaaaagt tgttgaggga gaagactgaa ctgaaagcca caaatcacag ctcagctagg aacaacatca tcatctgatg tctgaaagga tcaaaactgg tttccttcac ttcaagaaag gctttgtatg gtgaacttgc caaaggccaa agccctccgt gactcaagag tctgcccatc tcatgtgcta gatttccagc agaaatgttg ctaacttggt tccaccatat gaccaggcaa gcaattgagt acgcagttct gcatctcaag gtttccaaca gcttgtggtg gtattaaggg acttttgtcc tttccatttg ttcattgagg agtgggtcaa aattggttta cctgcaaagg ggagatgcac cttttgcaga gctatgcaca cactgtgaga cttggaaacc ttctcaccta cccatttgtg agagagggat ctcaaaggag gatactatga ctttgtgaaa ggatcctttg ggcctttcgt ccactttctc cgtatga 147 328 PRT

Pisum sativum

ttttcgcttc atgatgaagc cagctgctga gcattccaaa agaaatatga ttatggtgtt caggtgaagc aatatgccgg ttgttgtcat atggaaccta cgaaggtgaa aggaagctgt tggtgaacaa agctttgggg 987

ttcttctcct tattgaagaa gaaggttgag atctgaagcc caagaatcca tgcatgttca ctttgtggtc aactggtgct tggacacagt ctccactgat agcacaacat gaatgcttcc gacattggca acttgaattt

<210> <211> <212> <213> <4 00>

147

Met Ser Thr Ser Ser Ile Asn Gly Phe Ser Leu

10

15

Ala Lys Thr Ser Thr Lys Arg Thr Thr Leu Arg

20

25

30

Ser Leu Asn Thr Ser Ser Ser Ser Ser Ser Ser

35

40

45

Ile Gln Asp Lys Pro Val Phe Ala Ser Ser Ser

50

55

60

Val Leu Arg Glu Glu Met Gly Lys Gly Tyr Asp

65 70 75 80

Leu Gln Lys Leu Leu Arg Glu Lys Thr Glu Leu

85 90 95

Glu Lys Val Glu Gln Ile Thr Ala Gln Leu Gly

100 105 110

Asp Gly Ile Pro Lys Ser Glu Ala Ser Glu Arg

115 120 125

Leu His Phe Lys Lys Glu Lys Tyr Asp Lys Asn

130 135 140

Glu Leu Ala Lys Gly Gln Ser Pro Pro Phe Met 145 150 155 160

Asp Ser Arg Val Cys Pro Ser His Val Leu Asp

165 170 175

Ala Phe Val Val Arg Asn Val Ala Asn Leu Val

180 185 190

Ala Lys Tyr Ala Gly Thr Gly Ala Ala Ile Glu

195 200 205

Leu Lys Val Ser Asn Ile Val Val Ile Gly His

210 215 220

Ile Lys Gly Leu Leu Ser Phe Pro Phe Asp Gly 225 230 235 240

Phe Ile Glu Glu Trp Val Lys Ile Gly Leu Pro

245 250 255

Lys Ala Gln His Gly Asp Ala Pro Phe Ala Glu

260 265 270

Glu Lys Glu Ala Val Asn Ala Ser Leu Gly Asn

275 280 285

Phe Val Arg Glu Gly Leu Val Asn Lys Thr Leu

290 295 300

Tyr Tyr Asp Phe Val Lys Gly Ser Phe Glu Leu 305 310 315 320

Gly Leu Ser Ser Thr Phe Ser Val 325

<210> 148

Ser Ser Pro Phe Thr Phe Pro Ile Glu Ala Lys Ala Thr Thr Ile Lys Pro Ala Val Phe Phe Gln Pro Pro Tyr Ala Ser Ala Thr Tyr Ala Lys Leu Cys Leu Leu Ala Leu Trp Gly

Leu Ser Pro Val Ser Ala Pro Ser Leu Ile Thr Pro Ile Glu Glu Thr Ala Ala Ser Ser Ser Thr Gly Phe Leu Tyr Gly Ala Cys Ser Pro Gly Glu Tyr Asp Gln Val Leu His Cys Gly Gly Ser Thr Asp Ala Lys Val Thr His Cys Thr Tyr Pro Lys Gly Gly Leu Glu Phe

180 240 300 360 420 480 540 600 660 720 780 840 900 960 <211> 996 <212> DNA

<213> Medicago truncatula <4 00> 148

atgtctacct cttccataaa cggctttagt ctctcttctt attaaaaaag ttacattgag acctattgtt tctgcatctc tcttccactt ctaacttccc ttctcttatt caagacaagc tctcctatca tcaccccagt tttgagagaa gaaatgggaa gaagaactcc aaaaattgtt gagggagaag actgaattga gttgagcaaa ttacagctca gctaggaaca acagcatcag gatcaagcct cagagaggat caaaactggt ttccttcact acaaaaccag ctttgtatgg tgaacttgcc aaaggccaag gcatgctcag actcaagagt ctgcccatct catgtgctag tttgtggtca gaaatgttgc taacatggtt ccaccatatg actggatctg caattgagta tgctgttctg catctcaagg ggacacagtg cttgtggtgg tattaagggg cttttgtctt tccactgatt tcattgagga gtgggtcaaa attggtttac gcaaagcatg gagatgcacc ttttggagag ctatgcacac aatgtttctc ttggaaacct tctaacctac ccatttgtga acattggcac taaaaggagg atactatgac tttgtgaaag cttgaatttg gcctttcttc aactttctcc gtatga <210> 149 <211> 331 <212> PRT

<213> Medicago truncatula <400> 149

tgtcccctac ttaactcttc ctgtttttgc agggctatga aagccacagc ctgatggtgt tcaagaaaga cccccccgtt acttccagcc accaggcaaa tttccaacat ttccatttga ctgcaaaggc actgtgagaa gagagggatt gatcttttga

aaaaacttct ttcttcttcc ttcatcttct tgaagctatt agctgaaaag tccaacatct gaaatatgac tatggtgttt aggagaagct atatgctgga tgtggtcatt tggagcctac aaaggtgaag ggaagctgtg ggtgaacaaa gctttgggga )96

Met 1

Ser Thr Ser Ser Ile Asn Gly Phe Ser Leu

5

10

15

Thr Lys Thr Ser Ile Lys Lys Val Thr Leu Arg

25 30

Ser Leu Asn Ser Ser Ser Ser Ser Ser Ser Thr

40 45

Leu Ile Gln Asp Lys Pro Val Phe Ala Ser Ser

50 55 60

Thr Pro Val Leu Arg Glu Glu Met Gly Lys Gly 65 70 75 80

Glu Glu Leu Gln Lys Leu Leu Arg Glu Lys Thr

85 90 95

Ala Ala Glu Lys Val Glu Gln Ile Thr Ala Gln

100 105 110

Ser Ala Asp Gly Val Pro Thr Ser Asp Gln Ala

115 120 125

Thr Gly Phe Leu His Phe Lys Lys Glu Lys Tyr

130 135 140

Leu Tyr Gly Glu Leu Ala Lys Gly Gln Ala Pro 145 150 155 160

Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His

165 170 175

Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala

180 185 190

Tyr Asp Gln Ala Lys Tyr Ala Gly Thr Gly Ser

195 200 205

Val Leu His Leu Lys Val Ser Asn Ile Val Val

210 215 220

Cys Gly Gly Ile Lys Gly Leu Leu Ser 225 230 235

Ser Thr Asp Phe Ile Glu Glu Trp Val 245 250 255

Ala Lys Val Lys Ala Lys His Gly Asp Ala Pro

260 265 270

Thr His Cys Glu Lys Glu Ala Val Asn Val Ser

275 280 285

Thr Tyr Pro Phe Val Arg Glu Gly Leu Val Asn

Phe Pro 240

Lys Ile

Ser Ser Pro Ile Ser Asn Ser Ser Tyr Asp Glu Leu Leu Gly Ser Glu Asp Thr Pro Phe Val Leu Asn Met Ala Ile Ile Gly Phe Asp Gly Leu Phe Gly Leu Gly Lys Thr

Leu Ser Pro Val Ser Ala Phe Pro Ser Pro Ile Ile Glu Ala Ile Lys Ala Thr Thr Thr Ala Arg Ile Lys Lys Pro Ala Met Val Phe Asp Phe Gln Val Pro Pro Glu Tyr Ala His Ser Ala Gly Ala Tyr Pro Ala Lys Glu Leu Cys Asn Leu Leu Leu Ala Leu

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 290 295 300

Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser 305 310 315 320

Leu Glu Phe Gly Leu Ser Ser Thr Phe Ser Val

325 330

<210> 150 <211> 471 <212> DNA

<213> Medicago truncatula <4 00> 150

atggtatttg cttgctctga ctctagagtg agtccctcta ggagaagctt tcatggtccg aaacattgct aacatggtcc aacatcttgg ttattggaca tagtcgctgc ggtggaatct ggatggctgc tccataatga ttgggtgaaa attggtttat aaagaacatg aatgctgtga tttcaaagaa caatgcaaat aataattcat tagtgaacct gaagacatat ctatatgttg aacttagcac tattgggagg ttactatgat tttgtgaatg tataagaccc atgtcactaa acccattaca atcccctcta <210> 151 <211> 156 <212> PRT

<213> Medicago truncatula <400> 151

Met Val Phe Ala Cys Ser Asp Ser Arg Val Ser

10 15

Asn Phe Gln His Gly Glu Ala Phe Met Val Arg

25 30

Val Pro Thr Phe Asn Gln Val Glu Asn Ile Leu

40 45

Arg Cys Gly Gly Ile Ser Arg Leu Met Pro Ser

50 55 60

His Asn Asp Trp Val Lys Ile Gly Leu Ser Phe 65 70 75 80

Lys Glu His Glu Cys Cys Asp Phe Lys Glu Gln

85 90 95

Met Glu Ser Val Asn Asn Ser Leu Val Asn Leu

100 105 110

Val Asp Arg Glu Val Arg Asn Lys Asn Leu Ala

115 120 125

Tyr Asp Phe Val Asn Gly Glu Phe Lys Leu Trp

130 135 140

Val Thr Lys Pro Ile Thr Ile Pro Ser Lys Arg 145 150 155

<210> 152 <211> 828 <212> DNA

<213> Arabidopsis thaliana <4 00> 152

atggtgaact actcatcaat cagttgcatc ttctttgtgg attgtttcga tttcgagtgc tgcttcaagt cacggagaag aactacaaga agaacgatga gaaggggcca gagagatggg gaaatgtgtg gaaaaggaga gatgcaatct cccatagatc attgtttctc atcttggaag gcttaataga gactataatc aacagaggcc atgacatcat gttaaaattt gaagatggag ggttttgaat atgaacttca acagcttcac tggcactctc ggaagaaggt ttgcacttga gctgcatatg gttcacgaag gttgtgactg tgttgtacaa gatcggaaga gcagatactt gaattagagg gcattgctga aatggaggag gctgagaaaa accaaaatta agatcggaag cagaaaatat tacagataca ccttgcactc aaaacgttac ttggagcgtc gttagaaagg caagtgaagc tcctccgcgt ggcagtgcac gatgatgcta caaccaacca acaagcgcat agtgcactta tacagaccaa <210> 153

Phe Glu Leu Trp Gly

ttatcctgaa ctacatttaa caaggcttat ctttcaaagt tttgtgaaat atagagaagt gagaattcaa aaagaccttg

ctttcaacat tcaggtggag gccttccaga caaggttctg ggaatcag tg aaggaacaag gctctggaag a 471

Pro Ser Asn Ile Val Ile Arg Gly Lys Val Cys Lys Lys Thr Leu Leu Lys Tyr Pro

Ile Ile Leu Ala Asn Met Gly His Ser Trp Leu Leu Lys Val Leu Phe Cys Glu Tyr Leu Tyr Gly Gly Tyr Lys Thr His

ctctgtttag ttgaggacga gagaacttaa ttatgaacga cttcaaatgc caggaactat cgtctgaaca gcaggaatag ttatcagatc atgtaggaat ctggttcact ttaggaccgt attcgaatgc tagtttaa

tattttcaca acgcgagttt accggaatgg gagagttaac aactcttaag taagatcaat tactattaat aagaatggct gttggagaaa gattgatccc taccactcct gacaagaaaa gaggccggtt 828

60 120 180 240 300 360 420

60 120 180 240 300 360 420 480 540 600 660 720 780 <211> 275 <212> PRT

<213> Arabidopsis thaliana <4 00> 153

Met Val Asn Tyr Ser Ser Ile Ser Cys Ile Phe

1

5

10

15

Ser Ile Phe Thr Ile Val Ser Ile Ser Ser Ala

25 30

Glu Val Glu Asp Glu Arg Glu Phe Asn Tyr Lys

40 45

Gly Pro Glu Arg Trp Gly Glu Leu Lys Pro Glu

50 55 60

Lys Gly Glu Met Gln Ser Pro Ile Asp Leu Met

65 70 75 80

Ile Val Ser His Leu Gly Arg Leu Asn Arg Asp

85 90 95

Ala Thr Leu Lys Asn Arg Gly His Asp Ile Met

100 105 110

Gly Ala Gly Thr Ile Lys Ile Asn Gly Phe Glu

115

120

125

Leu His Trp His Ser Pro Ser Glu His Thr Ile

130

135

140

Ala Leu Glu Leu His Met Val His Glu Gly Arg

145

150

155

160

Val Val Thr Val Leu Tyr Lys Ile Gly Arg Ala

165 170 175

Ser Leu Glu Lys Glu Leu Glu Gly Ile Ala Glu

180 185 190

Lys Asn Val Gly Met Ile Asp Pro Thr Lys Ile

195 200 205

Lys Tyr Tyr Arg Tyr Thr Gly Ser Leu Thr Thr

210 215 220

Asn Val Thr Trp Ser Val Val Arg Lys Val Arg 225 230 235 240

Gln Val Lys Leu Leu Arg Val Ala Val His Asp

245 250 255

Ala Arg Pro Val Gln Pro Thr Asn Lys Arg Ile

260 265 270

Pro Ile Val

275 <210> 154 <211> 987 <212> DNA

<213> Flaveria pringlei <4 00> 154

atgtatgcta cagctgccgc atttgcaccc tccttcacca tcgtcgtctt ccaccgtatc cacttgcttt gcaaggctta tcgtcgtctg ccactccacc acccagcctc atccgtaatc actcccatca tcacccccac tgtgagagga gacatgggaa attgctgcac tcaagaagct tttaagtgaa aaggaggagt aaaatcgacg aaatcacggc ccaacttcaa actctcgaca gtcgagagga tcaaaaccgg gtttgccaag ttcaagaccg gctttgtacg atgaactttc caaaggccag agcccaaaat gactctcgag tttgcccgtc acacgtgctg gatttccaac cgtaacgtag ccaacattgt cccccccttt gataagctta gcagtcgagt atgcagttct gcatctcaag gtggagcaga aaatgtggtg ggatcaaggg tctgatgact ttccccgatg ttcattgagg actgggtcag agttggtctc cctgcaaagt ggaagtgcat cacttgatga tcaatgtgta tcctgcgaga cttgcaaacc tgttgactta cccgtttgtg agaaacggat ctcaagggtg cacactatga ctttgttaac ggggcctttg agcctttcgc ctcctacctc ggcataa <2 10> 155

Phe Val Ala Ser Lys Asn Trp Glu Asn Glu Tyr Asn Leu Lys Tyr Glu Asn Gly Asn Arg Asp Thr Met Glu Lys Ile Pro Pro Thr Val Asp Ala Val His

Ala Leu Phe Ser His Gly Asp Glu Lys Met Cys Gly Arg Val Asn Pro Ser Asn Phe Glu Asp Leu Gln Gln Arg Arg Phe Arg Met Ala Phe Ile Arg Glu Ala Glu Gly Ser Arg Cys Thr Gln Thr Arg Lys Asn Ser Asn Leu Tyr Arg

cctcccgccg gcaacagcgc agcccgtttt gtgaatcata tggcacctgt ccaaacctgc agaaatacct ttatggtttt ccggtgaggc aatacgctgg tagtcgtaat agggaccgac caaaggtgaa aggaggcggt tgatgaacaa agttgtgggg 987

caaaccgtca tcagtcgtcg tgccgccccg tgatgaggca ggctgctgcc atttgacgcg gacaaatcca tgcatgctct gtttgtggtc agtaggatcc tgggcatagt cagcaccgac agcggagcat gaatgtgtct aacattggcg gcttgatttc

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 <211> 328 <212> PRT

<213> Flaveria pringleí <400> 155

Met Tyr Ala Thr Ala Ala Ala Phe Ala Pro Ser

10 15

Arg Lys Pro Ser Ser Ser Ser Ser Thr Val Ser

25 30

Leu Ser Asn Ser Ala Gln Ser Ser Ser Ser Ser

40 45

Ser Leu Ile Arg Asn Gln Pro Val Phe Ala Ala

0 5 5 60

Thr Pro Thr Val Arg Gly Asp Met Gly Ser Glu 65 70 75 80

Ile Ala Ala Leu Lys Lys Leu Leu Ser Glu Lys

85 90 95

Val Ala Ala Ala Lys Ile Asp Glu Ile Thr Ala

100 105 110

Asp Thr Lys Pro Ala Phe Asp Ala Val Glu Arg

115 120 125

Ala Lys Phe Lys Thr Glu Lys Tyr Leu Thr Asn

130 135 140

Glu Leu Ser Lys Gly Gln Ser Pro Lys Phe Met 145 150 155 160

Asp Ser Arg Val Cys Pro Ser His Val Leu Asp

165 170 175

Ala Phe Val Val Arg Asn Val Ala Asn Ile Val

180 185 190

Leu Lys Tyr Ala Gly Val Gly Ser Ala Val Glu

195 200 205

Leu Lys Val Glu Gln Ile Val Val Ile Gly His

210 215 220

Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly 225 230 235 240

Phe Ile Glu Asp Trp Val Arg Val Gly Leu Pro

245 250 255

Lys Ala Glu His Gly Ser Ala Ser Leu Asp Asp

260 265 270

Glu Lys Glu Ala Val Asn Val Ser Leu Ala Asn

275 280 285

Phe Val Arg Asn Gly Leu Met Asn Lys Thr Leu

290 295 300

His Tyr Asp Phe Val Asn Gly Ala Phe Glu Leu 305 310 315 320

Ser Leu Ser Pro Pro Thr Ser Ala 325

<210> 156 <211> 996 <212> DNA

<213> Flaveria Iinearis <4 00> 156

atgtatgcca cagctgccgc attaattgca ccctccttca tcatcgtcgt cttccaccgt atccgctccc ttcgcaaggc gcgtcgtcgt cgttgtctgc cactccacca ccgagcctca gccgccccga ctcccatcat cacccccact gtgagaggag gacgaggcaa ttgctgcact gaagaagctt ttaagtgaaa gctgctgcaa aaatcgacga aatcacct.cc caacttcaaa tttgacgcgg tcgagaggat caaaaccggc tttgccaagt acaaatccag ctttgtacga tgaactttcc aaaggccaga gcatgctctg actctcgagt ttgcccgtca cacgtgctcg tttgt.ggtcc gtaacgtagc caacattgtc cccccctttg gtaggatccg ctgtcgagta tgcagttttg catctcaagg gggcatagta aatgtggtgg gatcaagggt ctgatgactt

Phe Thr Thr Cys Ala Thr Pro Thr Ser Tyr Glu Glu Gln Leu Ile Lys Pro Ala Val Phe Phe Gln Pro Pro Tyr Ala Ser Lys Pro Thr Ala Lys Gln Cys Leu Leu Ala Leu Trp Gly

Thr Ser Arg Phe Ala Arg Pro Pro Pro Pro Ile Ile Asp Glu Ala Leu Ala Pro Gln Thr Leu Thr Gly Phe Leu Tyr Asp Ala Cys Ser Pro Gly Glu Phe Asp Lys Val Leu His Cys Gly Gly Ser Thr Asp Ser Lys Val Val Ser Cys Thr Tyr Pro Lys Gly Ala Leu Asp Phe

ccacctctct taattaccaa tccgtaacca acatgggaag gggaggattt cgctcgacac tcaagaccga gcccaaaatt atttccaacc ataagcttaa tggagcagat tcccggacga

ccgcaaaccg caactcgctg gcccgttttt tgaatcatat ggcacctgtg caaacccgca gaaatacttg tatggttttt tggtgaggcg atatgctgga agttgtaatt aggaccgaca

60 120 180 240 300 360 420 480 54 0 600 660 720 agcaccgact tcattgagga ctgggtcaga gttggtctcc ctgcaaagtc aaaggtgaaa 780 gcggagcatg gaagtgcatc aattgatgat caatgtgtat cctgcgagaa ggaggcggtg 840 aatgtgtctc ttgcaaacct gttgacttac ccgtttgtga gaaacggatt gataaacaaa 900 acattggcgc tcaagggtgc acactatgac tttgttaacg ggacctttga gttgtggggg 960 cttgatttct gcctttcgcc tcctacctcg gcataa 996

<210> 157 <211> 331 <212> PRT

<213> Flaveria línearís <4 00> 157

Met Tyr Ala Thr Ala Ala Ala Leu Ile Ala Pro Ser Phe Thr Thr Ser 10 15

Leu Arg Lys Pro Ser Ser Ser Ser Ser Thr Val Ser Ala Pro Phe Ala

25 30

Arg Leu Ile Thr Asn Asn Ser Leu Ala Ser Ser Ser Lcu Ser Ala Thr

40 45

Pro Pro Pro Ser Leu Ile Arg Asn Gln Pro Val Phe Ala Ala Pro Thr

50 55 60

Pro Ile Ile Thr Pro Thr Val Arg Gly Asp Met Gly Ser Glu Ser Tyr 65 70 75 80

Asp Glu Ala Ile Ala Ala Leu Lys Lys Leu Leu Ser Glu Arg Glu Asp

85 90 95

Leu Ala Pro Val Ala Ala Ala Lys Ile Asp Glu Ile Thr Ser Gln Leu

100 105 110

Gln Thr Leu Asp Thr Lys Pro Ala Phe Asp Ala Val Glu Arg Ile Lys

115 120 125

Thr Gly Phe Ala Lys Phe Lys Thr Glu Lys Tyr Leu Thr Asn Pro Ala

130 135 140

Leu Tyr Asp Glu Leu Ser Lys Gly Gln Ser Pro Lys Phe Met Val Phe 145 150 155 160

Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln

165 170 175

Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Ile Val Pro Pro

180 185 190

Phe Asp Lys Leu Lys Tyr Ala Gly Val Gly Ser Ala Val Glu Tyr Ala

195 200 205

Val Leu His Leu Lys Val Glu Gln Ile Val Val Ile Gly His Ser Lys

210 215 220

Cys Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro Thr 225 230 235 240

Ser Thr Asp Phe Ile Glu Asp Trp Val Arg Val Gly Leu Pro Ala Lys

245 250 255

Ser Lys Val Lys Ala Glu His Gly Ser Ala Ser Ile Asp Asp Gln Cys

260 265 270

Val Ser Cys Glu Lys Glu Ala Val Asn Val Ser Leu Ala Asn Leu Leu

275 280 285

Thr Tyr Pro Phe Val Arg Asn Gly Leu Ile Asn Lys Thr Leu Ala Leu

290 295 300

Lys Gly Ala His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Gly 305 310 315 320

Leu Asp Phe Cys Leu Ser Pro Pro Thr Ser Ala

325 330

<210> 158 <211> 828 <212> DNA

<213> Arabidopsís thalíana <4 00> 158

atgggaaccc taggcagagc attttactcg gtcggttttt ggatccgtga gctcttgatc gcctcggttg tcgccttcaa ggcaaaaatt acttccgaga aggcatcgga cactgatgaa tgtatttgat aaggctccga ttgtggacaa gtggcaccaa gcgcctcagt tattggggac gttcacattg gaagaggatc gtccatttgg tatggatgcg tattacgagg cgatgtgaac accgtaagtg ttgggtcai caggacaact cacttgtgca tgtggcaaaa tcaaacttaa gcgggaaggt gcacccaacc

gactggtcaa 60 acaactgtca 120 ggaagctttt 180 gtccatttgg 240 aactaatatt 300 gcacccaacc 360 ataattggag acaatgtaac cattggtcat agtgctgttt tacatggatg tactgttgag 420 gatgagacct ttattgggat gggtgcgaca cttcttgatg gggtcgttgt tgaaaagcat 480 gggatggttg ctgctggtgc acttgtacga caaaacacca gaattccttc tggagaggta 540 tggggaggaa acccagcaag gttcctcagg aagctcactg atgaggaaat tgcttttatc 600 tctcagtcag caacaaacta ctcaaacctc gcacaggctc acgctgcaga gaatgcaaag 660 ccattaaatg tgattgagtt cgagaaggtt ctacgcaaga agcatgctct aaaggacgag 720 gagtatgact caatgctcgg aatagtgaga gaaactccac cagagcttaa cctccctaac 780 aacatactgc ctgataaaga aaccaagcgt ccttctaatg tgaactga 828

<210> 159 <211> 275 <212> PRT

<213> Arabidopsis thaliana <400> 159

Met Gly Thr Leu Gly Arg Ala Phe Tyr Ser Val Gly Phe 10 15

Glu Thr Gly Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu

25 30

Asn Tyr Phe Arg Glu Gln Leu Ser Arg His Arg Thr Leu

40 45

Phe Asp Lys Ala Pro Ile Val Asp Lys Asp Ala Phe Val

50 55 60

Ala Ser Val Ile Gly Asp Val His Ile Gly Arg Gly Ser 65 70 75 80

Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Thr Val Ser

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala

100 105 110

Leu Ser Gly Lys Val His Pro Thr Ile Ile Gly Asp Asn

115 120 125

Gly His Ser Ala Val Leu His Gly Cys Thr Val Glu Asp

130 135 140

Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val 145 150 155 160

Gly Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr

165 170 175

Ser Gly Glu Val Trp Gly Gly Asn Pro Ala Arg Phe Leu

180 185 190

Thr Asp Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr

195 200 205

Asn Leu Ala Gln Ala His Ala Ala Glu Asn Ala Lys Pro

210 215 220

Ile Glu Phe Glu Lys Val Leu Arg Lys Lys His Ala Leu 225 230 235 240

Glu Tyr Asp Ser Met Leu Gly Ile Val Arg Glu Thr Pro

245 250 255

Asn Leu Pro Asn Asn Ile Leu Pro Asp Lys Glu Thr Lys

260 265 270

Asn Leu Asn

275 <210> 160 <211> 874 <212> DNA

<213> Gossypium hirsutum <4 00> 160

catttcgagc tttgtttcct aatcactcgc ccgctgcgca atcaccgatc aaagctgaag 60 atgggaagcc ttggaaaagc aatatacacc gtcggattct ggattcggga gaccggtcag 120 gctctcgatc gcctaggctg ccgcctacaa ggcaactatt ttttccagga gcaactttct 180 aggcatcgga ctctgatgaa cgtatttgat aaatctcctc tggtggacaa ggatgcattt 240 gtagccccta gcgcatctgt cattggcgat gttcaggtgg gaagaggatc atctatttgg 300 tatggatgtg ttttaagggg ggatgtcaac agcattagtg ttggatctgg aactaatata 360 caagacaact cccttgtgca tgttgcaaag tctaatctaa gtgggaaagt gctaccaact 420 aacattggaa acaatgttac tgtaggtcat agtgctgttt tacatggctg taccgttgag 480 gatgaagcat ttgttggcat gggagccaca cttcttgatg gtgtagttgt ggaaaaacat 540

Trp Ile Arg Gln Gly Lys Met Asn Val Ala Pro Ser Ser Ile Trp Val Gly Ser Lys Ser Asn Val Thr Ile Glu Thr Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Ser Leu Asn Val Lys Asp Glu Pro Glu Leu Arg Pro Ser gctatggttg ctgctggagc ccttgtaaga cagaatacaa tggggaggca atcctgctaa attcctgagg aagctaactg tcccagtcag ccaccaatta taccaacctt gcacaggtac ccctttgatg aaattgaatt tgagaaaatt cttcgcaaga gagtatgact caatgctggg tgttgtccgt gaaactccac aatgtcctac cagataaaga gcaaaagtcc tctc <210> 161 <211> 273 <212> PRT

<213> Gossypium hírsutum <4 00> 161

Met Gly Ser Leu Gly Lys Ala Ile Tyr Thr Val

10 15

Glu Thr Gly Gln Ala Leu Asp Arg Leu Gly Cys

25 30

Tyr Phe Phe Gln Glu Gln Leu Ser Arg His Arg

40 45

Phe Asp Lys Ser Pro Leu Val Asp Lys Asp Ala

50 55 60

Ala Ser Val Ile Gly Asp Val Gln Val Gly Arg 65 70 75 80

Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His

100 105 110

Leu Ser Gly Lys Val Leu Pro Thr Asn Ile Gly

115 120 125

Gly His Ser Ala Val Leu His Gly Cys Thr Val

130 135 140

Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val 145 150 155 160

Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln

165 170 175

Ala Gly Glu Val Trp Gly Gly Asn Pro Ala Lys

180 185 190

Thr Glu Glu Glu Ile Ala Phe Ile Ser Gln Ser

195 200 205

Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala

210 215 220

Ile Glu Phe Glu Lys Val Leu Arg Lys Lys Phe 225 230 235 240

Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu

245 250 255

Ile Leu Pro Asp Asn Val Leu Pro Asp Lys Glu 260 265 270

Lys

<210> 162 <211> 1217 <212> DNA

<213> Lycopersicon esculentum <4 00> 162

aggcatgtgg tattcactat tctgccctac caattactct actcaatcgt cccttttgct acacaaacac cttgactgca agggctaaac cgaaagaaga agaaggagga ggtcaaacat tttactccct gggatccatc gttcgagcga ccggcaaagc gcctacaagg cagctcccac atagaggaac acctgtccag tattcgataa agctccggtg gtggataagg atgtatttgt ttggagatgt ccatgtggga cgcaattcat ctatttggta atgttaacag catcagtgtc ggatctggta ccaatataca tggccaaatc aaatataagt caaaaggtgc tgcccaccat ttggtcatag tgctgttgta catggctgca ccattgagga gggccacact gcttgatggt gttcatgtag agaaacatigc

ggatccctgc tggagaggtg 600

aagaagagat agcgtttatt 660

atgctgctga gaatgcaaaa 720

agtttgcgaa gagggatgaa 780

cagaactaat tcttccagac 840 874

Gly Phe Arg Leu Thr Leu Phe Val Gly Ser Ile Ser Val Ala Asn Asn Glu Asp Val Val Asn Thr Phe Leu Ala Thr Lys Pro Ala Lys Thr Pro Gln Lys

Trp Ile Arg Gln Gly Asn Met Asn Val Ala Pro Ser Ser Ile Trp Val Gly Ser Lys Ser Asn Val Thr Val Glu Ala Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Thr Phe Asp Glu Arg Asp Glu Pro Glu Leu Ser Ser Gln

gtggaaagcc cagctctact gggaaccctc tcttgatcgc gcatcggact agctccaggt tggatgtgta ggacaactcc catagggaac tgaggccttc catggttgct

ttcatttctc gatcagaaag gggaaagcaa gtcggaaatc cttatgaacg gcctcagtca ctaagaggtg cttgttcatg aatgttactg attggtatgg gcaggagccc

60 120 180 240 300 360 420 480 540 600 660 ttgtgaaaca gaacacaagg attccctccg gagaggtatg ggcaggcaat cccgctaagt 720 ttctgaggaa gctaactgat gaagagatag ccttcattgc tcagtcagca accaactact 780 gtaaccttgc tcgtgtccat gcagctgaga actccaagtc ctttgacgaa attgaatttg 840 aaaagatgct tcgtaagaag tatgccaaac gtgatgagga atatgattct atgattggtg 900 ttgtccgtga aacacctccc gagcttgtac ttcctgataa tatcctcccc gaaaaagctg 960 ctaagagcat cgcccaatga gatcagtgcc caagcaactc tctctttttt tgctttccag 1020 agatttattt tacaccgtga gcatctgtat ggagaacagt catggatatt ggctgttacc 1080 cttccaaata atatcaaact tattggatag catcggtacg tcactgcttt gtagttaaga 1140 cttttgcccc ttatttccca gaaattcttc agcttggaaa aggaagttac gcccgaaaaa 1200 aaaaaaaaaa aaaaaaa 1217

<210> 163 <211> 273 <212> PRT

<213> Lycopersicon esculentum <4 00> 163

Met Gly Thr Leu Gly Lys Ala Ile Tyr Ser Leu Gly Ser 10 15

Ala Thr Gly Lys Ala Leu Asp Arg Val Gly Asn Arg Leu

25 30

Ser His Ile Glu Glu His Leu Ser Arg His Arg Thr Leu

40 45

Phe Asp Lys Ala Pro Val Val Asp Lys Asp Val Phe Val

50 55 60

Ala Ser Val Ile Gly Asp Val His Val Gly Arg Asn Ser 65 70 75 80

Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala

100 105 110

Ile Ser Gln Lys Val Leu Pro Thr Ile Ile Gly Asn Asn

115 120 125

Gly His Ser Ala Val Val His Gly Cys Thr Ile Glu Asp

130 135 140

Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val His Val 145 150 155 160

Ala Met Val Ala Ala Gly Ala Leu Val Lys Gln Asn Thr

165 170 175

Ser Gly Glu Val Trp Ala Gly Asn Pro Ala Lys Phe Leu

180 185 190

Thr Asp Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr

195 200 205

Asn Leu Ala Arg Val His Ala Ala Glu Asn Ser Lys Ser

210 215 220

Ile Glu Phe Glu Lys Met Leu Arg Lys Lys Tyr Ala Lys 225 230 235 240

Glu Tyr Asp Ser Met Ile Gly Val Val Arg Glu Thr Pro

245 250 255

Val Leu Pro Asp Asn Ile Leu Pro Glu Lys Ala Ala Lys 260 265 270

Gln

<210> 164 <211> 1962 <212> DNA <213> Zea mays <4 00> 164

atgtacacat tgcccgtccg tgccaccaca tccagcatcg tgccagcctg ccacccccgc 60 gccgtcctcc tcctccggct ccggccccca ggctcaggct catccggaac gccccgtctt 120 cgccgccccg ccaccgtcgt gggcatggac cccaccgtcg agcgcttgaa gagcgggttc 180 cagaagttca agaccgaggt ctatgacaag aagccggagc tgttcgagcc tctcaagtcc 240 ggccagagcc ccaggtacat ggtgttcgcc tgctccgact cccgcgtgtg cccgtcggtg 300 acactgggac tgcagcccgg cgaggcattc accgtccgca acatcgcttc catggtccca 360 ccctacgaca agatcaagta cgccggcaca gggtccgcca tcgagtacgc cgtgtgcgcg 420 ctcaaggtgc aggtcatcgt ggtcattggc cacagctgct gcggtggcat cagggcgctc 480

Ile Val Arg Gln Gly Ser Met Asn Val Ala Pro Gly Ser Ile Trp Val Gly Ser Lys Ser Asn Val Thr Val Glu Ala Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Cys Phe Asp Glu Arg Asp Glu Pro Glu Leu Ser Ile Ala ctctccctca aggacggcgc gcccgacaac ttcaccttcg ggcagccctg ccaagaacaa ggtgaagaaa gagcacgcgt tgctccatcc tggagaagga ggccgtgaac gtgtcgctcc ttcgtcaagg aagggctggc cggcgggacg ctcaagctgg gtcaaagggc agttcgtcac atgggagcct ccccaggacg ggcttccagc agttcaaggt caatgtctat gacaagaagc aagtccggcc aggcccccaa gtacatggtg ttcgcctgct tcggtgaccc tgggcctgca gcccgcgaag gccttcaccg gtcccaggct acgacaagac caagtacacc ggcatcgggt tgcgccctca aggtggaggt cctcgtggtc attggccata gcgctcctct ccctcaagga cggcgcgccc gacaacttcc aggatcggca gccctgccaa gaacaaggtg aagaaagagc gaccagtgct ccatcctgga gaaggaggcc gtgaacgtgt taccccttgg tcaaggaagg gctggccggc gggacgtcaa ttcgttaaag ggcagttcgt cacatgggag cctccccagg agcggcttcc agcagttcaa ggtcaatgtc tatgacaaga ctcaagtccg gccaggcccc caagtacatg gtgttcgcct ccgtcggtga ccctgggcct gcagcccggc gaggccttca atggtccccg gctacgacaa gaccaagtac accggcatcg gtgtgcgccc tcaaggtgga ggtcctcgtg gtcattggcc agggcgctcc tctcactcca ggacggcgca cctgacacct gttaagatcg ccttcattgc caagatgaag gtaaagaaag gatgaccagt ggtccattct cgagaaggag gccgtgaacg acctacccct tcgtcaagga agggcttgca aatgggaccc tacgactttg tctcaggaga gttcctcaca tggaaaaagt <210> 165 <211> 653 <212> PRT <213> Zea mays <4 00> 165

Met Tyr Thr Leu Pro Val Arg Ala Thr Thr Ser

10 15

Cys His Pro Arg Ala Val Leu Leu Leu Arg Leu

25 30

Gly Ser Ser Gly Thr Pro Arg Leu Arg Arg Pro

40 45

Met Asp Pro Thr Val Glu Arg Leu Lys Ser Gly

50 55 60

Thr Glu Val Tyr Asp Lys Lys Pro Glu Leu Phe 65 70 75 80

Gly Gln Ser Pro Arg Tyr Met Val Phe Ala Cys

85 90 95

Cys Pro Ser Val Thr Leu Gly Leu Gln Pro Gly

100 105 110

Arg Asn Ile Ala Ser Met Val Pro Pro Tyr Asp

115 120 125

Gly Thr Gly Ser Ala Ile Glu Tyr Ala Val Cys

130 135 140

Val Ile Val Val Ile Gly His Ser Cys Cys Gly 145 150 155 160

Leu Ser Leu Lys Asp Gly Ala Pro Asp Asn Phe

165 170 175

Trp Val Arg Ile Gly Ser Pro Ala Lys Asn Lys

180 185 190

Ala Ser Val Pro Phe Asp Asp Gln Cys Ser Ile

195 200 205

Val Asn Val Ser Leu Gln Asn Leu Lys Ser Tyr

210 215 22 0

Gly Leu Ala Gly Gly Thr Leu Lys Leu Val Gly 225 230 235 240

Val Lys Gly Gln Phe Val Thr Trp Glu Pro Pro

245 250 255

Arg Leu Thr Ser Gly Phe Gln Gln Phe Lys Val

tggaggactg ccgtgccgtt agaacctcaa ttggcgccca ccatcgagcg cggagctttt ccgactcccg ttcgcaacat ccgccatcga gctgctgcgg acttcgtgga acgcgtccgt cgctccagaa gtggttggcc acgccatcga agccggagct gctccgactc ccgttcgcaa ggtccgccat atagctgctg tccacttcgt agcacgcctc tgtccctgga tcaagctgat ga

ggtcaggatc cgatgaccag gagctacccc ctacagcttc cttgacgagc cgggcctctc tgtgtgcccg cgccgccatg gtacgctgtg tggcatcagg ggactgggtc gccgttcgat cctcaagagc ccactacgac gcgcttgacg tttcgggcct ccgtgtgtcc catcgccgcc cgagtacgct cggtggcatc cgaggactgg ggtgccgttc gaacctcaag cggcgcccac 1962

Ser Ile Val Arg Pro Pro Ala Thr Val Phe Gln Lys Glu Pro Leu Ser Asp Ser Glu Ala Phe Lys Ile Lys Ala Leu Lys Gly Ile Arg Thr Phe Val Val Lys Lys Leu Glu Lys Pro Phe Val Ala His Tyr Gln Asp Ala Asn Val Tyr

Pro Ala Gly Ser Val Gly Phe Lys Lys Ser Arg Val Thr Val Tyr Ala Val Gln Ala Leu Glu Asp Glu His Glu Ala Lys Glu Ser Phe Ile Glu Asp Lys

540 600 660 720 7 80 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 192 0 260

265

270

Lys Pro Glu Leu Phe Gly Pro Leu Lys Ser Gly

275

280

285

Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys

290

295

300

Gly Leu Gln Pro Ala Lys Ala Phe Thr Val Arg

305

310

315 320

Val Pro Gly Tyr Asp Lys Thr Lys Tyr Thr Gly

325 330 335

Glu Tyr Ala Val Cys Ala Leu Lys Val Glu Val

340 345 350

His Ser Cys Cys Gly Gly Ile Arg Ala Leu Leu

355 360 365

Ala Pro Asp Asn Phe His Phe Val Glu Asp Trp

370 375 380

Pro Ala Lys Asn Lys Val Lys Lys Glu His Ala 385 390 395 400

Asp Gln Cys Ser Ile Leu Glu Lys Glu Ala Val

405 410 415

Asn Leu Lys Ser Tyr Pro Leu Val Lys Glu Gly

420 425 430

Ser Ser Gly Trp Pro His Tyr Asp Phe Val Lys

435 440 445

Trp Glu Pro Pro Gln Asp Ala Ile Glu Arg Leu

450 455 460

Gln Phe Lys Val Asn Val Tyr Asp Lys Lys Pro 465 470 475 480

Leu Lys Ser Gly Gln Ala Pro Lys Tyr Met Val

485 490 495

Ser Arg Val Ser Pro Ser Val Thr Leu Gly Leu

500 505 510

Phe Thr Val Arg Asn Ile Ala Ala Met Val Pro

515 520 525

Lys Tyr Thr Gly Ile Gly Ser Ala Ile Glu Tyr

530 535 540

Lys Val Glu Val Leu Val Val Ile Gly His Ser 545 550 555 560

Arg Ala Leu Leu Ser Leu Gln Asp Gly Ala Pro

565 570 575

Val Glu Asp Trp Val Lys Ile Ala Phe Ile Ala

580 585 590

Lys Glu His Ala Ser Val Pro Phe Asp Asp Gln

595 600 605

Lys Glu Ala Val Asn Val Ser Leu Glu Asn Leu

610 615 620

Val Lys Glu Gly Leu Ala Asn Gly Thr Leu Lys 625 630 635 640

Tyr Asp Phe Val Ser Gly Glu Phe Leu Thr Trp 645 650

166 1920 DNA

Zea mays 166

atgtacacat tgcccgtccg tgccaccaca tccagcatcg gcgccgtcct cctcctccgg ctccggccgc cccaggctca gtcttcgccg cccccgccac cgtctgtaaa cgggacggcg agagagatcg agagagaaag aaagggaggg catccaccag ggagagagag gccagagaag aggaggagaa gaagaagaag tccgaaaaaa aaggaggggc cagcgaagga gaagccgtcc actccttcag aaccagaagc cctccaacct ccacctcctc ggcatggacc ccaccgtcga gcgcttgaag agcgggttcc tatgacaaga agccggagct gttcgagcct ctcaagtccg

Gln Ala Pro Ser Asn Ile Ile Gly Leu Val Ser Leu Val Arg Ser Val Asn Val Leu Ala Gly Gln Thr Ser Glu Leu Phe Ala Gln Pro Gly Tyr Ala Val Cys Cys Asp Thr Lys Met Trp Ser Lys Thr Leu Ile Lys Lys

<2 10> <211> <212> <213> <4 00>

Pro Lys Tyr Val Thr Leu Ala Ala Met Ser Ala Ile Val Ile Gly Lys Asp Gly Ile Gly Ser Pro Phe Asp Ser Leu Gln Gly Gly Thr Phe Val Thr Gly Phe Gln Phe Gly Pro Cys Ser Asp Gly Glu Ala Asp Lys Thr Cys Ala Leu Gly Gly Ile Phe His Phe Lys Val Lys Ile Leu Glu Tyr Pro Phe Gly Ala His

tcgccagcct ggctcatccg ggcagctgag ccggcgggca atgagcagct acagataccc cctccaaggc agaagttcaa gccagagccc

cgccaccccc 60

gaacgccccc 120

gagtcaaacg 180

taagagggga 240

gcctctgcct 300

ccacctcgtc 360

ttcctccaag gaccgaggtc caggtacatg

420 480 540 gtgttcgcct gaggcattca gccggcacag gtcattggcc cccgacaact gtgaagaaag gccgtgaacg ggcgggacgc tgggagcctc. aatgtctatg tacatggtgt ccgggcgagg aagtacaccg ctcgtggtca ggcgcagcct atgaaggtaa aaggaggccg cttgcaaatg ctcacatgga atcatcataa aatgtgaatg atcgcccaat gaggcttttt

gctccgactc ccgtccgcaa ggtccgccat acagctgctg tcaccttcgt agcacgcgtc tgtcgctcca tcaagctggt cccaggacgc acaagaagcc tcgcctgctc ccttcaccgt gcatcgggtc ttggccatag acaccttcca agaaagagca tgaacgtgtc ggaccctcaa aaaagtgaaa tatatatact cgtcgagtac gtgaatgtaa atgtactata

ccgcgtgtgc catcgcttcc cgagtacgcc cggtggcatc ggaggactgg cgtgccgttc gaacctcaag tggcgcccac catcgagcgc ggagcttttc cgactcccgt tcgcaacatc cgccatcgag ctgctgcggt cttcgtcgag cgcctcggtg cctggagaac gctgatcggc aactagggct ataactatac tatctgtttt taagcaatat tcttatatga

ccgtcggtga atggtcccac gtgtgcgcgc agggcgctcc gtcaggatcg gatgaccagt agctacccct tcacacttcg ttgacgagcg gggcctctca gtgtgcccgt gccgccatgg tacgctgtgt ggcatcaggg gactgggtta ccgttcgatg ctcaagacct gcccactacg aaggcaattc tactagctac ctgcatctac cattttctac tgaataataa

cactgggact cctacgacaa tcaaggtgca tctccctcaa gcagccctgc gctccatcct tcgtcaagga tcaaagggca gcttccagca agtccggcca cggtgaccct tcccaggcta gcgccctcaa cgctcctctc agatcggctt accagtgctc accccttcgt actttgtctc taccggcccg ctaccgatag atatatatac cacttttcat tatgaccgcc

gcagcccggc gatcaagtac ggtcatcgtg ggacggcgcg caagaacaag ggagaaggag agggctggcc gttcgtcaca gttcaaggtc ggcccccaag gggcctgcag cgacaagacc ggtggaggtc actccaggac cattgccaag cattctcgag caaggaaggg aggagagttc ccgactctgc tcacccgagc cggatcaaca tcctaacgct ttgtgatcta

<210> <211> <212> <213> <4 00> Met Tyr 1

Leu Leu

Cys 50

Arg Glu 65

167 545 PRT Zea 167 Thr 5

Ala Thr 20 Arg Leu 35

Lys Arg

Arg

mays

Leu Pro

Pro Ala 25

Ile Arg 40

Asp Gly

55 Lys 70

Val 10 Pro

Asn

Gly

Arg Al

Ser

Gly Gly His 75

Ala 45

Gln Leu 60

Pro

Thr

15 Ser Ser 30 Pro

Thr Ser

Ser Gly

Val Phe Ala

Arg Ser Gln

Pro 80

Ala Gly

Gly Glu Arg Gly Gln Arg Arg Gly Gly Glu Glu

95

Lys Gly Gly Ala 110

Leu

Val

Gln

85

Pro Leu 100 His Arg 115 Pro

Pro

130 Thr Val 145

Tyr Asp Pro Arg

Pro

Glu

Lys 165 Tyr

Tyr

120 Pro Pro

135 Arg Leu 150 Lys

Met

90

Ser Glu

105 Pro His

jYs

Leu

Pro Ser

Val

125 Lys

Thr Pro Ser

Ala Ser Ser

Pro

Val

195 Ala Ser 210 Ser Ala 22 5 Val

180 Thr Leu

Gly

Met

Ile

Gly 245

Lys Asp Gly 260 y Ser

Val Ii Leu 200 Val Pro

215 Glu Tyr 230 His

Lys

Glu 170 Phe S 5

Gln

140 Ser Gly 155 Leu

Phe

Ala Cys

Phe

Glu 17 5 Ser

Gln 160 Pro

Lys

Leu

Pro

Pro Tyr

190 Gly Glu

205

Asp Lys

Asp Ser

Ala Phe

Ser

Ala Pro

Ala

Cys 250 Asp

220 Val Cys 235 Cys

Ala

Ile G

Pro

265 Ala Lys

Gly Gly 255

Asn Phe Thr 270 Lys Val

Ile

Leu 240 Ile

Lys Lys Arg

Asn

Phe Val

Lys Lys

Ser Ile Val Ser Gly Arg Ala Pro Ala Thr Arg Glu Gly His Lys Glu Glu Asp Ser Glu Gly Glu Pro Glu Lys Gly Met Phe Lys Thr Lys Ser Gly Arg Val Cys Thr Val Arg Tyr Ala Gly Val Gln Val Ala Leu Leu Glu Asp Trp Glu His Ala

Ala Ser Pro Arg Thr Val Ile Glu Arg Gly Glu Gln Glu Ala Ala Leu Asp Pro Glu Val Gln Ser Pro Ser Asn Ile Thr Gly Ile Val Ser Leu Val Arg Ser Val

600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 275 Pro Phe

290 Ser Leu 305 Gly

Gly

280

Asp Asp Gln Cys 295

Gln Asn Leu Lys 310

Leu Lys

Thr Leu Lys Leu 325 330

Gln Phe Val Thr Trp Glu

340 345

Ser Gly Phe Gln Gln Phe

285 Ser Ile

300 Ser Tyr 315

Val Gly

Leu Glu Lys

Pro

Phe 320 His

Val

Ser

Leu

355 Phe

Gly Pro

360 Leu

370 Ala Cys 385

Pro Gly

Ser

375 Asp Ser 390

Ala Phe

Lys Arg

Ala 335

Pro Pro Gln Asp Ala 350

Lys Val Asn Val Tyr 365

Ser Gly Gln Ala Pro 380

Val Cys Pro Ser Val 395 400

Val Arg Asn Ile Ala

Glu Ala Phe Thr Val Arg Asn 405 410 415

Tyr Asp Lys Thr Lys Tyr Thr Gly Ile Gly Ser 420 425 430

Cys Ala Leu Lys Val Glu Val Leu Val Val 440

Gly Ile Arg Ala 455 Phe Val

Val

435 Cys Gly

450 Thr Phe

His

Glu

445 Leu Leu

460 Asp Trp

Ser Leu Gln

Val

465 Met

Lys

Val 485

Ser Ile Leu

500 Thr Tyr Pro 515 Gly

470 Lys

Lys

Ile

530 Lys 545 <2 10> <211> <212> <213> <4 00> gggcagcccg ccagcgtccg ccgccgccaa agactagaga gagaagatga gagcgcttgc ctgttcgagc tcccgttgct aacatcgccg atcgagtacg tgcggtggca gtcgaggact atggctccct tacaacctcc gtcggcggcc cgatttacaa accccatccg atcgtcgtcc taaggccgag acatcaccaa tttttatt <210> 169 <211> 157

Glu 490

Glu Lys Glu

505 Phe Val Lys 520

Ala His Tyr Asp 535

475 His

Ala

Ser 495

Ala Val Asn 510

Glu Gly Leu

525 Phe Val Ser 540

Lys 480 Val

Ile

Pro

Val Ser

Ala Asn

Gly Glu

Glu Ala Lys Glu His Phe Ile Glu Asp Lys Lys Tyr Thr Leu Ala Met Ala Ile Ile Gly Asp Gly Gly Phe Phe Asp Leu Glu Gly Thr Phe Leu

Val Asn Val Gly Leu Ala Val Lys Gly Arg Leu Thr Lys Pro Glu Met Val Phe Gly Leu Gln Val Pro Gly Glu Tyr Ala His Ser Cys Ala Ala Tyr Ile Ala Lys Asp Gln Cys Asn Leu Lys Leu Lys Leu Thr Trp Lys

168

1208

DNA

Urochloa panicoídes 168

cactttaatg cacccccgcg cgccgtcgtg gaggggggcg gcgggtgcct agagcgggtt cactcaagga gcccgtcggt ccatggtccc ccgtctgcgc tcaaggcgct gggtcaggat tcgacgacca tgacctaccc actacgactt ctcctacacc acgtgaatgg ttctatgtga ctttttattt ta tatgtata

tcggcattgg ctctccgccc taaaccggcc agaagtacta ctgcctcccc caagcagttc aggccaggcc gaccctcggc accctacgac cctcaaggtc cctctcaatg cggcttcctc gtgctccatc ctgggtgaag cgtcaagggc atcatacata gtggagtgct atgtaataag taccatatga agccttcttc

ccatccgtgc gccgccgccc ggcgcacggg gtaggtcgaa ggctacaaaa aagagcgagg cccacgtaca ctgaagcccg aagaatcggt aaggtcctca caggacggcg gccaagaaga ttggagaagg gaaggtgtgt gcgttcgtca tatacatacg cactacctat caatagcatc tgcataattt ataataatat 1208

agccccgtcc caggctcgtc gagctcgaaa gccggctgtg agaagaccat tctacgacaa tggtgttcgc gcgaggcctt acaccggcat ccgtcatcgg cagccgacaa aggttctcac aggccgtcaa ccaacggctc catgggagaa tacatcgtct tttcggccgc ctctaccgct gaccgccttg ataatcatca

agcatcatcg 60 ggcaacgccg 120 gtcaaacgag 180 ataaaaagag 240 ggaccccgtc 300 gaagccggag 360 ctgctccgac 420 caccgtccgc 480 cgggtccgcc 540 ccacagccgc 600 cttccacttc 660 cgaccacccc 720 cgtctccctg 780 cctcaagctg 840 ataagccacc 900 cccgatatgc 960 tacatacggg 1020 ttaatttcta 1080 tggtcaaaag 1140 agtgtttacc 1200 Gly 5

Glu

<212> <2 13> <4 00> Met Ser 1

Pro Val 20

Tyr Asp Lys 35

Pro Thr

50 Val Thr

PRT

Urochloa pânico ides 169

Cys Leu Cys Leu

Tyr

Arg Leu 25

Lys Pro 40

Met Val

Cys 10 Gln

Glu

Phe

Ser

Leu

65 Ala

Ala

Ser Ala

55 Gly 70 Met Val 85 Ile

Leu 45

Ala Cys 60

Pro Gly

15 Gly Phe 30 Phe

Tyr Lys

Lys

Gln

Lys Lys Phe Lys

Glu Pro Leu Lys Glu Ser Asp Ser Arg Cys

Val

100 Ile Gly

Glu

His

Leu Lys Pro Gly Glu 75 80

Pro Pro Tyr Asp Lys

90 95

Tyr Ala Val Cys Ala

105 110

Ser Arg Cys Gly Gly Ile

Ala Phe Thr Val Tyr Thr

Asn Arg Leu Lys Lys

Val Lys Ala Leu

Gln

115 Asp 130 Ile Gly 145 <210> <211> <212> <213> <4 00> ccgcactgga ccgcaccccc gttgaccatg ctatgacaag ggtgttcgcc cgaggccttc caccggcatc cgtcatcggc agccgacaac ggttctgacc ggcagtcaac caacgggtcc atgggagaaa cccgatatgt cgctacgtac ttaatttcta gtggtcaaaa tttacctttt <210> <211> <212> <213> <4 00> Met Ser

120 125

Gly Ala Ala Asp Asn Phe

135 140

Phe Leu Ala Lys Lys Lys 150 155

170

1034

DNA

Urochloa panicoídes

170

atgtcggcat tggccatccg gcgcaccgcc gccccgggct gaccccgtcg agcgcttgca aagccggagc tgttcgagcc tgctccgact ctcgttgctg accgtccgca acatcgccgc gggtccgcca tcgagtacgc cacagccgct gcggtggcat ttccacttcg tcgaggattg gaccacccca tggctccgtt gtctccctct acaacctcct ctcaagctgg tcggcggcca taagccaccc gatttacagc accccatccg acgtgaacgg cgggtcgtcg ttctatgtga aggccgagct ttttatttat gacatcagct atatatgtat tact

171 240 PRT

Urochloa panicoídes 171

Leu Ala

His Phe Val Glu Asp Val Leu Thr Asp His

Thr Met Asp Ser Glu Val Gly Gln Ala Cys Pro Ser Arg Asn Ile Gly Ile Gly Val Leu Thr Leu Ser Met Trp Val Arg

ctcagccccg cgtcaggaac gagcggcttc actcaaggaa cccgtcggtg catggtccca cgtctgcgcc caaggcgctc ggtcaggatc cgatgaccag gacctacccc ctacgacttc tcctacacca gtggagtact atgtaataag gtaccgtatg aagtcttctt 1

tccagcatca gccgccgcca aagcagttca ggccaggccc accctcggcc ccctacgaca ctcaaggtca ctctccatgc ggcttcctcg tgctccatct tgggtgaagg gtcaaggggg ccgtacatac tactactacc caatagcatt atgcataatt cataatataa 034

tcgccagcgt 60 ccaccgccga 120 agagcgaggt 180 ccacgtacat 240 tgaagcccgg 300 agaaccggta 360 aggtcctcac 420 aggatggcgc 480 cgaagaagaa 540 tggagaagga 600 aaggcgtgtc 660 cgttcgtcac 720 atacgtacat 780 tattttcggc 840 ctctaccgct 900 tgacctcctt 960 tcataaagtg 1020

1

Val Ala

Ala

5 Thr

Arg 20 Thr Thr 35 Phe

Pro

Gly 50

Phe Glu 65

Cys Ser

Ala 25

Ala Glu 40

Gln Phe

55 Leu Lys 70

Asp Ser Arg 8 5

Lys

Pro

Ile

10

His

Leu

Lys

Glu

75 Cys Cys 90

Arg Ser Ala 15

Arg Arg Pro 30

Thr Met 45

Ser Glu 60

Gly Gl.n

Pro 95

Pro Ser Ser Ile Ile Ala Ser Gly Leu Val Arg Asn Ala Ala Asp Pro Val Glu Arg Leu Gln Ser Val Tyr Asp Lys Lys Pro Glu Leu

Ala Pro Thr Tyr Met Val Phe Ala

80

Ser Val Thr Leu Gly Leu Lys Pro Gly Glu Ala Phe Thr Val Arg Asn Ile Ala Ala

100 105 110

Asp Lys Asn Arg Tyr Thr Gly Ile Gly Ser Ala

115 120 125

Cys Ala Leu Lys Val Lys Val Leu Thr Val Ile

130 135 140

Gly Gly Ile Lys Ala Leu Leu Ser Met Gln Asp 145 150 155 160

Phe His Phe Val Glu Asp Trp Val Arg Ile Gly

165 170 175

Lys Val Leu Thr Asp His Pro Met Ala Pro Phe

180 185 190

Ile Leu Glu Lys Glu Ala Val Asn Val Ser Leu

195 200 205

Tyr Pro Trp Val Lys Glu Gly Val Ser Asn Gly

210 215 220

Gly Gly His Tyr Asp Phe Val Lys Gly Ala Phe

Met Val Ile Glu Gly His Gly Ala Phe Leu Asp Asp Tyr Asn Ser Leu Val Thr

Pro Pro Tyr Tyr Ala Val Ser Arg Cys Ala Asp Asn Ala Lys Lys Gln Cys Ser Leu Leu Thr Lys Leu Val Trp Glu Lys

225 <210> <211> <212> <21 3> <4 00>

230

235

240

172 795 DNA

Chlamydomonas reínhardtii 172

atgggatgcg gtgccagcgt gcctcagaat ggtggaggag cccgcgccag cacaaccagt gtctgaggcg caatcggcaa agcaaccgca gcagccttga aaagatcaat tcgctcacgg gtgctgcaga acctgctgga cggcaacatg cgcttcctgg caccaggact tcagccgcgt gcaggccatt aaggccaagc ctgggctgcg ccgactctcg cgtgcctgcg gaaattgtgt gtgttcgtgt: gccgtgtcgc cggcaacatt gctacgccag tatgccgtgc ttgacctcgg agttaaggtg gtgatggtcc gccgtgaagg ctgcactttc aggcaaggcg ttccccggct cacctggacg tcgccatcag ccgcgtcaac agcatgagcg aaggacggcg acgtggacat gctggaccgc gtggtgaagg cagcggtgcc agcgctccgt catcatccag gaggggttgc gcgggcgccg tgtacgacct ggacacgggc aaggtgcacg agcagcgccg agtag <210> 173 <211> 264 <212> PRT

<213> Chlamydomonas reínhardtii <400> 173

Met Gly Cys Gly Ala Ser Val Pro Gln Asn Gly

10 15

Thr Arg Val Met Pro Ala Pro Ala Gln Pro Val

25 30

Ala Ile Ser Phe Gln Pro Ser Arg Ser Asn Arg

40 45

Ile Asn Ser Leu Thr Asp Arg Ala Ser Pro Glu

50 55 60

Leu Leu Asp Gly Asn Met Arg Phe Leu Asp Gly 65 70 75 80

His Gln Asp Phe Ser Arg Val Gln Ala Ile Lys

8 5 90 95

Leu Ala Ala Ile Leu Gly Cys Ala Asp Ser Arg

100 105 110

Val Phe Asp Gln Gly Phe Gly Asp Val Phe Val

115 120 125

Asn Ile Ala Thr Pro Glu Glu Ile Ala Ser Leu

130 135 140

Asp Leu Gly Val Lys Val Val Met Val Leu Gly 145 150 155 160

Ala Val Lys Ala Ala Leu Ser Gly Lys Ala Phe

ctcccgttac tcagcttcca atagggcatc atggcgccgt aaaagcccct tcgaccaagg aggagatcgc tcggacacac tcatcgacac ccaaggcgca agaacgtcaa agaaggggaa tcagcgtcac 7 95

gcgggttatg accatcgcgc gcctgagcag cgcgcatccc cgcggccatc ctttggcgac cagtctggag acgctgcgga gctggtggac ccaggccatc gtaccaggtg cctgctgctg caagggcggc

Gly Gly Ala Ser Glu Ala Ser Ser Leu Gln Val Leu Ala Val Ala Ala Lys Gln Val Pro Ala Cys Arg Val Glu Tyr Ala His Thr Arg Pro Gly Phe

Pro Val Gln Ser Glu Lys Gln Asn His Pro Lys Pro Glu Ile Ala Gly Val Leu Cys Gly Ile Asp

60 120 180 240 300 360 420 480 540 600 660 720 780 Thr

Ser

165 Leu Val 180 Ala Lys

Asp

Ala

17 0 His Leu

185 His Gln

Asp

175 Val Ala

190 Ile Lys

Ile Ser

195 Asp Arg 210 Arg Ser 225

Ala Gly Ala 24 5

Thr Lys Gly Gly 260 174 939 DNA

Chlamydomonas 174

tcaagtctag

Ala

200 205

Lys Glu Asn Val Lys 215 220

Ile Ile Gln Glu Gly Leu 230 235

Val Tyr Asp Leu Asp Thr 250 255

Ser Ser Ala Glu

Val Val

Val

Asp

Tyr

Gln 240 Gly

Gly Gln Lys Lys

Arg Val Asn Ser Met Asp Val Asp Met Leu Val Gln Arg Cys Gln Gly Asn Leu Leu Leu Val His Val Ser Val

<210> <211> <212> <213> <4 00> atgtcgctat gccaaggggc gccgcgctgg gtccagccta ggccaggtgg gtgcccaaca aagctggggg attgaggtgg agcatggacg gccacggtgc ctcgacggag aacaccacca ctggagccgg gccatccaca atcaaggacc gacagccaga <210> 175 <211> 312 <212> PRT <213> <4 00> Met Ser

reinhardtii

cctgcctgcg

ttgttgaggg cacgctttat atgagctggg ctctatggtt acctggcgtt tgcaccagtg tgcccgctcc acccgctgct agcacagcac cgcgttcgtg

cgggctcatc gcgccaacag gcacggcacg acgcctgcac

ggtgtggtat caacatccag gcccaccgtc cattgaggac

cgacggtcaa gagcggctcc tcccctcggg ccaggtgtgg

aggaggccag agttcgagca gcgccgctct cggcgttggt

cttcatcggc gagcaagacg ggccgacccg ggcccgcgcc

ggcttcctat ggactgggct cagggccctc caccgcaagc gctcgcacgc gctgccaacg ggcgccgtgc gacaacgcca atcggcaaca aactgcctgg atcgtggctg gccggctcgc aagtctgcca tttgaggagc tcaaactcag aagaggtag

tcccctatcg ccctgtttcg agggtagtgt cggatgtgcc tgaaaatcaa ccaatgtgct tgcgcggtga tcgtgcacgt atgtgaccat tgggcatggg ccggcgccgt ccgccaagtt gctgctacgc agtacacgga tgcaccagat

gcaccccaag cggcgtgggc caaggaccac cgttaacgcg ggaggtggtt cgggaacgtt cgtgaacggc gtccaagtac tggccacgcc cgccaccgtg ggtgccgccc cctgcgccac cgagctgtcc gagctgcatc gtgggagtac 939

Chlamydomonas reinhardtii 175

1

Arg Gly

Leu 5

His Pro 20 Ser Leu 35 Val

Met 50

Leu Ala 65

Gln

Phe Lys

Lys Ala 25

Phe Arg 40

Gly Pro

Ser 10 Lys

Gly

Gln

Ser

Gly

Ala

Leu Pro

15 Leu Val 30

Gly Ala Ala

Glu

Gly Gly Leu

Phe

Gly Lys

Gln

55 Ala 70 Val Val

Pro

tí'3

Glu Val 100

Asn Ala Asn

Val

Val 75

Ala Pro 90

Val Pro Asn

105 Leu

Val 45

Gly Ser Val Lys Asp 60

His Arg Lys Pro Asp 80

Pro Ala Ala Ala 95

Lys His Ser Thr 110

Trp

115 Tyr

130 Ala Asn 145 Ser

Ile

Met

Gly 1

Gly

Ser

Asp 165 His 30

Gly Asn Val Lys Leu Gly 120 125

Val Leu Arg Gly Asp Val Asn 140

Gln Asp Asn Ala Ile Val

155 160

Ala Arg Pro Thr Val Ile 170 175

Ala Thr Val His Ala Cys Thr 185 190

Ala

135 Asn Ile 150

Gly Thr Ala

Phe Leu Thr Leu Asp Glu His Val Val Pro Arg Thr Ala Phe Ala Gly Gly Ile His Val Gly Asn Ile Glu

Phe Pro Tyr Tyr Gly Leu Leu Gly Ser Gln Pro Asn Val Asn Ala Leu Lys Ile Val Ala Ala Ser Ser Val Glu Val Gly Ser Lys Tyr Asn Val Thr Asp Asn Cys

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 Leu Val Gly Met Gly Ala Thr Val Leu Asp Gly

195 200 205

Gly Ser Ile Val Ala Ala Gly Ala Val Val Pro

210 215 220

Pro Ser Gly Gln Val Trp Ala Gly Ser Pro Ala

225

230

235

240

Leu Glu Pro Glu Glu Ala Ser Phe Ile Gly Lys

245

250

255

Ala Glu Leu Ser Ala Ile His Lys Phe Glu Gln

260

265

Glu Gln Tyr Thr Glu Ser Cys

275

280

270

Ile Ile Lys Asp 285

Asp Pro Ser Asn Ser Val His Gln Met Trp Glu

Ala Thr Val Lys Ser Pro Asn Thr Thr Ile Lys Phe Leu Arg His Ser Ala Ser Cys Tyr Ser Lys Thr Phe Glu Arg Ala Ala Leu Ala Tyr Asp Ser Gln Thr

290

295

300

Ala Leu Val Ala Arg Ala Lys Arg

305 310

<210> 176

<211> 1238

<212> DNA

<213> Oryza sativa

<4 00> 176

ggggctcatc tctctctctc tcactcttct ccctcttctc ccctacctcc cgcggcggcg gcggcggcgg cggccggcgg gagggcgcga gcggagaggg cgaggaggga aggagggagg cctcgggcgc gcgatctaca cggtggggaa gtggatccgc ccgcctcgga tccaccatcc agggcggcct ccgcgtcgag cacgatcatg aacatatttg agaaagagcc cagagtccac cagtgcagct gtgattggcg atgttgagat cggacatgga cattttaaga ggtgatgtca acagcattca tattggatct ttcccttgta catgttgcaa aagctaacat cagcgggaag aaacaatgtt acaataggtc atagtgctgt tctgcacgca ttttgttggt atgggtgcca ctctgcttga tggagtggtc tggtgcagga tcgcttgtta agcagaacac aaggattcct taatcctgcc aagttcctaa gaaagcttac tgaagaggag agcaacgaac tacatcaatc tggcccaagt ccatgctgcc cgagatcgag ctcgagaaga tgctgaggaa aaagtatgcc ttcgatgctc ggcgtggtcc gtgagatccc gccggagctc cccaaacaag gctcagaagg ctgttgctca ctgaatgttt aaagcttggt ttttttgtta cgtgttttga cctggaacaa atctcattgt ctgtttttca agcccaataa gaatttgggt accatataca gtacctctct ttgcattaca atgaagagca acatctttac tgaagtagaa acgcgtcctc tgtctgtg <210> 177 <211> 273 <212> PRT <213> Oryza sativa <4 00> 177

Met Gly Thr Leu Gly Arg Ala Ile Tyr Thr Val

10 15

Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser

25 30

Leu Arg Val Asp Glu Gln Leu Ser Arg His Arg

40 45

Phe Glu Lys Glu Pro Arg Val His Lys Asp Val

50 55 60

Ala Ala Val Ile Gly Asp Ile Glu Ile Gly His 65 7 0 7 5 8 0

Tyr Gly Ser Ile Leu Arg Gly Asp Val Asn Ser

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His

100 105 110

Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly 115 120 125

accaccagac cgagctccgg gaggcgacag ggcacggggc gagcagcttt aaggatgttt tcctcaatct ggatcaaata gttctcccaa tgcaccgtcg gttgaaaagc tctggagagg atagcgttca gagaattcca cacaaagacg atcctcccgg tgtcaagctc catttgacac cgagcattgt gttaatttgg

gccatcaaac 60 acagacagag 120 gcatggggac 180 aggccatgga 240 caaggcatcg 300 ttgttgctcc 360 ggtacggctc 420 tacaagacaa 480 ccataattgg 540 aggatgaagc 600 acagcatggt 660 tctgggtcgg 720 ttgctcagtc 780 agaccttcga 840 aggagtatga 900 acaacatcct 960 ccgcttggga 1020 atgtcttttg 1080 tttaggatcg 1140 gtcacttttt 1200 1238

Gly Lys Trp Ile Arg Thr Ile Gln Gly Gly Thr Ile Met Asn Ile Phe Val Ala Pro Ser Gly Ser Ser Ile Trp Ile His Ile Gly Val Val Ser Lys Ala Asn Asn Asn Val Thr Ile Gly His Ser Ala Val Leu His Ala Cys Ile Val

130 135 140

Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val 145 150 155 160

Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln

165 170 175

Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys

180 185 190

Thr Glu Glu Glu Ile Ala Phe Ile Ala Gln Ser

195 200 205

Asn Leu Ala Gln Val His Ala Ala Glu Asn Ser

210 215 220

Ile Glu Leu Glu Lys Met Leu Arg Lys Lys Tyr 225 230 235 240

Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu

245 250 255

Ile Leu Pro Asp Asn Ile Leu Pro Asn Lys Ala

Glu Asp Val Val Asn Thr Phe Leu Ala Thr Lys Thr Ala His Ile Pro Gln Lys

Glu Ala Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Ile Phe Asp Glu Lys Asp Glu Pro Glu Leu Ala Val Ala

260

265

270

His <210> <2 11> <212> <2 13> <4 00>

178 657 DNA

Oryza satíva 178

atgggttcga ctcgcctcct cgtactgctc gccgccgctt gtcccggcag ccagagcaca ggaagaaact gatcacgagg ggggacgaga aggggccgga gcactggggc aagctgaagc gccggcgaga tgcagtcgcc gatcgacctc tcccacgagc ctcggctacc tcgacgactc ctaccgcgcc gccgaggcct gacatcatgg tcaggttcga cggcgacgcc ggcagcgtcg tacctccgcc agctccactg gcactccccc accgagcaca gacatggagc tgcacatggt ccacgagagc gccgagaaga ctctacgagg tcggccgccc cgaccgcttc ctccaaaaga attgcggaca aggaggacag ggccgccttg cacgcagggg gagggttcgc accgtgtcga ggtatcagct cgaccttctc <210> 179 <211> 275 <212 > PRT <213> Oryza sativa <4 00> 179

Met Gly Ser Thr Arg Leu Leu Val Leu Leu Ala

10 15

Leu Ala Thr Ala Val Pro Ala Ala Arg Ala Gln

25 30

Glu Lys Glu Phe Thr Tyr Ile Ser Gly Asp Glu

40 45

Trp Gly Lys Leu Lys Pro Glu Trp Ala Gln Cys

50 55 60

Gln Ser Pro Ile Asp Leu Ser His Glu Arg Val 65 70 75 80

Leu Gly Tyr Leu Asp Asp Ser Tyr Arg Ala Ala

85 90 95

Asn Arg Gly His Asp Ile Met Val Arg Phe Asp

100 105 110

Val Val Ile Asn Gly Thr Ala Tyr Tyr Leu Arg

115 120 125

Ser Pro Thr Glu His Ser Val Asp Gly Arg Arg

130 135 140

His Met Val His Glu Ser Ala Glu Lys Lys Ala 145 150 155 160

Leu Tyr Glu Val Gly Arg Pro Asp Arg Phe Leu

165 170 175

Tyr Leu Lys Met Ile Ala Asp Lys Glu Asp Arg

ccctcctcct aggagttcac cggagtgggc gggtcaagct ccatcgtcaa tcatcaacgg gcgtcgacgg aggccgccgt tggagccata gtggtctgga agggaagctg

cgccaccgcc gtacatcagc gcagtgcggc ggtgcgcgac ccgcggccac caccgcctac ccgcaggtac gatcggcctc tctcaagatg cgattgtcaa tgcatga

Ala Ala Glu Glu Lys Gly Gly Ala Lys Leu Glu Ala Gly Asp Gln Leu Tyr Asp Ala Val Gln Lys Glu Glu

Ser Leu Leu Thr Asp His Pro Glu His Gly Glu Met Val Arg Asp Ser Ile Val Ala Gly Ser His Trp His Met Glu Leu Ile Gly Leu Met Glu Pro Lys Val Gly

60 120 180 240 300 360 420 480 540 600 657 180 185 190

Met Ile Asp Pro Arg Gly Ala Arg Gly Arg Ala

195 200 205

Tyr Met Gly Ser Leu Thr Thr Pro Pro Cys Thr

210 215 220

Thr Ile Val Lys Arg Val Arg Thr Val Ser Arg 225 230 235 240

Leu Arg Glu Ala Val His Asp Glu Met Glu Asn

245 250 255

Gln Ala Val Asn Asn Arg Asp Ile Ser Ile Phe

260 265 270

Lys Arg Tyr

275 <210> 180 <211> 822 <212> DNA

<213> Dioscorea cayenensis <4 00> 180

atgagttcat ccacccttct ccatctcctc ctcctctcct ccaaatgcaa aacctcagca agctgaggat gagtttagct ggtcctgaaa actggggaaa tcttaaaaag gagtgggaga cagtcaccca ttcaattgcg tgataacaga gtgatattcg agaagaaatt atagagccgc tgaagcaaca ttaaggaaca gaatttgagg gtaatgctgg ttcactatcc atcaatcgag attcattttc actccccttc agagcatgaa atgaatggcg cagctggtcc atgagagcca agaccaaaag agagcagtgg ggacgtgctg atacattcct ctcagatctt gaagacttta cagaagaatg aaataaatgc aggagttgtg gatccaaatc gcatatttta gatacatggg ctcattcaca gctccacctt accgtcatga ggaaggttgc aactgtttca ccaaggcaag gtgaatgaaa atgctataaa caatgcgaga ccacttcaac ttttactttg aacagctgaa atcgaagctt ggtgtcatat <210> 181 <211> 273 <212> PRT

<213> Dioscorea cayenensis <4 00> 181

Met Ser Ser Ser Thr Leu Leu His Leu Leu Leu Leu Ser 10 15

Phe Ser Cys Leu Pro Asn Ala Lys Pro Gln Gln Ala Glu

25 30

Ser Tyr Ile Glu Gly Ser Pro Asn Gly Pro Glu Asn Trp

40 45

Lys Lys Glu Trp Glu Thr Cys Gly Lys Gly Met Glu Gln

50 55 60

Gln Leu Arg Asp Asn Arg Val Ile Phe Asp Gln Thr Leu 65 70 75 80

Arg Arg Asn Tyr Arg Ala Ala Glu Ala Thr Leu Arg Asn

85 90 95

Asp Val Leu Val Glu Phe Glu Gly Asn Ala Gly Ser Leu

100 105 110

Arg Val Ala Tyr Gln Leu Lys Arg Ile His Phe His Ser

115 120 125

His Glu Met Asn Gly Glu Arg Phe Asp Leu Glu Ala Gln

130 135 140

Glu Ser Gln Asp Gln Lys Arg Ala Val Val Ser Ile Leu 145 150 155 160

Gly Arg Ala Asp Thr Phe Leu Ser Asp Leu Glu Asp Phe

165 170 175

Phe Ser Ser Ser Gln Lys Asn Glu Ile Asn Ala Gly Val

180 185 190

Asn Gln Leu Gln Phe Asp Asp Cys Ala Tyr Phe Arg Tyr 195 200 205

Ser Val Tyr Tyr Arg Gln Gly Val Val Trp Tyr Gln Leu Asp Leu Asn Ala Arg Pro Leu Arg Pro Tyr Pro His

ccctcctctt acattgaagg cttgtggcaa atcaaacttt gtggacatga ttgcatacca aaaggtttga tttctattct tcaagcagtt aattacagtt gcactgaagg tacttctgtt caaccaatta aa

ctcttgcctt aagtcctaat aggcatggag gggggagctg tgtattggtg actcaagcga ccttgaggca tttcagattt tagcagtagc tgatgactgt tatttcatgg gaagcaggca ccgctccgtt 822

Ser Leu Leu Asp Glu Phe Gly Asn Leu Ser Pro Ile Gly Glu Leu Ser Gly His Ser Ile Asn Pro Ser Glu Leu Val His Phe Arg Phe Ile Lys Gln Val Asp Pro Met Gly Ser

60 120 180 240 300 360 420 480 540 600 660 720 780 Phe Thr Ala Pro Pro Cys Thr Glu Gly Ile Ser Trp Thr Val Met Arg

210 215 220

Lys Val Ala Thr Val Ser Pro Arg Gln Val Leu Leu Leu Lys Gln Ala 225 230 235 240

Val Asn Glu Asn Ala Ile Asn Asn Ala Arg Pro Leu Gln Pro Thr Asn

245 250 255

Tyr Arg Ser Val Phe Tyr Phe Glu Gln Leu Lys Ser Lys Leu Gly Val 260 265 270

Ile

<210> 182 <211> 807 <212 > DNA

<213> Dioscorea batatas <4 00> 182

atgagttcat ccacccttct ccatctcctc ctcctctcct ccctcctctt ctcttgcctt 60 gcaaatgtag aggatgagtt tagctacatt gaaggaaatc ctaatggtcc tgaaaactgg 120 ggaaatctta aaccggagtg ggagacttgt ggcaaaggca tggagcagtc acccattcag 180 ttgcgtgata acagagtgat attcgatcaa actttgggga ggttgagaag aaattacaga 240 gccgttgatg caagattaag gaacagtgga catgatgtat tggtggaatt taagggtaat 300 gctggttcac tatcaatcaa tcgagttgca taccaactca agcgaattca ttttcactcc 360 ccttcagagc atgaaatgaa tggcgaaagg tttgaccttg aggcacagct ggttcatgag 420 agccaagatc aaaagagagc agtggtttct attcttttca tatttggacg tgctgaccca 480 ttcctctcag atcttgaaga ctttatcaag cagtttagca gtagccagaa gaatgaaata 540 aatgcaggag ttgtggatcc aaatcaatta cagattgatg actctgcata ttatagatac 600 atgggctcat tcacagctcc accttgcact gaaggtattt catggaccgt catgaggaag 660 gttgcaactg tttcaccaag acaagtactg ctgttgaagc aggcagtgaa tgaaaatgct 720 ataaacaatg caagaccact tcaaccaacc aatttccgct ccgtttttta ctttgaacag 780 ctgaaatcga aggtttgtgc catataa 807

<210> 183 <211> 268 <212> PRT

<213> Dioscorea batatas <4 00> 183

Met Ser Ser Ser Thr Leu Leu His Leu Leu Leu Leu Ser Ser Leu Leu 10 15

Phe Ser Cys Leu Ala Asn Val Glu Asp Glu Phe Ser Tyr Ile Glu Gly

25 30

Asn Pro Asn Gly Pro Glu Asn Trp Gly Asn Leu Lys Pro Glu Trp Glu

40 45

Thr Cys Gly Lys Gly Met Glu Gln Ser Pro Ile Gln Leu Arg Asp Asn

50 55 60

Arg Val Ile Phe Asp Gln Thr Leu Gly Arg Leu Arg Arg Asn Tyr Arg 65 70 75 80

Ala Val Asp Ala Arg Leu Arg Asn Ser Gly His Asp Val Leu Val Glu

85 90 95

Phe Lys Gly Asn Ala Gly Ser Leu Ser Ile Asn Arg Val Ala Tyr Gln

100 105 110

Leu Lys Arg Ile His Phe His Ser Pro Ser Glu His Glu Met Asn Gly

115 120 125

Glu Arg Phe Asp Leu Glu Ala Gln Leu Val His Glu Ser Gln Asp Gln

130 135 140

Lys Arg Ala Val Val Ser Ile Leu Phe Ile Phe Gly Arg Ala Asp Pro 145 150 155 160

Phe Leu Ser Asp Leu Glu Asp Phe Ile Lys Gln Phe Ser Ser Ser Gln

165 170 175

Lys Asn Glu Ile Asn Ala Gly Val Val Asp Pro Asn Gln Leu Gln Ile

180 185 190

Asp Asp Ser Ala Tyr Tyr Arg Tyr Met Gly Ser Phe Thr Ala Pro Pro

195 200 205

Cys Thr Glu Gly Ile Ser Trp Thr Val Met Arg Lys Val Ala Thr Val

210 215 220

Ser Pro Arg Gln Val Leu Leu Leu Lys Gln Ala Val Asn Glu Asn Ala 225 230 235 240

Ile Asn Asn Ala Arg Pro Leu Gln Pro Thr Asn

245 250 255

Tyr Phe Glu Gln Leu Lys Ser Lys Val Cys Ala

260 265

<210> 184 <211> 822 <212> DNA

<213> Dioscorea alata <4 00> 184

atgagttcat ccaccctttt ccatctcttc ctcctctcct tcaaatgcaa ggcttgatgg cgatgatgac tttagctaca cctgaaaact ggggaaatct tagaccggag tggaagactt tcacccatta atttgtgtga tgatagagtg atacggactc acaagttatc aggctgctcg tgcaacagtg aagaacaatg tttaaaagtg atgctggtac acaattcatc aatcaagtag cattttcact ccccatcaga acatgcactc agtggtgaaa atggtccatg agagccaaga tcaaaggaga gcagtaattg cgttctgacc cattcctccc agaccttgaa gactttatca accaatgaag tagatgcagg agttgtggat ccaaggcaat gcatattata gatacatggg ctcatacaca gctccacctt accgttatta agaagcttgg aactgtttca ccaaagcaag gtgaatgaaa attctatgaa caatgcaagg ccacttcaac tttttctatc cgcgtcagaa atctgatcat gttgccatat <210> 185 <211> 273 <212> PRT

<213> Dioscorea alata <400> 185

Phe Arg Ser Val Phe Ile

ttgaaggaag gtggctatgg caactttggg gacatgatat agtaccaact ggtatgacct ctattatgtt gccagataag tattacagtt gcactgaaga tactgatgtt cactgaaatt aa

ctcttgcttt tcctaatggt catggagcag gaagctgaga aatggtgtac caaacgaatt tgaggttcag cagatttgga cagacgtgag tgatgaccct tattacatgg gaagcaagca tcgcaccgtt 822

Met Ser Ser Ser Thr Leu Phe His Leu Phe Leu

1

15

10

Phe Ser Cys Phe Ser Asn Ala Arg Leu Asp Gly

25 30

Tyr Ile Glu Gly Ser Pro Asn Gly Pro Glu Asn

40 45

Pro Glu Trp Lys Thr Cys Gly Tyr Gly Met Glu

50 55 60

Leu Cys Asp Asp Arg Val Ile Arg Thr Pro Thr

65 70 75 80

Thr Ser Tyr Gln Ala Ala Arg Ala Thr Val Lys

85 90 95

Ile Met Val Tyr Phe Lys Ser Asp Ala Gly Thr

100 105 110

Val Glu Tyr Gln Leu Lys Arg Ile His Phe His

115 120 125

Ala Leu Ser Gly Glu Arg Tyr Asp Leu Glu Val

130 135 140

Ser Gln Asp Gln Arg Arg Ala Val Ile Ala Ile

145 150 155 160

Arg Ser Asp Pro Phe Leu Pro Asp Leu Glu Asp

165 170 175

Ser Arg Arg Glu Thr Asn Glu Val Asp Ala Gly

180 185 190

Gln Leu Leu Gln Phe Asp Asp Pro Ala Tyr Tyr

195 200 205

Tyr Thr Ala Pro Pro Cys Thr Glu Asp Ile Thr

210 215 220

Lys Leu Gly Thr Val Ser Pro Lys Gln Val Leu

225 230 235 240

Val Asn Glu Asn Ser Met Asn Asn Ala Arg Pro

245 250 255

Phe Arg Thr Val Phe Phe Tyr Pro Arg Gln Lys

260 265 270

Leu Ser Asp Asp Trp Gly Gln Ser Leu Gly Asn Asn Gln Phe Ser Pro Gln Met Met Phe Phe Ile Val Val Arg Tyr Trp Thr Met Leu Leu Gln Ser Asp

Ser Leu Leu Asp Phe Ser Asn Leu Arg Pro Ile Asn Lys Leu Arg Gly His Asp Ile Asn Gln Ser Glu His Val His Glu Arg Phe Gly Ser Gln Ile Asp Pro Arg Met Gly Ser Val Ile Lys Lys Gln Ala Pro Leu Lys His Val Ala

60 120 180 240 300 360 420 480 540 600 660 720 780 Ile <210> <211> <212> <213> <4 00>

186 831 DNA

Oryza sativa 186

atgagtactt cagctcgccg cctcctcctc ctcgccggcg ctgctctcgg ccactgcccc ggtggccgga gccgaggacg ggctcaccca gggggccgca gaactggggc agcctgaagc agcggcaaga tgcagtcgcc gatcaacctc ggcctcctcg ctcggcaacc tcaactacac ctaccagaac gccaacgcct gacatcatgg tcaggtttga cggcgacgcc ggtagcctaa cagctccggc agatgcactg gcacacgccg tcggagcaca gacatggagc tgcacatggt gcacctcaac gcccagaacc ctctacacca tcggcacccg ggacgagttt ctgcaaaagc atatcaaagc aagaaggcaa agagagagtg atcattggtg aagggacagg ataccgtgta ctaccgctac atgggctcct gagggagtca tctggaccgt tgtcaggaag gtgcgcaccg cttctcaagg cagctgtgct cacgggtaac gagaacaacg aacaacaggg agattgacct gttccttcct ctccctctca <210> 187 <211> 276 <212> PRT <213> Oryza sativa <400> 187

Met Ser Thr Ser Ala Arg Arg Leu Leu Leu Leu

10 15

Ala Ile Ala Leu Leu Leu Ser Ala Thr Ala Pro

25 30

Asp Asp Gly Tyr Ser Tyr Ile Pro Gly Ser Pro

40 45

Trp Gly Ser Leu Lys Pro Glu Trp Ala Thr Cys

50 55 60

Gln Ser Pro Ile Asn Leu Gly Leu Leu Asp Leu 65 70 75 80

Leu Gly Asn Leu Asn Tyr Thr Tyr Gln Asn Ala

85 90 95

Asn Arg Gly His Asp Ile Met Val Arg Phe Asp

100 105 110

Leu Lys Ile Asn Gly Thr Ala Tyr Gln Leu Arg

115 120 125

Thr Pro Ser Glu His Thr Ile Asp Gly Arg Arg

130 135 140

His Met Val His Leu Asn Ala Gln Asn Gln Ala 145 150 155 160

Leu Tyr Thr Ile Gly Thr Arg Asp Glu Phe Leu

165 170 175

Tyr Ile Ile Glu Ile Ser Lys Gln Glu Gly Lys

180 185 190

Gly Gly Ala Asp Pro Asn Val Ala Lys Gly Gln

195 200 205

Arg Tyr Met Gly Ser Phe Thr Thr Pro Pro Cys

210 215 220

Trp Thr Val Val Arg Lys Val Arg Thr Val Ser 225 230 235 240

Leu Leu Lys Ala Ala Val Leu Thr Gly Asn Glu

245 250 255

Leu Gln Gly Val Asn Asn Arg Glu Ile Asp Leu

2 60 2 65 27 0

Leu Ile Asn Asn

275 <210> 188 < 211> 84 6

ccgctgccgc acggctacag cggaatgggc acctcacctt ccgtcgtcaa agataaatgg ccatcgatgg aggccgccgt tagagcctta gggcggatcc ttaccacacc tgtcactgtc cgagacccct tcaacaactg

catcgcactc ctacatc.cct cacctgcagc ggctcccggc ccgtggccac cacggcgtac ccggaggtac cattggcatc tataattgag aaatgtagcc accttgcact ccaaatcaca tcagggcgtg a 831

Ala Gly Val Ala Arg Gly Ser Ser Thr Leu Asn Ala Gly Asp Gln Met Tyr Asp Ala Val Gln Lys Glu Arg Asp Thr Thr Glu Leu Ser Asn Asn Phe Leu

Ala Ala Ala Gly Ala Glu Pro Gln Asn Gly Lys Met Ala Pro Gly Ser Val Val Ala Gly Ser His Trp His Met Glu Leu Ile Gly Ile Leu Glu Pro Val Ile Ile Val Tyr Tyr Gly Val Ile Gln Ile Thr Ala Arg Pro Pro Leu Pro

60 120 180 240 300 360 420 480 540 600 660 720 780 <212> DNA <213> Oryza sativa <4 00> 188 atggtgtctc tccgcgcggc

ttctctcatg gggccgtcga cagtcgccga gaccgcaact aagttccacg atccactggc cacctcgtcc ctcggcgccc gacgagtgcg tcgctgcaga tgcggcgaga ctgcacctgc ggcagggccg aagtga <210> <21i> <212> <213> <4 00> Met Val 1

Val Ala

cggaagggaa actgggggaa tcgacatcaa acaacgccgt gcgaggtcgg acgcgccgtc acaagtccga cggactcctt acttcagcaa agcgcacggg acgtggtgtg tcatgtcgcc tcttctacta

catcgtcctc cgaggggccg gctgagcccg caccaagacc gaacgccacc ccaggtgatc ggagcacacc cgccgacggc ctacctccag ggaggaggcc gagctacttc gagcgtgctc attgccgacc caacccgccg

gtcgtcgccg gacttcacct gagtacagga gtcgtcccgc atcgtcaaca atcgccggga atcaacggca ggcctcgccg ttcaaggacc cacgtcgccg cggtacggcg gggaaggtga aaggacgcca ggcagcgccg 846

cctcgtcggt acatcgaagg tgtgcggcga gctcggacct acggcaagga agccgtacag ggcgcttccc tcatctccgt acctcgccga ccgggctggt gctcgctgac gggagatcag ggccggcgca tctccttcca

cgccgtcgcc cgccatggac ggggaggtcg cgacacgctg catcaccatg gttccaggcg gctcgagctc cctctacaag gctcggcgcc gcagatgagg gacgccgccg ccaggagcag gccgctcaat ggaattcgcc

Ile Val Leu Val 15

Ala Glu Gly Asn 30

189 281 PRT

Oryza sativa 189

Ser Leu Arg Ala Ala

10

Val Ala Phe Ser His 25

Thr Tyr Ile Glu Gly Ala Met Asp Gly Pro Ser

40 45

Ser Pro Glu Tyr Arg Met Cys Gly Glu Gly Arg

50 55 60

Asp Ile Asn Thr Lys Thr Val Val Pro Arg Ser 65 70 75 80

Asp Arg Asn Tyr Asn Ala Val Asn Ala Thr Ile

85 90 95

Asp Ile Thr Met Lys Phe His Gly Glu Val Gly

100 105 110

Gly Lys Pro Tyr Arg Phe Gln Ala Ile His Trp

115 120 125

His Thr Ile Asn Gly Arg Arg Phe Pro Leu Glu

130 135 140

Lys Ser Asp Ala Asp Gly Gly Leu Ala Val Ile 145 150 155 160

Leu Gly Ala Pro Asp Ser Phe Tyr Leu Gln Phe

165 170 175

Glu Leu Gly Ala Asp Glu Cys Asp Phe Ser Lys

180 185 190

Ala Ala Gly Leu Val Gln Met Arg Ser Leu Gln

195 200 205

Tyr Phe Arg Tyr Gly Gly Ser Leu Thr Thr Pro

210 215 220

Val Val Trp Ser Val Leu Gly Lys Val Arg Glu 225 230 235 240

Leu His Leu Leu Met Ser Pro Leu Pro Thr Lys

245 250 255

Gln Pro Leu Asn Gly Arg Ala Val Phe Tyr Tyr

260 265 270

Ala Val Ser Phe Gln Glu Phe Ala Lys

275 280

< 210 > 190 <211> 804 <212> DNA

<213> Arabidopsis thalíana

Val Ala Glu Gly Asn Trp Ser Gln Asp Leu Val Asn Gln Val His Ala Leu His Ser Val Lys Asp Glu Glu Lys Arg Pro Cys Ile Ser Asp Ala Asn Pro

Ala Ser Ser Pro Asp Phe Gly Lys Leu Ser Pro Ile Asp Thr Leu Asn Gly Lys Ile Ile Ala Pro Ser Glu Leu Val His Leu Tyr Lys His Leu Ala Ala His Val Thr Gly Ser Gly Glu Asn Gln Glu Gln Arg Pro Ala Pro Gly Ser

60 120 180 240 300 360 420 480 540 600 660 720 780 840 <400> 190

atggatacca acgcaaaaac aattttcttc atggctatgt

cctaatattt cacacgctca ttctgaagtc gacgacgaaa

aaaacggaaa agggaccaga gggatggggc aaaataaatc

accggaagat atcaatcccc gatcgatctt actaacgaaa

caagcatgga caagacaata taaaccagct ccggctgtaa

attatggtat catggaaagg agatgctggg aagatgacaa

ttggtgcaat gccattggca ttcaccttct gagcataccg

ctagagcttc acatggttca cacgagtgca cgaggcagaa

tacaaattag gcgaacctaa tgaattcctc accaagctac

ggaaataaag agataaatct agggatgatt gatccacgag

aaattctata gatacattgg ctctctcact gttcctcctt

actgtcgtca aaagggtgaa cacaatatca atggagcaaa

gttgacgatg gatttgagac aaattcaaga ccggttcaag

tggttctatg atccaaatgt ttga <210> 191 <211> 267 <212> PRT

<213> Arabídopsís thalíana <4 00> 191

Met Asp Thr Asn Ala Lys Thr Ile Phe Phe Met

gtttcatcta ctccatttac cgcactggaa gagtcagtct ttacaaacag tacggaaaac ttaacggaac ctgcggttat taaatggaat agattaggtt gcactgaagg ttacagctct actcaaaggg 804

tctatctttc ttacgaacaa agtttgtaac tattcatgat aggccatgac ggattttaat taggtacgac cggagttctt aaaagcagtg tcaaacaaga cgtcatttgg taggcaagcc aagatcagtt

1

5

10

15

Tyr Leu Ser Phe Pro Asn Ile Ser His Ala His

20

25

30

Glu Thr Pro Phe Thr Tyr Glu Gln Lys Thr Glu

40

Trp Gly Lys

50 55

45

Ile Asn Pro His Trp Lys Val Cys 60

Gln Ser Pro Ile Asp Leu Thr Asn Glu Arg Val

65 70 75 80

Gln Ala Trp Thr Arg Gln Tyr Lys Pro Ala Pro

85 90 95

Arg Gly His Asp Ile Met Val Ser Trp Lys Gly

100 105 110

Thr Ile Arg Lys Thr Asp Phe Asn Leu Val Gln

115

120

125

Pro Ser Glu His Thr Val Asn Gly Thr Arg Tyr

130 135 140

Met Val His Thr Ser Ala Arg Gly Arg Thr Ala 145 150 155 160

Tyr Lys Leu Gly Glu Pro Asn Glu Phe Leu Thr

165 170 175

Ile Lys Ala Val Gly Asn Lys Glu Ile Asn Leu

180 185 190

Arg Glu Ile Arg Phe Gln Thr Arg Lys Phe Tyr

195 200 205

Leu Thr Val Pro Pro Cys Thr Glu Gly Val Ile

210 215 220

Arg Val Asn Thr Ile Ser Met Glu Gln Ile Thr 225 230 235 240

Val Asp Asp Gly Phe Glu Thr Asn Ser Arg Pro

245 250 255

Gly Arg Ser Val Trp Phe Tyr Asp Pro Asn Val

260 265

<210> 192 <211> 792 <212> DNA

<213> Arabidopsis thalíana <4 00> 192

atgaaacaca ttttttttaa ctcgtgtata accaaaaaaa tttaactacg agaagaaagg agagaagggg ccagagaact tgggcaatgt gtggaaaagg caacatgcag tctccgattg ttgattgatc ataatcttgg ataccttcgt agccagtatt

Ala Met Cys Ser Glu Val Lys Gly Pro Asn Thr Gly Ser Leu Ile Ala Val Ile Asp Ala Gly Cys His Trp Asp Leu Glu Val Ile Gly Lys Leu Leu Gly Met Ile Arg Tyr Ile Trp Thr Val Ala Leu Arg Val Gln Asp

Phe Ile Asp Asp Glu Gly Arg Tyr His Asp Thr Asn Lys Met His Ser Leu His Val Leu Asn Gly Asp Pro Gly Ser Val Lys Gln Ala Ser Lys

atatagagga cgaaacgcag

ggggaagact aaagccagag

atcttacgga caaaagagtc

taccttcaaa tgccaccatt

60 120 180 240 300 360 420 480 540 600 660 720 780

60 120 180 240 aagaacagag gccatgatat catgatgaaa tttgaaggag gaaatgcagg tttaggtatc 300 actattaatg gtactgaata taaacttcaa cagattcatt ggcactctcc ttccgaacac 360 acactcaatg gcaaaaggtt tgttcttgag gaacacatgg ttcatcagag caaagatgga 420 cgcaacgctg ttgtcgcttt cttttacaaa ttgggaaaac ctgactattt tctcctcacg 480 ttggaaagat acttgaagag gataactgat acacacgaat cccaggaatt tgtcgagatg 540 gttcatccta gaacattcgg ttttgaatca aaacactatt atagatttat cggatcactt 600 acaactccac cgtgttctga aaatgtgatt tggacgattt ccaaagagat gaggactgtg 660 acattaaaac aattgatcat gcttcgagtg actgtacacg atcaatctaa ctcaaatgct 720 agaccgcttc agcgtaaaaa tgagcgtccg gtiggcacttt acataccaac atggcatagt 780 aaactatatt aa 792

<210> 193 <211> 263 <212> PRT

<213> Arabidopsis thaiiana <4 00> 193

Met Lys His Ile Phe Phe Asn Ser Cys Ile Thr Lys Lys Asn Ile Glu 10 15

Asp Glu Thr Gln Phe Asn Tyr Glu Lys Lys Gly Glu Lys Gly Pro Glu

25 30

Asn Trp Gly Arg Leu Lys Pro Glu Trp Ala Met Cys Gly Lys Gly Asn

40 45

Met Gln Ser Pro Ile Asp Leu Thr Asp Lys Arg Val Leu Ile Asp His

50 55 60

Asn Leu Gly Tyr Leu Arg Ser Gln Tyr Leu Pro Ser Asn Ala Thr Ile 65 7 0 7 5 8 0

Lys Asn Arg Gly His Asp Ile Met Met. Lys Phe Glu Gly Gly Asn Ala

85 90 95

Gly Leu Giy Iie Thr Ile Asn Gly Thr Giu Tyr Lys Leu Gin Gln Ile

100 105 110

His Trp His Ser Pro Ser Glu His Thr Leu Asn Gly Lys Arg Phe Val

115 120 125

Leu Glu Glu His Met Val His Gln Ser Lys Asp Gly Arg Asn Ala Val

130 135 140

Val Ala Phe Phe Tyr Lys Leu Gly Lys Pro Asp Tyr Phe Leu Leu Thr 145 150 155 160

Leu Glu Arg Tyr Leu Lys Arg Ile Thr Asp Thr His Glu Ser Gln Glu

165 170 175

Phe Val Glu Met Val His Pro Arg Thr Phe Giy Phe Glu Ser Lys His

180 185 190

Tyr Tyr Arg Phe Ile Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn

195 200 205

Val Ile Trp Thr Ile Ser Lys Glu Met Arg Thr Val Thr Leu Lys Gln

210 215 220

Leu Ile Met Leu Arg Val Thr Val His Asp Gln Ser Asn Ser Asn Ala 225 230 235 240

Arg Pro Leu Gln Arg Lys Asn Glu Arg Pro Val Ala Leu Tyr Ile Pro

245 250 255

Thr Trp His Ser Lys Leu Tyr 260 <210> 194 <211> 275 <212> PRT

<213> Adonis aestivalis <4 00> 194

Met Gly Thr Leu Gly Lys Ala Ile Tyr Thr Val Gly Phe Trp Ile Arg 10 15

Glu Thr Gly Gln Ala Iie Asp Arg Leu Gly Ser Arg Leu Gin Gly Asn

25 30

Tyr Tyr Phe His Glu Gln Leu Ser Arg His Arg Thr Leu Met Asn Ile

40 45

Phe Asp Lys Ala Pro Val Val Asp Lys Asp Ala Phe Ile Ala Pro Ser

50 55 60

Ala Ser Val Ile Gly Asp Val Gln Val Gly Arg Ser Ser Ser Ile Trp 65 70 75 80

Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser Val Gly Ser

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn

100 105 110

Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asn Asn Val Thr Val

115 120 125

Gly His Ser Ala Val Leu His Gly Cys Thr Val Gln Asp Ser Ala Phe

130 135 140

Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Asn His 145 150 155 160

Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro

165 170 175

Lys Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu

180 185 190

Thr Glu Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr

195 200 205

Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Thr Phe Glu Glu

210 215 220

Ile Glu Phe Glu Lys Leu Leu Arg Lys Lys Phe Ala Arg Lys Asp Glu 225 230 235 240

Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Thr Pro Gln Glu Leu

245 250 255

Ile Leu Pro Asp Asn Ile Leu Ala Asp Lys Gln Ser Pro Lys Ala Val

260 265 270

Ser Ser Ser

275 <210> 195 <211> 276 <212> PRT <213> Glycine max <4 00> 195

Met Gly Thr Leu Gly Arg Ala Ile Tyr Ser Val Gly Asn Trp Ile Arg 10 15

Gly Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Leu Leu Gln Gly Gly

25 30

Tyr Tyr Val Gln Glu Gln Leu Ser Arg His Arg Thr Leu Met Asp Ile

40 45

Phe Asp Lys Ala Pro Val Val Asp Glu Asp Val Phe Val Ala Pro Ser

50 55 60

Ala Ser Val Ile Gly Asp Val Gln Leu Gly Arg Gly Ser Ser Ile Trp 65 70 75 80

Tyr Gly Val Val Leu Arg Gly Asp Val Asn Ser Ile Arg Val Gly Asn

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn

100 105 110

Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asp Asn Val Thr Val

115 120 125

Gly His Ser Ala Val Ile His Gly Cys Thr Val Glu Asp Glu Ala Phe

130 135 140

Val Gly Met Gly Ala Ile Leu Leu Asp Gly Val Val Val Glu Lys Asn 145 150 155 160

Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro

165 170 175

Ser Gly Glu Val Trp Ala Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu

180 185 190

Thr Asp Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr

195 200 205

Asn Leu Ala Gln Val His Ala Ala Glu Asn Ser Lys Ser Phe Asp Glu

210 215 220

Ile Glu Phe Glu Lys Val Leu Arg Lys Lys Phe Ala Arg Lys Asp Glu 225 230 235 240

Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Glu Leu 245 250 255

Ile Leu Pro Asp Asn Val Leu Pro Asp Lys Ala Glu Lys Ala Leu Lys

260 265 270

Lys Ser Gly Ile 275

< 210 > 196

< 211> 276

< 212 > PRT

<213> Brassica napus <4 00> 196

Met Gly Thr Leu Gly Arg Val Ile Tyr Thr Val Gly Lys Trp Ile Arg 1 5 10 15

Gly Ser Gly Gln Ala Leu Asp Arg Val Gly Ser Ile Leu Gln Gly Ser

25 30

His Arg Leu Glu Glu His Leu Ser Arg His Arg Thr Leu Met Asn Val

40 45

Phe Asp Lys Ser Pro Leu Val Asp Lys Asp Val Phe Val Ala Pro Ser

50 55 60

Ala Ser Val Ile Gly Asp Val Gln Ile Gly Lys Gly Ser Ser Ile Trp 65 70 75 80

Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Asn Ile Ser Val Gly Ser

85 90 95

Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Thr Asn

100 105 110

Leu Gly Gly Lys Val Leu Pro Thr Thr Ile Gly Asp Asn Val Thr Val

115 120 125

Gly His Ser Ala Val Ile His Gly Cys Thr VaI Glu Asp Glu Ala Phe

130 135 140

Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His 145 150 155 160

Ala Met Val Ala Ala Gly Ser Leu Val Arg Glu Asn Thr Arg Ile Pro

165 170 175

Ser Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Met Arg Lys Leu

180 185 190

Thr Asp Glu Glu Ile Ala Tyr Ile Ser Lys Ser Ala Glu Asn Tyr Ile

195 200 205

Asn Leu Ala His Ile His Ala Ala Glu Asn Ser Lys Ser Phe Glu Glu

210 215 220

Ile Glu Val Glu Arg Ala Leu Arg Lys Lys Tyr Ala Arg Lys Asp Glu 225 230 235 . 240

Asp Tyr Asp Ser Met Leu Gly Ile Val Arg Glu Thr Pro Ala Glu Leu

245 250 255

Ile Leu Pro Asp Asn Val Leu Pro Glu Lys Thr Thr Thr Arg Val Pro

260 265 270

Thr Thr His Tyr

275 <210> 197 <211> 273 <212> PRT <213> Zea mays <4 00> 197

Met Gly Thr Leu Gly Arg Ala Ile Phe Thr Val Gly Lys Trp Ile Arg 10 15

Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly

25 30

Leu Arg Val Glu Glu Gln Val Ser Arg His Arg Thr Ile Met Asn Ile

40 45

Phe Glu Lys Glu Pro Arg Ile His Arg Asp Val Phe Val Ala Pro Ser

50 55 60

Ala Ala Val Ile Gly Asp Val Glu Ile Gly His Gly Ser Ser Ile Trp 65 7 0 7 5 8 0

Tyr Gly Ser Ile Leu Arg Gly Asp Val Asn Ser Ile His Ile Gly Ser 8 5 90 95 Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ser Lys Ala Asn 100 105 110 Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Ser Asn Val Thr Val 115 120 125 Gly His Ser Ala Val Leu His Ala Cys Thr Ile Glu Asp Glu Ala Phe 130 135 140 Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His 145 150 155 160 Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro 165 170 175 Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu lí 30 lí 35 190 Thr Glu Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr Asn Tyr Ile 195 200 205 Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Ser Phe Asp Glu 210 215 220 Ile Glu Leu Glu Lys Met Leu Arg Lys Lys Tyr Ala His Lys Asp Glu 225 230 235 240 Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Gln Leu 245 250 255 Ile Leu Pro Asp Asn Ile Leu Pro His Asn Ala Gln Lys Ala Val Ala 260 265 270 Arg <210> 198 <211> 274 <212> PRT <213> Triticum aestivum <4 00> 198 Met Gly Thr Leu Gly Arg Ala Ile Tyr Thr Val Gly Lys Trp Ile Arg 1 5 10 15 Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly 25 30 Leu Arg Thr Glu Glu Gln Val Ser Arg His Arg Thr Val Met Ser Ile 40 45 Phe Asp Lys Glu Pro Arg Ile Asn Lys Asp Val Phe Val Ala Pro Ser 50 55 60 Ala Ser Val Ile Gly Asp Val Glu Ile Gly His Gly Ser Ser Ile Trp 65 70 75 80 Tyr Gly Ser Val Leu Arg Gly Asp Val Asn Ser Ile Arg Ile Gly Ser 85 90 95 Gly Ser Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Thr Asn 100 105 110 Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Ser Asn Val Thr Val 115 120 125 Gly His Ser Ala Val Leu His Ala Cys Thr Ile Glu Asp Glu Ala Phe 130 135 140 Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His 145 150 155 160 Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro 165 170 175 Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu lí 30 185 190 Thr Glu Glu Glu Ile Thr Phe Ile Ala Gln Ser Ala Ala Asn Tyr Ile 195 200 205 Asn Leu Ala His Val His Ala Thr Glu Asn Ser Lys Ser Phe Asp Glu 210 215 220 Ile Glu Leu Glu Lys Lys Leu Arg Lys Lys Phe Ala His Lys Asp Glu 225 230 235 240 Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Gln Leu 24 5 250 255 Ile Leu Pro Asp Asn Ile Leu Pro Asp Lys Ala Pro Lys Ala Ala Val 2 60 2 65 27 0 Ala His <210> 199

<211> 270

<212> PRT

<213> Glycíne max

< 4 0 0 > 199

Met Gly Thr Leu Gly Arg Val Phe Tyr Ala Val Gly Phe Trp Ile Arg 1 5 10 15 Glu Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Arg Leu Gln Gly Asn 25 30 Tyr Leu Phe Gln Glu Gln Leu Ser Arg His Arg Pro Leu Met Asn Leu 40 45 Phe Asp Lys Ala Pro Ser Val His Arg Asp Ala Phe Val Ala Pro Ser 50 55 60 Ala Ser Leu Leu Gly Asp Val His Val Gly Pro Ala Ser Ser Ile Trp 65 70 75 80 Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Thr Ile Gly Ser 85 90 95 Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn 100 105 110 Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asp Asn Val Thr Val 115 120 125 Gly His Ser Ala Val Leu Gln Gly Cys Thr Val Glu Asp Glu Ala Phe 130 135 14 0 Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val Tyr Val Glu Lys His 145 150 155 160 Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro 165 17 0 175 Tyr Gly Glu Val Trp Gly Gly Asn Pro Ala Arg Phe Leu Arg Lys Leu 18 0 185 190 Thr Glu Asp Glu Met Thr Phe Phe Ser Gln Ser Ala Leu Asn Tyr Ser 195 200 205 Asn Leu Ala Gln Ala His Ser Ala Glu Asn Ala Lys Gly Leu Asp Glu 210 215 220 Thr Glu Phe Val Lys Val Leu His Lys Lys Phe Ala Arg His Gly Asp 225 230 235 240 Glu Tyr His Ser Val Leu Gly Gly Val Gln Glu Thr Pro Thr Glu Leu 245 250 255 Lys Ser Ser Asp Asn Val Leu Leu Asp Lys Val Pro Lys Ala 260 265 270 <2 10> 200 <211> 307 <212> PRT <213> Hordeum vuIgare <400> 200 Met Ala Lys Ala Ser Tyr Ala Val Gly Phe Trp Ile Arg Glu Thr Gly 1 5 10 15 Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu Gln Gly Asn Tyr Phe Phe 25 30 His Glu Gln Ile Ser Arg His Arg Thr Leu Met Asn Ile Phe Asp Lys 40 45 Ala Pro His Val His Lys Glu Ala Phe Val Ala Pro Ser Ala Ser Leu 50 55 60 Ile Gly Asp Val Glu Val Gly Lys Gly Ser Ser Ile Trp Tyr Gly Cys 65 70 75 80 Val Leu Arg Gly Asp Ala Asn Asn Val Gln Val Gly Ser Gly Thr Asn 85 90 95 Ile Gln Asp Asn Ser Val Val His Val Ala Lys Ser Asn Leu Ser Gly 100 105 110 Lys Val Phe Pro Thr Ile Ile Gly Asp Asn Val Thr Val Gly His Ser 115 120 125 Ala Val Leu Gln Gly Cys Thr Val Glu Asp Glu Ala Phe Val Gly Met 130 135 14 0 Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His Gly Met Val 145 150 155 160

Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro Cys Gly Glu

165 170 175

Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu Thr Asp Glu

180 185 190

Glu Ile Ala Phe Ile Ala Glu Ser Ala Ala Asn Tyr Ser Asn Leu Ala

195 200 205

Lys Ala His Ala Val Glu Asn Ala Lys Pro Val Glu Lys Ile Asp Phe

210 215 220

Glu Lys Val Leu Arg Lys Lys Val Ala His Gln Asp Glu Glu His Gly 225 230 235 240

Ser Met Leu Gly Ala Thr Arg Lys Ser Leu Gln Ser Trp Arg Arg Pro

245 250 255

Val Leu Leu Leu Arg Pro Asn Lys Leu Cys Leu Ser Val Phe Leu Ser

260 265 270

Phe Phe Gly Ala Phe Thr Ile Phe Ser Leu Asn Ser Tyr Ile Leu Ser

275 280 285

Val His Leu Val Trp Gln Phe Lys Ile Ile Ser Ile Ile Leu Gly Arg

290 295 300

Ala Met Phe 305 <210> 201 <211> 279 <212> PRT <213> Zea mays <4 00> 201

Met Val Ser Ser Ser Arg Ala Val Val Val Val Val Gly Leu Leu Val 10 15

Ala Ala Ser Ser Leu Ala Val Ala Ala Ser Asp Gly Gly Gly Pro Thr

25 30

Tyr Gly Tyr Thr Ala Gly Ser Pro Asp Gly Pro Glu Asn Trp Gly Lys

40 45

Leu Ser Pro Ala Tyr Lys Leu Cys Gly Gln Gly Lys Gln Gln Ser Pro

50 55 60

Ile Asp Ile Val Thr Lys Gln Ala Val Pro Thr Ala Thr Leu Asp Thr 65 70 75 80

Leu Asn Arg Thr Tyr Gly Ala Thr Asn Ala Thr Leu Ile Asn Asp Gly

85 90 95

His Asp Ile Thr Met Ala Leu Glu Gly Lys Val Gly Thr Val Thr Val

100 105 110

Asn Gly Lys Ala Tyr Ser Phe Glu Lys Leu His Trp His Ser Pro Ser

115 120 125

Asp His Thr Ile Asn Gly Gln Arg Phe Pro Leu Glu Leu His Leu Val

130 135 140

His Arg Ser Ala Asp Gly Ala Leu Ala Val Ile Gly Ile Leu Tyr Gln 145 150 155 160

Leu Gly Ala Pro Asp Ser Phe Tyr Tyr Gln Leu Lys Arg Gln Leu Gly

165 170 175

Glu Met Ala Gln Asp Arg Cys Asp Phe Ala Glu Glu Glu Glu Ser Arg

180 185 190

Val Glu Ala Gly Leu Ile His Leu Arg Ser Leu Gln Lys Arg Thr Gly

195 200 205

Ser Tyr Phe Arg Tyr Thr Gly Ser Leu Thr Val Pro Pro Cys Thr Glu

210 215 220

Asn Val Val Trp Ser Val Leu Gly Lys Val Arg Gln Ile Ser Gln Asp 225 230 235 240

Gln Leu Gln Leu Leu Lys Ala Pro Leu Pro Gly Ser Asp Ala Arg Pro

245 250 255

Thr Gln Pro Leu Asn Gly Arg Thr Val Gln Phe Tyr Asn Pro Pro Asn

260 265 270

Ser Thr Ile Ser Phe Gln Ile

275 <210> 202 <2 11 > 274 <212> PRT

<213> Brassíca napus <4 00> 202

Met Lys Arg Pro Ser Ile Val Arg Val Ile Phe Leu Ile Val Ile Ser 1 5 10 15

Ile Thr Thr Ala Ser Gly Ser Pro Asp His Gly Glu Val Glu Asp Glu

25 30

Thr Glu Phe Asn Tyr Glu Lys Gly Gly Glu Lys Gly Pro Glu Lys Trp

40 45

Gly Thr Leu Lys Pro Glu Trp Lys Met Cys Gly Asn Gly Thr Met Gln

50 55 60

Ser Pro Ile Asp Leu Thr Asp Lys Arg Val Phe Ile Asp His Asn Leu 65 70 75 80

Gly Pro Leu Arg Ser His Tyr Leu Pro Ser Asn Ala Thr Ile Lys Asn

85 90 95

Arg Gly His Asp Iie Met Leu Glu Phe Glu Gly Giy Asn Aia Giy Met

100 105 110

Gly Ile Ile Ile Asn Gly Thr Val Tyr Gln Leu Gln Gln Leu His Trp

115 120 125

His Ser Pro Ser Glu His Thr Ile Asn Gly Lys Arg Phe Val Leu Glu

130 135 140

Gln His Met Leu His Gln Ser Lys Asp Gly Arg Leu Ala Val Val Ala 145 150 155 160

Phe Leu Tyr Ser Leu Gly Arg Pro Asp Ser Phe Leu Leu Ser Leu Glu

165 170 175

Arg Gln Leu Lys Arg Ile Thr Asp Ala His Gly Ser Glu Asp Phe Val

180 185 190

Ser Trp Ile Asp Pro Arg Ala Val Asn Phe Lys Thr Arg Leu Tyr Tyr

195 200 205

Arg Tyr Leu Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn Val Thr

210 215 2.20

Trp Ser Ile Ser Arg Glu Met Arg Thr Val Thr Leu Lys Gln Leu Asp 225 230 235 240

Leu Leu Arg Val Ser Val His Asp Gln Ser Asn Thr Asn Ala Arg Pro

245 250 255

Leu Gln Arg Gln Asn Gly Arg Pro Val Lys Phe Tyr Leu Pro Ala Trp

260 265 270

His Ile <210> 203 <211> 17 <212> PRT

<213> Seqüência artificial <220>

<223> motivo 1 <220>

<221> VARIANTE <222> (1)..(1) <223> / substituir = "Thr" <220>

<2 21> VARIANTE

<222> (3)..(3)

<223> / substituir == "Asn"

<220>

<221> INCERTO <222> (4)..(4)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220>

<221> VARIANTE <222> (5)..(5)

<223> / substituir = "lie" / substituir = "Vai" / substituir = <220>

<221> INCERTO (6) . . (9)

Xaa pode ser qualquer aminoácido ocorrendo naturalmente

VARIANTE (10) . . (10) / substituir

"Tyr" / substituir = "Leu" / substituir = "His'

INCERTO

(H) - - (12)

Xaa pode ser qualquer aminoácido ocorrendo naturalmente

<222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <2 2 3> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223>

substituir <220>

<221> VARIANTE <222> (17) . . (17) <223> / substituir substituir = "Phe" <4 00> 203

Ser Glu His Xaa Leu Xaa Xaa Xaa Xaa Phe Xaa Xaa Glu Xaa His Leu

VARIANTE

(13) . . (13)

/ substituir

INCERTO

(14) . . (14) Xaa pode ser

VARIANTE

(15)..(15)

/ substituir

VARIANTE

(16) . . (16)

/ substituir "Phe"

''Asp"

qualquer aminoácido ocorrendo naturalmente

"Gln1

= "Ile" / substituir = "Val' / substituir = "Ala"

/ substituir = "Met" /

= "lie" / substituir / substituir = "Ala"

"Vai" / substituir = "Met" /

1

Leu

10

15

<210> 204 <211> 7 <212> PRT <213> Seqüência artificial <220> <223> motivo 2 <220> <221> VARIANTE <222> (D · · (1) <223> / substituir = "Asn" / substituir = substituir = "Thr" / substituir = "Phe" / substituir = "Arg" <220> <221> VARIANTE <222> (2) . . (2) <223> / substituir = "Vai" / substituir = <220> <221> VARIANTE <222> (4) . . (4) <223> / substituir = "lie" / substituir = <22 0> <2 21 > VARIANTE <222> (5) . . (5) <223> / substituir = "Thr" / substituir = <220> <221> VARIANTE <222> (6)..(6) <223> / substituir substituir = "Thr" <220>

<221> VARIANTE <222> (7)..(7) <223> / substituir <4 00> 204 Leu Ala Val Val Ala 1 5

<210> 205 16 PRT

Seqüência

= "Vai" / substituir

"lie" / substituir = "Ser" /

= "Phe" / substituir = "Vai" / substituir = "Met"

Phe Leu

<211> <212> <213> <220> <223> <220> <221> <222> <223> <220> <221> <222> <223>

motivo 3 VARIANTE

(D · · (1)

/ substituir

VARIANTE (2) . . (2) / substituir "Ala"

"Phe"

= "Phe" / substituir = "Vai" / substituir = "Gly" /

substituir = <220>

<221> VARIANTE <222> (3)..(3) <22 3> / substituir substituir = "His" <220>

VARIANTE (4)..(4) / substituir

"Glu" / substituir = "Gly" / substituir = "Thr" /

<221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223>

substituir <220>

INCERTO (5) . . (5) Xaa pode ser

VARIANTE (8)..(8) / substituir

VARIANTE (10) . . (10) / substituir

VARIANTE (14) . . (14) / substituir

"Ala"

<22 1> <222> <223> <220> <221> <222> <2 2 3> <4 00>

VARIANTE (15) . . (15) / substituir

"Phe"

qualquer aminoácido ocorrendo naturalmente

= "Phe" / substituir = "Tyr"

"Vai" / substituir = "Ala"

= "Thr" / substituir = "Gly" / substituir = "Asp" /

"Gln"

VARIANTE (16) . . (16) / substituir 205

Tyr Tyr Arg Tyr Xaa 1 5

<210> 206

= "Gly" / substituir --= "Asp" / substituir = "Arg"

Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn 15 120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

60

120

180

240

300

360

420

480

540

600

6 60

720

780

840

106

<211> 1416

<212> DNA

<213> Oryza sativa

<4 00> 206

cccacgcgtc aactcaaaca ctctgtcccc gagcagaagg ggcgagcccc ggtggtgatc agacggggaa gcgaaggcgg ctcgacagcg ctggtgtgca cgggtacgag gctcgacgac caccggcaac ccgggggctc gagcttcgac ggagttccac gtgcatcgcg gccgttccag ggcgcaggtg ggactcggcg gaagctctgg tcgtttcaac tgtcaagtga aggcttacat <210> 207 <2 11>

<212>

<213>

<220>

<223>

<4 00> ggggacaagt <210>

<2 11>

<2 12>

<213>

<220>

<223>

<4 00> ggggaccact <210> 209 <211>

<212>

<213>

<4 00> atggcgatga ccatgtttcg cctaaaggac ttctccggcg cctt tgtttg ttagctgcca aaggttttga aaagctatgg ccaccggaga agcggagaga ggagctggac atgtatattg acaaagcttg ttaagtaacc

cgcccacgcg

ctcacaccaa

aagaagggta

ccaagaagcc

ggcgcgggca

accggcgcgt

gtggcacgtg

cggggatggc

tccgccagtt

acgccgcaca

atgagcgtcg

ctcaagaaat

accaacacct

gccggcgggc

ggcgccaagg

cggagattcc

acgacgggct

cggttcgtga

gtgggcgacc

tcgttcgaga

gacctcagcg

tgttaatttc

tgtacaatta

tatcgatttg

gacttttgaa

cttacactga

acggtctcca

tctcatgtga

gtacaatctc

acaacttcac

atatctccaa

ttgatcttga

tgtcagagct

ttccagagag

tctccggtaa

gctactacaa

agatcctcga

tgaaacatct

tccgggacac tggctctcca acttgagcgc gtcgctggtg cgtcgaaggc cgtcggggct gtgatggcgt ggcggggagc cgtggacaac tctaccggcc gggtgaacca ccgactaccc tcgccggcaa t ccgcgggca cgtacaagga acgaggagac tgttccgcga cgaaggggtt cgagcctgac accagctctc agaagctcgt ttcggggttt gtaatttttt tccacctaaa

gactcatctt

catggaagtt

cgactggatt

cgacgatgct

accagagatt

cggtgaatta

caatggtaac

agttcttgac

taagaagctt

ttatggagat

atctccggcg

cagctacacc

catggcgagc

acatactctg

cagaaacata

agttcaggcc

ggtggtgaag

gtgagggcgg

ggacgggaag

cgggctcgcg

tccgcgactt

tacaccgtca

ttccggcgct

gacggcgcgg

cctgggccac

gtcgcggcgg

cgtccctccc

gaacgggtcg

cagcaagatc

cgggatcacg

gcacatcccg

cgtgtcggag

caagtccggc

gcaggaggcc

cggcctcgtc

agggggtttc

tttacccgac

ttaagt

aaacaatgcg

tcactgaccc

ctgtttctgc

cttctcaatc

cactcatctt

cgtgttatct

gggatgttga

ccattggaga

cttactggaa

acttataaca

aaatacctct

attcaaagct

tttctttccc

ggtggtgttc

tgtacactca

tttcttcaca

gtacacttga

gcactcctgc

gagccggggt

tggcgacgcg

aagacgctgc

gcggcgaagg

tcctgaaggc

tgcacctgga

ccggcatgcc

caaccgacgt

ttcctcctcg

ctcatcatcc

aaggccgggc

gcgatgatcg

tgtaacatgc

ttcgcgtcgc

ctgttccggc

gcggagtccg

gtgtactgga

agcgacccgg

tgagtttatt

agctttcagt

aaatcatgca

ctcagccgtt

tagcacactc

atctgtatct

tcaaatcctc

ctccggatgc

ctctcaacgt

ctcatttggt

tgaagagtct

cattccctgg

acaatttcaa

ctttcggtgg

tagagtatct

gcctcaagaa

caccggagtt

ccggagagat

tcaacaactt

gctcactcca

cctctgctct

tccttagcgt

gcgggccggt

ggcagggggt

cgcttggcgg

ggcgacggcg

cctcgcctcc

gctcgacgcg

tcaacgccga

cccgcctcaL

tcggctccat

taggcgacct

acggcgcgga

tgacgatgca

tgtacccggg

tgctgttccc

ggaagcggct

gctggaacaa

agaaggccag

atttacccat

gagagaggcc

ataaaaccac

1416

c 51

50

atttttctca

catgattggt

tcactgttct

ctccttcact

gaatctaact

aacttctctc

agagatttta

cggtaagtta

aaatttcttc

tggtctcaac

cttaagagaa

cggtggttta

tccgacgagt

aaccggtcat

51

DNA

Seqüência

iniciador: 207

208

50

DNA

Seqüência

iniciador: 208

2253

DNA

Arabidops is 209

artificial

prm8571

aagcaggctt

artificial

prm8572

aagctgggtc

thaliana

ttgtacaaaa

ttgtacaaga 960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

107

ataccaccgg

ttaaccggag

ttcagaaaca

gtcttcgaag

gggaatctaa

ttatgcagag

attccagaag

ctcaacggca

actgataatt

atttacctct

aatctacaga

ttcgaattga

ccagattcaa

aacggagaaa

ggtaatcaat

ctcgatctct

ttcaacgaaa

ccaacacggc

atcgtaatca

cagatgaata

ctagatttca

ggcggagctg

cgactcgttg

ttggggagaa

<210> 21C

<211> 7 5C

<212> PRl

<213> Ara

<4 00> 210 Met Ala Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu Tyr 1 5 10 15 Leu Phe Phe Ser Pro Cys Phe Ala Tyr Thr Asp Met Glu Val Leu Leu 20 25 30 Asn Leu Lys Ser Ser Met Ile Gly Pro Lys Gly His Gly Leu His Asp 35 40 45 Trp Ile His Ser Ser Ser Pro Asp Ala His Cys Ser Phe Ser Gly Val 50 55 60 Ser Cys Asp Asp Asp Ala Arg Val Ile Ser Leu Asn Val Ser Phe Thr 65 70 75 80 Pro Leu Phe Gly Thr Ile Ser Pro Glu Ile Gly Met Leu Thr His Leu 85 90 95 Val Asn Leu Thr Leu Ala Ala Asn Asn Phe Thr Gly Glu Leu Pro Leu 100 105 110 Glu Met Lys Ser Leu Thr Ser Leu Lys Val Leu Asn Ile Ser Asn Asn 115 120 125 Gly Asn Leu Thr Gly Thr Phe Pro Gly Glu Ile Leu Lys Ala Met Val 130 135 140 Asp Leu Glu Val Leu Asp Thr Tyr Asn Asn Asn Phe Asn Gly Lys Leu 145 150 155 160 Pro Pro Glu Met Ser Glu Leu Lys Lys Leu Lys Tyr Leu Ser Phe Gly 165 170 175 Gly Asn Phe Phe Ser Gly Glu Ile Pro Glu Ser Tyr Gly Asp Ile Gln 180 18 5 190 Ser Leu Glu Tyr Leu Gly Leu Asn Gly Ala Gly Leu Ser Gly Lys Ser 195 200 205 Pro Ala Phe Leu Ser Arg Leu Lys Asn Leu Arg Glu Met Tyr Ile Gly 210 215 9 ' 20 Tyr Tyr Asn Ser Tyr Thr Gly Gly Val Pro Pro Glu Phe Gly Gly Leu 225 230 235 240 Thr Lys Leu Glu Ile Leu Asp Met Ala Ser Cys Thr Leu Thr Gly Glu 245 250 255 Ile Pro Thr Ser Leu Ser Asn Leu Lys His Leu His Thr Leu Phe Leu 260 265 270

agctttccgg

aaatccctca

atctctacgg

tatgggagaa

taaagcttga

gtgagaaatt

agcttggtaa

ctgttccggc

tcttctccgg

ctaacaactg

ctctattctt

agcatttatc

tctctcgctg

tccctaaagg

taaccggttc

ctttcaacga

cttccttcgc

caggacaaac

cggttatcgc

agaagaagaa

aatctgaaga

gaattgtcta

gccgtgggac

tccgccaccg

tttagtcagc

aagcttcatc

acaaatacca

caatttcacg

tgtctctgat

agagatgtta

atgcaaatcc

ggggcttttc

tgaacttccg

gttttccggc

agatcggaac

gaggatcaac

ctcaacttta

gatcaacaac

aatccctacc

tctctccggt

cggaaacact

ctccgatcac

agcgatcacc

ccagaaatct

cgttctcgag

ccgtggatca

cgggaggagc

tcacatagtg

ttgaaatctc

aatctcggaa

gaggccatcg

ttacaattac

aatcatctca

attctctcta

ttaaccaaaa

aatctaccgt

gtaacgatgt

gagattccac

cgatttcgcg

acaagtgcga

atctccgtcg

gtgaaaaact

ggaatcggaa

agagtaccac

tacctctgtc

aatcacacgg

ggtttgatcc

ctcgcctgga

tgtcttaaag

atgccaaaca

gatcatggat

tga

tcgatttatc acattactct gagaattacc cggcgaatct ccggacttat acaacttctt tcagaatcgt tagttacgat ccggcgatgt ctgcgattgg gcaacattcc acaacatcac atctcagccg taggaactct acatgacgag tcggtggtca tccctcaccg cgttgttctc taatcagtgt aact aatcgc aagagaacat acgtagacgt tcacggcgga 22

aatcaatcag

aatcaatctc

aaaactcgaa

tggccggaac

ccccaaggac

ctttggtcca

taagaatctt

tatcgaactc

tctcgatcag

taatttcccc

gagagaaatc

cggcggtatt

taaccgaatc

aaatatctcc

tttaacaact

attcttggtg

tgtctcttgc

accgtcaagg

agcgattcgt

cttccagaaa

aatcggtaaa

cgcgattaaa

gattcaaact

53

P

íbidops is thaliana His Ile Asn Asn Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu 275 280 285 Val Ser Leu Lys Ser Leu Asp Leu Ser Ile Asn Gln Leu Thr Gly Glu 290 295 300 Ile Pro Gln Ser Phe Ile Asn Leu Gly Asn Ile Thr Leu Ile Asn Leu 305 310 315 320 Phe Arg Asn Asn Leu Tyr Gly Gln Ile Pro Glu Ala Ile Gly Glu Leu 325 330 335 Pro Lys Leu Glu Val Phe Glu Val Trp Glu Asn Asn Phe Thr Leu Gln 340 345 350 Leu Pro Ala Asn Leu Gly Arg Asn Gly Asn Leu Ile Lys Leu Asp Val 355 360 365 Ser Asp Asn His Leu Thr Gly Leu Ile Pro Lys Asp Leu Cys Arg Gly 370 375 380 Glu Lys Leu Glu Met Leu Ile Leu Ser Asn Asn Phe Phe Phe Gly Pro 385 390 395 400 Ile Pro Glu Glu Leu Gly Lys Cys Lys Ser Leu Thr Lys Ile Arg Ile 405 410 415 Val Lys Asn Leu Leu Asn Gly Thr Val Pro Ala Gly Leu Phe Asn Leu 420 425 430 Pro Leu Val Thr Ile Ile Glu Leu Thr Asp Asn Phe Phe Ser Gly Glu 435 440 445 Leu Pro Val Thr Met Ser Gly Asp Val Leu Asp Gln Ile Tyr Leu Ser 450 455 460 Asn Asn Trp Phe Ser Gly Glu Ile Pro Pro Ala Ile Gly Asn Phe Pro 4 65 470 475 480 Asn Leu Gln Thr Leu Phe Leu Asp Arg Asn Arg Phe Arg Gly Asn Ile 485 490 495 Pro Arg Glu Ile Phe Glu Leu Lys His Leu Ser Arg Ile Asn Thr Ser 500 505 510 Ala Asn Asn Ile Thr Gly Gly Ile Pro Asp Ser Ile Ser Arg Cys Ser 515 520 525 Thr Leu Ile Ser Val Asp Leu Ser Arg Asn Arg Ile Asn Gly Glu Ile 530 535 540 Pro Lys Gly Ile Asn Asn Val Lys Asn Leu Gly Thr Leu Asn Ile Ser 545 550 555 560 Gly Asn Gln Leu Thr Gly Ser Ile Pro Thr Gly Ile Gly Asn Met Thr 565 570 575 Ser Leu Thr Thr Leu Asp Leu Ser Phe Asn Asp Leu Ser Gly Arg Val 580 585 590 Pro Leu Gly Gly Gln Phe Leu Val Phe Asn Glu Thr Ser Phe Ala Gly 595 600 605 Asn Thr Tyr Leu Cys Leu Pro His Arg Val Ser Cys Pro Thr Arg Pro 610 615 620 Gly Gln Thr Ser Asp His Asn His Thr Ala Leu Phe Ser Pro Ser Arg 625 630 635 640 Ile Val Ile Thr Val Ile Ala Ala Ile Thr Gly Leu Ile Leu Ile Ser 645 650 655 Val Ala Ile Arg Gln Met Asn Lys Lys Lys Asn Gln Lys Ser Leu Ala 660 665 670 Trp Lys Leu Ile Ala Phe Gln Lys Leu Asp Phe Lys Ser Glu Asp Val 675 680 685 Leu Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly 690 695 700 Ile Val Tyr Arg Gly Ser Met Pro Asn Asn Val Asp Val Ala Ile Lys 705 710 715 720 Arg Leu Val Gly Arg Gly Thr Gly Arg Ser Asp His Gly Phe Thr Ala 725 730 7 5 5 Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg His Ile Val 740 745 750

<210> 211 <211> 2943 <212> DNA <213> Arabídopsis thaliana <4 00> 211

atggcgatga gacttttgaa gactcatctt ccatgtttcg cttacactga catggaagtt cctaaaggac acggtctcca cgactggatt ttctccggcg tctcatgtga cgacgatgct cctttgtttg gtacaatctc accagagatt ttagctgcca acaacttcac cggtgaatta atatctccaa caatggtaac ttgatcttga agttcttgac tgtcagagct taagaagctt ttccagagag ttatggagat tctccggtaa atctccggcg gctactacaa cagctacacc agatcctcga catggcgagc tgaaacatct acatactctg

aaggttttga

aaagctatgg

ccaccggaga

agcggagaga

ggagctggac

atgtatattg

acaaagcttg

ttaagtaacc

ataccaccgg

ttaaccggag

ttcagaaaca

gtcttcgaag

gggaatctaa

agctttccgg tttagtcagc aaatccctca aagcttcatc

atctctacgg

tatgggagaa

taaagcttga

ttatgcagag gtgagaaatt attccagaag agcttggtaa

ctcaacggca ctgttccggc actgataatt tcttctccgg atttacctct ctaacaactg aatctacaga ctctattctt ttcgaattga agcatttatc ccagattcaa tctctcgctg aacggagaaa tccctaaagg ggtaatcaat taaccggttc ctcgatctct ctttcaacga ttcaacgaaa cttccttcgc ccaacacggc caggacaaac atcgtaatca cggttatcgc cagatgaata agaagaagaa ctagatttca aatctgaaga ggcggagctg gaattgtcta cgactcgttg gccgtgggac ttggggagaa tccgccaccg acgaatctcc ttctttatga tctaaaggtg gtcatcttca ggcttgtgtt atcttcacca aataacattc ttttggactc ttcttagttg atggtgctgc ttctgagtgt atcgccccag agtatgcata taccttgaaa tgttggagtt aatagctggg ttaggtgggt gaggaacacg ttgcgattgt tgacccgagg agatcgcaat gatgtgtgtg tgcacatgct cactaaccct

acaaatacca

caatttcacg

tgtctctgat

agagatgtta

atgcaaatcc

ggggcttttc

tgaacttccg

gttttccggc

agatcggaac

gaggatcaac

ctcaacttta

gatcaacaac

aatccctacc

tctctccggt

cggaaacact

ctccgatcac

agcgatcacc

ccagaaatct

cgttctcgag

ccgtggatca

cgggaggagc

tcacatagtg

gtacatgcct

atgggagacg

tgattgttca

tgattttgaa

ggagtggttt

gtggatatag

gctattgttg

catgtgttca

agggaagttg

tga

<2 10>

<2 11>

<212 >

<213>

<4 00> Met Ala 1

Leu Phe

212

980

PRT

Arabidopsis 212

Arg Leu

thaliana

ctgtttctgc cttctcaatc cactcatctt cgtgttatct gggatgttga ccattggaga cttactggaa acttataaca aaatacctct attcaaagct tttctttccc ggtggtgttc tgtacactca tttcttcaca ttgaaatctc aatctcggaa gaggccatcg ttacaattac aatcatctca attctctcta ttaaccaaaa aatctaccgt gtaacgatgt gagattccac cgatttcgcg acaagtgcga atctccgtcg gtgaaaaact ggaatcggaa agagtaccac tacctctgtc aatcacacgg ggtttgatcc ctcgcctgga tgtcttaaag atgccaaaca gatcatggat agact tcttg aatggaagcc agacatagag ccattgatct gcccatgttg atgtcttcaa gtggacgaga aagaaacctg gaagaggaga ttgactggtt gaggaagaag cctaaatccg 2943

atctgtatct tcaaatcctc ctccggatgc ctctcaacgt ctcatttggt tgaagagtct cattccctgg acaatttcaa ctttcggtgg tagagtatct gcctcaagaa cacgcgagtt ccggagagat tcaacaactt tcgatttatc acattactct gagaattacc cggcgaatct ccggacttat acaacttctt tcagaatcgt tagttacgat ccggcgatgt ctgcgattgg gcaacattcc acaacatcac atctcagccg taggaactct acatgacgag tcggtggtca tccctcaccg cgttgttctc taatcagtgt aactaaccgc aagagaacat acgtagacgt tcacggcgga gttacgtagc ttggagagct tagccgtgga tgcatagaga ctgattttgg ttgctggctc agagtgatgt ttggtgaatt taactcagcc acccgttgac ccgcggcaag tggcgaactt

atttttctca

catgattggt

tcactgttct

ctccttcact

gaatctaact

aacttctctc

agagatttta

cggtaagtta

aaatttcttc

tggtctcaac

cttaagagaa

cggtggttta

tccgacgagt

aaccggtcat

aatcaatcag

aatcaatctc

aaaactcgaa

tggccggaac

ccccaaggac

ctttggtcca

taagaatctt

tatcgaactc

tctcgatcag

taatttcccc

gagagaaatc

cggcggtatt

taaccgaatc

aaatatctcc

tttaacaact

attcttggtg

tgtctcttgt

accgtcaagg

agcgattcgt

cttccagaaa

aatcggtaaa

cgcgattaaa

gattcaaact

gaacaaggat

tttgcatgga

agctgcaaag

tgttaagtcc

gcttgctaag

ttatggatac

gtatagtttc

tggagaagga

atcggatgct

aagtgtgatt

gcctacgatg

gatcgcgttc

Met

5

Phe

Asn

20 Ijeu Lys 35

Ser Pro 25

Ser Ser 40

Leu

10

Cys

Met

Lys Thr His

15

Phe Ala Tyr 30

He Gly Pro 45

Leu Leu Phe Leu His Leu Tyr Thr Asp Met Glu Val Leu Leu Lys Gly His Gly Leu His Asp

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 24 60 2520 2580 2640 2700 2760 2820 2880 2940 Trp I Ie His Ser Ser Ser Pro Asp Ala His Cys Ser Phe Ser Gly Val 50 55 60 Ser Cys Asp Asp Asp Ala Arg Val Ile Ser Leu Asn Val Ser Phe Thr 65 70 75 80 Pro Leu Phe Gly Thr Ile Ser Pro Glu Ile Gly Met Leu Thr His Leu 85 90 95 Val Asn Leu Thr Leu Ala Ala Asn Asn Phe Thr Gly Glu Leu Pro Leu 100 105 110 Glu Met Lys Ser Leu Thr Ser Leu Lys Val Leu Asn Ile Ser Asn Asn 115 120 125 Gly Asn Leu Thr Gly Thr Phe Pro Gly Glu Ile Leu Lys Ala Met Val 130 135 140 Asp Leu Glu Val Leu Asp Thr Tyr Asn Asn Asn Phe Asn Gly Lys Leu 145 150 155 160 Pro Pro Glu Met Ser Glu Leu Lys Lys Leu Lys Tyr Leu Ser Phe Gly 165 170 175 Gly Asn Phe Phe Ser Gly Glu Ile Pro Glu Ser Tyr Gly Asp Ile Gln 180 185 190 Ser Leu Glu Tyr Leu Gly Leu Asn Gly Ala Gly Leu Ser Gly Lys Ser 195 200 205 Pro Ala Phe Leu Ser Arg Leu Lys Asn Leu Arg Glu Met Tyr Ile Gly 210 215 220 Tyr Tyr Asn Ser Tyr Thr Gly Gly Val Pro Arg Glu Phe Gly Gly Leu 225 230 235 240 Thr Lys Leu Glu Ile Leu Asp Met Ala Ser Cys Thr Leu Thr Gly Glu 245 250 255 Ile Pro Thr Ser Leu Ser Asn Leu Lys His Leu His Thr Leu Phe Leu 260 265 270 His Ile Asn Asn Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu 275 280 285 Val Ser Leu Lys Ser Leu Asp Leu Ser Ile Asn Gln Leu Thr Gly Glu 290 295 300 Ile Pro Gln Ser Phe Ile Asn Leu Gly Asn Ile Thr Leu Ile Asn Leu 305 310 315 320 Phe Arg Asn Asn Leu Tyr Gly Gln Ile Pro Glu Ala Ile Gly Glu Leu 325 330 335 Pro Lys Leu Glu Val Phe Glu Val Trp Glu Asn Asn Phe Thr Leu Gln 340 345 350 Leu Pro Ala Asn Leu Gly Arg Asn Gly Asn Leu Ile Lys Leu Asp Val 355 360 365 Ser Asp Asn His Leu Thr Gly Leu Ile Pro Lys Asp Leu Cys Arg Gly 370 375 380 Glu Lys Leu Glu Met Leu Ile Leu Ser Asn Asn Phe Phe Phe Gly Pro 385 390 395 400 Ile Pro Glu Glu Leu Gly Lys Cys Lys Ser Leu Thr Lys Ile Arg Ile 405 410 415 Val Lys Asn Leu Leu Asn Gly Thr Val Pro Ala Gly Leu Phe Asn Leu 420 425 430 Pro Leu Val Thr Ile Ile Glu Leu Thr Asp Asn Phe Phe Ser Gly Glu 435 440 445 Leu Pro Val Thr Met Ser Gly Asp Val Leu Asp Gln Ile Tyr Leu Ser 450 4 55 460 Asn Asn Trp Phe Ser Gly Glu Ile Pro Pro Ala Ile Gly Asn Phe Pro 465 470 475 480 Asn Leu Gln Thr Leu Phe Leu Asp Arg Asn Arg Phe Arg Gly Asn Ile 485 490 4 95 Pro Arg Glu Ile Phe Glu Leu Lys His Leu Ser Arg Ile Asn Thr Ser 500 505 510 Ala Asn Asn I Ie Thr Gly Gly Ile Pro Asp Ser Ile Ser Arg Cys Ser 515 520 525 Thr Leu Ile Ser Val Asp Leu Ser Arg Asn Arg Ile Asn Gly Glu Ile 530 535 54 0 Pro Lys Gly He Asn Asn Val Lys Asn Leu Gly Thr Leu Asn He Ser 545 550 555 560 Gly Asn Gln Leu Thr Gly Ser Ile Pro Thr Gly Ile Gly Asn Met Thr 565 570 575 Ser Leu Thr Thr Leu Asp Leu Ser Phe Asn Asp Leu Ser Gly Arg Val 580 585 590 Pro Leu Gly Gly Gln Phe Leu Val Phe Asn Glu Thr Ser Phe Ala Gly 595 600 605 Asn Thr Tyr Leu Cys Leu Pro His Arg Val Ser Cys Pro Thr Arg Pro 610 615 62 ) η Gly Gln Thr Ser Asp His Asn His Thr Ala Leu Phe Ser Pro Ser Arg 625 630 635 640 Ile Val Ile Thr Val Ile Ala Ala Ile Thr Gly Leu Ile Leu Ile Ser 645 650 655 Val Ala Ile Arg Gln Met Asn Lys Lys Lys Asn Gln Lys Ser Leu Ala 660 665 670 Trp Lys Leu Thr Ala Phe Gln Lys Leu Asp Phe Lys Ser Glu Asp Val 675 680 685 Leu Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly 690 695 700 Ile Val Tyr Arg Gly Ser Met Pro Asn Asn Val Asp Val Ala Ile Lys 705 710 715 720 Arg Leu Val Gly Arg Gly Thr Gly Arg Ser Asp His Gly Phe Thr Ala 725 730 735 Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg His Ile Val Arg Leu 740 745 750 Leu Gly Tyr Val Ala Asn Lys Asp Thr Asn Leu Leu Leu Tyr Glu Tyr 755 760 765 Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys Gly Gly 770 775 780 His Leu Gln Trp Glu Thr Arg His Arg Val Ala Val Glu Ala Ala Lys 785 790 795 800 Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Leu His Arg 805 810 815 Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu Ala His 820 825 830 Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Val Asp Gly Ala Ala Ser 835 840 845 Glu Cys Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu 850 855 860 Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser Phe 865 870 875 880 Gly Val Val Leu Leu Glu Leu Ile Ala Gly Lys Lys Pro Val Gly Glu 885 890 895 Phe Gly Glu Gly Val Asp Ile Val Arg Trp Val Arg Asn Thr Glu Glu 900 905 910 Glu Ile Thr Gln Pro Ser Asp Ala Ala Ile Val Val Ala Ile Val Asp 915 920 925 Pro Arg Leu Thr Gly Tyr Pr ο Leu Thr Ser Val Ile His Val Phe Lys 930 93 5 940 Ile Ala Met Met Cys Val Glu Glu Glu Ala Ala Ala Arg Pro Thr Met 945 950 955 960 Arg Glu Val Val His Met Leu Thr Asn Pro Pro Lys Ser Val Ala Asn 965 970 975

Leu Ile Ala Phe 980 <210> 213 <2 11> 2964 <212> DNA

<213> Brassica napus <4 00> 213

atggcgatga gacttttgaa gactcacctt ctgtttctcc atcttcacta cgttatctcg attttgcttc tatctttctc accatgcttc gcttccactg acatggacca tctcctcacc ctcaaatcgt ccatggtcgg ccccaacggc cacggcctcc acgactgggt tcgctcccct

60

120

180 tctccctcag ctcactgttc tttctccggc tccctcaacg tctctttcac tcctctcttc gaccgtctcg tgaatctgac gttagctgct atgaagagtc tcacttctct aaaggttctc accttccccg gagagattct aacaacttca caggcccact tctctcggag gaaacttctt aaccggagaa ttggagtatc ttggcctcaa cggagccgga

gtttcctgcg ggaaccatct aataatttct aacatctcca cactcccatg gtcgacctcg accgccggag atccccgggc atcccagaga ctctccggcg

cgcctcaaga atcttaaaga aatgtacgtc ggctacttca ccgccggagt tcggtgaatt acgggagaga ttccgacgac atcaacaact taaccggaaa

gacaaaccta gaggttctcg tctgagtaat ctaaaacatt

catccctccg gaactctccg ctagacctct caataaacca gctaaccgga gagattcctc aacatcactc tcgtcaacct cttcagaaac aatctccacg ggagacatgc cgaacctcca agtcctccag gtgtgggaga ccggcgaatc tcggccggaa cgggaatctg aaaaagctcg accggactca tccccatgga gacaacttct tcttcggctc atcagaatcg tcaagaatct

tttgtgcaga ggcgggaagc gatccctgag aagctaggtc

ctcgttacca tcatcgagct tcaggcgacc ttctcgatca

cctcaacggt

caccgataac

tatctactta

acggttccgg

ttcttctccg

tctaacaatt

ccggctatcg gtaattttaa aaatctacag gatttattct

tttcgagtta

ccctgactcg

cggcggagat

cgggaatcaa

cctcacgcgt

gatcgccatc

tcagatgaac

gctcgatttc

aagcatctca atctcgcgat atcccgaaag ctcaccggct tccttcaacg acttccttcg cccggccaaa acgataatcg aagaagaagc aaggcggaag aggcggagcg gggatcgtct acgcctcgtg ggacgcggaa

gggaatattc cgagagaagt aacaacctca ccggcgacat gatctcagcc gtaaccgaat ttaggaactc tcaatctctc aagatgacga gcttaaccac tctcgatctc ctcggcggcc agttcctagt cttcaacgac ctccctcgcc acgtctcgtg gcgctgttct cgccgtcgag ctcatcagcg tcgcgattcg aagctaaccg ccttccagcg gaggagaaca taatcggcaa aacgtagacg tcgcgatcaa ttcacggcgg agattcagac gctagggagg atccgccacc ggatacgtgg cgaacaggga cacgaacctg cttctctacg ctcggcgagc ttttgcacgg gtctaaagga ggtcatcttc gtagccgttg aagcggcgaa aggactgtgt tatcttcacc ttgcatagag acgttaagtc caataacatt ttactggact gctgattttg ggcttgctaa gttcttactg gacggtgctg atagctggat cctatggata catcgctcca gagtatgctt aagagtgatg tttatagttt tggagtggtg ttattggagc gttggtgagt ttggggaagg agtggatata gtgaggtggg atacctcagc cgtcggatgc agctactgtt gttgcgatcg tacccgttga ctagtgtgat tcacgtgttc aagatagcga gcaacgacaa ggccgacgat gagggaagtt gtgcacatgc gtgactaact tgatcgcctt ctga <2 10>

<211>

<2 12>

<213>

<4 00>

acggcgacgc

ccccggagat

ccggtatgct

acaacgtgaa

aagtcctcga

tcaagaagct

gttacggaga

aatctccggc

acagctacac

acatggcgag

tgcacacttt

gtttaatcag

agagcttcat

ggcccatacc

acaacttcac

acgtctctga

tggagacgct

gatgcaaatc

cgggactatt

gggagcttcc

ggtttaccgg

tagaccggaa

ctaagatcaa

gcacttcctt

acatccacga

cgatcccgat

acctctcggg

ccggaaaccc

cctccgatcg

cagcggtcac

acgagagatc

acgtcctcga

accgcggatc

cagggaggag

gtcacatcgt

agtacatgcc

agtgggagac

atgactgttc

ctgattttga

cttccgagtg

acactctcaa

tgatagctgg

tgaggaacac

tcgaccagag

tgatgtgtgt

tcactaaccc

2964

tcgtgtcatc

tgggatgctg

cccgttggag

cctcaacgga

cgcgtacaac

gagacacctc

tatccagagc

gttcttgtct

cggcggcgta

ctgtacactc

gtttctccac

cttaaaatct

ctccctctgg

tgagttcatc

gctagagcta

taaccatctc

ggtgctctcc

gctaaacaag

cactctaccg

gggggagatg

tttaatcccc

ccggtttagc

cacgagtgct

aatctccgtc

cgtgattaac

cggaatcggg

gcgagtccca

ttacctctgc

catccacacg

ggcgctgatc

cctctcctgg

gtgcctccaa

catgccgaac

cgatcacgga

gagactcctc

taacgggagc

gaggcacaga

gccgttgatc

ggcccatgtt

tatgtcttcg

agtggatgag

gaagaaaccg

ggagggtgag

gttgactggt

ggaggatgag

tcccaagtcc

214

987

PRT

Brassíca napus 214

Met Ala I

10

15

Tyr Val Ile Ser Ile Leu Leu Leu Ser

20

25

30

40

4 5

50 55

His Cys Ser Phe 65 7 0

Ser Leu Asn Val

60

7 5 8 0

Ser Phe Thr Pro Leu

Leu Leu Phe Leu His Leu His Phe Ser Pro Cys Phe Ala Ser Lys Ser Ser Met VaL Gly Pro Arg Ser Pro Ser Pro Ser Ala > Gly Asp Ala Arg Val Ile CO Ή Phe Gly Thr Ile Ser Pro Glu 240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

2280

2340

2400

2460

2520

2580

2640

2700

2760

2820

2880

2940 85 90 95

Ile Gly Met Leu Asp Arg Leu Val Asn Leu Thr Leu Ala Ala Asn Asn 100 105 HO Phe Ser Gly Met Leu Pro Leu Glu Met Lys Ser Leu Thr Ser Leu Lys 115 120 125 Val Leu Asn Ile Ser Asn Asn Val Asn Leu Asn Gly Thr Phe Pro Gly 130 135 140 Glu Ile Leu Thr Pro Met Val Asp Leu Glu Val Leu Asp Ala Tyr Asn 145 150 155 160 Asn Asn Phe Thr Gly Pro Leu Pro Pro Glu Ile Pro Gly Leu Lys Lys 165 170 175 Leu Arg His Leu Ser Leu Gly Gly Asn Phe Leu Thr Gly Glu Ile Pro 180 185 190 Glu Ser Tyr Gly Asp Ile Gln Ser Leu Glu Tyr Leu Gly Leu Asn Gly 195 200 205 Ala Gly Leu Ser Gly Glu Ser Pro Ala Phe Leu Ser Arg Leu Lys Asn 210 215 220 Leu Lys Glu Met Tyr Val Gly Tyr Phe Asn Ser Tyr Thr Gly Gly Val 225 230 235 240 Pro Pro Glu Phe Gly Glu Leu Thr Asn Leu Glu Val Leu Asp Met Ala 245 250 255 Ser Cys Thr Leu Thr Gly Glu Ile Pro Thr Thr Leu Ser Asn Leu Lys 260 265 270 His Leu His Thr Leu Phe Leu His Ile Asn Asn Leu Thr Gly Asn Ile 275 280 285 Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys Ser Leu Asp Leu Ser 290 295 300 Ile Asn Gln Leu Thr Gly Glu He Pro Gln Ser Phe Ile Ser Leu Trp 305 310 315 320 Asn Ile Thr Leu Val Asn Leu Phe Arg Asn Asn Leu His Gly Pro Ile 325 330 335 Pro Glu Phe Ile Gly Asp Met Pro Asn Leu Gln Val Leu Gln Val Trp 340 345 350 Glu Asn Asn Phe Thr Leu Glu Leu Pro Ala Asn Leu Gly Arg Asn Gly 355 360 365 Asn Leu Lys Lys Leu Asp Val Ser Asp Asn His Leu Thr Gly Leu Ile 370 37 5 380 Pro Met Asp Leu Cys Arg Gly Gly Lys Leu Glu Thr Leu Val Leu Ser 385 390 395 400 Asp Asn Phe Phe Phe Gly Ser Ile Pro Glu Lys Leu Gly Arg Cys Lys 405 410 415 Ser Leu Asn Lys Ile Arg He Val Lys Asn Leu Leu Asn Gly Thr Val 420 425 430 Pro Ala Gly Leu Phe Thr Leu Pro Leu Val Thr Ile Ile Glu Leu Thr 435 440 445 Asp Asn Phe Phe Ser Gly Glu Leu Pro Gly Glu Met Ser Gly Asp Leu 450 455 460 Leu Asp His Ile Tyr Leu Ser Asn Asn Trp Phe Thr Gly Leu Ile Pro 465 470 475 480 Pro Ala Ile Gly Asn Phe Lys Asn Leu Gln Asp Leu Phe Leu Asp Arg 485 490 495 Asn Arg Phe Ser Gly Asn Ile Pro Arg Glu Val Phe Glu Leu Lys His 500 505 510 Leu Thr Lys Ile Asn Thr Ser Ala Asn Asn Leu Thr Gly Asp Ile Pro 515 520 525 Asp Ser Ile Ser Arg Cys Thr Ser Leu Ile Ser Val Asp Leu Ser Arg 530 53 5 540 Asn Arg Ile Gly Gly Asp Ile Pro Lys Asp He His Asp Va .1 Ile Asn 54 5 550 5 5 5 560 Leu Gly Thr Leu Asn Leu Ser Gly Asn Gln Leu Thr Gly Ser Ile Pro 565 570 575 Ile Gly Ile Gly Lys Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Phe 580 58 5 590 Asn Asp Leu 595

Asn Asp Thr 610

Val Ser Cys 625

Ala Leu Phe 645

Thr Ala Leu 660

Lys Hls Glu 675

Asp Phe Lys 690 He Gly Lys 705

Asn Val Asp 725

Ser Asp His 740 His Arg His 755

Asn Leu Leu 770 Leu His Gly 785

Val Ala Val 805

Ser Pro Leu 820

Asp Ser Asp 835 Leu Leu Asp 850 Tyr Gly Tyr 865

Lys Ser Asp 885

Gly Lys Lys 900

Trp Val Arg 915

Thr Val Val 930

Ser Val Ile 945

Ala Thr Thr

9 65

Pro Pro Lys 980

< 210 > 215

< 211> 2925

< 212 > DNA

<213> Eucalyptus grandis <4 00> 215

atggcggcga cggcggcgaa accgccctgc tccttctgcc tcctcctctt cgtctcggct ctgcagctca gggccgccct ggccgcgccc ccctcctcct cctcctcatc ctcctcgtcg ggggtcacgt gcgacgccgg ctcccgggtc ttcggccgcg tcccccgcga aatcggcctc agctgcaacc tctcggggac cctcccgccg ctcgacgtgt acgacaacaa cttcacggcc

Gly Gly Gln Phe Leu Val Phe Tyr Leu Cys Leu Pro Arg His Thr Ser Asp Arg Ile His Thr 640 Ile Thr Ile I Ie Ala Ala Val Ile Arg Gln Met Asn Lys Lys Leu Thr Ala Phe Gln Arg Leu Cys Leu Gln Glu Glu Asn Ile Tyr Arg Gly Ser Met Pro Asn 720 Val Gly Arg Gly Thr Gly Arg Gln Thr Leu Gly Arg He Arg Tyr Val Ala Asn Arg Asp Thr Asn Gly Ser Leu Gly Glu Leu Gln Trp Glu Thr Arg His Arg 800 Cys Tyr Leu His His Asp Cys Lys Ser Asn Asn Ile Leu Leu Asp Phe Gly Leu Ala Lys Phe Met Ser Ser Ile Ala Gly Ser Tyr Thr Leu Lys Val Asp Glu 880 Val Leu Leu Glu Leu Ile Ala Glu Gly Val Asp I Ie Val Arg Pro Gln Pro Ser Asp Ala Ala Leu Thr Gly Tyr Pro Leu Thr Met Met Cys Val Glu Asp Glu 960 Val Val His Met Leu Thr Asn Ala Phe

aagcccgcLt tccctcgcgc aactcgaccg ccgccgccct gtgtctctca ct ccgcgacc gagctc.ggca cagctgccgc

cctacttctg

agagcgacct

ccctccacga

ttccgcattg

acctcactga

tcgtcaacct

acctgaccga

cggaggtggt

cttctcctcc 60

cgacgtgctc 120

ctgggtcggc 180

ctccttcacc 240

cgtccgcctc 300

cacgctcacc 3 60

gctcgaagtc 420

ggggctgaag 48 0

Ser Gly Arg Val Pro Leu 600 605 Ser Phe Ala Gly Asn Pro 615 620 Leu Thr Arg Pro Gly Gln 630 635 Ser Pro Ser Arg Ile Ala 650 655 Ile Leu Ile Ser Val Ala 665 670 Arg Ser Leu Ser Trp Lys 680 685 Ala Glu Asp Val Leu Glu 695 700 Gly Gly Ala Gly Ile Val 710 715 Val Ala Ile Lys Arg Leu 730 735 Gly Phe Thr Ala Glu Ile 745 750 Ile Val Arg Leu Leu Gly 760 765 Leu Tyr Glu Tyr Met Pro 775 780 Ser Lys Gly Gly Hi s Leu 790 795 Glu Ala Ala Lys Gly Leu 810 815 Ile Leu His Arg Asp Val 825 830 Phe Glu Ala His Val Ala 840 845 Gly Ala Ala Ser Glu Cys 855 860 Ile Ala Pro Glu Tyr Ala 870 875 Val Tyr Ser Phe Gly Val 890 895 Pro Val Gly Glu Phe Gly 905 910 Asn Thr Glu Gly Glu Ile 920 925 Ala Ile Val Asp Gln Arg 935 940 His Val Phe Lys Ile Ala 950 955 Arg Pro Thr Met Arg Glu 970 975 Ser Val Thr Asn Leu Ile 98 5 aagctgaagt ggctcaacct cgccggcaat tacttcttcg gcgagatacc ggaggtttac

tcggagatgg agagcctgga gtacctgggc ctgcaggcga accagctgag cggcagagtc

ccggcgagcc tcgcgaagct gaagaacctc cagtggctct acctgggcta cttcaacacg

tacgatggcg agattccggc ggagttcggg tctatgaaag agctcagacg cctcgacttg

gcgagctgcg gcctctccgg cgagattccg gtgagcctga gcgagctaaa gaagttagac

tctctgttcc tccagtggaa caacctcatg ggcgttatcc cccccgagct ctcgaagatg

ttgagcctca tgtccctcga cctctccaac aattacctca ctggagtgat tccggcgacc

ttcgccgaac tcaagaacct gactctgctc aacctgttcg cgaaccacct ggaaggccag

atccccgagt tcgtgggcga gcttccgaac ctggagaccc tccaggtttg gggcaacaac

ttcacgatga tgttgccagc gggcctaggg aggaacggga ggctgctata cgtcgacgtc

acgcagaacc acttcaccgg cacgatccct cgggaattgt gccggggagg gaggctcaag

actctgatcc tgaccaacaa ctcgttcttt gggcccatcc ctgatgaatt cggggagtgc

aagtcgctga ccaaagtccg agtcggcaag aactttctcg acgggacgat tcctcggggg

atcttcaacc tgccgcaagc aactataatc gagcttaacg acaatctctt ctccggcgag

ctcccggcgc agatgtccgg cgagaacttg gtcatcctgt cgctctcgaa caaccggatt

tccggtgaga tccctccggc gattggcaac ttcagcggcc tgcgtactct gttactggac

gcgaacaggt tctccggcaa gattcccagc gagcttttct cgccgaggtt cctactgagg

gtgaacatca gcgggaacag catcagcggc aggattcctg gttcggtcac tgggtgcact

tctctggcag cccttgattt gagcaggaac aatctcgctg gcgagattcc gaacggcttg

tctagcctga aagtgttggc cgtcctcaat ctgtcgagca acagattgac cggtccagtt

ccaaaggaaa ttggcatcat gaccagcctc aatacgctcg atttgtcctt caacgatctc

tccggcgaag tcccccacga aggccagttc ctcgtcttca agaactcctc cttcgccgga

aaccagaaac tctgctcgcc aggccgcttc tcttgccctt cgcggtcaag tgcctcgcgc

acttcctcga gggttgtgat cacggcaatc tcactcgtga ccgcggcgct gctcatcacc

gtcacggtct accaggtcct gaagaggagg cggcagggct cgagagcctg gaagctcact

gccttccaga agctcggctt caaggccgag gacgtgctca agtgcctgga ggaggagaat

atcatcggca aaggtggcgc ggggatcgtc taccgcgggt cgatgcccaa cgggacggac

gtcgccatca agcagctggc gggacggggc ggcaacgggc tcagcgacca cggcttctcc

gcggagattc agaccctcgg tcggatccgg caccggaaca tcgtgaggct cctcggatac

ctctccaaca aggacaccaa cctgttgctg tacgagtaca tgcccaatgg gagcttaggg

gagctgttgc atggttcgaa aggcggccac ttgcagtggg agacgcggta tcggatcgcc

gtggaggccg cgaaggggct gtgctacctc caccacgatt gcttgccgct gataattcat

cgagacgtga agtcgaacaa cattctgctg gattcggact tcgaggcgca cgtcgctgat

ttcgggctgg ccaagttctt gcaggacgcc ggcgcatcgg agtgcatgtc gtccgtggcc

ggttcctacg gctacatagc cccagaatac gcctacacgc tgaaagtgga cgagaagagc

gacgtgtaca gcttcggggt cgtgctgctg gagctgatag ccgggaggaa gccggtgggg

gagtttggcg acggcgtgga catcgtgagg tgggtgaaga ccgcgtcgga ccccctcccg

cagccgccgt cggacgcggc cttggtgctg gccgtgatcg accgcaggct gggcgggtac

cccatcgcga gcgtgatcca cctcttcaag atcgcgtgcc ggtgcgtcga ggaggagagt

tccgagaggc ccaccatgag agaagtcgtc cacatgctga caaacccgcc tctgtccgcc

accaccttcg ccgtcggcgc caccccggac ctcatcaaac tgtag 2925

<210> 216

<211> <212> <213> <4 00> Met AJ 1

97 4 PRT

Eucalyptus grandis 216

5

10

15

20

25

30

35

40

45

50

5 5

60

65

70

75

100

105

95

IiO

115

120

125

Cys Lys Pro Ala Ser Tyr Phe Leu Phe Val Ser Ala Ser Leu Gln Leu Arg Ala Ala Leu Ala Trp Val Gly Pro Ser Ser Ser Phe Pro His Cys Ser Phe Thr Val Val Ser Leu Asn Leu Thr Arg Glu Ile Gly Leu Leu Arg Cys Asn Leu Ser Gly Thr Leu Leu Glu Val Leu Asp Val Tyr 540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

2280

2340

2400

2460

2520

2580

2640

2700

2760

2820

2880 130 135 140

Asp Asn Asn Phe Thr Ala Gln Leu Pro Pro Glu Val Val Gly Leu Lys 14 5 150 155 160 Lys Leu Lys Trp Leu Asn Leu Ala Gly Asn Tyr Phe Phe Gly Glu He 165 170 17 5 Pro Glu Val Tyr Ser Glu Met Glu Ser Leu Glu Tyr Leu Gly Leu Gln 180 185 190 Ala Asn Gln Leu Ser Gly Arg Val Pro Ala Ser Leu Ala Lys Leu Lys 195 200 205 Asn Leu Gln Trp Leu Tyr Leu Gly Tyr Phe Asn Thr Tyr Asp Gly Glu 210 215 220 I Ie Pro Ala Glu Phe Gly Ser Met Lys Glu Leu Arg Arg Leu Asp Leu 225 230 235 240 Ala Ser Cys Gly Leu Ser Gly Glu Ile Pro Val Ser Leu Ser Glu Leu 245 250 255 Lys Lys Leu Asp Ser Leu Phe Leu Gln Trp Asn Asn Leu Met Gly Val 260 265 270 Ile Pro Pro Glu Leu Ser Lys Met Leu Ser Leu Met Ser Leu Asp Leu 275 280 285 Ser Asn Asn Tyr Leu Thr Gly Val Ile Pro Ala Thr Phe Ala Glu Leu 290 295 300 Lys Asn Leu Thr Leu Leu Asn Leu Phe Ala Asn His Leu Glu Gly Gln 305 310 315 320 He Pro Glu Phe Val Gly Glu Leu Pro Asn Leu Glu Thr Leu Gln Val 325 330 335 Trp Gly Asn Asn Phe Thr Met Met Leu Pro Ala Gly Leu Gly Arg Asn 340 345 350 Gly Arg Leu Leu Tyr Val Asp Val Thr Gln Asn His Phe Thr Gly Thr 355 360 365 Ile Pro Arg Glu Leu Cys Arg Gly Gly Arg Leu Lys Thr Leu Ile Leu 370 375 380 Thr Asn Asn Ser Phe Phe Gly Pro Ile Pro Asp Glu Phe Gly Glu Cys 385 390 395 400 Lys Ser Leu Thr Lys Val Arg Val Gly Lys Asn Phe Leu Asp Gly Thr 405 410 415 Ile Pro Arg Gly Ile Phe Asn Leu Pro Gln Ala Thr Ile Ile Glu Leu 420 425 430 Asn Asp Asn Leu Phe Ser Gly Glu Leu Pro Ala Gln Met Ser Gly Glu 435 440 445 Asn Leu Val Ile Leu Ser Leu Ser Asn Asn Arg Ile Ser Gly Glu He 4 50 455 460 Pro Pro Ala Ile Gly Asn Phe Ser Gly Leu Arg Thr Leu Leu Leu Asp 465 470 475 480 Ala Asn Arg Phe Ser Gly Lys Ile Pro Ser Glu Leu Phe Ser Pro Arg 485 490 495 Phe Leu Leu Arg Val Asn He Ser Gly Asn Ser Ile Ser Gly Arg Ile 500 505 510 Pro Gly Ser Val Thr Gly Cys Thr Ser Leu Ala Ala Leu Asp Leu Ser 515 520 52 5 Arg Asn Asn Leu Ala Gly Glu Ile Pro Asn Gly Leu Ser Ser Leu Lys 530 535 540 Val Leu Ala Val Leu Asn Leu Ser Ser Asn Arg Leu Thr Gly Pro Val 545 550 5 55 560 Pro Lys Glu Ile Gly Ile Met Thr Ser Leu Asn Thr Leu Asp Leu Ser 565 570 575 Phe Asn Asp Leu Ser Gly Glu Val Pro His Glu Gly Gln Phe Leu Val 580 585 590 Phe Lys Asn Ser Ser Phe Ala Gly Asn Gln Lys Leu Gys Ser Pro Gly 595 600 605 Arg Phe Ser Cys Pro Ser Arg Ser Ser Ala Ser Arg Thr Ser Ser Arg 610 615 620 Val Val Ile Thr Ala Ile Ser Leu Val Thr Ala Ala Leu Leu Ile Thr 625 630 635 640 Val Thr Val Tyr Gln Val Leu Lys Arg Arg Arg Gln Gly Ser Arg Ala 645 650 655 Trp Lys Leu Thr Ala Phe Gln Lys Leu Gly Phe Lys Ala Glu Asp Val 6 60 665 670 Leu Lys Cys Leu Glu Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly 675 680 685 Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp Val Ala Ile Lys 690 695 700 Gln Leu Ala Gly Arg Gly Gly Asn Gly Leu Ser Asp His Gly Phe Ser 705 710 715 720 Ala Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg Asn Ile Val Arg 725 730 735 Leu Leu Gly Tyr Leu Ser Asn Lys Asp Thr Asn Leu Leu Leu Tyr Glu 74 0 745 750 Tyr Met Pro Asn Gly Sor Leu Cly Glu Leu Leu IIio C' 1 , . Ser Lys Gly 755 760 765 OJ- _y Gly His Leu Gln Trp Glu Thr Arg Tyr Arg Ile Ala Val Glu Ala Ala 770 775 780 Lys Gly Leu Cys Tyr Leu His His Asp Cys Leu Pro Leu Ile Ile His 785 790 795 800 Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu Ala 805 810 815 His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Gln Asp Ala Gly Ala 820 825 830 Ser Glu Cys Met Ser Ser Val Ala Gly Ser Tyr Gly Tyr Ile Ala Pro 835 840 845 Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser 850 855 860 Phe Gly Val Val Leu Leu Glu Leu Ile Ala Gly Arg Lys Pro Val Gly 865 870 875 880 Glu Phe Gly Asp Gly Val Asp Ile Val Arg Trp Val Lys Thr Ala Ser 885 890 895 Asp Pro Leu Pro Gln Pro Pro Ser Asp Ala Ala Leu Val Leu Ala Val 900 905 910 Ile Asp Arg Arg Leu Gly Gly Tyr Pro Ile Ala Ser Val Ile His Leu 915 920 925 Phe Lys Ile Ala Cys Arg Cys Val Glu Glu Glu Ser Ser Glu Arg Pro 930 935 940 Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Leu Ser Ala 945 950 955 960 Thr Thr Phe Ala Val Gly Ala Thr Pro Asp Leu Ile Lys Leu 965 970 <210>

<211>

<212>

<213>

<4 00>

atgagaagct gcaacgtgtt ggagacagag cactgtttct tcctttgttc aacctcacca acttccctca ataattcttc tcgcttccgg aagagttcgt

217

2946

DNA

Glycine max 217

gtgtgtgtta cacgctttta cttcgttcag tgacatggat

ccaaagacga

tttcaggtgt

ctctcttcgg ccacgttccg tctcgcagaa caacctcacc

tatttctccg

ttaagcacca

aggattctca

accatggaat

ccgagtctag

ggaaccattc

aacggcctca

agcacctcaa cgatgaccga actcgaggtc gaaactggag ggagagttac ggggaatatt caacaacgct ccttgacctc

ttgtttgttt gcgctgctga gactggaagt caagaacttc ccggagatcg ggcgaacttc catctctcac aacgtcttct

cgcgctccat

atcttgcgac

gaagcatacc atagcttatc agctcggata ctctgaaata caaatatgag aaacctcgac cgtctgagct ctccgacatg ccggggagat accgacgcgc

ctcgacgtct

aaattgaaat

tcggagttta

ccgaagagtt

tacgaaggcg

tcaagctgca

acgttgttct

gtgagcctca

ttctctcagc

tcttcatatg

agctgaagga

tttccacgtc

gagttgttgc

gagaattgga

ccaaggagct

ccggctattt

acgacaacaa

acctgaagct

agagcttgga

tgtctaagtt

gaattccacc

acctcagcgg

tgcaaatgaa

tgtcactgga

tgaaaaacct

gctacacgtg

gtccatgaag

gctttctgca

tatcaacgtc

caaacttgaa

cgccgccctc

tcccggcaaa

cttcaccgga

cgacggaaac

gtttttaagc

gaagacgctg

ggagttcggc

cgagattcca

taacctcacc

tctctccttc

cactctgatg

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960 aacttcttcc ctggaaacgc caaaacggga cgggatttgt ggtccaatcc aactacctta gagttggcca gggattctca ttaagggcac gaggtttttg ccaatcccaa atgcttgacg gtgtcgataa accacgctgg ttggtcttca cctaattcct gtcatggtga aggaggagga ttgaaagccg gcagggatcg gttggagcgg aagataaggc ttgcttctgt ggaggtcatt tgctatttgc atattgctcg tacgaccttg ccagagtatg gtgctgttgg atcgttggat gtgttggcag ttcaacatag gtagttcata ctctag <210>

acaacaatct

tgcagctctg

agttcaagtt

gcaagagtgg

ctaacgagat

acggcgcagt

ataaccgttt

ctctttccaa

tgcagactct

acctaccaat

cgacgtttac

gggagattcc

accaaatctc

atctctccta

gcgacaaatc

cgttgaagaa

ttgcactggc

agctgaagct

aggaggtggt

tgtaccgcgg

ggagtggaag

acaggaacat

atgagtacat

taaagtggga

accatgattg

atgctcactt

gctcctctca

cttacacttt

aactgataat

gggtcaacaa

tggtggaccc

ctatgatgtg

tgctctcaaa

ccgaggctca

ggagaacaat

cttcgacgtc

gaggttacaa

tgctaactgc

tccgtcaggg

taacggagaa

caacttattc

gtcacttgac

gctgactgtg

tcgctgcgtt

caaggggatg

agggtcagtc

caacaatttc

ctttgcaggg

gagacgcggc

cactgcggcg

tgcgatgacg

ggagtgtcta

gtccatgaga

gaacgattac

aatgaggctt

gccgaatggg

aatgaggtac

ttcccctctt

tgaggctcat

gtccatgtcc

gaaagtggac

agggaggaag

aacgagattg

aaggcttagt

tgttaaagaa

tcctcctcac

gttccctcct ttctcctctg acgaagaatc acgttcttga aagtctctaa attttcaagc ctgcctcccg ac.tgggaaaa acgaacgaat gtcaacataa tcactcgccg aaaaacctaa ccagacgaga atcggcaagg aacccgaatc ccttggagtt attctcgtgg tggaagctga aaagaagaga aacggaagcg gggttcaaag ttgggttacg agcttagggg aagattgcgg atcattcaca gttgctgatt tccattgctg gagaaaagtg ccagttggtg gagctctctc gggtatccat gtggggccca tttaccactc 2 94 6

tcgtcggcga

agctcccgca

acttcagcgg

tcacagataa

ccaagatccg

taccttccgt

aaatttccgg

ttcccccagc

tccttggaga

gcggcaacaa

ccgttgatct

cggatttaag

ttcgcttcat

tccctaccgg

tctgtagttc

tgaaatcgac

cggggacgga

cggggttcca

acataatagg

acgtggcaat

cggagataga

tgtcgaacaa

agtggctgca

tggaagctgc

gggatgtcaa

ttggccttgc

gctcctacgg

atgtgtacag

agtttggaga

agccgtcgga

tgataagtgt

ctaggcctac

acactcacaa

gcttcctaat gaacctgggg gt tgatccct cttcttccat agcctccaat cacgataatc cgattcactc gt tgaagaac aatcccgggg tctcaccgga tagccggaac cattttcaat gt tgagtctc tggtcagttt ccactcttgc gagggtgatc gtacatgagg gcggctgaac aaaaggagga aaagcggttg gacggtgggg ggagacgaac tggtgccaag aaagggacta gtctaataat caagttcttg ctacattgct ctttggcgtg cggggtggac tgcagcagta catttacatg catgagggaa cctaattaat

<211> <212> <2 13> <400>

218

981

PRT

Glycine max 218

Met Arg Ser Cys Val Cys Tyr Thr Leu Leu Leu Phe Val Phe Phe Ile 1 5 10 15 Trp Leu His Val Ala Thr Cys Ser Ser Phe Ser Asp Met Asp Ala Leu 20 25 30 Leu Lys Leu Lys Glu Ser Met Lys Gly Asp Arg Ala Lys Asp Asp Ala 35 40 45 Leu His Asp Trp Lys Phe Ser Thr Ser Leu Ser Ala His Cys Phe Phe 50 55 60 Ser Gly Val Ser Cys Asp Gln Glu Leu Arg Val Val Ala Ile Asn Val 65 70 75 80 Ser Phe Val Pro Leu Phe Gly His Val Pro Pro Glu Ile Gly Glu Leu 8 5 90 95 Asp Lys Ijeu Glu Asn Leu Thr Ile Ser Gln Asn Asn Leu Thr Gly Glu 100 105 110 Leu Pro Lys Glu Leu Ala Ala Leu Thr Ser Leu Lys His Leu Asn Ile 115 120 125 Ser His Asn Val Phe Ser Gly Tyr Phe Pro Gly Lys Ile Ile Leu Pro 130 135 140 Met Thr Glu Leu Glu Val Leu Asp Val Tyr Asp Asn Asn Phe Thr Gly 145 150 155 160 Ser Leu Pro Glu Glu Phe Val Lys Leu Glu Lys Leu Lys Tyr Leu Lys 165 170 175 Leu Asp Gly Asn Tyr Phe Ser Gly Ser Ile Pro Glu Ser Tyr Ser Glu 180

190

1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 17 4 0 1800 1860 1920 1980 2040 2100 2160 2220 2280 234 0 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 Phe Lys Ser Leu Glu Phe Leu Ser Leu Ser Thr Asn Ser Leu Ser Gly 195 200 205

Asn Ile Pro Lys Ser Leu Ser Lys Leu Lys Thr Leu Arg Ile Leu Lys 210 215 220

Leu Gly Tyr Asn Asn Ala Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly 225 230 235 240

Thr Met Glu Ser Leu Lys Tyr Leu Asp Leu Ser Ser Cys Asn Leu Ser 245 250 255

Gly Glu Ile Pro Pro Ser Leu Ala Asn Met Arg Asn Leu Asp Thr Leu 260 265 270

Phe Leu Gln Met Asn Asn Leu Thr Gly Thr Ile Pro Ser Glu Leu Ser 275 280 285

Asp Met Val Ser Leu Met Ser Leu Asp Leu Ser Phe Asn Gly Leu Thr 290 295 300

Gly Glu Ile Pro Thr Arg Phe Ser Gln Leu Lys Asn Leu Thr Leu Met 305 310 315 320

Asn Phe Phe His Asn Asn Leu Arg Gly Ser Val Pro Ser Phe Val Gly 325 330 335

Glu Leu Pro Asn Leu Glu Thr Leu Gln Leu Trp Glu Asn Asn Phe Ser 340 345 350

Ser Glu Leu Pro Gln Asn Leu Gly Gln Asn Gly Lys Phe Lys Phe Phe 355 360 365

Asp Val Thr Lys Asn His Phe Ser Gly Leu Ile Pro Arg Asp Leu Cys 370 375 380

Lys Ser Gly Arg Leu Gln Thr Phe Leu Ile Thr Asp Asn Phe Phe His 385 390 395 400

Gly Pro Ile Pro Asn Glu Ile Ala Asn Cys Lys Ser Leu Thr Lys Ile 405 410 415

Arg Ala Ser Asn Asn Tyr Leu Asn Gly Ala Val Pro Ser Gly Ile Phe 420 425 430

Lys Leu Pro Ser Val Thr Ile Ile Glu Leu Ala Asn Asn Arg Phe Asn 435 440 445

Gly Glu Leu Pro Pro Glu Ile Ser Gly Asp Ser Leu Gly Ile Leu Thr 450 455 460

Leu Ser Asn Asn Leu Phe Thr Gly Lys Ile Pro Pro Ala Leu Lys Asn 465 470 475 480

Leu Arg Ala Leu Gln Thr Leu Ser Leu Asp Thr Asn Glu Phe Leu Gly 485 490 495

Glu Ile Pro Gly Glu Val Phe Asp Leu Pro Met Leu Thr Val Val Asn 500 505 510

Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Phe Thr Arg 515 520 525

Cys Val Ser Leu Ala Ala Val Asp Leu Ser Arg Asn Met Leu Asp Gly 530 535 540

Glu Ile Pro Lys Gly Met Lys Asn Leu Thr Asp Leu Ser Ile Phe Asn 545 550 555 560

Val Ser Ile Asn Gln Ile Ser Gly Ser Val Pro Asp Glu Ile Arg Phe 565 570 575

Met Leu Ser Leu Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Ile Gly 580 585 590

Lys Val Pro Thr Gly Gly Gln Phe Leu Val Phe Ser Asp Lys Ser Phe 595 600 605

Ala Gly Asn Pro Asn Leu Cys Ser Ser His Ser Cys Pro Asn Ser Ser 610 615 620

Leu Lys Lys Arg Arg Gly Pro Trp Ser Leu Lys Ser Thr Arg Val Ile 625 630 635 64 0

Val Met Val Ile Ala Leu Ala Thr Ala Ala Ile Leu Val Ala Gly Thr 645 650 655

Glu Tyr Met Arg Arg Arg Arg Lys Leu Lys Leu Ala Met Thr Trp Lys 660 665 67 0

Leu Thr Gly Phe Gln Arg Leu Asn Leu Lys Ala Glu Glu Val Val Glu 675 680 685

Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val 690

Tyr Arg Gly '7 05

Val Gly Ala

725

Glu Thr Val 740

Tyr Val Ser 755 Asn Gly Ser 770 Lys Trp Glu 785

Cys Tyr Leu 805

Lys Ser Asn 820

Asp Phe Gly 835

Met Ser Ser 850 Tyr Thr Leu 865

Val Leu Leu 885

Asp Gly Val 900

Ser Gln Pro 915

Leu Ser Gly 930

Met Met Cys 945

Val Val His 965

Asn Leu Ile 980

<210> 219 <211> 2964 <212> DNA <213> Glyc <4 00> 219 atgagaagct gtgtgtgcta gcaacgtgct cttcgttcac ggagataaag ccaaagacga cactgtttct tcgtttgttc aacctcaccg acttccctca attatccttc ccgcttcccg tatttctccg ttaagcacca aggtacctaa agcatgaaat ccgagccttg ggaaccattc aacgacctca aacttcttcc ctggaaacgc caaaacggca cgagatt tgt ggtccaatcc

700

Asn Gly Ser Asp Val Ala 715 720

Arg Asn Asp Tyr Gly Phe 7 35

Arg His Arg 750

Thr Asn Leu 765

Trp Leu His 780 Lys Ile Ala 795

Cys Ser Pro 815

Leu Asp Ala 830

Phe Leu Tyr 845

Ser Tyr Gly 860

Glu Lys Sei:

875

Ile Gly Arg 895

Gly Trp Val 910 Aia Val 925 Ile Ser 940 Val Gly 955

Asn Pro

Ile Lys Arg Leu

Lys Ala Glu Ile Arg Leu Leu Gly Glu Tyr Met Pro Gly Gly His Leu Ala Lys Gly Leu His Arg Asp Val Ala His Val Ala Ser Ser Gln Ser Pro Glu Tyr Ala Gly Val Phe Gly Glu Leu Pro Arg Ile Ala Arg Glu His

60 120 18 0 240 300 360 420 4 80 540 600 660 720 780 840 900 960 102 0 1080 1140 1200 1260

tttcaggcgt

ctctcttcgg

tctcgcagaa

agcacctcaa

cgatgacgaa

tagagttggt

gcagcatacc

atagcttatc

aactcggata

ctctgagata

caaatctgac

cgtcggagct

ccggtgagat

aaaacaatct

tgcagctctg

agttaaagtt

gtaagagtgg

ctaacgagat

cacgctatta

tgacatggaa

cgctctccat

aaaatgcgac

tcaccttccg

caacctcacc

catctctcac

actggaggtc

gaaactggag

ggagagttac

ggggaagatt

caacaacgct

ccttgacctc

aaaccttgac

ctccgctatg

accgatgagc

tcgcggctca

ggataacaac

cttcgacgtc

gaggttacaa

tggtaactgc

ttgtttattt

tcgcttctga

gactggaagt

cgagaacttc

ccggagatcg

ggcgtacttc

aacgtcttct

ctcgacgtct

aaattaaaat

tcggagttta

cccaagagtt

tacgaaggtg

tctagctgca

acgttgttcc

gtgagcctca

ttctcacagc

gttccgtcct

ttctccttcg

atcaagaatc

acgatcatga

aagtctctca

695

Ser Met Arg 710

Gly Ser Gly 730

Gly Lys Ile 745

Asn Lys Glu 760

Leu Gly Glu 775

Met Arg Tyr 790

His His Asp 810

Asn Ile Leu 825 Leu Ala Lys 840

Ile Ala Gly 855

Lys Val Asp 870

Glu Leu Ile 890

Asp Ile Val 905

Ser Asp Ala 920

Tyr Pro Leu 935

Val Lys Glu 950

Met Leu Ser 970

Asn Leu

ine max

Asn Ile

Leu Leu

Gly Ala

Val Glu 800

Leu Ile

His Phe

Asp Leu

Tyr Ile

Asp Val 880

Lys Pro

Asn Lys

Val Leu Ala

Val Ile Tyr

Pro Thr Arg 960

Pro His Phe 975

Met Tyr Lys Ala Ile Glu Gly Ala Tyr Ser Phe Val Gly Glu Thr Arg Leu Val Val Asp Met Phe Asn Pro Thr Met Thr Thr His

tcttcatatg

agctgaagga

ttttcccctc

gagtcgttgc

gacaattgga

ccaaggagct

ccggccattt

acgacaacaa

acctgaagct

agagcttgga

tgtcgaagtt

gaattccacc

acctcagcgg

tgcaaattaa

tgtcacttga

ttagaaacct

tcgtcggcga

tgctacctcc

acttcaccgg

tcacagataa

ccaagatccg

Thr

gctgcgcgtg

ctccatgaaa

gctttctgca

tatcaacgtc

caaactcgag

cgccgccctc

ccccggccaa

cttcaccgga

cgacggaaac

gtttttaagc

gaagacgctg

ggagtttggc

cgagattcca

caacctcacc

tctctccatc

cactctcatg

gcttccgaat

gaaccttggg

gttgatccct

cttcttccgc

agcctccaat aactacctta acggcgtggt tccgtcaggg attttcaaac gagctggcca ataaccgttt: taacggcgaa ctgcctcctg gggattctca ctctttccaa caacttattc agtgggaaaa ttgagggcac tgcagactct ctcacttgac gcaaacgagt gaggtttttg acctaccgat gctgactgtg gtcaacataa ccaatcccaa cgacgttgac tcgctgcgtt tcactcaccg atgcttgaag ggaagattcc gaagggaatc aaaaacctca gtgtcgataa accaaatttc agggccagtc cctgaggaga accacattgg atctatccaa caacaatttc atcggcaagg gcggtcttca gcgagaaatc, ctttgcaggg aaccccaacc ccgaattcct cgttgtaccc tgacgacgcc ttgaagaaga aaatccacga gggtgatagt catcgtgatt gcactgggca gtgacggtgt acatgatgag gaggaggaag atgaaccttg gcgttccagc ggctgaactt caaagccgag gacgtggtgg ataataggaa aaggaggggc agggatcgtg taccgcgggt gtggcgataa agcggttggt tggggcgggg agtggaagga gagatagaaa cgctggggaa gataaggcac aggaacataa tcgaacaagg agacgaactt gctgctgtat gagtacatgc tggctgcatg gtgccaaagg agggcacttg aagtgggaaa gaagctgcta agggactgtg ctatttgcac catgattgtt gatgtcaagt ctaataatat attgctggat ggggacttgg ggccttgcca agttcttgta cgaccctggc gcctctcagt tcctacggct acattgctcc agagtatgca tacactttga gtgtacagct ttggcgttgt gctgctggag ctgataatag tttggagacg gggtggacat cgttggatgg gtcaacaaaa ccgtcggatg cagcgttggt gttggcagtg gtggacccaa acaagtgtca tttacatgtt caacatagct atgatgtgtg aggcctacca tgagggaagt cgttcatatg ctctcagagc actcacaacc taattaatct ctag <210> 220

taccttctgt

agatttccgg

ttcccccagc

tcgttggaga

gcggcaacaa

ccgtggacct

cggacttgag

ttcgcttcat

tcccaaccgg

tctgtacctc

ggcgcggccc

cagccgcgct

cgaagacgtg

agtgtctgaa

ccatgccaaa

acgattacgg

tgaggctttt

caaatgggag

tgaggtacaa

cccctcttat

aggcccatgt

ccatgtcctc

aagtggacga

ggaggaagcc

cgagattgga

ggttgagtgg

ttaaagaaat

ctcctcactc

2964

cacgataatc

cgaatccctg

gttgaagaac

aataccggga

tctaaccgga

cagccggaac

cattttcaat

gttgagtctc

gggtcagttc

ccactcttgc

ttggagtttg

gctggtggcg

gaagctgacg

ggaggagaac

cggaacagac

attcaaagcg

aggttacgtg

cttaggggaa

gattgcggtg

cattcacagg

tgctgatttt

cattgctggc

gaaaagtgat

agtgggagag

gctcgctcag

gtatccattg

ggggcccgct

tgctactcac

<211> <212> <213> <400>

987

PRT

Glycine max 220

Met Arg Ser Cys Val Cys Tyr Thr Leu Leu Leu Phe Ile Phe Phe Ile 1 5 10 15 Trp Leu Arg Val Ala Thr Cys Ser Ser Phe Thr Asp Met Glu Ser Leu 20 25 30 Leu Lys Leu Lys Asp Ser Met Lys Gly Asp Lys Ala Lys Asp Asp Ala 35 40 45 Leu His Asp Trp Lys Phe Phe Pro Ser Leu Ser Ala His Cys Phe Phe 50 55 60 Ser Gly Val Lys Cys Asp Arg Glu Leu Arg Val Val Ala Ile Asn Val 65 70 75 80 Ser Phe Val Pro Leu Phe Gly His Leu Pro Pro Glu Ile Gly Gln Leu 85 90 95 Asp Lys Leu Glu Asn Leu Thr Val Ser Gln Asn Asn Leu Thr Gly Val 100 105 HO Leu Pro Lys Glu Leu Ala Ala Leu Thr Ser Leu Lys His Leu Asn Ile 115 120 125 Ser His Asn Val Phe Ser Gly His Phe Pro Gly Gln Ile Ile Leu Pro 130 135 14 0 Met Thr Lys Leu Glu Val Leu Asp Val Tyr Asp Asn Asn Phe Thr Gly 145 150 155 160 Pro Leu Pro Val Glu Leu Val Lys Leu Glu Lys Leu Lys Tyr Leu Lys 165 170 175 Leu Asp Gly Asn Tyr Phe Ser Gly Ser Ile Pro Glu Ser Tyr Ser Glu 180 185 190 Phe Lys Ser Leu Glu Phe Leu Ser Leu Ser Thr Asn Ser Leu Ser Gly 195 200 205 Ijys Ile Pro Lys Ser Leu Ser Lys Leu Lys Thr Leu Arg Tyr Leu Lys 210 215 220 Leu Gly Tyr Asn Asn Ala Tyr Glu Giy Gly Ile Pro Pro Glu Phe Gly 1320 1380 1440 1500 1560 1620 1680 17 4 0 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 225 230 235 240 Ser Met Lys Ser Leu Arg Tyr Leu Asp Leu Ser Ser Cys Asn Leu Ser 245 250 255 Gly Glu Ile Pro Pro Ser Leu Ala Asn Leu Thr Asn Leu Asp Thr Leu 260 265 270 Phe Leu Gln Ile Asn Asn Leu Thr Gly Thr Ile Pro Ser Glu Leu Ser 275 280 285 Ala Met Val Ser Leu Met Ser Leu Asp Leu Ser Ile Asn Asp Leu Thr 290 295 300 Gly Glu Ile Pro Met Ser Phe Ser Gln Leu Arg Asn Leu Thr Leu Met 305 310 315 320 Asn Phe Phe Gln Asn Asn Leu Arg Gly Ser Val Pro Ser Phe Val Gly 325 330 335 Glu Leu Pro Asn Leu Glu Thr Leu Gln Leu Trp Asp Asn Asn Phe Ser 340 345 350 Phe Val Leu Pro Pro Asn Leu Gly Gln Asn Gly Lys Leu Lys Phe Phe 355 360 365 Asp Val Ile Lys Asn His Phe Thr Gly Leu Ile Pro Arg Asp Leu Cys 370 375 380 Lys Ser Gly Arg Leu Gln Thr Ile Met Ile Thr Asp Asn Phe Phe Arg 385 390 395 400 Gly Pro Ile Pro Asn Glu Ile Gly Asn Cys Lys Ser Leu Thr Lys Ile 405 410 415 Arg Ala Ser Asn Asn Tyr Leu Asn Gly Val Val Pro Ser Gly Ile Phe 420 425 430 Lys Leu Pro Ser Val Thr Ile Ile Glu Leu Ala Asn Asn Arg Phe Asn 435 440 445 Gly Glu Leu Pro Pro Glu I Ie Ser Gly GIu Ser Leu Gly Ile Leu Thr 450 455 460 Leu Ser Asn Asn Leu Phe Ser Gly Lys Ile Pro Pro Ala Leu Lys Asn 465 470 475 480 Leu Arg Ala Leu Gln Thr Leu Ser Leu Asp Ala Asn Glu Phe Val Gly 485 490 495 Glu I Ie Pro Gly Glu Val Phe Asp Leu Pro Met Leu Thr Val Val Asn 500 505 510 He Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Leu Thr Arg 515 520 525 Cys Val Ser Leu Thr Ala Val Asp Leu Ser Arg Asn Met Leu Glu Gly 530 535 540 Lys Ile Pro Lys Gly Ile Lys Asn Leu Thr Asp Leu Ser Ile Phe Asn 545 550 555 560 Val Ser Ile Asn Gln Ile Ser Gly Pro Val Pro Glu Glu Ile Arg Phe 565 570 575 Met Leu Ser Leu Thr Thr Leu Asp Leu Ser Asn Asn Asn Phe Ile Gly 580 585 590 Lys Val Pro Thr Gly Gly Gln Phe Ala Val Phe Ser Glu Lys Ser Phe 595 600 605 Ala Gly Asn Pro Asn Leu Cys Thr Ser His Ser Cys Pro Asn Ser Ser 610 615 620 Leu Tyr Pro Asp Asp Ala Leu Lys Lys Arg Arg Gly Pro Trp Ser Leu 625 630 635 64 0 Lys Ser Thr Arg Val He Val Ile Val Ile Ala Leu Gly Thr Ala Ala 6 4 5 650 655 Leu Leu Val Ala Val Thr Val Tyr Met Met Arg Arg Arg Lys Met Asn 660 66 i5 670 Leu Ala Lys Thr Trp Lys Leu Thr Ala Phe Gln Arg Leu Asn Phe Lys 675 680 685 Ala Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile GI y Lys 690 695 700 Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp 7 05 710 715 720 Val Ala Ile I. ys Arg Leu Val Gly Ala Gly Ser Gly Arg Asn Asp Tyr 725 7 30 7 35 120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

123

Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly Lys Ile Arg His Arg Asn 740 7 4 5 750 Ile Met Arg Leu Leu Gly Tyr Val Ser Asn Lys Glu Thr Asn Leu Leu 755 760 765 Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Trp Leu His Gly 770 775 780 Ala Lys Gly Gly His Leu Lys Trp Glu Met Arg Tyr Lys Ile Ala Val 785 790 7 95 800 Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu 805 810 815 Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Gly Asp 820 825 830 Leu Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp 835 840 845 Pro Gly Ala Ser Gln Ser Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr 850 855 860 Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp 865 870 875 880 Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ile Gly Arg Lys 885 890 895 Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile Val Gly Trp Val Asn 900 905 910 Lys Thr Arg Leu Glu Leu Ala Gln Pro Ser Asp Ala Ala Leu Val Leu 915 920 925 Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro Leu Thr Ser Val He 930 935 940 Tyr Met Phe Asn Ile Ala Met Met Gys Val Lys Glu Met Gly Pro Ala 945 950 955 960 Arg Pro Thr Met Arg Glu Val Val His Met Leu Ser Glu Pro Pro His 965 970 975 Ser Ala Thr His Thr His Asn Leu Ile Asn Leu 980 985 <210> 221 <211> 2961 <212> DNA <213> Lotus japonica <400> 221 atgagaatca

acagtggtgt

aagggagcca

gcacactgtt

gtcacgctgg

gagaatctca

ctcacctccc

aacatcaccg

ggtcctctcc

aactatttct

ggcttgaacg

ttgaaggaac

ggttccatgg

ccaccgagcc

accggaacca

atcaacgacc

atgaacttct

aatctcgaaa

ggcggaaacg

ccgccggatc

cgtggcccaa

aacaacttcc

acggaattga

ctcgggacgc

aacctcagag

gggggagttt

gagtgtctta

actcttcatt

aagccaaaca

cgttttccgg

ttccgctttt

ccatctccat

tcaaggtcct

ttggcatgac

cggaggaaat

ccggtacaat

caaacagctt

tgcacctcgg

agaatictccg

tggggaatct

ttccgccgga

tcaccggcga

tccaaaacaa

cgcttcaggt

gaagattctt

tatgcaaaag

ttcccaaggg

ttgacggtcc

gcaataaccg

tcacgctttc

cgttgcagag

ttgaaatccc

cttgttagtg

cagtgatctc

ccacgcactc

cgtaacgtgc

cggccacctt

gaacaacctc

caacatctcc

ggagctcgag

cgtcaagctc

accggagagc

aaccgggaga

ttactcgaac

cctgctagaa

aaccaaactc

ctatgtttta

gatgcactgc

gaagattgga

gaccagaact

ccgccggaga

actgaccagc

cacaacctct

gcccttgatg

gagaaactca

tactcggagt

gtcccggaga

gcttacgaag

atggctaact

cactccttat

gctatcttcc atgatgagcc gatcccggag agcttctcaa

gttccgcggc

ttgggagaac

atacttcgac

cgggaggttg

aatcggcgag

agttccacca

tctctcccct

aatttctcct

gtcaccaaaa

aaaacgttca

tgtaggtcac

ggggttttcc

cctcaacggc gaactgcctt

caacaacctc ttcaccggaa

cttatccctc gacgccaatg

aatgctcacc aaagtcaaca

ccttaatttg

taaagctcaa

agttttccac

tgcgagtggt

tagggttgtt

ttccctccga

tctccggcca

cctacgacaa

agtacctcca

ttcagagcct

gcttggcgaa

gtggaatccc

gcaacctcac

tcgtgcagat

tcatgtcact

aactgaagaa

ccttcatcgg

tcgtgctgcc

accacctcac

tcatcactga

tcacgaagat

aactgccttc

ccgtgatttc

aaatccccgc

agttcatcgg

tcagcggcaa

gttcagatgg

agaatccatg

ctcactctca

tgctctcaac

ggagaagtta

ccttgcaagc

attccctggt

cagcttctcc

cctcgccggg

tgagtttctc

gttgaagacg

gccggcgttc

cggcgagatt

gaacaacctc

ggacctctcc

tctcactcta

cgaccttcca

gcacaatctc

cgggttgatt

taacttcttc

tcgcgtggct

cgttacgata

aggcgaatct

cgcgatgaaa

agaaattccg

caacctcaca ggtccgatcc aacaacctcg aatctctcac ctcacgacgc tttctggtat agagcatcct cgggtgaggg acggtgcacg ttccagaggc attgggaaag gcgatcaagc attgagacgt aacaaggata ctgcacggtg gcggcgaggg gttaagtcca cttgctaagt tacggttaca tacagctttg ggagatggcg tcggatactg agtgtcatcc cccaccatga caagacctaa <210>

< 2 11 >

<212>

<213>

<4 00>

caacgacgat

ccggcgaggt

gcaacgagat

tggatctctc

tcaactacga

gtccttctgt

cgattgtgat

tggtcagaaa

tggagatcaa

gaggagcagg

ggttggtagg

tggggaaaat

cgaacttgtt

cgaagggtgg

gactctgcta

acaacatttt

ttttgtatga

ttgctccaga

gcgttgtgct

tggacatcgt

cattagtgtt

acatgttcaa

gggaagttgt

ttaatctcta

cactcaccgt

tccgaagggg

ttctggaccg

gagtaacaat

caagacgttc

cctctacgac

tggaattgca

gcggaggctg

ggcggaggat

catcgtgtac

gcagggaagt

ccggcaccgg

gctgtatgag

gcacttgcgg

tatgcaccat

gcttgatgct

ccctggtgct

gtatgcttac

gttggaactg

tggatgggtc

agcagtggtg

catagctatg

tcatatgctc

g

gcttctctga

atgaagaatt

gttcctgatg

ttcaccggaa

gccggaaacc

tcgttaagga

ctcgccacgg

caccgagcgc

gtagtcgagt

agaggttcca

gggaggaacg

aatataatga

tacatgccga

tgggagatga

gattgctctc

gattttgagg

tctcagtcca

acgctgaaag

atcataggga

aacaaaacca

gaccctcgcc

atgtgtgtga

actaatcctc

cggcggtaga

tgatggactt

agattcgatt

cagtccccac

cgaacctctg

aaacccgcgc

cggtgttgct

aggcctggaa

gtttaaagga

tgccgaacgg

attacggttt

ggcttctggg

atgggagctt

ggtataagat

ctcttattat

ctcatgttgc

tgtcctccat

tggacgagaa

gaaagccagt

tgtcagagct

tcagtggata

aggaaatggg

ctcagtctaa

2961

cctcagccgg

aagcattctg

catgactagc

cggcggccag

tttccctcac

caaaacggcg

ggtggcggtg

gctcaccgcg

agagaatata

aaccgacgtg

cagggcggag

gtacgtttcg

aggggagtgg

tgcggtggag

tcacagggat

tgattttgga

tgctggctcc

gagtgacgtg

gggtgagttt

ctctcagccg

ccccttgaca

ccctgctagg

tacctccact

222

986

PRT

Lotus

222

j aponica

Met Arg Ile Arg Val Ser Tyr Leu Leu Val Leu Cys Phe Thr Leu Ile 1 5 10 15 Trp Phe Arg Trp Thr Val Val Tyr Ser Ser Phe Ser Asp Leu Asp Ala 20 25 30 Leu Leu Lys Leu Lys Glu Ser Met Lys Gly Ala Lys Ala Lys His His 35 40 45 Ala Leu Glu Asp Trp Lys Phe Ser Thr Ser Leu Ser Ala His Cys Ser 50 55 60 Phe Ser Gly Val Thr Cys Asp Gln Asn Leu Arg Val Val Ala Leu Asn 65 70 75 80 Val Th.!? Leu Val Pro Leu Phe Gly His Leu Pro Pro Glu Ile Gly Leu 85 90 95 Leu Glu Lys Leu Glu Asn Leu Thr Ile Ser Met Asn Asn Leu Thr Asp 100 105 110 Gln Leu Pro Ser Asp Leu Ala Ser Leu Thr Ser Leu Lys Val Leu Asn 115 120 125 Ile Ser His Asn Leu Phe Ser Gly Gln Phe Pro Gly Asn Ile Thr Val 130 135 140 Gly Met Thr Glu Leu Glu Ala Leu Asp Ala Tyr Asp Asn Ser Phe Ser 145 150 155 160 Gly Pro Leu Pro Glu Glu Ile Val Lys Leu Glu Lys Leu Lys Tyr Leu 165 170 175 Hls Leu Ala Gly Asn Tyr Phe Ser Gly Thr Ile Pro Glu Ser Tyr Ser 180 185 190 Glu Phe Gln Ser Leu Glu Phe Leu Gly Leu Asn Ala Asn Ser Leu Thr 195 200 205 Gly Arg Val Pro Glu Ser Leu Ala Lys Leu Lys Thr Leu Lys Glu Leu 210 215 220 His Leu Gly Tyr Ser Asn Ala Tyr GI u Gly Gly Ile Pro Pro Ala Phe 225 230 235 240 Gly Ser Met Glu Asn Leu Arg Leu Leu Glu Met Ala Asn Cys Asn Leu 245 250 2 55 Thr Gly Glu Ile Pro Pro Ser Leu Gly Asn Leu Thr Lys Leu His Ser 260

265

270

1620 1680 17 4 0 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 Leu Phe Val Gln Met Asn Asn Leu Thr Gly Thr Ile Pro Pro Glu Leu 275 280 285 Ser Ser Met Met Ser Leu Met Ser Leu Asp Leu Ser Ile Asn Asp Leu 290 295 300 Thr Gly Glu Ile Pro Glu Ser Phe Ser Lys Leu Lys Asn Leu Thr Leu 305 310 315 320 Met Asn Phe Phe Gln Asn Lys Phe Arg Gly Ser Leu Pro Ser Phe Ile 325 330 335 Gly Asp Leu Pro Asn Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe 340 345 350 Ser Phe Val Leu Pro His Asn Leu Gly Gly Asn Gly Arg Phe Leu Tyr 355 360 365 Phe Asp Val Thr Lys Asn His Leu Thr Gly Leu Ile Pro Pro Asp Leu 370 37 5 380 Cys Lys Ser Gly Arg Leu Lys Thr Phe Ile Ile Thr Asp Asn Phe Phe 385 390 3 95 400 Arg Gly Pro Ile Pro Lys Gly Ile Gly Glu Cys Arg Ser Leu Thr Lys 405 410 415 Ile Arg Val Ala Asn Asn Phe Leu Asp Gly Pro Val Pro Pro Gly Val 420 425 430 Phe Gln Leu Pro Ser Val Thr He Thr Glu Leu Ser Asn Asn Arg Leu 435 440 445 Asn Gly Glu Leu Pro Ser Val Ile Ser Gly Glu Ser Leu Gly Thr Leu 450 455 460 Thr Leu Ser Asn Asn Leu Phe Thr Gly Lys Ile Pro Ala Ala Met Lys 465 470 475 480 Asn Leu Arg Ala Leu Gln Ser Leu Ser Leu Asp Ala Asn Glu Phe Ile 485 490 495 Gly Glu Ile Pro Gly Gly Val Phe Glu Ile Pro Met Leu Thr Lys Val 500 505 510 Asn Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr He Thr 515 520 52 5 His Arg Ala Ser Leu Thr Ala Val Asp Leu Ser Arg Asn Asn Leu Ala 530 535 540 Gly Glu Val Pro Lys Gly Met Lys Asn Leu Met Asp Leu Ser Ile Leu 545 550 555 560 Asn Leu Ser Arg Asn Glu Ile Ser Gly Pro Val Pro Asp Glu Ile Arg 565 570 575 Phe Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Ser Asn Asn Phe Thr 580 585 590 Gly Thr Val Pro Thr Gly Gly Gln Phe Leu Val Phe Asn Tyr Asp Lys 5 95 600 605 Thr Phe Ala Gly Asn Pro Asn Leu Cys Phe Pro His Arg Ala Ser Cys 610 615 620 Pro Ser Val Leu Tyr Asp Ser Leu Arg Lys Thr Arg Ala Lys Thr Ala 625 630 635 640 Arg Val Arg Ala Ile Val Ile Gly Ile Ala Leu Ala Thr Ala Val Leu 645 650 655 Leu Val Ala Val Thr Val His Val Val Arg Lys Arg Arg Leu His Arg 660 6 65 670 Ala Gln Ala Trp Lys Leu Thr Ala Phe Gln Arg Leu Glu Ile Lys Ala 675 680 685 Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly 690 695 700 Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp Val 705 710 715 720 Ala Ile Lys Arg Leu Val Gly Gln Gly Ser Gly Arg Asn Asp Tyr Gly 725 7 30 735 Phe Arg Ala Glu Ile Glu Thr Leu Gly Lys He Arg His Arg Asn Ile 740 745 750 Met Arg Leu Leu Gly Tyr Val Ser Asn Lys Asp Thr Asn Leu Leu Leu 755 760 765 Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Trp Leu His Gly Ala 120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

126

770

775

780

Lys Gly Gly His Leu Arg Trp Glu Met Arg Tyr Lys Ile Ala Val Glu 785 790 795 800 Ala Ala Arg Gly Leu Cys Tyr Met His His Asp Cys Ser Pro Leu Ile 805 810 815 Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ala Asp Phe 820 825 830 Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp Pro 835 840 845 Gly Ala Ser Gln Ser Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile 850 855 860 Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val 865 870 875 880 Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ile Gly Arg Lys Pro 885 890 895 Val Gly Glu Phe Gly Asp Gly Val Asp Ile Val Gly Trp Val Asn Lys 900 905 910 Thr Met Ser Glu Leu Ser Gln Pro Ser Asp Thr Ala Leu Val Leu Ala 915 920 925 Val Val Asp Pro Arg Leu Ser Gly Tyr Pro Leu Thr Ser Val Ile His 930 935 940 Met Phe Asn Ile Ala Met Met Cys Val Lys Glu Met Gly Pro Ala Arg 945 950 955 9 60 Pro Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Gln Ser 965 970 975 Asn Thr Ser Thr Gln Asp Leu Ile Asn Leu 980 985 <210> 223 <211 > 2925 <212> DNA <213> Medicago truncatula <400> 223 atgaaaaaca ttaaataatg aaagatgatg tccggtgtaa ctcttcggac actatggaca atcctcaaca atgaagaaac gaaatcgtta acaataccgg agtttaacag ttaggttatg ctccgatatc aatttagaaa cccgaactct ggggagattc aacaagcttc caggtttggg ttcatatact aaatcaaaga aacggaattg ggcccggtcc aaccgtttta ctttctaaca cagacgctgt ttaccggtgt acggttactc gaggttccta agcatatctg ttatcttaca gaccggtcat

tcacatgtta

atcttgatgc

cactcaaaga

aatgcgacga

acctttccaa

atctcaccgg

tctctcacaa

ttgaggctct

gcctgatgaa

agagttactc

ggaagattcc

agaatgctta

ttgaaatttc

acctcgactc

cttcaatgcg

cagaaacctt

gcggttcaat

aaaacaattt

ttgacgttac

agttgaaaac

gcccgtgtaa

caccggggat

acggccaact

atttatttac

tactcgatgc

tgactagaat

aatgtagttc

aagggatgaa

ggaaaatccc

acaattttac

ttgccggaaa

tttgctacta

gttgctaaag

ctggaaattt

agatcaacgt

ggagatcgga

cgagcttcca

cctcttctcc

agatgcttat

actcaagtac

ggagtttcag

taagagtttg

ctccggtgga

taacgctaac

cttgtttttg

gagtctcatg

ctcaaagctg

tccagcgttc

ctcttttgta

gaagaatcac

gtttatcgtt

gtcacttgaa

ttttcagttg

accaacggag

cgggaggatt

caatcagttt

caacataagt

actgactgca

gaatctgaag

tgatgagatt

cggaattgtc

tcctagccta

ttgtgcatgt

ctaaaaaaat

tcaacttctg

gtgattgctt

gagttgaaca

actgagctat

ggtaacttcc

gacaataatt

ttaagttttg

aagttggaga

tcgaagttaa

attccaccgg

ctcaccggag

caaatgaaca

tcgttggatc

aaaaatctca

atcggcgatc

ttgccgcaga

ctcaccggat

actgacaact

aaaatcagag

ccttctgtac

atttctggca

ccggcgtcca

ctcggagaaa

ggcaataatc

gttgacttca

gttctaagca

agattcatga

cccacaggtg

tgtttccccc

tatttacaac caatgaaagg cttcagctca tgaacgtgac tgctcgagag ccaaacttac ccggcaacat tcgaaggtcc ctggaaactt ttttaaggct agatgctaaa agttaggttc aaattccacc acctcaccgg tctccatcaa ctctcatcaa ttcctaacct atctcggttc tgatcccacc tcttccgcgg tggctaataa agataataga attctctcgg tgaagaatct ttccggcaga tcactggtgg gccgaaacat tttttaatgt cgagtctaac gtcagttttt accaaacaac

gtgttattca

agagaaagcc

ctgttcattt

gcaagttcca

ccttacaatc

ttctcttaga

cacttttgga

tcttccagag

tttctccggt

gaactataac

ggaactccaa

aatcaaatct

gagtcttgga

aacaattcca

cggactctca

tttcttccag

cgaaacgctt

aaacggaaag

ggagttatgc

tccaatacct

ctacttggac

gcttggaaat

gaatctcgct

ccgatcactg

ggtctttgct

aattccaaag

gcttaccggt

ttcgcataat

gacgctggat

ggtcttcaac

atgttcttca 1980

2040

2100

2160

2220

2280

2340

2400

2460

2520

2580

2640

2700

2 7 60

2820

2880

127

ttgctctatc gttcgagaaa aagccatgca aaggagaaag ctgtcgtcat agcaatcgtc

ttcgccacag cggtgttaat ggtaattgta acactgcaca tgatgaggaa gaggaagcgt

cacatggcaa aagcatggaa gctaacagcg tttcagaagt tggaattcag agcagaggaa

gtagtggagt gtctgaaaga agagaacata ataggaaaag gaggagctgg gattgtctac

agagggtcca tggcaaacgg aacagacgtt gcgataaagc gtttagttgg acaaggaagt

ggtagaaatg attatggatt caaagctgag atagagacat tgggaaggat tagacacaga

aacataatga ggcttttggg atatgtttca aacaaggata caaatttgtt gttgtatgag

tacatgccta atggtagttt aggtgagtgg cttcatggtg caaaaggttg tcatttgagt

tgggaaatga ggtacaaaat tgctgtggaa gctgctaagg gactttgcta tttgcaccat

gattgttcac ctcttatcat tcatagggat gttaagtcta ataatatatt gcttgatgct

gattttgagg ctcatgttgc tgattttgga cttgctaagt tcttgtatga tccaggtgct

tctcaatcca tgtcctcaat tgctggctcc tacggctaca ttgctccaga atatgcatac

actctcaaag tggatgaaaa aagtgatgtg tatagtttcg gagtggtgct attggagctg

ataataggaa ggaagccagt tggtgaattt ggagatggag tagacatcgt tggatggatc

aataaaactg aattagaact ttatcagcca tcagataaag cattagtgtc agcagtggtg

gacccacgac tcaatggata ccctttgact agtgttatct acatgttcaa catagctatg

atgtgtgtta aagaaatggg acctgcaagg cctaccatga gggaagttgt tcatatgctc

actaatccac ctcactctac aagtcacaac ttgattaatc tctag 2925

<210> <211> <2 12> <213> <4 00> Met 1

224

974

PRT

Medicago truncatula 224

5

10

15

20

25

30

35

40

45

50

5 5

60

65

70

75

85

90

95

100

105

110

115

120

125

130

135

14 (

145

150

155

165

170

175

180

185

190

195

200

205

210

215

220

225

230

235

245

250

2 55

260

2 65

270

2.75

280

28 5

290

295

300

305

31 (

315

Leu Leu Cys Met Leu Phe Thr Asp Ala Leu Leu Lys Leu Lys Asp Asp Ala Leu Lys Asp Trp Cys Ser Phe Ser Gly Val Lys Leu Asn Val Thr Gln Val Pro Gly Glu Leu Asn Met Leu Glu Thr Gly Glu Leu Pro Thr Glu Leu Asn Ile Ser Hls Asn Leu Thr Phe Gly Met Lys Lys Leu Phe Glu Gly Pro Leu Pro Glu 160 Tyr Leu Ser Phe Ala Gly Asn Tyr Ser Glu Phe Gln Lys Leu Leu Thr Gly Lys Ile Pro Lys Glu Leu Gln Leu Gly Tyr Glu Glu Leu Gly Ser Ile Lys Ser 240 Asn Leu Thr Gly Glu Ile Pro Asp Ser Leu Phe Leu Gln Met Glu Leu Ser Ser Met Arg Ser Gly Leu Ser Gly Glu Ile Pro Thr Leu Ile Asn Phe Phe Gln 320 Asn Lys Leu Arg Gly Ser Ile Pro Ala Phe Ile Gly Asp Leu Pro Asn 325 330 335 Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe Ser Phe Val Leu Pro 340 345 350 Gln Asn Leu Gly Ser Asn Gly Lys Phe Ile Tyr Phe Asp Val Thr Lys 355 360 365 Asn His Leu Thr Gly Leu Ile Pro Pro Glu Leu Cys Lys Ser Lys Lys 37 0 375 380 Leu Lys Thr Phe Ile Val Thr Asp Asn Phe Phe Arg Gly Pro Ile Pro 385 390 395 400 Asn Gly Ile Gly Pro Cys Lys Ser Leu Glu Lys Ile Arg Val Ala Asn 405 410 415 Asn Tyr Leu Asp Gly Pro Val Pro Pro Gly Ile Phe Gln Leu Pro Ser 420 425 430 Val Gln Ile Ile Glu Leu Gly Asn Asn Arg Phe Asn Gly Gln L e U Pjio 435 440 445 Thr Glu Ile Ser Gly Asn Ser Leu Gly Asn Leu Ala Leu Ser Asn Asn 450 455 460 Leu Phe Thr Gly Arg Ile Pro Ala Ser Met Lys Asn Leu Arg Ser Leu 465 470 475 480 Gln Thr Leu Leu Leu Asp Ala Asn Gln Phe Leu Gly Glu Ile Pro Ala 485 4 90 495 Glu Val Phe Ala Leu Pro Val Leu Thr Arg Ile Asn Ile Ser Gly Asn 500 505 510 Asn Leu Thr Gly Gly Ile Pro Lys Thr Val Thr Gln Cys Ser Ser Leu 515 520 52 5 Thr Ala Val Asp Phe Ser Arg Asn Met Leu Thr Gly Glu Val Pro Lys 530 535 540 Gly Met Lys Asn Leu Lys Val Leu Ser Ile Phe Asn Val Ser His Asn 545 550 555 560 Ser Ile Ser Gly Lys Ile Pro Asp Glu Ile Arg Phe Met Thr Ser Leu 565 570 575 Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Thr Gly Ile Val Pro Thr 580 5 8 5 Si 90 Gly Gly Gln Phe Leu Val Phe Asn Asp Arg Ser Phe Ala Gly Asn Pro 595 600 605 Ser Leu Cys Phe Pro His Gln Thr Thr Cys Ser Ser Leu Leu Tyr Arg 610 615 620 Ser Arg Lys Ser His Ala Lys Glu Lys Ala Val Val Ile Ala Ile Val 625 630 635 640 Phe Ala Thr Ala Val Leu Met Val Ile Val Thr Leu His Met Met Arg 645 650 655 Lys Arg Lys Arg His Met Ala Lys Ala Trp Lys Leu Thr Ala Phe Gln 660 665 670 Lys Leu Glu Phe Arg Ala Glu Glu Val Val Glu Cys Leu Lys Glu Glu 675 680 685 Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met 690 695 700 Ala Asn Gly Thr Asp Val Ala Ile Lys Arg Leu Val Gly Gln Gly Ser 705 710 715 720 Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly Arg 725 730 735 Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly Tyr Val Ser Asn Lys 740 745 750 Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly 755 760 765 Glu Trp Leu His Gly Ala Lys Gly Cys His Leu Ser Trp Glu Met Arg 770 775 780 Tyr Lys Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His 785 7 90 7 95 800 Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile 805 810 815 Leu Leu Asp Ala Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala 820 825 830

Lys Phe Leu Tyr Asp Pro Gly Ala Ser Gln Ser 835 840 845

Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala 850 855 860

Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val 865 870 875 880

Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly 885 890 895

Val Gly Trp Ile Asn Lys Thr Glu Leu Glu Leu 900 905 910

Lys Ala Leu Val Ser Ala Val Val Asp Pro Arg 915 920 925

Leu Thr Ser Val Ile Tyr Met Phe Asn Ile Ala 930 935 940

Glu Met Gly Pro Ala Arg Pro Thr Met Arg Glu 945 950 955 960

Thr Asn Pro Pro His Ser Thr Ser His Asn Leu 965 970

225 2985 DNA

Oryza satíva

Met Ser Tyr Thr Val Leu Asp Gly Tyr Gln Leu Asn Met Met Val Val Ile Asn

Ser Ile Ala Leu Lys Val Leu Glu Leu Val Asp Ile Pro Ser Asp Gly Tyr Pro Cys Val Lys His Met Leu Leu

<2 10> <211> <212> <213> <4 00>

225

atgcctccta ctctcctcct cctcctcctc ctcctcccac

cgcgacatct acgcgctcgc caagctcaag gcggcgctcg

gccccaccgc cgctcgccga ctgggacccg gccgcgacct tccggcgtca cctgcgacgg ccgctcccgc gtcgtcgcca

ctccactccg gctacctccc gcccgagatc gccctccttg

atcgccgcct gctgcctccc cggccacgtc cccctcgagc

cgccacctca acctctccaa caacaacctt tccggccact

ggtggcgcct ccccctactt cccctcgctc gagctcatcg

tcagggttgc ttcctccctt ctccgcttca cacgctcgcc

ggcaactact tcaccggcgc aatcccggac agctatggcg

cttggactca acggcaacac gctctccggc catgtccccg

cgcctccgcg agatgtacat cggatactac aaccagtacg

ttcggcgacc tcggcgcgct cctccgcctc gacatgagca

gtcccgccgg agctcggccg actccagcgc ctcgacacgc

ctctccggcg agataccgcc gcagctcggc gatctcagca

tccgtcaacg acctcgccgg cgagatccct cccagcctcg

ctcctcaacc tcttccggaa ccacctccgc ggcagcatac

gcgcagctcg aggtgctgca gctgtgggac aacaacctca

ctcgggaaga acggccgcct caagacgctc gacctggcca

atcccggcgg acctctgcgc cggccggcgg ctggagatgc

ctgttcggcc ccatcccgga ctcgctcggc gactgcaaga

gccaagaact tcttgaccgg cccggttccc gccgggctct

atggtggagc tcaccgacaa cctgctcacc ggcgagctcc

aagatcggca tgctgctgct ggggaacaat gggatcggtg

ggcaacctcc cggcgctgca gacgctgtcg ctggagtcca

ccaccggaga tcggcaatct caagaacctg tccaggctca

accggcgcca ttccagacga gctcatccgc tgcgcctccc

cgtaacggct tctccggcga gataccggag agcatcacgt

ctgaacgtgt ccaggaacag gctcaccggc gagctcccgc

agcctcacga cgctcgacgt gtcgtacaac agcctctcgg

cagttcttgg tgttcaacga gagctcgttc gtcggcaacc

gtggccgacg cgtgccctcc gtccatggcc ggcggcggcg

cggctgcggt gggactcgaa gaagatgctg gtggcgctgg

gcggtggcgt tcctgggcgc gaggaagggg tgctcggcgt

cggtcggggg cgtggaagat gacggcgttc cagaagctgg

gtggagtgcg tgaaggagga caacatcatc gggaagggcg

ggcgtgacgc gcggggcgga gctggcgatc aagcggttgg

cacgaccggg ggttctcggc ggaggtgacg acgctgggga

gtgaggctgc tggggttcgt gtcgaacagg gagacgaacc

cctccctcgc

tcccatcccc

cccccgcgca

tcaacctcac

actccctcgc

tccccaccct

tccccgtccc

acgcttacaa

tccgctacct

acctcgccgc

tctccctctc

acggcggcgt

gctgcaacct

tcttcctgca

gcctcgcgtc

ccaacctctc

cggacttcgt

ccggcaacat

ccaaccacct

tcgtgctcat

cgctcacgcg

tcaacctccc

cggacgtgat

gccgcatccc

acaacttctc

acgtcagcgg

tcgccgccgt

cgctcaagat

cggagatgtc

gccccgtgcc

cggggctgtg

gcggcgcggg

tggcggcgtt

ggcggtcggc

agttctcggc

gcgcggggat

tggggcgcgg

ggatcaggca

tgctgctgta

ctcccccgac

ctccgccacc

ctgcaccttc

cgccctcccg

caacctcacc

cccctctctc

cgactccggc

caacaacctc

ccacctcggc

gctcgagtac

ccgcctcacc

cccgccggag

caccggcccc

gtggaaccgc

gctcgacctc

caacctcaag

cgccggcttc

ccccgccggg

caccggcccc

ggagaacggc

cgtccgcctc

gcaggccaac

cggcggcgac

tccggccatc

cggagcgctg

caacgcgctc

cgacctcagc

actgtgcacg

caacatgacg

gatgcagggg

cggcggcccc

gtcccagctg

cgcggcggtg

ggcgcggcgg

ggaggacgtg

cgtgtaccac

cggcggcgag

ccggaacatc

cgagtacatg

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

2280

2340 ccgaatgggt cgctggggga gatgctccat ggcgggaagg gggggcacct cgggtgggag gcgagggcgc gggtggcggc ggaggcggcg tgcggcctct gctacctcca ccatgactgc gccccgagga tcatccaccg cgacgtcaag tccaacaaca tcctcctcga ctccgccttc gaggcgcacg tcgccgactt cggcctcgcc aagttcctcg gcggcgccac ctccgagtgc atgtccgcca ttgctggctc ctacggctac atcgcgccag agtacgcata cacgctgcga gtggacgaga agagcgacgt gtatagcttc ggtgtggtgc tattggagct catcaccgga cgccgccccg tgggcgggtt cggtgacggc gtggacatcg tgcactgggt ccgcaaggtg accgccgagc tgccggacaa ctccgacacg gcggccgtcc tcgccgtggc cgaccgccgc ctgacgccgg agccggtggc gctgatggtg aacctgtaca aggtggccat ggcgtgcgtg gaggaggcga gcacggcccg gcccaccatg cgcgaggtcg tccacatgct ctccaaccca aactcggc.cc agcccaatag tggtgacctc ctcgtcacct tctga 2985

<210> 226 <211> 994 <212> PRT <213> Oryza satíva <4 00> 226

Met Pro Pro Thr Leu Leu Leu Leu Leu Leu Leu Leu Pro Pro Ser Leu 10 15

Ala Ser Pro Asp Arg Asp Ile Tyr Ala Leu Ala Lys Leu Lys Ala Ala 20 25 30

Leu Val Pro Ser Pro Ser Ala Thr Ala Pro Pro Pro Leu Ala Asp Trp 35 40 45

Asp Pro Ala Ala Thr Ser Pro Ala His Cys Thr Phe Ser Gly Val Thr

50 55 60

Cys Asp Gly Arg Ser Arg Val Val Ala Ile Asn Leu Thr Ala Leu Pro 65 70 75 80

Leu His Ser Gly Tyr Leu Pro Pro Glu Ile Ala Leu Leu Asp Ser Leu 85 90 95

Ala Asn Leu Thr Ile Ala Ala Cys Cys Leu Pro Gly His Val Pro Leu 100 105 110

Glu Leu Pro Thr Leu Pro Ser Leu Arg His Leu Asn Leu Ser Asn Asn 115 120 125

Asn Leu Ser Gly His Phe Pro Val Pro Asp Ser Gly Gly Gly Ala Ser 130 135 140

Pro Tyr Phe Pro Ser Leu Glu Leu Ile Asp Ala Tyr Asn Asn Asn Leu 145 150 155 160

Ser Gly Leu Leu Pro Pro Phe Ser Ala Ser His Ala Arg Leu Arg Tyr 165 170 175

Leu His Leu Gly Gly Asn Tyr Phe Thr Gly Ala Ile Pro Asp Ser Tyr 180 185 190

Gly Asp Leu Ala Ala Leu Glu Tyr Leu Gly Leu Asn Gly Asn Thr Leu 195 200 205

Ser Gly His Val Pro Val Ser Leu Ser Arg Leu Thr Arg Leu Arg Glu 210 215 220

Met Tyr Ile Gly Tyr Tyr Asn Gln Tyr Asp Gly Gly Val Pro Pro Glu 225 230 235 240

Phe Gly Asp Leu Gly Ala Leu Leu Arg Leu Asp Met Ser Ser Cys Asn 245 250 255

Leu Thr Gly Pro Val Pro Pro Glu Leu Gly Arg Leu Gln Arg Leu Asp 260 265 270

Thr Leu Phe Leu Gln Trp Asn Arg Leu Ser Gly Glu Ile Pro Pro Gln 275 280 285

Leu Gly Asp Leu Ser Ser Leu Ala Ser Leu Asp Leu Ser Val Asn Asp 290 295 300

Leu Ala Gly Glu He Pro Pro Ser Leu Ala Asn Leu Ser Asn Leu Lys 305 310 315 320

Leu Leu Asn Leu Phe Arg Asn His Leu Arg Gly Ser Ile Pro Asp Phe 325 330 335

Val Ala Gly Phe Ala Gln Leu Glu Val Leu Gln Leu Trp Asp Asn Asn 34 0 34 5 35 0

Leu Thr Gly Asn Ile Pro Ala Gly Leu Gly Lys Asn Gly Arg Leu Lys 355 360 365

Thr Leu Asp Leu Ala Thr Asn His Leu Thr Gly Pro Ile Pro Ala Asp

2400 2460 2520 258 0 2 64 0 2700 2760 2820 2880 2940 370 375 380

Leu Cys Ala Gly Arg Arg Leu Glu Met Leu Val Leu Met Glu Asn Gly 385 390 395 4 00 Leu Phe Gly Pro Ile Pro Asp Ser Leu Gly Asp Cys Lys Thr Leu Thr 405 410 415 Arg Val Arg Leu Ala Lys Asn Phe Leu Thr Gly Pro Val Pro Ala Gly 420 425 430 Leu Phe Asn Leu Pro Gln Ala Asn Met Val Glu Leu Thr Asp Asn Leu 435 440 445 Leu Thr Gly Glu Leu Pro Asp Val Ile Gly Gly Asp Lys Ile Gly Met 4 50 4 55 460 Leu Leu Leu Gly Asn Asn Gly Ile Gly Gly Arg Ile Pro Pro Ala Ile 465 470 475 480 Gly Asn Leu Pro Ala Leu Gln Thr Leu Ser Leu Glu Ser Asn Asn Phe 485 4 90 495 Ser Gly Ala Leu Pro Pro Glu Ile Gly Asn Leu Lys Asn Leu Ser Arg 500 5 05 510 Leu Asn Val Ser Gly Asn Ala Leu Thr Gly Ala Ile Pro Asp Glu Leu 515 520 525 Ile Arg Cys Ala Ser Leu Ala Ala Val Asp Leu Ser Arg Asn Gly Phe 530 535 540 Ser Gly Glu Ile Pro Glu Ser Ile Thr Ser Leu Lys Ile Leu Cys Thr 545 550 555 5 60 Leu Asn Val Ser Arg Asn Arg Leu Thr Gly Glu Leu Pro Pro Glu Met 565 570 575 Ser Asn Met Thr Ser Leu Thr Thr Leu Asp Val Ser Tyr Asn Ser Leu 580 585 590 Ser Gly Pro Val Pro Met Gln Gly Gln Phe Leu Val Phe Asn Glu Ser 595 600 605 Ser Phe Val Gly Asn Pro Gly Leu Cys Gly Gly Pro Val Ala Asp Ala 610 615 620 Cys Pro Pro Ser Met Ala Gly Gly Gly Gly Gly Ala Gly Ser Gln Leu 625 630 635 64 0 Arg Leu Arg Trp Asp Ser Lys Lys Met Leu Val Ala Leu Val Ala Ala 645 650 655 Phe Ala Ala Val Ala Val Ala Phe Leu Gly Ala Arg Lys Gly Cys Ser 660 6 65 670 Ala Trp Arg Ser Ala Ala Arg Arg Arg Ser Gly Ala Trp Lys Met Thr 675 680 685 Ala Phe Gln Lys Leu Glu Phe Ser Ala Glu Asp Val Val Glu Cys Val 690 695 700 Lys Glu Asp Asn Ile He Gly Lys Gly Gly Ala Gly Ile Val Tyr His 705 710 715 720 Gly Val Thr Arg Gly Ala Glu Leu Ala Ile Lys Arg Leu Val Gly Arg 725 730 735 Gly Gly Gly Glu His Asp Arg Gly Phe Ser Ala Glu Val Thr Thr Leu 740 745 750 Gly Arg Ile Arg His Arg Asn He Val Arg Leu Leu Gly Phe Val Ser 7 55 760 765 Asn Arg Glu Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser 770 775 780 Leu Gly Glu Met Leu His Gly Gly Lys Gly Gly His Leu Gly Trp Glu 785 790 795 800 Ala Arg Ala Arg Val Ala Ala Glu Ala Ala Cys Gly Leu Cys Tyr Leu 805 810 815 His His Asp Cys Ala Pro Arg Ile Ile His Arg Asp Val Lys Ser Asn 820 825 830 Asn He Leu Leu Asp Ser Ala Phe Glu Ala His Val Ala Asp Phe Gly 835 840 845 Leu Ala Lys Phe Leu Gly Gly Ala Thr Ser Glu Cys Met Ser Ala Ile 8 5 ι0 855 860 Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Arg 865 870 875 880 Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu 885 890 895 Leu Ile Thr Gly Arg Arg Pro Val Gly Gly Phe Gly Asp Gly Val Asp 900 905 910 Ile Val His Trp Val Arg Lys Val Thr Ala Glu Leu Pro Asp Asn Ser 915 920 925 Asp Thr Ala Ala Val Leu Ala Val Ala Asp Arg Arg Leu Thr Pro Glu 930 935 94 0 Pro Val Ala Leu Met Val Asn Leu Tyr Lys Val Ala Met Ala Cys Val 945 950 955 960 Glu Glu Ala Ser Thr Ala Arg Pro Thr Met Arg Glu Val Val His Met 965 970 975 Leu Ser Asn Pro Asn Ser Ala Gln Pro Asn Ser Gly Asp Leu Leu Val 980 985 990 227

2931

DNA

Písum satíva 227

Thr Phe <210>

<211>

<212>

<213>

<400>

atgaaaagta tcacgtgtta tttgctggta ttcttctgcg tgttatttac accatgtttt tcaataaccg atctcgatgc gttgctaaag cttaaagaat caatgaaagg agagaaatca aaacatcccg attcactcgg agactggaag ttttccgctt ctggttcagc tcactgctca ttttccggtg taacgtgcga tcaagataac cgagtgataa ctctgaacgt gacgcaagtt ccactcttcg gaagaatttc taaggagatt ggagtgttgg ataagcttga gagactcatc atcaccatgg ataatctcac tggcgagctt ccgtttgaga tatccaatct tacctctctt aaaatcctta acatctctca caacaccttc tctggtaact tccccggcaa catcactctc cgtatgacga aacttgaggt tctagatgct tatgacaata gcttcactgg tcatcttcct gaggaaatcg tcagcctcaa ggaactcacg atcttatgtc tggccggaaa ctatttcacc ggtacaatac ccgagagtta ctcggaattt cagaagttgg agattttaag cataaacgca aacagtttat cggggaagat tccgaagagc ttatccaaat taaagacgct gaaggaactc cgtttaggtt acaacaacgc ttacgatggc ggagttccac cggagtttgg ttcattgaaa tctctccgat atcttgaggt gtctaactgt aacctcaccg gagaaattcc accgagtttt ggaaatttag aaaacctaga cagcttgttc ttgcaaatga acaacctcac cggaataatt ccaccggaac tctcttccat gaagagtctc atgtcgttgg atctctccaa caacgctctc tcaggagaga ttccagagag cttctcaaat ctcaaaagcc tcactctctt gaatttcttc cagaacaagt ttcgcggttc tattccggca ttcataggcg atcttcctaa cctggaaacg cttcaggttt gggaaaacaa tttctctttt gtattgccac aaaatctcgg ttcaaacgga aagttcattt tcttcgacgt tacgaagaat cacctcaccg gattgattcc accggatttg tgcaaatcga agaaattgca aacgtttata gttacggata acttcttcca cggtccaatc cctaaaggaa tcggcgcgtg taagtcactt ctcaaaatca gagttgctaa taactactta gacgggccgg tcccacaagg gatttttcaa atgccttctg taacgataat agagcttgga aataaccgtt ttaacggcca actaccttct gaagtttccg gcgttaatct cgggattctc actatctcta acaatttatt caccgggagg attcccgctt caatgaagaa tctcatatca cttcagactc tgtggcttga cgcaaatcag ttcgtcggag aaattccaaa ggaagtcttt gacttaccag tgttaacgaa gttcaacata agtggtaaca acctcaccgg tgtaatccca acgacggttt ctcagtgtag atcgttgaca gccgttgact tcagccggaa catgattacc ggcgaggttc ccaggggaat gaagaatctg aaggttctca gcatttttaa cctttcacat aacaacatat cgggtctaat ccccgacgag attcgattca tgacgagtct caccacgctg gatctatcct acaacaattt caccggaata gtccccaccg gcggtcagtt tttggttttc aacgacaggt cgtttttcgg aaaccctaac ctctgtttcc cacaccaatc ctcatgctct tcctatacct ttccctcgag taaaagccac gcgaaggtga aggccattat taccgcaatt gctctcgcca cagcagtgtt actggtaata gcgacgatgc acatgatgag gaagagaaag cttcatatgg cgaaagcatg gaagttaaca gcatttcaga gactagactt caaagcagag gaagttgtgg agtgtttgaa agaagagaac ataataggaa aaggaggagc cgggatcgtg tacagagggt ccatgcccaa cggaacagac gtagcgataa agcgtttagt tggacaagga agtgggagaa acgattacgg tttcaaagca gagatagaaa cattgggtag aatcagacac agaaacataa tgaggctatt gggttacgtt tctaataagg acacaaattt gttgctgtat gagtacatgc cgaatggtag tttaggggaa tggcttcatg gtgcaaaagg ctgtcatttg agttgggaaa tgaggtataa aattgcagtg gaagctggta aaggactttg ctatttgcac catgattgtt cacctcttat tattcatagg gatgttaagt ccaacaatat attgctagat gctgattttg aagcccatgt: tgctgatttt ggacttgcaa agtttttata tgacccaggt gcttctcagt ccatgtcctc tattgctggc tcctacggct acattgctcc agagtatgct

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

2280

2340

2400

2460

2520

2580 tatacgttga aagtggatga gaaaagcgat gtgtatagct ttggagtggt gctattggag ctgatcatag gaaggaaacc agtgggtgag tttggagatg gagtggacat cgttggatgg atcaataaaa ctgaattaga gctttatcag ccgtcagata aagcattggt gtcggcggtg gtggacccgc ggctcactgg atacccaatg gcaagtgtta tctacatgtt caacatagct atgatgtgtg ttaaagaaat gggacccgca aggcctacca tgagggaagt agttcatatg ctcactaatc cacctcagtc taccactcat aacaacctta ttaatctcta g 2931

<210> 228 <211> 976 <212> PRT <213> Písum satíva <400> 228

Met Lys Ser Ile Thr Cys Tyr Leu Leu Val Phe Phe Cys Val Leu Phe 1 5 10 15 Thr Pro Cys Phe Ser Ile Thr Asp Leu Asp Ala Leu Leu Lys Leu Lys 20 25 30 Glu Ser Met Lys Gly Glu Lys Ser Lys His Pro Asp Ser Leu Gly Asp 35 40 4 5 Trp Lys Phe Ser Ala Ser Gly Ser Ala His Cys Ser Phe Ser Gly Val 50 55 60 Thr Gys Asp Gln Asp Asn Arg Val Ile Thr Leu Asn Val Thr Gln Val 65 70 75 80 Pro Leu Phe Gly Arg Ile Ser Lys Glu Ile Gly Val Leu Asp Lys Leu 85 90 95 Glu Arg Leu Ile Ile Thr Met Asp Asn Leu Thr Gly Glu Leu Pro Phe 100 105 110 Glu Ile Ser Asn Leu Thr Ser Leu Lys Ile Leu Asn Ile Ser His Asn 115 120 125 Thr Phe Ser Gly Asn Phe Pro Gly Asn Ile Thr Leu Arg Met Thr Lys 130 135 140 Leu Glu Val Leu Asp Ala Tyr Asp Asn Ser Phe Thr Gly His Leu Pro 145 150 155 160 Glu Glu Ile Val Ser Leu Lys Glu Leu Thr Ile Leu Cys Leu Ala Gly 165 170 175 Asn Tyr Phe Thr Gly Thr Ile Pro Glu Ser Tyr Ser Glu Phe Gln Lys 180 185 190 Leu Glu Ile Leu Ser Ile Asn Ala Asn Ser Leu Ser Gly Lys Ile Pro 195 200 205 Lys Ser Leu Ser Lys Leu Lys Thr Leu Lys Glu Leu Arg Leu Gly Tyr 210 215 220 Asn Asn Ala Tyr Asp Gly Gly Val Pro Pro Glu Phe Gly Ser Leu Lys 225 230 235 240 Ser Leu Arg Tyr Leu Glu Val Ser Asn Cys Asn Leu Thr Gly Glu Ile 245 250 255 Pro Pro Ser Phe Gly Asn Leu Glu Asn Leu Asp Ser Leu Phe Leu Gln 260 265 270 Met Asn Asn Leu Thr Gly Ile Ile Pro Pro Glu Leu Ser Ser Met Lys 275 280 285 Ser Leu Met Ser Leu Asp Leu Ser Asn Asn Ala Leu Ser Gly Glu Ile 290 295 300 Pro Glu Ser Phe Ser Asn Leu Lys Ser Leu Thr Leu Leu Asn Phe Phe 305 310 315 320 Gln Asn Lys Phe Arg Gly Ser Ile Pro Ala Phe Ile Gly Asp Leu Pro 325 330 335 Asn Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe Ser Phe Val Leu 340 345 350 Pro Gln Asn Leu Gly Ser Asn Gly Lys Phe Ile Phe Phe Asp Val Thr 355 360 365 Lys Asn His Leu Thr Gly Leu Ile Pro Pro Asp Leu Cys Lys Ser Lys 370 37 5 380 Lys Leu Gln Thr Phe Ile Val Thr Asp Asn Phe Phe His Gly Pro Ile 385 390 395 400 Pro Lys Gly Ile Gly Ala Cys Lys Ser Leu Leu Lys Ile Arg Val Ala 405 410 4 15 2640

2700

2760

2820

2880 Asn Asn Tyr Leu Asp Gly Pro Val Pro Gln Gly Ile Phe Gln Met Pro 420 425 430

Ser Val Thr Ile Ile Glu Leu Gly Asn Asn Arg Phe Asn Gly Gln Leu 435 440 445

Pro Ser Glu Val Ser Gly Val Asn Leu Gly Ile Leu Thr Ile Ser Asn 450 455 460

Asn Leu Phe Thr Gly Arg Ile Pro Ala Ser Met Lys Asn Leu Ile Ser 465 470 475 480

Leu Gln Thr Leu Trp Leu Asp Ala Asn Gln Phe Val Gly Glu Ile Pro 485 490 495

Lys Glu Val Phe Asp Leu Pro Val Leu Thr Lys Phe Asn Ile Ser Gly 500 505 510

Asn Asn Leu Thr Gly Val Ile Pro Thr Thr Val Ser Gln Cys Arg Ser 515 520 525

Leu Thr Ala Val Asp Phe Ser Arg Asn Met Ilc Thr Gly Glu Val Pro 530 535 540

Arg Gly Met Lys Asn Leu Lys Val Leu Ser Ile Phe Asn Leu Ser His 545 550 555 560

Asn Asn Ile Ser Gly Leu Ile Pro Asp Glu Ile Arg Phe Met Thr Ser 565 570 575

Leu Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Thr Gly Ile Val Pro 580 585 590

Thr Gly Gly Gln Phe Leu Val Phe Asn Asp Arg Ser Phe Phe Gly Asn 595 600 605

Pro Asn Leu Cys Phe Pro His Gln Ser Ser Cys Ser Ser Tyr Thr Phe 610 615 620

Pro Ser Ser Lys Ser His Ala Lys Val Lys Ala Ile Ile Thr Ala Ile 625 630 635 640

Ala Leu Ala Thr Ala Val Leu Leu Val Ile Ala Thr Met His Met Met 645 650 655

Arg Lys Arg Lys Leu His Met Ala Lys Ala Trp Lys Leu Thr Ala Phe 660 665 670

Gln Arg Leu Asp Phe Lys Ala Glu Glu Val Val Glu Cys Leu Lys Glu 675 680 685

Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser 690 695 700

Met Pro Asn Gly Thr Asp Val Ala Ile Lys Arg Leu Val Gly Gln Gly 705 710 715 720

Ser Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly 725 730 735

Arg Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly Tyr Val Ser Asn 740 745 750

Lys Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu 755 760 765

Gly Glu Trp Leu His Gly Ala Lys Gly Cys His Leu Ser Trp Glu Met 770 775 780

Arg Tyr Lys Ile Ala Val Glu Ala Gly Lys Gly Leu Cys Tyr Leu His 785 790 795 800

His Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn 805 810 815

Ile Leu Leu Asp Ala Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu 820 825 830

Ala Lys Phe Leu Tyr Asp Pro Gly Ala Ser Gln Ser Met Ser Ser Ile 835 840 845

Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys 850 855 860

Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu 8 65 870 875 880

Leu Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp 885 890 895

Ile Val Gly Trp Ile Asn Lys Thr Glu Leu Glu Leu Tyr Gln Pro Ser 900 905 910

Asp Lys Ala Leu Val Ser Ala Val Val Asp Pro Arg Leu Thr Gly Tyr 915 920 925 Pro Met Ala Ser Val Ile Tyr Met Phe Asn Ile Ala Met Met Cys Val 930 935 940 Lys Glu Met Gly Pro Ala Arg Pro Thr Met Arg Glu Val Val His Met 945 950 955 960 Leu Thr Asn Pro Pro Gln Ser Thr Thr His Asn Asn Leu Ile Asn Leu 965 970 975 <210>

<2 11>

<212>

<213>

<4 00> atgagaacat tacagtgatc ggccttcaag gtcacgtgtg ggttcaattc aataatctca aatatttcca ctgcttgagg gtaaagctga ccggaggagt tcaggcaaag tactttaacc cttcttgaca acccatctgc ttatctggtc ataccagaga ctgcacggtc tggggcaaca atgctggatg gggaaattga attggccagt atccctgctg ttctctggcg aacaatcgga ctgtcactgg tccctcacca tcccactgca cctaagaaga actggtcaac tacaacaatt tcatttctcg catggccata gtcactgttt aaatcacggg cttgagtgct gggtcaatgc ggaagaagtg aatattgtaa tacatgccta tgggagac.ta gattgctcgc gattttgagg tcagagtgca acactgaaag atagcaggga aggaagacca gaccccaggc. ctgtgtgtta accaatcctc <210> 230 <211> 973

229 2922 DNA

Popu Iu s 229

ttctgtgctt ttgaagtcct attgggtggc atgaggactc ctccagagat cggggggatt acaatgttat ttcttgatgt aaaatctcaa actcggagat taccttcaag gttatgaggg tggcttcctg attcgttgtt taattagctt gtttttcaga caatcccaga acttcacttt tgtctattaa cgacgttgat gcaagtcctt ggatatttaa agcttccacc tcacaggtaa acacgaacag agatcaacat catcacttac ttgccaaact taccaggtga tatttggcag gaaatccaaa ggggggggtc tgctgttaat cctggaagct tgaaagagga cagagggtgt atcatggctt ggctgttggg atggaagctt gatacagaat ctttgattat ctcatgttgc tgtcctccgt tggacgaaaa gaaagccagt catcagaact ttagtgggta aagatgagag cacaatctgc

tremuloides

ttttctttta cttgaagctg ttctccagca gcgtgtggtg tgggctgttg tccagtggag tgctgggaat ttacaacaat gcatgttcat tttgagcttg cttgtccagg gagtattcca taaccttgac tcttcaagtc gaaatcactg tttgaaaaac attttttggt tgagcttcct tcacttaact tctcatgaac gctcaaaatc tttgcctttg agagatttca aatcccgcct actttctggt ccgtgctaac atccgttgat gaacgatttg aattggatac gatcccttct tctctgtgca ttttagtact agttgtgacg cactgcattc aaacattata tgatcatgta ctcggctgag gtacgtatcg aggggagctt tgctgtggag acatagggat tgattt tggt tgctggctcc gagtgatgtt cggggagttt ctctcagcca cccacttgca ctcagccagg ccccagccta

ctagtattat

aaaacctcca

tctcccacag

tctctaaacg

aacaagcttg

atagccatgc

ttccccggaa

aattttacgg

cttggaggga

gagtacttgg

ttgaagaatc

cctgaatttg

ggtgagattc

aataatctca

gatctttcga

atagaactga

gattttccga

caaaatcttg

ggattggtcc

aatttcttcc

cgaataatga

gcgacacttg

ggagatgcac

gctattggga

gaaattcctg

aacatcagag

ttcagtcaaa

agctttcttg

atgagaagcc

gccggccaat

gcgagaaata

tcaaagctaa

gtttacagat

caaaggctcg

ggcaaaggtg

gctatcaaac

attcaaactc

aataaggata

ttgcatggtt

gctgctaagg

gttaagtcca

ctcgctaagt

tatggttaca

tacagttttg

ggagatgggg

tctgatgcag

ggtgtcattc

cccaccatga

ctcgcccttt

tgttcgctcc

tgtatggaca

ctcactgtta

tgtcgtttag

tgaatcttac

tgacatctct

aaatcactct

gtgcattgcc

atttcttttc

gcttgaatgg

ttaagagctt

ggtcattaag

cttccgcttt

ctggccatat

taaacaacct

tcaatctctt

accttgaggt

gccggaatgg

cgcgggattt

ttggatcgct

ataatatgtt

ttgagttgag

taggcctttt

atctgaagaa

aagaaatctg

gtgaaatccc

acagcctcag

atctctctcg

ttacatccct

tcctggcgtt

atacttgctc

taatcactgt

tgagaaagaa

acttcaaggc

gtgctggtat

gacttgttgg

ttggaagaat

ccaacttgct

caaagggagg

gactctgtta

ataacatatt

tcttacaaga

ttgctccaga

gtgttgtgct

tggacatcgt

ctacagtctt

acttgtttaa

gggaagttgt

ag

ttgcagtgga

taatggcact

cttctctgga

acatcttcct

tctgtcaggt

caggattttg

tggcatggca

aactgaaatt

tggtacaata

taatgcgctt

gtgcgttggg

taatcttgaa

aagtcaatta

ccctcctgaa

cactggggag

tcaaaacaag

gcttcaggtt

gaagctgatg

atgcaaagga

tcctgatgaa

ttcaggaact

caataacctt

atcagtttct

cttgcagact

gggactgaag

agcttcgatt

tggggagatt

aaatcaactc

taatctctca

caatgacagt

cttcggtgat

cattgcactc

gaggctgcag

agaggacgtg

tgtctaccgt

tcgaggcagc

caggcaccga

attgtatgaa

ccatttgcag

tcttcaccac

acttgattcc

tgcaggctca

gtacgcatac

gctggagctg

gaggtgggtc

ggcagttgtg

gatagctatg

tcacatgctc

2922

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

2280

2340

2400

2460

2520

2580

2640

2700

2760

2820

2880 <212> PRT

<213> Populus tremuloides <4 O0> 230

Met Arg Thr Phe Leu Cys Phe Phe Leu Leu Leu Val Leu Leu Phe Ala 1 5 10 15 Pro Cys Ser Gly Tyr Ser Asp Leu Glu Val Leu Leu Lys Leu Lys Thr 20 25 30 Ser Met Tyr Gly His Asn Gly Thr Gly Leu Gln Asp Trp Val Ala Ser 35 40 45 Pro Ala Ser Pro Thr Ala His Cys Tyr Phe Ser Gly Val Thr Cys Asp 50 55 60 Glu Asp Ser Arg Val Val Ser Leu Asn Val Ser Phe Arg His Leu Pro 65 7 0 75 80 Gly Ser Ile Pro Pro Glu Ile Gly Leu Leu Asn Lys Leu Val Asn Leu 8 5 90 95 Thr Leu Ser Gly Asn Asn Leu Thr Gly Gly Phe Pro Val Glu Ile Ala 100 105 110 Met Leu Thr Ser Leu Arg Ile Leu Asn Ile Ser Asn Asn Val Ile Ala 115 120 125 Gly Asn Phe Pro Gly Lys Ile Thr Leu Gly Met Ala Leu Leu Glu Val 130 135 140 Leu Asp Val Tyr Asn Asn Asn Phe Thr Gly Ala Leu Pro Thr Glu Ile 145 150 155 160 Val Lys Leu Lys Asn Leu Lys His Val His Leu Gly Gly Asn Phe Phe 165 170 175 Ser Gly Thr Ile Pro Glu Glu Tyr Ser Glu Ile Leu Ser Leu Glu Tyr 180 185 190 Leu Gly Leu Asn Gly Asn Ala Leu Ser Gly Lys Val Pro Ser Ser Leu 195 200 205 Ser Arg Leu Lys Asn Leu Lys Ser Leu Cys Val Gly Tyr Phe Asn Arg 210 215 220 Tyr Glu Gly Ser Ile Pro Pro Glu Phe Gly Ser Leu Ser Asn Leu Glu 225 230 235 240 Leu Leu Asp Met Ala Ser Cys Asn Leu Asp Gly Glu Ile Pro Ser Ala 245 250 2 55 Leu Ser Gln Leu Thr His Leu His Ser Leu Phe Leu Gln Val Asn Asn 260 265 270 Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys 275 280 285 Ser Leu Asp Leu Ser Ile Asn Asn Leu Thr Gly Glu Ile Pro Glu Ser 290 295 300 Phe Ser Asp Leu Lys Asn Ile Glu Leu Ile Asn Leu Phe Gln Asn Lys 305 310 315 320 Leu His Gly Pro Ile Pro Glu Phe Phe Gly Asp Phe Pro Asn Leu Glu 325 330 335 Val Leu Gln Val Trp Gly Asn Asn Phe Thr Phe Glu Leu Pro Gin Asn 340 345 350 Leu Gly Arg Asn Gly Lys Leu Met Met Leu Asp Val Ser Ile Asn His 355 360 365 Leu Thr Gly Leu Val Pro Arg Asp Leu Cys Lys Gly Gly Lys Leu Thr 370 37 '5 380 Thr Leu Ile Leu Met Asn Asn Phe Phe Leu Gly Ser Leu Pro Asp Glu 385 390 395 400 Ile Gly Gln Cys Lys Ser Leu Leu Lys Ile Arg Ile Met Asn Asn Met 405 410 415 Phe Ser Gly Thr Ile Pro Ala Gly Ile Phe Asn Leu Pro Leu Ala Thr 420 425 430 Leu Val Glu Leu Ser Asn Asn Leu Phe Ser Gly Glu Leu Pro Pro Glu 435 440 445 Ile Ser Gly Asp Ala Leu Gly Leu Leu Ser Val Ser Asn Asn Arg Ile 4 50 455 460 Thr Gly Lys Ile Pro Pro Ala Ile Gly Asn Leu Lys Asn Leu Gln Thr 4 65 4 70 475 480 Leu Ser Leu Asp Thr Asn Arg Leu Ser Gly Glu Ile Pro Glu Glu Ile 485 490 495 Trp Gly Leu Lys Ser Leu Thr Lys Ile Asn Ile Arg Ala Asn Asn Ile 500 505 510 Arg Gly Glu Ile Pro Ala Ser Ile Ser His Cys Thr Ser Leu Thr Ser 515 520 525 Val Asp Phe Ser Gln Asn Ser Leu Ser Gly Glu Ile Pro Lys Lys Ile 530 535 540 Ala Lys Leu Asn Asp Leu Ser Phe Leu Asp Leu Ser Arg Asn Gln Leu 4 5 550 555 560 Thr Gly Gln Leu Pro Gly Glu Ile Gly Tyr Met Arg Ser Leu Thr Ser 565 570 575 Leu Asn Leu Ser Tyr Asn Asn Leu Phe Gly Arg Ile Pro Ser Ala Gly 580 585 590 Gln Phe Leu Ala Phe Asn Asp Ser Ser Phe Leu Gly Asn Pro Asn Leu 595 600 605 Cys Ala Ala Arg Asn Asn Thr Cys Ser Phe Gly Asp His Gly His Arg 610 615 620 Gly Gly Ser Phe Ser Thr Ser Lys Leu Ile Ile Thr Val Ile Ala Leu 625 630 635 640 Val Thr Val Leu Leu Leu Ile Val Val Thr Val Tyr Arg Leu Arg Lys 645 650 655 Lys Arg Leu Gln Lys Ser Arg Ala Trp Lys Leu Thr Ala Phe Gln Arg 660 665 670 Leu Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Lys Glu Glu Asn 675 680 685 Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro 690 695 700 Glu Gly Val Asp His Val Ala Ile Lys Arg Leu Val Gly Arg Gly Ser 705 710 715 720 Gly Arg Ser Asp His Gly Phe Ser Ala Glu Ile Gln Thr Leu Gly Arg 725 730 735 Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Tyr Val Ser Asn Lys 740 745 750 Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly 755 760 765 Glu Leu Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg 770 775 780 Tyr Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His 785 790 795 800 Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile 805 810 815 Leu Leu Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala 820 825 830 Lys Phe Leu Gln Asp Ala Gly Ser Ser Clu Cys Met Ser Ser Val Ala 835 840 845 Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val 850 855 860 Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu 865 870 875 880 Ile Ala Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile 885 890 895 Val Arg Trp Val Arg Lys Thr Thr Ser Glu Leu Ser Gln Pro Ser Asp 900 905 910 Ala Ala Thr Val Leu Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro 915 920 925 Leu Ala Gly Val Ile His Leu Phe Lys Ile Ala Met Leu Cys Val Lys 930 935 940 Asp Glu Ser Ser Ala Arg Pro Thr Met Arg Glu Val Val His Met Leu 945 950 955 960 Thr Asn Pro Pro Gln Ser Ala Pro Ser Leu Leu Ala Leu 965 970

<210> 231 <211> 2922 <212> DNA

<213> Populus tremuloides <4 00> 231

atgggaactc ttctgtgttt tcttcttcct tttcttgtac ggatacagtg aacttgaagt cctcttgaag ctgaaatctt actggccttg aagattgggt ggcttctcct acatctcctt ggagtcacgt gtgatgagag ctcacgtgtg gtgtcactta cctggttcaa ttcctccaga gattgggttg ttgaacaagc aatgataatc tcacggggga acttcctgcg gagatagcca ttgaacattt ctggcaatgc tattggtggg aatttctctg acacagcttg aggttcttga tatttacaac aataattgct attgcaaacc tgaaaaaact caagcatctt cacctgggag ataccagagg agtactcgga gattatgatc ttggagttct ctttcaggca aagttccttc tagcttgtct aagctgaaga gggtactata accattacga aggaggtatt ccacctgaat gaacttcttg acatgggttc ttgcaacctt aatggtgaga ttaacccatc tgcattcgct gtttcttcaa ttcaataatc gaattatctg gtctaattag cttgaaatca cttgatcttt gagatacccg agagtttttc agctttgaaa aacttaacac aagctgcacg gtccaatccc agactttgtt ggtgattttc gtttggggaa acaacttcac atttgagctt cccaaacagc atgtatctgg acgtgtcata taatcacttg acaggattgg ggagggaaat tgaagacgtt gattctcatg aataatttct gaaattggcc agtgcaagtc cttgctcaaa atcagaatca actatccctg ctgggatctt taatttacct ttggtgaccc tatttctccg gcgagcttcc accggagatt tcaggagatg tctgacaatc ggattactgg tagaatcccc cgggctattg tttctatctc tggaaatgaa cagactttct ggtgaaattc gagatcctct ccaagatcag catccgtgcc aacaacatta atgttccatt gcacttcact tacatccgtt gatttcagtc attccaaagg agattactaa actgaaggat ttgagtattc cttactggtc aactaccaag tgaaattcga tacatgacaa tcctacaaca atttatttgg ccggatccct tctgtcggcc agctcatttc ttggaaatcc aaatctctgt gtagcaagaa ggtcatggcc atagaaggtc ctttaatact tcaaagctaa gtcactgcgt tgctgttaat agcagtgaca gtttacagat aaatcacggg cctggaagct cactgcattc caaaggctcg ctcgagtgct tgaaagagga aaacattata ggcaaaggtg gggtcaatga cagagggtat tgatcatgta gctatcaaac ggacgaaacg atcatggctt ctcagccgag atccaaacac aatattgtta ggctgctggg gtacgtatca aataaggata tacatgccaa atgggagctt aggagagctt ttgcatggtt tgggaaacca ggtacagaat tgctgtggag gctgccaagg gattgctctc ctttgattat acatagggat gtgaagtcca gattttgagg ctcatgttgc tgattttggg ctggccaagt tcagaatgca tgtcctctat tgctggctcc tatggttaca acattgaaag tggacgaaaa aagtgatgtt tacagctgcg atagcaggga ggaagccagt aggggagttt ggagatgggg aggaagacca cgtcagaact atctcagcca tccgatgcag gaccccaggc ttagtgggta ccctctaaca ggtgccattc ttgtgtgtaa aagatgagag ctcgaaccgg cctaccatga accaatcctc cacagtcagc ctcaagcctc ctcaccctct <210>

<211>

<212>

<213>

<400>

tactgttcac tgcttgcagt 60 ccatgtacgg acataatggc 120 cagctcattg tttcttctct 180 atttgtcgtt cagacatctt 240 ttgtgaatct tactttggcc 300 tgcttaaatc tctcaggatt 360 gaaagatcac tcctggcatg 420 cgggtccact gccaattgaa 480 ggaatttctt ttctggtaaa 540 taggcttgaa tggtaatgac 600 atctcaagag cttgtgcatt 660 ttggatcatt gagtaatctt 720 ttccttctac tctaggccaa 780 tcactggata tatcccttcg 840 caatcaacaa cctcactggg 900 tcctcaatct ctttcaaaac 960 caaaccttga ggtgcttcag 1020 tcggccggaa tgggaagctg 1080 ttcctcggga cttatgcaag 1140 tcattggatc acttcctgaa 1200 tttgtaatct ctttacaggc 1260 aaattgagtt gagccataac 1320 cactaggctc tctttcggtc 1380 ggaatttgaa gagtttgcag 1440 ctgatgaaat cttcagtctg 1500 gcggtgaaat cccagcttcc 1560 aaaacagcat cagtggggag 1620 ttgatctctc tcgaaatcag 1680 gtcttacaac tctaaacctc 1740 aattcctggc gttcaatgac 1800 atgactcttg ctcatttggt 1860 tgatcactgt cattgctctt 1920 tgagaaagaa gaatctgcag 1980 atttcaaagc agaggatgtg 2040 gcgctgggat tgtctaccgt 2100 gacttgttgg tagaggcacc 2160 ttggaaggat caggcaccga 2220 ccaacttgct gttgtatgag 2280 caaagggagg ccatttgcag 2340 gactctgtta tcttcaccat 2400 ataacatatt acttgattcg 2460 tcttgcaaga tgcaggtgca 2520 ttgctccaga atacgcttac 2580 gtgttgtgct gctggagctg 2640 tggacatagt gagatgggtc 2700 cttcagtctt ggcagttgtg 2760 acctgtttaa gatagctatg 2820 gggaagtggt tcacatgctc 2880 ag 2922 232 97 3 PRT

Populus tremuloides 232

Met Gly Thr Leu Leu Cys Phe Leu Leu Pro Phe 1 5 10 15

Thr Ala Cys Ser Gly Tyr Ser Glu Leu Glu Val 2 0 2 5 30

Ser Ser Met Tyr Gly His Asn Gly Thr Gly Leu

Leu Val Leu Leu Phe Leu Leu Lys Leu Lys Glu Asp Trp Val Ala 40 45

Ser Pro Thr Ser Pro Ser Ala His Cys Phe Phe Ser Gly Val Thr O 1C CO 50 55 60 Asp Glu Ser Ser Arg Val Val Ser Leu Asn Leu Ser Phe Arg His Leu 65 70 75 80 Pro Gly Ser Ile Pro Pro Glu Ile Gly Leu Leu Asn Lys Leu Val Asn 85 90 95 Leu Thr Leu Ala Asn Asp Asn Leu Thr Gly Glu Leu Pro Ala Glu Ile 100 105 110 Ala Met Leu Lys Ser Leu Arg Ile Leu Asn Ile Ser Gly Asn Ala Ile 115 120 125 Gly Gly Asn Phe Ser Gly Lys Ile Thr Pro Gly Met Thr Gln Leu Glu 130 135 140 Val Leu Asp Ile Tyr Asn Asn Asn Cys Ser Gly Pro Leu Pro Ile Glu 145 150 155 160 Ile Ala Asn Leu Lys Lys Leu Lys His Leu His Leu Gly Gly Asn Phe 165 170 175 Phe Ser Gly Lys Ile Pro Glu Glu Tyr Ser Glu Ile Met Ile Leu Glu 180 185 190 Phe Leu Gly Leu Asn Gly Asn Asp Leu Ser Gly Lys Val Pro Ser Ser 195 200 205 Leu Ser Lys Leu Lys Asn Leu Lys Ser Leu Cys Ile Gly Tyr Tyr Asn 210 215 220 His Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly Ser Leu Ser Asn Leu 225 230 235 240 Glu Leu Leu Asp Met Gly Ser Cys Asn Leu Asn Gly Glu Ile Pro Ser 245 250 2 5 5 Thr Leu Gly Gln Leu Thr His Leu His Ser Leu Phe Leu Gin Phe Asn 260 265 270 Asn Leu Thr Gly Tyr Ile Pro Ser Glu Leu Ser Gly Leu Ile Ser Leu 275 280 285 Lys Ser Leu Asp Leu Ser Ile Asn Asn Leu Thr Gly Glu Ile Pro Glu 290 295 300 Ser Phe Ser Ala Leu Lys Asn Leu Thr Leu Leu Asn Leu Phe Gln Asn 305 310 315 320 Lys Leu His Gly Pro Ile Pro Asp Phe Val Gly Asp Phe Pro Asn Leu 325 330 335 Glu Val Leu Gln Val Trp Gly Asn Asn Phe Thr Phe Glu Leu Pro Lys 340 345 350 C-In Leu Gly Arg Asn Gly Lys Leu Met Tyr Leu Asp Val Ser Tyr Asn 3 5 5 360 365 His Leu Thr Gly Leu Val Pro Arg Asp Leu Cys Lys Gly Gly Lys Leu 370 375 380 Lys Thr Leu He Leu Met Asn Asn Phe Phe Ile Gly Ser Leu Pro Glu 385 390 395 400 Glu Ile Gly Gln Cys Lys Ser Leu Leu Lys Ile Arg Ile Ile Cys Asn 405 410 415 Leu Phe Thr Gly Thr Ile Pro Ala Gly Ile Phe Asn Leu Pro Leu Val 420 425 430 Thr Gln Ile Glu Leu Ser His Asn Tyr Phe Ser Gly Glu Leu Pro Pro 435 440 445 Glu Ile Ser Gly Asp Ala Leu Gly Ser Leu Ser Val Ser Asp Asn Arg 450 455 460 Ile Thr Gly Arg Ile Pro Arg Ala Ile Gly Asn Leu Lys Ser Leu Gln 465 470 475 480 Phe Leu Ser Leu Glu Met Asn Arg Leu Ser Gly Glu Ile Pro Asp Glu 485 490 495 Ile Phe Ser Leu Glu Ile Leu Ser Lys Ile Ser Ile Arg Ala Asn Asn 500 505 510 Ile Ser Gly Glu Ile Pro Ala Ser Met Phe His Cys Thr Ser Leu Thr 515 520 525 Ser Val Asp Phe Ser Gln Asn Ser He Ser Gly Glu Ile Pro Lys Glu 530 535 540 Ile Thr Lys Leu Lys Asp Leu Ser I Ie Leu Asp Leu Ser Arg Asn Gln 545 550 555 560 Leu Thr Gly Gln Leu Pro Ser Glu Ile Arg Tyr Met Thr Ser Leu Thr 565 570 57 5 Thr Leu Asn Leu Ser Tyr Asn Asn Leu Phe Gly Arg Ile Pro Ser Val 580 585 590 Gly Gln Phe Leu Ala Phe Asn Asp Ser Ser Phe Leu Gly Asn Pro Asn 595 600 605 Leu Cys Val Ala Arg Asn Asp Ser Cys Ser Phe Gly Gly His Gly His 610 615 620 Arg Arg Ser Phe Asn Thr Ser Lys Leu Met Ile Thr Val Ile Ala Leu 625 630 635 640 Val Thr Ala Leu Leu Leu Ile Ala Val Thr Val Tyr Arg Leu Arg Lys 645 650 655 Lys Asn Leu Gln Lys Ser Arg Ala Trp Lys Leu Thr Ala Phe Gln Arg 660 665 670 Leu Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Lys Glu Glu Asn 675 680 685 Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Thr 690 695 700 Glu Gly Ile Asp His Val Ala Ile Lys Arg Leu Val GIy Arg Gly Thr 705 710 715 720 Gly Arg Asn Asp His η 1 \Ι Phe Ser Ala Glu Ile Gln Thr Leu Gly Arg 725 ^xy 735 730 Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Tyr Val Ser Asn Lys 740 745 750 Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly 755 760 765 Glu Leu Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg 770 775 780 Tyr Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His 785 790 795 800 Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile 805 810 815 Leu Leu Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Aia 820 825 830 Lys Phe Leu Gln Asp Ala Gly Ala Ser Glu Cys Met Ser Ser Ile Ala 835 840 845 Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val 850 855 860 Asp Glu Lys Ser Asp Val Tyr Ser Cys Gly Val Val Leu Leu Glu Leu 865 870 875 880 Ile Ala Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile 885 890 895 Val Arg Trp Val Arg Lys Thr Thr Ser Glu Leu Ser Gln Pro Ser Asp 900 905 910 Ala Ala Ser Val Leu Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro 915 920 925 Leu Thr Gly Ala Ile His Leu Phe Lys Ile Ala Met Leu Cys Val Lys 930 935 940 Asp Glu Ser Ser Asn Arg Pro Thr Met Arg Glu Val Val His Met Leu 945 950 955 960 Thr Asn Pro Pro Gln Ser Ala Ser Ser Leu Leu Thr Leu 965 970 <2 10> 233 <211> 996 <2 12> PRT <2 13> Zea mays <400 > 233 Met Pro Pro Pro Thr Phe Leu Leu Gly Leu Leu Leu Leu Leu Leu Leu 1 5 10 15 Ala Ala Ala Ala Pro Ala Pro Ala Ser Ala Thr Pro Glu Arg Asp Ala 25 30 Tyr Ala Leu Ser Arg Leu Lys Ala Ser Leu Val Pro Ser Ala Thr Asn 35 40 45 Ser Thr Ser Ala Pro Leu Ser Asp Trp Asp Pro Ala Ala Thr Pro Pro 50 55 60 Ala His Cys Ala Phe Thr Gly VaI Thr Cys Asp Ala Ala Thr Ser Arg 65 70 75 80 Val Val Ala Ile Asn Leu Thr Ala Val Pro Leu His Gly Gly Ala Leu 85 90 95 Pro Pro Glu Val Ala Leu Leu Asp Ala Leu Ala Ser Leu Thr Val Ala 100 105 110 Asn Cys Tyr Leu Arg Gly Arg Leu Pro Pro Ala Leu Ala Ser Met Pro 115 120 125 Ala Leu Arg His Leu Asn Leu Ser Asn Asn Asn Leu Ser Gly Pro Phe 130 135 40 Pro Pro Pro Pro Pro Ala Ala Tyr Phe Pro Ala Leu Glu Ilc Val Asp 145 150 155 160 Val Tyr Asn Asn Asn Leu Ser Gly Pro Leu Pro Pro Leu Gly Ala Pro 165 170 175 His Ala Arg Ser Leu Arg Tyr Leu His Leu Gly Gly Asn Tyr Phe Asn 180 18 5 190 Gly Ser Ile Pro Asp Thr Phe Gly Asp Leu Ala Ala Leu Glu Tyr Leu 195 200 205 Gly Leu Asn Gly Asn Ala Leu Ser Gly Arg Val Pro Pro Ser Leu Ser 210 215 220 Arg Leu Ser Arg Leu Arg Glu Met Tyr Val Gly Tyr Tyr Asn Gln Tyr 225 230 235 240 Ser Gly Gly Val Pro Arg Glu Phe Gly Ala Leu Gln Ser Leu Val Arg 245 250 255 Leu Asp Met Ser Ser Cys Thr Leu Thr Gly Pro Ile Pro Pro Glu Leu 260 265 270 Ala Arg Leu Ser Arg Leu Asp Thr Leu Phe Leu Ala Leu Asn Gln Leu 275 280 28 5 Thr Gly Glu Ile Pro Pro Glu Leu Gly Ala Leu Thr Ser Leu Arg Ser 290 295 300 Leu Asp Leu Ser Ile Asn Asp Leu Ala Gly Glu Ile Pro Ala Ser Phe 305 310 315 320 Ala Ala Leu Thr Asn Leu Lys Leu Leu Asn Leu Phe Arg Asn Lys Leu 325 330 335 Arg Gly Glu Ile Pro Ala Phe Leu Gly Asp Phe Pro Phe Leu Glu Val 34 0 345 350 Leu Gln Val Trp Asp Asn Asn Leu Thr Gly Pro Leu Pro Pro Ala Leu 355 360 365 Gly Arg Asn Gly Arg Leu Lys Thr Leu Asp Val Thr Ser Asn His Leu 370 375 380 Thr Gly Thr Ile Pro Pro Asp Leu Cys Ala Gly Arg Asn Leu Gln Leu 385 390 395 400 Leu Val Leu Met Asp Asn Gly Phe Phe Gly Ser Ile Pro Glu Ser Leu 405 410 415 Gly Asp Cys Lys Thr Leu Thr Arg Val Arg Leu Gly Lys Asn Phe Leu 420 425 430 Thr Gly Pro Val Pro Ala Gly Leu Phe Asp Leu Pro Gln Ala Asn Met 435 440 445 Leu Glu Leu Thr Asp Asn Met Leu Thr Gly Glu Leu Pro Asp Val Ile 450 455 460 Ala Gly Asp Lys Ile Gly Met Leu Met Leu Gly Asn Asn Arg Ile Gly 465 470 475 480 Gly Arg Ile Pro Ala Ala Ile Gly Asn Leu Pro Ala Leu Gln Thr Leu 485 490 495 Ser Leu Glu Ser Asn Asn Phe Ser Gly Ser Leu Pro Pro Glu Ile Gly 500 505 510 Arg Leu Arg Asn Leu Thr Arg Leu Asn Ala Ser Gly Asn Ala Leu Thr 515 520 525 Gly Giy Ile Pro Arg Glu Leu Met Gly Cys Ala Ser Leu Gly Ala Val 530 535 540

Asp Leu Ser Arg Asn Gly Leu Thr Gly Glu Ile Pro Asp Thr Val Thr 54 5 550 555 560 Ser Leu Lys Ile Leu Cys Thr Leu Asn Val Ser Arg Asn Arg Leu Ser 565 570 575 Gly Glu Leu Pro Ala Ala Met Ala Asn Asn Thr Ser Leu Thr Thr Leu 580 585 590 Asp Val Ser Tyr Asn Gln Leu Ser Gly Pro Vai Pro Met Gln Gly Gln 595 600 605 Phe Leu Val Phe Asn Glu Ser Ser Phe Val Gly Asn Pro Gly Leu Cys 610 615 620 Ser Ala Cys Pro Pro Ser Ser Gly Gly Ala Arg Ser Pro Phe Ser Leu 625 630 635 640 Arg Arg Trp Asp Ser Lys Lys Leu Leu Val Trp Leu Val Val Leu Leu 645 650 655 Thr Leu Leu Val Leu Ala Val Leu Gly Ala Arg Lys Ala His Glu Ala 660 665 670 Trp Arg Glu Ala Ala Arg Arg Arg Ser Gly Ala Trp Lys Met Thr Ala 675 680 685 Phe Gln Lys Leu Asp Phe Ser Ala Asp Asp Val Val Glu Cys Leu Lys 690 695 700 Glu Asp Asn Ile He Gly Lys Gly Gly Ala Gly Ile Val Tyr His Gly 705 710 715 720 Val Thr Arg Gly Gly Ala Glu Leu Ala Ile Lys Arg Leu Val Gly Arg 725 730 735 Gly Cys Gly Asp His Asp Arg Gly Phe Thr Ala Glu Val Thr Thr Leu 740 745 750 Gly Arg Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Phe Val Ser 755 7 60 765 Asn Arg Glu Ala Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser 770 775 780 Leu Gly Glu Met Leu His Gly Gly Lys Gly Gly His Leu Gly Trp Glu 785 790 795 800 Ala Arg Ala Arg Val Ala Ala Glu Ala Ala Arg Gly Leu Cys Tyr Leu 805 810 815 Hls His Asp Cys Ala Pro Arg He Ile His Arg Asp Val Lys Ser Asn 820 825 830 Asn Ile Leu Leu Asp Ser Ala Phe Glu Ala His Val Ala Asp Phe Gl y 835 840 845 Leu Ala Lys Phe Leu Gly Gly Gly Gly Ala Thr Ser Glu Cys Met Ser 850 855 860 Ala Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr 865 870 875 880 Leu Arg Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu 885 890 895 Leu Glu Leu Ile Thr Gly Arg Arg Pro Val Gly Ser Phe Gly Asp Gl y 900 905 910 Val Asp Ile Val His Trp Val Arg Lys Val Thr Ala Asp Ala Ala Al a 915 920 925 Al a Glu Glu Pro Val Leu Leu Val Ala Asp Arg Arg Leu Ala Pro Glu 930 935 940 Pro Val Pro Leu Leu Ala Asp Leu Tyr Arg Val Ala Me t: Ala Cys Val 945 950 955 960 Glu Glu Aia Ser Thr Ala Arg Pro Thr Met Arg Glu Val Val His Met 965 97 0 975 Leu Ser Thr Ser Ala Ala Ala Gln Pro Asp VaI Pro His Aia Leu Cys 980 985 990

Lys Val Val Asp 995 <210> 234 <211> 2343 <212> DNAi

<213> Ipomoea batatas <4 00> 234

ttctccggcg ttgcatgcga tcaggattca cgagtcattt ccgctcttcg gttccctccc gccggagatt ggactgctgg ctcacctccg ttaatctctc tggtgcgctt ccatcggaga aaagccatta atatgtcaaa caatttgttg agcggccatt ggtatgactg agcttcaagt gttggatgtt tacaataaca catgaagtgg tgaagttgaa gaagctgaaa attctcaatc ggagagatac cggaaatata ctctaacatt tccagtttac aatagcctca cgggaaatat accggcaagc ttggcgcagc cgccttggct acttgaatac atttgaaaga ggcattccac acacttcaaa tgcttgatct tagggaatgc aacctttctg gggaatctaa aacagctata ctttctgtat ttgtacggga ccggcggagc tctccggttt ggagagtttg gtgcatctgg atgggagaaa ttcctcaaag tttagccgag ttgaagagcc agaaacacgt tccaaggcac aattcccgcg ttcatcggtg ttacagcttt ggaacaacaa tttcacatcc gagttaccgg cgattgaggt ttctggacgt ttcgtcaaac caaatcagcg tgtatgggag ggaagctgga agcactaatt ctcatggaaa cctcaagtcc tgggcgagtg caagtccttg aatggggttc aatggagcca tcccgcctgg ctttcttcaa tttgccgttg caaaacaatt acttctccag cgagcttccg accaagatgc cttgatcttc acaacaacag gataaatggc cagattcctc aacctctgga agttatccct ccactccaac agattctccg tcacatttga aaaagatggt gaccatggat ttaagcagca ccagcctcaa ttgctcagtg tacacagctg aattcctttg accggaaaaa ttccaaagga aatctcttct ctggagcgcc agaaatctac ttactggttc agttcccagt gaactagggc ctggatcatt ctttcaatga tttttcgggt ccaataccca ttcgataacc ggtctttcta cgggaatcca aaactcttct ccagtcaatc acaacaacca ttcttggacc acaaaacgaa attttgggta ctgcagcagc atttttatct gctgttatat gcgcgaagag aaaagattat gaaatccaat aatgcttgga ctggaatata aagtagagga tgtggttgag tgtttgaaag gggggagcag ggacagtata caaaggctcc atgcccgatg aggctagaca ggcgaggaac tgggcgtcgt gatcttggtt ctgggaagaa tcaggcaccg acacattatt agattacttg actaatttgt tattgtatga atacatgcct aatgggagct acgaatgggg ccaatttgct ttgggagatg cggtttcgaa gggctatgtt acttgcacca tgattgctcc cctcccatta aataatattt tactcacttc tgattatata gcttgcattg

ctttagccat

ataggctttt

tggcgaaact

tccctggaga

acttttccgg

tcggaggaaa

agactttaaa

ttcagaatct

cagaattagg

gtgaaattcc

acagcctgac

acctttcaga

tggtattgat

atctacccaa

taaacctcgg

gcagagtacc

acaaattttc

gtgttgagaa

gcttaatcta

ttgccaagaa

cggcattcgg

ggaaaattcc

acagtttaac

acttgagtgc

taaatgtact

taatgaatag

ccaatggaca

attcacctcc

tactcataat

gggtaaggtg

aactaacaac

aggaaaacat

gtgtcatcat

tctctgctga

gttatgcatc

tgtcggggat

ttgcggtgga

ttcataggga

ctgattttgg

tcc <210> <211> <212> <213> <4 00> Phe Se 1

2343

235

781

PRT

Ipomoea batatas 235

atccgctgtt

aaacttaact

cacatccatt

aatcttggtc

aaggcttcct

ttacttcaca

cttacaaaca

tcgtgagctc

ctccatcacc

taaaagttta

aggtcatatt

aaataatatg

aaacttgttc

actagaggtt

acgaaaccgc

ggaaaatttg

tggaccgttt

gaactatctc

cgtttgtctc

tctcacagat

aaatttagag

aaatcaaatt

aggtgaagtt

aaataattta

caacttgtcc

cttgactgtc

gttaggagtt

aagctcatcg

tactgtcttg

cattattgtt

attcaagaaa

aattgggcaa

agcaataaaa

aattaaaaca

taacagagat

cctgcatggg

agccgcaaag

cgtaaagtct

gctggctaaa

10

15

20

25

35

40

45

50

5 5

60

65

70

75

90

95

100

105

110

115

120

125

Ser Arg Val Ile Ser Leu Ala Leu Pro Pro Glu Ile Gly Leu Thr Ser Val Asn Leu Ser Gly Thr Ser Ile Lys Ala Ile Asn Phe Pro Gly Glu Ile Leu Val Val Tyr Asn Asn Asn Phe Ser Leu Lys Lys Leu Lys Ile Leu Glu Ile Pro Glu Ile Tyr Ser Leu Gln Thr Asn Ser Leu Thr 60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1740

1800

1860

1920

1980

2040

2100

2160

2220

2280

2340 130 135 140

Gly Asn Ile Pro Ala Ser Leu Ala Gln Leu Gln Asn Leu Arg Glu Leu 145 150 155 160 Arg Leu Gly Tyr Leu Asn Thr Phe Glu Arg Gly Ile Pro Pro Glu Leu 165 170 175 Gly Ser Ile Thr Thr Leu Gln Met Leu Asp Leu Arg Glu Cys Asn Leu 180 185 190 Ser Gly Glu Ile Pro Lys Ser Leu Gly Asn Leu Lys Gln Leu Tyr Phe 195 200 205 Leu Tyr Leu Tyr Gly Asn Ser Leu Thr Gly His Ile Pro Ala Glu Leu 210 215 220 Ser Gly Leu Glu Ser Leu Val His Leu Asp Leu Ser Glu Asn Asn Met 225 230 235 240 Met Gly Glu Ile Pro Gln Ser Leu Ala Glu Leu Lys Ser Leu Val Leu 245 250 255 Ile Asn Leu Phe Arg Asn Thr Phe Gln Gly Thr Ile Pro Ala Phe Ile 260 265 270 Gly Asp Leu Pro Lys Leu Glu Val Leu Gln Leu Trp Asn Asn Asn Phe 275 280 285 Thr Ser Glu Leu Pro Val Asn Leu Gly Arg Asn Arg Arg Leu Arg Phe 290 295 300 Leu Asp Val Ser Ser Asn Gln Ile Ser Gly Arg Val Pro Glu Asn Leu 305 310 315 320 Cys Met Gly Gly Lys Leu Glu Ala Leu Ile Leu Met Glu Asn Lys Phe 325 330 335 Ser Gly Pro Phe Pro Gln Val Leu Gly Glu Cys Lys Ser Leu Asn Gly 340 345 350 Val Arg Val Glu Lys Asn Tyr Leu Asn Gly Ala I Ie Pro Pro Gly Phe 355 360 365 Leu Gln Phe Ala Val Gly Leu Ile Tyr Val Cys Leu Gln Asn Asn Tyr 370 375 380 Phe Ser Ser Glu Leu Pro Thr Lys Met Leu Ala Lys Asn Leu Thr Asp 385 390 395 400 Leu Asp Leu His Asn Asn Arg Ile Asn Gly Gin Ile Pro Pro Ala Phe 405 410 415 Gly Asn Leu Glu Asn Leu Trp Lys Leu Ser Leu His Ser Asn Arg Phe 420 425 430 Ser Gly Lys Ile Pro Asn Gln Ile Ser His Leu Lys Lys Met Val Thr 435 440 445 Met Asp Leu Ser Ser Asn Ser Leu Thr Gly Glu Val Pro Ala Ser Ile 450 455 460 Ala Gln Cys Thr Gln Leu Asn Ser Phe Asp Leu Ser Ala Asn Asn Leu 465 470 475 480 Thr Gly Lys Ile Pro Lys Glu He Ser Ser Leu Glu Arg Leu Asn Val 485 490 495 Leu Asn Leu Ser Arg Asn Leu Leu Thr Gly Ser Val Pro Ser Glu Leu 500 505 510 Gly Leu Met Asn Ser Leu Thr Val Leu Asp His Ser Phe Asn Asp Phe 515 520 525 Ser Gly Pro Ile Pro Thr Asn Gly Gln Leu Gly Val Phe Asp Asn Arg 530 535 540 Ser Phe Tyr Gly Asn Pro Lys Leu Phe Tyr Ser Pro Pro Ser Ser Ser 54 5 550 555 560 Pro Val Asn His Asn Asn His Ser Trp Thr Thr Lys Arg Ile Leu Ile 5 65 570 575 Ile Thr Val Leu Ile Leu Gly Thr Ala Ala Ala Phe Leu Ser Ala Val 580 585 590 Ile Trp Val Arg Cys Ile He Val Ala Arg Arg Glu Lys Ile Met Lys 595 600 605 Ser Asn Asn Ala Trp Lys Leu Thr Thr Phe Lys Lys Leu Glu Tyr Lys 610 615 620 Val Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Gln 625 630 635 640 Gly Gly Ala Gly Thr Val Tyr Lys Gly Ser Met Pro Asp Gly Val Iie 6 4 5 650 65 5 Ile Ala Ile Lys Arg Leu Asp Arg Arg Gly Thr Gly Arg Arg Asp Leu 660 665 670 Gly Phe Ser Ala Glu Ile Lys Thr Leu Gly Arg Ile Arg His Arg His 675 680 685 Ile Ile Arg Leu Leu Gly Tyr Ala Ser Asn Arg Asp Thr Asn Leu Leu 690 695 700 Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Ser Gly Ile Leu His Gly 705 710 715 720 Thr Asn Gly Ala Asn Leu Leu Trp Glu Met Arg Phe Arg Ile Ala Val 725 730 735 Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Pro 740 745 750 Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Thr Scr Asp 755 760 765 Tyr Ile Ala Cys Ile Ala Asp Phe Gly Leu Ala Lys Ser 770 775 780 <210> 236 <211> 4 <212> PRT <213> Seqüência artificial <220>

<223> motivo 1 <220>

<221> INCERTO

<222> (2) . . (2)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente

<4 00> 236 Leu Xaa Asp Trp 1

<210> 237

<211> 11

<212> PRT

<213> Seqüência artificial <220>

<223> motivo 2 <220>

<221> VARIANTE

<222> (1) . . (1)

<223> / substituir = "Pro"

<220>

<221> INCERTO

<222> (4)..(4)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220>

<221> VARIANTE

<222> (6)..(6)

<223> / substituir = "Thr"

<220>

<221> VARIANTE

<222> (9)..(9)

<223> / substituir = "Thr" / substituir = "Lys"

<4 00> 237

Ala His Cys Xaa Phe Ser Giy Val Ser Cys Asp

10

<210> 238

<211> 56

<212> DNA

<213> Seqüência artificial <220>

<223> iniciador: prm08591

<4 00> 238 ggggacaagt ttgtacaaaa aagcaggctt: aaacaatggc gatgagactt ttgaag <210> 239

51 DNA

Seqüência artificial

56

<211> <212> <213> <220> <223> <4 00>

iniciador: prm.08592 239

ggggaccact ttgtacaaga aagctgggtc gctacgtaac caagaagtca c

<210> 240

<211> 1243

<212> DNA

<213> Oryza satíva

<4 00> 240

51

aaaaccaccg agggacctga tctgcaccgg ttttgatagt

gttttccgat cgagggacga aaatcggatt cggtgtaaag

ttattccgga gcatgattgg gaagggagga cataaggccc

gtccagatct ccagatcact cagcaggatc ggccgcgttc

ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc

gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc

atagatagct actactctct ccgtttcaca atgtaaatca

atattgatgt taatgaatat agacatatat atctatttag

atgtaggaaa tgctagaatg acttacattg tgaattgtga

tggatggatg caggatcatg aaagaattaa tgcaagatcg

ttactaattg cgctgcatat atgcatgaca gcctgcatgc

ccattaggaa gtaaccttgt cattacttat: accagtacta

tcatgagcaa atctacaaaa ctggaaagca ataaggaata

cattaatcac caaatatttc gccttctcca gcagaatata

tgtacacact gacagtgtac gcataaacgc. agcagccagc

gcacactggc cttccatctc aggctagctt tctcagccac

gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc

gaatcgctcc cgcgcgcggc ggcggcgcgc acgtacgaat

ccacgacacg atcgcgcgcg acgccggcga caccggccat

ccgactataa atacgtaggc atctgcttga tcttgtcatc

aggaaaaaaa aacaaaacac accaagccaa ataaaagcga <210> 241 <211> 230 <212> PRT

<213> Seqüência artificial <22 0>

tgagggaccc

ttaagggacc

atgtcgcatg

gcgtagcacc

gtagcttccg

cttgcacgcg

ttctactatt

attcattaac

aatggacgaa

tatctgccgc

gggcgtgtaa

catactatat

cgggactgga

tatctctcca

ttaactgtcg

ccatcgtaca

aaatcaaaac

gcacgcacgc

ccacccgcgc

catctcacca

caa

gttgtgtctg 60 tcagatgaac 120 tgtttggacg 180 cgcggtttga 240 ccggaagcga 300 atacatcggg 360 ttccacattc 420 atcaatatga 480 gtacctacga 540 atgcaaaatc 600 gcgtgttcat 660 agtattgatt 720 aaagactcaa 780 tcttgatcac 840 tctcaccgtc 900 tgtcaactcg 960 caccggagaa 1020 acgcccaacc 1080 cctcacctcg 1140 CC3â3âd333 1200 1243 <223> Dominio C-terminai deSEQ ID NO: 212 <4 00> 241 Arg Leu Leu Gly Tyr Val Ala Asn Lys Asp Thr Asn Leu Leu Leu Tyr 1 5 10 15 Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys 20 25 30 Gly Gly His Leu Gln Trp Glu Thr Arg His Arg Val Ala Val Glu Ala 35 40 45 Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Leu 50 55 60 His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu 65 70 7. 5 80 Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Val Asp Gly Ala 85 90 95 Ala Ser Glu Gys Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala 100 105 110 Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr 115 12 0 125 CO Phe Gly Val Val Leu Leu Glu Leu Ile Ala Gly Lys Lys Pro Val CD 130 135 140 Gly Glu Phe Gly Glu Gly Val Asp Ile Val Arg Trp Val Arg Asn Thr 145 150 15 5 160 Glu Glu Glu Ile Thr Gln Pro Ser Asp Ala Ala Ile Val Val Ala Ile 165 170 175

Val Asp Pro Arg Leu Thr Gly Tyr Pro Leu Thr Ser Val Ile His 180 185 190 Phe Lys Ile Ala Met Met Cys Val Glu Glu Glu Ala Ala Ala Arg 195 200 205 Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Lys Ser 210 215 220

Ala Asn Leu Ile Ala Phe 225 230

Claims

1. Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, caracterizado pelo fato de que compreende aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um polipeptídeo TCP de Classe I, e opcionalmente selecionar plantas tendo rendimento aumentado, em que dito polipeptídeo TCP de Classe I compreende de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQID: 65.

2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que dito polipeptídeo TCP de Classe I compreende adicionalmente uma região rica em HQ (H sendo histidina, Q glutamina), entre o motivo I C- terminal conservado e a extremidade C-terminal do polipeptídeo.

3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que dito polipeptídeo TCP de Classe I, quando usado na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 ao invés de com qualquer outro ciado de TCP.

4. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita seqüência de ácidos nucleicos codifica qualquer um dos polipeptídeos TCP de Classe I como dado em Tabela A ou ortólogos ou parálogos ou homólogos de qualquer das SEQ ID NOs mencionadas acima.

5. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I é uma ou mais das seguintes variantes de ácido nucleico: (i) uma porção de uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (ii) uma seqüência de ácidos nucleicos capaz de hibridizar com uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (iii)uma variante de união de uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (iv) uma variante alélica de uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (v) uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I obtida por embaralhamento de gene; (vi) uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I obtida por mutagênese dirigida por sítio.

6. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita expressão aumentada é efetuada por um ou mais dentre identificação por ativação de T-DNA, TILLING, ou recombinação homóloga.

7. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo e expressando em uma planta uma seqüência de ácidos nucleicos codificando polipeptídeo TCP de Classe I.

8. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dito rendimento aumentado de sementes é um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.

9. Método de acordo com reivindicações 7 ou 8, caracterizado pelo fato de que dita seqüência de ácidos nucleicos é operacionalmente ligada a um promotor constitutivo, preferivelmente a um promotor GOS2.

10. Método de acordo com qualquer uma das reivindicações 7 a 9, caracterizado pelo fato de que dita seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I preferivelmente é de origem de planta, ainda preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente de Arabidopsis thaliana.

11. Planta ou parte da mesma, caracterizada pelo fato de que inclui sementes viáveis por um método como definido em qualquer uma das reivindicações 1 a 10, em que dita planta ou parte da mesma compreende um transgene de ácido nucleico codificando um polipeptídeo TCP de Classe I.

12. Construção, caracterizada pelo fato de compreender: (a) seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (a); e opcionalmente (c) uma seqüência de término de transcrição.

13. Construção de acordo com a reivindicação 12, caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelo menos um promotor constitutivo, preferivelmente um promotor GOS2.

14. Uso de uma construção como definida nas reivindicações 12 ou 13, caracterizado pelo fato de ser para fazer plantas tendo rendimento aumentado de sementes em relação às plantas de controle.

15. Planta, parte de planta, ou célula de planta, caracterizada pelo fato de ser transformada com uma construção como definida nas reivindicações 12 ou 13.

16. Método para a produção de uma planta transgênica tendo rendimento aumentado de sementes em relação às plantas de controle, caracterizado pelo fato de compreender: (i) introduzir e expressar em uma planta ou célula de planta uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; e (ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta.

17. Planta transgênica, caracterizada pelo fato de ter rendimento aumentado de sementes em relação às plantas de controle, dito rendimento aumentado de sementes resultando de expressão aumentada de um ácido nucleico codificando um polipeptídeo TCP de Classe I, ou uma célula de planta transgênica derivada de dita planta transgênica.

18. Planta transgênica de acordo com a reivindicação 17, caracterizada pelo fato de que dito rendimento aumentado de sementes é um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.

19. Planta transgênica de acordo com a reivindicação 11, 15,17 ou 18, caracterizada pelo fato de que dita planta é uma planta de cultivo ou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia, ou uma célula de planta transgênica derivada de dita planta transgênica.

20. Partes colhíveis de uma planta como definida qualquer uma das reivindicações 11, 15, 17, 18, ou 19 caracterizadas pelo fato de que ditas partes colhíveis preferivelmente são sementes.

21. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 19 e/ou de partes colhíveis de uma planta como definida na reivindicação 20.

22. Uso de um ácido nucleico codificando um polipeptídeo TCP de Classe I caracterizado pelo fato de ser para aumentar rendimento de sementes em plantas.

23. Uso de acordo com a reivindicação 22, caracterizado pelo fato de que dito rendimento aumentado de sementes é selecionado a partir de um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.

24. Uso de um ácido nucleico codificando um polipeptídeo TCP de Classe I, caracterizado pelo fato de ser como um marcador molecular.