BRPI0608940A2

BRPI0608940A2 - identificação de uma nova classe de sintases epsp

Info

Publication number: BRPI0608940A2
Application number: BRPI0608940-2A
Authority: BR
Inventors: Nadine Barbara Carozzi; Brian Carr; Philp E Hammer
Original assignee: Athenix Corp
Priority date: 2005-04-08
Filing date: 2006-04-07
Publication date: 2010-02-17
Also published as: US20060253921A1; AR053049A1; US20100144529A1; US20100144530A1; AU2006235263B2; JP4879969B2; AU2006235263A1; EP1871875A2; CN101175850A; WO2006110586A3; US7700842B2; CA2603465A1; MX2007012462A; CA2603465C; NZ563000A; CN101175850B; JP2008535495A; EP2295548A1; WO2006110586A2

Abstract

IDENTIFICAçãO DE UMA NOVA CLASSE DE SINTASES EPSP. A presente invenção refere-se a composições e métodos para conferir tolerância ao glifosato em bactérias, plantas, células, tecidos e sementes de planta. Composições incluem uma nova classe de enzimas EPSPS, designadas Classe III, e polinucleotídeos que codificam tais enzimas, vetores que compreendem esses polinucleotídeos, e células hospedeiras que compreendem os vetores. As novas proteínas compreendem pelo menos um domínio de seqúência selecionado a partir dos domínios Classe III aqui fornecidos. Esses domínios de seqúência podem ser usados para identificar EPSP sintases com atividade de resistência ao glifosato.

Description

Relatório Descritivo da Patente de Invenção para "IDENTIFICA-ÇÃO DE UMA NOVA CLASSE DE SINTASES EPSP".

REFERÊNCIA CRUZADA A PEDIDO DE PATENTE RELACIONADO

Esse pedido de patente reivindica o benefício dos Pedidos depatente Provisórios U.S. N9s 60/669.686, depositado em 8 de abril de 2005;60/678.348 depositado em 6 de maio de 2005; 60/695.193 depositado em 29de junho de 2005; e 60/725.182 depositado em 11 de outubro de 2005, cujosconteúdos estão incorporados aqui por referência em sua totalidade.CAMPO DA INVENÇÃO

A presente invenção refere-se à biologia molecular de planta,particularmente a uma nova classe de EPSP sintases que conferem resis-tência ao herbicida glifosato.ANTECEDENTES DA INVENÇÃO

N-fosfonometilglicina, comumente referida como glifosato, é umimportante agronômico químico. O glifosato inibe a enzima que converte oácido fosfoenolpirúvico (PEP) e ácido 3-fosfoxiquímico (S3P) em ácido 5-enolpiruvil-3-fosfochiquímico. A inibição dessa enzima (5-enolpiruvilchiqui-mato-3-fosfato sintase; referida aqui como "EPSP sintase" ou "EPSPS") ma-ta células de planta por bloquear a via do chiquimato, dessa maneira inibindoa biossíntese de aminoácidos aromáticos.

Já que herbicidas da classe do glifosato inibem a biossíntese deaminoácido aromático, eles não apenas matam células de planta, mas elestambém são tóxicos para células bacterianas. O glifosato inibe várias EPSPsintases bacterianas, e assim é tóxico para essas bactérias. Entretanto, cer-tas EPSP sintases bacterianas tem uma grande tolerância ao glifosato.

Células de planta resistentes a toxicidade do glifosato podem serproduzidas pela transformação de células de planta para expressar EPSPsintases bacterianas resistentes ao glifosato. Notavelmente, o gene bacteri-ano da cepa de Agrobacterium tumefaciens CP4 tem sido usado para confe-rir resistência a herbicida em células de planta após a expressão em plantas.Uma EPSP sintase mutada da cepa de Salmonella typhimurium CT7 confereresistência ao glifosato em células bacterianas e confere resistência ao glifo-sato em células de planta (Patente U.S. NQs 4.535.060; 4.769.061; e 5.094.945).

EPSP sintase (Mr 46.000) se dobra em dois domínios similares,cada um compreendendo três cópias de uma unidade de dobramentopocpccpp (Stallings et al. (1991) Proc. Natl. Acad. Sei. U.S.A. 885046-5050). Lys-22, Arg-124, Asp-313, Arg-344, Arg-386, e Lys-411 são resíduos con-servados da EPSP sintase de E. coli (Schõnbrunn et al. (2001) Proc. Natl.Acad. Sei. U.S.A. 98:1376-1380). Resíduos conservados importantes para aatividade de EPSPS incluem também Arg-100, Asp-242, e Asp-384 (Selva-pandiyan et al. (1995) FEBS Letters 374:253-256). Arg-27 se liga a S3P (Shuttleworth et al. (1999) Biochemistry 38:296-302). Variantes da enzimaEPSPS selvagem que foram isoladas são tolerantes ao glifosato como resul-tado de alterações na seqüência codificante de aminoácidos de EPSPS (Ki-shore & Shah (1988) Annu. fíev. Biochem. 57:627-63; Wang et al. (2003) J.Plant Res. 116:455-60; Eschenburg et al. (2002) Planta 216:129-35). He et al. (2001, Biochim et Biophysica Acta 1568:1-6) desenvolveram EPSP sinta-ses com tolerância aumentada ao glifosato por mutagênese e recombinaçãoentre genes de EPSPS de E. colie Salmonella typhimurium e sugeriram quemutações na posição 42 (T42M) e na posição 230 (Q230K) são provavel-mente responsáveis pela resistência observada. Um trabalho subseqüente (He et al (2003) Biosci. Biotech. Biochem. 67:1405-1409) mostra que a mu-tação T42M (treonina para metionina) é suficiente para melhorar a tolerânciade ambas as enzimas de E.colie Salmonella typhimurium.

Devido às muitas vantagens que a resistência de plantas a her-bicidas fornecem, métodos para identificação de genes resistentes a herbici- da com atividade de resistência ao glifosato são desejáveis.SUMÁRIO DA INVENÇÃO

Composições e métodos são fornecidos para conferir tolerânciaao glifosato em bactérias, plantas, células de planta, tecidos e sementes. Ascomposições incluem uma nova classe de enzimas EPSPS, designada Classe III, e polinucleotídeos que codificam tais enzimas, vetores que com-preendem estes polinucleotídeos e células hospedeiras que compreendemos vetores. As novas proteínas compreendem pelo menos um domínio deseqüência selecionada a partir dos seguintes domínios (domínios Classe III):Domínio I:

L-A-K-G-X1-S-X2-L-X3-G-A-L-K-S-D-D-T (SEQ ID NO: 13), onde X^ denotalisina ou treonina, onde X2 denota arginina ou histidina, onde X3 denota seri- na ou treonina;Domínio Ia:

L-A-K-G-X1, (SEQ ID NO: 14), onde X, denota lisina ou treonina;Domínio Ib:

S-X1-L-X2 (SEQ ID NO: 15), onde Xi denota arginina ou histidina, onde X2 denota serina ou treonina;Domínio Ic:

G-A-L-K-S-D-D-T (SEQ ID NO: 16);Domínio II:

E-P-D-X^Xs-T-F-Xg-V-X^Xs-Xe-G (SEQ ID NO: 17), onde X^ denota ácido15 aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota va-lina ou isoleucina, onde X4 denota treonina ou ácido glutâmico ou lisina, on-de X5 denota serina ou glicina, onde X6 denota glutamina ou serina ou ácidoglutâmico ou treonina;Domínio Ha:

E-P-D-XrX2-T-F-X3-V (SEQ ID NO: 18), onde X^ denota ácido aspártico oualanina, onde X2 denota serina ou treonina, onde X3 denota valina ou isoleu-cina;

Domínio llb:

XrX2-X3-G (SEQ ID NO: 19), onde X, denota treonina ou ácido glutâmico ou lisina, onde X2 denota serina ou glicina, onde X3 denota glutamina ou serinaou ácido glutâmico ou treonina;Domínio III:

flFLTAA (SEQ ID NO: 20);Domínio IV: KfíPI(G/M)P (SEQ ID NO: 21) K-fí-P-l-Xi-P, onde X1 denota glicina ou metionina ou leucina;Domínio V:

XrG-C-P-P-V (SEQ ID NO: 22), onde X, denota treonina ou serina;Domínio VI:

l-G-A-X1-G-Y-X2-D-L-T (SEQ ID NO: 23), onde Xt denota arginina ou lisina ou leucina, e onde X2 denota isoleucina ou valina;Domínio VII:

W-XrV-X2-X3-T-G (SEQ ID NO: 24), onde X^ denota arginina ou lisina, ondeX2 denota alanina ou histidina ou ácido glutâmico ou serina, onde X3 denotaprolina ou alanina; Domínio VIII:

E-P-D-A-S-A-A-T- Y-L-W-XrA-X2-X3-L (SEQ ID NO: 25), onde X^ denotaalanina ou glicina, onde X2 denota ácido glutâmico ou glutamina, onde X3denota valina ou leucina ou alanina;Domínio Vllla: E-P-D-A-S-A-A-T-Y-L-W (SEQ ID NO: 26);Domínio IX:

l-D-XrG (SEQ ID NO: 27), onde X! denota isoleucina ou leucina;Domínio X:

F-XrQ-P-D-A- K-A (SEQ ID NO: 28), onde X^ denota treonina ou serina; Domínio XI:

Xi -F-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-l-P-T-X8-A-V- X9 A-A- F-N (SEQID NO: 29), onde X^ denota glutamina ou lisina ou serina, onde X2 denotaasparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 deno-ta prolina ou glutamina, onde X5 denota treonina ou ácido glutâmico ou vali- na, onde X6 denota valina ou isoleucina, onde X7 denota ácido aspártico ouvalina, onde X8 denota leucina ou isoleucina, onde X9 denota leucina ou iso-leucina;Domínio Xla:

Xi-F-P-X2-X3-X4-A (SEQ ID NO: 30), onde Xt denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ouleucina, onde X4 denota prolina ou glutamina;Domínio Xlb:

XrX2-X3-G-S-Q-M-Q-D-A-l-P-T-X4-A- V- X5A-A- F-N (SEQ ID NO: 31), ondeXi denota treonina ou ácido glutâmico ou valina, onde X2 denota valina ouisoleucina, onde X3 denota ácido aspártico ou valina, onde X4 denota leucina ou isoleucina, onde X5 denota leucina ou isoleucina;

Domínio Xlc:

G-S-Q-M-Q-D-A-l-P-T (SEQ ID NO: 32);

Domínio XII:

P-V-R-F-XrX2-X3-X4-N-L-R-V-K-E-C-D-fl-X5 (SEQ ID NO: 33), onde X, de- nota valina ou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutâmico,onde X5 denota isoleucina ou valina;Domínio Xlla:P-V-R-F (SEQ ID NO: 34); Domínio Xllb:

XrX^Xa-X^N-L-R-V-K-E-C-D-^-Xõ (SEQ ID NO: 35), onde X! denota valinaou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3 denota leu-cina ou isoleucina, onde X4 denota alanina ou ácido glutâmico, onde X5 de-nota isoleucina ou valina; Domínio Xllc:

N-L-R-V-K-E-C-D-fí (SEQ ID NO: 36);

Domínio XIII:

E-G-D-D-L-XrX2 (SEQ ID NO: 37), onde Xi denota leucina ou isoleucina,onde X2 denota valina ou isoleucina; Domínio XIV:

Xi-P-X2-L-A-G (SEQ ID NO: 38), onde Xi denota ácido aspártico ou aspara-gina, onde X2 denota alanina ou serina ou treonina;Domínio XV:

A-XH-D-X2-X3-X4- D-H-R (SEQ ID NO: 39), onde Xi denota leucina ou serina ou ácido glutâmico, onde X2 denota treonina ou serina, onde X3 denota histi-dina ou fenilalanina, onde X4 denota alanina ou serina;Domínio XVI:

F-A-L-A-XrL-K-Xs-Xs-G-l (SEQ ID NO: 40), onde X^ denota glicina ou alani-na, onde X2 denota isoleucina ou valina, onde X3 denota serina ou glicina oualanina ou lisina; Domínio XVIa:

F-A-L-A-XrL-K (SEQ ID NO: 41), onde XA denota glicina ou alanina;Domínio XVIb:

L-K-XrX2-G-l (SEQ ID NO: 42), onde Xi denota isoleucina ou valina, ondeX2 denota serina ou glicina ou alanina ou lisina; e Domínio XVII:

-XrP-X2-C-V-X3-/< (SEQ ID NO: 43), onde Xi denota asparagina ou ácidoaspártico, onde X2 denota alanina ou ácido aspártico, onde X3 denota alaninaou glicina.Domínio XVIII:

XrS-L-G-V (SEQ ID NO: 44), onde Xi denota alanina ou serina ou prolina.

Os domínios descritos acima nas SEQ ID NOS: 13-44 foram i-dentificados pelo alinhamento das seqüências Classe III que compartilhampelo menos 50% de identidade de seqüência. A presença de pelo menos umdesses domínios de seqüências é preditiva de atividade de resistência ao

glifosato. g.

São fornecidas moléculas de ácido nucléico isoladas que cor-respondem a seqüências de ácido nucléico que conferem resistência a umherbicida. Além disso, são abrangidas seqüências de aminoácidos que cor-respondem aos polinucleotídeos. Em particular, a presente invenção fornece

moléculas de ácido nucléico isoladas que compreendem um domínio ClasseIII, incluindo a seqüência de nucleotídeos descrita em SEQ ID NOS: 9, 11,55, 57 e 58, uma seqüência de nucleotídeos que codifica a seqüência deaminoácidos mostrada em SEQ ID NOS: 10, 12, 56 e 59, a seqüência denucleotídeos da resistência a herbicida depositada em um hospedeiro bacte-

riano como NQs de Acesso B-30833 e B-30838, assim como variantes efragmentos dessas. Seqüências de nucleotídeos que são complementares auma seqüência de nucleotídeos da invenção ou que hibridizam a uma se-qüência da invenção também são abrangidas. As seqüências encontram usona construção de vetores de expressão para transformação subseqüente emplantas de interesse, como sondas para o isolamento de outros genes deresistência ao glifosato, como marcadores selecionáveis e similares. As composições também incluem anticorpos para os polipeptí- deos assim como polinucleotídeos sintéticos que codificam polipeptídeos deresistência a um herbicida. As seqüências codificantes podem ser usadasem construtos de DNA ou cassetes de expressão para transformação e ex-pressão em organismos, incluindo microrganismos e plantas. As composi- ções também compreendem bactérias, plantas, células de plantas, tecidos esementes transformadas que são tolerantes ao glifosato pela introdução dascomposições da invenção no genoma do organismo. Onde o organismo éuma planta, a introdução da seqüência permite que herbicidas que contêmglifosato sejam aplicados à cultura para matar seletivamente ervas daninhas sensíveis ao glifosato, mas não o organismo transformado.

Métodos para identificar uma EPSP sintase com atividade deresistência ao glifosato são fornecidos adicionalmemte. Os métodos com-preendem obter uma seqüência de aminoácidos para uma EPSP sintase eidentificar se a seqüência de aminoácidos compreende pelo menos um do- mínio de seqüência da invenção.

As EPSP sintases aqui descritas representam uma nova classede enzimas EPSPS, referidas daqui por diante como enzimas EPSPS Clas-se III.

DESCRIÇÃO DAS fiquraS

A figura 1 mostra um alinhamento de seqüências de aminoáci-

dos de EPSP sintase. Os resíduos conservados que foram identificados co-mo importantes para ligação de substrato e para atividade de EPSPS estãoenquadrados. Os quadrados delineiam as localizações dos aminoácidos dosdomínios de Classe III. Numerais romanos acima dos quadrados correspon- dem aos domínios de Classe III.

DESCRIÇÃO DETALHADA DA INVENÇÃO

A presente invenção é representada por composições e métodospara conferir tolerância a herbicida, particularmente tolerância a glifosato, emorganismos. Os métodos envolvem a transformação de organismos com se-qüências de nucleotídeos que codificam um gene de tolerância ao glifosatoda Classe III. Em particular, a presente invenção reconhece uma classe deenzimas que confere tolerância ao glifosato e seqüências de nucleotídeosque codificam as tais enzimas. As seqüências encontram uso na preparaçãode plantas que mostram tolerância aumentada ao herbicida glifosato. Assim,são fornecidas bactérias, plantas, células de planta, tecidos de planta e se-mentes transformadas.

As enzimas Classe III são caracterizadas por terem pelo menosum domínio selecionado a partir dos domínios listados abaixo, referidos aquicomo domínios Classe III:Domínio I:

L-A-K-G-X^S-Xa-L-Xg-G-A-L-K-S-D-D-T (SEQ ID NO: 13), onde X1 denotalisina ou treonina, onde X2 denota arginina ou histidina, onde X3 denota seri-na ou treonina;Domínio Ia:

L-A-K-GOd, (SEQ ID NO: 14), onde Xi denota lisina ou treonina;Domínio Ib:

S-XrL-X2 (SEQ ID NO: 15), onde X1 denota arginina ou histidina, onde X2denota serina ou treonina;Domínio Ic:

G-A-L-K-S-D-D-T (SEQ ID NO: 16);Domínio II:

E-P-D-X^Xs-T-F-Xa-V-X^Xs-Xe-G (SEQ ID NO: 17), onde X^ denota ácidoaspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota va-lina ou isoleucina, onde X4 denota treonina ou ácido glutâmico ou lisina, on-de X5 denota serina ou glicina, onde X6 denota glutamina ou serina ou ácidoglutâmico ou treonina;Domínio Ma:

Domínio llb:

XrX2-X3-G (SEQ ID NO: 19), onde Xi denota treonina ou ácido glutâmico oulisina, onde X2 denota serina ou glicina, onde X3 denota glutamina ou serina ou ácido glutâmico ou treonina;Domínio III:

fíFLTAA (SEQ ID NO: 20);Domínio IV:

K/?PI(G/M)P (SEQ ID NO: 21) K-fí-P-l-XrP, onde Xt denota glicina ou metionina ou leucina;Domínio V:

XrG-C-P-P-V (SEQ ID NO: 22), onde X, denota treonina ou serina;Domínio VI:

I-G-A-X1-G-Y-X2-D-L-T (SEQ ID NO: 23), onde X1 denota arginina ou lisina ou leucina, e onde X2 denota isoleucina ou valina;Domínio VII:

W-XrV-X2-X3-T-G (SEQ ID NO: 24), onde Xi denota arginina ou lisina, ondeX2 denota alanina ou histidína ou ácido glutâmico ou serina, onde X3 denotaprolina ou alanina; Domínio VIII:

E-P-D-A-S-A-A-T- Y-L-W-XrA-X2-X3-L (SEQ ID NO: 25), onde Xt denotaalanina ou glicina, onde X2 denota ácido glutâmico ou glutamina, onde X3denota valina ou leucina ou alanina;Domínio VIlia: E-P-D-A-S-A-A-T-Y-L-W (SEQ ID NO: 26);Domínio IX:

l-D-XrG (SEQ ID NO: 27), onde X1 denota isoleucina ou leucina;Domínio X:

F-XrQ-P-D-A- K-A (SEQ ID NO: 28), onde X1 denota treonina ou serina; Domínio XI:

XrF-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-l-P-T-X8-A-V- X9A-A- F-N (SEQID NO: 29), onde Xi denota glutamina ou lisina ou serina, onde X2 denotaasparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 deno-ta prolina ou glutamina, onde X5 denota treonina ou ácido glutâmico ou vali-na, onde X6 denota valina ou isoleucina, onde X7 denota ácido aspártico ouvalina, onde X8 denota leucina ou isoleucina, onde X9 denota leucina ou iso-leucina;Domínio Xla:

X1-F-P-X2-X3-X4-A (SEQ ID NO: 30), onde XA denota glutamina ou lisina ouserina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ouleucina, onde X4 denota prolina ou glutamina;Domínio Xlb:

'X1-X2-X3-G-S-Q-M-Q-D-A-I-P-T-X4-A- V- X5A-A- F-N (SEQ ID NO: 31), ondeX1 denota treonina ou ácido glutâmico ou valina, onde X2 denota valina ouisoleucina, onde X3 denota ácido aspártico ou valina, onde X4 denota leucinaou isoleucina, onde X5 denota leucina ou isoleucina;Domínio Xlc:

G-S-Q-M-Q-D-A-l-P-T (SEQ ID NO: 32);Domínio XII:

P-V-R-F-Xi-X2-X3-X4-N-L-R-V-K-E-C-D-fí-X5 (SEQ ID NO: 33), onde X1 de-nota valina ou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutâmico,onde X5 denota isoleucina ou valina;Domínio Xlla:P-V-R-F (SEQ ID NO: 34);Domínio Xllb:

XrXa-Xa-X^N-L-R-V-K-E-C-D-fl-Xs (SEQ ID NO: 35), onde X1 denota valinaou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3 denota leu-cina ou isoleucina, onde X4 denota alanina ou ácido glutâmico, onde X5 de-nota isoleucina ou valina;Domínio Xllc:

N-L-R-V-K-E-C-D-/?(SEQ ID NO: 36);Domínio XIII:

E-G-D-D-L-Xi-X2 (SEQ ID NO: 37), onde X, denota leucina ou isoleucina,onde X2 denota valina ou isoleucina;Domínio XIV:

X1-P-X2-L-A-G (SEQ ID NO: 38), onde X1 denota ácido aspártico ou aspara-gina, onde X2 denota alanina ou serina ou treonina; Domínio XV:

A-Xrl-D-X2-X3-X4- D-H-R (SEQ ID NO: 39), onde Xt denota leucina ou serinaou ácido glutâmico, onde X2 denota treonina ou serina, onde X3 denota histi-dina ou fenilalanina, onde X4 denota alanina ou serina;Domínio XVI:

F-A-L-A-XrL-K-X2-X3-G-l (SEQ ID NO: 40), onde X, denota glicina ou alani-na, onde X2 denota isoleucina ou valina, onde X3 denota serina ou glicina oualanina ou lisina;Domínio XVIa:

F-A-L-A-XrL-K (SEQ ID NO: 41), onde X, denota glicina ou alanina; Domínio XVIb:

L-K-Xi-X2-G-I (SEQ ID NO: 42), onde X, denota isoleucina ou valina, ondeX2 denota serina ou glicina ou alanina ou lisina; eDomínio XVII:

-XrP-X2-C-V-X3-/C (SEQ ID NO: 43), onde X^ denota asparagina ou ácido aspártico, onde X2 denota alanina ou ácido aspártico, onde X3 denota alaninaou glicina.Domínio XVIII:

XrS-L-G-V (SEQ ID NO: 44), onde X1 denota alanina ou serina ou prolina.

Os domínios descritos acima nas SEQ ID NOS: 13-44 foram i- dentifiçados pelo alinhamento de seqüências Classe III que compartilhampelo menos 50% de identidade de seqüência. Em algumas modalidades pelomenos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22,23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32 desses domínios de seqüência estãopresentes.

Usando os métodos da invenção e os domínios identificados,

proteínas adicionais (por exemplo, SEQ ID NOS: 2, 4, 46 e 48) que conferemtolerância ao glifosato podem ser identificadas. Essas proteínas incluem pro-teínas conhecidas assim como as proteínas identificadas recentemente (porexemplo, SEQ ID NOS: 10, 12, 56 e 59).

Por "glifosato" entende-se qualquer forma herbicida de N-fosfo-nometilglicina (incluindo qualquer sal desse) e outras formas que resultam na produção do ânion de glifosato em planta. Uma "proteína de resistência aherbicida", "proteína tolerante a herbicida" ou uma proteína que resulta daexpressão de um polinucleotídeo que codifica a "resistência a herbicida" ou a"tolerância a herbicida" inclui proteínas que conferem a uma célula a habili-dade de tolerar uma concentração de um herbicida maior do que as células que não expressam a proteína ou tolerar uma certa concentração de umherbicida por um período de tempo maior do que as células que não expres-sam a proteína. Uma "proteína resistente ao glifosato" ou uma "proteína tole-rante ao glifosato" inclui uma proteína que confere a uma célula a habilidadede tolerar uma concentração maior de glifosato do que as células que não

expressam a proteína ou tolerar uma certa concentração de glifosato por umperíodo de tempo maior do que as células que não expressam a proteína.Por "tolerar" ou "tolerância" entende-se tanto sobreviver, ou realizar funçõescelulares essenciais tais como síntese de proteína e respiração de uma ma-neira que não é prontamente discernível de células não tratadas. Polinucleotídeos isolados e Variantes e Fragmentos Desses

Um aspecto da invenção diz respeito a polinucleotídeos isoladosdiferentes das seqüências de polinucleotídeos listadas em SEQ ID NOS: 1,3, 7, 45, 47 e 53 que codificam enzimas EPSP sintase que tem pelo menosum domínio de seqüência Classe III da invenção. Por "diferente de" entende-

se que a invenção não inclui as seqüências de polinucleotídeos descritasnas SEQ ID NOS citadas.

Os polinucleotídeos isolados da presente invenção compreen-dem seqüências de nucleotídeos que codificam proteínas e polipeptídeosresistentes a herbicida ou porções biologicamente ativas desses, assim co-

mo polinucleotídeos suficientes para uso como sondas de hibridização paraidentificar polinucleotídeos que codificam resistência a herbicida. Como usa-do aqui, o termo "polinucleotídeo" pretende incluir moléculas de DNA (porexemplo, cDNA ou DNA genômico) e moléculas de RNA (por exemplo, mR-NA) e análogos do DNA ou RNA gerados usando análogos de nucleotídeos.Os polinucleotídeos podem ser de DNA de filamento simples ou de filamentoduplo.

Seqüências de nucleotídeos da invenção incluem aquelas carac-terizadas pelos domínios incluídos acima. A informação usada na identifica-ção desses domínios inclui alinhamento de seqüências de moléculas deEPSP sensíveis ao glifosato. Os alinhamentos de seqüências foram usadospara identificar regiões de homologia entre as seqüências e para identificardomínios Classe III que são característicos de enzimas EPSPS Classe III.

Variantes dos domínios também são abrangidas dentro do esco-po da invenção (por exemplo SEQ ID NO: 55). Tais variantes incluem se-qüências que compartilham pelo menos 90%, pelo menos 95%, 96%, 97%,98% ou 99% de identidade de seqüência e estão contidas em uma moléculade DNA que confere tolerância ao glifosato.

Um polinucleotídeo ou proteína "isolada" ou "purificada" ou umaporção biologicamente ativa desses, é substancialmente livre de outro mate-rial celular ou meio de cultura quando produzido por técnicas recombinantes,ou substancialmente livre de precursores químicos ou outros químicosquando sintetizado quimicamente. Preferivelmente, um polinucleotídeo "iso-lado" é livre de seqüências (por exemplo, seqüências que codificam proteí-na) que flanqueiam naturalmente o polinucleotídeo (isto é, seqüências locali-zadas nas extremidades 5' e 3' do polinucleotídeo) no DNA genômico doorganismo a partir do qual o polinucleotídeo é derivado. Para os propósitosda invenção, "isolado" quando usado para se referir a polinucleotídeos excluicromossomos isolados. Por exemplo, em várias modalidades, o polinucleotí-deo isolado que codifica resistência ao glifosato pode conter menos do quecerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb ou 0,1 kb de seqüência de nu-cleotídeos que flanqueiam naturalmente o polinucleotídeo no DNA genômicoda célula a partir da qual o polinucleotídeo é derivado. Uma proteína resis-tente ao glifosato que é substancialmente livre de material celular inclui pre-parações de proteína que tem menos do que 30%, 20%, 10% ou 5% (porpeso seco) de proteína de resistência a não-herbicida (também referidasaqui como "proteína contaminante").

Polinucleotídeos que são fragmentos dessas seqüências de nu-cleotídeos que codificam resistência a herbicida também são abrangidospela presente invenção (por exemplo, SEQ ID NOS: 57, 58 e 60). Por "frag-mento" entende-se uma porção da seqüência de nucleotídeo que codificauma proteína resistente a herbicida (por exemplo, SEQ ID NO: 59). Umfragmento de uma seqüência de nucleotídeos pode codificar uma porçãobiologicamente ativa de uma proteína de resistência a herbicida ou ela podeser um fragmento que pode ser usado como uma sonda de hibridização ouiniciador de PCR usando os métodos descritos abaixo. Os polinucleotídeosque são fragmentos de uma seqüência de nucleotídeos de resistência a her-bicida compreendem pelo menos cerca de 15, 20, 50, 75, 100, 200, 300,350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050,1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650,1700, 1750, 1800, 1850, 1900, 1950 nucleotídeos contíguos ou até o númerode nucleotídeos presentes em uma seqüência de nucleotídeos de extensãocompleta que codifica resistência a herbicida descrita aqui. Por nucleotídeos"contíguos" entende-se resíduos de nucleotídeos que são imediatamenteadjacentes urrf ao outro.

Fragmentos das seqüências de nucleotídeos da presente inven-ção geralmente compreenderão pelo menos um dos domínios Classe III aquidescritos e codificarão fragmentos de proteína que retém a atividade biológi-ca da proteína de resistência ao glifosato de extensão completa; isto é, ativi-dade de resistência a herbicida. Por "retém a atividade de resistência a umherbicida" entende-se que o fragmento terá pelo menos cerca de 30%, pelomenos cerca de 50%, pelo menos cerca de 70% ou pelo menos cerca de80% da atividade de resistência a um herbicida da proteína de resistência aoglifosato de extensão completa descrita aqui como SEQ ID NO: 6. Métodospara medir a atividade de resistência a um herbicida são bem-conhecidas natécnica. Veja, por exemplo, Patentes U.S. N-s 4.535.060 e 5.188.642, cadauma das quais está incorporada aqui por referência em sua totalidade.Um fragmento de uma seqüência de nucleotídeos que codificaresistência a um herbicida que codifica uma porção biologicamente ativa deuma proteína da invenção codificará pelo menos 15, 25, 30, 50, 75, 100,125, 150, 175, 200, 250, 300, 350, 400 aminoácidos contíguos ou até o nú-mero total de aminoácidos presentes em uma proteína de resistência aoherbicida de extensão completa da invenção. De forma importante, o frag-mento compreenderá pelo menos um dos domínios Classe III descritos aqui.

Proteínas resistentes a herbicida da presente invenção são a-quelas caracterizadas como Classe III ou fragmentos ou variantes dessasque retém atividade. O termo "suficientemente idênticas" é pretendido signi-ficar uma seqüência de aminoácidos ou nucleotídeos que tem pelo menoscerca de 60% ou 65% de identidade de seqüência, pelo menos cerca de70% ou 75% de identidade de seqüência, pelo menos cerca de 80% ou 85%de identidade de seqüência ou pelo menos cerca de 90%, 91%, 92%, 93%,94%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência comparadacom uma seqüência de referência usando um dos programas de alinhamen-to aqui descritos usando parâmetros padronizados. Um versado na técnicareconhecerá que esses valores podem ser apropriadamente ajustados paradeterminar a identidade correspondente de proteínas codificadas por duasseqüências de nucleotídeos levando em consideração a degeneração decódon, similaridade de aminoácidos, posicionamento da fase de leitura esimilares.

Para determinar o percentual de identidade de duas seqüênciasde aminoácidos ou de dois polinucleotídeos, as seqüências são alinhadascom o propósito de comparação ótima. O percentual de identidade entre asduas seqüências é uma função do número de posições idênticas comparti-lhadas pelas seqüências (isto é, percentual de identidade = número de posi-ções idênticas/número total de posições (por exemplo, posições superpos-tas) x 100). Em uma modalidade, as duas seqüências têm a mesma exten-são. O percentual de identidade entre as duas seqüências pode ser determi-nado usando técnicas similares àquelas descritas abaixo, com ou sem per-mitir intervalos. No cálculo de percentual de identidade, tipicamente são con-tadas combinações exatas.

A determinação do percentual de identidade entre duas seqüên-cias pode ser obtida usando um algoritmo matemático. Um exemplo não limi-tante de um algoritmo matemático utilizado para a comparação de duas se- qüências é o algoritmo de Karlin & Altschul (1990) Proc. Natl. Acad. Sei. USA87:2264-2268, modificado como em Karlin & Altschul (1993) Proc. Natl. A-cad. Sei. USA 90:5873-5877. Tal algoritmo está incorporado nos programasBLASTN BLASTX de Altschul et ai. (1990) J. Mol. Biol. 215:403-410. Aspesquisas de nucleotídeo BLAST podem ser realizadas com o programa

BLASTN, "score" = 100, "wordlenght" = 12, para se obter seqüências de nu-cleotídeos homólogas aos polinucleotídeos semelhantes a GDC da inven-ção. As pesquisas de proteína BLAST podem ser realizadas com o progra-ma BLASTX, "score" = 50, "wordlenght" = 3, para se obter seqüências deaminoácidos homólogas as moléculas de proteína de resistência a herbicida da invenção. Para se obter alinhamentos com intervalos para fins de compa-ração, Gapped BLAST pode ser utilizado como descrito em Altschul et al.(1997) Nucleic Acids Res. 25:3389-2402. Alternativamente, PSI-Blast podeser usado para realizar uma pesquisa repetida que detecte relações distan-tes entre as moléculas. Veja Altschul et al. (1997) supra. Quando se utiliza os programasèBLAST, Gapped BLAST e PSI-Blast, os parâmetros padrãodos respectivos programas (por exemplo, BLASTX e BLASTN) podem serusados. Veja www.ncbi.nlm.nih.gov. Outro exemplo não limitante de um al-goritmo matemático utilizado para a comparação de seqüências é o algorit-mo ClustalW (Higgins et aí. (1994) Nucleic Acid Res. 22:4673-4680). Clus- talW compara seqüências e alinha a totalidade da seqüência dos aminoáci-dos ou DNA e assim pode fornecer dados sobre a conservação de seqüên-cia da seqüência de aminoácidos inteira. O algoritmo ClustalW é usado emdiversos pacotes de programas de análise de DNA/ aminoácidos disponíveiscomercialmente, tais como o módulo ALIGNX do Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, CA). Após o alinhamento das seqüênciasde aminoácidos com ClustalW, o percentual de identidade de aminoácidospode ser obtido. Um exemplo não limitante de um programa útil para análisedos alinhamentos de ClustalW é GENEDOC®. GENEDOC® (Karl Nicholas)permite a determinação de similaridade e identidade de aminoácido (ouDNA) entre várias proteínas. Outro exemplo não limitante de um algoritmomatemático utilizado para a comparação de seqüências é o algoritmo deMyers e Miller (1988) CABIOS 4;11 -17. Tal algoritmo está incorporado noprograma ALIGN (versão 2.0), que é parte do pacote de programas de ali-nhamento de seqüência GCG (disponibilizado por Accelrys, Inc., San Diego,CA). Quando se utiliza o programa ALIGN para a comparação de seqüên-cias de aminoácidos, uma tabela de resíduo de peso PAM120, um "gap len-ght "penalty" de 12 e um gap "penalty" de 4.

A menos que estabelecido de outra maneira, GAP Versão 10,que usa o algoritmo de Needleman e Wunsch (1970) J. Mol. Biol. 48(3):443-453, será usado para determinar a identidade ou similaridade usando os se-guintes parâmetros: % de identidade e % de similaridade de uma seqüênciade nucleotídeos usando "GAP Weight de 50" e "Lenght Weight" de 3, e amatriz de pontuação nwsgapdna.cmp; % de identidade ou % de similaridadepara uma seqüência de aminoácidos usando GAP weight de 8 e lenght wei-ght de 2 e o programa de pontuação BLOSUM62. Programas equivalentestambém podem ser usados. Por "programa equivalente" é entendido qual-quer programa de comparação de seqüência que, para quaisquer duas se-qüências em questão, gera um alinhamento que tem combinações de resí-duo de nucleotídeo idênticas e um percentual de identidade de seqüênciaidêntico quando comparado ao alinhamento correspondente gerado peloGAP Versão 10. A invenção também abrange polinucleotídeos variantes."Variantes" das seqüências de nucleotídeos que codificam resistência a her-bicida incluem aquelas seqüências que codificam a proteína resistente aherbicida descrita aqui mas que diferem conservativamente devido a dege-neração do código genético, assim como aquelas que são suficientementeidênticas como discutido acima. Variantes alélicas que ocorrem naturalmentepodem ser identificadas com o uso de técnicas de biologia molecular bem-conhecidas, tais como reação em cadeia da polimerase (PCR) e técnicas dehibridização como delineado abaixo. Seqüências de nucleotídeo variantestambém incluem aquelas seqüências de nucleotídeos derivadas sintetica-mente que foram geradas, por exemplo, pelo uso de mutagênese direciona-da ao sítio mas que ainda codificam as proteínas de resistência a herbicidadescritas na presente invenção como discutido abaixo. As proteínas varian-tes abrangidas pela presente invenção são biologicamente ativas, isso é,elas retém a atividade biológica desejada da proteína nativa, isso é, a ativi-dade de resistência ao herbicida. Por "retém a atividade de resistência aoherbicida" entende-se que a variante terá pelo menos cerca de 30%, pelomenos cerca de 50%, pelo menos cerca de 70% ou pelo menos cerca de80% da atividade de resistência ao herbicida da proteína nativa. Métodospara medir a atividade de resistência ao herbicida são bem-conhecidos natécnica. Veja, por exemplo, Patentes U.S. N9s 4.535.060 e 5.188.642, cadauma das quais está incorporada aqui por referência em sua totalidade.

O versado ainda apreciará que as alterações podem ser introdu-zidas por mutação nas seqüências de nucleotídeos da invenção levandodessa maneira a alterações na seqüência de aminoácidos das proteínas deresistência ao herbicida codificadas, sem alterar a atividade biológica dasproteínas. Assim, polinucleotídeos variantes isolados podem ser criados pelaintrodução de uma ou mais substituições, adições ou deleções de nucleotí-deos na seqüência de nucleotídeos correspondente aqui descrita, tal queuma ou mais substituições, adições ou deleções de aminoácidos são intro-duzidas na proteína codificada. Mutações podem ser introduzidas por técni-cas padronizadas, tais como mutagênese direcionada ao sítio e mutagênesemediada por PCR. Tais seqüências variantes de nucleotídeos são tambémabrangidas pela presente invenção.

Por exemplo, substituições conservativas de aminoácidos po-dem ser feitas em um ou mais resíduos de aminoácidos preditos, não es-senciais. Um resíduo de aminoácido "não essencial" é um resíduo que podeser alterado a partir da seqüência selvagem de uma proteína de resistênciaao herbicida sem alterar a atividade biológica, enquanto que um resíduo deaminoácido "essencial" é necessário para a atividade biológica. Uma "substi-tuição conservativa de aminoácido" é uma na qual o resíduo de aminoácidoé substituído por outro resíduo de aminoácido que tem uma cadeia lateralsimilar. Famílias de resíduos de aminoácidos que têm cadeias laterais simi-lares foram bem-definidas na técnica. Essas famílias incluem aminoácidoscom cadeias laterais básicas (por exemplo, lisina, arginina, histidina), cadei-as laterais ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeiaslaterais polares não carregadas (p;ex., glicina, asparagina, glutamina, serina,treonina, tirosina, cisteína), cadeias laterais não polares (por exemplo, alani-na, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano),cadeias laterais beta-ramificadas (por exemplo, treonina, valina, isoleucina) ecadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, triptofano,histidina). Substituições de aminoácidos podem ser feitas em regiões nãoconservadas que retém função. Em geral, tais substituições não deveriamser feitas para resíduos de aminoácidos conservados ou para resíduos deaminoácidos que residem dentro de um motivo conservado, onde tais resí-duos são essenciais para atividade da proteína. Entretanto, um versado natécnica poderá compreender que variantes funcionais podem ter alteraçõesconservadas ou não conservadas menores nos resíduos conservados.

Alternativamente, seqüências variantes de nucleotídeos podemser feitas pela introdução de mutações aleatoriamente ao longo ou em parteda seqüência codificante, tal como por mutagênese de saturação, e os mu-tantes resultantes podem ser rastreados quanto a habilidade de conferir ati-vidade de resistência a um herbicida para identificar mutantes que retém aatividade. Após a mutagênese, a proteína codificada pode ser expressa re-combinantemente e a atividade da proteína pode ser determinada usandotécnicas de ensaio padronizadas.

Usando métodos tais como PCR, hibridização e similares se-qüências de resistência a herbicida correspondentes podem ser identificadaspela procura dos domínios conservados da invenção. Veja, por exemplo,Sambrook & Russell (2001) Molecular Cloning: A Laboratory Manual (ColdSpring Harbor Laboratory Press, Cold Spring Harbor, NY) e Innis et ai,(1990) PCR Protocols: A Guide to Methods and Applications (AcademicPress, St. Louis, MO).

Em um método de hibridização, toda ou parte da seqüência donucleotídeo de resistência a herbicida ou um domínio pode ser usado pararastrear bibliotecas de cDNA ou genômicas. Métodos para construção detais bibliotecas de cDNA e genômicas são comumente conhecidas na técni-ca e estão descritos em Sambrook & Russell, 2001, supra. As assim chama-das sondas de hibridização podem ser fragmentos de DNA genômico, frag-mentos de cDNA, fragmentos de RNA ou outros oligonucleotídeos e podemser marcadas com um grupo detectável tal como 32P ou qualquer outro mar-cador detectável, tais como radioisótopos, um composto fluorescente, umaenzima ou um co-fator de enzima. Sondas para hibridização podem ser fei-tas pela marcação de oligonucleotídeos sintéticos com base na seqüênciade nucleotídeo que codifica resistência ao herbicida conhecida aqui descrita.Iniciadores degenerados desenhados com base nos nucleotídeos conserva-dos ou resíduos de aminoácido na seqüência de nucleotídeos ou seqüênciade aminoácidos codificada podem ser adicionalmente usados. A sonda com-preende tipicamente uma região de seqüência de nucleotídeos que se hibri-diza sob condições estringentes a pelo menos cerca de 12, a pelo menoscerca de 25 ou pelo menos cerca de 50, 75, 100, 125, 150, 175, 200, 250,300, 350, 400f500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 1800 nu-cleotídeos consecutivos de uma seqüência de nucleotídeos que codifica re-sistência a herbicida da invenção ou um fragmento ou variante dessa. Méto-dos para o preparo de sondas para hibridização são geralmente conhecidosna técnica e estão descritos em Sambrook & Russell, 2001, supra e Sam-brook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., ColdSpring Harbor Laboratory Press, Cold Spring Harbor, New York), ambos osquais estão incorporados aqui por referência.

A hibridização de tais seqüências pode ser realizada sob condi-ções estringentes. Por "condições estringentes" ou "condições estringentesde hibridização" entende-se condições sob as quais uma sonda hibridizará asua seqüência alvo em um grau detectavelmente maior do que a outras se-qüências (por exemplo, pelo menos 2 vezes sobre o basal). Condições es-tringentes são dependentes da seqüência e serão diferentes em circunstân-cias diferentes. Pelo controle da estringência da hibridização e/ou das condi-ções de lavagem, as seqüências alvo que são 100% complementares a son-da podem ser identificadas (sondagem homóloga). Alternativamente, condi-ções de estringência podem ser ajustadas para permitir alguns pareamentoserrados nas seqüências tal que graus menores de similaridade sejam detec-tados (sondagem heteróloga). Geralmente, uma sonda é menor do que cer-ca de 1000 nucleotídeos de extensão ou menor do que 500 nucleotídeos emextensão.

Tipicamente, condições estringentes serão aquelas nas quais aconcentração de sal é menor do que cerca de 1,5 M de íon Na, tipicamentecerca de 0,01 a 1,0 M de concentração de íon Na (ou outros sais) em pH 7.0a 8.3 e a temperatura é de pelo menos cerca de 309C para sondas curtas(por exemplo, 10 a 50 nucleotídeos) e pelo menos cerca de 60eC para son-das longas (por exemplo, maior do que 50 nucleotídeos). Condições estrin-gentes também podem ser obtidas com a adição de agentes desestabilizan-tes tais como formamida. Condições de baixa estringência exemplares inclu-em hibridização com uma solução tampão de formamida 30 a 35% , NaCI 1M, SDS (dodecil sulfato de sódio) 1% a 37QC e uma lavagem em SSC 1X a2X (SSC 20X = NaCI 3,0 M / citrato de trisódio 0,3 M) a 50 a 55°C. Condi-ções de estringência moderada exemplares incluem hibridização em forma-mida 40 a 45%, NaCI 1,0 M, SDS 1% a 37°C, e uma lavagem em SSC 0,5Xa 1X em 55 a 60°C. Condições de alta estringência exemplares incluem hi-bridização em formamida 50%, NaCI 1 M, SDS 1% a 37°C, e uma lavagemem SSC 0,1X em 60 a 65°C. Opcionalmente, os tampões de lavagem podemcompreender cerca de 0,1% a cerca de 1% de SDS. A duração da hibridiza-ção geralmente é menor do que 24 horas, comumente cerca de 4 a cerca de12 horas.

Especificidade é tipicamente a função das lavagens pós-hibridização, os fatores críticos sendo a força iônica e a temperatura da so-lução final de lavagem. Para híbridos de DNA-DNA, a Tm pode ser aproxi-mada a partir da equação de Meinkoth e Wahl (1984) Anal. Biochem.138:267-284: Tm = 81,5°C + 16,6 (log M) + 0,41 (%GC) - 0,61 (% form) -500/L; onde M é a molaridade de cátions monovalentes, %GC é a porcenta-gem de nucleotídeos guanosina e citosina no DNA, % form é o percentual deformamida na solução de hibridização e L é a extensão do híbrido em pares5 de base. A Tm é a temperatura (sob força iônica e pH definidos) na qual 50%de uma seqüência alvo complementar hibridiza com uma sonda perfeitamen-te pareada. A Tm é reduzida em cerca de 19C para cada 1% de pareamentoerrado; assim, Tm, condições de hibridização e/ou lavagem podem ser ajus-tadas para hibridizar seqüências da identidade desejada. Por exemplo, se

10 seqüências com > 90% de identidade são buscadas, o Tm pode ser diminuí-do em 109C. Geralmente, condições estringentes são selecionadas para se-rem cerca de 59C menores do que o ponto de fusão térmica (Tm) para a se-qüência específica e seu complemento em uma força iônica e pH definidos.Entretanto, condições severamente estringentes podem utilizar uma hibridi-

15 zação e/ou lavagem 1, 2, 3 ou 49C menores do que o ponto de fusão térmica(Tm); condições moderadamente estringentes podem utilizar uma hibridiza-ção e/ou lavagem a 6, 7, 8, 9 ou 109C menores do que o ponto de fusãotérmica (Tm); condições de baixa estringência podem utilizar uma hibridiza-ção e/ou lavagem 11, 12, 13, 14, 15 ou 20QC menores do que o ponto de

20 fusão térmica ftm). Usando a equação, composições de hibridização e lava-gem eoTm desejado aqueles versados na técnica entenderão que variaçõesna estringência de hibridização e/ou soluções de lavagem estão inerente-mente descritas. Se o grau desejado de pareamentos errados resulta em umTm de menos do que 459C (solução aquosa) ou 329C (solução de formami-

25 da), é preferido aumentar a concentração de SSC tal que uma temperaturamais elevada possa ser usada. Um guia extenso para a hibridização de poli-nucleotídeos é encontrado em Tijssen (1993) Laboratory Techniques in Bio-chemistry and Molecular Biology - Hybridization with Nucleic Acid Probes,Parte I, Capítulo 2 (Elsevier, Nova Iorque); e Ausubel et ai, eds. (1995) Cur-

30 rent Protocols in Molecular Biology, Capítulo 2 (Greene Publishing & Wiley-Interscience, Nova Iorque). Veja Sambrook et ai (1989) Molecular Cloning: ALaboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold S-pring Harbor, NY).

Proteínas Isoladas e Variantes e Fragmentos Dessas

Proteínas de resistência a herbicida também são abrangidasdentro da presente invenção. Por "proteína de resistência a herbicida" en-tende-se uma proteína Classe III que tem pelo menos um dos domínios des-critos acima, incluindo, por exemplo, SEQ ID NOS: 10, 12, 56 e 59. Frag-mentos, porções biologicamente ativas e variantes dessas também são for-necidos e podem ser usados para praticar os métodos da presente invenção.

"Fragmentos" ou "porções biologicamente ativas" incluem frag-mentos de polipeptídeo que compreende uma porção de uma seqüência deaminoácidos que codifica uma proteína de resistência a herbicida e que re-tém a atividade de resistência ao herbicida. Uma porção biologicamente ati-va de uma proteína de resistência a herbicida pode ser um polipeptídeo quetem, por exemplo, 10, 25, 50, 100 ou mais aminoácidos de extensão. Taisporções biologicamente ativas podem ser preparadas por técnicas recombi-nantes e avaliadas quanto a resistência ao herbicida. Métodos para medir aatividade de resistência ao herbicida são bem-conhecidos na técnica. Veja,por exemplo, Patentes U.S. Nes 4.535.060 e 5.188.642, cada uma das quaisestá incorporada aqui por referência em sua totalidade.Pof "variantes" entende-se proteínas ou polipeptídeos que tem

uma seqüência de aminoácidos que é pelo menos cerca de 60%, 65%, cercade 70%, 75%, cerca de 80%, 85%, ou pelo menos cerca de 90%, 91%, 92%,93%, 94%, 95%, 96%, 97%, 98% ou 99% idêntica a uma enzima Classe III.Variantes também incluem polipeptídeos codificados por um polinucleotídeo

que hibridiza ao polinucleotídeo que codifica uma enzima Classe III ou umcomplemento dessa, sob condições estringentes. Variantes incluem polipep-tídeos que diferem na seqüência de aminoácidos devido a mutagênese. Pro-teínas variantes abrangidas pela presente invenção são biologicamente ati-vas, ou seja continuam a possuir a atividade biológica desejada da proteína

nativa que é reter a atividade de resistência ao herbicida. Métodos para me-dir a atividade de resistência ao herbicida são bem-conhecidos na técnica.Veja, por exemplo, Patentes U.S. Nes 4.535.060 e 5.188.642, cada uma dasquais está incorporada aqui por referência em sua totalidade.

Genes de bactérias quase sempre possuem múltiplos códons deiniciação de metionina na proximidade do início da fase aberta de leitura.Muitas vezes a iniciação da tradução em um ou mais desses códons de par-tida levarão a geração de uma proteína funcional. Esses códons de partidapodem incluir códons ATG. Entretanto, bactérias tais como Bacillus sp. tam-bém reconhecem o códon GTG como um códon de partida e proteínas queiniciam a tradução em códons GTG contêm uma metionina no primeiro ami-noácido. Além disso, muitas vezes não é determinado a priori quais dessescódons são usados naturalmente na bactéria. Dessa forma, é compreendidoque o uso de um dos códons de metionina alternados pode levar a geraçãode variantes que conferem resistência ao herbicida (por exemplo, SEQ IDNO: 59 codificada pela SEQ ID NO: 58). Essas proteínas de resistência aherbicida são abrangidas na presente invenção e podem ser usadas nosmétodos da presente invenção.

Anticorpos para os polipeptídeos da presente invenção ou paravariantes ou fragmentos desses também são abrangidos. Métodos para pro-duzir anticorpos são bem-conhecidos na técnica (veja, por exemplo, Harlow& Lane (1988) Antibodies: A Laboratory Manual, Cold Spring Harbor Labora-tory, Cold Spring Harbor, N.Y.; Patente U.S. Ne 4.196.265).Transformação de Células Bacterianas e de Plantas

A transformação de células bacterianas pode ser obtida por umadas várias técnicas conhecidas na técnica, não limitadas a eletroporaçao outransformação química (Veja, por exemplo, Ausubel (Ed.) (1994) CurrentProtocols in Molecular Biology, John Wiley and Sons, Inc., Indianápolis, IN).Marcadores que conferem resistência a substâncias tóxicas são úteis na i-dentificação de células transformadas (que incorporaram e expressaram oDNA de teste) das células não transformadas (aquelas que não contém ounão expressam o DNA de teste). Em um aspecto da invenção, genes sãoúteis como um marcador para identificar a transformação de células bacteri-anas ou de planta.

A transformação de células de planta pode ser obtida de umamaneira similar. Por "planta" entende-se plantas completas, órgãos de plan-tas (por exemplo, folhas, caules, raízes, etc), sementes, células de planta,propágulos, embriões e progênie das mesmas. Células de planta podem serdiferenciadas ou indiferenciadas (por exemplo, calos, suspensões de culturade células, protoplastos, células de folha, células da raiz, células de floema,pólen). "Plantas transgênicas" ou "plantas transformadas" ou plantas ou célu-las ou tecidos "estavelmente transformados" se referem a plantas que incor-poraram ou integraram seqüências de polinucleotídeos exógenos ou frag-mentos de DNA na célula da planta. Por "transformação estável" é pretendi-do que o construto de nucleotídeo introduzido em uma planta se integre nogenoma da planta e seja capaz de ser herdado pela progênie dessa.

Os genes da invenção podem ser modificados para se obter ouaumentar a expressão em células de plantas. As seqüências de resistênciaao herbicida da invenção podem ser fornecidas em cassetes de expressãopara expressão na planta de interesse. "Cassete de expressão em planta"inclui construtos de DNA que são capazes de resultar na expressão de umaproteína a partir de uma fase aberta de leitura em uma célula de planta. Ocassete incluirá na direção de transcrição 5'-3', uma região de iniciação datranscrição (isto é, um promotor) operativamente ligado a uma seqüência deDNA da invenção e uma região de terminação da transcrição ou da tradução(isto é, região de terminação) funcional em plantas. Em algumas modalida-des, a região de iniciação da transcrição causará a produção de uma se-qüência de RNA que permite expressão suficiente da enzima EPSPS codifi-cada para aumentar a tolerância ao glifosato de uma célula de planta trans-formada com o polinucleotídeo. Por "expressão suficiente" é pretendido quea região de iniciação da transcrição fornecerá a expressão de uma quantida-de de polipeptídeo resistente ao glifosato da invenção (por exemplo, aquelesque contêm um domínio Classe III) que conferirá a planta ou célula a habili-dade de tolerar uma concentração de glifosato maior do que plantas ou célu-las que não contém ou não expressam a proteína, ou tolerar uma certa con-centração de glifosato por um tempo maior do que plantas ou células quenão contém ou não expressam a proteína.O cassete pode, além disso, conter pelo menos um gene adicio-nal a ser co-transformado no organismo, tal como um gene marcador sele-cionável. Alternativamente, o(s) gene(s) adicional(is) pode(m) ser forneci-do(s) em cassetes de expressão múltiplos. Tal cassete de expressão é for-necido com uma pluralidade de sítios de restrição para inserção da seqüên-cia de resistência ao herbicida para estar sob a regulação transcricional dasregiões regulatórias.

O promotor pode ser nativo ou análogo, ou estranho ou heteró-logo, a planta hospedeira e/ou a seqüência de DNA da invenção. Além dis-so, o promotor pode ser a seqüência natural ou alternativamente uma se-qüência sintética. Onde o promotor é "nativo" ou "homólogo" à planta hospe-deira, é pretendido que o promotor seja encontrado na planta nativa na qualo promotor é introduzido. Onde o promotor é "estranho" ou "heterólogo" àseqüência de DNA da invenção, é pretendido que o promotor não seja opromotor nativo ou de ocorrência natural para a seqüência de DNA operati-vamente ligada da invenção. "Heterólogo" geralmente se refere a seqüênciasde polinucleotídeos que não são endógenas da célula ou parte do genomanativo no qual eles estão presentes, e que foram adicionados à célula porinfecção, transfecção, microinjeção, eletroporação, microprojeção ou seme-lhantes. Por "operativamente ligado" entende-se uma ligação funcional entreum promotor e uma segunda seqüência, em que a seqüência promotora ini-cia e media a transcrição da seqüência de DNA que corresponde a segundaseqüência. Geralmente, operativamente ligado significa que as seqüênciasde polinucleotídeos a serem ligadas são contíguas e, onde necessário juntarduas regiões codificantes de proteína, contíguas e na mesma fase de leitura.

Freqüentemente, tais construtos também conterão regiões 5' e 3'não traduzidas. Tais construtos podem conter uma "seqüência de sinal" ouuma "seqüência líder" para facilitar o transporte co-traducional ou pós-tra-ducional do peptídeo de interesse para certas estruturas intracelulares deinteresse tais como cloroplastos (ou outro plastídeo), retículo endoplasmáti-co ou aparelho de Golgi ou para ser secretado. Por exemplo, o gene podeser manipulado para conter um peptídeo de sinal para facilitar a transferên-cia do peptídeo para o retículo endoplasmático. Por "seqüência de sinal" en-tende-se uma seqüência que é conhecida ou suspeita de resultar em trans-porte de peptídeo co-traducional ou pós-traducional através da membranacelular. Em eucariotos, isso envolve tipicamente a secreção no aparelho deGolgi, com alguma glicosilaçao resultante. Por "seqüência líder" entende-sequalquer seqüência que quando traduzida, resulta em uma seqüência deaminoácidos suficiente para desencadear o transporte co-traducional da ca-deia de peptídeo para uma organela subcelular. Assim, isso inclui seqüên-cias líderes que desencadeiam transporte e/ou glicosilaçao pela passagemno retículo endoplasmático, passagem para vacúolos, plastídeos incluindocloroplastos, mitocôndria e similares. O cassete de expressão em plantatambém pode ser manipulado para conter um íntron, tal que mRNA que pro-cessando do íntron seja necessário para expressão.

Por "região 3' não traduzida" entende-se uma seqüência de nu-cleotídeo localizada a jusante de uma seqüência codificante. Seqüências desinal de poliadenilação (por exemplo, nucleotídeos poliadenilados) e outrasseqüências que codificam sinais regulatórios capazes de afetar a adição detratos de ácido poliadenílico à extremidade 3' do mRNA precursor são regi-ões 3' não traduzidas. Por "região 5' não traduzida" entende-se uma se-qüência de nuõíeotídeo localizada a montante de uma seqüência codificante.

Outros elementos não traduzidos a montante e a jusante incluemintensificadores. Intensificadores são seqüências de nucleotídeos que agempara aumentar a expressão de uma região promotora. Intensificadores sãobem-conhecidos na técnica e incluem, mas não são limitados a região inten-sificadora de SV40 e o elemento intensificador 35S.

A região de terminação pode ser nativa com a região de inicia-ção da tradução, pode ser nativa com a seqüência de resistência ao herbici-da da presente invenção ou pode ser derivada de outra fonte. Regiões determinação convenientes estão disponíveis no plasmídeo Ti de A. tumefaci-ens, tais como as regiões de terminação da octopina sintase e nopalina sin-tase. Veja também Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144;Proudfoot (1991) Cell 64:671 -674; Sanfacon et al. (1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell 2:1261 -1272; Munroe et al. (1990) Gene91:151-158; Bailas et al. (1989) Nucleic Acids Res. 17:7891-7903; e Joshi eíal. (1987) Nucleic Acid Res. 15:9627-9639.

Onde apropriado, o(s) gene(s) pode(m) ser otimizado(s) para aumentar a expressão na célula hospedeira transformada. Ou seja, os genespodem ser sintetizados usando os códons preferidos da célula hospedeirapara expressão melhorada, ou podem ser sintetizados usando códons emuma freqüência de uso de códons preferido do hospedeiro. Geralmente oconteúdo de GC do gene estará aumentado. Veja, por exemplo, Campbell e

Gowri (1990) Plant Physiol. 92:1-11 para uma discussão sobre o uso de có-dons preferido do hospedeiro. Métodos são conhecidos na técnica para sin-tetizar os genes preferidos do hospedeiro. Veja, por exemplo, Patentes U.S.Nss 6.320.100; 6.075.185; 5.380.831; e 5.436.391. Pedido Publicado U.S.Nes 20040005600 e 20010003849, e Murray et al. (1989) Nucleic Acids Res.

17:477-498, aqui incorporados por referência.

Em uma modalidade, os polinucleotídeos de interesse são dirigi-dos para o cloroplasto para expressão. Dessa maneira, onde o polinucleotí-deo de interesse não está diretamente inserido no cloroplasto, o cassete deexpressão conterá adicionalmente um polinucleotídeo que codifica um peptí-

deo de trânsito para direcionar o produto de gene de interesse para os clo-roplastos. Tais peptídeos de transito são conhecidos na técnica. Veja, porexemplo, Von Heijne et al. (1991) Plant Mol. Biol. Rep. 9:104-126; Clark etal. (1989) J. Biol. Chem. 264:17544-17550; Della-Cioppa et al. (1987) PlantPhysiol. 84:965-968; Romer et al. (1993) Biochem. Biophys. Res. Commun.

196:1414-1421; e Shah et al. (1986) Science 233:478-481. Em algumas mo-dalidades, os polinucleotídeos da invenção codificam um polipeptídeo defusão que compreende um peptídeo de trânsito de cloroplasto na terminaçãoamino e a enzima EPSPS. Um "polipeptídeo de fusão" pode ser gerado, porexemplo, pela remoção do códon de parada da seqüência de polinucleotídeo

que codifica um primeiro polipeptídeo, então acrescentar a seqüência depolinucleotídeo que codifica um segundo polipeptídeo in trame tal que a se-qüência de polinucleotídeo resultante será então expressa como um polipep-tídeo único por uma célula.

Os polinucleotídeos de interesse a serem direcionados para ocloroplasto podem ser otimizados para expressão no cloroplasto para seremresponsáveis pelas diferenças no uso de códon entre o núcleo da planta eessa organela. Dessa maneira, os polinucleotídeos de interesse podem sersintetizados usando os códons preferidos de cloroplasto. Veja, por exemplo,Patente U.S. Ng 5.380.831, incorporada aqui por referência.

Tipicamente esse "cassete de expressão em planta" será inseri-do em um "vetor de transformação de planta". Por "vetor de transformação"entende-se uma molécula de DNA que é necessária para a transformaçãoeficiente de uma célula. Tal molécula pode consistir de um ou mais cassetesde expressão e pode estar organizada em mais de um "vetor" de moléculade DNA. Por exemplo, vetores binários são vetores de transformação deplanta que utilizam dois vetores de DNA não contíguos para codificar todasas funções atuantes eis- e trans- necessárias para transformação de célulasde planta (Hellens e Mullineaux (2000) Trends in Plant Science 5:446-451)."Vetor" se refere a um construto de polinucleotídeo designado para transfe-rência entre células hospedeiras diferentes. "Vetor de expressão" se refere aum vetor que tem a habilidade de incorporar, integrar e expressar seqüên-cias ou fragméhtos de DNA heterólogos em uma célula estranha.

Esse vetor de transformação de planta pode ser compreendidode um ou mais vetores de DNA necessários para se obter a transformaçãoda planta. Por exemplo, é uma prática comum na técnica utilizar vetores detransformação de planta que são constituídos por mais do que um segmentode DNA contíguo. Esses vetores são geralmente referidos na técnica como"vetores binários". Vetores binários assim como vetores com plasmídeos au-xiliares são os mais freqüentemente usados para transformação mediadapor Agrobacterium, onde o tamanho e a complexidade dos segmentos deDNA necessários para se obter a transformação eficiente são bastante gran-des e é vantajoso separar funções em moléculas de DNA separadas. Veto-res binários contêm tipicamente um plasmídeo vetor que contém as seqüên-cias cis-atuantes necessárias para transferência de T-DNA (tal como a bordaesquerda e a borda direita), um marcador selecionável que é manipuladopara ser capaz de expressão em uma célula de planta e um "gene de inte-resse" (um gene manipulado capaz de expressão em uma célula de plantapara a qual a geração de plantas transgênicas é desejada). Também presen-tes nesse vetor de plasmídeo estão as seqüências necessárias para replica-ção bacteriana. As seqüências cis-atuantes são arranjadas de uma forma apermitir a transferência eficiente para céulas de planta e expressão nessas.Por exemplo, o gene marcador selecionável e o gene de interesse estão lo-calizados entre as bordas esquerda e direita. Freqüentemente um segundovetor de plasmídeo contêm os fatores trans-atuantes que mediam a transfe-rência de T-DNA de Agrobacterium para células de planta. Esse plasmídeofreqüentemente contêm as funções de virulência (genes Vir) que permitem ainfecção de células de planta pela Agrobacterium e transferência de DNA porclivagem nas seqüências de fronteira e transferência de DNA mediada porvir, como é compreendido na técnica (Hellens e Mullineaux (2000) Trends inPlant Science 5:446-451). Vários tipos de cepas de Agrobacterium (por e-xemplo, LBA 4404, GV3101, EHA.101, EHA105, etc.) podem ser usadas paratransformação de planta. O segundo vetor de plasmídeo não é necessáriopara a transformação de plantas por outros métodos tais como microproje-ção, microinjeção, eletroporação, polietileno glicol, etc.Transformação de planta

Métodos da invenção envolvem a introdução de um construto denucleotídeo em uma planta. Por "introdução" é pretendido dar a planta oconstruto de nucleotídeo de tal maneira que o construto ganhe acesso aointerior de uma célula da planta. Os métodos da invenção não requerem queum método em particular para introdução de um construto de nucleotídeo emuma planta seja usado, apenas que o construto de nucleotídeo ganhe aces-so ao interior de pelo menos uma célula da planta. Métodos para introduçãode construtos de nucleotídeo em plantas são conhecidos na técnica incluin-do, mas não limitado a métodos de transformação estável, métodos detransformação transitória e métodos mediados por vírus.

Em geral, métodos de transformação de planta envolvem a31

transferência de DNA heterólogo para células alvo de plantas (por exemplo,embriões imaturos ou maduros, culturas em suspensão, calos indiferencia-dos, protoplastos, etc), seguida pela aplicação de um nível limiar máximo deseleção apropriada (dependendo do gene marcador selecionável e nessecaso de "glifosato") para recuperar as células transformadas da planta a par-tir de um grupo de massa de células não transformadas. Em tais processos,polipeptídeos resistentes a glifosato que compreendem um ou mais domí-nios Classe III da presente invenção podem ser usados como marcador se-lecionável.

Explantes são transferidos tipicamente para um suprimento fres-co do mesmo meio e cultivados rotineiramente. Subseqüentemente, as célu-las transformadas são diferenciadas em brotos após colocadas em meio deregeneração suplementado com um nível limiar máximo do agente de sele-ção (por exemplo, "glifosato"). Os brotos são então transferidos para ummeio seletivo de enraizamento para recuperação de broto enraizado ou plân-tula. A plântula transgênica se desenvolve na planta madura e produz se-mentes férteis (por exemplo, Hiei et al. (1994) The Plant Journal 6:271-282;Ishida et al (1996) Nature Biotechnology 14:745-750). Explantes são tipica-mente transferidos para um suprimento fresco do mesmo meio e cultivadosrotineiramente: Uma descrição geral das técnicas e métodos para a geraçãode plantas transgênicas é encontrada em Ayres & Park (1994) Criticai Revi-ews in Plant Science 13:219-239 e Bommineni e Jauhar (1997) Maydica42: 7-120. Já que o material transformado contém muitas células, tanto ascélulas transformadas como as não transformadas estão presentes em qual-quer pedaço do calo alvo ou tecido ou grupo de células em estudo. A habili-dade de matar células não transformadas e permitir que células transforma-das proliferem resulta em culturas de plantas transformadas. Freqüentemen-te, a habilidade de remover células não transformadas é uma limitação àrecuperação rápida de células transformadas de planta e a geração bem-sucedida de plantas transgênicas. Então, métodos moleculares e bioquími-cos serão usados para confirmar a presença do gene heterólogo integradode interesse no genoma da planta transgênica.A geração de plantas transgênicas pode ser realizada por um devários métodos, incluindo mas não limitado a introdução de DNA heterólogopor Agrobacterium em células de planta (transformação mediada por Agro-bacterium), bombardeio de células de planta com DNA estranho heterólogoaderido a partículas e vários outros métodos diretos não mediados por partí-culas (por exemplo, Hiei et al. (1994) The Plant Journal 6:271-282; Ishida etal. (1996) Nature Biotechnology 14:745-750; Ayres and Park (1994) Criticaifíeviews in Plant Science 13:219-239; Bommineni & Jauhar (1997) Maydica42:107-120) para transferir DNA.

Métodos para transformação de cloroplastos são conhecidos natécnica. Veja, por exemplo, Svab et al. (1990) Proc. Natl. Acad. Sei. USA87:8526-8530; Svab & Maliga (1993) Proc. Natl. Acad. Sei. USA 90:913-917;Svab & Maliga (1993) EMBOJ. 12:601-606. O método conta com a liberaçãode partículas de DNA que contém um marcador selecionável e que atinge oDNA do genoma do plastídeo através de recombinação homóloga. Além dis-so, a transformação do plastídeo pode ser obtida por transativação de umtransgene silencioso gerado no plastídeo por expressão no tecido preferidode uma RNA polimerase codificada no núcleo e direcionada ao plastídeo. Talsistema foi relatado em McBride et al. (1994) Proc. Natl. Acad. Sei. USA91:7301-7305.

As células que foram transformadas podem ser cultivadas emplantas de acordo com meios convencionais. Veja, por exemplo, McCormicket al. (1986) Plant Cell Reports 5:81-84. Essas plantas podem então ser cul-tivadas e polinizadas tanto com a mesma cepa transformada quanto comcepas diferentes e o híbrido resultante que tem expressão constitutiva dacaracterística fenotípica desejada, identificado. Duas ou mais gerações po-dem ser cultivadas para assegurar que a expressão da característica fenotí-pica desejada está estavelmente mantida e herdada e então as sementescolhidas para assegurar que a expressão da característica fenotípica dese-jada tenha sido obtida. Dessa maneira a presente invenção fornece sementetransformada (também referida como "semente transgênica") que tem umconstruto de nucleotídeo da invenção, por exemplo, um cassete de expres-são da invenção, estavelmente incorporado em seu genoma.Plantas

A presente invenção pode ser usada para a transformação dequalquer espécie de planta, incluindo mas não limitado a monocotiledônease dicotiledôneas. Exemplos de plantas de interesse incluem, mas não sãolimitados a milho (milho graúdo), sorgo, trigo, girassol, tomate, crucíferas,pimentas, batata, algodão, arroz, soja, beterraba, cana de açúcar, tabaco,cevada, canola, Brassica sp., alfafa.centeio, painço, açafrão, amendoim, ba-tata doce, mandioca, café,coco, abacaxi, arvores cítricas, cacau, chá, bana-na, abacate, figo, goiaba, manga, azeitona, papaia, caju, macadâmia, amên-doa, aveia, vegetais, ornamentais e coníferas.

Vegetais incluem, mas não são limitados a tomates, alface, fei-jões verdes, feijão de lima, ervilhas e membros do gênero Curcumis tais co-mo pepino, meloa e melão. As ornamentais incluem, mas não são limitadasa azaléia, hidrângea, hibisco, rosas, tulipas, narcisos, petúnias, cravo, poin-sétia e crisântemo. Preferivelmente, as plantas da presente invenção sãoplantas de cultura (por exemplo, milho, sorgo, trigo, girassol, tomate, crucífe-ras, pimentas, batata, algodão, arroz, soja, beterraba, cana de açúcar, taba-co, cevada, canola, etc).

Esêa invenção é particularmente adequada para qualquer mem-bro da família das plantas monocotiledôneas, incluindo mas não limitado amilho, arroz, cevada, aveia, trigo, sorgo, centeio, cana de açúcar, abacaxi,inhame, cebola, banana, coco e tâmaras.Avaliação da Transformação de Planta

Após a introdução do DNA estranho heterólogo em células deplanta, a transformação ou integração do(s) gene(s) heterólogo(s) no geno-ma da planta é confirmada por vários métodos tais como análise de polinu-cleotídeos, proteínas e metabólitos associados com o gene integrado.

A análise por PCR é um método rápido para rastrear célulastransformadas, tecidos ou brotos quanto a presença do(s) gene(s) incorpo-rado^) no estágio precoce antes do transplante para o solo (Sambrook &Russell (2001) Molecular Cloning: A Laboratory Manual, Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY). PCR é realizado usando inicia-dores de oligonucleotídeo específico para o gene de interesse ou vetor deAgrobacterium, etc.

A transformação da planta pode ser confirmada pela análiseSouthern blot de DNA genômico (Sambrook & Russell, 2001, supra). Em ge-ral, o DNA total é extraído do transformante, digerido com as enzimas derestrição apropriadas, fracionado em um gel de agarose e transferido paramembrana de nitrocelulose ou náilon. A membrana ou "blot" é então sonda-da com, por exemplo, fragmento de DNA alvo radiomarcado com 32P paraconfirmar a integração do gene introduzido no genoma da planta de acordocom técnicas padronizadas (Sambrook & Russell, 2001, supra).

Na análise Northern, o RNA é isolado de tecidos específicos dotransformante, fracionado em gel de agarose formaldeído, e transferido paraum filtro de náilon de acordo com procedimentos padronizados que são roti-neiramente usados na técnica (Sambrook & Russell, 2001, supra). A expres-são do RNA codificado pela seqüência da invenção é então testada pela hi-bridização do filtro com uma sonda radioativa derivada de um GDC, por mé-todos conhecidos na técnica (Sambrook e Russell, 2001, supra).

Western blot e ensaios bioquímicos e similares podem ser reali-zados nas plantas transgênicas para determinar a presença de proteína co-dificada pelo gene resistente ao herbicida por procedimentos padronizados(Sambrook e Russell, 2001, supra) usando anticorpos que se ligam a um oumais epitopos presentes na proteína resistente ao herbicida.

A presente invenção também é direcionada a métodos para i-dentificar uma EPSP sintase com atividade de resistência ao glifosato. Osmétodos envolvem determinar se certos domínios de seqüência conserva-dos estão presentes na seqüência de aminoácidos de uma EPSP sintase. Apresença de um ou mais domínios listados acima.Predição da Função da Proteína a partir da Seqüência

Usando os métodos da invenção e os domínios identificados,polipeptídeos adicionais (por exemplo, SEQ ID NOS: 2, 4, 46 e 48) que con-ferem tolerância ao glifosato podem ser identificados. Esses polipeptídeosadicionais podem ser identificados pela pesquisa de bases de dados de se-qüência que contém seqüências de EPSP sintase e/ou por alinhamento deseqüências de polipeptídeos de EPSP sintase para pesquisar a presença dedomínios Classe III. Esses polipeptídeos incluem polipeptídeos conhecidosassim como os novos polipeptídeos identificados. É entendido que algumamodificação desses domínios é tolerada na natureza sem perda da naturezaque confere resistência ao glifosato desses domínios, e são portanto equiva-lentes aos domínios listados aqui.

Em geral, existem quatro níveis de estrutura de proteína: a estru-tura primária, que consiste da cadeia linear de aminoácidos ou da seqüênciade polipeptídeos; a estrutura secundária, que é dada pelas hélices a, fila-mentos p e voltas nas quais a proteína se dobra; a estrutura terciária, que éfeita de motivos simples que se combinaram para formar domínios globula-res compactos; e a estrutura quaternária, que pode compreender várias ca-deias de aminoácidos ou subunidades. Quando se prediz a função a partirda seqüência, é importante identificar os motivos ou padrões funcionalmenteimportantes. Domínios de proteína com dobramentos similares freqüente-mente partilham a mesma função molecular (Hegyi & Gerstein (1999) J. Mol.Biol. 288:147-164; Moult & Melamud (2000) Curr. Opin. Struct. Biol. 10:384-389; Shakhnovich et al. (2003) J. Mol. Biol. 326:1-9). A identificação de do-mínios importantes para a função da proteína pode ser feita por alinhamen-tos múltiplos de seqüência.

A estrutura tridimensional pode ser predita por modelagem porhomologia, isto é, pelo uso de uma seqüência homóloga (> 25% de identida-de de seqüência) com um estrutura 3D experimentalmente determinada. Aestrutura tridimensional de, por exemplo, EPSP sintase de E. coli (AroA) ébem-conhecida (Shónbrunn etal. (2001) Proc. A/aí/. Acad. Sei. USA 98:1375-1380). Essa estrutura é baseada na cristalização de AroA com glifosato exiquimato 3-fosfato.

Os seguintes exemplos são oferecidos por meio de ilustração enão por meio de limitação.36

EXPERIMENTAÇÃO

Exemplo 1. Isolamento de Genes de EPSPS

Genes que codificam enzimas EPSPS Classe III foram isoladosa partir de sete bactérias diferentes (Klebsiella pneumoniae, Agrobacteriumradiobacter, Rhizobium sp., Brevundomonas vesicularis, Agrobacterium tu-mefaciens, Pseudomonas syringae, e Brucella/Ochrobactrum).

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg8 são fornecidas no Pedido de Patente U.SN9 60/640.195, depositado em 29 de dezembro de 2004 e fornecidas naSEQ ID NO: 7 e SEQ ID NO:8 desse pedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg12 são fornecidas nas SEQ ID NOS: 57 e e SEQ ID NOS: 58 e 59 desse pedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg15 são fornecidas nas SEQ ID NO: 11 e SEQID NO: 12 desse pedido de patente, respectivamente.

A seqüência que codifica o'DNA e a seqüência de aminoácidosda fase aberta de leitura de grg6 são fornecidas no Número de Acesso doGenBank AE016853, bases de 1.140.091 até 1.141.347 e fornecidas nasSEQ ID NO: 1 e SEQ ID NO: 2 desse pedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg9 são fornecidas no Número de Acesso doGenBank NC_003304, bases de 628.398 até 629.675 e fornecidas nas SEQID NO: 3 e SEQ ID NO: 4 desse pedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg7 são fornecidas nas SEQ ID NO: 45 e SEQID NO: 46 desse pedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg5 são fornecidas no Número de Acesso doGenBank NC_005773, bases de 1 até 1257 e fornecidas nas SEQ ID NO: 47e SEQ ID NO: 48 desse pedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de EPSPS do milho são fornecidas no Número deAcesso do GenBank X63374 (gi: 1524383), bases de 1 até 1335 e a seqüên-cia da proteína é fornecida na SEQ ID NO: 50 desse pedido de patente.

A seqüência que codifica o DNA e a seqüência de aminoácidosde uma EPSPS bacteriana descrita no Pedido Internacional de PatenteWO2005014820 são fornecidas na SEQ ID NO: 53 e SEQ ID NO: 54 dessepedido de patente, respectivamente.

A seqüência que codifica o DNA e a seqüência de aminoácidosda fase aberta de leitura de grg7m1 são fornecidas nas SEQ ID NO: 55 eSEQ ID NO: 56 desse pedido de patente, respectivamente.Exemplo 2. Clonagem do gene de EPSP sintase da cepa DC3000 de Pseu-domonas syringae pv tomato

A seqüência codificante de EPSP sintase foi amplificada porPCR a partir do DNA genômico da cepa DC3000 de Pseudomonas syringaepv tomato (ATCC BAA-871) usando os seguintes iniciadores: CAGA-GATCTGGCATGCGACCTCAAGCCACTCTC (superior, SEQ ID NO: 61) eCAGGGCGCGCCTCAGCGCTGAACACTCACCC (inferior, SEQ ID NO: 62).O produto de PCR resultante de 1,3 kb foi digerido com Bgl II e Ase I, ligadoem pUC18 modificado que foi digerido com BamH I e Ase I, então eletropo-rado em células DH5a. O plasmídeo de DNA foi preparado a partir de colô-nias resistentes a ampicilina e analisado por digestão de restrição. Um clonefoi escolhido para análise posterior. A seqüência de DNA do inserto foi de-terminada usando técnicas bem-conhecidas na técnica e foi descoberta ser100% idêntica a seqüência publicada para a cepa DC3000 (número de a-cesso do Genbank AE016853 bases de 1.140.091 até 1.141.347). Esseplasmídeo foi denominado de pAX703 e a ORF de EPSPS foi denominadade grg6.

O plasmídeo pAX703 foi transformado em células AaroA de E.colie descoberto complementar a deleção. Isso demonstra que grg6 codificauma EPSP sintase funcional.

Exemplo 3. Clonagem do oene de EPSP sintase a partir da cepa C58 deAgrobacterium radiobacterA seqüência que codifica a EPSP sintase foi amplificada porPCR a partir do DNA genômico da cepa C58 de Agrobacterium tumefasciens(ATCC 33970) usando os seguintes iniciadores: CAGGGATCCGGCAT-GATCGAACTGACCATCACCC (superior, SEQ ID NO: 63) e CAGGGCGCG CCTCAGTGCTGCGGCTCGGCAGCG (inferior, SEQ ID NO: 64). O produtode PCR resultante de 1,3 kb foi digerido com BamH I e Ase I, ligado empUC18 modificado que foi digerido com BamH I e Ase I, então eletroporadoem células DH5a. O plasmídeo de DNA foi preparado a partir de colôniasresistentes a ampicilina e analisado por digestão de restrição. Um clone foi escolhido para análise posterior. A seqüência de DNA do inserto foi determi-nada usando técnicas bem-conhecidas na técnica e foi descoberta ser 100%idêntica a seqüência publicada para a cepa C58 (número de acesso doGenbank NC_003304 bases de 628398 até 629675). Esse plasmídeo foidenominado de pAX702 e a ORF de EPSPS de C58 foi denominada de grg9.

O plasmídeo pAX702 foi transformado em células AaroA de E.coli e encontrado complementar a deleção. Isso demonstra que grg9 codificauma EPSP sintase funcional.

Exemplo 4. Testando arg6 e gra9 quanto a resistência ao qlifosato Os plasmídeos pAX703 e pAX702, que contêm grg6 e grg9 res-pectivamente, foram transformados em células de E.coli e esfriados sobremeio de ágar M63 contendo várias concentrações de glifosato. O plasmídeovetor pUC18 foi usado como um controle sensível ao glifosato. Os resultadossão apresentados na Tabela 1 abaixo e demonstram que a expressão de grg6 ou grg9 confere a resistência a níveis elevados de glifosato.

<table>table see original document page 39</column></row><table>Exemplo 5. Clonagem do gene de EPSP sintase da cepa B728a de Pseu-domonas syringae pv syringae.

A seqüência que codifica a EPSP sintase foi amplificada porPCR a partir de uma colônia isolada de um único poço da cepa B728a dePseudomonas syringae pv syringae usando os seguintes iniciadores:CAGGGATCCGGCATGCGACCTCAAGCCACCCTC (superior, SEQ ID NO:65) e CAGGGCGCGCCTCAGCGCTGAACACTCACAC (inferior, SEQ IDNO: 66). O produto de PCR resultante de 1,26 kb foi digerido com as enzi-mas de restrição apropriadas e ligado no vetor pRSFIb, então eletroporadoem células de E.coli. O plasmídeo de DNA foi preparado a partir de colôniasresistentes a ampicilina e analisadas por digestão de restrição. Um clone foiescolhido para análise posterior e designado como pAX1923. A seqüênciade DNA da fase aberta de leitura em pAX1923 foi determinada e descobertaser idêntica a seqüência publicada da EPSPS da cepa B728a de Pseudo-monas syringae pv syringae. Assim, designou-se essa fase aberta de leituracomo grg7.

Similarmente, um produto de PCR de 1,26 kb separado foi dige-rido com BamH I e Ase I, ligado em pUC18 modificado que foi digerido comBamH I e Ase I, então eletroporado em células DH5a. O plasmídeo de DNAfoi preparado a partir de colônias resistentes a ampicilina e analisado pordigestão de restrição. Um clone foi escolhido para análise posterior. A se-qüência de DNA do inserto de pAX712 foi determinada usando técnicasbem-conhecidas na técnica e foi encontrada conter 3 alterações de nucleotí-deo quando comparada com a seqüência de DNA publicada da cepa B728ade Pseudomonas syringae pv syringae (Número de Acesso do GenbankNZ_AABP02000003, bases de 39.901 até 41.400). Essas três alterações denucleotídeo do DNA resultam em uma proteína com uma alteração de ami-noácido relativa a proteína hipotética codificada pela seqüência publicada. Afase de leitura aberta da cepa B728a que codifica uma EPSPS como a iden-tificada no plasmídeo pAX712 foi designada de grg7m1 (SEQ ID NO: 55;seqüência da proteína grg7m1 descrita na SEQ ID NO:56).Exemplo 6. Clonagem do gene de EPSP sintase da cepa 1448a de Pseu-domonas syringae pv phaseolicolaOs dados da seqüência de EPSPS da cepa 1448a de Pseudo-monas syringae pv phaseolicola foram obtidos do website www.tigr.org doThe Institute for Genomic Research. A seqüência que codifica a EPSP sinta-se da cepa 1448a de Pseudomonas syringae pv phaseolicola foi amplificadapor PCR a partir do DNA genômico da cepa 1448a de Pseudomonas syrin-gae pv phaseolicola (ATCC BAA-978) usando os seguintes iniciadores:CAGGGATCCGGCATGCGACCTCAAGCCACCCTC (superior, SEQ ID NO:

67) e AGAGGCGCGCCTCAGCGCTGAACACGCACC (inferior, SEQ ID NO:

68) , designados baseado na seqüência de DNA disponibilizada pelo TheInstitute for Genomic Research ("TIGR", comunicação pessoal). O produtode PCR resultante de 1,26 kb foi digerido com BamH I e Ase I, ligado empUC18 modificado que foi digerido com BamH I e Ase I, então eletroporadoem células DH5cc. O plasmídeo de DNA foi preparado a partir de colôniasresistentes a ampicilina e analisado por digestão de restrição. Um clone foiescolhido para análise posterior e designado pAX713. A seqüência de DNAdo inserto de pAX713 foi determinada usando técnicas bem-conhecidas natécnica e foi descoberta ser 100% idêntica a seqüência de DNA publicada dacepa 1448a de Pseudomonas syringae pv phaseolicola (realizada pelo TheInstitute for Genomic Research (TIGR) e disponibilizada online na forma ele-trônica em www.tigr.org). Esse plasmídeo foi denominado de pAX713 e afase de leitura aberta da cepa 1448a que codifica uma EPSPS como identifi-cada no plasmídeo pAX713 foi designada como grg5.

Exemplo 7. Testando grg5 e grg7quanto a resistência a qlifosato

Os plasmídeos pAX713, pAX1923 e pAX712, que contêm grg5 egrg7e grg7m1, respectivamente, foram transformados em células de E.colieesfriados sobre meio de ágar M63 contendo várias concentrações de glifosa-to. O plasmídeo vetor pUC18 foi usado como um controle sensível ao glifo-sato. Os resultados são apresentados na Tabela 2 abaixo e demonstram quea expressão de grg5, grg7 ou grg7m1 confere resistência a níveis elevadosde glifosato.Tabela 2.

Crescimento de E. coli que expressa grg5, grg7, ou grg7m1 na presença de glifosa-to. <table>table see original document page 42</column></row><table>

Exemplo 8: Isolamento de ATX20019

ATX20019 foi isolado pelo plaqueamento de amostras de soloem Meio de Sais Minerais HEPES (HMSM) contendo glifosato como únicafonte de fósforo. Já que HMSM não contém aminoácidos aromáticos, umacepa deve ser resistente ao glifosato a fim de crescer nesse meio.

Dois gramas de solo foram suspensos em aproximadamente 10ml de água, vortexados por 15 segundos e deixados assentar por 15 minu-tos. Um "loopful" de 10 |il dessa suspensão foi adicionado a 3 ml de HMSMsuplementado com glifosato 10 mM (pH 7.0). HMSM contém (por litro): 10 gde glicose, 2 g de NH4SO4,9,53 g de HEPES, 1,0 ml de MgS04 0,8 M, 1,0 mlde CaCI2 0,1 M, 1,0 ml de Solução de Elementos Traço (Em 100 ml de solu-ção 1000x: 0,1 rg de FeS047H20, 0,5 mg de CuS045H20, 1,0 mg de H3B03,1,0 mg de MnS045H20, 7,0 mg de ZnS047H20, 1,0 mg de Mo03, 4,0 g deKCI). A cultura foi cultivada em uma incubadora com agitação por quatro di-as a 28°C e então 20 uJ foram usados para inocular 2,5 ml de HMSM frescocontendo contendo glifosato 10 mM como a única fonte de fósforo. Após doisdias, 20 uJ foram usados para inocular outros 2,5 ml de cultura fresca. Após5 dias, 20 uJ foram usados para inocular 2,5 ml de cultura fresca. Após cres-cimento suficiente, a cultura foi plaqueada em meio sólido pelo estriamentode uma volta de 1 uJ sobre a superfície da placa de ágar contendo ágarHMSM contendo glifosato 10 mM como única fonte de fósforo e armazenadaa 28°C. A cultura foi então replaqueada para isolamento. Uma cepa em par-ticular, designada ATX20019, foi selecionada devido a sua habilidade decrescer na presença de altas concentrações de glifosato. ATX20019 foi de-terminada ser um membro de Ochtrobactrum sp./Brucella sp. pelo seqüenci-amento do rDNA 16S e comparação contra uma base de dados.Exemplo 9. Preparação e Rastreamento de Bibliotecas de Cosmídeos

DNA total foi extraído de uma cultura de ATX20019 usando mé-todos comumente conhecidos na técnica. O DNA foi parcialmente digeridocom a enzima de restrição Sau3A 1 e ligado com o fragmento de vetor Su-perCos (Stratagene) de acordo com as instruções do fabricante. Os produtosde ligação foram acondicionados em partículas de fagos usando o extrato deacondicionamento GigaPack III XL (Stratagene), transfectados em células deE. coli aroA. E. coli aroA é uma cepa na qual o gene aroA nativo, que codifi-ca EPSP sintase, foi deletado. A cepa não pode crescer em meio M63 porque requer aminoácidos aromáticos suplementados exogenamente. A pre-sença de um cosmídeo que contém um gene de EPSP sintase pode com-plementar geneticamente o fenótipo aroA, ou seja, permite que a cepa cres-ça no meio M63 sem aminoácidos aromáticos suplementados exogenamen-te.

As células transfectadas foram plaqueadas em meio M63 ágarque contém 50 u.g/ml de canamicina meio M63 ágar contendo KH2P04 100mM, (NH4)2S04 15 mM, CaCI250 \M, FeS04 1 \iM, MgCI2 50 |iM, glicose 55mM, 25 mg/litro de L-prolina, 10 mg/litro de tiamina HCI, NaOH suficientepara ajustar o pH para 7.0, e 15 g/litro de ágar. Duas colônias que cresceramnesse meio foram identificadas. O cosmídeo de DNA foi preparado a partirde cada uma dessas colônias e retransformado em células de E. coli aroA.Em cada caso, as células retransformadas com o cosmídeo de DNA cresce-ram em meio M63 na presença de 0 ou 10 mM de glifosato enquanto que ascélulas que continham o vetor SuperCos vazio não cresceram. Isso confirmaque os cosmídeos são capazes de complementar o fenótipo aroA e capazesde conferir resistência ao glifosato. Esses cosmídeos foram denominadospAX1100 e pAX1101. Os cosmídeos pareceram ser idênticos pela análise dadigestão por restrição usando duas enzimas diferentes. Um cosmídeo,pAX1101, foi selecionado para caracterização posterior.Exemplo 10. Caracterização de ora12no Cosmídeo pAX1101

Para identificar o(s) gene(s) responsável(responsáveis) pela re-sistência ao glifosato mostrada pelo cosmídeo pAX1101, o DNA desse clonefoi mutagenizado com elementos transponíveis. Nesse método, identificam-se clones que sofreram inserções com transposons e perderam a habilidadede conferir resistência ao glifosato. A localização das inserções de transpo-son identifica a fase aberta de leitura responsável pelo fenótipo de resistên-cia ao glifosato.

O cosmídeo pAX1101 foi submetido a mutagênese com transpo-son in vitro usando um EN::TN Insertion Kit (Epicentre, Madison, Wl) e o pro-tocolo do fabricante. Esse processo insere aleatoriamente um fragmento detransposon no cosmídeo de DNA e assim interrompe a função de genes nocosmídeo. Os transposons contêm um gene que codifica resistência a umantibiótico, assim clones com inserção de transposon podem ser seleciona-dos pela habilidade de crescer na presença daquele antibiótico. As localiza-ções das inserções de transposon podem ser determinadas pelo mapea-mento de fragmentos de restrição ou por seqüenciamento com iniciadoresque se anelam no transposon.

Clones de pAX1101 com inserção de transposon foram trans-formados na cepa DH5a de E.coli e plaqueados em meio M63 que contémglifosato. Foram encontrados múltiplos clones que tinham perdido a habili-dade de crescer na presença de glifosato, indicando que o transposon inter-rompeu a gene responsável pela resistência.

A seqüência de DNA foi determinada para a região de pAX1101que contém as inserções de transposon usando métodos de seqüenciamen-to bem-conhecidos na técnica e é apresentada como SEQ ID NO: 9. Umafase de leitura aberta (ORF) foi identificada nas bases de 46 até 1380 daSEQ ID NO: 9. Essa seqüência de nucleotídeos é fornecida como SEQ IDNO: 57 e a seqüência de aminoácidos correspondente é fornecida comoSEQ ID NO: 58. Análise de dados de seqüência de oito inserções de trans-poson seleciona aquela que perdeu a resistência ao glifosato revelando quetodas estavam dentro da ORF. Isso indica que a ORF codifica a resistênciaao glifosato conferida pelo cosmídeo. Esse gene foi denominado grg12. Ocosmídeo pAX1101 que contém a ORF de grg12\o\ depositado no Agricultu-ral Research Service Culture Collection (NRRL) em 4 de abril de 2005 e de-signado com N9 de Acesso B-30833.Exemplo 11. Homologia de GRG12 com Outras Proteínas

GRG12 tem homologia com enzimas EPSP sintase. Um alinha-mento da seqüência de aminoácidos de GRG12 (SEQ ID NO: 10) com a se-qüência de aminoácidos de outras EPSP sintases é mostrado na figura 1. ATabela 3 lista o percentual de identidade de GRG12 com várias EPSP sinta-ses. O exame da seqüência de aminoácidos (SEQ ID NO: 10) revelou queela não contem os quatro domínios típicos de enzimas EPSP sintase ClasseII. Assim ela é uma nova EPSP sintase não Classe II resistente ao glifosato.

GRG12 tem a maior homologia de aminoácidos com umaEPSPS descrita na WO2005014820 (SEQ ID NO: 54). GRG12 (SEQ ID NO:10) tem 92% de identidade de aminoácidos com as EPSPS descritas naWO2005014820.

Tabela 3. Identidade de aminoácido de GRG12 a outras EPSP Sintases

<table>table see original document page 45</column></row><table>

Análise adicional da seqüência de DNA de grg12 (SEQ ID NO:9) revelou a presença de uma segunda fase aberta de leitura menor (SEQ IDNO: 58) começando com um códon de início GTG no nucleotídeo 142 deSEQ ID NO: 9. A tradução dessa fase aberta de leitura resulta em uma pro-teína (SEQ ID NO: 59) que é idêntica aos resíduos 33-444 de SEQ ID NO:10, exceto que o códon de início de SEQ ID NO: 59 é uma metionina ao in-vés da valina presente em SEQ ID NO: 10. O alinhamento de SEQ ID NO:59 com proteínas EPSPS conhecidas indicou que esta proteína contém to-dos os resíduos conhecidos por serem críticos para funcionar como umaEPSPS. Dessa forma, essa proteína provavelmente compreende uma enzi-ma EPSPS resistente ao glifosato funcional, enquanto uma proteína que re-sulta do início da tradução de um códon de início interno aos domínios alta-mente conservados deve ser improvável de ser funcional. SEQ ID NO: 59 é97% idêntica a EPSPS descrita em WO2005014820 (SEQ ID NO: 54).

A habilidade de ambas as fases abertas de leitura (SEQ ID NOS:57 e 58) codificar atividade de EPSPS funcional pode ser testada pela ampli-ficação de cada fase aberta de leitura por PCR, clonagem dos fragmentos dePCR resultantes em um vetor de plasmídeo sob o controle de um promotoradequado, indução da expressão de proteína a partir da fase aberta de leitu-ra como conhecido na técnica, e comparação da habilidade da proteína ex-pressa complementar o fenótipo arok em E. colie conferir resistência ao gli-fosato.

Exemplo 12. Manipulação de grg12 para Expressão de Proteína GRG12 emE. coli

A fase aberta de leitura (ORF) de grg12ío\ amplificada por PCR,clonada em uma versão levemente modificada do vetor de plasmídeo pUC18e transformada na cepa de E. coli DH5ot. As modificações a pUC18 foramcomo se segue: um códon de parada foi inserido na fase aberta de leitura delacZ e um sítio de ligação de ribossomo (para otimizar a iniciação da tradu-ção da ORF de grg12 inserida) foi inserido a montante do sítio de restriçãode BamHI. O DNA de plasmídeo foi preparado e a presença e orientação doinserto grg12 foram determinadas por digestão de restrição. Um clone quecontinha a ORF na orientação de sentido direto com relação ao promotor lacno vetor foi nomeado pAX1106 e foi testado quanto a habilidade de conferirresistência ao glifosato. Células de E. coli que tinham pAX1106 ou plasmí-deo de vetor vazio foram estriados sobre placas de ágar M63 contendo 0 a200 mM de glifosato. Os resultados estão apresentados na Tabela 4 abaixo.Esses resultados demonstram que grg12 confere resistência a altos níveisde glifosato.Tabela 4. Crescimento de pAX1106 sobre Ágar de Glifosato M63

<table>table see original document page 47</column></row><table>

Exemplo 13. Purificação de GRG12 Expresso como uma Proteína 6xHis-taaaed em E. coli

A região codificante de grg12 é amplificada por PCR usando PFUULTRA® DNA polimerase (Stratagene). Os oligonucleotídeo usados pa-ra iniciar o PCR são desenhados para introduzir sítios de reconhecimento deenzima de restrição próximo às terminações 5' e 3' do produto de PCR resul-tante. O produto de PCR resultante é digerido com enzimas de restrição a-propriadas e o produto digerido é clonado no vetor de expressão de 6xHis-

tag, pRSF1 b (Novagen). O clone resultante contém grg12 na mesma fase deleitura translacional que, é imediatamente C-terminal ao 6xHis tag. Estraté-gias gerais para gerar tais clones, e para expressar proteínas que contêm6xHis-tag são bem-conhecidas na técnica.

O nível de expressão da proteína GRG12 pode ser determinado

em um gel de proteína SDS-PAGE. A proteína GRG12 pode ser isolada porpurificação da proteína GRG12 induzida por cromatografia em, por exemplo,Resina Ni-NTA Superflow (Qiagen), seguindo as instruções do fabricante.Exemplo 14: Isolamento de ATX4150

ATX4150 foi isolado pelo plaqueamento das amostras de solo

em Meio Mínimo Enriquecido (EMM) contendo glifosato como a única fontede fósforo. Já que EMM não contém aminoácidos aromáticos, uma cepa de-ve ser resistente ao glifosato para crescer nesse meio.

Dois gramas de solo foram suspensos em aproximadamente 30ml de água, e sonicados por 30 segundos em um banho de água sonicador

Aquasonic. A amostra foi vortexada por 5 segundos e deixada repousar por60 segundos. Esse processo foi repetido 3 vezes. 100 |il dessa suspensãoforam adicionados a 3 ml de EMM suplementado com 4 mM de glifosato (pH6.0). EMM contém (por 900 mis): 10 g de sacarose, 2 g de NaN03,1,0 ml deMgS04 0,8 M, 1,0 ml de CaCI2 0,1 M, 1,0 ml de Solução de Elementos Traço(Em 100 ml de Solução 1000x: 0,1 g de FeS047H20, 0,5 mg de Cu-S04-5H20, 1,0 mg de H3B03, 1,0 mg de MnSCV5H20, 7,0 mg de Zn-S04'7H20, 1,0 mg de Mo03, 4,0 g de KCI). A cultura foi agitada em um tam-bor rotatório de cultura de tecido por dezesseis dias a 21 °C e então 100 [i\foram usados para inocular 3 ml de EMM fresco contendo 4 mM de glifosatocomo a única fonte de fósforo. Após cinco dias, 100 jll! foram usados parainocular outra cultura de 3 ml fresca. Após alguns dias, a cultura foi plaquea-da sobre meio sólido pelo esfriamento de uma volta de 1 uJ sobre a superfí-cie da placa de ágar contendo ágar EMM contendo 5 mM de glifosato comoa única fonte de fósforo. Após alguns dias, as colônias foram replaqueadaspara isolamento em EMM contendo 5 mM de glifosato como a única fonte defósforo. Uma cepa em particular, designada ATX4150, foi selecionada devi-do a sua habilidade de crescer na presença de altas concentrações de glifo-sato.

Exemplo 15. Preparo e Rastreamento de Bibliotecas de Cosmídeo

O DNA total foi extraído de uma cultura de ATX4150 usando mé-todos comumente usados na técnica. O DNA foi parcialmente digerido comenzima de restrição Sau3A1 e ligado com o fragmento de vetor SuperCos(Stratagene) dl acordo com as instruções do fabricante. Os produtos de li-gação foram acondicionados dentro de partículas de fago usando GigaPackIIIXL packaging extract (Stratagene), transfectados em células E. coli aroA-.E. coli aroA-, é uma cepa na qual o gene aroA nativo, que codifica a EPSPsintase, foi deletado. Essa cepa não pode crescer em meio M63 porque elarequer aminoácidos aromáticos fornecidos exogenamente. A presença deum cosmídeo que contém um gene de EPSP sintase pode complementargeneticamente o fenótipo aroA-, isso é, ele permite que a cepa cresça emmeio M63 sem aminoácidos aromáticos fornecidos exogenamente.

As células transfectadas foram plaqueadas em meio de ágarM63 contendo 50 |ig/ml de canamicina. O meio de ágar M63 contém 100mM de KH2P04, 15 mM de (NH4)2S04, 50 |liM de CaCI2, 1 \iM de FeS04, 50(iM de MgCI2, 55 mM de glicose, 25 mg/litro de L-prolina, 10 mg/litro de tia-mina HCI, NaOH suficiente para ajustar o pH para 7.0, e 15 g/litro de ágar. Cinco colônias que cresceram sobre esse meio foram identificadas. O DNA de cosmideo foi preparado a partir de cada uma dessas colônias e retrans-formado em células de E. coli aroA-. Em cada caso, as células retransforma-das com o DNA de cosmideo cresceram sobre meio M63 na presença de .0 ou 10 mM de glifosato enquanto células contendo o vetor SuperCos vazio não. Isso confirma que os cosmídeos são capazes de complementar o fenó-tipo aroA- e são capazes de conferir resistência ao glifosato. Um cosmideo foi selecionado para caracterização adicional e foi nomeado pAX305. Exemplo 16. Identificação de qro15 em Cosmideo PAX305

Para identificar o(s) gene(s) responsável(is) pela resistência ao glifosato mostrada pelo cosmideo pAX305, o DNA desse clone foi mutageni-zado com elementos transponíveis. O cosmideo pAX305 foi submetido a mutagênese de transposon in vitro usando um EZ::TN Insertion Kit (Epicen-tre, Madison, Wl) e o protocolo do fabricante. Clones de inserção de transposon de pAX305 foram transformados em E. coli e plaqueados em meio M63 contendo glifosato. Foram encontrados múltiplos clones que perderam a habilidade de crescer na presença de glifosato, indicando que o transposon rompeu o gene responsável pela resistência.

A seqüência de DNA foi determinada para a região de pAX305 que contém as inserções de transposon usando métodos de seqüenciamen-to bem-conhecidos na técnica e é apresentada em SEQ ID NO: 61. Uma fase aberta (ORF, bases de nucleotídeo 77 até 1354 de SEQ ID NO: 61) foi identificada. A análise dos dados de seqüência de oito seleções de inserção de transposon que perderam a resistência ao glifosato revelou que todos estavam dentro da ORF. Isso indica que a ORF codifica a resistência ao glifosato conferida pelo cosmideo. Esse gene foi nomeado grg15. O cosmideo pAX305 contendo a ORF de grg15 (SEQ ID NO: 11) foi depositado na Agricultura! Research Service Culture Collection (NRRL) em 20 de abril de 2005 e designado o N9 de Acesso NRRL B-30838. Exemplo 17. Homoloqia de GRG15 com Outras Proteínas

GRG15 tem homologia a enzimas EPSP sintase. Um alinhamen-to da seqüência de aminoácido de GRG15 (SEQ ID NO: 12) com as seqüências de aminoácido de outras EPSP sintases é mostrada na figura 1. A Tabela 5 lista o percentutal de identidade de GRG15 a várias EPSP sintases. O exame da seqüência de aminoácido (SEQ ID NO: 12) revelou que ela não contém os quatro domínios típicos de enzimas EPSP sintase Classe II. Dessa forma essa é uma nova EPSP sintase resistente ao glifosato, não-Classe II. Tabela 5. Identidade de Aminoácido de GRG15 e outras EPSP Sintases

<table>table see original document page 50</column></row><table>Exemplo 18. Blocos de Homologia entre enzimas não-Classe II resistentes ao Glifosato (Classe III)

Comparação das seqüências de aminoácido das proteínas GRG (proteínas resistentes ao glifosato não-classe II) mostra que as proteínas GRG têm significante homologia uma a outra, e são distintas de EPSP sintases resistentes ao glifosato identificadas anteriormente, (veja a figura 1). Exemplo 19: Identificação de Domínios Conservados

As seqüências de aminoácido que sete EPSP sintases conhecidas foram analisadas para domínios conservados que não estavam presentes nem nas EPSP sintases Classe I nem nas classe II. Os seguintes domínios são encontrados nessas EPSP sintases: tipo em negrito denota resíduos conservados apenas entre essa classe, e em itálico denota resíduos conservados em todas as enzimas EPSPS. Domínio I:L-A-K-G-XrS-X2-L-X3-G-A-L-K-S-D-D-T (SEQ ID NO: 13), onde Xi denota lisina ou treonina, onde X2 denota arginina ou histidina, onde X3 denota serina ou treonina.

Domínio Ia:

L-A-K-G-X1, (SEQ ID NO: 14), onde X1 denota lisina ou treonina.

Domínio Ib:

S-X1-L-X2 (SEQ ID NO: 15), onde X1 denota arginina ou histidina, onde X2 denota serina ou treonina.

Domínio Ic:

G-A-L-K-S-D-D-T (SEQ ID NO: 16)

Domínio II:

E-P-D-XrXs-T-F-Xg-V-X^Xs-Xe-G (SEQ ID NO: 17), onde X1 denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota va-lina ou isoleucina, onde X4 denota treonina ou ácido glutâmico ou lisina, onde X5 denota serina ou glicina, onde X6 denota glutamina ou serina ou ácido glutâmico ou treonina.

Domínio Ha:

E-P-D-XrX^T-F-Xa-V (SEQ ID NO: 18), onde X^ denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota valina ou isoleucina.

Domínio llb:

X1-X2-X3-G (SEQ ID NO: 19), onde X, denota treonina ou ácido glutâmico ou lisina, onde X2 denota serina ou glicina, onde X3 denota glutamina ou serina ou ácido glutâmico ou treonina.

Domínio III:

fíFLTAA (SEQ ID NO: 20)

Domínio IV:

KflPI(G/M)P (SEQ ID NO: 21)

K-F?-P-l-XrP, onde Xi denota glicina ou metionina ou leucina.

Domínio V:

XrG-C-P-P-V (SEQ ID NO: 22), onde X1 denota treonina ou serina.

Domínio VI:l-G-A-XrG-Y-X2-D-L-T (SEQ ID NO: 23), onde denota arginina ou lisina ou leucina, e onde X2 denota isoleucina ou valina. Domínio VII:

W-XrV-X2-X3-T-G (SEQ ID NO: 24), onde Xt denota arginina ou lisina, onde X2 denota alanina ou histidina ou ácido glutâmico ou serina, onde X3 denota prolina ou alanina. Domínio VIII:

E-P-D-A-S-A-A-T- Y-L-W-X1-A-X2-X3-L (SEQ ID NO: 25), onde X1 denota alanina ou glicina, onde X2 denota ácido glutâmico ou glutamina, onde X3 denota valina ou leucina ou alanina. Domínio Vllla:

E-P-D-A-S-A-A-T- Y-L-W (SEQ ID NO: 26) Domínio IX:

l-D-XrG (SEQ ID NO: 27), onde Xt denota isoleucina ou leucina. Domínio X:

F-XrQ-P-D-A- K-A (SEQ ID NO: 28), onde X1 denota treonina ou serina, Domínio XI:

XTF-P-Xz-Xs-X^A-Xs-Xe-Xy-G-S-Q-M-Q-D-A-I-P-T-Xe-A-V- X9 A-A- F-N (SEQ ID NO: 29), onde Xi denota glutamina ou lisina ou serina, onde X2 denota asparagina ouliistidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina, onde X5 denota treonina ou ácido glutâmico ou valina, onde X6 denota valina ou isoleucina, onde X7 denota ácido aspártico ou valina, onde X8 denota leucina ou isoleucina, onde X9 denota leucina ou isoleucina. Domínio Xla:

Xi-F-P-X2-X3-X4-A (SEQ ID NO: 30), onde X1 denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina. Domínio Xlb:

XrX2-X3-G-S-Q-M-Q-D-A-l-P-T-X4-A- V- X5A-A- F-N (SEQ ID NO: 31), onde X1 denota treonina ou ácido glutâmico ou valina, onde X2 denota valina ou isoleucina, onde X3 denota ácido aspártico ou valina, onde X4 denota leucinaou isoleucina, onde X5 denota leucina ou isoleucina. Domínio Xlc:

G-S-Q-M-Q-D-A-l-P-T (SEQ ID NO: 32) Domínio XII:

P-V-R-F-XrXa-Xa-X^N-L-R-V-K-E-C-D-fí-Xs (SEQ ID NO: 33), onde Xt denota valina ou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutâmico, onde X5 denota isoleucina ou valina. Domínio Xlla: P-V-R-F (SEQ ID NO: 34) Domínio Xllb:

XrXs-Xa-X^N-L-R-V-K-E-C-D-fí-Xg (SEQ ID NO: 35), onde X1 denota valina ou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutâmico, onde X5 de- nota isoleucina ou valina. Domínio XIIc:

N-L-R-V-K-E-C-D-fl (SEQ ID NO: 36) Domínio XIII:

E-G-D-D-L-X1-X2 (SEQ ID NO: 37), onde Xi denota leucina ou isoleucina, onde X2 denota valina ou isoleucina. Domínio XIV:

XrP-X2-L-A-G (SEQ ID NO: 38), onde X1 denota ácido aspártico ou aspara-gina, onde X2 denota alanina ou serina ou treonina. Domínio XV:

A-X1-I-D-X2-X3-X4- D-H-R- (SEQ ID NO: 39), onde X^ denota leucina ou serina ou ácido glutâmico, onde X2 denota treonina ou serina, onde X3 denota histidina ou fenilalanina, onde X4 denota alanina ou serina. Domínio XVI:

F-A-L-A-XrL-K-X2-X3-G-l (SEQ ID NO: 40), onde X^ denota glicina ou alani-30 na, onde X2 denota isoleucina ou valina, onde X3 denota serina ou glicina ou alanina ou lisina. Domínio XVIa:F-A-L-A-XrL-K (SEQ ID NO: 41), onde X^ denota glicina ou alanina. Domínio XVIb:

L-K-XT-X2-G-I (SEQ ID NO: 42), onde Xi denota isoleucina ou valina, onde X2 denota serina ou glicina ou alanina ou Usina. Domínio XVII:

-XTP-X2-C-V-X3-K (SEQ ID NO: 43), onde X1 denota asparagina ou ácido aspártico, onde X2 denota alanina ou ácido aspártico, onde X3 denota alanina ou glicina. Domínio XVIII:

XrS-L-G-V (SEQ ID NO: 44), onde Xt denota alanina ou serina ou prolina. Exemplo 20. Manipulação de ara12 para Transformação de Planta

A fase aberta de leitura (ORF) de grg12é amplificada por PCR a partir de um molde de cDNA de extensão completa. Sítios de restrição de Hinà III são adicionados a cada extremidade da ORF durante o PCR. Adicionalmente, a seqüência de nucleotídeo ACC é adicionada imediatamente 5' ao códon de início do gene para aumentar a eficiência traducional (Kozak (1987) Nucleic Acids Research 15:8125-8148; Joshi (1987) Nucleic Acids Research 15:6643-6653). O produto de PCR é clonado e seqüenciado, u-sando técnicas bem-conhecidas na técnica, para garantir que nenhuma mutação seja introduzida durante o PCR.

O plasmídeo contendo o produto de PCR de grg12 é digerido com, por exemplo, Hinó III e o fragmento contendo a ORF intacta é isolado. Nesse exemplo, o fragmento é clonado no sítio de Hinó III de um plasmídeo, tal como pAX200, que é um vetor de expressão de planta que contém o promotor de actina do arroz (McEIroy et al. (1991) Molec. Gen. Genet. 231:150-160), e o terminador Pinll (An et al. (1989) The Plant Cell 1:115-122). O fragmento promotor - gene - terminador desse plasmídeo intermediário é então subclonado em um plasmídeo tal como pSB11 (Japan Tobacco, Inc.) para formar um plasmídeo final referido aqui como pSB11GRG12. pSB11GRG12 é organizado tal que o fragmento de DNA que contém o cons-truto do promotor - grg12- terminador pode ser cortado por enzimas de restrição apropriadas e também usando para transformação em plantas, porexemplo, por injeção de um feixe de aerossol. A estrutura de pSB11GRG12 é verificada por digestão de restrição e eletroforese em gel e por seqüenci-amento através das várias junções de clonagem.

O plasmídeo é mobilizado em Agrobacterium tumefaciens cepa LBA4404 que também carrega o plasmídeo pSB1 (Japan Tobacco, Inc.), usando procedimentos de acasalamento triparentais bem-conhecidas na técnica, e plaqueamento sobre meio contendo antibiótico. O plasmídeo pSB11GRG12 carrega resistência a espectinomicina mas é um plasmídeo de estreita variação de hospedeiro e não pode replicar em Agrobacterium.

Colônias resistentes a antibiótico surgem quando pSB11GRG12 se integra no plasmídeo de ampla variação de hospedeiro pSB1 através de recombina-ção homologa. O produto co-integrado resultante é verificado por hibridiza-ção Southern. A cepa de Agrobacterium que carrega o co-integrado pode ser usada para transformar milho, por exemplo, pelo método Purelntro (Japan

Tobacco).

Exemplo 21. Transformação de gral2 em Células de Planta

Espigas de milho são melhor colhidas 8-12 dias após a poliniza-ção. Os embriões são isolados a partir das espigas, e esses embriões de 0,8-1,5 mm de tamanho são preferidos para uso na transformação. Os em-

briões são plaqueados com o escutelo para cima sobre um meio de incuba-ção adequado, tal como meio DN62A5S (3,98 g/L de Sais N6; 1 mLA (de estoque 1000x) de vitaminas N6; 800 mg/L de L-Asparagina; 100 mg/L de Mio-inositol; 1,4 g/L de L-Prolina; 100 mg/L de Casaminoácidos; 50 g/L de sacarose; 1 mL/L (de estoque a 1 mg/mL) de 2,4-D). Entretanto, o meio e os

sais diferentes de DN62A5S são adequados e conhecidos na técnica. Os embriões são incubados durante a noite a 25°C no escuro. Entretanto, não é necessário per se incubar os embriões durante a noite.

Os explantes resultantes são transferidos para "mesh squares" (30-40 por placa), transferidos para meio osmótico por cerca de 30-45 mínu- tos, e então transferidos para uma placa de irradiação (veja, por exemplo, Publicação PCT NQ WO/0138514 e Patente U.S. Ng 5.240.842).

Os construtos de DNA projetados para expressar GRG12 emcélulas de planta são acelerados em tecido de planta usando um acelerador de feixe de aerossol, usando condições essencialmente como descritas na Publicação PCT NQ WO/0138514. Após a irradiação, os embriões são incubados por cerca de 30 minutos em meio osmótico, e colocados em meio de incubação durante a noite a 25°C no escuro. Para evitar danos excessivos ao explantes irradiados, eles são incubados por pelo menos 24 horas antes da transferência para meio de recuperação. Os embriões são espalhados sobre meio de período de recuperação, por cerca de 5 dias, 25°C no escuro, e então transferidos para um meio de seleção. Os explantes são incubados em meio de seleção por até oito semanas, dependendo da natureza e características da seleção em particular utilizada. Após o período de seleção, o calo resultante é transferido para meio de maturação de embrião, até a formação de embriões somáticos maduros ser observada. Os embriões somáticos maduros resultantes são então colocados sob luz leve, e o processo de regeneração é iniciado por métodos conhecidos na técnica. Os brotos resultantes são deixados enraizar em meio de enraizamento, e as plantas resultantes são transferidas para sementeiras e propagadas como plantas trans-gênicas. Materiais

Tabela 6. Meio BN62A5S

<table>table see original document page 56</column></row><table>O pH da solução é ajustado para pH 5.8 com KOH 1N/KCI 1N, Gelrite (Sigma) é adicionado em uma concentração de até 3g/L, e o meio é autoclavado. Após o resfriamento para 50°C, 2 ml/L de uma solução estoque a 5 mg/ml de nitrato de prata (Phytotechnology Labs) é adicionado.Exemplo 22. Transformação de ara12em Células de Milho por Transformação Mediada por Agrobacterium

Espigas são melhor colhidas 8-12 dias após a polinização. Os embriões são isolados a partir das espigas, e esses embriões de 0,8-1,5 mm de tamanho são preferidos para uso na transformação. Os embriões são plaqueados com o escutelo para cima em um meio de incubação adequado, e incubados durante a noite a 25°C no escuro. Entretanto, não é necessário per se incubar os embriões durante a noite. Os embriões são colocados em contato com uma cepa de Agrobacterium contendo os vetores apropriados para a transferência mediada pelo plasmídeo Ti por cerca de 5-10 min, e então plaqueados em meio de co-cultivo por cerca de 3 dias (25°C no escuro). Após o co-cultivo, os explantes são transferidos para meio de período de recuperação por cerca de cinco dias (a 25°C no escuro). Os explantes são incubados em meio de seleção por até oito semanas, dependendo da natureza e características da seleção em particular utilizada. Após o período de seleção, o calo resultante é transferido para meio de maturação de embrião, até a formação de embriões somáticos maduros ser observada. Os embriões somáticos maduros resultantes são então colocados sob luz baixa, e o processo de regeneração é iniciado como conhecido na técnica. Os brotos resultantes são deixados enraizar em meio de enraizamento, e as plantas resultantes são transferidas para sementeiras e propagadas como plantas transgênicas.

Todas as publicações e pedidos de patente mencionados no relatório descritivo são indicativos do nível de perícia dos versados na técnica a qual essa invenção pertence. Todas as publicações e pedidos de patente estão aqui incorporados por referência na da mesma forma que se cada publicação ou pedido de patente individual fosse específica e individualmente indicado para ser incorporado por referência.

Embora a invenção anterior tenha sido descrita em algum detalhe por meio de ilustração e exemplo para fins de clareza de entendimento, será óbvio que certas alterações e modificações podem ser praticadas dentro do escopo das reivindicações anexas.Listagem de Seqüências

<110> Carozzi, Nadine Carr, Brian Hammer, Philip E.

<120> IDENTIFICAÇÃO DE UMA NOVA CLASSE DE EPSP SINTASES

<130> 045600/310289

<150> 60/669,686

<151> 2005-04-08

<150> 60/678,348 <151> 2005-05-06

<150> 60/695,193 <151> 2005-06-29

<150> 60/725,182 <151> 2005-10-11

<160> 68

<170> FastSEQ para Windows versão 4.0

<210> 1

<211> 1257

<212> DNA

<213> Pseudomonas syringae <220>

<221> CDS

<222> (1) ... (1257)

<221> Região de interesse biológico

<222> (0) ... (0)

<223> Gene EPSPS da cepa DC3000

<400> 1 =

atg cga cct caa gcc act etc act gtt atg cet gtc gag cgc ceg ctg 48 Met Arg Pro Gln Ala Thr Leu Thr Vai Met Pro Vai Glu Arg Pro Leu 1 5 10 15

gtc ggg cgc gtc age ceg ceg ggc tec aag tcg ate acc aac cgc gea 96 Vai Gly Arg Vai Ser Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala 20 25 30

ctg ctg ctg gcg ggg ctt gcc aaa ggc acc age cgc ctg acc ggc gcg 144 Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala 35 40 45

ctg aag agt gac gat acc cgt gtg atg tec gaa gea ctg cga ctg atg 192 Leu Lys Ser Asp Asp Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met 50 55 60

ggc gtg cag gtc gac gag ceg gat gac age acc ttt gtg gtc acc age 240 Gly Vai Gln Vai Asp Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser 65 70 75 80

age ggc cac tgg caa gcg ceg cag caa gcg ctg ttt etc ggc aac gcc 288 Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala 85 90 95999 acc 9C9 ac9 C9C tfct ct9 acc 9ct 9C9 ct9 9CC aac ttt gaa ggc 336 Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly 100 105 110

gac ttc gtg gtg gat ggc gac gag tac atg cgt aaa cgc ccg ate ggc 384 Asp Phe Vai Vai Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly 115 120 125

ccg ctg gtc gat gcc ttg cag cgc atg ggc gtg gaa ate age gcg cec 432 Pro Leu Vai Asp Ala Leu Gln Arg Met Gly Vai Glu lie Ser Ala Pro 130 135 140

age ggt tgc ccg cec gtg gcg ate aag ggc aag ggc ggt ctg caa gcc 480 Ser Gly Cys Pro Pro Vai Ãla lie Lys Gly Lys Gly Gly Leu Gln Ala 145 150 155 160

999 c9fc stt gaa ate gac ggc aac ctg tec age cag tac gta tcg gcg 528 Gly Arg lie Glu Xle Asp Gly Asn Leu Ser Ser Gln Tyr Vai Ser Ala 165 170 175

ctg ctg atg gcc gga gcg tgt ggc aaa ggc tcg ctt gaa gtt gct ctg 576 Leu Leu Met Ala Gly Ala Cys Gly Lye Gly Ser Leu Glu Vai Ala Leu 180 185 190

acc ggt age gag ate ggc gea cgc ggc tat gtc gac ctg acc ctg gcg 624 Thr Gly Ser Glu lie Gly Ala Arg Gly Tyr Vai Asp Leu Thr Leu Ala 195 200 205

gcg atg cag gcc ttc ggc gct gaa gtt cag gcc ate ggc gac gct gcc 672 Ala Met Gln Ala Phe Gly Ala Glu Vai Gln Ala lie Gly Asp Ala Ala 210 215 220

tgg aaa gtc tcg gcc acc ggc tac cac gct acg gat ttc cac ate gag 720 Trp Lys Vai Ser Ala Thr Gly Tyr His Ala Thr Asp Phe His lie Glu 225 230 235 240

ccg gat gea tcg gea gcc acc tac etc tgg gcc gea caa gcc ctg acc 768 Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr 245 250 255

gaa ggc aac ate gac ctg ggc gtg gcc agt gat gea ttc act cag cet 816 Glu Gly Asn lie Asp Leu Gly Vai Ala Ser Asp Ala Phe Thr Gln Pro 260 265 270

gac gcg ctg gcc age cag ate ate gac age ttc ccg aac atg ccg gcg 864 Asp Ala Leu Ala Ser Gln lie lie Asp Ser Phe Pro Asn Met Pro Ala 275 280 285

gtg ate gac ggt tcg caa atg cag gac gcc att ccg acc etc gea gtg 912 Vai lie Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr Leu Ala Vai 290 295 300

etc gcg gcc ttc aat cgt cag ccg gta cgc ttc gtc ggc ate gcc aac 960 Leu Ala Ala Phe Asn Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Asn 305 310 315 320

ctg cgg gtc aag gaa tgt gat cgt att tca gcg ctg tgt gac ggc ctg 1008 Leu Arg Vai Lys Glu Cys Asp Arg lie Ser Ala Leu Cys Asp Gly Leu 325 330 335

tgc gcc ate gea ccg ggc ctt gcg gtt gaa gag ggc gac gac ctg ate 1056 Cys Ala lie Ala Pro Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu lie 340 345 350

gtg cac gcc aac ccg gcg ctg gea ggg acc aca gtc aac gea ctg ate

1104Vai His Ala Asn Pro Ala Leu Ala Gly Thr Thr Vai Asn Ala Leu lie 35S 360 365

gac acc cat tcc gac cat cgc ate gcc atg tgc ttt gcc ctg gct ggt 1152 Asp Thr His Ser Asp His Arg lie Ala Met Cys Phe Ala Leu Ala Gly 370 375 380

ttg aag ate aaa ggc ate cat att cag gat cec gat tgc gtc gcc aag 1200 Leu Lys lie Lys Gly lie His lie Gln Asp Pro Asp Cys Vai Ala Lys 385 330 395 400

acc tat ceg ggt tac tgg gat gcg ctg gct tcg ctg ggg gtg agt gtt 1248 Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Vai Ser Vai 405 410 415

cag cgc tga 1257 Gln Arg *

<210> 2 <211> 418 <212> PRT

. <213> Pseudomonas syringae <400> 2

Met Arg Pro Gln Ala Thr Leu Thr Vai Met Pro Vai Glu Arg Pro Leu

15 10 15

Vai Gly Arg Vai Ser Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala

20 25 30

Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala

35 40 45

Leu Lys Ser Asp Asp Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met

50 55 60

Gly Vai Gln Vai Asp Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser 65 70 75 80

Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala

85 90 95

Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly

100 105 110

Asp Phe Vai Vai Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly

115 120 125

Pro Leu Vai Asp Ala Leu Gln Arg Met Gly Vai Glu lie Ser Ala Pro

130 s- 135 140

Ser Gly Cys Pro Pro Vai Ala lie Lys Gly Lys Gly Gly Leu Gln Ala 145 150 155 160

Gly Arg lie Glu lie Asp Gly A6n Leu Ser Ser Gln Tyr Vai Ser Ala

165 170 175

Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Ser Leu Glu Vai Ala Leu

180 185 190

Thr Gly Ser Glu lie Gly Ala Arg Gly Tyr Vai Asp Leu Thr Leu Ala

195 200 205

Ala Met Gln Ala Phe Gly Ala Glu Vai Gln Ala lie Gly Asp Ala Ala

210 215 220

Trp Lys Vai Ser Ala Thr Gly Tyr His Ala Thr Asp Phe His lie Glu 225 230 235 240

Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr

245 250 255

Glu Gly Asn lie Asp Leu Gly Vai Ala Ser Asp Ala Phe Thr Gln Pro

260 265 270

Asp Ala Leu Ala Ser Gln lie lie Asp Ser Phe Pro Asn Met Pro Ala

275 280 285

Vai lie Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr Leu Ala Vai

290 295 300

Leu Ala Ala Phe Asn Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Asn 305 310 315 320Leu Arg Vai Lys Glu Cys Asp Arg lie Ser Ala Leu Cys Asp Gly Leu

325 330 335

Cys Ala lie Ala Pro Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu lie

340 345 350

Vai His Ala Asn Pro Ala Leu Ala Gly Thr Thr Vai Asn Ala Leu lie

355 360 365

Asp Thr His Ser Asp His Arg lie Ala Met Cys Phe Ala teu Ala Gly

370 375 380

Leu Lys lie Lys Gly lie His lie Gln Asp Pro Asp Cys Vai Ala Lys

385 390 395 400

Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Vai Ser Vai

405 410 415

Gln Arg

<210> 3

<211> 1278

<212> DNA

<213> Agrobacterium tumifaciens <220>

<221> CDS

<222> (1) ... (1278)

<221> Região de interesse biológico

<222> (0) ... (0)

<223> EPSPS da cepa C58

<400> 3

atg ate gaa ctg acc ate acc ceg cec ggc cac ceg ctt tec ggc aag 48

Met lie Glu Leu Thr lie Thr Pro Pro Gly His Pro Leu Ser Gly Lys 1 5 10 15

gtg gag ceg cec ggc tec aaa tec ate acc aac cgc gcg ctt etc ttg 96 Vai Glu Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu 20 25 30

gcc ggc etc gcc aag ggc aaa age cac ttg tca ggc gcc ctg aaa age 144 Ala Gly Leu Ala Lys Gly Lys Ser His Leu Ser Gly Ala Leu Lys Ser 35 40 45

gac gat acg ctt tat atg gcc gaa gct ctg cgg gag atg ggc gtg aag 192 Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Vai Lys 50 55 60

gtc acc gag cet gac gcc acc acc ttc gtg gtg gag gga acg ggc gtg 240 Vai Thr Glu Pro Asp Ala Thr Thr Phe Vai Vai Glu Gly Thr Gly Vai 65 70 75 80

ctg cag cag ceg gaa aag ceg ctg ttc etc ggc aat gcc ggc acc gcc 288 Leu Gln Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala 85 90 95

acg cgg ttc ctg act gcc gcc ggg gea ctt gtc gat ggc gcc gtc ate 336 Thr Arg Phe Leu Thr Ala Ala Gly Ala Leu Vai Asp Gly Ala Vai lie 100 105 110

ate gat ggg gac gaa cat atg cgc aaa cgc ceg ata ctg ceg ctg gtg 384 lie Asp Gly Asp Glu His Met Arg Lys Arg Pro lie Leu Pro Leu Vai 115 120 125

cag gcg ctg cgg gct etc ggc gtg gaa gcg gat gcg cca acc ggc tgc Gln Ala Leu Arg Ala Leu Gly Vai Glu Ala Asp Ala Pro Thr Gly Cys 130 135 140ccg cct gtc acc gtc cgt ggc aag ggt atg ggt ttt cca aag ggc age Pro Pro Vai Thr Vai Arg Gly Lys Gly Met Gly Phe Pro Lys Gly Ser 145 150 155 160

480

gtc acc ate gac gcc aat etc tec age cag tat gtg tcg gea ctg ttg 528 Vai Thr lie Asp Ala Asn Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu 165 170 175

atg gcc gcc gcc tgc ggt gac aag cec gtg gat ate ate ctg aag ggt 576 Met Ala Ala Ala Cye Gly Asp Lys Pro Vai Asp lie lie Leu Lys Gly 180 185 190

gag gaa ate ggc gcg aag ggc tat ate gac etc acc aca tec gcc atg 624 Glu Glu lie Gly Ala Lys Gly Tyr lie Asp Leu Thr Thr Ser Ala Met 195 200 205

gaa gcc ttc gga gcg aag gtg gag cgg gtc age aac gcc ate tgg cgc 672 Glu Ala Phe Gly Ala Lys Vai Glu Arg Vai Ser Asn Ala lie Trp Arg 210 215 220

gtg cat ccg acc ggt tac acg gea acc gat ttc cac ate gag ccg gat 720 Vai His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His lie Glu Pro Asp 225 230 235 240

gcc tec gcc gcc acc tat etc tgg ggc gcg gag ctt ctg acc ggc ggt 768 Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly 245 250 255

gct ate gat ate ggc acg cec gct gac aaa ttc act cag ccg gat gcc 816 Ala lie Asp lie Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala 260 265 270

aag gct tat gag gtc atg gcg cag ttt ccg cat ctg cec gcc gaa ate 864 Lys Ala Tyr Glu Vai Met Ala Gln Phe Pro His Leu Pro Ala Glu lie 275 280 285

gac ggt tcg cag atg cag gac gcc att cca acc ate gcg gtt ate gcc 912 Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr lie Ala Vai lie Ala 290 295 300

gcc ttc aac gag acg ccg gtg cgt ttc gtc ggc ate gcc aat ctg cgc 960 Ala Phe Asn Glu Thr Pro Vai Arg Phe Vai Gly lie Ala Asn Leu Arg 305 ^ 310 315 320

gtc aag gaa tgc gac cgc ate cgc gcc gtc tcg etc ggc etc aac gaa 1008 Vai Lys Glu Cys Asp Arg lie Arg Ala Vai Ser Leu Gly Leu Asn Glu 325 330 335

ate cgc gag ggt ctg gcg cat gaa gag ggt gac gac ctg ate gta cat 1056 lie Arg Glu Gly Leu Ala His Glu Glu Gly Asp Asp Leu lie Vai His 340 345 350

gcc gat ccg tcg etc gcc ggg cag acg gtc gat gcc tec ate gat acc 1104 Ala Asp Pro Ser Leu Ala Gly Gln Thr Vai Asp Ala Ser lie Asp Thr 355 360 365

ttt gcc gat cac cgc ate gcc atg agt ttt gea ctg gcg gcg etc aag 1152 Phe Ala Asp His Arg lie Ala Met Ser Phe Ala Leu Ala Ala Leu Lys 370 375 380

ate gga ggc ate gcc ate cag aat cec gcc tgc gtg gcc aag acc tat 1200 lie Gly Gly lie Ala lie Gln Asn Pro Ala Cys Vai Ala Lys Thr Tyr 385 390 395 400

ccg ggc tac tgg aaa gcg ctt gcc tcg etc ggc gtc gac tat acc gaa 1248 Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Vai Asp Tyr Thr Glu405 410 415

aag gaa age gct gcc gag ceg cag cac tga 1278 Lys Glu Ser Ala Ala Glu Pro Gln His * 420 425

4

<211> 425 <212> PRT

<213> Agrobacterium tumifaciens <400> 4

Met - lie Glu Leu Thr lie Thr Pro Pro Gly His Pro Leu Ser Gly Lys

1 5 10 15

Vai Glu Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu

20 25 30

Ala Gly Leu Ala Lys Gly Lys Ser His Leu Ser Gly Ala Leu Lys Ser

35 40 45

Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Vai Lys

50 55 60

Vai Thr Glu Pro Asp Ala Thr Thr Phe Vai Vai Glu Gly Thr Gly Vai 65 70 75 80

Leu Gln Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala

85 90 95

Thr Arg Phe Leu Thr Ala Ala Gly Ala Leu Vai Asp Gly Ala Vai lie

100 105 110

lie Asp Gly Asp Glu His Met Arg Lys Arg Pro lie Leu Pro Leu Vai

115 120 125

Gln Ala Leu Arg Ala Leu Gly Vai Glu Ala Asp Ala Pro Thr Gly Cys

130 135 140

Pro Pro Vai Thr Vai Arg Gly Lys Gly Met Gly Phe Pro Lys Gly Ser 145 150 155 160

Vai Thr lie Asp Ala Asn Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu

165 170 175

Met Ala Ala Ala Cys Gly Asp Lys Pro Vai Asp lie lie Leu Lys Gly

180 185 190

Glu Glu lie Gly Ala Lys Gly Tyr lie Asp Leu Thr Thr Ser Ala Met

195 200 205

Glu Ala Phe Gly Ala Lys Vai Glu Arg Vai Ser Asn Ala lie Trp Arg

210 215 220

Vai His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His lie Glu Pro Asp 225 230 235 240

Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly

245 250 255

Ala lie Asp lie Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala

260 265 270

Lys Ala Tyr Glu Vai Met'Ala Gln Phe Pro His Leu Pro Ala Glu lie

275 280 285

Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr lie Ala Vai lie Ala

290 295 300

Ala Phe Asn Glu Thr Pro Vai Arg Phe Vai Gly lie Ala Asn Leu Arg 305 310 315 320

Vai Lys Glu Cys Asp Arg lie Arg Ala Vai Ser Leu Gly Leu Asn Glu

325 330 335

lie Arg Glu Gly Leu Ala His Glu Glu Gly Asp Asp Leu lie Vai His

340 345 350

Ala Asp Pro Ser Leu Ala Gly Gln Thr Vai Asp Ala Ser lie Asp Thr

355 360 365

Phe Ala Asp His Arg lie Ala Met Ser Phe Ala Leu Ala Ala Leu Lys

370 375 380

lie Gly Gly lie Ala lie Gln Asn Pro Ala Cys Vai Ala Lys Thr Tyr 385 390 395 400

Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Vai Asp Tyr Thr Glu

405 410 415

Lys Glu Ser Ala Ala Glu Pro Gln His<210> 5 <211> 1398 <212> DNA

<213> Enterobacteriaceas <220>

<221> CDS

<222> (103) ... (1398)

<400> 5

aaaaaaggaa atgaactatg tgttgctgga aaaagtaggg aagggagtgg tgaagagtat 60 tccactggtt caattagaaa aaatcattca aggattacca aa gtg aaa gta aca 114

Vai Lys Vai Thr

ata cag ccc gga gat ctg act gga att ate cag tca cec gct tca aaa 162 lie Gln Pro Gly Asp Leu Thr Gly lie lie Gln Ser Pro Ala Ser Lys 5 10 15 20

agt tcg atg cag cga gct tgt gct gct gca ctg gtt gca aaa gga ata 210 Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Vai Ala Lys Gly lie 25 30 35

agt gag ate att aat ccc ggt cat age aat gat gat aaa gct gcc agg 258 Ser Glu lie lie Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg 40 45 50

gat att gta age cgg ctt ggt gcc agg ctt gaa gat cag cet gat ggt 306 Asp lie Vai Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly 55 60 65

tet ttg cag ata aca agt gaa ggc gta aaa cet gtc gct cet ttt att 354 Ser Leu Gln lie Thr Ser Glu Gly Vai Lys Pro Vai Ala Pro Phe lie 70 75 80

gac tgc ggt gaa tet ggt tta agt ate cgg atg ttt act ceg att gtt 402 Asp Cys Gly Glu Ser Gly Leu Ser lie Arg Met Phe Thr Pro lie Vai 85 90 95 100

gcg ttg agt aaa gaa gag gtg acg ate aaa gga tet gga age ctt gtt 450 Ala Leu Ser Lys Glu Glu Vai Thr lie Lys Gly Ser Gly Ser Leu Vai i- 105 110 115

aca aga cca atg gat ttc ttt gat gaa att ctt ceg cat etc ggt gta 498 Thr Arg Pro Met Asp Phe Phe Asp Glu lie Leu Pro His Leu Gly Vai 120 125 130

aaa gtt aaa tet aac cag ggt aaa ttg cet etc gtt ata cag ggg cca 546 Lys Vai Lys Ser Asn Gln Gly Lys Leu Pro Leu Vai lie Gln Gly Pro 135 140 145

ttg aaa cca gca gac gtt acg gtt gat ggg tec tta age tet cag ttc 594 Leu Lys Pro Ala Asp Vai Thr Vai Asp Gly Ser Leu Ser Ser Gln Phe 150 155 160

ctt aca ggt ttg ttg ctt gca tat gcg gcc gca gat gca age gat gtt 642 Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Vai 165 170 175 180

gcg ata aaa gta acg aat etc aaa age cgt ceg tat ate gat ctt aca 690 Ala lie Lys Vai Thr Asn Leu Lys Ser Arg Pro Tyr lie Asp Leu Thr 185 190 195ctg gat gtg atg aag cgg ttt ggt ttg aag act ccc gag aat cga aac 738 Leu Asp Vai Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn 200 205 210

tat gaa gag ttt tat ttc aaa gcc ggg aat gta tat gat gaa acg aaa 786 Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Vai Tyr Asp Glu Thr Lys 215 220 225

atg caa cga tac acc gta gaa ggc gac tgg age ggt ggt gct ttt tta 834 Met Gln Arg Tyr Thr Vai Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu 230 235 240

ctg gta gcg ggg gct att gcc ggg ceg ate acg gta aga ggt ttg gat 882 Leu Vai Ala Gly Ala lie Ala Gly Pro lie Thr Vai Arg Gly Leu Asp 245 250 255 260

ata gct tcg acg cag gct gat aaa gcg ate gtt cag gct ttg atg agt 930 lie Ala Ser Thr Gln Ala Asp Lys Ala lie Vai Gln Ala Leu Met Ser 265 270 275

gcg aac gea ggt att gcg att gat gea aaa gag ate aaa ctt cat cet 578 Ala Asn Ala Gly lie Ala lie Asp Ala Lys Glu lie Lys Leu His Pro 280 285 290

gct gat etc aat gea ttt gaa ttt gat gct act gat tgc ceg gat ctt 1026 Ala Asp Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu 295 300 305

ttt ceg cca ttg gtt gct ttg gcg tet tat tgc aaa gga gaa aca aag 1074 Phe Pro Pro Leu Vai Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys 310 315 320

ate aaa ggc gta age agg ctg gcg cat aaa gaa agt gac aga gga ttg 1122 lie Lys Gly Vai Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu 325 330 335 340

acg ctg cag gac gag ttc ggg aaa atg ggt gtt gaa ate cac ctt gag 1170 Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Vai Glu lie His Leu Glu 345 350 355

gga gat ctg atg cgc gtg ate gga ggg aaa ggc gta aaa gga gct gaa 1218 Gly Asp Leu Met Arg Vai lie Gly Gly Lys Gly Vai Lys Gly Ala Glu 360 365 370

gtt agt tca agg cac gat cat cgc att gcg atg gct tgc gcg gtg gct 1266 Vai Ser Ser Arg His Asp His Arg lie Ala Met Ala Cys Ala Vai Ala 375 380 385

gct tta aaa gct gtg ggt gaa aca acc ate gaa cat gea gaa gcg gtg 1314 Ala Leu Lys Ala Vai Gly Glu Thr Thr lie Glu His Ala Glu Ala Vai 390 395 400

aat aaa tec tac ceg gat ttt tac age gat ctt aaa caa ctt ggc ggt 1362 Asn Lys Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly 405 410 415 420

gtt gta tet tta aac cat caa ttt aat ttc tca tga 1398 Vai Vai ser Leu Asn His Gln Phe Asn Phe Ser * 425 430

<210> 6 <211> 431 <212> PRT

<213> Enterobacteriaceas

<400>Vai Lys Vai Thr lie Gln Pro Gly Asp Leu Thr Gly lie lie Gln Ser

15 10 15

Pro Ala Ser Lys Ser Ser Met Gln Arg Ala Cys Ala Ala Ala Leu Vai

20 25 30

Ala Lys Gly lie Ser Glu lie lie Asn Pro Gly His Ser Asn Asp Asp

35 40 45

Lys Ala Ala Arg Asp lie Vai Ser Arg Leu Gly Ala Arg Leu Glu Asp

50 55 60

Gln Pro Asp Gly Ser Leu Gln lie Thr Ser Glu Gly Vai Lys Pro Vai 65 70 75 80

Ala Pro Phe lie Asp Cys Gly Glu Ser Gly Leu Ser lie Arg Met Phe

85 90 95

Thr Pro lie Vai Ala Leu Ser Lys Glu Glu Vai Thr lie Lys Gly Ser

100 105 110

Gly Ser Leu Vai Thr Arg Pro Met Asp Phe Phe Asp Glu lie Leu Pro

115 120 125

His Leu Gly Vai Lys Vai Lys Ser Asn Gln Gly Lys Leu Pro Leu Vai

130 135 140

lie Gln Gly Pro Leu Lys Pro Ala Asp Vai Thr Vai Asp Gly Ser Leu 145 150 155 160

Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp

165 170 175

Ala Ser Asp Vai Ala lie Lys Vai Thr Asn Leu Lys Ser Arg Pro Tyr

180 185 190

lie Asp Leu Thr Leu Aep Vai Met Lys Arg Phe Gly Leu Lys Thr Pro

195 200 205

Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly Asn Vai Tyr

210 215 220

Asp Glu Thr Lys Met Gln Arg Tyr Thr Vai Glu Gly Asp Trp Ser Gly 225 230 235 240

Gly Ala Phe Leu Leu Vai Ala Gly Ala lie Ala Gly Pro lie Thr Vai

245 250 255

Arg Gly Leu Asp lie Ala Ser Thr Gln Ala Asp Lys Ala lie Vai Gln

260 265 270

Ala Leu Met Ser Ala Asn Ala Gly lie Ala lie Asp Ala Lys Glu lie

275 280 285

Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe ABp Ala Thr Asp

290 295 300

Cys Pro Asp Leu Phe Pro Pro Leu Vai Ala Leu Ala Ser Tyr Cys Lys 305 310 315 320

Gly Glu Thr Lys lie Lys Gly Vai Ser Arg Leu Ala His Lys Glu Ser

- 325 330 335

Asp Arg Gly LeIÈi Thr Leu Gln Asp Glu Phe Gly Lys Met Gly Vai Glu

340 345 350

lie His Leu Glu Gly Asp Leu Met Arg Vai lie Gly Gly Lys Gly Vai

355 360 365

Lys Gly Ala Glu Vai Ser Ser Arg His Asp His Arg lie Ala Met Ala

370 375 380

Cys Ala Vai Ala Ala Leu Lys Ala Vai Gly Glu Thr Thr lie Glu His 385 390 395 400

Ala Glu Ala Vai Asn Lye Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys

405 410 415

Gln Leu Gly Gly Vai Vai Ser Leu Asn His Gln Phe Asn Phe Ser 420 425 430

<210> 7 <211> 1257 <212> DNA

<213> Brevundomonas vesicularis 220>

221> CDS

222> (1) ... (1257)

400>

7atg atg atg ggt aga gcc aaa etc acg att ate ceg ceg ggc aag cet 48 Met Met Met Gly Arg Ala Lys Leu Thr lie lie Pro Pro Gly Lys Pro 15 10 15

ttg acc gga cgc gcc atg ceg ceg gga tcg aag tcg ate acc aac cgc 96 Leu Thr Gly Arg Ala Met Pro Pro Gly Ser Lys Ser lie Thr Asn Arg 20 25 30

gea ttg ctg etc gcc ggc etc gcc aag ggc acg age cgg cta acc ggt 144 Ala Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly 35 40 45

gcg ctg aag age gac gat acc cgc tat atg gcc gaa gcg ctg cgt gcg 192 Ala Leu Lys Ser Asp Asp Thr Arg Tyr Met Ala Glu Ala Leu Arg Ala 50 55 60

atg ggt gta acg ate gac gag cec gac gac acc acg ttc ate gtc aaa 240 Met Gly Vai Thr lie Asp Glu Pro Asp Asp Thr Thr Phe lie Vai Lys 65 70 75 80

ggc age ggc aag ctg cag ceg ceg gea gcc ceg ctt ttc etc ggc aat 288 Gly Ser Gly Lys Leu Gln Pro Pro Ala Ala Pro Leu Phe Leu Gly Asn 85 90 95

gcc ggc acg gea acg cgc ttc ctg acg gcg gcc gcg gea ctg gtg gac 336 Ala Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Vai Asp 100 105 110

ggc aag gtc ate gtc gac ggc gat gcc cat atg cgc aag cgg ceg ate 384 Gly Lys Vai lie Vai Asp Gly Asp Ala His Met Arg Lys Arg Pro lie 115 120 125

gga ceg cta gtc gac gcg ttg cgc tcg etc ggc ate gat gcc tcg gct 432 Gly Pro Leu Vai Asp Ala Leu Arg Ser Leu Gly lie ABp Ala Ser Ala 130 135 140

gaa acc ggc tgc ceg cca gtc acg ate aac ggc acc ggc cgc ttc gag 480 Glu Thr Gly Cys Pro Pro Vai Thr lie Asn Gly Thr Gly Arg Phe Glu 145 150 155 160

gea age cgc gtg cag ate gat ggc ggc ctg tec age cag tat gtc tcg 528 Ala Ser Arg Vai Gln lie Asp Gly Gly Leu Ser Ser Gln Tyr Vai Ser 165 170 175

gcg etc ctg atg atg gcc gcc ggc ggc gat cgc gct gtc gat gtc gag 576 Ala Leu Leu Met Met Ala Ala Gly Gly Asp Arg Ala Vai Asp Vai Glu 180 185 190

ctt etc ggc gaa cat ate ggc gct etc ggc tat ate gac ctg acc gtt 624 Leu Leu Gly Glu His lie Gly Ala Leu Gly Tyr lie Asp Leu Thr vai 195 200 205

gcc gcc atg cgc gct ttc ggc gcg aag gtt gag cgt gtg age ceg gtc 672 Ala Ala Met Arg Ala Phe Gly Ala Lys Vai Glu Arg Vai Ser Pro Vai 210 215 220

gcc tgg cgc gtc gag cec acc ggc tat cat gcg gcc gac ttc gtg ate 720 Ala Trp Arg Vai Glu Pro Thr Gly Tyr His Ala Ala Asp Phe Vai lie 225 230 235 240

gag ceg gat gcc tet gct gcg acc tat etc tgg gcc gcc gaa gtt ctg 768 Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Glu Vai Leu 245 250 255

a9c 99c ggc aag ate gat etc ggc acg ceg gcg gaa cag ttc tcg caa 816Ser Gly Gly Lys lie Asp Leu Gly Thr Pro Ala Glu Gln Phe Ser Gln 260 265 270

ccg gat gcg aaa gcc tat gat ctg att tcg aaa ttc ccg cat ctg cct 864 Pro Asp Ala Lys Ala Tyr Asp Leu lie Ser Lys Phe Pro His Leu Pro 275 280 285

gct gtc ate gac ggc tcg cag atg cag gac gcc ate ccg acg etc gcc 912 Ala Vai lie Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr Leu Ala 290 295 300

gtt etc gcc gct ttc aac gaa atg cct gtg cgc ttc gtc ggt ate gaa 960 Vai Leu Ala Ala Phe Asn Glu Met Pro Vai Arg Phe Vai Gly lie Glu 305 310 315 320

aac ctg cgc gtc aag gaa tgc gat cgt ate cgc gcg etc tcg age ggc 1008 Asn Leu Arg Vai Lys Glu Cys Asp Arg lie Arg Ala Leu Ser Ser Gly 325 330 335

cta tec cgc ate gtt ccg aac etc ggc acg gaa gag ggc gac gat etc 1056 Leu Ser Arg lie Vai Pro Asn Leu Gly Thr Glu Glu Gly Asp Asp Leu 340 345 350

ate ate gcc tec gat ccg age ctt gcc ggc aaa ate ctg acc gea gag 1104 lie lie Ala Ser Asp Pro Ser Leu Ala Gly Lys lie Leu Thr Ala Glu 355 360 365

ate gat age ttt gcc gat cac cgc ate gcc atg age ttt gcg ctg gcc 1152 lie Asp Ser Phe Ala Asp Kis Arg lie Ala Met Ser Phe Ala Leu Ala 370 375 380

ggc ctg aag ate ggc ggc att acc att etc gac cec gac tgc gtc gcc 1200 Gly Leu Lys lie Gly Gly lie Thr lie Leu Asp Pro Asp Cys Vai Ala 385 390 395 400

aag aca ttc ccg tec tac tgg aat gtg ctg tet tcg ctg ggg gtc gcc 1248 Lys Thr Phe Pro Ser Tyr Trp Asn Vai Leu Ser Ser Leu Gly Vai Ala 405 410 415

tac gaa gjac 1257 Tyr Glu Asp

<210> 8

<211> 419

<212> PRT

<213> Brevundomonas vesicularis

<400> 8

Met Met Met Gly Arg

1 5

Leu Thr Gly Arg Ala

20

Ala Leu Leu Leu Ala

35

Ala Leu Lys Ser Asp

50

Met Gly Vai Thr lie

65

Gly Ser Gly Lys Leu

85

Ala Gly Thr Ala Thr

100

Gly Lys Vai lie Vai

115

Ala Lys Leu Thr lie lie 10

Met Pro Pro Gly Ser Lys 25

Gly Leu Ala Lys Gly Thr 40

Asp Thr Arg Tyr Met Ala 55

Asp Glu Pro Asp Asp Thr 70 75 Gln Pro Pro Ala Ala Pro 90

Arg Phe Leu Thr Ala Ala 105

Asp Gly Asp Ala His Met 120

Pro Pro Gly Lys Pro 15

Ser lie Thr Asn Arg 30

Ser Arg Leu Thr Gly 45

Glu Ala Leu Arg Ala 60

Thr Phe lie Vai Lys 80

Leu Phe Leu Gly Asn 95

Ala Ala Leu Vai Asp 110

Arg Lys Arg Pro lie 125Gly Pro Leu Vai Asp Ala Leu Arg Ser Leu Gly lie Asp Ala Ser Ala

130 135 140

Glu Thr Gly Cys Pro Pro Vai Thr lie Asn Gly Thr Gly Arg Phe Glu 145 150 155 160

Ala Ser Arg Vai Gln lie Asp Gly Gly Leu Ser Ser Gln Tyr Vai Ser

165 170 175

Ala Leu Leu Met Met Ala Ala Gly Gly Asp Arg Ala Vai Asp Vai Glu

180 185 190

Leu Leu Gly Glu His lie Gly Ala Leu Gly Tyr lie Asp Leu Thr Vai

195 200 205

Ala Ala Met Arg Ala Phe Gly Ala Lys Vai Glu Arg Vai Ser Pro Vai

210 215 220

Ala Trp Arg Vai Glu Pro Thr Gly Tyr His Ala Ala Asp Phe Vai He 225 230 235 240

Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Glu Vai Leu

245 250 255

Ser Gly Gly Lys lie Asp Leu Gly Thr Pro Ala Glu Gln Phe Ser Gln

260 265 270

Pro Asp Ala Lys Ala Tyr Asp Leu lie Ser Lys Phe Pro His Leu Pro

275 280 285

Ala Vai lie Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr Leu Ala

290 295 300

Vai Leu Ala Ala Phe Asn Glu Met Pro Vai Arg Phe Vai Gly lie Glu 305 310 315 320

Asn Leu Arg Vai Lys Glu Cys Asp Arg lie Arg Ala Leu Ser Ser Gly

325 330 335

Leu Ser Arg lie Vai Pro Asn Leu Gly Thr Glu Glu Gly Asp Asp Leu

340 345 350

lie lie Ala Ser Asp Pro Ser Leu Ala Gly Lys lie Leu Thr Ala Glu

355 360 365

lie Asp Ser Phe Ala Asp His Arg lie Ala Met Ser Phe Ala Leu Ala

370 375 380

Gly Leu Lys lie Gly Gly lie Thr lie Leu Asp Pro Asp Cys Vai Ala 385 390 395 400

Lys Thr Phe Pro Ser Tyr Trp Asn Vai Leu Ser Ser Leu Gly Vai Ala 405 410 415

Tyr Glu Asp

<210> 9 <211> 1385 <212> DNA

<213> Ochrobactrum/Brucella <221> CDS

<222> (142) ... (1380)

<400> 9

gcgcatgcca ataaataacg cagatcaccc actcactcga caagcatggc gtgtttgcct 60 gatgattcgg gtccgcacgt cggccactcc acgccacctt gccttgacca ggagccttgt 120 accttgagtt cgcagaaaac c gtg acc gtt aca ccg ccc aac ttc ccc etc 171

Vai Thr Vai Thr Pro Pro Asn Phe Pro Leu 15 10

act ggc aag gtc gcg ccc ccc ggc tec aaa tec att acc aac cgt gcg 219 Thx Gly Lys Vai Ala Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala 15 20 25

ctg ttg etc gcg gea ctg gcc aag ggc acc age cgt ttg age ggt gcg 267 Leu Leu Leu Ala Ala Leu Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala 30 35 40

etc aaa age gat gac acg cgc cac atg tcg gtc gcc ctg cgg cag atg 315 Leu Lys Ser Asp Asp Thr Arg His Met Ser Vai Ala Leu Arg Gln Met 45 50 55ggc gtc acc ate gac gag ceg gac gac acc acc ttt gtc gtc acc age 363 Gly Vai Thr lie Asp Glu Pro Asp Asp Thr Thr Phe Vai Vai Thr Ser 60 65 70

caa ggc tcg ctg caa ttg ceg gcc cag ceg ttg ttc etc ggc aac gcc 411 Gln Gly Ser Leu Gln Leu Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala 75 80 85 90

ggc acc gcc atg cgc ttt etc acg gct gcc gtc gcc acc gtg caa ggc 459 Gly Thr Ala Met Arg Phe Leu Thr Ala Ala Vai Ala Thr Vai Gln Gly 95 100 105

acc gtg gta ctg gac ggt gac gag tac atg caa aaa cgc ceg ate ggc 507 Thr Vai Vai Leu Asp Gly Asp Glu Tyr Met Gln Lys Arg Pro lie Gly 110 115 120

ceg ctg ctg gcc acc ctg ggc cag aac ggc ate cag gtc gac age cec 555 Pro Leu Leu Ala Thr Leu Gly Gln Asn Gly lie Gln Vai Asp Ser Pro 125 130 135

acc ggt tgc cca ceg gta acg gtg cat ggc gcg ggc aag gtc cag gcc 603 Thr Gly Cys Pro Pro Vai Thr Vai His Gly Ala Gly Lys Vai Gln Ala 140 145 150

agg cgt ttt gag att gac gga ggc ttg tec age cag tac gta tcg gcc 651 Arg Arg Phe Glu lie Asp Gly Gly Leu Ser Ser Gln Tyr Vai Ser Ala 155 160 165 170

ctg ctg atg ctg gcg gcg tgc ggc gaa gea ceg att gaa gtg gcg ctg 699 Leu Leu Met Leu Ala Ala Cys Gly Glu Ala Pro lie Glu Vai Ala Leu 175 180 185

acc ggc aag gac ate ggc gcc cgt ggc tat gtg gac ctg acc etc gat 747 Thr Gly Lys Asp lie Gly Ala Arg Gly Tyr Vai Asp Leu Thr Leu Asp 190 195 200

tgc atg cgt gcg ttc ggg gcc cag gta gac ate gtg gac gac acc acc 795 Cys Met Arg Ala Phe Gly Ala Gln Vai Asp lie Vai Asp Aep Thr Thr 205 210 215

t99 cgc gtg gcc cec acg ggc tat acc gcc cat gat tac ctg ate gaa 843 Trp Arg Vai Ala Pro Thr Gly Tyr Thr Ala His Asp Tyr Leu lie Glu 220 â 225 230

cec gac gct tec gcc gcc act tac ctg tgg gcc gea gaa gta ctg acc 891 Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Glu Vai Leu Thr 235 240 245 250

ggt ggc cgt ate gat att ggt gta gcc gcg cag gac ttc acc cag cec 939 Gly Gly Arg He Asp He Gly Vai Ala Ala Gln Asp Phe Thr Gln Pro 255 260 265

gac gcc aag gea cag gcc gtg ate gcg caa ttc ceg aac atg cag gcc 987 Asp Ala Lys Ala Gln Ala Vai He Ala Gln Phe Pro Asn Met Gln Ala 270 275 280

acg gtg gtg ggt tca caa atg cag gat gcg ate ceg acc ctg gcg gtg 1035 Thr Vai Vai Gly Ser Gln Met Gln Asp Ala He Pro Thr Leu Ala Vai 285 290 295

etc gcc gea ttc aac aat acc ceg gtg cgc ttc act gaa ctg gcg aac 1083 Leu Ala Ala Phe Asn Asn Thr Pro Vai Arg Phe Thr Glu Leu Ala Asn 300 305 310

ctg cgc gtc aag gaa tgt gac cgc gtg cag gcg ctg cac gat ggc etc 1131Leu Arg Vai Lys Glu Cys Asp Arg Vai Gln Ala Leu His Asp Gly Leu 315 320 325 330

aac gaa att cgc ccg ggc ctg gcg acc ate gaa ggt gat gac ctg ctg 1179 Asn Glu lie Arg Pro Gly Leu Ala Thr lie Glu Gly Asp Asp Leu Leu 335 340 345

gtt gcc age gac cec gct ttg gct ggc acc gcc tgc acc gea ctg ate 1227 Vai Ala Ser Asp Pro Ala Leu Ala Gly Thr Ala Cys Thr Ala Leu lie 350 355 360

gat acc cac gcc gac cat cgc ate gcc atg tgc ttt gcc ctg gcc ggg 1275 Asp Thr His Ala Asp His Arg lie Ala Met Cys Phe Ala Leu Ala Gly 365 370 375

ctg aaa gtc tcg ggc att cgc ate caa gac cet gat tgc gta gcc aag 1323 Leu Lys Vai Ser Gly lie Arg lie Gln Asp Pro Asp Cys Vai Ala Lys 380 385 390

acc tac cet gac tac tgg aaa gcg ctg gcc age ctg ggc gtt cac tta 1371 Thr Tyr Pro Asp Tyr Trp Lys Ala Leu Ala Ser Leu Gly Vai His Leu 395 400 405 410

age tac tga cacac 1385 Ser Tyr *

<210> 10 <211> 444 <212> PRT

<213> Ochrobactrum/Brucella <400> 10

Met Ala Cy6 Leu Pro Asp Asp Ser Gly Pro His Vai Gly HÍ6 Ser Thr

15 10 15

Pro Pro Cys Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr

20 25 30

Vai Thr Vai Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Vai Ala Pro

35 40 45

Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu

50 55 60

Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr 65 70 75 80

Arg His Met Ser Vai Ala Leu Arg Gln Met Gly Vai Thr lie Asp Glu

85 90 95

Pro Asp Asp Thr Thr Phe Vai Vai Thr Ser Gln Gly Ser Leu Gln Leu

100 105 110

Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe

115 120 125

Leu Thr Ala Ala Vai Ala Thr Vai Gln Gly Thr Vai Vai Leu Asp Gly

130 135 140

Asp Glu Tyr Met Gln Lys Arg Pro lie Gly Pro Leu Leu Ala Thr Leu 145 150 155 160

Gly Gln Asn Gly lie Gln Vai Asp Ser Pro Thr Gly Cys Pro Pro Vai

165 170 175

Thr Vai His Gly Ala Gly Lys Vai Gln Ala Arg Arg Phe Glu lie Asp

180 185 190

Gly Gly I*eu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Leu Ala Ala

195 200 205

Cys Gly Glu Ala Pro lie Glu Vai Ala Leu Thr Gly Lys Asp lie Gly

210 215 220

Ala Arg Gly Tyr Vai Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly 225 230 235 240

Ala Gln Vai Asp lie Vai Asp Asp Thr Thr Trp Arg Vai Ala Pro Thr 245 250 255Gly Tyr Thr Ala His Asp Tyr Leu lie Glu Pro Asp Ala Ser Ala Ala

260 265 270

Thr Tyr Leu Trp Ala Ala Glu Vai Leu Thr Gly Gly Arg lie Asp lie

275 280 285

Gly Vai Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala

290 295 300

Vai lie Ala Gln Phe Pro Asn Met Gln Ala Thr Vai Vai Gly Ser Gln 305 310 315 320

Met Gln Asp Ala lie Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn Asn

325 330 335

Thr Pro Vai Arg Phe Thr Glu Leu Ala Asn Leu Arg Vai Lys Glu Cys

340 345 350

Asp Arg Vai Gln Ala Leu His Asp Gly Leu Asn Glu lie Arg Pro Gly

355 360 365

Leu Ala Thr lie Glu Gly Asp Asp Leu Leu Vai Ala Ser Asp Pro Ala

370 375 380

Leu Ala Gly Thr Ala Cys Thr Ala Leu lie Asp Thr His Ala Asp His 385 390 395 400

Arg lie Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Vai Ser Gly lie

405 410 415

Arg lie Gln Asp Pro Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp

420 425 430

Lys Ala Leu Ala Ser Leu Gly Vai His Leu Ser Tyr 435 440

<210> 11

<211> 1278

<212> DNA

<213> Desconhecido

<220>

<223> Isolado da amostra de solo

<221> CDS

<222> (1) ... (1278)

<400> 11

atg ate gaa ctg acc ate acc ceg cec ggc cac ceg ctt tec ggc aag 48 Met lie Glu Leu Thr lie Thr Pro Pro Gly His Pro Leu Ser Gly Lys 1 5 10 15

gtg gag ceg cec ggt tec aaa tec att acc aac cgt gea ctt ctg ctg 96 Vai Glu Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu 20 25 30

gcc ggg etc gcc àag ggc aaa age cgt etc acg ggc gcg ctg aaa age 144 Ala Gly Leu Ala Lys Gly Lys Ser Arg Leu Thr Gly Ala Leu Lys Ser 35 40 45

gac gat acg ctt tac atg gea gaa gcg ctg cgt gag atg ggt gtc aag 192 Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Vai Lys 50 55 60

gta acc gag cet gac gcg acc acc ttc gtg gtg gag agt tca ggt ggg 240 Vai Thr Glu Pro Asp Ala Thr Thr Phe Vai Vai Glu Ser Ser Gly Gly 65 70 75 80

ttg cat.cag ceg gaa aag ceg ctt ttc etc ggc aat gcc ggc aca gct 288 Leu His Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala 85 90 95

acc cgc ttt etc acc gcc gct gcc gcc ctt gtg gat ggc gcc gtc ate 336 Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Vai Asp Gly Ala Vai lie 100 10S lioate gat ggc gac gag cat atg cgc aaa cgc ceg ate atg ceg ctg gtg 384 lie Asp Gly Asp Glu His Met Arg Lys Arg Pro lie Met Pro Leu Vai 115 120 125

gaa gcc ctg cgc tec etc ggc gtt gag gcg gag gcg ceg acc ggc tgc 432 Glu Ala Leu Arg Ser Leu Gly Vai Glu Ala Glu Ala Pro Thr Gly Cys 130 135 140

ceg cec gtc acc gtc tgc ggt aag ggt act ggc ttc ceg aag ggc age 480 Pro Pro Vai Thr Vai Cys Gly Lys Gly Thr Gly Phe Pro Lys Gly Ser 145 150 155 160

gtc acg ate gac gcc aac ctt tec age cag tat gtg tec gea ctt ctg 528 Vai Thr lie Asp Ala Asn Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu 165 170 175

atg gcc gcc gcc tgc ggc gac aag cet gtc gat ate ate etc aaa ggt 576 Met Ala Ala Ala Cys Gly Asp Lys Pro Vai Asp lie lie Leu Lys Gly 180 185 190

gag gaa ate ggc gcg aag ggc tat ate gat etc acc aca tcg gcc atg 624 Glu Glu lie Gly Ala Lys Gly Tyr lie Asp Leu Thr Thr Ser Ala Met 195 200 205

gaa gcc ttc ggc gea aag gtg gag cgg gtc age aac gcc ate tgg cgc 672 Glu Ala Phe Gly Ala Lys Vai Glu Arg Vai Ser Asn Ala lie Trp Arg 210 215 220

gtg cat ceg acc ggc tac acg gcg acc gat ttc cat ate gag ceg gat 720 Vai His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His lie Glu Pro Asp 225 230 235 240

gcc tcg gcc gcc acc tat etc tgg ggc gct gag ctt ttg acc ggc ggc 768 Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly 245 250 255

gcc ate gat ate ggt acg ceg gcc gac aag ttc acc cag ceg gat gcc 816 Ala lie Asp lie Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala 260 265 270

aag gcc cat gag gtc atg gcg caa ttt ceg cat ctg cec gcc gaa ate 864 Lys Ala His Glu Vai Met Ala Gln Phe Pro His Leu Pro Ala Glu lie 275 280 285

gac ggt tcg cag atg cag gat gcc att cec acc att gcc gtt etc gcc 912 Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr lie Ala Vai Leu Ala 290 295 300

gcc ttt aac gaa acg ceg gtg cgt ttc gtc ggc ate gcc aat ctg cgc 960 Ala Phe Asn Glu Thr Pro Vai Arg Phe Vai Gly lie Ala Asn Leu Arg 305 310 315 320

gtc aag gag tgc gac cga ate cgc gcc gtc tca etc ggc etc aac gaa 1008 Vai Lys Glu Cys Asp Arg lie Arg Ala Vai Ser Leu Gly Leu Asn Glu 325 330 335

ate cgc gat ggt ctg gcg cat gag gaa ggc gac gac ttg ate gtg cat 1056 lie Arg Asp Gly Leu Ala His Glu Glu Gly Asp Asp Leu lie Vai His 340 345 350

tec gat cet tcg ctt gcg ggc cag acg gtg aat gcc tec ate gac act 1104 Ser Asp Pro Ser Leu Ala Gly Gln Thr Vai Asn Ala Ser lie Asp Thr 355 360 365

ttc gcc gac cac cgt ate gcc atg age ttt gcg ctg gcg gcg ctg aag 1152 Phe Ala Asp His Arg lie Ala Met Ser Phe Ala Leu Ala Ala Leu Ly6370 375 380

ate ggc ggc att gcc ate cag aat ceg gcc tgc gtg ggc aag acc tat 1200 lie Gly Gly lie Ala lie Gln Asn Pro Ala Cye Vai Gly Lys Thr Tyr 385 390 395 400

cec ggt tac tgg aag gcg etc gcc tcg ctg gga gtc gaa tac tcg gaa 1248 Pro Gly Tyr Trp Lys Ala Leu Ala Ser Leu Gly Vai Glu Tyr Ser Glu 405 410 415

aag gaa acc gct gcc gag ceg cag cat tag 1278 Lys Glu Thr Ala Ala Glu Pro Gln His * 420 425

<210> 12

<211> 425

<212> PRT

<213> Desconhecido

<220>

<223> Isolado da amostra de solo <400> 12

Met lie Glu Leu Thr lie Thr Pro Pro Gly His Pro Leu Ser Gly LyB

1 5 10 15

Vai Glu Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu

20 25 30

Ala Gly Leu Ala Lys Gly Lys Ser Arg Leu Thr Gly Ala Leu Lys Ser

35 40 45

Asp Asp Thr Leu Tyr Met Ala Glu Ala Leu Arg Glu Met Gly Vai Lys

50 55 60

Vai Thr Glu Pro Asp Ala Thr Thr Phe Vai Vai Glu Ser Ser Gly Gly 65 70 75 80

Leu His Gln Pro Glu Lys Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala

85 90 95

Thr Arg Phe Leu Thr Ala Ala Ala Ala Leu Vai Asp Gly Ala Vai lie

100 105 110

lie Asp Gly Asp Glu His Met Arg Lys Arg Pro lie Met Pro Leu Vai

115 120 125

Glu Ala Leu Arg Ser Leu Gly Vai Glu Ala Glu Ala Pro Thr <5ly Cys

130 135 140

Pro Pro Vai Thr Vai Cys Gly Lys Gly Thr Gly Phe Pro Lys Gly Ser 145 150 155 160

Vai Thr lie Asp Ala Asn Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu

165 170 175

Met Ala Ala Ala Cys Gly Asp Lys Pro Vai Asp lie lie Leu Lys Gly

180 185 190

Glu Glu lie Gly Ala Lys Gly Tyr lie Asp Leu Thr Thr Ser Ala Met

195 200 205

Glu Ala Phe Gly Ala Lys Vai Glu Arg Vai Ser Asn Ala lie Trp Arg

210 215 220

Vai His Pro Thr Gly Tyr Thr Ala Thr Asp Phe His lie Glu Pro Asp 225 230 235 240

Ala Ser Ala Ala Thr Tyr Leu Trp Gly Ala Glu Leu Leu Thr Gly Gly 245 250 255

Ala lie Asp He Gly Thr Pro Ala Asp Lys Phe Thr Gln Pro Asp Ala

260 265 270

Lys Ala His Glu Vai Met Ala Gln Phe Pro His Leu Pro Ala Glu lie

275 280 285

Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr lie Ala Vai Leu Ala

290 295 300

Ala Phe Asn Glu Thr Pro Vai Arg Phe Vai Gly lie Ala Asn Leu Arg 305 310 315 320

Vai Lys Glu Cys Asp Arg lie Arg Ala Vai Ser Leu Gly Leu Asn Glu 325 330 335He Arg Asp Gly 340 Leu Ala Hís Glu

Ser Asp Pro Ser Leu Ala Gly Gln

355 360

Phe Ala ABp His Arg He Ala Met

370 375

He Gly Gly He Ala He Gln Asn

385 390

Pro Gly Tyr Trp Lys Ala Leu Ala

405

Lys Glu Thr Ala 420 Ala Glu Pro Gln

Glu Gly Asp Asp Leu lie Vai His 345 350 Thr Vai Asn Ala Ser He Asp Thr 365

Ser Phe Ala Leu Ala Ala Leu Lys 380

Pro Ala Cys Vai Gly Lys Thr Tyr 395 400 Ser Leu Gly Vai Glu Tyr Ser Glu 410 415

His 425

<210> 13

<211> 17

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 5

<223> Xaa= Lys ou Thr

<221> VARIANTE

<222> 7

<223> Xaa= Arg ou His

<221> VARIANTE

<222> 9

<223> Xaa= Ser ou Thr

<400> 13

Leu Ala Lys Gly Xaa Ser Xaa Leu Xaa Gly Ala Leu Lys Ser Asp Asp

15 10 15

Thr

<210> 14

<211> 5

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE <222> 5

<223> Xaa= Lys ou Thr

<400> 14

Leu Ala Lys Gly Xaa

1 5

<210> 15

<211> 4

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> <222> <223>

VARIANTE 2

Xaa= Arg ou His<221> VARIANTE

<222> 4

<223> Xaa= Ser ou Thr

<400> 15

Ser Xaa Leu Xaa 1

<210> 16

<211> 8

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<400> 16

Gly Ala Leu Lys Ser Asp Asp Thr 1 5

<210> 17

<211> 13

<212> PRT

<213> Seqüência artificial

<220>

<223> Domínios conservados

<221> VARIANTE

<222> 4

<223> Xaa= Asp ou Ala

<221> VARIANTE

<222> 5

<223> Xaa= Ser ou Thr

<221> VARIANTE

<222> 8

<223> Xaa= Vai ou lie

<221> . VARIANTE <222> 10

<223> Xaa= Thr, Glu ou Lys

<221> VARIANTE

<222> (12) ... (0)

<223> Xaa= Gln, Ser, Glu ou Thr

<400> 17

Glu Pro Asp Xaa Xaa Thr Phe Xaa Vai Xaa Xaa Xaa Gly 15 20

<210> 18

<211> 9

<212> PRT

<213> Seqüência artificial

<220>

<223> Domínios conservados

<221> VARIANTE

<222> 4

<223> Xaa= Asp ou Ala<221> VARIANTE

<222> 5

<223> Xaa= Ser ou Thr

<221> VARIANTE

<222> 8

<223> Xaa= Vai ou lie

<400> 18

Glu Pro Asp Xaa Xaa Thr Phe Xaa Vai 1 5

<210> 19

<211> 4

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 1

<223> Xaa= Thr, Glu ou Lys

<221> VARIANTE

<222> 2

<223> Xaa= Ser ou Gly

<221> VARIANTE

<222> 3

<223> Xaa= Gln, Ser, Glu ou Thr

<400> 19

Xaa Xaa Xaa Gly 1

<210> 20

<211> 6

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<400> 20

Arg Phe Leu Thr Ala Ala

1 5

<210> 21

<211> 6

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 5

<223> Xaa= Gly, Met ou Leu

<400> 21

Lys Arg Pro lie Xaa Pro<210> 22 <211> 6 <212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE <222> 1

<223> Xaa= Thr ou Ser

<400> 22

Xaa Gly Cys Pro Vai

1 5

<210> 23

<211> 10

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 7

<223> Xaa= lie ou Vai

<400> 23

lie Gly Ala Xaa Gly Tyr Xaa Asp Leu Thr 1 5 10

<210> 24

<211> 7

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 2

<223> Xaa= Arg ou Lys

<221> VARIANTE

<222> 4

<223> Xaa= Ala, His, Glu ou Ser

<221> VARIANTE

<222> 5

<400> 24

Trp Xaa Vali Xaa Xaa Thr Gly 1 5

<210> 25

<211> 16

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 12

<223> Xaa= Ala ou Gly<221> VARIANTE <222> 14

<223> Xaa= Gly ou Gln

<221> VARIANTE <222> 15

<223> Xaa= Vai, Leu ou Ala <400> 25

Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Xaa Ala Xaa Xaa Leu 15 10 15

<210> 26

<211> 11

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<400> 26

Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp

1 5 10

<210> 27

<211> 4

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 3

<223> Xaa= lie ou Leu

<400> 27

lie Asp Xaa Gly 1

<210> 28

<211> 8

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 2

<223> Xaa= Thr ou Ser

<400> 28

Phe Xaa Gln Pro Asp Ala Lys Ala 1 5

<210> 29

<211> 28

<212> PRT

<213> Seqüência artificial

<220> <223>

Domínios conservados<221> VARIANTE <222> 1

<223> Xaa= Glu, Lys ou Ser

<221> VARIANTE

<222> 4

<223> Xaa= Asp ou His

Trp Xaa Vali Xaa Xaa Thr Gly 1 5

<221> VARIANTE

<222> 5

<223> Xaa= Met ou Leu

<221> VARIANTE <222> 6

<223> Xaa= Pro ou Gln

<221> VARIANTE <222> 8

<223> Xaa= Thr, Glu ou Vai

<221> VARIANTE <222> (9) ... (0)

<223> Xaa= Vai ou lie

<221> VARIANTE <222> (10) ... (0)

<223> Xaa= Asp ou Vai

<221> VARIANTE <222> (21) ... (0)

<223> Xaa= Leu ou lie

<221> VARIANTE <222> (24) ... (0)

<223> Xaa= Leu ou lie

<400> 29

Xaa Phe Pro Xaa Xaa Xaa Ala Xaa xaa Xaa Gly Ser Gln Met Gln Asp

1 S 10 15

Ala lie Pro Thr Xaa Ala Vai Xaa Ala Ala Phe Asn 20 25

<210> 30

<211> 7

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE <222> 1

<223> Xaa= Gln, Lys ou Ser

221> VARIANTE 222> 4

223> Xaa= Asp ou His

221> 222> 223>

VARIANTE 5

Xaa= Met ou Leu<221> VARIANTE

<222> 6

<223> Xaa= Pro ou Gln

<400> 30

Xaa Phe Pro Xaa Xaa Xaa Ala 1 5

<210> 31

<211> 21

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 1

<223> Xaa= Thr Glu ou Vai

<221> VARIANTE

<222> 2

<223> Xaa= Vai ou lie

<221> VARIANTE

<222> 3

<223> Xaa= Asp ou Vai

<221> VARIANTE <222> 14

<223> Xaa= Leu ou lie

<221> VARIANTE <222> 17

<223> Xaa= Leu ou lie <400> 31

Xaa Xaa Xaa Gly Ser Gln Met Gln Asp Ala lie Pro Thr Xaa Ala Vai

1 5 10 15

Xaa Ala Ala Phe Asn

20

<210> 32 <211> 10 <212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados <400> 32

Gly Ser Gln Met Gln Asp Ala lie Pro Thr 15 10

<210> 33

<21.1> 18

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE <222> 5<223> Xaa= Vai ou Thr

<221> VARIANTE

<222> 6

<223> Xaa= Glu ou Gly

<221> VARIANTE

<222> 7

<223> Xaa= Leu ou lie

<221> VARIANTE <222> 8

<223> Xaa= Ala ou Glu

<221> VARIANTE <222> 17

<223> Xaa= lie oü Vai

<400> 33

Pro Vai Arg Phe Xaa Xaa Xaa Xaa Asn Leu Arg Vai Lys Glu Cys Asp

15 10 15

Arg Xaa

<210> 34

<211> 4

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<400> 34

Pro Vai Arg Phe 1

<210> 35

<211> 14

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 1

<223> Xaa= Vai ou Thr

<221> VARIANTE

<222> 2

<223> Xaa= Glu ou Gly

<221> VARIANTE

<222> 3

<223> Xaa= Leu ou lie

221> VARIANTE

222> 4

223> Xaa= Ala ou Glu

221> VARIANTE

222> 17

223> Xaa= lie ou Vai

400> 35Xaa Xaa Xaa Xaa Asn Leu Arg Vai Lys Glu Cys Asp Arg Xaa

<210> 36 <211> 9 <212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados <400> 36

Asn Leu Arg Vai Lys Glu Cys asp Arg 1 5

<210> 37 <211> 7 <212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE <222> 6

<223> Xaa= Leu ou lie

<221> VARIANTE <222> 7

<223> Xaa= Vai ou lie

<400> 37

Glu Gly Asp Asp Leu Xaa Xaa 1 5

<210> 38

<211> 6

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 1

<223> Xaa= Asp ou Asn

<221> VARIANTE

<222> 3

<223> Xaa= Ala, Ser ou Thr

<400> 38

Xaa Pro Xaa Leu Ala Gly 1 5

<210> 3 9

<211> 10

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221>

VARIANTE<222> 2

<223> Xaa= Leu Ser ou Glu

<221> VARIANTE

<222> 5

<223> Xaa= Thr ou Ser

<221> VARIANTE

<222> 6

<223> Xaa= His ou Phe

<221> VARIANTE <222> 7

<223> Xaa= ala ou Ser

<400> 39

Ala Xaa lie Asp Xaa xaa Xaa Asp His Arg 1 5 10

<210> 40

<211> 11

<212> PRT

<213> Seqüência artificial

<220>

<223> Domínios conservados

<221> VARIANTE

<222> 5

<223> Xaa= Gly ou Ala

<221> VARIANTE

<222> 8

<223> Xaa= lie ou Vai

<221> VARIANTE

<222> 9

<223> Xaa= Ser, Gly, Ala ou Lys

<400> 40

Phe Ala Leu Ala Xaa Leu Lys Xaa Xaa Gly He 1 5 10

<210> 41

<211> 7

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 5

<223> Xaa= Gly ou Ala

<400> 41

Phe Ala Leu Ala Xaa Leu Lys 1 5

<210> 42

<211> 6

<212> PRT

<213> Seqüência artificial<220>

<223> Domínios conservados

<221> VARIANTE

<222> 3

<223> Xaa= lie ou Vai

<221> VARIANTE

<222> 4

<223> Xaa= Ser, Gly, Ala ou Lys

<400> 42

Leu Lys Xaa Xaa Gly lie

1 5

<210> 43

<211> 7

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 1

<223> Xaa= Asn ou Asp .

<221> VARIANTE

<222> 3

<223> Xaa= Ala ou Asp

<221> VARIANTE

<222> 6

<223> Xaa= Ala ou Gly

<400> 43

Xaa Pro Xaa Çys Vai Xaa Lys

1 S

<210> 44

<211> 5

<212> PRT

<213> Seqüência artificial <220>

<223> Domínios conservados

<221> VARIANTE

<222> 1

<223> Xaa= Ala, Ser ou Pro

<400> 44

Xaa Ser Leu Gly Vai

1 5

<210> 45

<211> 1500

<212> DNA

<213> Pseudomonas syringae <220>

<221> CDS

<222> (102) ... (1358)

<221>

Região de interesse biológico<222> (0) ... (0)

<223> Cepa B728a de pv syringae

<400> 45

gctgacccgc gcccgggctt ggcgatgaat gaaaccggca ctgcgggctt gatcccgctc 60 gtgctaggat cgcgattttt ccgctgacgc tcagggacat c atg cga cct caa gcc 116

Met Arg Pro Gln Ala 1 5

acc etc act gtt ttg cct gtc gag cgc ceg ttg gtc ggg cgt gtc age 164 Thr Leu Thr Vai Leu Pro Vai Glu Arg Pro Leu Vai Gly Arg Vai Ser 10 15 20

ceg ceg ggc tec aag tcg ate acc aac cgt gea ttg ttg ctg gcc ggg 212 Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Gly 25 30 35

ctg 9cc aaa ggc acc age cgc ctg acc ggc gcg ctg aag agt gat gac 260 Leu Ala Lye Gly Thr Ser Arg Leu Thr Gly Ala Leu Lys Ser Asp Asp 40 45 50

acg cgc gtg atg tec gaa gcc ttg cgt ctg atg ggc gtg cag gtc gac 308 Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met Gly Vai Gln Vai Asp 55 60 65

gag ceg gat gac age acc ttc gtg gtc acc age age ggg cac tgg cag 356 Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser Ser Gly His Trp Gln 70 75 80 85

gcg ceg caa cag gcg ctg ttc etc ggc aat gcc ggg act gcg aca cgc 404 Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala Gly Thr Ala Thr Arg 90 95 100

ttt ctg acc gcg gea ctg gcc aac ttc gaa ggc gac ttc gtg gtg gat 452 Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly Asp Phe Vai Vai Asp 105 110 115

ggc gac gaa tac atg cgc aag cgc ceg ate ggc ceg ttg gtc gat gcc 500 Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly Pro Leu Vai Asp Ala 120 125 130

ttg cag cgc atg ggc gtg gag gtc age gea cec agt ggt tgc ceg ceg 548 Leu Gln Arg Met Gly Vai Glu Vai Ser Ala Pro Ser Gly Cys Pro Pro 135 140 145

gtg gcc ate aag ggc aag ggc ggt ctt gag gcc ggt cgt ate gaa ate 596 Vai Ala lie Lys Gly Lys Gly Gly Leu Glu Ala Gly Arg lie Glu lie 150 155 160 165

gac ggc aat ctg tec age cag tat gtg tcg gea ctg ctg atg gcc ggt 644 Asp Gly Asn Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Ala Gly 170 175 180

gcc tgt ggc aag ggg cct gtg gaa gtt gcc ctg aca ggc age gag ate 692 Ala Cys Gly Lys Gly Pro Vai Glu Vai Ala Leu Thr Gly Ser Glu lie 185 190 195

ggc gcg cgt ggt tac etc gac etc acg ctg gcg gcc atg cgg gcg ttc 740 Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala Ala Met Arg Ala Phe 200 205 210

ggt gcc gag gtt cag gcc ate ggc gac gcc gcc tgg aaa gtc tcg gct 788 Gly Ala Glu Vai Gln Ala lie Gly Asp Ala Ala Trp Lys Vai Ser Ala 215 220 225

acc ggt tat cgc gct acg gat ttc cac ate gaa ceg gat gcc tcg gcg Thr Gly Tyr Arg Ala Thr Asp Phe His lie Glu Pro Asp Ala Ser Ala 230 235 240 245gcc acc tac ctt tgg gct gcg cag gcc ctg acc gag ggc gct ate gac 884 Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr Glu Gly Ala lie Asp 250 255 260

ctg ggc gtg gcc age aac gcg ttc act cag cet gat gea ctg gcc agt 932 Iieu Gly Vai Ala Ser Asn Ala Phe Thr Gln Pro Asp Ala Leu Ala Ser 265 270 275

cag ate ate gcc age ttc ceg aac atg ceg gcc gtg ate gac ggc tcg 980 Gln lie lie Ala Ser Phe Pro Asn Met Pro Ala Vai lie Asp Gly Ser 280 285 290

cag atg cag gac gcg att cec acg ctg gcc gta ctg gcc gcg ttc aat 1028 Gln Met Gln Asp Ala lie Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn 295 300 305

cgt caa ceg gtg cgc ttt gtc ggc ate gcc aac ctg cgg gtc aag gag 1076 Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Asn Leu Arg Vai Lys Glu 310 315 320 325

tgc gac cgc ate tcg gea ctg tec aac ggc ctg tgc gcc ate gea cec 1124 Çys Asp Arg lie Ser Ala Leu Ser Asn Gly Leu Cys Ala lie Ala Pro 330 335 340

ggc ctg gcg gtc gaa gag ggt gac gat ctg ate gtt acc gcc aac ceg 1172 Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu lie Vai Tfrr Ala Asn Pro 345 350 355

acg ctg gea ggc act acg gtc gat gcc ttg ate gat acc cac tec gac 1220 Thr Leu Ala Gly Thr Thr Vai Asp Ala Leu lie Asp Thr His Ser Asp 360 365 370

cat cgg ate gcc atg tgc ttt gea ctg gcg ggc ctg aag att gcc ggc 1268 His Arg lie Ala Met Cys Phe Ala Leu Ala Gly Leu Lys lie Ala Gly 375 380 385

ate cgc att etc gac cet gat tgc gtc gcc aag acc tac ceg ggg tac 1316

lie Arg lie Leu Asp Pro Asp Cys Vai Ala Lys Thr Tyr Pro Gly Tyr 390 395 400 405

tgg gat gcg ctg gct tet ctg ggt gtg agt gtt cag cgc tga 1358 Trp Asp Ala Leu Ala Ser Leu Gly Vai Ser Vai Gln Arg *

410 415

tagatcaggt ttatcggctc gggaagcctg taggatttcg agacatcttt agctggcagt 1418 ctacggttgt agatactatg tttatacgtt ggggttgcat gcctcgtgtg aggtatctac 1478 agtattgcta cgttatgagg tg 1500

<210> 46

<211> 418

<212> PRT

<213> Pseudomonas syringae

<220>

<221> CDS

<222> (0) ... (0)

<223> Cepa B728a de pv syringae

<400> 46

Met Arg Pro Gln Ala Thr Leu Thr Vai Leu Pro Vai Glu Arg Pro Leu

1 5 10 15

Vai Gly Arg Vai Ser Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala

20 25 30

Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala

35 40 45

Leu Lys Ser Asp Asp Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met

50 55 60

Gly Vai Gln Vai Asp Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser

65 70 75 80Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala

85 90 95

Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly

100 105 110

Asp Phe Vai Vai Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly

115 120 125

Pro Leu Vai Asp Ala Leu Gln Arg Met Gly Vai Glu Vai Ser Ala Pro

130 135 140

Ser Gly Cys Pro Pro Vai Ala lie Lys Gly Lys Gly Gly Leu Glu Ala 145 150 155 160

Gly Arg lie Glu lie Asp Gly Asn Leu Ser Ser Gln Tyr Vai Ser Ala

165 170 175

Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Vai Glu Vai Ala Leu

180 185 190

Thr Gly Ser Glu lie Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala

195 200 205

Ala Met Arg Ala Phe Gly Ala Glu Vai Gln Ala lie Gly Asp Ala Ala

210 215 220

Trp Lys Vai Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His lie Glu 225 230 235 240

Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr

245 250 255

Glu Gly Ala lie Aep Leu Gly Vai Ala Ser Asn Ala Phe Thr Gln Pro

260 265 270

Asp Ala Leu Ala Ser Gln lie lie Ala Ser Phe Pro Asn Met Pro Ala

275 280 285

Vai lie Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr Leu Ala Vai

290 295 300

Leu Ala Ala Phe Asn Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Asn 305 310 315 320

Leu Arg Vai Lys Glu Cys Asp Arg lie Ser Ala Leu Ser Asn Gly Leu

325 330 335

Cys Ala lie Ala Pro Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu lie

340 345 350

Vai Thr Ala Asn Pro Thr Leu Ala Gly Thr Thr Vai Asp Ala Leu lie

355 360 365

Asp Thr His Ser Asp His Arg lie Ala Met Cys Phe Ala Leu Ala Gly

370 375 380

Leu Lys lie Ala Gly lie Arg lie Leu Asp Pro Asp Cys Vai Ala Lys 385 390 395 400

Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Vai Ser Vai 405 410 415

Gln Arg

<210> 47

<211> 1466

<212> DNA

<213> Pseudomonas syringae <220>

<221> CDS

<222> (101) ... (1357)

<221> Região de interesse biológico <222> (0) ... (0)

<223> Cepa 1448a de pv phaseolicola

<400> 47 gtaaacggct gtctggcccg tgctaggatc gcgatttttc

ttggggcagc aaaaccgcac cgctgacgct cagggacatc

tgcgggcttg atcccgctcg 60 atg cga cct caa gcc 115 Met Arg Pro Gln Alaacc etc act gtt ttg cet gtc gag cgc ceg ctg gtc ggg cgc gtc age 163 Thr Leu Thr Vai Leu Pro Vai Glu Arg Pro Leu Vai Gly Arg Vai Ser 10 15 20

ceg ceg ggc tec aag tcg ate acc aac cgc gea ttg ttg ctg gcc ggg 211 Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Gly 25 30 35

ctg gcc aaa ggc acc age cgc ctg acc ggc gcg ctg aag agt gac gac 259 Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala Leu Lys Ser Asp Asp 40 45 50

acc cgc gtg atg tec gaa gea ctg cgt ctg atg ggc gtg cag gtc gac 307 Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met Gly Vai Gln Vai Asp 55 60 65

gag ceg gat gac age acc ttc gtg gtc acc age age ggc cac tgg cag 355 Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser Ser Gly His Trp Gln 70 75 80 B5

gea ceg cag cag gea ctg ttt etc ggt aac gcc gga acc gea acg cgc 403 Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala Gly Thr Ala Thr Arg 90 95 100

ttt ctg acc gct gea ctg gcc aac ttc gaa ggc gac ttt gtg gtc gac 451 Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly Asp Phe Vai Vai Asp 105 110 115

ggc gac gag tac atg cgc aag cgc ceg ate ggc ceg ctg gtc gat gcc 499 Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly Pro Leu Vai Asp Ala 120 125 130

ttg cag cgc atg ggt gtg gag gtc agt gcg cec agt ggc tgc ceg ceg 547 Leu Gln Arg Met Gly Vai Glu Vai Ser Ala Pro Ser Gly Cys Pro Pro

135 140 145

gtg gcg ate aag ggc aaa ggc ggt ctg gaa gcc gga cgt att gaa ate 595 Vai Ala lie Lys Gly Lys Gly Gly Leu Glu Ala Gly Arg lie Glu lie 150 155 160 165

gat ggc aac ctg tec age cag tac gtg tca gcg ttg ctg atg gcc gga 643 Asp Gly Asn Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Ala Gly 170 175 180

gcc tgc ggc aag ggc ceg gtc gaa gtc gcc ttg acc ggc age gag att 691 Ala Cys Gly Lys Gly Pro Vai Glu Vai Ala Leu Thr Gly Ser Glu Jle 185 190 195

ggc gea cgt ggt tac gtc gac ctt acc ctg gcg gcc atg cag gcc ttc 739 Gly Ala Arg Gly Tyr Vai Asp Leu Thr Leu Ala Ala Met Gln Ala Phe 200 205 210

ggc gcc gag gtt cag gcc ate ggc gaa acc gcc tgg aaa gtc tcg gcc 787 Gly Ala Glu Vai Gln Ala lie Gly Glu Thr Ala Trp Lys Vai Ser Ala 215 220 225

act ggt tat cgc gct acg gac ttc cat ate gaa ceg gat gea tcg gcg 835 Thr Gly Tyr Arg Ala Thr Asp Phe His lie Glu Pro Asp Ala Ser Ala 230 235 240 245

gcc acc tac ctg tgg gcc gcc caa gea ctg acc gag ggc gat ate gac 883 Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr Glu Gly Asp lie Asp 250 255 260

etc ggc gtg gcc age gac gea ttc act cag cet gat gcc ctg gcc agt 931 Leu Gly Vai Ala Ser Asp Ala Phe Thr Gln Pro Asp Ala Leu Ala Ser 265 270 275

cag ate ate gea age ttc ceg aac atg cet gcc gtg ate gac ggt tcg 979 Gln lie lie Ala Ser Phe Pro Asn Met Pro Ala Vai lie Asp Gly Ser 280 285 290caa atg cag gac gcg att ccg acg ctg gcg gta etc gcc gcc ttc aac 1027 Gln Met Gln Asp Ala lie Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn 295 300 305

cgt cag cca gtg cgc ttt gtc ggc ate gcc aac ctg cgg gtc aag gaa 1075 Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Asn Leu Arg Vai Lys Glu 310 315 320 325

tgt gac cgt att tca gea ctg tec cac ggc ctg tgt gcc ate gcg ccg 1123 Cys Asp Arg lie Ser Ala Leu Ser His Gly Leu Cys Ala lie Ala Pro 330 335 340

ggc ctt gct gta gag gag ggc gac gac ctg ctg gtg cac gcc aac ccg 1171 Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu Leu Vai His Ala Asn Pro 345 350 355

gcg ctg gea ggc acc acg gta gac gea ttg att gac acc cac tec gac 1219 Ala Leu Ala Gly Thr Thr Vai Asp Ala Leu lie Asp Thr His Ser Asp 360 365 370

cat cgc ate gcc atg tgt ttt gcg ctg gea ggc ttg aag att gcc ggt 1267 His Arg lie Ala Met Cys Phe Ala Leu Ala Gly Leu Lys lie Ala Gly 375 380 385

att cgc att etc gac cca gat tgc gtc ggc aag acc tac ccg ggt tac 1315 lie Arg lie Leu Asp Pro Asp Cys Vai Gly Lys Thr Tyx Pro Gly Tyr 390 395 400 405

tgg gat gea ctg gct tcg ctg ggg gtg cgt gtt cag cgc tga 1357

Trp Asp Ala Leu Ala Ser Leu Gly Vai Arg Vai Gln Arg * 410 415

gageagetat ggagccgttt ttcagatccc gaagaacggc tgcatcatcc gcgccagcag 1417 cccgtgaaag cgcagccttg attctgtcgc cagtacgcag atgcattcc 1466

<210> 48 <211> 418 <212> PRT

<213> Pseudomonas syringae

<220>

<221> VARIANTE <222> (0) ... (0)

<223> Cepa 1448a de pv phaseolicola <400> 48

Met Arg Pro Gln Ala Thr Leu Thr Vai Leu Pro Vai Glu Arg Pro Leu

15 10 15

Vai Gly Arg Vai Ser Pro Pro Gly Ser Lys Ser lie Thr Asn Arg Ala

20 25 30

Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala

35 40 45

Leu Lys Ser Asp Asp Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met

50 55 60

Gly Vai Gln Vai Asp Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser 65 70 75 80

Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala

85 90 95

Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly

100 105 110

Asp Phe Vai Vai Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly

11S 120 125

Pro Leu Vai Asp Ala Leu Gln Arg Met Gly Vai Glu Vai Ser Ala Pro

130 135 140

Ser Gly Cys Pro Pro Vai Ala lie Lys Gly Lys Gly Gly Leu Glu Ala 145 150 155 160Gly Arg lie Glu lie Asp Gly Asn Leu Ser Ser Gln Tyr Vai Ser Ala

165 170 175

Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Vai Glu Vai Ala Leu

180 185 190

Thr Gly Ser Glu lie Gly Ala Arg Gly Tyr Vai Asp Leu Thr Leu Ala

195 200 205

Ala Met Gln Ala Phe Gly Ala Glu Vai Gln Ala lie Gly Glu Thr Ala

210 215 220

Trp Lys Vai Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His lie Glu 225 230 235 240

Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr

245 250 255

Glu Gly Asp lie Asp Leu Gly Vai Ala Ser Asp Ala Phe Thr Gln Pro

260 265 270

Aep Ala Leu Ala Ser Gln He He Ala Ser Phe Pro Asn Met Pro Ala

275 280 285

Vai He Asp Gly Ser Gln Met Gln Asp Ala He Pro Thr Leu Ala Vai

290 295 300

Leu Ala Ala Phe Asn Arg Gln Pro Vai Arg Phe Vai Gly He Ala Asn 305 310 315 320

Leu Arg Vai Lys Glu Cys Asp Arg He Ser Ala Leu Ser His Gly Leu

325 330 335

Cys Ala He Ala Pro Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu Leu

340 345 350

Vai His Ala Asn pro Ala Leu Ala Gly Thr Thr Vai Asp Ala Leu He

355 360 365

Asp Thr His Ser Asp His Arg He Ala Met Cys Phe Ala Leu Ala Gly

370 375 380

Leu Lys He Ala Gly He Arg He Leu Asp Pro Asp Cys Vai Gly Lys

385 390 395 400

Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Ala Ser Leu Gly Vai Arg Vai 405 410 415

Gln Arg

<210> 49 <211> 427 <212> PRT

<213> Escherichia coli <400> 49

Met Glu Ser Leu Thr Leu Gln Pro He Ala Arg Vai Asp Gly Thr He

15 10 15

Asn Leu Pro Gly Ser Lys Thr Vai Ser Asn Arg Ala Leu Leu Leu Ala

20 25 30

Ala Leu Ala Kis Gly Lys Thr Vai Leu Thr Asn Leu Leu Asp Ser Asp

35 40 45

Asp Vai Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Vai Ser Tyr

50 55 60

Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu He He Gly Asn Gly Gly 65 70 75 80

Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly

85 90 95

Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp

100 105 HO

He Vai Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro He Gly His

115 120 125

I/eu Vai Asp Ala Leu Arg Leu Gly Gly Ala Lys He Thr Tyr Leu Glu

130 135 140

Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly 145 150 1S5 160

Asn Vai Asp Vai Asp Gly Ser Vai Ser Ser Gln Phe Leu Thr Ala Leu

165 170 175

Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Vai He Arg He Lys

180 185 190

Gly Asp Leu Vai Ser Lys Pro Tyr He Asp He Thr Leu Asn Leu Met

195 200 205

Lys Thr Phe Gly Vai Glu He Glu Asn Gln His Tyr Gln Gln Phe Vai 210 215 220Vai Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Vai Glu

225 230 235 240

Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala lie Lys

245 250 255

Gly Gly Thr Vai Lys Vai Thr Gly lie Gly Arg Asn Ser Met Gln Gly

260 265 270

Asp lie Arg Phe Ala Asp Vai Leu Glu Lys Met Gly Ala Thr lie Cys

275 280 285

Trp Gly Asp Asp Tyr lie Ser Cys Thr Arg Gly Glu Leu Asn Ala lie

290 295 300

Asp Met Asp Met Asn His lie Pro Asp Ala Ala Met Thr lie Ala Thr

305 310 315 320

Ala Ala Leu Phe Ala Lys Gly Thr Thr Arg Leu Arg Asn lie Tyr Asn

325 330 335

Trp Arg Vai Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu

340 345 350

Arg Lys Vai Gly Ala Glu Vai Glu Glu Gly His Asp Tyr lie Arg lie

355 360 365

Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu 11e Ala Thr Tyr Asn ASp

370 375 380

His Arg Met Ala Met Cys Phe Ser Leu Vai Ala Leu Ser Asp Thr Pro

385 390 395 400

Vai Thr lie Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr

405 410 415

Phe Glu Gln Leu Ala Arg lie Ser Gln Ala Ala

420 425

<210> 50 <211> 444 <212> PRT <213> Zea mays

<400> 50

Ala Gly Ala Glu Glu lie Vai Leu Gln Pro lie Lys Glu lie Ser Gly

1 5 10 15

Thr Vai Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg lie Leu Leu

20 25 30

Leu Ala Ala Leu Ser Glu Gly Thr Thr Vai Vai Asp Asn Leu Leu Asn

35 40 45

Ser Glu Asp Vai His Tyr Met Leu Gly Ala Leu Arg Thr Leu Gly Leu

50 55 60

Ser Vai Glu Ala Asp Lys Ala Ala Lys Arg Ala Vai Vai Vai Gly Cys 65 70 75 80

Gly Gly Lys Phe Pro Vai Glu Asp Ala Lys Glu Glu Vai Gln Leu Phe

85 90 95

Leu Gly Asn Ala Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Vai Thr

100 105 110

Ala Ala Gly Gly Asn Ala Thr Tyr Vai Leu Asp Gly Vai Pro Arg Met

115 120 125

Arg Glu Arg Pro lie Gly Asp Leu Vai Vai Gly Leu Lys Gln Leu Gly

130 135 140

Ala Asp Vai Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro Vai Arg Vai 145 150 155 160

Asn Gly lie Gly Gly Leu Pro Gly Gly Lys Vai Lys Leu Ser Gly Ser

165 170 175

lie Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala Ala Pro Leu Ala 180 185 190Leu Gly Asp Vai Glu lie Glu lie lie Asp Lys Leu lie Ser lie Pro

195 200 205

Tyr Vai Glu Met Thr Leu Arg Leu Met Glu Arg Phe Gly Vai Lys Ala

210 215 220

Glu His Ser Asp Ser Trp Asp Arg Phe Tyr lie Lys Gly Gly Gln Lys 225 230 235 240

Tyr Lys Ser Pro Lys Asn Ala Tyr Vai Glu Gly Asp Ala Ser Ser Ala

245 250 255

Ser Tyr Phe Leu Ala Gly Ala Ala lie Thr Gly Gly Thr Vai Thr Vai

260 265 270

Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Vai Lys Phe Ala Glu

275 280 265

Vai Leu Glu Met Met Gly Ala Lys Vai Thr Trp Thr Glu Thr Ser Vai

290 295 300

Thr Vai Thr Gly Pro Pro Arg Glu Pro Phe Gly Arg Lys His. Leu Lys 305 310 315 320

Ala lie Asp Vai Asn Met Asn Lys Met Pro Asp Vai Ala Met Thr Leu

325 330 335

Ala Vai Vai Ala Leu Phe Ala Asp Gly Pro Thr Ala lie Arg Asp Vai

340 345 350

Ala Ser Trp Arg Vai Lys Glu Thr Glu Arg Met Vai Ala lie Arg Thr

355 360 365

Glu Leu Thr Lys Leu Gly Ala Ser Vai Glu Glu Gly Pro Asp Tyr Cys

370 375 380

lie lie Thr Pro Pro Glu Lys Leu Asn Vai Thr .Ala lie Asp Thr Tyr 385 390 395 400

Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Glu 405 410 415

Vai Pro Vai Thr lie Arg Asp Pro Gly Cys Thr Arg Lys Thr Phe Pro

420 425 430

Asp Tyr Phe Asp Vai Leu Ser Thr Phe Vai Lys Asn 435 440

<210> 51

<211> 455

<212> PRT

<213> Agrobacterium sp. <220>

<221> VARIANTE

<222> (0) ... (0)

<223> Cepa CP4

<400> 51

Met Ser His Gly Ala Ser Ser Arg Pro Ala Thr Ala Arg Lys Ser Ser

1 5 10 15

Gly Leu Ser Gly Thr Vai Arg lie Pro Gly Asp Lys Ser lie Ser His

20 25 30

Arg Ser Phe Met Phe Gly Gly Leu Ala Ser Gly Glu Thr Arg lie Thr

35 40 45

Gly Leu Leu Glu Gly Glu Asp Vai lie Asn Thr Gly Lys Ala Met Gln

50 55 60

Ala Met Gly Ala Arg lie Arg Lys Glu Gly Asp Thr Trp lie lie Asp 65 70 75 80

Gly Vai Gly Asn Gly Gly Leu Leu Ala Pro Glu Ala Pro Leu Asp Phe •

85 90 95

Gly Asn Ala Ala Thr Gly Cys Arg Leu Thr Met Gly Leu Vai Gly Vai

100 105 110

Tyr Asp Phe Asp Ser Thr Phe lie Gly Abp Ala Ser Leu Thr Lys Arg

115 120 125

Pro Met Gly Arg Vai Leu Asn Pro Leu Arg Glu Met Gly Vai Gln Vai

130 135 140

Lys Ser Glu Asp Gly Asp Arg Leu Pro Vai Thr Leu Arg Gly Pro Lys 145 150 155 160

Thr Pro Thr Pro lie Thr Tyr Arg Vai Pro Met Ala Ser Ala Gln Vai 165 170 175Lys Ser Ala Vai Leu Leu Ala Gly Leu Asn Thr Pro Gly lie Thr Thr

180 185 190

Vai lie Glu Pro lie Met Thr Arg Asp His Thr Glu Lys Met Leu Gln

195 200 205

Gly Phe Gly Ala Asn Leu Thr Vai Glu Thr Asp Ala Asp Gly Vai Arg

210 215 220

Thr lie Arg Leu Glu Gly Arg Gly Lys Leu Thr Gly Gln Vai lie Asp 225 230 235 240

Vai Pro Gly Asp Pro Ser Ser Thr Ala Phe Pro Leu Vai Ala Ala Leu

245 250 255

Leu Vai Pro Gly Ser Asp Vai Thr lie Leu Asn Vai Leu Met Asn Pro

260 265 270

Thr Arg Thr Gly Leu lie Leu Thr Leu Gln Glu Met Gly Ala Asp lie

275 280 285

Glu Vai lie Asn Pro Arg Leu Ala Gly Gly Glu Asp Vai Ala Asp Leu

290 295 300

Arg Vai Arg Ser Ser Thr Leu Lys Gly Vai Thr Vai Pro Glu Asp Arg 305 310 315 320

Ala Pro Ser Met lie Asp Glu Tyr Pro lie Leu Ala Vai Ala Ala Ala

325 330 335

Phe Ala Glu Gly Ala Thr Vai Met Asn Gly Leu Glu Glu Leu Arg Vai

■ 340 345 350

Lys Glu Ser Asp Arg Leu Ser Ala Vai Ala Asn Gly Leu Lys Leu Asn

355 360 365

Gly Vai Asp Cys Asp Glu Gly Glu Thr Ser Leu Vai Vai Arg Gly Arg

370 375 380

Pro Asp Gly Lys Gly Leu Gly Asn Ala Ser Gly Ala Ala Vai Ala Thr 385 390 395 400

His Leu Asp His Arg lie Ala Met Ser Phe Leu Vai Met Gly Leu Vai

405 410 415

Ser Glu Abu Pro Vai Thr Vai Asp Asp Ala Thr Met lie Ala Thr ser 420 425 430

405 410 415

Arg lie Gln Asp Pro Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp

420 425 430

Lys Ala Trp Pro Ser Leu Gly Vai His Leu Asn Asp 435 440

Phe Pro Glu Phe Met Asp Leu Met Ala Gly Leu Gly Ala Lys lie Glu

435 440 445

Leu Ser Asp Thr Lys Ala Ala 450 455

<210> 52

<211> 428

<212> PRT

<213> Bacillus subtilis <220>

<221> VARIANTE

<222> (0) ... (0)

<223> EPSPS-proteína

<400> 52

Met Lys Arg Asp Lys Vai Gln Thr Leu His Gly Glu lie His lie pro

1 5 10 15

Gly Asp Lys Ser lie Ser His Arg Ser Vai Met Phe Gly Ala Leu Ala

20 25 30

Ala Gly Thr Thr Thr Vai Lys Asn Phe Leu Pro Gly Ala Asp Cys Leu

35 40 45

Ser Thr lie Asp Cys Phe Arg Lys Met Gly Vai His lie Glu Gln Ser

50 55 60

Ser Ser Asp Vai Vai lie His Gly Lys Gly lie Asp Ala Leu Lys Glu 65 70 75 80

Pro Glu Ser Leu Leu Asp Vai Gly Asn Ser Gly Thr Thr lie Arg Leu 85 90 95Met Leu Gly lie Leu Ala Gly Arg Pro Phe Tyr Ser Ala Vai Ala Gly

100 105 110

Asp Glu Ser lie Ala Lys Arg Pro Met Lys Arg Vai Thr Glu Pro Leu

115 120 125

Lys Lys Met Gly Ala Lys lie Asp Gly Arg Ala Gly Gly Glu Phe Thr

130 135 140

Pro Leu Ser Vai Ser Gly Ala Ser Leu Lys Gly lie Asp Tyr Vai Ser 145 150 155 160

Pro Vai Ala Ser Ala Gln lie Lys Ser Ala Vai Leu Leu Ala Gly Leu

165 170 17S

Gln Ala Glu Gly Thr Thr Thr Vai Thr Glu Pro His Lys Ser Arg Asp

180 185 190

His Thr Glu Arg Met Leu Ser Ala Phe Gly Vai Lys Leu Ser Glu Asp

195 200 205

Gln Thr Ser Vai Ser lie Ala Gly Gly Gln Lys Leu Thr Ala Ala Asp

210 215 220

lie Phe Vai Pro Gly Asp lie Ser Ser Ala Ala Phe Phe Leu Ala Ala 225 230 235 240

Gly Ala Met Vai Pro Asn Ser Arg lie Vai Leu Lys Asn Vai Gly Leu

245 250 255

Asn Pro Thr Arg Thr Gly lie lie Asp Vai Leu Gln Asn Met Gly Ala

260 265 270

Lys Leu Glu He Lys Pro Ser Ala Asp Ser Gly Ala Glu Pro Tyr Gly

275 280 285

Asp Leu lie lie Glu Thr Ser Ser Leu Lys Ala Vai Glu lie Gly Gly

290 295 300

Asp lie lie Pro Arg Leu lie Asp Glu lie Pro lie lie Ala Leu Leu 305 310 315 320

Ala Thr Gln Ala Glu Gly Thr Thr Vai lie Lys Asp Ala Ala Glu Leu

325 330 335

Lys Vai Lys Glu Thr Asn Arg lie Asp Thr Vai Vai Ser Glu Leu Arg

340 345 350

Lys Leu Gly Ala Glu lie Glu Pro Thr Ala Asp Gly Met Lys Vai Tyr

355 360 365

Gly Lys Gln Thr Leu Lys Gly Gly Ala Ala Vai Ser Ser His Gly Asp

370 375 380

His Arg lie Gly Met Met Leu Gly lie Ala Ser Cys lie Thr Glu Glu

385 390 395 400

Pro lie Glu lie Glu His Thr Asp Ala lie His Vai Ser Tyr pro Thr

405 410 415

Phe Phe Glu His Leu Asn Lys Leu Ser Lys Lys Ser

420

425

<210> <211> <212> <213>

53

1500 DNA

Desconhecida

<220> <223>

Bactéria desconhecida

<221> <222>

CDS (40)

(1371)

<400>

53

ctcctacagt tagggcaagt cccccaccac tcgacaagc atg gcg tgt ttg cct

Met Ala Cys Leu Pro 1 5

54

gat gat tcg ggt ccg cat gtc ggc cac tcc acg cca cct cgc ctt gac 102 Asp Asp Ser Gly Pro His Vai Gly His Ser Thr Pro Pro Arg Leu Asp 10 15 20cag gag cct tgt acc ttg agt tcg cag aaa acc gtg acc gtt aca ccg 150 Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr Vai Thr Vai Thr Pro 25 30 35

ccc aac ttc ccc etc act ggc aag gtc gcg cec cec ggc tec aaa tec 198 Pro Asn Phe Pro Leu Thr Gly Lys Vai Ala Pro Pro Gly Ser Lys Ser 40 45 50

att acc aac cgt gcg ctg ttg ctg gcg gea ttg gcc aag ggc acc age 246 lie Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu Ala Lys Gly Thr Ser 55 60 65

cgt ttg age ggt gcg etc aaa age gat gac acg cgc cac atg tcg gtc 294 Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr Arg His Met Ser Vai 70 75 80 85

gcc ctg cgg cag atg ggc gtc acc ate gac gag ccg gac gac acc acc 342 Ala Leu Arg Gln Met Gly Vai Thr lie Asp Glu Pro Asp Asp Thr Thr 90 95 100

ttt gtg gtc acc age caa ggc tcg ctg caa ttg ccg gcc cag ccg ttg 390 Phe Vai Vai Thr Ser Gln Gly Ser Leu Gln Leu Pro Ala Gln Pro Leu 105 110 115

ttc etc ggc aac gct ggc acc gcc atg cgc ttt etc acg gct gcc gtg 438 Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe Leu Thr Ala Ala Vai 120 125 130

gcc acc gtg caa ggc acc gtg gta ctg gac ggc gac gag tac atg caa 486 Ala Thr Vai Gln Gly Thr Vai Vai Leu Asp Gly Asp Glu Tyr Met Gln 135 140 145

aaa cgc ccg att ggc ccg ctg ctg gct acc ctg ggc cag aac ggc ate 534 Lys Arg Pro lie Gly Pro Leu Leu Ala Thr Leu Gly Gln Asn Gly lie 150 155 160 165

cag gtc gac age ccc acc ggt tgc cca ccg gtc acc gtg cac ggc atg 582 Gln Vai Asp Ser Pro Thr Gly Cys Pro Pro Vai Thr Vai His Gly Met

170 175 180

ggc aag gtc cag gcc aag cgt ttc gag att gat ggt ggt ttg tec age 630 Gly Lys Vai Gln Ala Lys Arg Phe Glu lie Asp Gly Gly Leu Ser Ser 165 190 195

cag tac gta tcg gcc ctg ctg atg etc gcg gcg tgc ggc gaa gcg ccg 678 Gln Tyr Vai Ser Ala Leu Leu Met Leu Ala Ala Cys Gly Glu Ala Pro 200 205 210

att gaa gtg gcg ctg acc ggc aag gat ate ggt gcc cgt ggc tac gtg 726 lie Glu Vai Ala Leu Thr Gly Lys Asp lie Gly Ala Arg Gly Tyr Vai 215 220 225

gac ctg acc etc gac tgc atg cgt gcc ttc ggg gcc cag gtg gac gcc 774 Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly Ala Gln Vai Asp Ala 230 235 240 245

gtg gac gac acc acc tgg cgc gtc gcc ccc acc ggc tat acc gcc cat 822 Vai Asp Asp Thr Thr Trp Arg Vai Ala Pro Thr Gly Tyr Thr Ala His 250 255 260

gat tac ctg ate gaa ccc gat gcg tec gcc gcc acg tat ttg tgg gcc 870 Asp Tyr Leu lie Glu Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala 265 270 275gca gaa gtg ctg acc ggt ggg cgt ate gac ate ggc gta gcc gcg cag 918 Ala Glu Vai Leu Thr Gly Gly Arg lie Asp lie Gly Vai Ala Ala Gln 280 265 290

gac ttc acc cag cec gac gcc aag gcc cag gcc gtg att gcg cag ttc 966 Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala Vai lie Ala Gln Phe 295 300 305

ceg aac atg caa gcc acg gtg gta ggc tcg caa atg cag gat gcg ate 1014 Pro Asn Met Gln Ala Thr Vai Vai Gly Ser Gln Met Gln Asp Ala lie 310 315 320 325

ceg acc ctg gcg gtg etc gcc gcg ttc aac aac acc ceg gtg cgt ttc 1062 Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn Asn Thr Pro Vai Arg Phe 330 335 340

act gaa ctg gcg aac ctg cgc gtc aag gaa tgt gac cgc gtg cag gcg 1110 Thr Glu Leu Ala Asn Leu Arg Vai Lys Glu Cys Asp Arg Vai Gln Ala 345 350 355

ctg cac gat ggc etc aac gaa att cgc ceg ggc ctg gcg acc ate gag 1158 Leu His Asp Gly Leu Asn Glu He Arg Pro Gly Leu Ala Thr lie Glu 360 365 370

ggc gat gac ctg ctg gtc gcc age gac ceg gcc ctg gca ggc acc gcc 1206 Gly Asp Asp Leu Leu Vai Ala Ser Asp Pro Ala Leu Ala Gly Thr Ala 375 380 385

tgc aec gca ctg ate gac acc cac gcc gac cat cgc ate gcc atg tgc 1254 Cys Thr Ala Leu He Asp Thr His Ala Asp His Arg He Ala Met Cys 390 395 400 405

ttt gcc ctg gcc ggg ctt aaa gtc tcg ggc att cgc att caa gac ceg 1302 Phe Ala Leu Ala Gly Leu Lys Vai Ser Gly He Arg He Gln Asp Pro 410 415 420

gac tgc gtg gcc aag acc tac cet gac tac tgg aaa gcc tgg cec age 1350 Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp Lys Ala Trp Pro Ser 425 430 435

ctg ggc gtt cac cta aac gac tgacacacaa aacctgtagc agagcttgct 1401

Leu Gly Vai His Leu Asn Asp 440

cgcgaaaaac gcacacgtgc cgcgtttgtt caggaaacac gcgttatcgt tgacgtttat 1461 cgagctaagc tcgctcctãc attttgcagc gagatcttg 1500

<210> 54

<211> 444

<212> PRT

<213> Desconhecida

<220>

<223> Bactéria desconhecida

<400> 54

Met Ala Cys Leu Pro Asp Asp Ser Gly Pro His Vai Gly His Ser Thr 1 5 10 15

Pro Pro Arg Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr

20 25 30

Vai Thr Vai Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Vai Ala Pro

35 40 45

Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu

50 55 60

Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr

65 70 75 80Arg His Met Ser Vai Ala Leu Arg Gln Met Gly Vai Thr lie Asp Glu

85 90 95

Pro Asp Asp Thr Thr Phe Vai Vai Thr Ser Gln Gly Ser Leu Gln Leu

100 105 110

Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe

115 120 125

Leu Thr Ala Ala Vai Ala Thr Vai Gln Gly Thr Vai Vai Leu Asp Gly

130 135 140

Asp Glu Tyr Met Gln Lys Arg Pro lie Gly Pro Leu Leu Ala Thr Leu 145 150 155 160

Gly Gln Asn Gly lie Gln Vai Asp Ser Pro Thr Gly Cys Pro Pro Vai

165 170 175

Thr Vai His Gly Met Gly Ly6 Vai Gln Ala Lys Arg Phe Glu lie Asp

180 185 130

Gly Gly Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Leu Ala Ala

195 200 205

Cys Gly Glu Ala Pro lie Glu Vai Ala Leu Thr Gly Lys Asp lie Gly

210 215 220

Ala Arg Gly Tyr Vai Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly 225 230 235 240

Ala Gln Vai Asp Ala Vai Asp Asp Thr Thr Trp Arg Vai Ala Pro Thr

245 250 255

Gly Tyr Thr Ala His Asp Tyr Leu lie Glu Pro Asp Ala Ser Ala Ala

260 265 270

Thr Tyr Leu Trp Ala Ala Glu Vai Leu Thr Gly Gly Arg lie Asp lie

275 280 285

Gly Vai Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala

290 295 300

Vai lie Ala Gln Phe Gln Asn Met Gln Ala Thr Vai Vai Gly Ser Gln 305 310 315 320

Met Gln Asp Ala lie Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn Asn

325 330 335

Thr Pro Vai Arg Phe Thr Glu Leu Ala Asn Leu Arg Vai Lys Glu Cys

340 345 350

Asp Arg Vai Gln Ala Leu His Asp Gly Leu Asn Glu lie Arg Pro Gly

355 360 365

Leu Ala Thr lie Glu Gly Asp Asp Leu Leu Vai Ala Ser Asp Pro Ala

370 375 380

Leu Ala Gly Thr Ala Cys Thr Ala Leu lie Asp Thr His Ala Asp His 385 390 395 400

Arg lie Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Vai Ser Gly lie

405 410 415

Arg lie Gln Asp Pro Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp

420 425 430

Lys Ala Trp Pro Ser Leu Gly Vai His Leu Asn Asp 435 440

<210> 55

<211> 1257

<212> DNA

<213> Pseudomonas syringae <220>

<221> Região de interesse biológico

<222> (0) ... (0)

<223> cepa B728a de pv syringae

<221> CDS

<222> (1) ... (1257)

<400> 55

atg cga cct caa gcc acc etc act gtt ttg cet gtc gag cgc ceg ttg Met Arg Pro Gln Ala Thr Leu Thr Vai Leu Pro Vai Glu Arg Pro Leu 1 5 10 15gtc ggg cgt gtc age ceg ceg ggc tec aag tcg ate acc aac cgt gea 96 Vai Gly Arg Vai Ser Pro Pro Gly Ser Lys Ser lie Thr Abd Arg Ala 20 25 30

ttg ttg ctg gcc ggg ctg gcc aaa ggc acc age cgc ctg acc ggc gcg 144 Leu Leu Leu Ala Gly Leu Ala Lys Gly Thr Ser Arg Leu Thr Gly Ala 35 40 45

ctg aag agt gat gac acg cgc gtg atg tec gaa gcc ttg cgt ctg atg 192 Leu Lys Ser Asp Asp Thr Arg Vai Met Ser Glu Ala Leu Arg Leu Met 50 55 60

9gc gtg cag gtc gac gag ceg gat gac age acc ttc gtg gtc acc age 240 Gly Vai Gln Vai Asp Glu Pro Asp Asp Ser Thr Phe Vai Vai Thr Ser 65 70 75 80

a9C ggg cac tgg cag gcg ceg caa cag gcg ctg ttc etc ggc aat gcc 288 Ser Gly His Trp Gln Ala Pro Gln Gln Ala Leu Phe Leu Gly Asn Ala 85 90 95

ggg act gcg aca cgc ttt ctg acc gcg gea ctg gcc aac ttc gaa ggc 336 Gly Thr Ala Thr Arg Phe Leu Thr Ala Ala Leu Ala Asn Phe Glu Gly 100 105 110

gac ttc gtg gtg gat ggc gac gaa tac atg cgc aag cgc ceg ate ggc 384 Asp Phe Vai Vai Asp Gly Asp Glu Tyr Met Arg Lys Arg Pro lie Gly 115 120 125

ceg ttg gtc gat gcc ttg cag cgc atg ggc gtg gag gtc age gea cec 432 Pro Leu Vai Asp Ala Leu Gln Arg «et Gly Vai Glu Vai Ser Ala Pro 130 135 140

agt ggt tgc ceg ceg gtg gcc ate aag ggc aag ggc ggt ctt gag gcc 480 Ser Gly Cys Pro Pro Vai Ala He Lys Gly Lys Gly Gly Leu Glu Ala 145 150 155 160

ggt cgt ate gaa ate gat ggc aat ctg tec age cag tat gtg tcg gea 528 Gly Arg lie Glu lie Asp Gly Asn Leu Ser Ser Gln Tyr Vai Ser Ala 165 170 175

ctg ctg atg gcc ggt gcc tgt ggc aag ggg cet gtg gaa gtt gcc ctg 576

Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Vai Glu Vai Ala Leu 180 185 190

aca ggc age gag ate ggc gcg cgt ggt tac etc gac etc acg ctg gcg 624 Thr Gly Ser Glu lie Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala 195 200 205

gcc atg cgg gcg ttc ggt gcc gag gtt cag gcc ate ggc gac gcc gcc 672 Ala Met Arg Ala Phe Gly Ala Glu Vai Gln Ala He Gly Asp Ala Ala 210 215 220

tgg aaa gtc tcg gct acc ggt tat cgc gct acg gat ttc cac ate gaa 720 Trp Lys Vai Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His lie Glu 225 230 235 240

ceg gat gcc tcg gcg gcc acc tac ctt tgg gct gcg cag gcc ctg acc 768 Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr 245 250 255

ga9 99C gct ate gac ctg ggc gtg gcc age aac gcg ttc act cag cet 816 Glu Gly Ala He Asp Leu Gly Vai Ala Ser Asn Ala Phe Thr Gln Pro 260 265 270

gat gea ctg gcc agt cag ate ate gcc age ttc ceg aac atg ceg gcc 864 Asp Ala Leu Ala Ser Gln He He Ala Ser Phe Pro Asn Met Pro Ala 275 280 285gtg ate gac ggc tcg cag atg cag gac gcg att cec acg ctg gcc gta 912 Vai lie Asp Gly Ser Gln Met Glu Asp Ala lie Pro Thr Iieu Ala Vai 290 295 300

ctg gcc gcg ttc aat cgt caa ceg gtg cgc ttt gtc ggc ate gcc aac 960 Leu Ala Ala Phe Asn Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Aan 305 310 315 320

ctg cgg gtc aag gag tgc gac cgc ate tcg gea ctg tec aac ggc ctg 1008 I/eu Arg Vai Lys Glu Cys Asp Arg lie Ser Ala Leu Ser Asn Gly Leu 325 330 335

tgc gcc ate gea cec ggc ctg gcg gtc gaa gag ggt gac gat ctg ate 1056 Cys Ala lie Ala Pro Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu lie 340 345 350

gtt acc gcc aac ceg acg ctg gea ggc act acg gtc gat gcc ttg ate 1104 Vai Thr Ala Asn Pro Thr Leu Ala Gly Thr Thr Vai Asp Ala Leu lie 355 360 365

gat acc cac tec gac cat cgg ate gcc atg tgc ttt gea ctg gcg ggc 1152 Asp Thr His Ser Asp His Arg lie Ala Met Cys Phe Ala Leu Ala Gly 370 375 380

ctg aag att gcc ggc ate cgc att etc gac cet gac tgc gtc gcc aag 1200 Leu Lys lie Ala Gly lie Arg lie Leu Asp Pro Asp Cys Vai Ala Lys 385 390 395 400

acc tac ceg ggg tac tgg gat gcg ctg gtt tet ctg ggt gtg agt gtt 1248 Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Vai Ser Leu Gly Vai Ser Vai 405 410 415

cag cgc tga 1257 Gln Arg *

<210> 56

<211> 418

<212> PRT

<213> Pseudomonas syringae <220>

<221> VARIANTE

<222> (0) ... (0)

<223> cepa B728a de pv syringae

<400> 56

Met Arg Pro Gln Ala Thr Leu Thr

1 5

Vai Gly Arg Vai Ser Pro Pro Gly

20

Leu Leu Leu Ala Gly Leu Ala Lys

35 40

Leu Lys Ser Asp Asp Thr Arg Vai

50 55

Gly Vai Gln Vai Asp Glu Pro Asp

65 70

Ser Gly His Trp Gln Ala Pro Gln

85

Gly Thr Ala Thr Arg Phe Leu Thr

100

Asp Phe Vai Vai Asp Gly Asp Glu

115 120

Pro Leu Vai Asp Ala Leu Gln Arg

130 135

Ser Gly Cys Pro Pro vai Ala lie

145 150

Gly Arg lie Glu lie Asp Gly Asn

165

Vai Leu Pro Vai Glu Arg Pro Leu

10 15

Ser Lys Ser lie Thr Asn Arg Ala

25 30

Gly Thr Ser Arg Leu Thr Gly Ala

45

Met Ser Glu Ala Leu Arg Leu Met

60

Asp Ser Thr Phe Vai Vai Thr Ser

75 80

Gln Ala Leu Phe Leu Gly Asn Ala

90 95

Ala Ala Leu Ala Asn Phe Glu Gly

105 110

Tyr Met Arg Lys Arg Pro lie Gly

125

Met Gly Vai Glu Vai Ser Ala Pro

140

Lys Gly Lys Gly Gly Leu Glu Ala

155 160

Leu Ser Ser Gln Tyr Vai Ser Ala

170 175Leu Leu Met Ala Gly Ala Cys Gly Lys Gly Pro Vai Glu Vai Ala Leu

180 185 190

Thr Gly Ser Glu lie Gly Ala Arg Gly Tyr Leu Asp Leu Thr Leu Ala

195 200 205

Ala Met Arg Ala Phe Gly Ala Glu Vai Gln Ala lie Gly Asp Ala Ala

210 215 220

Trp Lys Vai Ser Ala Thr Gly Tyr Arg Ala Thr Asp Phe His lie Glu 225 230 235 240

Pro Asp Ala Ser Ala Ala Thr Tyr Leu Trp Ala Ala Gln Ala Leu Thr

245 250 255

Glu Gly Ala lie Asp Leu Gly Vai Ala Ser Asn Ala Phe Thr Gln Pro

260 265 270

Asp Ala Leu Ala Ser Gln lie lie Ala Ser Phe Pro Asn Met Pro Ala

275 280 285

Vai lie Asp Gly Ser Gln Met Gln Asp Ala lie Pro Thr Leu Ala Vai

290 295 300

Leu Ala Ala Phe Asn Arg Gln Pro Vai Arg Phe Vai Gly lie Ala Asn 305 310 315 320

Leu Arg Vai Lys Glu Cys Asp Arg lie Ser Ala Leu Ser Asn Gly Leu

325 330 335

Cys Ala lie Ala Pro Gly Leu Ala Vai Glu Glu Gly Asp Asp Leu lie

340 345 350

Vai Thr Ala Asn Pro Thr Leu Ala Gly Thr Thr Vai Asp Ala Leu lie

355 360 365

Asp Thr His Ser Asp His Arg lie Ala Met Cys Phe Ala Leu Ala Gly

370 375 380

Leu Lys lie Ala Gly lie Arg Ilê Leu Asp Pro Asp Cys Vai Ala Lys 385 390 395 400

Thr Tyr Pro Gly Tyr Trp Asp Ala Leu Vai Ser Leu Gly Vai Ser Vai 405 410 415

Gln Arg

<210> 57

<211> 1332

<212> DNA

<213> Ochrobactrum/Brucella

<221> CDS

<222> (1) ... (1332)

<400> 57

atg gcg tgt ttg cct gat gat tcg ggt ccg cac gtc ggc cac tcc acg Met Ala Cys Leu Pro Asp Asp Ser Gly Pro His Vai Gly His Ser Thr 15 10 15

48

cca cct tgc ctt gac cag gag cct tgt acc ttg agt tcg cag aaa acc 96 Pro Pro Cys Leu Asp Gln Glu Pro Cys Thr Leu Ser Ser Gln Lys Thr 20 25 30

gtg acc gtt aca ccg ccc aac ttc ccc etc act ggc aag gtc gcg cec 144 Vai Thr Vai Thr pro Pro A8n Phe Pro Leu Thr Gly Lys Vai Ala Pro 35 40 45

ccc ggc tcc aaa tcc att acc aac cgt gcg ctg ttg etc gcg gea ctg 192 Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu 50 55 60

gcc aag ggc acc age cgt Ala Lys Gly Thr Ser Arg 65 70

ttg age ggt gcg etc aaa age gat gac acg 240 Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr 75 80cgc cac atg tcg gtc gcc ctg cgg cag atg ggc gtc acc ate gac gag 28a Arg His Met Ser Vai Ala Leu Arg Gln Met Gly Vai Thr lie Asp Glu 85 90 95

ceg gac gac acc acc ttt gtc gtc acc age caa ggc tcg ctg caa ttg 336 Pro Asp Asp Thr Thr Phe Vai Vai Thr Ser Gln Gly Ser Leu Gln Leu 100 105 110

ceg gcc cag ceg ttg ttc etc ggc aac gcc ggc acc gcc atg cgc ttt 384 Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe 115 120 125

etc acg gct gcc gtc gcc acc gtg caa ggc acc gtg gta ctg gac ggt 432 Leu Thr Ala Ala Vai Ala Thr Vai Gln Gly Thr Vai Vai Leu Asp Gly 130 135 140

gac gag tac atg caa aaa cgc ceg ate ggc ceg ctg ctg gcc acc ctg 480 Asp Glu Tyr Met Gln Lys Arg Pro lie Gly Pro Leu Leu Ala Thr Leu 145 150 155 160

ggc cag aac ggc ate cag gtc gac age cec acc ggt tgc cca ceg gta 528 Gly Gln Asn Gly lie Gln Vai Asp Ser Pro Thr Gly Cys Pro Pro Vai 165 170 175

acg gtg cat ggc gcg ggc aag gtc cag gcc agg cgt ttt gag att gac 576 Thr Vai His Gly Ala Gly Lys Vai Gln Ala Arg Arg Phe Glu lie Asp 180 185 190

99a 99C ttg tec age cag tac gta tcg gcc ctg ctg atg ctg gcg gcg 624 Gly Gly Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Leu Ala Ala 195 200 205

tgc ggc gaa gea ceg att gaa gtg gcg ctg acc ggc aag gac ate ggc 672 Cys Gly Glu Ala Pro II e Glu Vai Ala Leu Thr Gly Lye Asp lie Gly 210 215 220

gcc cgt ggc tat gtg gac ctg acc etc gat tgc atg cgt gcg ttc ggg 720 Ala Arg Gly Tyr Vai Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly

225 230 235 240

gcc cag gta gac ate gtg gac gac acc acc tgg cgc gtg gcc cec acg 768 Ala Gln Vai Asp lie Vai Asp Asp Thr Thr Trp Arg Vai Ala Pro Thr 245 250 255

ggc tat acc gcc cat gat tac ctg ate gaa cec gac gct tec gcc gcc 816 Gly Tyr Thr Ala His Asp Tyr Leu lie Glu Pro Asp Ala ser Ala Ala 260 265 270

act tac ctg tgg gcc gea gaa gta ctg acc ggt ggc cgt ate gat att 864 Thr Tyr Leu Trp Ala Ala Glu Vai Leu Thr Gly Gly Arg lie Asp lie 275 280 285

ggt gta gcc gcg cag gac ttc acc cag cec gac gcc aag gea cag gcc 912 Gly Vai Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala 290 295 300

gtg ate gcg caa ttc ceg aac atg cag gcc acg gtg gtg ggt tca caa 960 Vai lie Ala Gln Phe Pro Asn Met Gln Ala Thr Vai Vai Gly Ser Gln 305 310 315 320

atg cag gat gcg ate ceg acc ctg gcg gtg etc gcc gea ttc aac aat 1008 Met Gln Asp Ala lie Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn Asn 325 330 335

acc ceg gtg cgc ttc act gaa ctg gcg aac ctg cgc gtc aag gaa tgt 1056 Thr Pro Vai Arg Phe Thr Glu Leu Ala Asn Leu Arg Vai Lys Glu Cys 340 345 350gac cgc gtg cag gcg ctg cac gat ggc etc aac gaa att cgc ceg ggc 1104 Asp Arg Vai Gln Ala Leu His Aep Gly Leu Asn Glu lie Arg Pro Gly 355 360 365

ctg gcg acc ate gaa ggt gat gac ctg ctg gtt gcc age gac cec gct 1152 Leu Ala Thr lie Glu Gly Asp Asp Leu Leu Vai Ala Ser Asp Pro Ala 370 375 380

ttg gct ggc acc gcc tgc acc gea ctg ate gat acc cac gcc gac cat 1200 Leu Ala Gly Thr Ala Cys Thr Ala Leu lie Asp Thr His Ala Asp His 385 390 395 400

cgc ate gcc atg tgc ttt gcc ctg gcc ggg ctg aaa gtc tcg ggc att 1248 Arg lie Ala Met Cys Phe Ala Leu Ala Gly Leu Lye Vai Ser Gly lie 405 410 415

cgc ate caa gac cet gat tgc gta gcc aag acc tac cet gac tac tgg 1296 Arg II e Gln Aep Pro Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp 420 425 430

aaa gcg ctg gcc age ctg ggc gtt cac tta age tac 1332 Lys Ala Leu Ala Ser Leu Gly Vai His Leu Ser Tyr 435 440

<210> 58

<211> 1236

<212> DNA

<213> Ochrobactrum/Brucella

<221> CDS

<222> (1) ... (1236)

<400> 58

gtg acc gtt aca ceg cec aac ttc cec etc act ggc aag gtc gcg cec 48 Met Thr Vai Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Vai Ala Pro

15 10 15

cec ggc tec aaa tec att acc aac cgt gcg ctg ttg etc gcg gea ctg Pro Gly Ser Lys Ser lie Thr Asn Arg Ala Leu Leu Leu Ala Ala Leu 20 25 30

96

gcc aag ggc acc age cgt ttg age ggt gcg etc aaa age gat gac acg 144 Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr

35 40 45

cgc cac atg tcg gtc gcc ctg cgg cag atg ggc gtc acc ate gac gag 192 Arg His Met Ser Vai Ala Leu Arg Gln Met Gly Vai Thr lie Asp Glu

50 55 60

ceg gac gac acc acc ttt gtc gtc acc age caa ggc tcg ctg caa ttg 240

Pro Asp Asp Thr Thr Phe Vai Vai Thr Ser Gln Gly Ser Leu Gln Leu

65 70 75 80

ceg gcc cag ceg ttg ttc etc ggc aac gcc ggc acc gcc atg cgc ttt 288

Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe

85 90 95

etc acg gct gcc gtc gcc acc gtg caa ggc acc gtg gta ctg gac ggt 336

Leu Thr Ala Ala Vai Ala Thr Vai Gln Gly Thr Vai Vai Leu Asp Gly

100 105 110

gac gag tac atg caa aaa cgc ceg ate ggc ceg ctg ctg gcc acc ctg 384

Asp Glu Tyr Met Gln Lys Arg Pro lie Gly Pro Leu Leu Ala Thr Leuggc cag aac ggc ate cag gtc gac age cec acc ggt tgc cca ceg gta 432 Gly Gln Asn Gly lie Gln Vai Asp Ser Pro Thr Gly Cys Pro Pro Vai 130 135 140

acg gtg cat ggc gcg ggc aag gtc cag gcc agg cgt ttt gag att gac 480 Thr Vai His Gly Ala Gly Lys Vai Gln Ala Arg Arg Phe Glu lie Asp 145 150 155 160

9ga 99C ttg tec age cag tac gta tcg gcc ctg ctg atg ctg gcg gcg 528 Gly Gly Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Leu Ala Ala 165 170 175

tgc ggc gaa gea ceg att gaa gtg gcg ctg acc ggc aag gac ate ggc 576 Cys Gly Glu Ala Pro lie Glu Vai Ala Leu Thr Gly Lys Asp lie Gly 180 185 190

gcc cgt ggc tat gtg gac ctg acc etc gat tgc atg cgt gcg ttc ggg 624 Ala Arg Gly Tyr Vai Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly 195 200 205

gcc cag gta gac ate gtg gac gac acc acc tgg cgc gtg gcc cec acg 672 Ala Gln Vai Asp lie Vai Asp Asp Thr Thr Trp Arg Vai Ala Pro Thr 210 215 220

ggc tat acc gcc cat gat tac ctg ate gaa cec gac gct tec gcc gcc 720 Gly Tyr Thr Ala His Asp Tyr Leu lie Glu Pro Asp Ala Ser Ala Ala 225 230 235 240

act tac ctg tgg gcc gea gaa gta ctg acc ggt ggc cgt ate gat att 768 Thr Tyr Leu Trp Ala Ala Glu Vai Leu Thr Gly Gly Arg lie Asp lie 245 250 255

ggt gta gcc gcg cag gac ttc acc cag cec gac gcc aag gea cag gcc 816 Gly Vai Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala 260 265 270

gtg ate gcg caa ttc ceg aac atg cag gcc acg gtg gtg ggt tca caa 864 Vai lie Ala Gln Phe Pro Asn Met Gln Ala Thr Vai Vai Gly Ser Gln 275 280 285

atg cag gat gcg ate ceg acc ctg gcg gtg etc gcc gea ttc aac aat 912 Met Gln Asp Ala lie Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn Asn 290 295 300

acc ceg gtg cgc ttc act gaa ctg gcg aac ctg cgc gtc aag gaa tgt 960 Thr Pro Vai Arg Phe Thr Glu Leu Ala Asn Leu Arg Vai Lys Glu Cys 305 310 315 320

gac cgc gtg cag gcg ctg cac gat ggc etc aac gaa att cgc ceg ggc 1008 Asp Arg Vai Gln Ala Leu Hie Asp Gly Leu Asn Glu lie Arg Pro Gly 325 330 335

ctg gcg acc ate gaa ggt gat gac ctg ctg gtt gcc age gac cec gct 1056 Leu Ala Thr lie Glu Gly Asp Asp Leu Leu Vai Ala Ser Asp Pro Ala 340 345 350

ttg gct ggc acc gcc tgc acc gea ctg ate gat acc cac gcc gac cat 1104 Leu Ala Gly Thr Ala Cys Thr Ala Leu lie Asp Thr His Ala Asp His 355 360 365

cgc ate gcc atg tgc ttt gcc ctg gcc ggg ctg aaa gtc tcg ggc att 1152 Arg lie Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Vai Ser Gly lie 370 375 380

cgc ate caa gac cet gat tgc gta gcc aag acc tac cet gac tac tgg 1200 Arg lie Gln Asp Pro Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp 385 390 395 400

aaa gcg ctg gcc age ctg ggc gtt cac tta age tac 1236 Lys Ala Leu Ala Ser Leu Gly Vai His Leu Ser Tyr 405 410<210> 59

<211> 412

<212> PRT

<213> Ochrobactrum/Brucella

<400> 59

Met Thr Vai Thr Pro Pro Asn Phe Pro Leu Thr Gly Lys Vai Ala Pro

1 5 10 15

Pro Gly Ser Lys Ser He Thr Asn Arg Ala heu Leu Leu Ala Ala Leu

20 25 30

Ala Lys Gly Thr Ser Arg Leu Ser Gly Ala Leu Lys Ser Asp Asp Thr

35 40 45

Arg His Met ser Vai Ala Leu Arg Gln Met Gly Vai Thr He Asp Glu

50 55 60

Pro Asp Asp Thr Thr Phe Vai Vai Thr Ser Gln Gly Ser Leu Gln Leu

65 70 75 80

Pro Ala Gln Pro Leu Phe Leu Gly Asn Ala Gly Thr Ala Met Arg Phe

85 90 95

Leu Thr Ala Ala Vai Ala Thr Vai Gln Gly Thr Vai Vai Leu Asp Gly

100 105 110

Asp Glu Tyr Met Gln Lys Arg Pro He Gly Pro Leu Leu Ala Thr Leu

115 120 125

Gly Gln Asn Gly He Gln Vai Asp Ser Pro Thr Gly Cys Pro Pro Vai

130 135 140

Thr Vai His Gly Ala Gly Lys Vai Gln Ala Arg Arg Phe Glu He Asp

145 150 155 160

Gly Gly Leu Ser Ser Gln Tyr Vai Ser Ala Leu Leu Met Leu Ala Ala

165 170 175

Çys Gly Glu Ala Pro He Glu Vai Ala Leu Thr Gly Lys Asp He Gly

180 185 190

Ala Arg Gly Tyr Vai Asp Leu Thr Leu Asp Cys Met Arg Ala Phe Gly

195 200 205

Ala Gln Vai Asp He Vai Asp Asp Thr Thr Trp Arg Vai Ala Pro Thr

210 215 220

Gly Tyr Thr Ala His Asp Tyr Leu He Glu Pro Asp .Ala Ser Ala Ala

225 230 235 240

Thr Tyr I/eu Trp Ala Ala Glu Vai Leu Thr Gly Gly Arg He Asp He

245 250 255

Gly Vai Ala Ala Gln Asp Phe Thr Gln Pro Asp Ala Lys Ala Gln Ala

260 265 270

Vai He Ala Gln Phe Pro Asn Met Gln Ala Thr vai Vai Gly Ser Gln

275 280 265

Met Gln Asp Ala He Pro Thr Leu Ala Vai Leu Ala Ala Phe Asn Asn

290 295 300

Thr Pro Vai Arg Phe Thr Glu Leu Ala Asn Leu Arg Vai Lys Glu Cys

305 310 315 320

Asp Arg Vai Gln Ala Leu His Asp Gly Leu Asn Glu He Arg Pro Gly

325 330 335

Leu Ala Thr He Glu Gly Asp Asp Leu Leu Vai Ala Ser Asp Pro Ala

340 345 350

Leu Ala Gly Thr Ala Cys Thr Ala Leu He Asp Thr His Ala Asp His

355 360 365

Arg He Ala Met Cys Phe Ala Leu Ala Gly Leu Lys Vai Ser Gly He

370 375 380

Arg lie Gln Asp Pro Asp Cys Vai Ala Lys Thr Tyr Pro Asp Tyr Trp

385 390 395 400

Lys Ala Leu Ala Ser Leu Gly Vai His Leu Ser Tyr

405 410

210> 60

211> 1496

212> DNA

213> Desconhecido

220>

223> Isolado da amostra de solo

400>

60aagcaccggc tcacaaattc ccgccgatat tccgatagcc cggctttgcg ccgcattctt 60 tgacaagacg acgatcatga tcgaactgac catcaccccg cccggccacc cgctttccgg 120 caaggtggag ccgcccggtt ccaaatccat taccaaccgt gcacttctgc tggccgggct 180 cgccaagggc aaaagccgtc tcacgggcgc gctgaaaagc gacgatacgc tttacatggc 240 agaagcgctg cgtgagatgg gtgtcaaggt aaccgagcct gacgcgacca ccttcgtggt 300 ggagagttca ggtgggbtgc atcagccgga aaagccgctt ttcctcggca atgccggcac 360 agctacccgc tttctcaccg ccgctgccgc ccttgtggat ggcgccgtca tcatcgatgg 420 cgacgagcat atgcgcaaac gcccgatcat gccgctggtg gaagccctgc gctocctcgg 480 cgttgaggcg gaggcgccga ccggctgccc gcccgtcacc gtctgcggta agggtactgg 540 cttcccgaag ggcagcgtca cgatcgacgc caacctttcc agccagtatg tgtccgcact 600 tctgatggcc gccgcctgcg gcgacaagcc tgtcgatatc atcctcaaag gtgaggaaat 660 cggcgcgaag ggctatatcg atctcaccac atcggccatg gaagccttcg gcgcaaaggt 720 ggagcgggtc agcaacgcca tctggcgcgt gcatccgaco ggctacacgg cgaccgattt 780 ccatatcgag ccggatgcct cggccgccac ctatctctgg ggcgctgagc ttttgaccgg 840 cggcgccatc gatatcggta cgccggccga caagttcacc cagccggatg ccaaggccca 900 tgaggtcatg gcgcaatttc cgcatctgcc cgccgaaatc gacggttcgc agatgcagga 960 tgccattccc accattgccg ttctcgccgc ctttaacgaa acgccggtgc gtttcgtcgg 1020 catcgccaat ctgcgcgtca aggagtgcga ccgaatccgc gccgtctcac tcggcctcaa 1080 cgaaatccgc gatggtctgg cgcatgagga aggcgacgac ttgatcgtgc attccgatcc 1140 ttcgcttgcg ggccagacgg tgaatgcctc catcgacact ttcgccgacc accgtatcgc 1200 catgagcttt gcgctggcgg cgctgaagat cggcggcatt gccatccaga atccggcctg 1260 cgtgggcaag acctatcccg gttactggaa ggcgctcgcc tcgctgggag tcgaatactc 1320 ggaaaaggaa accgctgccg agccgcagca ttagaagaac ggtattggtt ttccgtcatt 1380 ccggccctga gccggaatcc agtgcgatca agtccttgat cgcgaaagac tcttcaagcc 1440 gcgcagacgc gcggctgctg gataccgggt ctagcccggt atgacggcaa tgactg 1496

<210> 61

<211> 33

<212> DNA

<213> Seqüência artificial <220>

<223> Oligonucleotídeo

<400> 61

cagagatctg gcatgcgacc tcaagccact etc

<210> 62

<211> 31

<212> DNA

<213> Seqüência artificial <220>

<223> Oligonucleotídeo

<400> 62

cagggcgcgc ctcagcgctg aacactcacc c

<210> 63

<211> 34

<212> DNA

<213> Seqüência artificial

33

31

<220>

<223> Oligonucleotídeo

<400> 63

cagggatccg gcatgatcga actgaccatc accc 34

<210> 64

<211> 33

<212> DNA

<213> Seqüência artificial<220>

<223> Oligonucleotídeo <400> 64

cagggcgcgc ctcagtgctg cggctcggca gcg

<210> 65

<211> 33

<212> DNA

<213> Seqüência artificial <220>

<223> Oligonucleotídeo

<400> 65

cagggatccg gcatgcgacc tcaagccacc etc

<210> 66

<211> 31

<212> DNA

<213> Seqüência artificial <220>

<223> Oligonucleotídeo

<400> 66

cagggcgcgc ctcagcgctg aacactcaca c

<210> 67

<211> 33

<212> DNA

<213> Seqüência artificial

<220>

<223> Oligonucleotídeo

<400> 67

cagggatccg gcatgcgacc tcaagccacc etc

<210> 68

<211> 30

<212> DNA

<213> Seqüência artificial

<220>

<223> Oligonucleotídeo

<400> 68

agaggcgcgc ctcagcgctg aacacgcacc

106

33

31

33

Claims

REIVINDICAÇÕES

1. Polinucleotídeo isolado diferente do polinucleotídeo listado nas SEQ ID NOS: 1, 3, 7, 45, 47, e 53 que codifica uma enzima EPSPS que tem pelo menos um domínio de seqüência selecionado a partir do grupo que consiste em: Domínio I:L-A-K-G-XrS-Xa-L^-G-A-L-K-S-D-D-T (SEQ ID NO: 13), onde Xi denota lisina ou treonina, onde X2 denota arginina ou histidina, onde X3 denota serina ou treonina; Domínio Ia:L-A-K-G-Xi, (SEQ ID NO: 14), onde Xi denota lisina ou treonina;Domínio Ib:S-XrL^ÍSEQ ID NO: 15), onde X1 denota arginina ou histidina, onde X2 denota serina ou treonina; Domínio Ic:G-A-L-K-S-D-D-T (SEQ ID NO: 16);Domínio II:E-P-D-X^-T-F-Xa-VOQ-Xs-Xe-G (SEQ ID NO: 17), onde X1 denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota valina ou isoleucina, onde X4 denota treonina ou ácido glutamico, ou lisina, onde X5 denota serina ou glicina, onde X6 denota glutamina ou serina ou ácido glutamico ou treonina; Domínio lia:E-P-D-X1-X2-T-F-X3-V (SEQ ID NO: 18), onde X, denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota valina ou isoleucina; Domínio Mb:XrX2-X3-G (SEQ ID NO: 19), onde X1 denota treonina ou ácido glutamico ou lisina, onde X2 denota serina ou glicina, onde X3 denota glutamina ou serina ou ácido glutamico ou treonina; Domínio III:flFLTAA (SEQ ID NO: 20);2Domínio IV:KflPI(G/M)P(SEQIDNO:21)K-/?-P-l-XrP, onde Xt denota glicina ou metionina ou leucina;Domínio V: XrG-C-P-P-V (SEQ ID NO: 22), onde X, denota treonina ou se-rina;Domínio VI:l-G-A-XrG-Y-X2-D-L-T (SEQ ID NO: 23), onde Xi denota argini-na ou lisina ou leucina, e onde X2 denota isoleucina ou valina; Domínio VII:W-XrV-X2-X3-T-G (SEQ ID NO: 24), onde X, denota arginina ou lisina, onde X2 denota alanina ou histidina ou ácido glutâmico ou serina, onde X3 denota prolina ou alanina; Domínio VIII: E-P-D-A-S-A-A-T- Y-L-W-XrA-X2-X3-L (SEQ ID NO: 25), ondeXt denota alanina ou glicina, onde X2 denota ácido glutâmico ou glutamina, onde X3 denota valina ou leucina ou alanina; Domínio Vllla:E-P-D-A-S-A-A-T- Y-L-W (SEQ ID NO: 26); Domínio IX:I-D-Xt-G (SEQ ID NO: 27), onde X1 denota isoleucina ou leucina;Domínio X:F-XrQ-P-D-A- K-A (SEQ ID NO: 28), onde Xi denota treonina ouserina; Domínio XI:XrF-P-Xg-Xa^-A-Xs-Xe-Xy-G-S-Q-M-Q-D-A-l-P-T-Xe-A-V- X9 A-A- F-N (SEQ ID NO: 29), onde X: denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina, onde X5 denota treonina ou ácido glutâ- mico ou valina, onde X6 denota valina ou isoleucina, onde X7 denota ácido aspártico ou valina, onde X8 denota leucina ou isoleucina, onde X9 denota leucina ou isoleucina;Domínio Xla:XrF-P-X2-X3-X4-A (SEQ ID NO: 30), onde Xi denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina; Domínio Xlb:XrXa-Xs-G-S-Q-M-Q-D-A-l-P-TOQ-A- V- X5 A-A- F-N (SEQ ID NO: 31), onde X^ denota treonina ou ácido glutamico ou valina, onde X2 denota valina ou isoleucina, onde X3 denota ácido aspártico ou valina, onde X4 denota leucina ou isoleucina, onde X5 denota leucina ou isoleucina; Domínio Xlc:G-S-Q-M-Q-D-A-l-P-T (SEQ ID NO: 32); Domínio XII:P-V-R-F-X1-X2-X3-X4-N-L-R-V-K-E-C-D-fí-X5 (SEQ ID NO: 33), onde Xi denota valina ou treonina, onde X2 denota ácido glutamico ou glici-na, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutamico, onde X5 denota isoleucina ou valina; Domínio Xlla:P-V-R-F (SEQ ID NO: 34); Domínio Xllb:XrX^Xs-X^N-L-R-V-K-E-C-D-fl-Xs (SEQ ID NO: 35), onde Xidenota valina ou treonina, onde X2 denota ácido glutamico ou glicina, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutamico, onde X5 denota isoleucina ou valina; Domínio XIIc:N-L-R-V-K-E-C-D-fl (SEQ ID NO: 36);Domínio XIII:E-G-D-D-L-XrX2 (SEQ ID NO: 37), onde Xt denota leucina ou isoleucina, onde X2 denota valina ou isoleucina; Domínio XIV:XrP-X2-L-A-G (SEQ ID NO: 38), onde X^ denota ácido aspárticoou asparagina, onde X2 denota alanina ou serina ou treonina; Domínio XV:A-X1-I-D-X2-X3-X4- D-H-R (SEQ ID NO: 39), onde ^ denota leu-cina ou serina ou ácido glutâmico, onde X2 denota treonina ou serina, onde X3 denota histidina ou fenilalanina, onde X4 denota alanina ou serina; Domínio XVI: F-A-L-A-XrL-K-X2-X3-G-l (SEQ ID NO: 40), onde X1 denota gli-cina ou alanina, onde X2 denota isoleucina ou valina, onde X3 denota serina ou glicina ou alanina ou lisina; Domínio XVIa:F-A-L-A-XrL-K (SEQ ID NO: 41), onde X1 denota glicina ou ala-nina;Domínio XVIb:L-K-XtXjtG-I (SEQ ID NO: 42), onde X^ denota isoleucina ou valina, onde X2 denota serina ou glicina ou alanina ou lisina; Domínio XVII: -XrP^-C-V-Xs-K^SEQ ID NO: 43), onde X1 denota asparaginaou ácido aspártico, onde X2 denota alanina ou ácido aspártico, onde X3 denota alanina ou glicina; Domínio XVIII:XrS-L-G-V (SEQ ID NO: 44), onde Xt denota alanina ou serina ou prolina.

2. Polinucleotídeo de acordo com a reivindicação 1, em que o dito polinucleotídeo é selecionado a partir do grupo que consiste em:a) a seqüência de nucleotídeo de SEQ ID NO: 9, 11, 55, 57, 58, ou 60, ou um complemento dessas; b) uma seqüência de nucleotídeo que tem pelo menos 95%de identidade de seqüência com a seqüência de nucleotídeo de SEQ ID NO: 9, 11, 57, ou 59, ou 61, ou um complemento dessas;c) a seqüência de nucleotídeo de resistência do inserto de DNA do plasmídeo depositado como N9s de Acesso B-30833 ou B-30838, ou um complemento desses;d) uma seqüência de nucleotídeo que codifica um polipeptí-deo que compreende a seqüência de aminoácido de SEQ ID NO: 10, 12, 56, ou 59; e, e) uma seqüência de nucleotídeo que codifica um polipeptí-deo que tem pelo menos 95% de identidade de seqüência 5 de aminoácido com a seqüência de aminoácido de SEQ IDNO: 10, 12, ou 59.

3. Polinucleotídeo de acordo com a reivindicação 1, em que o dito polinucleotídeo está ligado a um promotor que funciona em células de planta para causar a produção de uma seqüência de RNA que permite ex- pressão suficiente da enzima EPSPS codificada para aumentar a tolerância ao glifosato de uma célula de planta transformada com o polinucleotídeo.

4. Polinucleotídeo de acordo com a reivindicação 3 que ainda compreende uma região 3' não traduzida que funciona em células de planta para causar a adição de uma extensão de nucleotídeos poliadenilados à terminação 3' da seqüência de RNA.

5. Polinucleotídeo de acordo com a reivindicação 3, em que o dito promotor é heterólogo em relação ao polinucleotídeo.

6. Polinucleotídeo de acordo com a reivindicação 1, no qual o polinucleotídeo codifica um polipeptídeo de fusão que compreende um pep- tídeo de trânsito de cloroplasto amino-terminal e a enzima EPSPS.

7. Método de produzir plantas geneticamente transformadas que são tolerantes em relação ao herbicida glifosato, que compreende as etapas de:a) inserir no genoma de uma célula de planta um polinucleotí-25 deo que compreende:i) um promotor que funciona em células de planta para causar a produção de uma seqüência de RNA,ii) um polinucleotídeo diferente do polinucleotídeo listado na SEQ ID NOS: 7 ou 53 que causa a produção de uma seqüência de RNA que codifica uma enzimaEPSPS que tem pelo menos um domínio de seqüência selecionado apartir do grupo que consiste em:Domínio I:L-A-K-G-Xi-S-X2-L-X3-G-A-L-K-S-D-D-T (SEQ ID NO: 13), onde Xt denota lisina ou treonina, onde X2 denota arginina ou histidina, onde X3 denota serina ou treonina; 5 Domínio Ia:L-A-K-G-Xt, (SEQ ID NO: 14), onde Xi denota lisina ou treonina;Domínio Ib:S-X1-L-X2 (SEQ ID NO: 15), onde X^ denota arginina ou histidina, onde X2 denota serina ou treonina; 10 Domínio Ic:G-A-L-K-S-D-D-T (SEQ ID NO: 16);Domínio II:E-P-D-XrXs-T-F-Xa-V-X^Xs-Xe-G (SEQ ID NO: 17), onde X, denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 15 denota valina ou isoleucina, onde X4 denota treonina ou ácido glutâmico, ou lisina, onde X5 denota serina ou glicina, onde X6 denota glutamina ou serina ou ácido glutâmico ou treonina; Domínio Ma:E-P-D-X^Xg-T-F-Xa-V (SEQ ID NO: 18), onde X^ denota ácido 20 aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota valina ou isoleucina; Domínio Mb:XrX2-X3-G (SEQ ID NO: 19), onde X, denota treonina ou ácido glutâmico ou lisina, onde X2 denota serina ou glicina, onde X3 denota gluta-25 mina ou serina ou ácido glutâmico ou treonina; Domínio III:flFLTAA (SEQ ID NO: 20);Domínio IV:K/?PI(G/M)P (SEQ ID NO: 21) 30 K-H-P-I-XtP, onde X1 denota glicina ou metionina ou leucina;Domínio V:Xt-G-C-P-P-V (SEQ ID NO: 22), onde X, denota treonina ou se-rina;Domínio VI:l-G-A-XrG-Y-X2-D-L-T (SEQ ID NO: 23), onde Xi denota argini-na ou lisina ou leucina, e onde X2 denota isoleucina ou valina; Domínio VII:W-XrV-X2-X3-T-G (SEQ ID NO: 24), onde X^ denota arginina ou lisina, onde X2 denota alanina ou histidina ou ácido glutâmico ou serina, onde X3 denota prolina ou alanina; Domínio VIII: E-P-D-A-S-A-A-T- Y-L-W-XrA-X2-X3-L (SEQ ID NO: 25), ondeX1 denota alanina ou glicina, onde X2 denota ácido glutâmico ou glutamina, onde X3 denota valina ou leucina ou alanina; Domínio Vllla:E-P-D-A-S-A-A-T- Y-L-W (SEQ ID NO: 26); Domínio IX:l-D-XrG (SEQ ID NO: 27), onde X^ denota isoleucina ou leucina;Domínio X:F-XrQ-P-D-A- K-A (SEQ ID NO: 28), onde X^ denota treonina ouserina; Domínio XI:XrF-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-l-P-T-X8-A-V- X9 A-A- F-N (SEQ ID NO: 29), onde X1 denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina, onde X5 denota treonina ou ácido glutâ-25 mico ou valina, onde X6 denota valina ou isoleucina, onde X7 denota ácido aspártico ou valina, onde X8 denota leucina ou isoleucina, onde X9 denota leucina ou isoleucina; Domínio Xla:Xi-F-P-X2-X3-X4-A (SEQ ID NO: 30), onde X^ denota glutamina 30 ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina; Domínio Xlb:XrX2-X3-G-S-Q-M-Q-D-A-l-P-T-X4-A- V- X5 A-A- F-N (SEQ ID NO: 31), onde Xi denota treonina ou ácido glutamico ou valina, onde X2 denota valina ou isoleucina, onde X3 denota ácido aspártico ou valina, onde X4 denota leucina ou isoleucina, onde X5 denota leucina ou isoleucina; Domínio Xlc:G-S-Q-M-Q-D-A-l-P-T (SEQ ID NO: 32); Domínio XII:P-V-R-F-X1-X2-X3-X4-N-L-R-V-K-E-C-D-fí-X5 (SEQ ID NO: 33), onde Xi denota valina ou treonina, onde X2 denota ácido glutamico ou glici-na, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutamico, onde X5 denota isoleucina ou valina; Domínio XIIa:P-V-R-F (SEQ ID NO: 34); Domínio Xllb:Xi-X2-X3-X4-N-L-R-V-K-E-C-D-f?-X5 (SEQ ID NO: 35), onde X, denota valina ou treonina, onde X2 denota ácido glutamico ou glicina, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutamico, onde X5 denota isoleucina ou valina; Domínio XI Ic:N-L-R-V-K-E-C-D-fl (SEQ ID NO: 36); Domínio XIII:E-G-D-D-L-XrX2 (SEQ ID NO: 37), onde Xi denota leucina ou isoleucina, onde X2 denota valina ou isoleucina; Domínio XIV:XrP-XjrL-A-G (SEQ ID NO: 38), onde Xi denota ácido aspártico ou asparagina, onde X2 denota alanina ou serina ou treonina; Domínio XV:A-Xrl-D-X2-X3-X4- D-H-R (SEQ ID NO: 39), onde X: denota leucina ou serina ou ácido glutamico, onde X2 denota treonina ou serina, onde X3 denota histidina ou fenilalanina, onde X4 denota alanina ou serina; Domínio XVI:F-A-L-A-XrL-K-X^-G-l (SEQ ID NO: 40), onde XA denota gli-cina ou alanina, onde X2 denota isoleucina ou valina, onde X3 denota serina ou glicina ou alanina ou lisina; Domínio XVIa:F-A-L-A-XrL-K (SEQ ID NO: 41), onde X, denota glicina ou ala- nina;Domínio XVIb:L-K-XrX2-G-l (SEQ ID NO: 42), onde Xi denota isoleucina ou valina, onde X2 denota serina ou glicina ou alanina ou lisina; Domínio XVII: -X^P-X2-C-V-X3-K (SEQ ID NO: 43), onde X1 denota asparaginaou ácido aspártico, onde X2 denota alanina ou ácido aspártico, onde X3 denota alanina ou glicina; Domínio XVIII:XrS-L-G-V (SEQ ID NO: 44), onde Xi denota alanina ou serina ou prolina.iii) um polinucleotídeo 3' não traduzido que funciona em células de plantas para causar a adição de uma extensão de nucleotídeos poliadenilados no final de terminação 3' da seqüência de RNA; 20 b) obter uma célula de planta transformada; ec) regenerar a partir da célula de planta transformada uma planta geneticamente transformada que tem tolerância ao herbicida glifosato aumentada.

8. Método de acordo com a reivindicação 7, em que obter a plan-25 ta transformada compreende rastrear por uma tolerância aumentada ao herbicida glifosato.

9. Método de acordo com a reivindicação 7, no qual o polinucleotídeo codifica um polipeptídeo de fusão que compreende um peptídeo de trânsito amino-terminal e a enzima EPSPS.

10. Célula de planta tolerante ao glifosato que compreende umpolinucleotídeo heterólogo como definido na reivindicação 1.

11. Célula de planta tolerante ao glifosato de acordo com a reivin-dicação 10, selecionada a partir do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba sacarina, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, choupo, pinho, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramíneas.

12. Planta tolerante ao glifosato que compreende células de planta como definidas na reivindicação 10.

13. Semente transformada da planta como definida na reivindicação 12.

14. Planta tolerante ao glifosato de acordo com a reivindicação 12, selecionada a partir do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba sacarina, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, choupo, pinho, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramíneas.

15. Polipeptídeo isolado selecionado a partir do grupo que consiste em:a) um polipeptídeo que compreende a seqüência de aminoá-cldo de SEQ ID NO: 10, 12, 56, ou 59;b) um polipeptídeo codificado pela seqüência de nucleotídeo de SEQ ID NO: 9, 11, 55, 57, 58, ou 60;c) um polipeptídeo que compreende uma seqüência de ami-noácido que tem pelo menos 95% de identidade de seqüência com a seqüência de aminoácido de SEQ ID NO: 10, 12, ou 59, em que o dito polipeptídeo tem atividade de resistência a herbicida;d) um polipeptídeo que é codificado por uma seqüência de nucleotídeo que é pelo menos 95% idêntica a seqüência de nucleotídeo de SEQ ID NO: 9, 11, 57, 58, ou 60, em que o dito polipeptídeo tem atividade de resistência a herbicida; e,e) um polipeptídeo que é codificado pela seqüência de nucleotídeo de resistência a herbicida do inserto de DNA do plasmídeo depositado como N9s de Acesso B-30833 ou B-·30838.

16. Polipeptídeo de acordo com a reivindicação 15, compreendendo ainda uma seqüência de aminoácido heteróloga.

17. Método para controlar seletivamente ervas daninhas em um campo que tem sementes de plantas ou plantas que compreende as etapas de:a) plantar as sementes ou plantas que são tolerantes ao glifo-sato, as ditas plantas ou sementes tendo integrado nos seus genomas um polinucleotídeo que compreende um po-linucleotídeo heterólogo que tem::i) um promotor que funciona em células de planta para causar a produção e uma seqüência de RNA;ii) um polinucleotídeo diferente do polinucleotídeo listado em SEQ ID NO: 7 ou 53 que causa a produção de uma seqüência de RNA que codifica uma enzima EPSPS que tem pelo menos um domínio de seqüência selecionado a partir do grupo que consiste em:Domínio I:L-A-K-G-XrS-X2-L-X3-G-A-L-K-S-D-D-T (SEQ ID NO: 13), onde Xi denota lisina ou treonina, onde X2 denota arginina ou histidina, onde X3 denota serina ou treonina; Domínio Ia:L-A-K-G-X1, (SEQ ID NO: 14), onde X1 denota lisina ou treonina;Domínio Ib:S-Xi-L-X2(SEQ ID NO: 15), onde X1 denota arginina ou histidina, onde X2 denota serina ou treonina; Domínio Ic:G-A-L-K-S-D-D-T (SEQ ID NO: 16);Domínio II:E-P-D-XrXs-T-F-Xg-VOQ-Xs-Xe-G (SEQ ID NO: 17), onde X1 denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota valina pu isoleucina, onde X4 denota treonina ou ácido glutâmico, oulisina, onde X5 denota serina ou glicina, onde X6 denota glutamina ou serina ou ácido glutamico ou treonina; Domínio Ma:E-P-D-XrX2-T-F-X3-V (SEQ ID NO: 18), onde Xi denota ácido aspártico ou alanina, onde X2 denota serina ou treonina, onde X3 denota va-lina ou isoleucina; Domínio llb:XrX2-X3-G (SEQ ID NO: 19), onde Xi denota treonina ou ácido glutamico ou lisina, onde X2 denota serina ou glicina, onde X3 denota glutamina ou serina ou ácido glutamico ou treonina; Domínio III:flFLTAA (SEQ ID NO: 20);Domínio IV:KflPI(G/M)P (SEQ ID NO: 21)K-/?-P-l-XrP, onde Xi denota glicina ou metionina ou leucina;Domínio V:XrG-C-P-P-V (SEQ ID NO: 22), onde XA denota treonina ou serina;Domínio VI:l-G-A-XrG-Y-X2-D-L-T (SEQ ID NO: 23), onde X: denota argini-na ou lisina ou leucina, e onde X2 denota isoleucina ou valina; Domínio VII:W-XrV-X2-X3-T-G (SEQ ID NO: 24), onde Xi denota arginina ou lisina, onde X2 denota alanina ou histidina ou ácido glutamico ou serina, onde X3 denota prolina ou alanina; Domínio VIII:E-P-D-A-S-A-A-T- Y-L-W-XrA-X2-X3-L (SEQ ID NO: 25), onde X-i denota alanina ou glicina, onde X2 denota ácido glutamico ou glutamina, onde X3 denota valina ou leucina ou alanina; Domínio Vllla:E-P-D-A-S-A-A-T- Y-L-W (SEQ ID NO: 26);Domínio IX:l-D-XrG (SEQ ID NO: 27), onde Xi denota isoleucina ou leucina;Domínio X:F-XrQ-P-D-A- K-A (SEQ ID NO: 28), onde X, denota treonina ouserina; Domínio XI:Xi-F-P-X2-X3-X4-A-X5-X6-X7-G-S-Q-M-Q-D-A-I-P-T-X8-A-V- X9 A-A- F-N (SEQ ID NO: 29), onde Xi denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina, onde X5 denota treonina ou ácido glutâ-mico ou valina, onde X6 denota valina ou isoleucina, onde X7 denota ácido aspártico ou valina, onde X8 denota leucina ou isoleucina, onde X9 denota leucina ou isoleucina; Domínio Xla:Xi-F-P-X2-X3-X4-A (SEQ ID NO: 30), onde Xi denota glutamina ou lisina ou serina, onde X2 denota asparagina ou histidina, onde X3 denota metionina ou leucina, onde X4 denota prolina ou glutamina; Domínio Xlb:XTX2-X3-G-S-Q-M-Q-D-A-I-P-T-X4-A- V- X5 A-A- F-N (SEQ ID NO: 31), onde Xi denota treonina ou ácido glutâmico ou valina, onde X2 denota valina ou isoleucina, onde X3 denota ácido aspártico ou valina, onde X4 denota leucina ou isoleucina, onde X5 denota leucina ou isoleucina; Domínio Xlc:G-S-Q-M-Q-D-A-l-P-T (SEQ ID NO: 32); Domínio XII:P-V-R-F-XrX2-X3-X4-N-L-R-V-K-E-C-D-f?-X5 (SEQ ID NO: 33), onde Xi denota valina ou treonina, onde X2 denota ácido glutâmico ou glici-na, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutâmico, onde X5 denota isoleucina ou valina; Domínio Xlla:P-V-R-F (SEQ ID NO: 34); Domínio Xllb:XrX2-X3-X4-N-L-R-V-K-E-C-D-fl-X5 (SEQ ID NO: 35), onde X^denota valina ou treonina, onde X2 denota ácido glutâmico ou glicina, onde X3 denota leucina ou isoleucina, onde X4 denota alanina ou ácido glutâmico, onde X5 denota isoleucina ou valina; Domínio XIIc:N-L-R-V-K-E-C-D-f? (SEQ ID NO: 36); Domínio XIH:E-G-D-D-L-XrX2 (SEQ ID NO: 37), onde Xi denota leucina ou isoleucina, onde X2 denota valina ou isoleucina; Domínio XIV:XrP-X2-L-A-G (SEQ ID NO: 38), onde X1 denota ácido aspártico ou asparagina, onde X2 denota alanina ou serina ou treonina; Domínio XV:A-XH-D-X2-X3-X4- D-H-R (SEQ ID NO: 39), onde X, denota leucina ou serina ou ácido glutâmico, onde X2 denota treonina ou serina, onde X3 denota histidina ou fenilalanina, onde X4 denota alanina ou serina; Domínio XVI:F-A-L-A-XrL-K-Xs-Xg-G-l (SEQ ID NO: 40), onde Xi denota glicina ou alanina, onde X2 denota isoleucina ou valina, onde X3 denota serina ou glicina ou alanina ou lisina; Domínio XVIa:F-A-L-A-XrL-K (SEQ ID NO: 41), onde X, denota glicina ou alanina;Domínio XVIb:L-K-XrX2-G-l (SEQ ID NO: 42), onde Xi denota isoleucina ou valina, onde X2 denota serina ou glicina ou alanina ou lisina; Domínio XVII:-Xi-P-Xs-C-V-Xs-K (SEQ ID NO: 43), onde Xi denota asparagina ou ácido aspártico, onde X2 denota alanina ou ácido aspártico, onde X3 denota alanina ou glicina; Domínio XVIII:XrS-L-G-V (SEQ ID NO: 44), onde Xi denota alanina ou serinaou prolina.iii) um polinucleotídeo 3' não traduzido que funciona em células de planta para causar a adição de uma extensão de nucleotídeos poliadenilados à terminação 3' da seqüência de RNA; e b) aplicar às plantas e sementes no campo uma quantidade suficiente de herbicida glifosato para controlar as sementes sem afetar significativamente as plantas.

18. Método de acordo com a reivindicação 17, em que a dita planta ou sementes de planta compreendem uma planta de cultivo.

19. Método de acordo com a reivindicação 17, em que o dito promotor é heterólogo com relação ao polinucleotídeo e adaptado para causar expressão suficiente da enzima EPSPS para aumentar a tolerância ao glifosato da planta transformada com o polinucleotídeo.

20. Método de produzir uma planta que é tolerante em relação ao herbicida glifosato, que compreende as etapas de:a) inserir no genoma de uma célula de planta o polinucleotídeo como definido na reivindicação 1;b) obter células de planta transformadas; ec) regenerar a partir da célula de planta transformada uma planta geneticamente transformada que tem tolerância em relação ao herbicida glifosato aumentada.

21. Método de produzir plantas geneticamente transformadas que são tolerantes ao glifosato, que compreende transformar células de planta com um construto de DNA que compreende um polinucleotídeo selecionado a partir do grupo que consiste em SEQ ID NOS: 1, 3, 9, 1.1, 45, 47, 55, 57, 58 ou 60, e regenerar uma planta transformada.

22. Método de acordo com a reivindicação 21, em que o dito construto de DNA ainda compreende um promotor que funciona em células de planta para causar a produção de uma seqüência de RNA que permite a expressão suficiente da enzima EPSPS codificada para aumentar a tolerância ao glifosato de uma célula de planta transformada com o polinucleotídeo.

23. Método de acordo com a reivindicação 21, no qual o polinu-cleotídeo codifica um polipeptídeo de fusão que compreende um peptídeo de trânsito de cloroplasto amino-terminal e a enzima EPSPS.

24. Célula de planta tolerante ao glifosato que compreende um polinucleotídeo selecionado a partir do grupo que consiste em SEQ ID NOS: 1,3,9,11,45,47,55,57,58,6 60.

25. Célula de planta tolerante ao glifosato de acordo com a reivindicação 24, selecionada a partir do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba sacarina, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, choupo, pinho, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramíneas.

26. Planta tolerante ao glifosato que compreende células de planta como definidas na reivindicação 24.

27. Planta tolerante ao glifosato de acordo com a reivindicação 26, selecionada a partir do grupo que consiste em milho, trigo, arroz, cevada, soja, algodão, beterraba sacarina, colza, canola, linho, girassol, batata, tabaco, tomate, alfafa, choupo, pinho, eucalipto, maçã, alface, ervilhas, lentilhas, uva e gramíneas.

28. Semente transformada da planta como definida na reivindicação 26.

29. Método para controlar seletivamente ervas daninhas em um campo que tem sementes plantadas ou plantas que compreende as etapas de:a) plantar as plantas como definidas na reivindicação 26, ou a semente transformada derivada delas, eb) aplicar às plantas e sementes no campo uma quantidade suficiente de herbicida glifosato para controlar as ervas daninhas sem afetar significativamente as plantas.

30. Método de acordo com a reivindicação 29, em que a dita planta ou sementes de planta compreende uma planta de cultivo.

31. Método de acordo com a reivindicação 29, no qual o polinucleotídeo codifica um polipeptídeo de fusão que compreende um peptídeo de trânsito de cloroplasto amino-terminal e a enzima EPSPS.