BRPI0619092A2

BRPI0619092A2 - molécula de ácido nucléico isolada, polipetptìdeo isolado, vetor, célula hospedeira, planta transgênica, semente, método para produzir polipeptìdeo com atividade de resistência à herbicidas, método para conferir resistência à herbicida para planta, método para medir à liberação de fosfato por enzima

Info

Publication number: BRPI0619092A2
Application number: BRPI0619092-8A
Authority: BR
Inventors: Cheryl L Peters; Jill Hinson; Philip E Hammer; Brian Vande Berg; Laura Cooper Schouten; Brian Carr
Original assignee: Athenix Corp
Priority date: 2005-12-01
Filing date: 2006-12-01
Publication date: 2011-09-13
Also published as: EP2078754A2; NZ569433A; WO2007064828A2; DE602006008827D1; PL1963510T3; EP1963510B1; CA2631406C; RU2008126711A; SI1963510T1; US20070136840A1; HRP20090610T1; EP2078754B1; AU2006320516A1; RU2393225C2; AU2006320516B2; CA2631406A1; US20090227771A1; RS51134B; AU2006320516C1; US7674958B2

Abstract

MOLéCULA DE áCIDO NUCLéICO ISOLADA, POLIPEPTìDEO ISOLADO, VETOR, CéLULA HOSPEDEIRA, PLANTA TRANSGêNICA, SEMENTE, MéTODO PARA PRODUZIR POLIPEPTIDEO COM ATIVIDADE DE RESISTêNCIA A HERBICIDAS, METODO PARA CONFERIR RESISTêNCIA A HERBICIDA PARA PLANTA, MéTODO PARA MEDIR A LIBERAçãO DE FOSFATO POR ENZIMA. Composições e métodos para conferir resistência ou tolerância a herbicidas para bactérias, plantas, células vegetais, tecidos e sementes são providos. Composições incluem polinucleotídeos codificando polipeptídeos de resistência ou tolerância a herbicidas, vetores compreendendo aqueles polinucleotídeos, e células hospedeiras compreendendo os vetores. As seqüências de nucleotídeos da invenção podem ser usadas em constructos de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo microorganismos e plantas. Composições também compreendem bactérias, plantas, plantas, células vegetais, tecidos e sementes transformadas. Em particular, são providos polinucleotídeos isolados codificando polipeptídeos de resistência ou tolerância a glifosato. Adicionalmente, seqúências de aminoácidos correspondentes aos polinucleotideos são englobadas. Em particular, a presente invenção provê polinucleotídeos isolados compreendendo seqúências de nucleotídeos codificando a seqUência de aminoácidos apresentada em SEQ ID NO: 2, 4, ou 6, ou a seqUência de nucleotídeos apresentada em SEQ ID NO: 1, 3, ou 5. A presente invenção provê, adicionalmente, um método para medir atividade cinética de enzima usando substratos fluorogênicos.

Description

MOLÉCULA DE ACIDO NUCLEICO ISOLADA, POLIPEPTIDEO ISOLADO, VETOR, CÉLULA HOSPEDEIRA, PLANTA TRANS GÊNICA, SEMENTE, MÉTODO PARA PRODUZIR POLIPEPTIDEO COM ATIVIDADE DE RESISTÊNCIA A HERBICIDAS, MÉTODO PARA CONFERIR RESISTÊNCIA A HERBICIDA PARA PLANTA, MÉTODO PARA MEDIR A LIBERAÇÃO DE FOSFATO POR ENZIMA

CAMPO DA INVENÇÃO

Esta invenção provê novos genes codificando resistência a herbicidas, os quais são úteis em biologia vegetal, melhoramento de cultivares, e cultura de células vegetais.

FUNDAMENTOS DA INVENÇÃO

N-fosfonometilglicina, comumente referida como glifosato, é um importante químico agrícola. Glifosato inibe a enzima que converte ácido fosfoenolpirúvico (PEP) e ácido 3-fosfochiquímico (S3P) a ácido 5-enolpiruvil-3- fosfochiquímico. A inibição dessa enzima (5- enolpiruvilchiquimato-3-fosfato sintase; aqui referida como "EPSPS") mata células vegetais desligando a via de chiquimato, inibindo, dessa forma a biossíntese de ácido aromático.

Como herbicidas da classe do glifosato inibem a biossíntese de ácido aromático, ele não matam apenas células vegetais, mas são também tóxicos a células bacterianas. Glifosato inibe várias sintases EPSP bacterianas, e, assim, é tóxico a essas bactérias. Contudo, certas sintases EPSP bacterianas possuem uma alta tolerância a glifosato.

Células vegetais resistentes a toxicidade de glifosato podem ser produzidas transformando células vegetais para expressar sintases EPSP bacterianas resistentes a glifosato. Notavelmente, o gene bacteriano de Agrobacterium tumefaciens linhagem CP4 foi usado para conferir resistência a herbicidas em células vegetais após a expressão em plantas. Uma sintase EPSP mutada de Salmonella typhimurium linhagem CT7 confere resistência a glifosato em células bacterianas, e confere resistência a glifosato em células vegetais (U.S. Patent Nos. 4.535.060; 4.769.061; e 5.094.945). Contudo, há uma necessidade por outros genes de resistência a herbicidas.

A atividade cinética de EPSPS pode ser testada medindo a liberação de fosfato. A liberação de fosfato é detectada usando um teste combinado para a detecção fluorescente de fosfato baseado na geração de N-acetil-3,7- dihidroxifenoxacina (Amplex® Red), como é conhecido na arte (Vazquez et al. (2003) Analytical Biochemistry 320: 292- 298) . As condições de teste publicadas podem levar à saturação do teste em experimentos onde o fosfato é liberado muito rapidamente. Métodos adicionais são necessários para a medição de atividade cinética de EPSPS.

SUMÁRIO DA INVENÇÃO Composições e métodos para conferir resistência a herbicidas ou tolerância a bactérias, plantas, células vegetais, tecidos e sementes são providas. Composições incluem moléculas de ácidos nucléicos codificando polipeptideos de resistência ou tolerância a herbicidas, vetores compreendendo aquelas moléculas de ácidos nucléicos, e células hospedeiras compreendendo os vetores. Composições também incluem anticorpos para os polipeptideos de resistência ou tolerância a herbicidas. Como observado, as seqüências de nucleotideos da invenção podem ser usadas em constructos de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo microorganismos e plantas. Composições também compreendem bactérias, plantas, células vegetais, tecidos, e sementes transformadas. Além disso, são providos métodos para produzir os polipeptideos codificados pelos nucleotideos sintéticos da invenção.

Moléculas de ácidos nucléicos isoladas e variantes dessas codificando polipeptideos de resistência ou tolerância a herbicidas são providas. Adicionalmente, seqüências de aminoácidos e variantes dessas codificadas pelos polinucleotideos que conferem resistência ou tolerância a herbicidas são englobadas. A presente invenção provê moléculas de ácidos nucléicos isoladas compreendendo uma seqüência de nucleotideos apresentada em SEQ ID NO: 1, 3, ou 5, uma seqüência de nucleotideos codificando a seqüência de aminoácidos apresentada em SEQ ID N0:2, 4, ou 6, a seqüência de nucleotideos de resistência a herbicidas depositada em um hospedeiro bacteriano com Nos.de Acesso NRRL B-30888 ou NRRL B-30949, assim como variantes e fragmentos dessas. Seqüências de nucleotideos que são complementares a uma seqüência de nucleotideos da invenção, ou que hibridizam a uma seqüência da invenção são também englobadas.

Métodos para medir a atividade cinética enzimática usando substratos fluorogênicos são também providos.

DESCRIÇÃO DAS FIGURAS

A Figura 1 apresenta um alinhamento da seqüência de aminoácidos ORFl GRG23 (SEQ ID 30 NO: 2) e GRG51 (SEQ ID NO: 6) com Bacillus clausii (SEQ ID NO:7), Rubrobacer xylanophilus (SEQ ID N0:8), Escherichia coli (SEQ ID NO: 11), Agrobacterium sp. linhagem CP4 (SEQ IDNOilO) e Zea mays (SEQ ID NO:9).

A Figura 2 apresenta um gráfico de distribuição de atividade de enzima GRG23 (eixo y) em função da concentração de PEP (eixo x) em concentrações de glifosato de 0, 3, 5 e 10 mM.

A Figura 3 apresenta um gráfico de distribuição de Km (app) (eixo y) em função da concentração de glifosato (eixo χ) . A interceptação do eixo X representa a Kj para glifosato. DESCRIÇÃO DETALHADA DA INVENÇÃO

As presentes invenções serão, agora, descritas mais completamente daqui em diante com referência às figuras que as acompanham, nas quais alguns, mas não todos os avanços das invenções são apresentados. De fato, essas invenções podem ser incorporadas de várias formas diferentes e não deveriam ser construídas limitadas aos avanços aqui relatados; ao invés, esses avanços são providos de forma que esta descrição satisfaça requisitos legais aplicáveis. Números relativos referem-se a elementos relativos.

Várias modificações e outros avanços das invenções aqui relatados virão à mente de alguém especialista na arte a qual estas invenções pertencem, tendo o benefício dos ensinamentos apresentados nas descrições precedentes e desenhos associados. Portanto, deve ser entendido que as invenções não são limitadas aos avanços específicos descritos e que se pretende que modificações e outros avanços sejam incluídos no escopo das reivindicações em anexo. Apesar de termos específicos serem aqui empregados, eles são usados em um senso genérico e descritivo e não para propósitos de limitação.

A presente invenção é desenhada para composições e métodos para regular resistência a herbicidas em organismos, particularmente em plantas ou células vegetais. Os métodos envolvem transformar organismos com seqüências de nucleotideos codificando o gene de resistência a glifosato da invenção. As seqüências de nucleotideos da invenção são úteis para preparar plantas que apresentam tolerância aumentada ao herbicida glifosato. Assim, são providas bactérias, plantas, células vegetais, tecidos vegetais e sementes transformadas. Composições incluem ácidos nucléicos e proteínas relacionadas a tolerância a herbicidas em microorganismos e plantas, assim como bactérias, plantas, tecidos vegetais e sementes transformadas. Seqüências de nucleotideos do gene de resistência a glifosato (grg23 e grg51) e as seqüências de aminoácidos das proteínas dessa forma codificadas são descritas. As seqüências são úteis na construção de vetores de expressão para subseqüente transformação em plantas de interesse, como sondas para o isolamento de outros genes de resistência a glifosato, como marcadores de seleção, e similares. Assim, por "gene de resistência a glifosato da invenção" pretende-se a seqüência de nucleotideos apresentada em SEQ ID NO:l ou 3, e variantes e fragmentos dessas (SEQ ID NO:5, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, e 32), que codificam um polipeptídeo de resistência ou tolerância a glifosato. Igualmente, um "polipeptídeo de resistência a glifosato da invenção" é um polipeptídeo tendo a seqüência de aminoácidos apresentada em SEQ ID NO: 2 ou 4, e variantes e fragmentos dessas (SEQ ID NO:6, 15, 17, 19, 21, 23, 25, 27, 29, 31, e 33), que conferem resistência ou tolerância a glifosato para uma célula hospedeira. Plasmídios contendo as seqüências de nucleotideos de resistência a herbicidas da invenção foram depositadas na coleção de culturas permanente da autoridade depositária internacional Agricultural Research Service Culture Collection, Northern Regional Research Laboratory (NRRL) em 18 de novembro de 2005, e designados com o No. de Acesso NRRL B-30888 (grg23), e em 26 de junho de 2006 e designados com o No. de Acesso NRRL B-30949 (grg51) . Esse depósito será mantido sob os termos do Tratado de Budapeste sobre o Tratado Internacional de Reconhecimento do Depósito de Microorganismos para Propósitos de Procedimentos de Patente (Treaty on the International Recognition of the Deposit of Microorganisms for the Purposes of Patent Procedure) . Esse depósito foi feito meramente como uma conveniência para aqueles especialistas na arte e não é uma admissão de que um depósito é necessário sob o 35 U.S.C. §112.

Por "glifosato" pretende-se qualquer forma herbicida da N-fosfonometilglicina (incluindo qualquer sal dessa) e outras formas que resultam na produção do ânion de glifosato em planta. Uma "proteína de resistência a herbicidas" ou uma proteína resultando da expressão de uma "molécula de ácido nucléico codificando resistência a herbicidas" inclui proteínas que conferem a uma célula a habilidade de tolerar uma concentração mais alta de um herbicida do que células que não expressa a proteína, ou tolerar uma certa concentração de um herbicida por um tempo maior do que células que não expressam a proteína. Uma "proteína de resistência a glifosato" inclui uma proteína que confere a uma célula a habilidade de tolerar uma maior concentração de glifosato do que células que não expressam a proteína, ou tolerar certas concentrações de glifosato por um período de tempo maior do que células que não expressam a proteína. Por "tolerar" ou "tolerância" pretende-se tanto sobreviver, ou conduzir funções celulares essenciais, tais como síntese de proteínas e respiração, de maneira que não seja prontamente discernível a partir de células não tratadas.

Moléculas de ácidos nucléicos isoladas, e Variantes e Fragmentos Dessas

Um aspecto da invenção pertence a moléculas de ácidos nucléicos isoladas compreendendo seqüências de nucleotídeos codificando proteínas de resistência a herbicidas e polipeptídeos ou porções biologicamente ativas desses, assim como moléculas de ácidos nucléicos suficientes para uso como sondas de hibridização para identificar ácidos nucléicos codificando resistência a herbicidas. Como aqui usado, o termo "molécula de ácido nucléico" deve incluir moléculas de DNA (e.g., DNAc ou DNA genômico) e moléculas de RNA (e.g., RNAm) e análogos do DNA ou RNA gerado usando análogos de nucleotídeos. A molécula de ácido nucléico pode ser de fita simples ou dupla-fita.

Seqüências de nucleotídeos codificando as proteínas da presente invenção incluem as seqüências apresentadas em SEQ ID NO: 1, 3, e 5 a seqüência de nucleotídeos de resistência a herbicidas depositada em um hospedeiro bacteriano com com os Nos. de Acesso NRRL B-30888 e B-30949, e variantes, fragmentos, e complementos dessas. Por "complemento" pretende-se uma seqüência de nucleotideos que suficientemente complementar a uma dada seqüência de nucleotideos, de forma que esta possa hibridizar à dada seqüência de nucleotideos para, dessa forma, formar um duplex estável. A seqüência de aminoácidos correspondente para a proteína de resistência a herbicidas codificada por essas seqüências de nucleotideos é apresentada em SEQ ID NO:2, 4, ou 6. A invenção também engloba moléculas de ácidos nucléicos compreendendo seqüências de nucleotideos codificando proteínas de resistência a herbicidas de comprimento parcial, e complementos dessas.

Uma molécula de ácido nucléico ou proteína "isolada" ou "purificada", ou porção biologicamente ativa dessa, é substancialmente livre de outro material celular, ou meio de cultura quando produzida por técnicas recombinantes, ou substancialmente livre de precursores químicos ou outros químicos quando quimicamente sintetizada.

Preferencialmente, um ácido nucléico "isolado" é livre de seqüências (preferencialmente seqüências codificando proteínas) que naturalmente flanqueiam o ácido nucléico (i.e., seqüências localizadas nas extremidades 5' e 3' do ácido nucléico) no DNA genômico do organismo do qual o ácido nucléico é derivado. Para propósitos da invenção, "isolado" quando usado para referir-se a moléculas de ácidos nucléicos exclui cromossomos isolados. Por exemplo, em vários avanços, a molécula de ácido nucléico isolada codificando resistência a glifosato pode conter menos do que cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb, ou 0,1 kb da seqüência de nucleotideos que naturalmente flanqueia a molécula de ácido nucléico no DNA genômico da célula da qual o ácido nucléico é derivado. Uma proteína de resistência a herbicidas, que é substancialmente livre de material celular, inclui preparações de proteína tendo menos do que cerca de 30%, 20%, 10%, ou 5% (por peso seco) de proteínas que não de resistência a herbicidas (também referida como "proteína contaminante").

Moléculas de ácidos nucléicos que são fragmentos dessas seqüências de nucleotideos codificadoras de resistência a herbicidas são também englobadas pela presente invenção. Por "fragmento" pretende-se uma porção da seqüência de nucleotideos codificando uma proteína de resistência a herbicidas. Um fragmento de uma seqüência de nucleotideos pode codificar uma porção biologicamente ativa de uma proteína de resistência a herbicidas, ou pode ser um fragmento que pode ser usado como uma sonda de hibridização ou primer de PCR usando métodos descritos abaixo. Moléculas de ácidos nucléicos que são fragmentos de uma seqüência de nucleotideos de resistência a herbicidas compreendem pelo menos cerca de 15, 20, 50, 75, 100, 200, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950 nucleotideos contíguos, ou até o número de nucleotideos presentes em uma seqüência de nucleotideos codificadora de resistência a herbicidas de comprimento total aqui descrita (por exemplo, 1892 nucleotideos para SEQ ID NO: 1, 1259 nucleotideos para SEQ ID NO:3, e 1242 nucleotideos para SEQ ID NO:5). Por nucleotideos "contíguos" pretende-se resíduos de nucleotideos que estão imediatamente adjacentes um ao outro.

Fragmentos das seqüências de nucleotideos da presente invenção geralmente codificarão fragmentos de proteína que retêm a atividade biológica da proteína de resistência a glifosato de comprimento total; i.e., atividade de resistência a herbicidas. Por "retém a atividade de resistência a herbicidas" pretende-se que o fragmento tenha pelo menos cerca de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, ou pelo menos cerca de 80% da atividade de resistência a herbicidas das proteínas de resistência a glifosato de comprimento total aqui descritas como SEQ ID NO: 2, 4, ou 6. Métodos para medir a atividade de resistência a herbicidas são bem conhecidos na arte. Ver, por exemplo, U.S. Patent Nos. 4.535.060, e 5.188.642, cada qual são aqui incorporados por referência em sua integridade.

Um fragmento de uma seqüência de nucleotideos codificadora de resistência a herbicidas que codifica uma porção biologicamente ativa de uma proteína da invenção codificará pelo menos cerca de 15, 25, 30, 50, 75, 100, 125. 150, 175, 200, 250, 300, 350, 400 aminoácidos contíguos, ou até o número total de aminoácidos presente em uma proteína de resistência a herbi.cidas da invenção de comprimento total (por exemplo, 436 aminoácidos para SEQ ID N0:2, 413 aminoácidos para SEQ ID N0:4, e 413 aminoácidos para SEQ ID NO:6).

Proteínas de resistência a herbicidas da presente invenção são codificadas por uma seqüência de nucleotídeos suficientemente idêntica à seqüência de nucleotídeos de SEQ ID NO:l, 3, ou 5. Para o termo "suficientemente idêntica" pretende-se um aminoácido ou seqüência de nucleotídeos que possui pelo menos cerca de 60% ou 65% de identidade de seqüência, cerca de 70% ou 75% de identidade de seqüência, cerca de 80% ou 85% de identidade de seqüência, cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência comparado a uma seqüência referência usando um dos programas de alinhamento aqui descritos usando parâmetros padrão. Alguém especialista na arte reconhecerá que esses valores podem ser apropriadamente ajustados para determinar identidade correspondente de proteínas codificadas por duas seqüências de nucleotídeos levando-se em conta a degeneração de códons, similaridade de aminoácidos, posicionamento de quadro de leitura, e similares.

Para determinar a identidade percentual de duas seqüências de aminoácidos ou de dois ácidos nucléicos, as seqüências são alinhadas para propósitos de comparação ótima. A identidade percentual entre as duas seqüências é uma função do número de posições idênticas compartilhadas pelas seqüências (i.e., identidade percentual = número de posições idênticas/ número total de posições (e.g., posições de sobreposição) χ 100) . Em um avanço, as duas seqüências são do mesmo comprimento. A identidade percentual entre duas seqüências pode ser determinada usando técnicas similares àquelas descritas abaixo, com ou sem espaços permitidos. Para calcular a identidade percentual, são contados, tipicamente, correspondências exatas.

A determinação da identidade percentual entre duas seqüências pode ser conseguida usando um algoritmo matemático. Um exemplo não limitante de um algoritmo matemático utilizado para a comparação de duas seqüências é o algoritmo de Karlin and Altschul (1990) Proc. Natl Acad. Set USA 87:2264-2268, modificado como em Karlin and Altschul (1993) Proc. Natl. Acad. Sei. USA 90:5873-5877. Tal algoritmo é incorporado nos programas BLASTN e BLASTX de Altschul et al. (1990) J Mol. Biol. 215:403-410. Buscas BLAST de nucleotideos podem ser efetuadas com o programa BLASTN, pontuação = 100, comprimento de palavra = 12, para obter seqüências de nucleotideos homólogas a moléculas de ácidos nucléicos tipo GDC da invenção. Buscas BLAST de proteínas podem ser efetuadas com o programa BLASTX, pontuação = 50, comprimento de palavra = 3, para obter seqüências de aminoácidos homólogas a moléculas de proteína de resistência a herbicidas da invenção. Para obter alinhamentos espaçados para propósitos de comparação, Gapped BLAST pode ser utilizado como descrito em Altschul et al. (1997) Nucleic Acids Res. 25:338 9-34 02. Alternativamente, PSI-Blast pode ser usado para efetuar uma busca iterada que detecte relações distantes entre moléculas. Ver Altschul et al. (1997) supra. Quando utilizando os programas BLAST, Gapped BLAST, e PSI-Blast, os parâmetros padrão dos respectivos programas (e.g., BLASTX e BLASTN) podem ser usados. Ver www.ncbi.nlm.nih.gov. Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de seqüências é o algoritmo do ClustalW (Higgins et al. 1994) Nucleic Acids Res. 22:4673-4680). ClustalW compara seqüências e alinha a totalidade da seqüência de aminoácidos ou DNA, e, assim, pode prover dados sobre a conservação de seqüência de toda a seqüência de aminoácidos. 0 algoritmo de ClustalW é usado em diversos comercialmente pacotes de software disponíveis para análise de DNA/aminoácidos, tais como o módulo ALIGNX da suite Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, CA) . Após o alinhamento de seqüências de aminoácidos com ClustalW, a identidade percentual de aminoácidos pode ser avaliada. Um exemplo não limitante de um programa computacional útil para análise de alinhamentos ClustalW é GeneDoc™. GeneDoc™ (Karl Nicholas) permite a avaliação de similaridade e identidade de aminoácidos (ou DNA) entre múltiplas proteínas. Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de seqüências é o algoritmo de Myers and Miller (1988) CABIOS 4:11-17. Tal algoritmo é incorporado no programa ALIGN (versão 2.0), que é parte do pacote de software de alinhamento de seqüências GCG (disponibilizado pela Accelrys, Inc., San Diego, CA). Quando utilizando o programa ALIGN para comparar seqüências de aminoácidos, uma tabela de peso de resíduos PAM 120, uma penalidade por extensão de espaço de 12, e uma penalidade de espaço de 4 podem ser usadas.

A menos que declarado ao contrário, GAP Version 10, que usa o algoritmo de Needleman and Wunsch (1970) J. MoI Biol. 48(3) : 443-453, será usado para determinar a identidade de seqüência ou similaridade usando os seguintes parâmetros: % identidade % similaridade para uma seqüência de nucleotídeos usando GAP Weight de 50 e Length Weight de 3, e a matriz de pontuação nwsgapdna.cmp; % identidade ou % similaridade para uma seqüência de aminoácidos usando GAP weight de 8 e length weight of 2, e o programa de pontuação BLOSUM62. Programas equivalentes podem ser também usados. Por "programa equivalente" pretende-se qualquer programa de comparação de seqüências que, para quaisquer duas seqüências em questão, gere um alinhamento tendo correspondências de resíduos de nucleotídeos idênticas e uma identidade percentual de seqüência idêntica quando comparado ao alinhamento correspondente gerado por GAP Version 10.

A invenção também engloba moléculas de ácidos nucléicos variantes. "Variantes" das seqüências de nucleotídeos codificadoras de resistência a herbicidas incluem aquelas seqüências que codificam a proteína de resistência a herbicidas aqui descrita, mas que diferem de forma conservadora por causa da degeneração do código genético, assim como aquelas que são suficientemente idênticas, como discutido acima (por exemplo, SEQ ID NO: 5, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, e 32 são variantes de SEQ ID NO:l). Variantes alélicos naturalmente ocorrentes podem ser identificados com o uso de técnicas conhecidas de biologia molecular, tais como reação de cadeia de polimerase (PCR) e técnicas de hibridização, como destacado abaixo. Seqüências de nucleotídeos variantes também incluem seqüências de nucleotídeos derivadas sinteticamente que foram geradas, por exemplo, usando mutagênese sítio- direcionada, mas que ainda codificam as proteínas de resistência a herbicidas descritas na presente invenção, como discutido abaixo. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, isto é, elas retêm a atividade biológica desejada da proteína nativa, ou seja, atividade de resistência a herbicidas. Por "retém atividade de resistência a herbicidas" pretende-se que o variante tenha pelo menos cerca de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, ou pelo menos cerca de 80% da atividade de resistência a herbicidas da proteína nativa. Métodos para medir a atividade de resistência a herbicidas são bem conhecidos na arte. Ver, por exemplo, U.S. Patent Nos. 4.535.060, e 5.188.642, cada qual é aqui incorporada por referência em sua integridade. O especialista irá avaliar, ainda, que mudanças podem ser introduzidas por mutação nas seqüências de nucleotideos da invenção, levando, dessa forma, a mudanças na seqüência de aminoácidos das proteínas de resistência a herbicidas codificadas, sem alterar a atividade biológica das proteínas. Assim, moléculas de ácidos nucléicos isoladas variantes podem ser criadas introduzindo-se um ou mais substituições, adições, ou deleções de nucleotideos na seqüência de nucleotideos correspondente aqui descrita, de forma que uma ou mais substituições, adições, ou deleções de aminoácidos sejam introduzidas na proteína codificada. Mutações podem ser introduzidas por técnicas padrão, tais como mutagênese sítio-direcionada e mutagênese mediada por PCR. Tais seqüências de nucleotideos variantes são também englobadas pela presente invenção.

Por exemplo, substituições de aminoácidos conservativas podem ser feitas em um ou mais resíduos de aminoácidos previstos, não essenciais. Um resíduo de aminoácido "não essencial" é um resíduo que pode ser alterado a partir da seqüência de tipo selvagem de uma proteína de resistência a herbicidas sem alterar a atividade biológica, enquanto que um resíduo de aminoácido "essencial" é necessário para a atividade biológica. Uma "substituição de aminoácido conservativa" é uma na qual o resíduo de aminoácido é substituído com um resíduo de aminoácido tendo uma cadeia lateral similar. Famílias de resíduos de aminoácidos tendo cadeias laterais similares foram definidas na arte. Essas famílias incluem aminoácidos com cadeias laterais básicas (e.g., lisina, arginina, histidina), cadeias laterais ácidas (e.g., ácido aspártico, ácido glutâmico), cadeias laterais polares sem carga (e.g., glicina, asparagina, glutamina, serina, treonina, tirosina, cisteina), cadeias laterais apolares (e.g., alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais beta-ramifiçadas (e.g., treonina, valina, isoleucina) e cadeias laterais aromáticas (e.g., tirosina, fenilalanina, triptofano, histidina). Substituições de aminoácidos podem ser feitas em regiões não conservadas que retêm função. Em geral, tais substituições não seriam feitas para resíduos de aminoácidos conservados, ou para resíduos de aminoácidos residindo em um motivo conservado, onde tais resíduos são essenciais para atividade de proteína. Contudo, alguém especialista na arte entenderia que variantes funcionais podem ter pequenas alterações conservadas ou não conservadas nos resíduos conservados.

Lis-22, Arg-124, Asp-313, Arg-344, Arg-386, e Lis-411, são resíduos conservados da EPSP sintase de E. coli (Schonbrunn et al. (2001) Proc. Natl. Acad. Sei. USA 98:1376-1380). Resíduos conservados importantes para atividade de EPSP sintase também incluem Arg-100, Asp-242, e Asp-384 (Selvapandiyan et al. (1995) FEBS Letters 374:253-256). Arg-27 se liga a S3P (Shuttleworth et al. (1999) Biochemistry 38:296- 302). Alternativamente, seqüências de nucleotideos variantes podem ser feitas introduzindo mutações aleatoriamente junto de toda ou parte da seqüência codificadora, tal como pode mutagênese de saturação, e os mutantes resultantes podem ser rastreados para a habilidade de conferir atividade de resistência a herbicidas para identificar mutantes que retêm atividade. Após a mutagênese, a proteína codificada pode ser expressada de forma recombinante, e a atividade da proteína pode ser determinada usando técnicas de teste padrão.

Usando métodos tais como PCR, hibridização, e similares, seqüências de resistência a herbicidas correspondentes podem ser identificadas, tais seqüências tendo identidade substancial às seqüências da invenção. Ver, por exemplo, Sambrook and Russell (2001) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) e Innis, et al. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, St. Louis, MO).

Em um método de hibridização, toda ou parte da seqüência de nucleotideos de resistência a herbicidas pode ser usada para rastrear DNAc ou bibliotecas genômicas.

Métodos para construção de tais bibliotecas de DNAc e genômicas são geralmente conhecidos na arte e são descritos em Sambrook and Russell (2001) supra. As chamadas sondas de hibridização podem ser fragmentos de DNA genômico, fragmentos de DNAc, fragmentos de RNA, ou outros oligonucleotideos, e podem ser rotuladas com um grupo detectável, tal como 32P3 ou qualquer outro marcador detectável, tal como outros radioisótopos, um composto fluorescente, uma enzima, ou um co-fator enzimático. Sondas para hibridização podem ser feitas rotulando oligonucleotideos sintéticos baseado na(s) seqüência(s) de nucleotideos codificadora de resistência a herbicidas conhecida(s) aqui descrita(s). Primers de degeneração projetados com base em nucleotideos ou resíduos de aminoácidos conservados na seqüência de nucleotideos ou seqüência de aminoácidos codificada podem, adicionalmente, ser usados. A sonda tipicamente compreende uma região de seqüência de nucleotideos que hibridiza sob condições rigorosas a pelo menos cerca de 12, pelo menos cerca de 25, pelo menos cerca de 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, ou 1800 nucleotideos consecutivos da(s) seqüência(s) de nucleotideos codificadora(s) de resistência a herbicidas da invenção ou um fragmento ou variante dessas. Métodos para a preparação de sondas para hibridização são geralmente conhecidos na arte e são descritos em Sambrook and Russell (2001) supra, e Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY), ambos são aqui incorporados por referência. Por exemplo, toda uma seqüência resistência a herbicidas aqui descrita, ou uma ou mais porções desta, pode ser usada como uma sonda capaz de hibridizar especificamente a seqüências de resistência a herbicidas correspondentes e RNAs mensageiros. Para alcançar hibridização especifica sob uma variedade de condições, tais sondas incluem seqüências que são únicas e são pelo menos cerca de 10 nucleotideos em comprimento, e pelo menos cerca de 20 nucleotideos em comprimento. Tais sondas podem ser usadas para amplificar seqüências de resistência a herbicidas correspondentes a partir de um organismo escolhido por PCR. Essa técnica pode ser usada para isolar seqüências codificadoras adicionais, a partir de um organismo desejado, ou como um teste diagnóstico para determinar a presença de seqüências codificadoras em um organismo. Técnicas de hibridização incluem rastreamento de hibridização de bibliotecas de DNA em placas (tanto placas como colônias; ver, por exemplo, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).

A hibridização de tais seqüências pode ser conduzida sob condições rigorosas. Por "condições rigorosas" ou "condições de hibridização rigorosas" pretende-se condições sob as quais uma sonda ira hibridizar a sua seqüência alvo a um grau detectavelmente maior do que a outras seqüências (e.g., pelo menos 2 vezes em relação à base). Condições rigorosas são dependentes de seqüência e serão diferentes em diferentes circunstâncias. Controlando-se o rigor das condições de hibridização e/ou lavagem, seqüências alvo que são 100% complementares à sonda podem ser identificadas (sondagem homóloga). Alternativamente, condições de rigor podem ser ajustadas para permitir alguma falta de correspondência em seqüências, de forma que menores graus de similaridade sejam detectados (sondagem heteróloga). Geralmente, uma sonda é menor do que cerca de 1000 nucleotideos em comprimento, ou menor do que cerca de 500 nucleotideos em comprimento.

Tipicamente, condições rigorosas serão aquelas nas quais a concentração de sais é menor do que cerca de 1,5 M de ion Na, tipicamente cerca de 0,01 a 1,0 M de concentração de ion Na (ou outros sais) em pH 7,0 a 8,3 e a temperatura é de pelo menos cerca de 30°C para sondas curtas (e.g.,10 a 50 nucleotideos) e pelo menos cerca de 60°C para sondas longas (e.g., maiores do que 50 nucleotideos). Condições rigorosas podem ser também alcançadas com a adição de agentes desestabilizantes, tais como formamida. Condições exemplares de baixo rigor incluem hibridização com uma solução tampão de 30 a 35% formamida, NaCl a 1 M, 1% de SDS (sódio dodecil sulfato) a 37°C, e uma lavagem em IX a 2X SSC (20X SSC = 3,0 M NaCl/0,3 M trissódio citrato) a 50 a 55°C. Condições exemplares de rigor moderado incluem hibridização em 40 a 45% formamida, 1,0 M NaCl, 1% SDS a 37°C, e uma lavagem em 0,5X a IX SSC a 55 a 60°C. Condições exemplares de alto rigor incluem hibridização em 50% formamida, NaCl a 1 M, 1% SDS a 37°C, e uma lavagem em 0,1X SSC a 60 a 65°C. Opcionalmente, tampões de lavagem podem compreender cerca de 0,1% a cerca de 1% de SDS. A duração de hibridização é geralmente menor do que cerca de 24 horas, usualmente cerca de 4 a cerca de 12 horas. A especificidade é tipicamente a função de lavagens pós-hibridização, os fatores críticos sendo a força iônica e a temperatura da solução de lavagem final. Para híbridos DNA-DNA, a Tm pode ser aproximada a partir da equação de Meinkoth and Wahl (1984) Anal. Biochem. 138:267-284: Tm = 81,50C + 16,6 (log M) + 0,41 (%GC) - 0,61 (% form) - 500/L; onde M é a molaridade de cátions monovalentes, %GC é a porcentagem de nucleotídeos de guanosina e citosina no DNA, % form é a porcentagem de formamida na solução de hibridização, e L é o comprimento do híbrido em pares de base. Tm é a temperatura (sob força iônica e pH definidos) na qual 50% de uma seqüência alvo complementar hibridiza a uma sonda perfeitamente correspondente. A Tm é reduzida em cerca de 1°C para cada 1% de falta de correspondência; assim, Tm, condições de hibridização, e/ou lavagem podem ser ajustadas para hibridizar a seqüências da identidade desejada. Por exemplo, se seqüências com >90% de identidade são procuradas, a Tm, pode ser diminuída em 10°C. Geralmente, condições rigorosas são selecionadas para serem cerca de 5°C menores do que o ponto térmico de derretimento (Tm) para a seqüência específica e seu complemento em uma definida força iônica e pH. Contudo, condições severamente rigorosas podem utilizar uma hibridização e/ou lavagem a 1, 2, 3, ou 4 °C menor do que o ponto térmico de derretimento (Tm); condições moderadamente rigorosas podem utilizar uma hibridização e/ou lavagem a 6, 7, 8, 9, ou 10°C menor do que o ponto térmico de derretimento (Tm) ; condições de baixo rigor podem utilizar uma hibridização e/ou lavagem a 11 , 12, 13, 14, 15, ou 20°C menor do que o ponto térmico de derretimento (Tm) . Usando a equação, composições de hibridização e lavagem, e Tm desejada, aqueles de conhecimento ordinário entenderão que variações no rigor de soluções de hibridização e/ou lavagem são inerentemente descritas. Se o grau desejado de falta de correspondência resulta em uma Tm de menos de 45°C (solução aquosa) ou 32°C (solução de formamida), é preferível aumentar a concentração de SSC de forma que uma maior temperatura possa ser usada. Um guia extenso para a hibridização de ácidos nucléicos é encontrado em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology Hybridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier, New York); e Ausubel et al, eds. (1995) Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, New York). Ver Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).

Proteínas isoladas e Variantes e Fragmentos Dessas

Proteínas de resistência a herbicidas são também englobadas na presente invenção. Por "proteína de resistência a herbicidas" ou " proteína de tolerância a herbicidas" pretende-se uma proteína tendo a seqüência de aminoácidos apresentada em SEQ ID NO: 2, 4, ou 6. Fragmentos, porções biologicamente ativas, e variantes dessas são também providos, e podem ser usados para praticar os métodos da presente invenção. "Fragmentos" ou "porções biologicamente ativas" incluem fragmentos de polipeptideos compreendendo uma porção de uma seqüência de aminoácidos codificando uma proteina de resistência a herbicidas como apresentado em SEQ ID NO: 2, 4, ou 6 e que retém atividade de resistência a herbicidas. Uma porção biologicamente ativa de uma proteina de resistência a herbicidas pode ser um polipeptideo que é, por exemplo, de 10, 25, 50, 100 ou mais aminoácidos em comprimento. Tais porções biologicamente ativas podem ser preparadas por técnicas recombinantes e avaliadas para atividade de resistência a herbicidas. Métodos para medir a atividade de resistência a herbicidas são bem conhecidos na arte. Ver, por exemplo, U.S. Patent Nos. 4.535.060, e 5.188.642, cada qual é aqui incorporada por referência em sua integridade. Como usado aqui, um fragmento compreende pelo menos 8 aminoácidos contíguos de SEQ ID NO: 2, 4, ou 6. A invenção engloba outros fragmentos, contudo, tais como qualquer fragmento na proteína maior do que cerca de 10, 20, 30, 50, 100, 150, 200, 250, 300, 350, ou 400 aminoácidos.

Por "variantes" pretende-se proteínas ou polipeptideos tendo uma seqüência de aminoácidos que é pelo menos cerca de 60%, 65%, pelo menos cerca de 70%, 75%, pelo menos cerca de 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% idêntica à seqüência de aminoácidos de SEQ ID NO: 2, 4, ou 6 (por exemplo, SEQ ID NO:6, 15, 17, 19, 21, 23, 25, 27, 29, 31, e 33 são variantes de SEQ ID NO:2). Variantes também incluem polipeptídeos codificados por uma molécula de ácido nucléico que hibridiza à molécula de ácido nucléico de SEQ ID N0:1, 3, ou 5, ou um complemento dessas, sob condições rigorosas. Variantes incluem polipeptídeos que diferem em seqüência de aminoácidos devido à mutagênese. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, ou seja, elas continuam a possuir a atividade biológica desejada da proteína nativa, isto é, retendo a atividade de resistência a herbicidas. Métodos para medir a atividade de resistência a herbicidas são bem conhecidos na arte. Ver, por exemplo, U.S. Patent Nos. 4.535.060, e 5.188.642, cada qual é aqui incorporada por referência em sua integridade.

Genes bacterianos, tais como os genes grg23 ou grg51 desta invenção, muito freqüentemente possuem múltiplos códons de iniciação de metionina na proximidade do início do quadro de abertura de leitura. Freqüentemente, a iniciação da tradução em um ou mais desses códons de início levará à geração de uma proteína funcional. Esses códons de início podem incluir códons ATG. Contudo, bactérias, tais como Bacillus sp. também reconhecem o códon GTG como um códon de início, e proteínas que iniciam a tradução nos códons GTG contêm uma metionina no primeiro aminoácido. Adicionalmente, não é freqüentemente determinado a priori quais desses códons são usados naturalmente na bactéria. Assim, é entendido que o uso de um dos códons alternados de metionina pode levar à geração de variantes de grg23 ou grg51 que conferem resistência a herbicidas. Essas proteínas de resistência a herbicidas são englobadas na presente invenção e podem ser usadas nos métodos da presente invenção.

Anticorpos para os polipeptídeos da presente invenção, ou para variantes ou fragmentos desses, são também englobados. Métodos para produzir anticorpos são bem conhecidos na arte (ver, por exemplo, Harlow and Lane (1988) Antibodies: A Laboratory Manual (Cold Spring Harbor Laboratory, Cold Spring Harbor, NY); U.S. Patent No. 4 .196.265) .

Variantes Alterados ou Melhorados

É reconhecido que a seqüência de DNA de grg23 ou grg51 pode ser alterada por vários métodos, e que essas alterações podem resultar em seqüências de DNA codificando proteínas com seqüências de aminoácidos diferentes daquelas codificadas por grg23 ou grg51. Esta proteína pode ser alterada de vários jeitos, incluindo substituições de aminoácidos, deleções, truncações, e inserções. Métodos para tais manipulações são geralmente conhecidos na arte. Por exemplo, variantes da seqüência de aminoácidos da proteína GRG23 ou GRG51 podem ser preparados por mutações no DNA. Isso pode ser também conseguido por um de diversas formas de mutagênese e/ou por evolução direcionada. Em alguns aspectos, as mudanças codificadas na seqüência de aminoácidos não afetarão substancialmente a função da proteína. Tais variantes possuirão a desejada atividade de resistência a herbicidas. Contudo, é entendido que a habilidade de GRG23 ou GRG51 conferir resistência a herbicidas pode ser melhorada pelo uso de tais técnicas nas composições da presente invenção. Por exemplo, GRG23 ou GRG51 podem ser expressados em células hospedeiras que exibem altas taxas de falta de incorporação de base durante a replicação de DNA, tais como XL-I Red (Stratagene, La Jolla, CA) . Após a propagação em tais linhagens, DNA de grg23 ou grg51 pode ser isolado (por exemplo, preparando-se DNA de plasmidio, ou amplificando por PCR e clonando o fragmento de PCR resultante em um vetor) e cultivado em linhagens não mutagênicas. Clones contendo mutações em grg23 ou grg51 podem ser identificados medindo-se a resistência melhorada a um herbicida, tal como glifosato, por exemplo, cultivando células em concentrações aumentadas de glifosato e testando para clones que conferem tolerância a concentrações aumentadas glifosato. Alternativamente, alterações podem ser feitas à seqüência de proteínas de várias proteínas no terminal amino ou carboxi, sem afetar substancialmente a atividade. Essas alterações podem incluir inserções, deleções, ou alterações introduzidas por métodos moleculares modernos, tais como PCR, incluindo amplificações por PCR que alteram ou estendem a seqüência codificadora de . proteína em virtude da inclusão de seqüências codificadoras de aminoácidos nos oligonucleotídeos utilizados na amplificação por PCR. Alternativamente, as seqüências de proteínas adicionadas podem incluir seqüências codificadoras de proteínas inteiras, tais como aquelas usadas comumente na arte para gerar fusões de proteínas. Tais fusões de proteínas são freqüentemente usadas para (1) aumentar a expressão de uma proteína de interesse; (2) introduzir um domínio de ligação, atividade enzimática, ou epitopo para facilitar tanto purificação de proteína, detecção de proteína, ou outros usos experimentais conhecidos na arte; ou, (3) secreção alvo ou tradução de uma proteína a uma organela sub-celular, tal como o espaço periplásmico de bactérias gram-negativas, ou o retículo endoplasmático de células eucariontes, o último dos quais freqüentemente resulta em glicosilação da proteína.

Seqüências de nucleotídeos e de aminoácidos variantes da presente invenção também englobam seqüências derivadas de procedimentos mutagênicos e recombinogênicos, tais como embaralhamento de DNA. Com tal procedimento, uma ou mais diferentes regiões codificadoras de proteínas de resistência a herbicidas podem ser usadas para criar uma nova proteína de resistência a herbicidas possuindo as propriedades desejadas. Dessa maneira, bibliotecas de polinucleotídeos recombinantes são geradas a partir de uma população de polinucleotídeos de seqüência relacionados compreendendo regiões que possuem identidade de seqüência substancial e podem ser homologamente recombinados in vitro ou in vivo. Por exemplo, usando essa abordagem, motivos de seqüência codificando um domínio de interesse podem ser embaralhados entre o gene de resistência a herbicidas da invenção e outros genes de resistência a herbicidas conhecidos para se obter um novo gene codificando uma proteína com uma propriedade de interesse melhorada, tal como uma atividade aumentada de resistência a glifosato. Estratégias para tal embaralhamento de DNA são conhecidas na arte. Ver, por exemplo, Stemmer (1994) Proc. Natl. Acad.

Sei. USA 91 :10747-10751; Stemmer (1994) Nature 370:389- 391; Crameri et al. (1997) Nature Biotech. 15:436-438; Moore et al (1997) J MoI. Biol. 272:336-347; Zhang et al. (1997) Proc. Natl. Acad. Sei. USA 94:4504-4509; Crameri et al. (1998) Nature 391 :288-291; e U.S. Patent Nos. 5.605.793 e 5.837.458.

Transformação de Células Bacterianas ou Vegetais

São aqui providos novos genes isolados que conferem resistência a um herbicida. Também providos estão seqüências de aminoácidos das proteínas GRG23 e GRG51. A proteína resultante da tradução desse gene permite às células funcionar na presença de concentrações de um herbicida que é, de outra forma, tóxico a células incluindo células vegetais e células bacterianas.

Em um aspecto da invenção, o gene grg23 ou grg51 é útil como um marcador para avaliar a transformação de células bacterianas ou vegetais. Manipulando grg23 ou grg51 a ser (1) expressado de um promotor bacteriano conhecido por estimular a transcrição no organismo a ser testado, (2) corretamente traduzido para gerar um peptídeo GRG23 ou GRG51 intacto, e (3) colocar as células em uma concentração, ao contrário, tóxica de herbicida, células que foram transformadas com DNA em virtude de sua resistência a herbicida podem ser identificadas. Por "promotor" pretende-se uma seqüência de ácidos nucléicos que funcione para direcionar a transcrição de uma seqüência codificadora abaixo. O promotor, junto com outras seqüências de ácidos nucléicos reguladoras de transcrição e tradução, (também chamadas "seqüências controle") é necessário para a expressão de uma seqüência de DNA de interesse.

A transformação de células bacterianas é conseguida por uma de diversas técnicas conhecidas na arte, incluindo, mas não limitando-se a, eletroporação ou transformação química (Ver, por exemplo, Ausubel (ed.) (1994) Current Protocols in Molecular Biology (John Wiley and Sons, Inc., Indianapolis, IN)) . Marcadores conferindo resistência a substâncias tóxicas são úteis para identificar células transformadas (tendo incorporado e expressado o DNA de teste) a partir de células não transformadas (aquelas não contendo ou não expressando o DNA de teste). Em um aspecto da invenção, o gene grg23 ou grg51 é útil como um marcador para avaliar a transformação de células bacterianas ou vegetais.

A transformação de células vegetais pode ser conseguida de modo similar. Por "vegetal" pretende-se plantas inteiras, órgãos vegetais (e.g., folhas, caules, raízes, etc.), sementes, células vegetais, propágulos, embriões e progênie das mesmas. Células vegetais podem ser diferenciadas ou não diferenciadas (e.g. calo, células de cultura em suspensão, protoplastos, células foliares, células radiculares, células do floema, pólen). "Plantas transgênicas" ou "plantas transformadas" ou plantas "estavelmente transformadas", células ou tecidos referem-se a plantas que incorporaram ou integraram seqüências de ácidos nucléicos exógenas ou fragmentos de DNA na célula vegetal. Por "transformação estável" pretende-se que o constructo de nucleotideos introduzido em uma planta se integre no genoma da planta e seja capaz de ser herdado pela progênie dessa.

O gene grg23 ou grg51 da invenção pode ser modificado para obter ou aumentar a expressão em células vegetais. As seqüências de resistência a herbicidas da invenção podem ser providas em cassetes de expressão para expressão na planta de interesse. "Cassete de expressão vegetal" inclui constructos de DNA que são capazes de resultar na expressão de uma proteína a partir de um quadro de iniciação de leitura em uma célula vegetal. O cassete incluirá na direção de transcrição 5'-3', uma região de iniciação transcricional (i.e., promotor) operacionalmente ligada a uma seqüência de DNA da invenção, e uma região de terminação de tradução e transcrição (i.e., região de terminação) funcional em plantas. O cassete pode conter, adicionalmente, pelo menos um gene adicional a ser co- transformado no organismo, tal como um gene marcador de seleção. Alternativamente, o(s) gene(s) adicional(is) pode ser provido em múltiplos cassetes de expressão. Tal cassete de expressão é provido com uma pluralidade de sítios de restrição para inserção da seqüência de resistência a herbicidas a estar sob regulação transcricional das regiões reguladoras.

0 promotor pode ser nativo ou análogo, ou estrangeiro ou heterólogo, à planta hospedeira e/ou à seqüência de DNA da invenção. Adicionalmente, o promotor pode ser a seqüência natural ou, alternativamente, a seqüência sintética. Onde o promotor é "nativo" ou "homólogo" à planta hospedeira, o promotor deve ser encontrado na planta nativa na qual o promotor é introduzido. Onde o promotor é "estrangeiro" ou "heterólogo" à seqüência de DNA da invenção, o promotor não deve ser um promotor nativo ou naturalmente ocorrente para a seqüência de DNA operacionalmente ligada da invenção. "Heterólogo" geralmente refere-se às seqüências de ácidos nucléicos que não são endógenas à célula ou parte do genoma nativo na qual estão presentes, e foram adicionadas à célula por infecção, transfecção, micro-injeção, eletroporação, microprojeção, ou similares. Por "operacionalmente ligado" pretende-se uma ligação funcional entre um promotor e uma segunda seqüência, caracterizado pelo fato de que a seqüência promotora inicia e media a transcrição da seqüência de DNA correspondente à segunda seqüência. Geralmente, operacionalmente ligado significa que as seqüências de ácidos nucléicos sendo ligadas são contíguas e, onde necessário para juntar duas regiões codificadoras de proteína, contíguas no mesmo quadro de leitura. Freqüentemente, tais constructos também conterão regiões 5' e 3' não traduzidas. Tais constructos podem conter uma "seqüência sinal" ou "seqüência líder" para facilitar o transporte de co-tradução ou pós-tradução do peptídeo de interesse para certas estruturas intracelulares, tais como o cloroplasto (ou outro plastídio), retículo endoplasmático, ou aparelho de Golgi, ou para ser secretado. Por exemplo, o gene pode ser construído para conter um peptídeo sinal para a transferência do peptídeo para o retículo endoplasmático. Por "seqüência sinal" pretende-se uma seqüência que é conhecida ou suspeita de resultar em transporte de co- tradução ou pós-tradução de peptídeo através da membrana celular. Em eucariotos, esse transporte envolve, tipicamente, secreção no aparelho de Golgi, com alguma glicosilação resultante. Por "seqüência líder" pretende-se qualquer seqüência que, quando traduzida, resulte em uma seqüência de aminoácidos suficiente para disparar o transporte de co-tradução da cadeia peptídica para uma organela sub-celular. Assim, isso inclui seqüências líder direcionando o transporte e/ou glicosilação por passagem no retículo endoplasmático, passagem para vacúolos, plastídios, incluindo cloroplastos, mitocôndria, e similares. O cassete de expressão vegetal pode ser também construído para conter um íntron, de forma que o processamento de RNAm do íntron seja necessário para a expressão. Por "região 3' não traduzida" pretende-se uma seqüência de nucleotideos localizada abaixo de uma seqüência codificadora. São regiões 3' não traduzidas seqüências de sinais de poliadenilação e outras seqüências codificando sinais reguladores capazes de afetar a adição de traços de ácido poliadenilico à extremidade 3' do RNAm precursor. Por "região 5' não traduzida" pretende-se uma seqüência de nucleotideos localizada acima de uma seqüência codificadora.

Outros elementos acima e abaixo não traduzidos incluem intensificadores. Intensificadores são seqüências de nucleotideos que atuam para aumentar a expressão de uma região promotora. Intensificadores são bem conhecidos na arte e incluem, mas não são limitados a, a região intensificadora SV40 e o elemento intensificador 35S.

A região de terminação pode ser nativa em relação à região de iniciação transcricional, pode ser nativa em relação à seqüência de resistência a herbicidas da presente invenção, ou pode ser derivada de outra fonte. Regiões de terminação convenientes estão disponíveis do plasmídio Ti de A. tumefaciens, tais como regiões de terminação de octopina sintase e nopalina sintase. Ver, também Guerineau et al. (1991) Mo/. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al (1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell 2:1261-1272; Munroe et al. (1990) Gene 91:151-158; Bailas et al. (1989) Nucleic Aeids Res. 17:7891-7903; e Joshi et al. (1987) Nucleie Aeid Res. 25 15:9627-9639.

Onde apropriado, o(s)· gene(s) pode ser otimizado para expressão aumentada na célula hospedeira transformada. Isto é, os genes podem ser sintetizados usando códons preferenciais de célula hospedeira para expressão melhorada, ou podem ser sintetizados usando códons a uma freqüência de códons preferida de hospedeiro. Geralmente, o conteúdo GC do gene será aumentado. Ver, por exemplo, Campbell and Gowri (1990) Plant Physiol. 92:1-11 para uma discussão do uso de códons preferidos de hospedeiro. Métodos para sintetizar genes preferidos de hospedeiro são conhecidos na arte. Ver, por exemplo, U.S. Patent Nos. 6.320.100; 6.075.185; 5.380.831; e 5.436.391, U.S. Published Application Nos. 20040005600 e 20010003849, e Murray et al. (1989) Nucleic Acids Res. 17:477-498, aqui incorporados por referência. Em um avanço, os ácidos nucléicos de interesse são direcionados para o cloroplasto para expressão. Dessa maneira, onde o ácido nucléico de interesse não é diretamente inserido no cloroplasto, o cassete de expressão conterá, adicionalmente, um ácido nucléico codificando um peptideo de trânsito para direcionar o produto gênico de interesse para os cloroplastos. Tais peptideos de trânsito são conhecidos na arte. Ver, por exemplo, Von Heijne et al. (1991) Plant MoI. Biol. Rep. 9:104-126; Clark et al. (1989) J. Biol. Chem. 264:17544-17550; Della-Cioppa et al. (1987) Plant Physiol. 84:965-968; Romer et al. (1993) Biochem. Biophys. Res. Commun. 196:1414-1421; e Shah et al. (1986) Science 233:478-481.

Os ácidos nucléicos de interesse a serem direcionados para o cloroplasto podem ser otimizados para expressão no cloroplasto para contabilizar diferenças no uso de códon entre o núcleo da planta e essa organela. Dessa maneira, os ácidos nucléicos de interesse podem ser sintetizados usando códons preferenciais de cloroplasto. Ver, por exemplo, U.S. Patent No. 5.380.831, aqui incorporada por referência.

Tipicamente esse "cassete de expressão vegetal" será inserido em um "vetor de transformação vegetal." Por "vetor de transformação" pretende-se uma molécula de DNA que é necessária para transformação eficiente de uma célula. Tal molécula pode consistir de um ou mais cassetes de expressão, e pode ser organizada em mais de uma molécula de DNA "vetor". Por exemplo, vetores binários são vetores de transformação vegetal que utilizam dois DNA vetores não contíguos para codificar todas funções requisito eis e trans para transformação de células vegetais (Hellens and Mullineaux (2000) Trends in Plant Science 5:446-451). "Vetor" refere-se a um constructo de ácido nucléico projetado para se transferir entre células hospedeiras diferentes. "Vetor de expressão" refere-se a um vetor que possui a habilidade de incorporar, integrar e expressar seqüências de DNA heterólogas ou fragmentos em uma célula estrangeira. Esse vetor de transformação vegetal pode ser compreendido de um ou mais DNA vetores necessários para alcançar a transformação vegetal. Por exemplo, é uma comum na arte to utilizar vetores de transformação vegetais que são compreendidos de um ou mais segmentos de DNA contíguos. Esses vetores são freqüentemente referidos na arte como "vetores binários." Vetores binários, assim como vetores com plasmídios ajudantes, são mais freqüentemente usados para transformação mediada por Agrobacterium, onde é bem grande o tamanho e a complexidade de segmentos de DNA necessários para alcançar transformação eficiente, e é vantajoso separar funções em moléculas de DNA separadas. Vetores binários contém tipicamente um vetor de plasmídio que contém as seqüências eis necessária para transferência de T-DNA (tais como fronteira esquerda e fronteira direita), um marcador selecionável que é construído para ser capaz de expressão em uma célula vegetal, e um gene de interesse (um gene construído para ser capaz de expressão em uma célula vegetal para a qual a geração de plantas transgênicas é. desejada). Também presentes nesse vetor de plasmídio estão seqüências necessárias para replicação bacteriana. As seqüências eis são arranjadas de modo a permitir transferência eficiente em células vegetais e expressão nestas. Por exemplo, o gene marcador de seleção e o gene de interesse estão localizados entre as fronteiras esquerda e direita. Freqüentemente um segundo vetor de plasmídio contém os fatores trans que mediam a transferência de T-DNA de Agrobacterium para células vegetais. Esse plasmídio freqüentemente contém as funções de virulência (genes Vir) que permitir a infecção de células vegetais por Agrobacterium, e transferência de DNA por clivagem nas seqüências de fronteira e transferência de DNA mediada por vir, como entendido na arte (Hellens and Mullineaux (2000) Trends in Plant Science, 5:446- 451). Diversos tipos de linhagens de Agrobacterium (e.g. LBA4404, GV3101, EHAlOl, EHA 105, etc.) podem ser usados para transformação vegetal. O segundo vetor de plasmidio não é necessário para transformar as plantas pode outros métodos, tais como microprojeção, micro-injeção, eletroporação, polietileno glicol, etc.

Transformação Vegetal

Métodos da invenção envolvem introduzir um constructo de nucleotideos em uma planta. Por "introduzir" pretende-se apresentar à planta o constructo de nucleotideos de modo que o constructo ganhe acesso ao interior de uma célula da planta. Os métodos da invenção não necessitam que seja usado um método em particular para introduzir um constructo de nucleotideos em uma planta, apenas que o constructo de nucleotideos ganhe acesso ao interior de pelo menos uma célula da planta. Métodos para introduzir constructos de nucleotideos em plantas são conhecidos na arte incluindo, mas não se limitando a, métodos de transformação estável, métodos de transformação transiente, e métodos mediados por virus. Em geral, métodos de transformação vegetal envolvem transferir DNA heterólogo em células vegetais alvo (e.g. embriões maduros ou imaturos, culturas em suspensão, calos não diferenciados, protoplastos, etc.), seguido pela aplicação de um nivel limite máximo de seleção apropriada (dependendo do gene marcador de seleção e, neste caso, "glifosato") para recuperar as células vegetais transformadas a partir de um grupo de massa de células não transformadas. Explantes são tipicamente transferidos para um suprimento fresco do mesmo meio e cultivados rotineiramente. Subseqüentemente, as células transformadas são diferenciadas em brotos após a colocação em meio de regeneração suplementado com um nivel limite máximo de agente de seleção (e.g. "glifosato"). Os brotos são, então, transferidos para um meio seletivo enraizador para recuperar o broto com raiz ou plântula. As plântulas transgênicas, então crescidas em plantas maduras, produzem sementes férteis (e.g. Hiei et al. (1994) The Plant Journal 6:271- 282; Ishida et al. (1996) Nature Biotechnology 14:745-750). Explantes são tipicamente transferidos para um suprimento fresco do mesmo meio e cultivados rotineiramente. Uma descrição geral das técnicas e métodos para gerar plantas transgênicas é encontrada em Ayres and Park (1994) Criticai Reviews in Plant Science 13:219-239 e Bommineni and Jauhar (1997) Maydica 42:107-120. Como o material transformado contém várias células; ambas células transformadas e não transformadas estão presentes em qualquer pedaço do calo alvo ou tecido ou grupo de células em questão. A habilidade de matar células não transformadas e permitir que células transformadas se proliferem resulta em culturas vegetais transformadas. Freqüentemente, a habilidade de remover células não transformadas é uma limitação para rápida recuperação de células vegetais transformadas e geração bem-sucedida de plantas transgênicas. Métodos moleculares e bioquímicos podem ser usados para confirmar a presença do gene heterólogo integrado de interesse no genoma da planta transgênica.

A geração de plantas transgênicas pode ser realizada por um dos diversos métodos, incluindo, mas não se limitando a, introdução de DNA heterólogo por Agrobacterium em células vegetais (transformação mediada por Agrobacterium), bombardeamento de células vegetais com DNA estrangeiro heterólogo aderido a partículas, e vários outros métodos sem uso de partículas ou diretamente mediados (e.g. Hiei et al. (1994) The Plant Journal 6:271- 282; Ishida et al. (1996) Nature Biotechnology 14:745-750; Ayres and Park (1994) Criticai Reviews in Plant Science 13:219-239; Bommineni and Jauhar (1997) Maydica 42:107-120) para transferir DNA.

Métodos para transformação de cloroplastos são conhecidos na arte. Ver, por exemplo, Svab et al. (1990) Proc. Natl. Acad. Sei. USA 87:8526-8530; Svab and Maliga (1993) Proc. Natl. Acad. Sei. USA 90:913-917; Svab and Maliga (1993) EMBO J. 12:601-606. 0 método confia na distribuição de DNA contendo um marcador selecionável por pistola de partículas e direcionamento do DNA para o genoma do plastídio através de recombinação homóloga. Adicionalmente, transformação de plastidio pode ser conseguida por ativação de um transgene transmitido por plastidio silencioso por expressão preferencial de tecido de uma RNA polimerase nuclearmente codificada e direcionada por plastidio. Tal sistema foi relatado em McBride et al. (1994) Proc. Natl. Acad. Sci. USA 91 :7301-7305.

As células que foram transformadas podem ser cultivadas em plantas em concordância com meios convencionais. Ver, por exemplo, McCormick et al. (1986) Plant Cell Reports 5:81-84. Essas plantas podem ser, então, crescidas, e tanto polinizadas com a mesma linhagem transformada ou diferentes linhagens, e o híbrido resultante tendo expressão constitutiva da característica fenotípica desejada identificada. Duas ou mais gerações podem ser cultivadas para garantir que a expressão da característica fenotípica desejada seja estavelmente mantida e herdada e, então, as sementes colhidas para assegurar que a expressão da característica fenotípica desejada foi alcançada. Dessa maneira, a presente invenção provê sementes transformadas (também referidas como "sementes transgênicas") tendo um constructo de nucleotídeos da invenção, por exemplo, um cassete de expressão da invenção, estavelmente incorporado em seu genoma.

Medição de atividade de EPSPS Em um avanço da presente invenção, a enzima EPSPS resistente a glifosato possui uma Km para fosfoenolpiruvato (PEP) entre cerca de 1 e cerca de 150uM, incluindo cerca de 2 uM, cerca de 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130 ou cerca de 140 uM, e uma Ki (glifosato)/ Krri (PEP) entre cerca de 500 e cerca de 1000, cerca de 550, cerca de 600, 650, 700, 750, 800, 850, 900, 950, ou até cerca de 1000. Como aqui usado, Km and Ki são medidas sob condições nas quais a enzima obedece a cinética de Michaelis-Menten, em torno de pH 7. Uma técnica de medição não limitante usa a enzima na forma purificada em cloreto de potássio e tampão HEPES em pH 7 em temperatura ambiente e usa concentrações de glifosato de 0 a IOmM.

A atividade cinética de EPSPS pode ser testada, por exemplo, medindo-se a liberação de fosfato que resulta durante a catálise de um substrato de EPSPS (por exemplo, PEP e S3P) para seu subseqüente produto de reação (por exemplo, ácido 5-enolpiruvil-3-fosfochiquimico) usando um teste fluorescente descrito por Vazquez et al. (2003) Anal. Biochem. 320 (2) :292-298. Esse teste é baseado na oxidação do composto não fluorescente N-acetil-3,7- dihidroxifenoxacina (Amplex® Red, Invitrogen, Carlsbad, CA) para o composto fluorescente resorufina por peróxido de hidrogênio (Zhou and Panchuk-Voloshina (1997) Anal. Biochem. 253:169-174). A reação confia na utilização de fosfato por purina nucleosideo fosforilase (PNP), xantina oxidase (XOD), e peroxidase de raiz forte (HRP). A liberação de fosfato está ligada ao nivel de fluorescência que resulta da conversão de Amplex® Red para resorufina. A fluorescência pode ser medida, por exemplo, usando um filtro fluorômetro, leitor de placa, espectrofluorômetro, espectrofotômetro, ou similares, usando métodos bem conhecidos na arte. A fluorescência gerada pela reação pode ser detectada usando um fluorômetro para excitação na faixa de cerca de 530 a cerca de 560 nm e uma emissão de cerca de 590 nm. A absorbância pode ser detectada (por exemplo, usando um espectrofotômetro ou leitor de placa) a cerca de 565 nm.

Em um avanço, a presente invenção engloba uma alteração das condições de este previamente relatadas para estender a faixa dinâmica do teste para acomodar uma amplitude mais ampla de concentrações de substrato. A alteração compreende uma concentração de XOD de pelo menos 1 U/ml, cerca de 1 a cerca de 1,25 U/ml, cerca de 1,25 a cerca de 1,5 U/ml, cerca de 1,5 a cerca de 2 U/ml, ou maior do que 2 U/ml; uma concentração de PNP maior do que 0,1 U/ml, cerca de 0,1 a cerca de 0,5 U/ml, cerca de 0,5 a cerca de 1 U/ml, cerca de 1 a cerca de 1,5 U/ml, cerca de 1,5 a cerca de 2 U/ml, ou maior do que 2 U/ml; e uma concentração de Amplex® Red maior do que 100 μΜ, cerca de 100 a cerca de 200 μΜ, cerca de 200 a cerca de 300 μΜ, cerca de 300 a cerca de 400 μΜ, cerca de 400 a cerca de 500 μΜ, cerca de 500 a cerca de 600 μΜ, cerca de 700 a cerca de 800 μΜ, cerca de 800 a cerca de 900 μΜ, cerca de 900 a cerca de 1000 μΜ, ou maior do que cerca de 1000 μΜ. Essa modificação pode ser aplicada para testes medindo a atividade cinética de qualquer enzima na qual fosfato é liberado durante uma reação catalisada pela enzima.

Plantas

A presente invenção pode ser usada para transformação de qualquer espécie de planta, incluindo, mas não limitado a, monocotiledôneas e dicotiledôneas. Exemplos de plantas de interesse incluem, mas não são limitados a, milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açucar, tabaco, cevada, couve e Brassica sp. , alfafa, centeio, milhete, cártamo, amendoim, batata-doce, mandioca, café, coco, abacaxi, árvores citrica, cacau, chá, banana, abacate, figo, goiaba, manga, oliveira, mamão-papaia, caju, macadâmia, amêndoa, aveia, verduras, ornamentais, e coniferas.

Verduras incluem, mas não são limitados a, tomates, alface, feijões verdes, feijões lima, ervilhas, e membros do gênero Curcumis, tais como pepino, cantalupo, e melão. Ornamentais incluem, mas não são limitados a, azaléia, hortênsia, hibisco, rosas, tulipas, narcisos, petúnias, cravo, bico-de-papagaio, e crisântemo. Preferencialmente, plantas da presente invenção são plantas de cultivo (por exemplo, milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de- açúcar, tabaco, cevada, couve, etc.). Esta invenção é particularmente adequada para qualquer membro da família de plantas monocotiledôneas incluindo, mas não limitado a, milho, arroz, cevada, aveia, trigo, sorgo, centeio, cana-de-açúcar, abacaxi, inhame, cebola, banana, coco, e tâmaras.

Avaliação de Transformação Vegetal

Após a introdução de DNA estrangeiro heterólogo em células vegetais, a transformação ou integração do gene heterólogo no genoma da planta é confirmada por vários métodos, tais como análise de ácidos nucléicos, proteínas e metabólitos associados com o gene integrado.

A análise de PCR é um método rápido de rastrear células transformadas, tecidos ou brotos para a presença do gene incorporado no estágio inicial antes de transplantar paro o solo (Sambrook and Russell (2001) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY)). PCR é conduzido usando primers de oligonucleotídeos específicos para o gene de interesse ou uma base de vetor de Agrobacteriumf etc.

A transformação vegetal pode ser confirmada por análise de Southern blot de DNA genômico (Sambrook and Russell (2001) supra) . Em geral, DNA total é estraído do transformante, digerido com enzimas de restrição apropriadas, fracionado em gel de agarose e transferido para uma membrana de nitrocelulose ou náilon. A membrana ou "blot" pode ser, então, sondada com, por exemplo, fragmento de DNA alvo radio-rotulado com 32P para confirmar a integração do gene introduzido no genoma vegetal de acordo com técnicas padrão (Sambrook and Russell, 2001, supra).

Na análise Northern, RNA é isolado a partir de tecidos específicos de transformante, fracionado em um gel de formaldeído agarose, e passado para blot em um filtro de náilon de acordo com procedimentos padrão que são rotineiramente usados na arte (Sambrook and Russell (2001) supra). A expressão de RNA codificado por grg23 ou grg51 é então testada hibridizando o filtro a uma sonda radioativa derivada de um GDC por métodos conhecidos na arte (Sambrook and Russell (2001) supra). Testes de Western blot e bioquímicos e similares pode ser conduzidos nas plantas transgênicas para determinar a presença de proteína codificada pelo gene de resistência a herbicidas por procedimentos padrão (Sambrook and Russell (2001) supra) usando anticorpos que se ligam a um ou mais epitopos presentes na proteína de resistência a herbicidas.

Os seguintes exemplos são oferecidos por meio de ilustração e não por meio de limitação.

Experimental

Exemplo 1: Isolamento de ATX21308 ATX 21308 foi isolado colocando-se as amostras de solo em placas em Meio Minimo Enriquecido 3 (EMM3) contendo fosfatos e glifosato a 50 mM. Como EMM3 contém 5 aminoácidos aromáticos, a linhagem deve ser resistente a glifosato para crescer neste meio.

Aproximadamente um grama de solo é suspenso em aproximadamente 10 mL de água, e misturado em misturador tipo vórtex por 5 segundos. 100 pL desta suspensão é adicionada a 1 mL de EMM3 com fosfato mas sem glifosato. EMM3 contém (por litro, pH 7,0): 10 g de sacarose, 1 g de NH4Cl, 0,2 g de MgS04-7H20, 0,01 g de FeS04-7H20, 0, 007 g de MnSO4-H2O e 10 ml de solução de fosfato contendo (por litro, pH 7,0) 210 g de Na2HPO4 e 90 g de NaH2PO4. A cultura é chacoalhada em tambor rolador para cultura de tecidos a 21°C de um dia para outro e então colocada em placas em ágar EMM3 contendo glifosato a 50 mM. Após 3 dias, o isolado é colocado em placas em ágar Luria Bertani (LB) para confirmar a morfologia individual. Após seis dias, a colônia individual é traçada em ágar EMM3 contendo glifosato a 50 mM. O isolado cresceu de um dia para o outro em placas glifosato a 50 mM. Uma linhagem particular, designada ATX21308, foi selecionada em virtude de sua habilidade de crescer na presença de altas concentrações de glifosato. Esta linhagem é testada para sua habilidade de crescer na presença de glifosato em cultura líquida e é capaz de crescer até em concentrações de glifosato de aproximadamente 300 mM nas condições testadas. Exemplo 2. Preparação e Rastreamento de Bibliotecas de Cosmideos

DNA total foi extraído de uma cultura de ATX21308 usando métodos comumente conhecidos na arte. O DNA foi parcialmente digerido com enzima de restrição Sau3Al e ligado com fragmento de vetor SuperCos (Stratagene) de acordo com as diretrizes do fabricante. Produtos da ligação foram empacotados em partículas fago usando extrato de empacotamento GigaPack III XL (Stratagene), transfectados em células E. coli, e colocados em placas em ágar LB contendo canamicina a 50 μg/mL para selecionar para colônias contendo cosmídeos.

Colônias individuais foram coletadas para placas de 384 poços contendo caldo LB e canamicina a 50 μg/mL, e crescidas até saturação. As células destas culturas foram diluídas 1:10, em seguida alfinetadas em placas de ágar MG63 contendo canamicina a 50 pg/mL, e glifosato a 0 mM, 10 mM, 20 mM, ou 50 mM. [meio de ágar M63 KH2PO4 a IOOmM, (NH4) 2S04 a 15 mM, CaCl2 a 50 μΜ, FeSO4 a 1 μΜ, MgCl2 a 50 μΜ, glicose a 55 mM, L-prolina a 25 mg/litro, tiamina HCl a 10 mg/litro, NaOH suficiente para ajustar o pH para 7,0, e ágar a 15 g/litro] .

Os transformantes que crescem mais rápido nas concentrações mais altas de glifosato foram isolados e digeridos com enzima de restrição EcoR I para identificar cosmídeos com padrões de restrição divididos. Diversos clones que cresceram na presença de glifosato e dividem padrões de restrição por EcoR I similares foram identificados. Um destes clones de cosmideo, pAX1924, foi selecionado para mais experimentos.

Exemplo 3. Identificação de grg23 no cosmideo pAX1924

Para identificar o(s) gene(s) responsável(is) pela resistência a glifosato mostrado pelo cosmideo pAX1924, o DNA deste clone é mutagenizado com elementos tipo transposon. Neste método, clones que sofreram inserções de transposon e perderam a habilidade de conferir resistência a glifosato são identificados. A localização das inserções de transposon identifica o quadro de iniciação de leitura responsável pelo fenótipo de resistência ao glifosato.

O cosmideo pAX1924 é sujeito a mutagênese in vitro por transposon usando um kit de inserção EZ::TN (Epicentre, Madison, WI) de acordo com o protocolo do fabricante. Este processo insere aleatoriamente um fragmento de transposon no DNA do cosmideo e assim interrompe aleatoriamente a função de genes no cosmideo. Este transposon em particular contém um gene que codifica resistência a trimetoprim, de modo que clones com inserção do transposon podem ser selecionados pela habilidade de crescer na presença daquele antibiótico. Os locais de inserção do transposon podem ser determinados por mapeamento de fragmentos de restrição ou por seqüenciamento com primers que anelam no transposon. Clones de pAX1924 com inserção de transposon são colocados em placas em meio M63 contendo glifosato. Múltiplos clones contendo transposons são identificados, os quais perderam a habilidade de crescer na presença de glifosato, indicando que o transposon interrompeu o gene responsável pela resistência.

A seqüência de DNA é determinada para a região de pAXl924 contendo as inserções de transposon usando métodos de seqüenciamento bem conhecidos na arte. Usando esta informação de seqüência, prímers de DNA são sintetizados e utilizados para determinar a seqüência de DNA de pAX1924 na região que engloba as inserções de transposon. A análise da seqüência de DNA resultante mostra que essa região contém um único gene. Este gene é designado aqui como grg23. Análise de grg23 mostra que ele é capaz de gerar duas proteínas possíveis em células bacterianas por conta da presença sítios de início de tradução potencialmente alternativos. O primeiro ORF (ORFl) inicia com um códon de início GTG nas posições 109-111 da SEQ ID NO:1, e acaba em um códon de parada TAG nos nucleotídeos 1417-14-19 de SEQ ID NO:1. O segundo ORF (0RF2) inicia em um códon de início ATG nos nucleotídeos 178-180 da SEQ ID NO:1, e acaba no códon de parada TAG nos nucleotídeos 1417-1419 do SEQ ID NO:1. A tradução do ORFl gera a seqüência de aminoácidos apresentada em SEQ ID NO: 2. A tradução do 0RF2 gera a seqüência de aminoácidos apresentada em SEQ ID NO:4. Análise da região de DNA que cerca grg23 sugere que 0RF2 é precedida por um sitio de ligação a ribossomo, enquanto não há sitio óbvio de ligação a ribossomo precedendo o inicio de tradução de ORFl. Além disso, alinhamento de ambos os quadros de leitura aberta com enzimas representativas EPSPS mostra que poucas enzimas EPSPS contêm esta extensão N-terminal codificadas dentro de ORF1. Assim, o ORF funcional codificado por grg23 em bactéria é 0RF2. Portanto, como usado aqui, GRG23 refere-se àquela que é codificada por 0RF2 (nucleotideos 178-1419 da SEQ ID NO: 1) . De todo modo, é bem conhecido na arte que enzimas EPSPS são um tanto tolerantes a aminoácidos adicionais em seus terminais N. Portanto, a expressão de ORF1 (nucleotideos 109-1419 da SEQ ID N0:1) também deve gerar um EPSPS que confere resistência a glifosato.

Para testar a habilidade de 0RF2 funcionar como um EPSPS e conferir às células resistência a glifosato, este quadro de iniciação de leitura pode ser subclonado e expresso em E. coli.

Exemplo 4. Subclonagem de grg23 em vetores para expressão em E. coli

O gene que codifica o 0RF2 de GRG2 3 (iniciando com ATG (posições 178-180 da SEQ ID N0:1), expressando uma proteína de 413 aminoácidos) foi subclonado em pUC18 e pRSF1b usando a mesma estratégia de clonagem descrita acima. Um primer de PCR [5' CAGGGATCCGGCATGGAAACTGATCGACTAGTG 3'] foi sintetizado que adiciona um sitio BamHI seguido de GCC (5'- GGATCCGGC-3' ) imediatamente 5' do sitio de inicio. Um 2° primer foi sintetizado [5' ATTGGCGCGCCCTAGCCGGGGAGCGTAAG 3'] que adicionou um sitio AscI imediatamente 3'da seqüência de parada (5'-GGCGCGCC-3') . A região de codificação de grg23 é amplificada por PCR usando DNA polimerase PFUULTRA™ (Stratagene). Em seguida a amplificação de grg23 por PCR usando estes primers e digestão de restrição com BamHI/AscI, o produto do PCR foi ligado em pUC19 (digerido com BamHI e AscI) e pRSFlb (digerido com BamHI e Asei), e colônias contendo inserções foram obtidas. O clone pUC18-grg23 (aqui designado como pAX1927) foi confirmado por digestão de restrição e por seqüenciamento e DNA.

Similarmente, o vetor de expressão pAX1909 foi digerido com BamHI e AscI, e o vetor contendo o fragmento foi purificado em gel por métodos bem conhecidos na arte. O vetor pAX1909 é um derivado de PRSF-Ib (Novagen, San Diego, CA), modificado para conter um sitio para BamHI diretamente 3' da região que codifica o "marcador-His" rico em histidina. Assim, proteínas clonadas em pAX1909 são fusões em quadro que contém os aminoácidos adicionais MAHHHHHHGSG. Vetores como pAX1909 são tipicamente desenvolvidos para expressão de proteínas e purificação, e esses métodos são bem conhecidos na arte.

O produto de PCR digerido resultante acima foi ligado em vetor pAX1909 digerido, e colônias contendo inserções foram obtidas. 0 clone pAX1909-grg23 (aqui designado pAX1926) foi confirmado por digestão de restrição e por seqüenciamento de DNA. A maneira de construção de pAX1926 é de forma que o produto de tradução GRG23 previsto contém uma extensão amino-terminal composta de MAHHHHHH. Esta extensão N-terminal compõe uma 'marca de histidina' ou 'marca de seis His' que é útil para facilitar a purificação da proteína GRG23, como é bem conhecido na arte.

O plasmídio pAX192 6 contendo o 0RF2 de grg23 foi depositado na coleção da autoridade depositária internacional Agricultural Research Service Culture Collection (NRRL) em 18 de novembro, 2005, e atribuída No. de Acesso NRRL B-30888.

Exemplo 5. grg23 Confere Resistência a Altos Níveis de Glifosato

A construção pUC18-Grg23 (pAX1927) foi transformada na linhagem DH5a de E. coli e colocada em placas de ágar LB suplementadas com carbenicilina (0,1 mg/ml). Duas colônias foram selecionadas, ressuspendidas em água estéril, e traçadas em placas M63 contendo glifosato a 0 mM, 25 mM, 50 mM ou 100 mM. Isopropil-B-D-tiogalactopiranosídeo (IPTG; 0,1 mM) também foi adicionado às placas. Como controle, células contendo apenas o vetor pUC18 foram transformadas e traçadas em placas com glifosato. Após 2 dias de crescimento, estas placas foram examinadas para crescimento (Tabela 1). Tabela 1.

<table>table see original document page 56</column></row><table>

Este resultado confirma que a expressão de grg23 para produzir GRG23-ORF2 confere resistência a glifosato em E. coli a pelo menos 100 mM. Adicionalmente, o crescimento de E. coli contendo pAX1927 é mais forte na presença de glifosato do que na ausência de glifosato.

Exemplo 6. Homologia de GRG23 com Outras Proteínas

A seqüência de aminoácidos deduzida de GRG23 tem homologia com enzimas EPSPS, indicando que grg23 codifica uma EPSPS.

Exame da seqüência de aminoácidos deduzida de GRG-0RF2 SEQ ID NO:4) revela que ela não contém quatro domínios típicos de enzimas EPSPS Classe II. Portanto é uma nova EPSPS resistente a glifosato não pertencente à Classe II.

Procuras em bases de dados de proteínas disponíveis publicamente, como SWISSPROT, revelam que GRG23 tem similaridade de aminoácidos com uma vasta classe de enzimas EPSPS. Entretanto, nenhuma proteína e qualquer base de dados têm identidade maior do que 50% com a seqüência de aminoácidos de GRG23. Um alinhamento representativo de GRG23 com outras enzimas EPSPS é apresentado na Figura 1.

Exemplo 7. Purificação de GRG23

A construção pRSFlb-grg23 (pAX1926) foi expressa em E. coli após indução com IPTG, e purificada em um único passo usando coluna de cromatografia de cobalto como conhecido na arte. Após eluição da coluna, GRG23 purificada foi dialisada contra HEPES a 50 mM/KCl a 100 mM, PH 7,0. A proteína era mais do que 95% pura como avaliado por PAGE. A quantidade de GRG23 foi quantificada usando o método de Bradford, como é bem conhecido na arte (Bradford (1976) Anal. Biochem. 72:248-254) .

Exemplo 8. Ensaios Cinéticos da Atividade de GRG23

Amostras de proteínas purificadas foram ensaiadas para atividade de EPSPS usando ensaios cinéticos que envolvem incubação de PEP (Sigma, St. Louis, MO) e S3P em um tampão contendo cloreto de potássio e HEPES a PH 7,0. Liberação de fosfato foi detectada usando ensaio acoplado para a detecção fluorescente baseado em fosfato na geração de AMPLEX® RED, como é conhecido na arte (Vazquez et al (2003) Anal. Biochem. 320: 292-298). As condições de ensaio publicadas podem levar à saturação do ensaio em experimentos onde fosfato é liberado muito rapidamente. Esta saturação meio que limita a escala dinâmica do ensaio, e requer uma escala definida de concentrações de enzimas. Foi determinado que a limitação cinética do ensaio de fosfato fluorescente é aparentemente por causa de uma combinação de fatores, incluindo a limitação de inosina e PNP. Na invenção presente, as condições ensaio foram desenvolvidas para gerar uma escala dinâmica substancialmente melhorada e permitir o uso de uma escala mais larga de concentrações de enzimas e substratos. As condições de ensaio que foram significativamente modificadas incluem as concentrações de purina nucleosideo fosforilase (PNP), xantina oxidase (XOD), AMPLEX® RED, e inosina, cada qual foi aumentado em concentração no ensaio para acomodar taxas mais altas de retorno de fosfato. Esse ensaio foi adaptado para uso na medida da atividade de EPSPS em um formato de 96 poços com os seguintes melhoramentos:

Tabela 2. Ensaio de fluorescência melhorada

<table>table see original document page 58</column></row><table> <table>table see original document page 59</column></row><table>

Ensaios enzimáticos foram realizados em placas de 96 poços com volume total de 50 pL. Reações foram realizadas em temperatura ambiente em pH 7,0. Todos os componentes do ensaio exceto PEP, EPSPS, e S3P foram combinados em um Master Mix e alíquotas colocadas em placa de 96 poços usando um pipetador multi-canal. Concentrações apropriadas de PEP foram então adicionadas a cada poço. Diluições frescas de EPSPS foram preparadas e adicionadas aos poços apropriados. Cada ensaio foi iniciado pela adição de S3P.

Dados de taxas foram traçados e os parâmetros cinéticos Km e Kcat foram determinados por uso da aplicação da equação de Michaelis-Menten usando programa de ajuste de curva não-linear (KALEIDAGRAPH®, Synergy Sofware). Dados e Ki foram determinados pela medida de Km(app) em concentrações múltiplas de glifosato, e traçando Km(app) como função da concentração do inibidor.

Tabela 3. Efeito do Glifosato no Km(app) de GRG23

<table>table see original document page 59</column></row><table> Plotando-se Km(app) em função da concentração de glifosato, uma representação linear da resistência de GRG23 a glifosato pode ser obtida. A interceptação em X da linha resultante representa -Ki. Plotar essa linha com os dados apresentados na Tabela 3 gera o seguinte dado:

Tabela 4. Valores cinéticos para GRG23

<table>table see original document page 60</column></row><table>

GRG23 é altamente resistente a glifosato, com um Ki de mais de 9 mM, e uma razão Ki/Km maior que 800.

Exemplo 9. Isolamento de ATX21313

Para a linhagem ATX21313, aproximadamente um grama de solo foi suspendida em 10 mL e água, e 100 μΐϋ foi usado para inocular uma cultura de 1 mL de Meio de Sais Minerais A (MSMA) e nenhum glifosato. MSMA contém (por litro, pH 7,0) Ig de NH4Cl, 10 g de sacarose, 0,2 g de MgS04-7H20, 0, 01 g de FeSO4-7H20, 0, 007 g de MnSO4-H2O suplementado com fosfatos. Após incubação de um dia para outro, a cultura foi colocada em placas em meio sólido contendo MSMA e glifosato a 50 mM, incubada por alguns dias, e inoculada em placas de ágar Luria Bertani para confirmar o tipo de colônia individual. 0 crescimento na presença de glifosato a 50 mM foi reconfirmado pelo recrescimento em MSMA, placas de ágar a 50 mM. Este método de isolamento gerou a linhagem ΔΤΧ21313, a qual foi capaz de crescer bem nestas condições.

Exemplo 10. Clonagem de EPSP sintases resistentes a glifosato

DNA genômico foi extraído da linhagem ATX21313 e o DNA resultante foi parcialmente digerido com enzima de restrição Sau3A 1 para gerar fragmentos de DNA com aproximadamente 5 quilobases em tamanho. Estas moléculas de DNA foram selecionadas por tamanho em géis de agarose, purificadas, e ligadas em braços de vetor LAMBDA ZAP® pré- digeridos com BamHI. Os braços ligados foram então empacotados em partículas fago, e titulações de fagos foram determinadas como conhecido na arte. As bibliotecas resultantes foram amplificadas por métodos conhecidos na arte para gerar uma titulação de biblioteca entre 3 χ IO7 e 3 χ IO8 PFU/ml. Para cada biblioteca independente, E. Coli (XLl Blue MRF' ) foi então co-transfectada com fago de uma biblioteca amplificada assim como por fago ajudante M13 para permitir excisão em massa da biblioteca na forma de um ssDNA circular, infeccioso, como conhecido na arte (Short et al. (1988) Nucleic Acids Research 16:7583-7 600). Após centrifugação das células co-infectadas, o sobrenadante contendo fagos foi aquecido a 65-70°C por 15-20 minutos para incapacitar qualquer partícula residual de fago lambda. Diluições da biblioteca de plasmídios ssDNA resultante foram transfectadas em culturas frescas de células E. coli XLl Blue MRF' competentes e também células XL-Blue MRF' (àaroA) (XL1 Blue MRF'). As células transfectadas resultantes foram colocadas em placas M63 contendo canamicina, IPTG a 0,1 mM e glifosato a 0 mM, 20 mM ou 50 mM. Este método de rastreamento permite a identificação de clones contendo EPSP sintases tolerantes a glifosato. Colônias crescendo em glifosato a 20 mM ou 50 mM na linhagem AaroA ou XL-Blue MRF' foram recolhidas e seus plasmidios analisados por digestão de restrição para identificar plasmidios com padrões de restrição compartilhados. Plasmidios individuais foram seqüenciados por métodos conhecidos na arte, com preferência dada a plasmidios que conferiam resistência a glifosato a 50 mM.

Usando esta abordagem, às vezes modificado para cada biblioteca como conhecido e apreciado na arte, clones da biblioteca contendo genes EPSP sintase foram identificados.

As seqüências das regiões dos clones resultantes foram determinadas na região da EPSP sintase.

Exemplo 11. Seqüências de DNA e proteína das EPSP sintases

A seqüência de DNA da EPSP sintase resistente a glifosato foi determinada para pAX1967 por métodos bem conhecidos na arte. A seqüência de DNA de grg51 é fornecida aqui como SEQ ID NO: 5. O produto de tradução presumido de grg51 (GRG51) é fornecido aqui como SEQ ID NO: 6. GRG51 mostra 97% de identidade de aminoácidos para GRG23 (SEQ ID NO:2).

Plasmidio pAX1967 contendo grg51 foi depositado na coleção da autoridade depositária internacional Agricultural Research Service Culture Collection (NRRL) em 26 de junho, 2006, a atribuído No. De Acesso NRRL B-30949. Tabela 5 resume a homologia de GRG23 e GRG51 com outras enzimas EPSP sintase.

Tabela 5. Identidade de aminoácidos de GRG23-ORF1 e GRG51 para enzimas EPSPS representativas_

<table>table see original document page 63</column></row><table>

Exemplo 12. Clonagem de Nova EPSP Sintase Resistente a Glifosato em Vetor de Expressão E. coli

0 gene grg51 contido em pAX1967 foi sub-clonado em vetor de expressão E. coli pRSFlb (Invitrogen). Clones resultantes foram confirmados por seqüenciamento de DNA, e usados para induzir a expressão de grg51 em E. coli. A proteína marcada com expressão His foi então purificada como conhecido na arte.

Exemplo 13. Resistência a Glifosato de EPSP sintases

Células contendo pAX1967 foram colocadas em placas M63+ contendo antibióticos e glifosato O mM ou 20 mM. 0 crescimento foi pontuado após dois dias de crescimento a 37°C. GRG51 foi observada por conferir resistência a glifosato a 20 mM em células E. coli (Tabela 6).

Tabela 6. Rastreamento de G^ _if osato

<table>table see original document page 64</column></row><table>

Exemplo 14. Expressão e projeto de syngrg23

Uma nova seqüência gênica codificando a proteína GRG23 (SEQ ID NO:2; U.S. Patent ApplicationNo. 60/741.166 arquivada em Io de dezembro, 2005) foi projetada e sintetizada. Esta seqüência é fornecida como SEQ ID NO:12. Este quadro de iniciação de leitura, aqui designado "syngrg23", foi clonado em vetor de expressão pRSFlb (Invitrogen), por métodos conhecidos na arte.

O gene syngrg23 foi clonado em vetor pUC19 para criar pAX748. Primers de PCR que flanqueiam syngrg23 neste vetor foram usados para amplificar syngrg23 de pAX748 usando o sistema MUTAZYME® II (Stratagene) para introduzir mutações aleatórias na região codificante de syngrg23. 0 modelo foi diluído 1:50 em reação de PCR error-prone, e a amplificação foi realizada por 30 ciclos. 0 produto de PCR resultante foi digerido com enzimas de restrição BamHI e Sgs I, purificada em gel, e ligada em vetor pRSFlb para criar uma biblioteca de syngrg23 mutagenizado.

As bibliotecas de syngrg23 mutagenizadas foram transformadas em linhagem BL21*DE3 estrela de E. coli (Invitrogen). Após transformação, colônias individuais foram colocadas em placas com meio M63 Ix contendo glifosato a 150 mM para selecionar clones que teriam retido atividade enzimática e tolerância no crescimento.

Exemplo 15. Rastreamento para resistência a glifosato em placas

Ligações da biblioteca foram transformados em células E. coli BL21*DE3 competentes (Invitrogen). As transformações foram executadas de acordo com instruções do fabricante com as seguintes modificações. Após incubação por 1 hora a 37°C em meio SOC, as células eram sedimentadas por centrifugação (5 minutos, 1OOOxg, 4°C). As células foram lavadas com 1 mL de M63+, centrifugadas novamente, e o sobrenadante decantado. As células foram lavadas uma segunda vez com 1 mL de M63+ e ressuspendidas em 200 μL de M63+. Para seleção de enzimas GRG23 mutantes conferindo resistência a glifosato em E. coli, as células foram colocadas em placas de meio ágar M63+ contendo glifosato a 150 mM, IPTG (isopropil-beta-D-tiogalactopiranosideo) a 0,05 mM, e canamicina a 50 pg/ml. Meio M63+ contém KH2PO4 a 100 mM, (NH4)2SO4 a 15 mM, CaCl2 a 50 μΜ, FeSO4 a 1 μΜ, MgCl2 a 50 μΜ, glicose a 55 mM, L-prolina a 25 mg/litro, tiamina HCl a 10 mg/litro, NaOH suficiente para ajustar o pH para 7,0, e ágar a 15 g/litro.

Colônias individuais foram coletadas e postas em placas de 384 poços. Duas placas de 384 poços foram criadas desta maneira. Uma terceira placa de 384 clones foi coletada a partir de colônias que cresceram em placas sem glifosato.

Exemplo 16. Isolamento e análise de variantes de GRG23 resistentes a glifosato

Células BL21*DE3 transformadas com syngrg23 mutagenizado e/ou variantes de grg23 foram identificadas por crescimento em placas de glifosato. Extratos de syngrg23 mutagenizados e variantes de grg23 foram preparados e ensaiados para atividade enzimática melhorada. Colônias identificadas em placas de glifosato presas em blocos de 96 poços contendo meio LB foram crescidas até uma D.O. em torno de 0,6. IPTG foi então adicionado (0,5 mM) e os blocos foram incubados de um dia para outro a 20°C para induzir a expressão de proteína. Extratos de proteína foram preparados a partir de precipitados celulares usando reagente de cultura POP (Novagen) e Lysonase (Novagen), e a atividade enzimática nos lisados crus foi mensurada após o aquecimento dos extratos por 30 min a 37 °C. Extratos com atividade maior do que dois desvios padrão acima da média de um conjunto de extratos contendo a proteína controle apropriada (por exemplo, GRG23) foram selecionados para mais análises.

Clones apresentando atividade aumentada após incubação como extratos crus foram crescidos em culturas de 250 mL de LB, e a expressão de proteína induzida por IPTG. Após indução, a proteína GRG23 mutante foi purificada de cada cultura por cromatografia de afinidade usando resina de cobalto (Novagen). As proteínas purificadas foram então testadas para atividade enzimática após aquecimento por 0, 2, 4, e aproximadamente 16 horas a 37°C.

Exemplo 17. Variantes de GRG23 melhoradas

De uma biblioteca de syngrg23 mutagenizados, vários clones com atividade melhorada foram identificados. As seqüências de DNA dos clones correspondentes a estes 30 25 extratos foram determinadas. A Tabela 7 mostra as mudanças de aminoácidos identificadas em seis variantes de GRG23 que retiveram a resistência a glifosato: grg23(L3P1.B20) (SEQ ID NO:26) codificando a seqüência de aminoácidos GRG23(L3P1.B20) (SEQ ID NO:27); grg23(L3P1.B3) (SEQ ID NO:28) codificando a seqüência de aminoácidos GRG23(L3P1.B3) (SEQ ID NO:29); grg23(L3P1.F18) (SEQ ID NO:30) codificando a seqüência de aminoácidos GRG23 (L3P1. F18) (SEQ ID NO:31); e grg23 (L3P1. 023) SEQ ID NO:31, codificando a seqüência de aminoácidos GRG23(L3P1.023) SEQ ID NO:32).

Tabela 7. Mutações identificadas em variantes de GRG23 _resistentes a glifosato_

<table>table see original document page 68</column></row><table>

Os clones foram crescidos em culturas de 250 mL de LB, e a expressão de proteína induzida e isolada como descrito acima. As proteínas purificadas foram então testadas para atividade enzimática após aquecimento por 0, 2 e 4, e aproximadamente 16 horas a 37°C. Um dos clones, denominado "M5", foi capaz de reter uma proporção aumentada de sua atividade enzimática depois de prolongada incubação a 37°C (Tabela 8). A seqüência de DNA deste clone foi determinada, e o gene é designado aqui como grg23(acel) (SEQ ID 0:14). A proteína expressa de grg23(ace1) é designada GRG23(ACE1) SEQ ID NO:15). Tabela 8. Meia-vida de GRG23(ACEl) vs GRG23 em temperatura elevada

<table>table see original document page 69</column></row><table>

GRG23(ACEl) contém 2 substituições de aminoácidos relativas à proteína GRG2 3 selvagem: A49-^T e S276->T. 0 vetor pRSFlb que contém este gene é designado pAX3801. Figura 1 mostra a estabilidade relativa de GRG23(ACEl) vs GRG23 em temperaturas elevadas.

Exemplo 18. Determinação da atividade EPSPS de variantes de GRG-23

Extratos contendo proteínas de variantes de GRG23 foram ensaiados para atividade de EPSP sintase como descrito na U.S. Patent Application No. 60/741.166, arquivada em Io de dezembro de 2005, aqui incorporada por referência em sua integridade. Ensaios foram realizados em um volume final de 50 μΐί contendo chiquimato-3-f osf ato a 0,5 mM, fosfoenolpiruvato (PEP) a 200 μΜ, xantina oxidase a 1 U/ml, nucleosídeo fosforilase a 2 U/ml, inosina a 2,25 mM, peroxidase de raiz-forte a 1 U/ml, glifosato a 0-2 mM, HEPES/KOH a 50 mM pH 7,0, KCl a 100 mM, e AMPLEX® RED (Invitrogen) de acordo com as instruções do fabricante. Extratos foram incubados como todos os componentes do ensaio exceto chiquimato-3-fosfato por 5 minutos a temperatura ambiente, e ensaios foram iniciados pela adição de chiquimato-3-fosfato. Atividade de EPSP sintase foi mensurada usando um espectrômetro de fluorescência Spectramex Gemini XPS (Molecular Dynamics, excitação: 555 nm; emissão: 590 nm).

Após completa determinação dos parâmetros cinéticos terem sido executadas com proteína purificada como descrito anteriormente (U.S. Patent Application No. 60/741.166, arquivada em Io de dezembro de 2005), ajuste da quantidade de proteína determinada por ensaio de Bradford como conhecido na arte. Para qualquer concentração de glifosato, a atividade de EPSP sintase foi mensurada em função de uma larga escala de concentrações de PEP. Os dados foram ajustados à equação de Michaelis-Menten usando o programa KALEIDAGRAPH® (Synergy Software) e usados para determinar Km (Km aparente) da EPSP sintase naquela concentração de glifosato. Km, valores aparentes foram determinados em não menos do que 4 concentrações de glifosato, e Ki do EPSPS para glifosato foram calculados da curva do Km aparente vs. Concentração de glifosato, usando a equação (ml*X/(m2+x); Ml = 1; m2 = 1) como conhecido na arte.

Tabela 9. Cinética de GRG23(ACEl) vs GRG2 3

<table>table see original document page 70</column></row><table>

Exemplo 19. Identificação de grg23 (ace2) GRG23(ACEl) contém duas modificações de aminoácidos em relação a GRG23. Para determinar se substituições adicionais nestas posições podem melhorar ainda mais a atividade, uma biblioteca de DNA foi gerada que resultou em clones expressando proteínas que eram substancialmente mutadas em ambas as posições 49 e 276 do GRG23. Clones conferindo resistência a glifosato foram selecionados por crescimento em placas de glifosato, e crescidos e ensaiados para propriedades cinéticas como descrito.

Surpreendentemente, um clone, aqui designado grg23(ace2) (SEQ ID N0:16), codificando a proteína GRG(ACE2) (SEQ ID NO:17) foi identificado como tendo termoestabilidade melhorada. A seqüência de DNA de grg23(ace2) mostra que GRG23(ACE2) contém uma única mudança de aminoácido (resíduo 276 de GRG23 para arginina).

Exemplo 20. Comparação entre GRG23 e GRG51, e mutagênese de diferentes resíduos

Duas bibliotecas foram geradas para avaliar as permutações de seqüências de aminoácidos possíveis a partir da comparação com as seqüências de aminoácidos de GRG23 e GRG51. A primeira biblioteca introduziu variação da seqüência de aminoácidos de GRG51 na região codificadora de grg23(ace2). A segunda biblioteca introduziu variação da seqüência de aminoácidos de GRG23(ACE2) na região codificadora de grg51. Clones das bibliotecas resultantes foram avaliados quanto a (1) habilidade de conferir resistência a glifosato na célula, e (2) atividade após incubação prolongada a 37°C. Um total de dez clones foram seqüenciados e analisados em mais detalhe. Um clone em particular, aqui designado grg51.4 (SEQ ID NO:18), codificando a proteína GRG51.4 (SEQ ID NO:19), contém várias alterações de aminoácidos em relação tanto a GRG23(ACE2) e GRG51. As mudanças de aminoácidos presentes em GRG51.4 em relação a GRG23(ACE2) foram subseqüentemente introduzidas no gene grg23{ace2), para gerar grg23(ace3) (SEQ ID N0:20), que codifica a proteína GRG(ACE3) (SEQ S N0:21). GRG23(ACE3) exibe atividade e termoestabilidade superior em relação a GRG2 3, e GRG23(ACE2).

GRG23(acel) foi mutagenizado, e clones foram testados para identificar clones expressando variantes com termoestabilidade e/ou atividade melhorada. Um clone, grg23(L5P2.J2) (SEQ ID NO:22), codificando GRG23(L5P2.J2) (SEQ ID NO:23), foi identificado por virtude de suas propriedades cinéticas melhoradas. GRG23 (L5P2.J2) contém três alterações de aminoácidos em relação a GRG23(ACEl), como mostrado na seguinte Tabela 10.

Tabela 10. Alterações de aminoácidos em GRG23(L5P2.J2)

<table>table see original document page 72</column></row><table> <table>table see original document page 73</column></row><table>

Mutagênese de oligonucleotídeos foi usada para criar clones que contenham cada uma das alterações de aminoácidos identificadas em GRG23(L5P2.J2) na região codificadora de grg23(ace3). Um clone foi identificado como codificando uma proteína tendo propriedades cinéticas melhoradas sobre GRG23(ACE3), e designado grg23{ace4) (SEQ ID NO:24). A proteína codificada por grg23(ace4) é designada como GRG23(ACE4) (SEQ ID NO:25) contém uma única alteração de aminoácido em relação a GRG23(ACE3) (valina 101 para fenilalanina). Baseado neste resultado, uma mutagênese por oligonucleotídeo separada foi realizada para testar as cinéticas de cada substituição de aminoácido possível na posição 101. Nenhuma das alterações de aminoácidos resultou em melhorias maiores nas propriedades cinéticas comparadas a GRG23(ACE4).

Tabela 11. Cinética de variantes melhorados

<table>table see original document page 73</column></row><table> <table>table see original document page 74</column></row><table>

Exemplo 21. Engenharia de grg23 ou grg51 para Transformação de Plantas

O quadro de leitura aberto (ORF) de grg23 ou grg51 é amplificado por PCR de um molde de cDNA de tamanho completo. Sitios de restrição Hind III são adicionados em cada fim do ORF durante PCR. Adicionalmente, a seqüência de nucleotideos ACC é adicionada imediatamente 5'do códon de inicio do gene para aumentar a eficiência de tradução (Kozak (1987) Nucleic Acids Research 15:8125-814 8; Joshi (1987) Nucleic Acids Research 15:6643-6653). O produto de PCR é clonado e seqüenciado usando técnicas bem conhecidas na arte para assegurar que nenhuma mutação é introduzida durante o PCR.

O plasmidio contendo o produto de PCR grg23 ou grg51 é digerido com Hind III e o fragmento contendo o ORF intacto é isolado. Este fragmento é clonado no sitio Hind III do plasmidio pAX200, um vetor de expressão em planta contendo o promotor de actina de arroz (McElroy et al. (1991) Molec. Gen. Genet. 231:150-160) e o terminador PinII (An et al. (1989) The Plant Cell 1:115-122). O fragmento promotor- gene-terminador deste plasmidio intermediário é subclonado no plasmidio pSBll (Japan Tobacco, Inc.) para formar o plasmidio final, por exemplo, pSBHGRG23. pSBHGRG23 é organizado tal que o fragmento de DNA de 3,91 kb contendo a construção promotor-grg23-terminador pode ser excisado por dupla digestão com Kpn I e Pme I e usado para transformação em plantas por injeção de feixe aerossol. A estrutura de pSBHGRG23 é verificada por digestão de restrição e eletroforese em gel, e por seqüenciamento ao longo de várias junções de clonagem.

O plasmidio é mobilizado na linhagem LBA4404 de Agrobacterium tumefaciens o qual também contém o plasmidio pSBl (Japan Tobacco, Inc.), usando procedimentos de cruzamento triparental bem conhecidos na arte, e plaqueando em meio contendo espectinomicina. O plasmidio pSBHGRG23 carrega resistência a espectinomicina mas é um plasmideo de escala estreita em hospedeiro e não pode se replicar em Agrobacterium. Colônias resistentes a espectinomicina surgem quando pSBHGRG23 se integra no plasmidio pSBl de escala larga em hospedeiro através de recombinação homóloga. O produto co-integrado de pSBl e pSBHGRG23 é verificado por hibridização Southern. A linhagem de Agrobacterium contendo o co-integrado é usada para transformar milho pelo método PureIntro (Japan Tobacco).

Exemplo 22. Transformação de grg23 ou_grg51 em células de Plantas

Espigas de milho são coletadas 8-12 dias após polinização. Embriões são isolados das espigas, e aqueles embriões com 0,8-1,5 mm de tamanho são usados para transformação. Embriões são plaqueados com o escutelo virado para cima em meio de incubação apropriado, como meio DN62A5S (Sais N6 a 3,98 g/L; vitaminas N6 a 1 mL/L (de estoque IOOOx); L-Asparagina a 800 mg/L; Mio-inositol a 100 mg/L; L-Prolina a 1.4 g/L; Casaminoácidos a 100 mg/L; sacarose a 50 g/L; 2,4-D a 1 mL/L (de estoque a 1 mg/mL) ) . Entretanto, meio e sais outros que não DN62A5S são apropriados e são conhecidos na arte. Embriões são incubados de um dia para outro a 25°C no escuro.

Os explantes resultantes são transferidos para malhas quadradas (30-40 por placa), transferidos para meio osmótico por 30-45 minutos, então transferidos para placa irradiante (veja, por exemplo, Publicação PCT No. W0/0138514 e Patente E.U No. 5,240,842).

Construções de DNA para expressar GRG23 em células de planta são aceleradas em tecido de planta usando um acelerador de feixe aerossol, usando condições essencialmente como descrito na Publicação PCT NO. WO/0128514. Após irradiação, embriões são incubados por 30 min em meio osmótico, e colocados em meio de incubação de um dia para outro a 25°C no escuro. Para evitar danos impróprios a explantes irradiados, eles são incubados por pelo menos 24 horas antes de transferir para meio de recuperação. Embriões são então espalhados em meio de período de recuperação por 5 dias a 25°C no escuro, depois transferidos para um meio de seleção. Explantes são incubados em meio de seleção por até oito semanas, dependendo da natureza e características de seleção particular utilizada. Após o período de seleção, o calo resultante é transferido para meio de maturação de embrião até a observação da formação de embriões somáticos maduros. Os embriões somáticos maduros resultantes são então colocados em luz baixa e o processo de regeneração é iniciado por métodos conhecidos na arte. Aos brotos resultantes são permitidos o enraizamento em meio de enraizamento, e as plantas resultantes são transferidas para potes berçários e propagadas como plantas transgênicas.

Materiais Meio DN62A5S

<table>table see original document page 77</column></row><table> <table>table see original document page 78</column></row><table>

Ajuste o pH da solução para pH 5,8 com KOH a 1N/KC1 a 1N, adicione Gelrite (Sigma) para 3g/L, e autoclave. Após resfriamento para 50°C, adicione 2 mL/L de uma solução estoque de Nitrato de Prata a 5 mg/mL (Phytotechnology Labs). A receita gera em torno de 20 placas.

Exemplo 23. Transformação de grg23 ou grg51 em Células de Plantas de Milho por Transformação Mediada por Agrobacterium

Espigas de milho são coletadas 8-12 dias após polinização. Embriões são isolados das espigas, e aqueles embriões com 0,8-1,5 mm de tamanho são usados para transformação. Embriões são colocados em placas com o escutelo virado para cima em meio de incubação apropriado, e incubados de um dia para outro a 25°C no escuro. Entretanto, não é necessário per se incubar os embriões de um dia para outro. Embriões são contatados com uma linhagem de Agrobacterium contendo os vetores apropriados para transferência medida por plasmidio Ti por 5-10 min, e então plaqueados em meio de co-cultivo por 3 dias (25°C no escuro). Após co-cultivo, os explantes são transferidos para meio de período de incubação por cinco dias (25°C no escuro). Os explantes são incubados em meio de seleção por até oito semanas, dependendo da natureza e características da seleção particular utilizada. Após o período de seleção, o calo resultante é transferido para meio de maturação de embrião, até que a formação de embriões somáticos maduros seja observada. Os embriões somáticos maduros resultantes são então colocados em luz baixa, e o processo de regeneração é iniciado por métodos conhecidos na arte. Aos brotos resultantes são permitidos o enraizamento em meio de enraizamento, e as plantas resultantes são transferidas para potes berçários e propagadas como plantas transgênicas.

Todas as publicações e aplicações de patentes mencionadas na especificação são indicativas do nível de perícia daqueles especialistas na arte a qual esta invenção pertence. Todas as publicações e aplicações de patentes são aqui incorporadas por referência na mesma medida como se cada publicação ou aplicação de patente individual fosse especificamente e individualmente indicada para ser incorporada por referência.

Apesar da invenção precedente ter sido descrita em algum detalhe por meio de ilustração e exemplo para finalidades de claridade e compreensão, será óbvio que certas alterações e modificações podem ser praticadas dentro do escopo das reivindicações em anexo. LISTAGEM DE SEQÜÊNCIAS

1) INFORMAÇÕES GERAIS:

I.a) Requerente: Cheryl Peters

Jill Burdette Philip E. Hammer Brian Vande Berg Laura Cooper Schouten Brian Carr

II) Titulo da Invenção: MOLÉCULA DE ÁCIDO NUCLÉICO ISOLADA, POLIPEPTÍDEO ISOLADO, VETOR, CÉLULA HOSPEDEIRA, PLANTA TRANSGÊNICA, SEMENTE, MÉTODO PARA PRODUZIR POLIPEPTÍDEO COM ATIVIDADE DE RESISTÊNCIA A HERBICIDAS, MÉTODO PARA CONFERIR RESISTÊNCIA A HERBICIDA PARA PLANTA, MÉTODO PARA MEDIR A LIBERAÇÃO DE FOSFATO POR ENZIMA

III) Arquivo de Referência: 45600/320129

IV.a) Dados de Prioridade Unionista: 60/741.166

IV.b) Data de preenchimento do formulário anterior:

01/12/2005

IV.a) Dados de Prioridade Unionista: 60/817.799

IV.b) Data de preenchimento do formulário anterior: 30/06/2006

V)Número de Seqüências: 33 (trinta e três)

VI)Programa para leitura: FastSEQ for Windows Version 4.0

2) INFORMAÇÕES GERAIS DAS SEQÜÊNCIAS:

I.a) Número identificador da seqüência: SEQ ID No: 1

II) Características da seqüência:

II.a) tamanho: 1892

Il.b) tipo: DNA

II.c) organismo: Arthrobacter globiformis

III) Característica: III.a) Nome/Legenda: incerto

III.b) Localização: (0)...(0)

III.c) Outras informações: Linhagem ATX21308

III.a) Nome/Legenda: CDS

III.b) Localização: (109) ... (1419)

III.a) Nome/Legenda: incerto

III.b) Localização: 1801

III.c) Outras informações: η = A,Τ,C or G

III.a) Nome/Legenda: incerto

III.b) Localização: 1801

III.c) Outras informações: n = A,Τ,C or G

IV) Seqüência: SEQ ID NO. 1

gggaccacat gctgctcctg atttcagggc tgctgccggt atggaccagg gtttagagag 60 ggacggcacg catccgggcc cttatcggac caacgccaac agcggtcg gtg gcc ttg 117

Met Ala Leu 1

gag cgg ggc cag cac ggc cga tca cgt aga ctc ttt gga gct tcg ctc 165 Glu Arg Gly Gln His Gly Arg Ser Arg Arg Leu Phe Gly Ala Ser Leu 5 10 15

gaa agg ate acc atg gaa act gat cga cta gtg ate cca gga tcg aaa 213 Glu Arg Xle Thr Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys 20 25 30 35 "age"^tSb-CiSS' aaclígÇ^gõE ttg ctt ttg gct gcc gea gcg aag ggc acg 261 Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr 40 45 SO

tcg gtc ctg gtg aga cca ttg gtc age gcc gat acc tca gea ttc aaa 309 Ser Val Leu Val Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys SS 60 65

act gea att cag gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat 357 Thr Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn 70 75 80

tgg gtc gtt gaa ggc ctg ggt cag gea cce eac ctc gac gcc gac ate 405 Trp Val Val Glu Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile 85 90 95

tgg tgc gag gat gea ggt acc gtg gcc cgg ttc ctc cct cca ttc gtc 453 Trp Cys Glu Asp Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val 100 105 110 115

gcc gea gga cag ggg aag ttc acc gtc gac gga age gag cag ctg cgg 501 Ala Ala Gly Gln Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg 120 125 130

cgg cgc ccg ctt cgg ccc ctg gtc gac ggc ate cgc cac ctg ggc gcc 549 Arg Arg Pro Leu Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala 135 140 145

cgc gtc tec tcc gag cag ctg ccc cta aca att gaa gcg age ggg ctg 597 Arg Val Ser Ser Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu 150 155 160

gea ggc ggg gag tac gaa att gaa gcc cat cag age age eag ttc gcc 64S Ala Gly Gly Glu Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala 165 170 175

tcc ggc ctg ate atg gcc gce ccg tac gcg cga eaa ggc ctg cgt gtg 693 Ser Gly Leu Ile Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val 180 185 190 195

cgg ata cca aat ccc gtg age cag ccc tac ctc acg atg aca ctg cgg 741 Arg Ile Pro Asn Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg 200 205 210

atg atg agg gac ttc ggc ctt gag acc age acc gac gga gcc acc gtc 789 Met Met Arg Asp Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val 215 220 225

age gtc cct ccc ggg cgc tac aca gcc cgg cgg tat gaa att gaa ccg 837 Ser Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro 230 235 240

gac gcg tca act gcg tcg tac ttc gcc gce gct tcc gcc gtc tet ggc 885 Asp Ala Ser Thr Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly 245 250 255

cga age ttc gaa ttc cag ggc ctt ggc aca gac age ate caa ggc gac 933 Arg Ser Phe Glu Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp 260 265 270 275

acg tca ttc ttc aat gta ctt ggg cgg ctc ggt gea gag gtc cac tgg 981 Thr Ser Phe Phe Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp 280 285 290

gca ccc aac tcg gtc acc ata tcc gga ccg gaa agg ctg aac ggc gac 1029 Ala Pro Asn Ser Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp 295 300 305

att gaa gtg gat atg ggc gag ata tcg gac acc ttc atg aca ctc gcg 1077 Ile Glu Val Asp Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala 310 315 320

gcg att gcc cct cta gcc gat gga ccc ate acg ata acc aac att ggc 1125 Ala Ile Ala Pro Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly 325 330 335

cat gca cgg ttg aag gaa tcc gac cgc ate tcg gcg atg gaa acc aac 1173 His Ala Arg Leu Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn 340 345 350 355

ctg cga acg ctc ggt gta caa acc gac gtc gga cac gac tgg atg cga 1221 Leu Arg Thr Leu Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg 360 365 370

ate tac ccc tet acc ccg cac ggc ggc aga gtc aat tgc cac cgg gac 1269 Ile Tyr Pro Ser Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp 375 380 385

cac agg ate gcc atg gcg ttt tca ate ctg gga ctg cga gtg gac ggg 1317 His Arg Ile Ala Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly 390 395 400

att acc etc gac gac cct caa tgt gtc ggg aag acc ttt cot ggc ttc 1365 Ile Thr Leu Asp Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe 405 410 415

ttc gac tac ctt gga cgc ctt tte ccc gaa aag gcg ctt acg ctc ccc 1413 Phe Asp Tyr Leu Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro 420 425 430 435

ggc tag tgacttectc tccggcggac gctaggcatc ggaaaacgaa tectgacatg 1469 Gly *

accgacctcc tcgcgtcacg gcgtgtctgc ccgcggcccc ttatgctttc tggttgtcca agcagggcaa tcagctgttc agcactgtca gctgccacgt cggcggctct catcgctgtc tcaggatccg ccctcgtcgc ctgatcctga ggcggccaga gccgaagcaa taaggagttt ggcgatatgg gcttcatgct gaactatggg cca

cggtacccaa gcattctgcc ttagccgctt 1529 gattttcatc cgggatgttg cctgaccttg 1589 atggtgtggg ccctgaaggc ggcttcgatg 1649 acgacacgca gatgcgcttc ataggcacgt 1709 gccaaggcaa tagttagatg tgcctccgtt 1769 tncgaggcca cccagattcc ccgggtggaa 1829 gtccggatgg aagtgacttt tcaactctgc 1889

1892 I.a) Número identificador da seqüência: SEQ ID No: 2

II) Características da seqüência:

II.a) tamanho: 436 II.b) tipo: PRT

II.c) organismo: Arthrobacter globiformis IV) Seqüência: SEQ ID NO. 2

Met Ala Leu Glu Arg Gly Gln His Gly Arg Ser Arg Arg Leu Phe Gly 1 5 10 15 Ala Ser Leu Glu Arg Ile Thr Met Glu Thr Asp Arg Leu Val Ile Pro '20· — ~ —— 25 30 Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Ala Ala 35 40 45 Lys Gly Thr Ser Val Leu Val Arg Pro Leu Val Ser Ala Asp Thr Ser 50 55 60 Ala Phe Lys Thr Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp 65 70 75 80 Gly Asp Asn Trp Val Val Glu Gly Leu Gly Gln Ala Pro His Leu Asp 85 90 95 Ala Asp Ile Trp Cys Glu Asp Ala Gly Thr Val Ala Arg Phe Leu Pro 100 105 110 Pro Phe Val Ala Ala Gly Gln Gly Lys Phe Thr Val Asp Gly Ser Glu 115 120 125 Gln Leu Arg Arg Arg Pro Leu Arg Pro Leu Val Asp Gly Ile Arg His 130 135 140 Leu Gly Ala Arg Val Ser Ser Glu Gln Leu Pro Leu Thr Ile Glu Ala 145 150 155 160 Ser Gly Leu Ala Gly Gly Glu Tyr Glu Ile Glu Ala His Gln Ser Ser 165 170 175 Gln Phe Ala Ser Gly Leu Ile Met Ala Ala Pro Tyr Ala Arg Gln Gly 180 185 190 Leu Arg Val Arg Ile Pro Asn Pro Val Ser Gln Pro Tyr Leu Thr Met 195 200 205 Thr Leu Arg Met Met Arg Asp Phe Gly Leu Glu Thr Ser Thr Asp Gly 210 215 220 Ala Thr Val Ser Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Glu 225 230 235 240 Ile Glu Pro Asp Ala Ser Thr Ala Ser Tyr Phe Ala Ala Ala Ser Ala 245 250 255 Val Ser Gly Arg Ser Phe Glu Phe Gln Gly Leu Gly Thr Asp Ser Ile 260 265 270 Gln Gly Asp Thr Ser Phe Phe Asn Val Leu Gly Arg Leu Gly Ala Glu 275 280 285 Val His Trp Ala Pro Asn Ser Val Thr Ile Ser Gly Pro Glu Arg Leu 290 295 300 Asn Gly Asp Ile Glu Val Asp Met Gly Glu Ile Ser Asp Thr Phe Met 305 310 315 320 Thr Leu Ala Ala Ile Ala Pro Leu Ala Asp Gly Pro Ile Thr Ile Thr 325 330 335 Asn Ile Gly His Ala Arg Leu Lys Glu Ser Asp Arg Ile Ser Ala Met 340 345 350 Glu Thr Asn Leu Jtfg Thr Leu Gly Val Gln Thr Asp Val Gly His Asp 355 360 365 Trp Met Arg Ile Tyr Pro Ser Thr Pro His Gly Gly Arg Val Asn Cys 370 375 380 His Arg Asp His Arg Ile Ala Met Ala Phe Ser Ile Leu Gly Leu Arg 385 390 395 400 Val Asp Gly Ile Thr Leu Asp Asp Pro Gln Cys Val Gly Lys Thr Phe 405 410 415 Pro Gly Phe Phe ASp Tyr Leu Gly Arg Leu Phe Pro Glu Lys Ala Leu 420 425 430

Thr Leu Pro Gly 435 I.a) Número identificador da seqüência: SEQ ID No: 3

II) Características da seqüência:

II.a) tamanho: 18 92 II.b) tipo: DNA

II.c) organismo: Arthrobacter globiformis

III) Característica:

III.a) Nome/Legenda: CDS

III.b) Localização: (178) ... (1419)

III.a) Nome/Legenda: misc_feature

III.b) Localização: 1801

III.c) Outras informações: η = A,Τ,C or G

IV) Seqüência: SEQ ID NO. 3

gggaccaeat gctgctcctg atttcagggc tgctgccggt atggaccagg gtttagagag 60 ggacggcacg catccgggcc cttatcggac caacgccaac agcggtcggt ggccttggag 120 cggggccagc acggccgatc acgtagactc tttggagctt cgctcgaaag gatcacc atg 180

Met 1

gaa act gat cga cta gtg ate cca gga tcg aaa age ate acc aac cgg 228 Glu Tbr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn Arg S 10 15

gct ttg ctt ttg gct gcc gea gcg aag ggc acg tcg gtc ctg gtg aga 276 Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val Arg 20 25 30

cca ttg gtc age gcc gat acc tca gea ttc aaa act gea att cag gcc 324 Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln Ala 35 40 45

ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa ggc 372 Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu Gly 50 55 60 65

ctg ggt cag gea ccc cac ctc gac gcc gac ate tgg tgc gag gat gea 420 Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp Ala 70 75 80

ggt acc gtg gcc cgg ttc ctc cet eca ttc gtc gcc gea gga cag ggg 468 Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln Gly 85 90 95

aag ttc ace gtc gac gga age gag cag ctg cgg egg cgc ccg ctt cgg 516 Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu Arg 100 105 110

ccc ctg gtc gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc gag 564 Pro Leu' Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser Glu 115 120 125

cag ctg ccc cta aca att gaa gcg age ggg ctg gea ggc ggg gag tac 612 Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu Tyr 130 135 140 145

gaa att gaa gcc cat cag age age cag ttc gcc tee ggc ctg ate atg 660 Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile Met 150 155 160

gcc gcc ccg tac gcg cga caa ggc ctg cgt gtg cgg ata cca aat cee 708 Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn Pro 165 170 175

gtg age cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac ttc 756 Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp Phe 180 185 190 ggc ctt gag acc age acc gac gga gcc acc gtc age gtc cct ccc ggg 804 Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro Gly 195 200 205

cgc tac aca gcc cgg egg tat gaa att gaa ccg gac gcg tca act gcg 852 Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr Ala 210 215 220 225

tcg tac ttc gcc gcc gct tcc gcc gtc tet ggc cga age ttc gaa ttc 900 Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu Phe 230 235 240

cag ggc ctt ggc aca gac age ate caa ggc gac acg tca ttc ttc aat 948 Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe Asn 245 250 255

gta ctt ggg cgg etc ggt gea gag gtc cac tgg gea ccc aac tcg gtc 996 Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser Val 260 265 270

acc ata tcc gga ccg gaa agg ctg aac ggc gac att gaa gtg gat atg 1044 Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp Met 275 280 285

ggc gag ata tcg gac acc ttc atg aca ctc gcg gcg att gcc cct cta 1092 Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro Leu 290 295 300 305

gcc gat gga ccc ate acg ata acc aac att ggc cat gea cgg ttg aag 1140 Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu Lys 310 315 320

gaa tcc gac cgc ate tcg gcg atg gaa acc aac ctg cga acg ctc ggt 1188 Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu Gly 325 330 335

gta caa acc gac gtc gga cac gac tgg atg cga ate tac ccc tet acc 1236 Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser Thr 340 345 350

ccg cac ggc ggc aga gtc aat tgc cac cgg gac cac agg ate gcc atg 1284 Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala Met 355 360 365

gcg ttt tca ate ctg gga ctg cga gtg gac ggg att acc ctc gac gac 1332 Ala Phe Ser lie Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp Asp 370 375 380 385

cct caa tgt gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt gga 1380 Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu Gly 390 395 400

cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag tgacttccte 1429 Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410

tccggcggac gctaggcatc gcgtgtctgc cggtacccaa tggttgtcca gattttcatc agcactgtca atggtgtggg

ggaaaacgaa tcctgacatg gcattctgcc ttagcegctt cgggatgttg cctgaccttg ccctgaaggc ggcttcgatg

accgacctcc tcgcgtcacg 1489

ccgcggcccc ttatgctttc 1549

agcagggcaa tcagctgttc 1609

gctgccacgt cggcggctct 1669

"catcgctgtc"àcgàcãcgcã "gatgcgcttc ctgatcctga gccaaggcaa tagttagatg taaggagttt tncgaggcca cccagattcc gaactatggg gtccggatgg aagtgacttt

ataggcacgt tcaggatccg ccctcgtcgc 1729 tgcctccgtt ggcggccaga gccgaagcaa 1789 ccgggtggaa ggcgatatgg gcttcatget 1849 tcaactctgc cca 1892 I.a) Número identificador da seqüência: SEQ ID No: 4

II) Características da seqüência:

II.a) tamanho: 413 II.b) tipo: PRT

II.c) organismo: Arthrobacter globíformis IV) Seqüência: SEQ ID NO. 4

Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu I>eu 20 Leu Ala Ala Ala Ala 25 Lys Gly Thr Ser Val 30 Leu Val Arg Pro Leu 35 Val Ser Ala Asp Thr 40 Ser Ala Phe Lys Thr 45 Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr 100 Val Asp Gly Ser Glu 105 Gln Leu Arg Arg Arg 110 Pro Leu Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln 130 Leu Pro Leu Thr Ile Glu 135 Ala Ser Gly Leu 140 Ala Gly Gly Glu Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln 180 Pro Tyr Leu Thr Met 185 Thr Leu Arg Met Met 190 Arg Asp Phe Gly Leu 195 Glu Thr Ser Thr Asp 200 Gly Ala Thr Val Ser 205 Val Pro Pro Gly Arg 210 Tyr Thr Ala Arg Arg Tyr 215 Glu Ile Glu Pro 220 Asp Ala Ser Thr Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly 260 Arg Leu Gly Ala Glu 265 Val Kis Trp Ala Pro 270 Asn Ser Val Thr Ile 275 Ser Gly Pro Glu Arg 280 Leu Asn Gly Asp Ile 285 Glu Val Asp Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg 325 Ile Ser Ala Met Glu 330 Thr Asn Leu Arg Thr 335 Leu Gly Val Gln Thr 340 Asp Val Gly His Asp 345 Trp Met Arg Ile Tyr 350 Pro Ser Thr Pro Hls Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala 370 Phe Ser Ile Leu Gly Leu 375 Arg Val Asp Gly 380 Ile Thr Leu Asp Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

Gly Arg Eeu Phe "Frõ Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 5

II) Características da seqüência:

II.a) tamanho: 1242 Il.b) tipo: DNA

II.c) organismo: Desconhecido

III) Característica:

III.c) Outras informações: III.a) Nome/Legenda: CDS III.b) Localização: (1)...(

IV) Seqüência: SEQ ID NO. 5

Isolada de uma amostra de solo 1242)

atg gaa act gat cga cta gtg ate cca gga tcg aaa age ate acc aac 48 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 15 10 15

cgg gct ttg ctt ttg gct gcc gea gcg aag ggc gcg tcg gtc ctg gtg 96 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Ala Ser Val Leu Val 20 25 30

aga cca ttg gtc age gcc gat aec tca gea ttc aaa act gea att cag 144 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45

gcc etc ggt gcc aac gtc tca gcg gac ggt gat gat tgg gtc gtt gaa 192 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu 50 55 60

ggc ctg ggc cag gea ccc aac cte gac gcc gac ate tgg tgc gag gat 240 Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp SS 70 75 80

gcc ggt acc gtg gcc cgg ttc etc cct cca ttc gtc gcc gea gga cag 288 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95

ggg aag ttc acc gtc gac gga age gag cag ctg cgg cgg cgc ccg ctt 336 Gly Lys -Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110

cgg ccc gtg gtc gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc 384 Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125

gag cag ctg ccc cta acg att gaa gcg age ggg etg gea ggc ggg gag 432 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140

tac gaa att gaa gcc cat cag age age cag ttc gcc tcc ggt ctg ate 480 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

atg gcc gcc ccg tae gcg cga caa ggc ctg cgt gtt cgg ata cca aat 528 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175

ccc gtg age cag ccc tac etc acg atg aca ctg cgg atg atg agg gac 576 Pro Val Ser Glri Pro Tyx Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190

ttc ggc att gag acc age acc gac gga gcg acc gtc age gtt cct ccc 624 Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205

ggg cgc tac aca gcg cgg cgg tat gag att gaa ccg gac gcg tca act 672 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220

gcg tcg tac ttc gcc gcc gct tcc gcc gtc tet ggc cgg cgc ttc gaa 720 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu 225 230 235 240

ttc cag ggc ctt ggc aca gac age ate caa ggc gac acg tca ttc ttc 768 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255

aat gta ctt ggg cgg etc ggc gea gag gtc cac tgg gea tcc aac tcg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270

gtc acc ata tcc gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864 Val Thr Ile Ser Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285

atg ggc gag ata tcg gac acc ttc atg aca ctg gcg gcg att gcc cct 912 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300

cta gcc gat gga ccc ate acg ata aca aac att ggc cat gea cgg ttg 960 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320

aag gaa tcc gac cgc ate tcg gcg atg gaa age aac ctt cga atg ctc 1008 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Met Leu 325 330 335

ggt gta caa acc gac gtc gga cac gac tgg atg ega ate tac ccc tet 1056 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

acc ccg cac ggc ggc aga gtc aat tgc cac cgg gac cac agg ate gcc 1104 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365

atg gcg ttt tca ate ctg gga ctg cga gtg gac ggg att acc ctc gac 1152 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380

gac cct caa tgt gtc ggg aag ace ttt cct ggc ttc ttc gac tac ett 1200 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt ttc ccg gaa aag gcg ctt acg ctc ccc ggc tag 1242

Gly Axg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410 I.a) Número identificador da seqüência: SEQ ID No: 6

II) Características da seqüência:

II.a) tamanho: 413 II.b) tipo: PRT

II.c) organismo: Desconhecido

III) Característica:

III.c) Outras informações: isolated from soil sample

IV) Seqüência: SEQ ID NO. 6

Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn

15 10 15

Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Ala Ser Val Leu Val

20 25 30

Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln

35 40 45

Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu

50 55 60

Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80

Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln I^k 85 90 95

Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu

100 105 110

Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser

115 120 125

Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu

130 135 140

Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn

165 170 175

Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp

180 185 190

Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro

195 200 205

Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr

210 215 220

Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu 225 230 235 240

Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe

245 250 255

Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser

260 265 270

Val Thr Ile Ser Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp

275 280 285

Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro

290 295 300

Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu κ 305 310 315 320

' Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Met Leu

325 330 335

Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser

340 345 350

Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala

355 360 365

Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp

370 375 380

Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 7

II) Características da seqüência:

II.a) tamanho: 44 6

II.b) tipo: PRT

II.c) organismo: Bacillus clausii

IV) Seqüência: SEQ ID NO. 7

Met Val Gln Phe Asp Ser Gln Ala Arg Ser Pro Tip Thr Pro Leu Ala 1 5 10 15 Gly Val Glu Arg Leu Arg Leu Thr Pro Ser Gln Lys Arg Ile Asn Ala 20 25 30 Thr Leu Glu Val Pro Gly Ser Lys Ser Ala Thr Asn Arg Ala Leu Leu 35 40 45 Leu Ala Ala Val Ala Ser Gly Thr Ser Thr Leu Arg Asn Ala Leu Lys 50 55 60 Ser Asp Asp Thr Tyr Trp Cys Ile Glu Ala Leu Lys Lys Thr Gly Val 65 70 75 80 Glu Ile Ala Val Asp Gly Ser Asn Val Thr Val Tyr Gly Arg Gly Gly 85 90 95 Val Phe His Ser Gly Ser Leu Tyr Ile Gly Ser Ala Gly Thr Ala Gly 100 105 110 Arg Phe Leu Pro Gly Met Leu Taa Ala Ala Thr Gly Asn Trp His Val 115 120 125 Glu Ala Ser His Ser Met Asn Lys Arg Pro Ile Ala Pro Leu Val Lys 130 135 140 Thr Leu Gln Ala Leu Gly Ua Asn Ile Gln Tyr Gly Ser Arg Arg Gly 145 150 155 160 His Tyr Pro Leu Ser Ile Ser Gly Glu Gly Leu Asn Gly Gly Lys Val 165 170 175 Asn Met Ser Gly Gln Leu Ser Ser Gln Phe Ile Ser Gly Cys Leu Leu 180 185 190 Ala Ala Pro Leu Ala Lys Asn Pro Val Ser Ile Thr Val Lys Asp Gly 195 200 205 Ile Val Gln Gln Ala Tyr Val Arg Ile Thr Ile Asp Leu Met Ala Ala 210 215 220 Phe Gly Val Glu Val Lys Ala Ala Pro Asp Trp Ser Leu Leu Glu Val 225 230 235 240 Asn Pro Ser Pro Tyr Val Ala Asn Asp Ile Ala Ile Glu Ala Asp Ala 245 250 255 Ser Thr Ala Cys Tyr Phe Leu Ala Leu Ala Ala Ile Thr Ala Gly Lys 260 265 270 Ile Arg Ile Arg His Phe Ser Thr Lys Thr Ser Gln Pro Asp Ile Leu 275 280 285 Fhe Val Ser Ile Leu Lys Arg Met Gly Cys Asn Phe Glu Ile Gly Pro 290 295 300 Ser Phe Val Glu Gly Glu Gly Pro Thr Arg Leu Arg Gly Gly Phe Thr 305 310 315 320 Val Asn Met Asn Glu Leu Ser Asp Gln Ala Leu Thr Leu Ala Ala Ile 325 330 335 Ser Pro Phe Ala Asp Gly Pro Ile Ala Ile Glu Gly Val Gly His Ile 340 345 350 Arg His His Glu Cys Asp Arg Ile Arg Ala Ile Cys Thr Glu Leu Ser 355 360 365 Arg Leu Gly Ile Arg Val Glu Glu Arg His Asp Gly Leu Thr Val Tyr 370 375 380 Pro Gly Gln Pro Lys Pro Thr Val Val Asn Thr Tyr Asp Asp His Arg 385 390 395 400 Met Ala Met Ala Leu Ala Leu Ile Gly Ala Lys Val Asp Gly Ile Glu 405 410 415 Leu Asp Asp Pro Gly Cys Val Ala Lys Thr Cys Pro Ser Tyr Phe Ser 425 430 Met Leu Ala Gln Thr Gly Ile Gly Val Lys Ala Val Ser Pro 435 440 445 I.a) Número identificador da seqüência: SEQ ID No: 8

II) Características da seqüência:

II.a) tamanho: 4 47

II.b) tipo: PRT

II.c) organismo: Rubrobacer xylanophilus

IV) Seqüência: SEQ ID NO. 8

Met Ser Gly Val Ser Gly Val Pro Gly Val Asp Phe Gly Ile Glu Glu 1 5 10 15 Val Arg Gly Ser Phe Pro Glu Glu Met Glu Val Ala Pro Leu Glu Arg 20 25 30 Pro Pro Asp Ala Thr Val Arg Leu Pro Gly Ser Lys Ser Ile Thr Asn 35 40 45 Arg Ala Leu Leu Val Ala Ala Leu Ala Gly Gly Thr Ser Arg Ile Glu 50 55 60 Asn Pro Leu Leu Ala Asp Asp Pro Phe Trp Leu Met Asn Ala Leu Val 65 70 75 80 Gly Leu Gly Phe Gly Val Arg Val Gly Glu Glu Gly Ala Val Glu Val 85 90 95 Ala Gly Gly Gly Gly Gly Ile Pro Ala Pro Ser Ala Asp Val Phe Val 100 105 110 Gly Asn Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Ala Leu Ala Leu 115 120 125 Gly Ser Gly Pro Tyr Arg Val Asp Gly Thr Pro Arg Met Arg Glu Arg 130 135 140 Pro Val Ala Glu Leu Val Glu Ala Leu Arg Ala Leu Gly Ala Arg Val 145 150 155 160 Glu Cys Glu Glu Arg Glu Gly His Leu Pro Leu Val Val Arg Gly Gly 165 170 175 Ala Arg Gly Gly Gly Glu Ile Ser Val Ser Gly Glu Arg Ser Ser Gln 180 185 190 Phe Leu Ser Gly Leu Leu Ile Ser Ala Pro Cys Leu Pro Gly Gly Leu 195 200 205 Thr Val Arg Pro Arg Gly Ala Leu Val Ser Arg Pro Tyr Val Asp Ile 210 215 220 Thr Val Arg Val Met Arg Ser Phe Gly Ala Ser Val Glu Glu Glu Pro 225 230 235 240 Ser Gly Ala Ala Phe Arg Val Ala Pro Gly Ala Tyr Arg Ala Thr Ala 245 250 255 Tyr Arg Val Glu Pro Asp Ala Ser Ala Ala Ser Tyr Phe Leu Ala Ala 260 265 270 Ala Ala Leu Thr Ala Gly Arg Val Val Ile Pro Gly Leu Gly Arg Ser 275 280 285 Ser Leu Gln Gly Asp Val Ala Phe Ala Gly Ile Leu Arg Arg Met Gly 290 295 300 Cys Arg Val Ser Leu Ser Glu Asp Arg Ile Glu Leu Ala Gly Pro Pro 305 310 315 320 Arg Leu Arg Gly Val Glu Ala Asp Met Asn Ala Ile Ser Asp Thr Met 325 330 335 Met Thr Leu Ala Ala Ile Ala Pro Phe Ala Ser Ser Pro Thr Leu Ile 340 345 350 Lys Asn Val Ala His Thr Arg Leu Gln Glu Thr Asp Arg Leu Ala Ala 355 360 365 Val Ala Ala Glu Leu Ser Arg Leu Gly Val Arg Val His Glu Thr Pro 370 375 380 Asp Ser Leu Arg Ile Ile Pro Gly Lys Val Arg Pro Ala Ala Ile Arg 385 390 395 400 Thr Tyr GTy Asp Hfs Arg Met Ala Met Ala Phe Ser Leu Val Gly Leu

405 410 415

Arg Val Arg Gly Val Arg Ile Leu Asp Pro Gly Cys Val Thr Lys Thr

420 425 430

Leu Pro Gly Tyr Phe Arg Leu Leu Glu Gly Leu Arg Arg Gly Gly 435 440 445 I.a) Número identificador da seqüência: SEQ ID No: 9

II) Características da seqüência:

II.a) tamanho: 44 4 II.b) tipo: PRT

II.c) organismo: Zea mays

IV) Seqüência: SEQ ID NO. 9

Ala Gly Ala Glu Glu Ile Val Leu Gln Pro Ile Lys Glu Ile Ser Gly 1 5 10 15 Thr Val Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu 20 25 30 Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu Asn 35 40 45 Ser Glu Asp Val His Tyr Met Leu Gly Ala Leu Arg Thr Leu Gly Leu 50 55 60 Ser Val Glu Ala Asp Lys Ala Ala Lys Arg Ala Val Val Val Gly Cys 65 70 75 80 Gly Gly Lys Phe Pro Val Glu Asp Ala Lys Glu Glu Val Gln Leu Phe 85 90 95 Leu Gly Asn Ala Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr 100 105 110 Ala Ala Gly Gly Asn Ala Thr Tyr Val Leu Asp Gly Val Pro Arg Met 115 120 125 Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly 130 135 140 Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro Val Arg Val 145 150 155 160 Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly Ser 165 170 175 Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala Ala Pro Leu Ala 180 185 190 Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys Leu Ile Ser Ile Pro 195 200 205 Tyr vai Glu Met Thr Leu Arg Leu Met Glu Arg Phe Gly Val Lys Ala 210 215 220 Glu His Ser Asp Ser Trp Asp Arg Phe Tyr Ile Lys Gly Gly Gln Lys 225 230 235 240 Tyr Lys Ser Pro Lys Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala 245 250 255 Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Gly Thr Val Thr Val 260 265 270 Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala Glu 275 280 285 Val Leu Glu Met Met Gly Ala Lys Val Thr Trp Thr Glu Thr Ser Val 290 295 300 Thr Val Thr Gly Pro Pro Arg Glu Pro Phe Gly Arg Lys His Leu Lys 305 310 315 320 Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr Leu 325 330 335 Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Ala Ile Arg Asp Val 340 345 350 Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Val Ala Ile Arg Thr 355 360 365 Glu Leu Thr Lys Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr Cys "370 —,· -· ' 375 380

Ile Ile Thr Pro Pro Glu Lys Leu Asn Val Thr Ala Ile Asp Thr Tyr 385 390 395 400

Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Glu

405 410 415

Val Pro Val Thr Ile Arg Asp Pro Gly Cys Thr Arg Lys Thr Phe Pro

420 425 430

Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys Asn 435 440 I.a) Número identificador da seqüência: SEQ ID No: 10

II) Características da seqüência:

II.a) tamanho: 4 55 II.b) tipo: PRT

II. c) organismo: Agrobacterium sp. IV) Seqüência: SEQ ID NO. 10

Met Ser His Gly Ala Ser Ser Arg Pro Ala Thr Ala Arg Lys Ser Ser 1 5 10 15 Gly Leu Ser Gly Thr Val Arg Ile Pro Gly Asp Lys Ser Ile Ser His 20 25 30 Arg Ser Phe Met Phe Gly Gly Leu Ala Ser Gly Glu Thr Arg Ile Thr 35 40 45 Gly Leu Leu Glu Gly Glu Asp vai Ile Asn Thr Gly Lys Ala Met Gln 50 55 60 Ala Met Gly Ala Arg Ile Arg Lys Glu Gly Asp Thr Trp Ile Ile Asp 65 70 75 80 Gly Val Gly Asn Gly Gly Leu Leu Ala Pro Glu Ala Pro Leu ASp Phe 85 90 95 Gly Asn Ala Ala Thr Gly Cys Arg Leu Thr Met Gly Leu Val Gly Val 100 105 110 Tyr Asp Phe Asp Ser Thr Phe Ile Gly Asp Ala Ser Leu Thr Lys Arg 115 120 125 Pro Met 130 Gly Arg Val Leu Asn 135 Pro Leu Arg Glu Met 140 Gly Val Gln Val Lys Ser Glu Asp Gly Asp Arg Leu Pro Val Thr Leu Arg Gly Pro Lys 145 150 155 160 Thr Pro Thr Pro Ile 165 Thr Tyr Arg Val Pro 170 Met Ala Ser Ala Gln 175 Val Lys Ser Ala Val Leu Leu Ala Gly Leu Asn Thr Pro Gly Ile Thr Thr 180 185 190 Val Ile Glu 195 Pro Ile Met Thr Arg 200 Asp His Thr Glu Lys 205 Met Leu Gln Gly Phe 210 Gly Ala Asn Leu Thr 215 Val Glu Thr Asp Ala 220 Asp Gly Val Arg Thr Ile Arg Leu Glu Gly Arg Gly Lys Leu Thr Gly Gln Val Ile Asp 225 230 235 240 Val Pro Gly Asp Pro 245 Ser Ser Thr Ala Phe 250 Pro Leu Val Ala Ala 255 Leu Leu Val Pro Gly 260 Ser Asp Val Thr Ile 265 Leu Asn Val Leu Met 270 Asn Pro Thr Arg Thr 275 Gly Leu Ile Leu Thr 280 Leu Gln Glu Met Gly 285 Ala Asp Ile Glu vai Ile Asn Pro Arg Leu Ala Gly Gly Glu Asp Val Ala Asp Leu 290 295 300 Arg Val Arg Ser Ser Thr Leu Lys Gly Val Thr Val Pro Glu Asp Arg 305 310 315 320 Ala Pro Ser Met Ile 325 Asp Glu Tyr Pro Ile 330 Leu Ala Val Ala Ala 335 Ala Phe Ala Glu Gly 340 Ala Thr Val Met Asn 345 Gly Leu Glu Glu Leu 350 Arg Val

Lye"Glu""Ser Asp ArgmIieu Ser Ala Val Ala Asn Gly Leu Lys Leu Asn 355 360 365

Gly Val Asp Cys Asp Glu Gly Glu Thr Ser Leu Val Val Arg Gly Arg

370 375 380

Pro Asp Gly Lys Gly Leu Gly Asn Ala Ser Gly Ala Ala Val Ala Thr 385 390 395 400

His Leu Asp His Arg Ile Ala Met Ser Phe Leu Val Met Gly Leu Val

405 410 415

Ser Glu Asn Pro Val Thr Val Asp Asp Ala Thr Met Ile Ala Thr Ser

420 425 430

Phe Pro Glu Phe Met Asp Leu Met Ala Gly Leu Gly Ala Lys Ile Glu

435 440 445

Leu Ser Asp Thr Lys Ala Ala 450 455 I.a) Número identificador da seqüência: SEQ ID No: 11

II) Características da seqüência:

II.a) tamanho: 427 II.b) tipo: PRT

II.c) organismo: E. coli

IV) Seqüência: SEQ ID NO. 11

Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile 1 5 10 15 Asn Leu Pro Gly Ser Lys Thr Val Ser Asn Arg Ala Leu Leu Leu Ala 20 25 30 Ala Leu Ala Kis Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp 35 40 45 Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr 50 55 60 Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly £5 70 75 80 Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly 85 90 95 Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp 100 105 110 Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His 115 120 125 Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu 130 135 140 Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly 145 150 155 160 Asn Val Asp Val Asp 165 Gly Ser Val Ser Ser 170 Gln Phe Leu Thr Ala Leu 175 Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys 180 185 190 Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met 195 200 205 Lys Thr 210 Phe Gly Val Glu Ile 215 Glu Asn Gln His Tyr 220 Gln Gln Phe Val Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu 225 230 235 240 Gly Asp Ala Ser Ser 245 Ala Ser Tyr Phe Leu 250 Ala Ala Ala Ala Ile Lys 255 Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly 260 265 270 Asp Ile Arg Phe Ala Asp Val Leu GlU Lys Met Gly Ala Thr Ile Cys 275 280 285 Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile 290 295 300 Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr 305 .... - 310 315 320 Ala Ala Leu Phe Taa 325 Lys Gly Thr Thr Arg 330 Leu Arg Asn Ile Tyr Asn 335 Trp Arg Val Lys 340 Glu Thr Asp Arg Leu 345 Phe Ala Met Ala Thr 350 Glu Leu Arg Lys Val 355 Gly Ala Glu Val Glu 360 Glu Gly His Asp Tyr 365 Ile Arg Ile Thr Pro 370 Pro Glu Lys Leu Asn 375 Phe Ala GlU Ile Ala 380 Thr Tyr Asn Asp His Arg Met Ala Met Cys Phe Ser Leu vai Ala Leu Ser Asp Thr Pro 385 390 395 400 Val Thr Ile Leu Asp 405 Pro Lys Cys Thr Ala 410 Lys Thr Phe Pro Asp Tyr 415 Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala

420 425 I.a) Número identificador da seqüência: SEQ ID No: 12

II) Características da seqüência:

II.a) tamanho: 1242

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23 sintético

III.a) Nome/Legenda: CDS

III.b) Localização: (1) ... (1242)

IV) Seqüência: SEQ ID NO. 12

atg gaa act gat cgc ctt gtg ate cca gga tcg aaa age ate acc aac 48 Met Glu Thr Asp Arg Leu Val lie Pro Gly Ser Lys Ser Xle Thr Asn 1 5 10 15

cgg gct ttg ctt ttg gct gcc gea gcg aag ggc acg tcg gtc ctg gtg 96 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30

aga cca ttg gtc age gcc gat acc tca gea ttc aaa act gea ate cag 144 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45

gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60

ggc ctg ggt cag gea ccc cac ctc gac gcc gac ate tgg tgc gag gac 240 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80

gea ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gea ggt cag 288 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95

ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110

cgg ccc ctg gtc gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc 384 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 gag cagf ctg1' ccc" cttT aca' att gaa gcg age ggg ctg gea ggc ggg gag 432 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140

tac gaa att gaa gcc cat cag age age eag tte gcc tec ggc ctg ate 480 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175

ccc gtg tca cag ccc tac etc acg atg aca ctg cgg atg atg agg gac 576 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190

tte ggc ctt gag acc age acc gae gga gcc acc gtc age gtc cct cca 624 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205

ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220

gcg teg tac tte gcc gcc gct tcc gcc gtc tet ggc agg age tte gaa 720 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240

ttt caa ggc ctt ggc aca gac age ate caa ggc gac acg tca tte tte 768 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255

aat gta ctt ggg egg etc ggt gcg gag gtc cac tgg gea ccc aac teg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270

gtc acc ata tet gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864 Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285

atg ggc gag att teg gac acc tte atg aca ctc gcg gcg att gcc cct 912 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300

ttg gcc gat gga ccc ate acg ata acc aac att ggt cat gea cgg ttg 960 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320

aag gaa tcc gac cgc ate tca gcg atg gaa acc aac ctg cgc acg ctc 1008 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335

ggt gta caa acc gac gtc gga cac gac tgg atg aga ate tac ccc tet 1056 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg ate gct 1104 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365

atg gcg ttt tca ate ctg gga ctg aga gtg gac ggg att acc ctc gac 1152

ftét lXla' TtieT "Ser "fie" 'Keu' Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380

gac cct caa tgc gtc ggg aag acc ttt cct ggc tte tte gac tac ctt 1200 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt tte ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410 I.a) Número identificador da seqüência: SEQ ID No: 13

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23 sintético

IV) Seqüência: SEQ ID NO. 13

Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu 35 Val Ser Ala Asp Thr 40 Ser Ala Phe Lys Thr 45 Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe vai Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu

305 310 Lys Glu Ser Asp Arg Ile Ser Ala 325 Gly Val Gln Thr Asp Val Gly His 340 Thr Pro His Gly Gly Arg Val Asn 355 360 Met Ala Phe Ser Ile Leu Gly Leu 370 375 Asp Pro Gln Cys Val Gly Lys Thr 385 390 Gly Arg Leu Phe Pro Glu Lys Ala

405

315 320 Met Glu Thr Asn Leu Arg Thr Leu 330 335 Asp Trp Met Arg Ile Tyr Pro Ser 345 350 Cys His Arg Asp His Arg Ile Ala 365 Arg Val Asp Gly Ile Thr Leu Asp 380 Phe Pro Gly Phe Phe Asp Tyr Leu 395 400 Leu Thr Leu Pro Gly 410 I.a) Número identificador da seqüência: SEQ ID No: 14

II) Características da seqüência:

II.a) tamanho: 1242 II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(acel) III.a) Nome/Legenda: CDS

III.b) Localização: (1)...(1242)

IV) Seqüência: SEQ ID NO. 14

atg gaa act gat cgc ctt gtg ate cca gga tcg aaa age ate acc aac 48 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15

acc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192 Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60

ggc ctg ggt cag gea ccc cac ctc gac gcc gac ate tgg tgc gag gac 24 0 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80

gea ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gea ggt cag 2 88 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95

cgg ccc ctg gtc gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc 3 84 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125

gag cag ctg ccc ctt aca att gaa gcg age ggg ctg gea ggc ggg gag 432 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140

tac gaa att gaa gcc cat cag age age cag ttc gcc tcc ggc ctg ate 480 Tyr Glu lie Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190

ttc ggc ctt gag acc age acc gac gga gcc acc gtc age gtc cct cca 624 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205

gcg tcg tac ttc gcc gcc gct tcc gcc gtc tet ggc agg age ttc gaa 720 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240

ttt caa ggc ctt ggc aca gac age ate caa ggc gac acg tca ttc ttc 768 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255

aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gea ccc aac tcg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270

gtc acc ata act gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864 Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285

atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300

ggt gta caa ace gac gtc gga cac gac tgg atg aga ate tac ccc tet 1056 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

atg gcg ttt tca ate ctg gga ctg aga gtg gac ggg att acc ctc gac 1152 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp

370 375 380

gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410 I.a) Número identificador da seqüência: SEQ ID No: 15

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(acel)

IV) Seqüência: SEQ ID NO. 15 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45 Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 tfal Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285 Ylet Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 jeu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu Ϊ05 310 315 320 jys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 32S 330 335

Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365

Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380

Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 16

II) Características da seqüência:

II.a) tamanho: 1242 Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(ace2) III.a) Nome/Legenda: CDS

III.b) Localização: (1)...(1242)

IV) Seqüência: SEQ ID NO. 16

atg gaa act gat cgc ctt gtg ate cca gga tcg aaa age ate acc aac 48 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 15 10 15

cgg ccc ctg gtc gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc 384 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125

gag cag ctg ccc ctt aca att gaa gcg age ggg ctg gea ggc ggg gag 432 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 tac gaa atY gaa gcc cat cag age age cag ttc gcc tcc ggc ctg ate 480 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

gtc acc ata cgg gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864 Val Thr Ile Arg Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285

atg gcg ttt tca ate ctg gga ctg aga gtg gac ggg att acc ctc gac 1152 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380

jac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200 Àsp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410 I.a) Número identificador da seqüência: SEQ ID No: 17

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(ace2)

ivL. Seqüência : SEQ ID i NO. 17 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 Val Thr Ile Arg Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 345 350 Thr Pro Hls Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala

355 360 365

Met Ala Phe Ser Xle Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp

370 375 380

Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu

385 390 395 400

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 18

II) Características da seqüência:

II.a) tamanho: 1242 II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg51.4 III.a) Nome/Legenda: CDS

III.b) Localização: (1)...(1242)

IV) Seqüência: SEQ ID NO. 18

atg gaa act gat cga cta gtg ate cca gga tcg aaa age ate acc aac 48 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15

aga cca ttg gtc age gcc gat acc tca gea ttc aaa act gea att cag 144 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45

gcc ctc ggt gcc aac gtc tca gcg gac ggt gat gat tgg gtc gtt gaa 192 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu 50 55 60

ggc ctg ggc cag gea ccc aac ctc gac gcc gac ate tgg tgc gag gat 240 Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80

gcc ggt acc gtg gcc cgg ttc ctc cct cca ttc gtc gcc gea gga cag 288 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95

ggg aag ttc acc gtc gac gga age gag cag ctg cgg cgg cgc ccg ctt 336 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110

gag cag ctg ccc cta acg att gaa gcg age ggg ctg gea ggc ggg gag 432 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140

tac gaa att gaa gcc cat cag age age cag ttc gcc tcc ggt ctg ate 480 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 TSO 155 160

atg gcc gcc ccg tac gcg cga caa ggc ctg cgt gtt cgg ata cca aat 528 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Xle Pro Asn 165 170 175

ccc gtg age cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190

ggg cgc tac aca gcg cgg cgg tat gag att gaa ccg gac gcg tca act 672 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Xle Glu Pro Asp Ala Ser Thr 210 215 220

aat gta ctt ggg cgg ctc ggc gea gag gtc cac tgg gea tcc aac tcg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270

gtc acc ata cgc gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864 Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285

aag gaa tcc gac cgc ate tcg gcg atg gaa age aac ctt cga acg ctc 1008 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu 325 330 335

ggt gta caa acc gac gtc gga cac gac tgg atg cga ate tac ccc tet 1056 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

gac cct caa tgt gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt ttc ccg gaa aag gcg ctt acg ctc ccc ggc tag 1242

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410 I.a) Número identificador da seqüência: SEQ ID No:

II) Características da seqüência:

II.a) tamanho: 413 II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg51.4

IV) Seqüência: SEQ ID NO. 19 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu 20 Leu Ala Ala Ala Ala 25 Lys Gly Thr Ser Val 30 Leu Val Arg Pro Leu 35 Val Ser Ala Asp Thr 40 Ser Ala Phe Lys Thr 45 Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp 55 70 75 80 Ala Gly Thr Val Ala Arg 85 Phe Leu Pro Pro 90 Phe Val Ala Ala Gly 95 Gln Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Val 115 Val Asp Gly Ile Arg 120 His Leu Gly Ala Arg 125 Val Ser Ser Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln 180 Pro Tyr Leu Thr Met 185 Thr Leu Arg Met Met 190 Arg Asp Phe Gly Xle 195 Glu Thr Ser Thr Asp 200 Gly Ala Thr Val Ser 205 Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270 Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285 Met Gly 290 Glu Ile Ser Asp Thr 295 Phe Met Thr Leu Ala 300 Ala Ile Ala Pro Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 20

II) Características da seqüência:

II.a) tamanho: 1242

Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(ace3)

III.a) Nome/Legenda: CDS

III.b) Localização: (1)...(1242)

IV) Seqüência: SEQ ID NO. 20

gcc ctc ggt gcc aac gtc tca gcc gac ggt gac gat tgg gtc gtt gaa 192 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu 50 55 60

ggc ctg ggt cag gea ccc aac ctc gac gcc gac ate tgg tgc gag gac 240 Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80

gea ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gea ggt cag 288 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln

85 90 95

tac gaa att gaa gcc cat cag age age cag ttc gcc tcc ggc ctg ate 480 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Xle Pro Asn 165 . 170 175

ttc ggc att gag acc age acc gac gga gcc acc gtc age gtc cct cca 624 Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205

gcg tcg tac ttc gcc gcc gct tcc gcc gtc tet ggc agg cgc ttc gaa 720 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu 225 230 235 240

aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gea tcc aac tcg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270

gtc acc ata cgt gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864 Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285

aag gaa tcc gac cgc ate tca gcg atg gaa age aac ctg cgc acg ctc 10 OE Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu 325 330 335

gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 12 OC Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242

" Sly Xrg Ku IPhett 1Pro" SliT' Lys Ala Leu Thr Leu Pro Gly *

405 410 I.a) Número identificador da seqüência: SEQ ID No: 21

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(ace3) IV) Seqüênci. a: SEQ ID NO. 21 Met Glu Thr Asp Arg Leu vai He Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 14 0 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270 Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 22

II) Características da seqüência:

II.a) tamanho: 1242 Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L5P2.J2) III.a) Nome/Legenda: CDS

III.b) Localização: (1) ... (1242)

IV) Seqüência: SEQ ID NO. 22

cgg gct ttg ctt ttg gct gcc gea gcg aag ggc acg tcg gtc ctg gtg 96 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thsr Ssir Va.1 Leu. Va.1 20 25 30

85 90 95

ggg aag ttc acc ttc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336 Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110

gag cag ctg ccc ctt aca att gaa gcg agt ggg ctg gea ggc ggg gag 432 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140

tac gaa att gaa gcc cat cag age age cag ttc gcc tcc ggc ctg ate 4 80 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

ggg cgc tac aca tcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672 Gly Arg Tyr Thr Ser Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220

gcg tcg tac ttc gcc gcc gct tcc gcc gtc tet ggc agg age ttc gaa 72 0 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240

gtc acc ata act gga ccg gaa agg ctg aac ggc aac att gaa gtg gat 864 Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asn Ile Glu Val Asp 275 280 285

aag gaa tcc gac cgc ate tca gcg atg gaa acc aac ctg cgc acg ctc 100£ Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242

II) Características da seqüência:

II.a) tamanho: 413 II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L5P2.J2)

IV) Seqüência: SEQ ID NO. 23 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu 20 Leu Ala Ala Ala Ala 25 Lys Gly Thr Ser Val 30 Leu Val Arg Pro Leu 35 Val Ser Ala Asp Thr 40 Ser Ala Phe Lys Thr 45 Ala Ile Gln Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Leu 115 Val Asp Gly Ile Arg 120 His Leu Gly Ala Arg 12 5 Val Ser Ser Glu Gln 130 Leu Pro Leu Thr Ile 135 Glu Ala Ser Gly Leu Ala 140 Gly Gly Glu Tyr Glu Xle Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln 180 Pro Tyr Leu Thr Met 185 Thr Leu Arg Met Met 190 Arg Asp Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ser Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly 245 Thr Asp Ser Ile Gln 250 Gly Asp Thr Ser Phe 255 Phe Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asn Ile Glu Val Asp 275 280 285 Met Gly 290 Glu Ile Ser Asp Thr 295 Phe Met Thr Leu Ala Ala 300 Ile Ala Pro Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg 325 Ile Ser Ala Met Glu 330 Thr Asn Leu Arg Thr 335 Leu Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu irè Ur uV IhpP Ilteff' ..·'' ""U a- 395 400 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 24

II) Características da seqüência:

II.a) tamanho: 1242

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(ace4)

III.a) Nome/Legenda: CDS

III.b) Localização: (1)...(1242)

IV) Seqüência: SEQ ID NO. 24

gea ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gea ggt cag 288 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly. Gln

85 90 95

cgg ccc gtg gtc gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc 3 84 Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125

tac gaa att gaa gcc cat cag age age cag ttc gcc tcc ggc ctg ate 480 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160

atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 ccc gtg Tca cag ccc tac etc acg atg aca ctg cgg atg atg agg gac 576 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190

ttc ggc att gag aec age acc gac gga gcc acc gtc age gtc cct cca 624 Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205

aat gta ctt ggg cgg etc ggt gcg gag gtc cac tgg gea tcc aac tcg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270

gtc acc ata cgg gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864 Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285

aag gaa tcc gac cgc ate tca gcg atg gaa age aac ctg cgc acg ctc 1008 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu 325 330 335

atg gcg ttt tca ate ctg gga ctg aga gtg gae ggg att acc ctc gac 1152 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410

1242 I.a) Número identificador da seqüência: SEQ ID No: 25

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(ace4)

IV) Seqüência: SEQ ID NO. 25

Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser 260 265 270 Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 2 95 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly I.a) Número identificador da seqüência: SEQ ID No: 26

II) Características da seqüência:

II.a) tamanho: 1244

Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L3P1.B20) I II.a) Nome/Legenda: CDS

III.b) Localização: (I)... (1242)

IV) Seqüência: SEQ ID NO. 26

gcc etc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60

ggc ctg ggt cag gea ccc cac etc gac gcc gac ate tgg tgc gag gac 240 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80

ggg aag ttc acc gtc gac gga tca gag cag ttg cgg cgg cgc ccg ctt 3 36 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110

cgg ccc ctg gtt gac ggc ate cgc cac ctg ggc gcc cgc gtc tcc tcc 384 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125

ttc ggc ctt gag acc age acc gac gga gcc acc gtc age ate cct cca 624 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Ile Pro Pro 195 200 205

aag gaa tcc gac cgc ate tca gcg atg gaa acc aac ctg cgc acg ctc 10 08 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242

II) Características da seqüência:

II.a) tamanho: 413 II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L3P1.B20)

IV) Seqüência : SEQ ID NO. 27 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala Hls Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Ile Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No: 28

II) Características da seqüência:

II.a) tamanho: 12 4 4 II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L3P1.B3) III.a) Nome/Legenda: CDS

III.b) Localização: (1) ... (1242)

IV) Seqüência: SEQ ID NO. 28

ggc ctg ggt cag gea ccc cac ctc gac gcc cac ate tgg tgc gag gac 240 Gly Leu Gly Gln Ala Pro His Leu Asp Ala His Ile Trp Cys Glu Asp 65 70 75 80

ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 ttc 'ggC "ctt "gag "acc age acc gac gga gcc acc gtc age gtc cct cca 624 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205

ggg cgc tac aca gcc cgg cgg tat aaa ata gaa ccg gat gcg tca act 672 Gly Arg Tyr Thr Ala Arg Arg Tyr Lys Xle Glu Pro Asp Ala Ser Thr 210 215 220

acc ccg cac ggc ggt aga gtg aat tgc cac cga gac cac agg ate gct 1104 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365

gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt ' 1200 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410 I.a) Número identificador da seqüência: SEQ ID No: 2

II) Características da seqüência:

II.a) tamanho: 413 II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L3P1.B3)

IV) Seqüência: SEQ ID NO. 29 Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn Z 5 10 15 Arg Ala Leu Leu 20 Leu Ala Ala Ala Ala 25 Lys Gly Thr Ser Val 30 Leu Val Arg Pro Leu 35 Val Ser Ala Asp Thr 40 Ser Ala Phe Lys Thr 45 Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala His Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr 100 Val Asp Gly Ser Glu 105 Gln Leu Arg Arg Arg 110 Pro Leu Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 14 0 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr 165 Ala Arg Gln Gly Leu 170 Arg Val Arg Ile Pro 175 Asn Pro Val Ser Gln 180 Pro Tyr Leu Thr Met 185 Thr Leu Arg Met Met 190 Arg Asp Phe Gly Leu 195 Glu Thr Ser Thr Asp 200 Gly Ala Thr Val Ser 205 Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Lys Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 Val Thr Xle Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro 405 Glu Lys Ala Leu Thr 410 Leu Pro Gly I.a) Número identificador da seqüência: SEQ ID No: 30

II) Características da seqüência:

II.a) tamanho:1244 II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23 (L3P1.F18) III.a) Nome/Legenda: CDS

III.b) Localização: (1)...(1242)

IV) Seqüência: SEQ ID NO. 30

atg gaa act gat cgc ctt gtg ate cca gga tcg aaa age ate ace aac 48

Met 1 Glu Thr Asp Arg 5 Leu Val Ile Pro Gly 10 Ser Lys Ser Ile Thr 15 Asn cgg Arg gct Ala ttg Leu ctt Leu 20 ttg Leu gct Ala gcc Ala gca Ala gcg Ala 25 aag Lys ggc acg Gly Thr tcg Ser gtc Val 30 ctg Leu gtg Val 96 aga Arg cca Pro ttg Leu 35 gtc Val age Ser gcc Ala gat Asp acc Thr 40 tca Ser gca Ala ttc Phe aaa Lys act Thr 45 gca Ala ate Ile cag Gln 144 gce Ala ctc Leu 50 ggt Gly gcc Ala aac Asn gtc Val tca Ser 55 gcc Ala gac ggt Asp Gly gac Asp aat Asn 60 tgg gtc Trp Val gtt Val gaa Glu 192 ggc Gly 65 ctg ggt Leu Gly cag Gln gca Ala ccc Pro 70 cac His ctc Leu gac Asp gcc Ala gac Asp 75 ate Ile tgg Trp tgc Cys gag Glu gac Asp 80 240 gca Ala ggt act Gly Thr gtg Val gcc Ala 85 cgg Arg ttc Phe ctc Leu cct Pro cca Pro 90 ttc Phe gta Val gcc Ala gca Ala ggt Gly 95 cag Gln 288 ggg Gly aag. Lys ttc Phe acc Thr 100 gtc Val gac Asp gga Gly tca Ser gag Glu 105 cag Gln ctg cgg Leu Arg cgg cgc Arg Arg 110 ccg Pro ctt Leu 336 cgg Arg ccc Pro ctg Leu 115 gtc Val gac Asp ggc Gly ate Ile cgc Arg 120 cac His ctg Leu ggc gcc Gly Ala cgc Arg 125 gtc Val tcc Ser tcc Ser 384 gag Glu cag Gln 130 ctg Leu ccc Pro ctt Leu aca Thr att Ile 135 gaa Glu gcg Ala age Ser ggg ctg Gly Leu 140 gca ggc Ala Gly ggg Gly gag Glu 432 tac Tyr 145 gaa Glu att Ile gaa Glu gcc Ala cat His 150 cag Gln age Ser age Ser cag Gln ttc Phe 155 gcc Ala tcc ggc Ser Gly ctg Leu ate Ile 160 480 atg Met gcc Ala gcc Ala ccg Pro tac Tyr 165 gcg Ala aga Arg caa Gln ggc ctg Gly Leu 170 cgt Arg gtg Val cgg Arg ata Ile cca Pro 175 aat Asn 528

ccc gtg tca cag ccc tac ctc acg atg aca Ctg cgg atg atg agg gac 576 Pro Val Ser Gln Pro Tyx Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190

ttc ggc ctt gag acc age acc gac gga gce acc gtc age gtc cct cca Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro

624 195 200 205

gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg age ttc gaa 720 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240

gtc ate ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864 Val Ile Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285

ggt gta caa acc gac gtc gga cac gac tgg atg aga ate tac ccc tct 1056 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

atg gcg ttt tca ate ctg gga ctg aga gtg gac ggg att acc cte gac 1152 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410

gg 1244 I.a) Número identificador da seqüência: SEQ ID No: 31

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L3P1.F18)

IV) Seqüência: SEQ ID NO. 31

Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val 20 25 30 Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln 35 40 45 Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln 85 90 95 Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu 100 105 110 Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser 115 120 125 Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn 165 170 175 Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp 180 185 190 Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro 195 200 205 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser 260 265 270 Val Ile Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285 Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu 325 330 335 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350 Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala 355 360 365 Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly 405 410 I.a) Número identificador da seqüência: SEQ ID No:

II) Características da seqüência:

II.a) tamanho: 1244

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras, informações: grg23(L3P1.023)

III.a) Nome/Legenda: CDS

III.b) Localização: (1) ... (1242)

IV) Seqüência: SEQ ID NO. 32

ggg~cgc~tãc' aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672 Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220

ttt caa ggc ctt ggc aca gac age ate caa ggc gac acg tca ttt ttc 768 Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe 245 250 255

aat gta ctt ggg cgg etc ggt gcg gag gtc cac tgg gea ccc aac tcg 816 Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser

260 265 270

gtc acc ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864 Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp 275 280 285

ggt gta caa acc gac' gtc gga cac gac tgg atg aga ate tac ccc tct 1056 Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser 340 345 350

gga cgc ctt ttc ccc gaa aag gcg ctt acg ctt ccc ggc tag 1242

Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly * 405 410

gg 1244 I.a) Número identificador da seqüência: SEQ ID No: 33

II) Características da seqüência:

II.a) tamanho: 413

II.b) tipo: PRT

II.c) organismo: Seqüência artificial

III) Característica:

III.c) Outras informações: grg23(L3P1.023)

IV) Seqüência: SEQ ID NO.33 Met Glu Thr Asp His Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn 1 5 10 15 Arg Ala Leu Leu 20 Leu Ala Ala Ala Ala 25 Lys Gly Thr Ser Val 30 Leu Val Arg Pro Leu 35 Val Ser Ala Asp Thr 40 Ser Ala Phe Lys Thr 45 Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu 50 55 60 Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp 65 70 75 80 Ala Gly Thr Val Ala 85 Arg Phe Leu Pro Pro 90 Phe Val Ala Ala Gly 95 Gln Gly Lys Phe Thr 100 Val Asp Gly Ser Glu 105 Gln Leu Arg Arg Arg 110 Pro Leu Arg Pro Leu 115 Val Asp Gly Ile Arg 120 His Leu Gly Ala Arg 125 Val Ser Ser Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu 130 135 140 Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile 145 150 155 160 Met Ala Ala Pro Tyr 165 Ala Arg Gln Gly Leu 170 Arg Val Arg Ile Pro 175 Asn Pro Val Ser Gln 180 Pro Tyr Leu Thr Met 185 Thr Leu Arg Met Met 190 Arg Asp Phe Gly Leu 195 Glu Thr Ser Thr Asp 200 Gly Ala Thr Val Ser 205 Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr 210 215 220 Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu 225 230 235 240 Phe Gln Gly Leu Gly 245 Thr Asp Ser Ile Gln 250 Gly Asp Thr Ser Phe 255 Phe Asn Val Leu Gly 260 Arg Leu Gly Ala Glu 265 Val His Trp Ala Pro 270 Asn Ser Val Thr Xle 275 Ser Gly Pro Glu Arg 280 Leu Asn Gly Asp Ile 285 Glu Val Asp Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro 290 295 300 Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu 305 310 315 320 Lys Glu Ser Asp Arg 325 Ile Ser Ala Met Glu 330 Thr Asn Leu Arg Thr 335 Leu Gly Val Gln Thr 340 Asp Val Gly His Asp 345 Trp Met Arg Ile Tyr 350 Pro Ser Thr Pro His 355 Gly Gly Arg Val Asn 360 Cys His Arg Asp His 365 Arg Ile Ala Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp 370 375 380 Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu 385 390 395 400 Gly Arg Leu Phe Pro 405 Glu Lys Ala Leu Thr 410 Leu Pro Gly

Claims

1. Molécula de ácido nucléico isolada, caracterizada pelo fato de que é selecionada do grupo consistindo de: a) molécula de ácido nucléico compreendendo a seqüência de nucleotideos de SEQ ID NO: 1, 3, ou -5, ou um complemento dessas; b) molécula de ácido nucléico compreendendo a seqüência de nucleotideos tendo ao menos 80% de identidade de seqüência à seqüência de nucleotideos de SEQ ID NO: 1, 3, ou 5, ou um complemento dessas; c) seqüência de nucleotideos de resistência a herbicidas da inserção de DNA do plasmidio depositado com o No. De Acesso NRRL B-30888 ou B- -30949, ou um complemento dessas; d) molécula de ácido nucléico que codifica o polipeptideo compreendendo a seqüência de aminoácidos de SEQ ID N0:2, 4, ou 6; e, e) molécula de ácido nucléico compreendendo a seqüência de nucleotideos codificando um polipeptideo tendo ao menos 80% de identidade de seqüência de aminoácidos à seqüência de aminoácidos de SEQ ID NO:2, 4, ou 6.

2. Molécula de ácido nucléico isolada de acordo com a reivindicação 1, caracterizada pelo fato de que dita seqüência de nucleotideos é uma seqüência sintética que foi projetada para expressão em uma planta.

3. Vetor, caracterizado pelo fato de que compreende a molécula de ácido nucléico como definida na reivindicação 1.

4. Vetor de acordo com a reivindicação 3, caracterizado pelo fato de que compreende ainda uma molécula de ácido nucléico codificando um polipeptideo heterólogo.

5. Célula hospedeira, caracterizada pelo fato de que contém o vetor como definido na reivindicação 3.

6. Célula hospedeira de acordo com a reivindicação 5, caracterizada pelo fato de que é uma célula hospedeira bacteriana.

7. Célula hospedeira de acordo com a reivindicação 5, caracterizada pelo fato de que é uma célula vegetal.

8. Planta transgênica, caracterizada pelo fato de que compreende a célula hospedeira como definida na reivindicação 7.

9. Planta de acordo com a reivindicação 8, caracterizada pelo fato de que dita planta é selecionada do grupo consistindo de milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada, e couve.

10. Semente, caracterizada pelo fato de que é a semente transformada da planta como definida na reivindicação 8.

11. Polipeptideo isolado, caracterizado pelo fato de que é selecionado do grupo consistindo de: a) polipeptideo compreendendo a seqüência de aminoácidos de SEQ ID NO:2, 4, ou 6; b) polipeptideo codificado pela seqüência de nucleotideos de SEQ ID N0:1, 3, ou 5; c) polipeptideo compreendendo a seqüência de aminoácidos tendo pelo menos 80% de identidade de seqüência à seqüência de aminoácidos de SEQ ID N0:2, 4, ou 6, em que dito polipeptideo possui atividade de resistência a herbicidas; d) polipeptideo que é codificado pela seqüência de nucleotideos que é ao menos 80% idêntica à seqüência de nucleotideos de SEQ ID N0:1, 3, ou -5, em que dito polipeptideo possui atividade de resistência a herbicidas; e, e) polipeptideo que codificado pela seqüência de nucleotideos de resistência a herbicidas da inserção de DNA do plasmídio depositado com o No. De Acesso NRRL B-30888 ou B-30949.

12. Polipeptideo de acordo com a reivindicação 11, caracterizado pelo fato de que compreende ainda uma seqüência de aminoácidos heteróloga.

13. Método para produzir um polipeptideo com atividade de resistência a herbicidas, caracterizado pelo fato de que compreende cultivar a célula hospedeira como definida na reivindicação 5 sob condições nas quais uma molécula de ácido nucléico codificando o polipeptideo é expressada, dito polipeptideo sendo selecionado do grupo consistindo de: a) polipeptideo compreendendo a seqüência de aminoácidos de SEQ ID NO:2, 4, ou 6; b) polipeptideo codificado pela seqüência de ácidos nucléicos de SEQ ID NO:l, 3, ou 5; c) polipeptideo compreendendo a seqüência de aminoácidos tendo ao menos 80% de identidade de seqüência a um polipeptideo com a seqüência de aminoácidos de SEQ ID NO:2, 4, ou 6, em que dito polipeptídeo possui atividade de resistência a herbicidas; d) polipeptídeo codificado pela molécula de ácido nucléico compreendendo uma seqüência de nucleotídeos tendo ao menos 80% de identidade de seqüência à seqüência de ácidos nucléicos de SEQ ID NO:l, 3, ou 5, em que dito polipeptídeo possui atividade de resistência a herbicidas; e, e) polipeptídeo que codificado pela seqüência de nucleotídeos de resistência a herbicidas da inserção de DNA insert do plasmídio depositado com o No. De Acesso NRRL B-30888 ou B-30949.

14. Método para conferir resistência a um herbicida para uma planta, caracterizado pelo fato de que compreende transformar dita planta com um constructo de DNA, dito constructo compreendendo um promotor que dirige a expressão em uma célula vegetal operacionalmente ligada com uma seqüência de nucleotídeos pelo menos 80% idêntica à seqüência de nucleotídeos de SEQ ID NO: 1, 3, ou 5, e regenerar uma planta transformada.

15. Método de acordo com a reivindicação 14, caracterizado pelo fato de que dito herbicida é glifosato.

16. Planta, caracterizada pelo fato de que tem estavelmente incorporado em seu genoma um constructo de DNA compreendendo uma seqüência de nucleotídeos que codifica uma proteína tendo atividade de resistência a herbicidas, em que dita seqüência de nucleotídeos é selecionada do grupo consistindo de: a) seqüência de nucleotídeos de SEQ ID NO: 1, 3, ou 5; b) seqüência de nucleotídeos tendo ao menos 80% de identidade de seqüência a uma seqüência de nucleotídeos de SEQ ID NO: 1, 3, ou 5, em que dita seqüência de nucleotídeos codifica um polipeptídeo tendo atividade de resistência a herbicidas; c) seqüência de nucleotídeos codificando o polipeptídeo compreendendo uma seqüência de aminoácidos de SEQ ID NO: 2, 4, ou 6; d) seqüência de nucleotídeos codificando o polipeptídeo tendo ao menos 80% de identidade de seqüência de aminoácidos à seqüência de aminoácidos de SEQ ID NO: 2, 4, ou 6, em que dito polipeptídeo possui atividade de resistência a herbicidas; e, e) seqüência de nucleotídeos de resistência a herbicidas da inserção de DNA do plasmídio depositado com o No. de acesso NRRL B-30888 ou B- -3094 9; em que dita seqüência de nucleotideos é operacionalmente ligada a um promotor que dirige

17. Planta de acordo com a reivindicação 16, caracterizada pelo fato de que dita planta é uma célula vegetal.

18. Molécula de ácido nucléico isolada, caracterizada pelo fato de que codifica a enzima EPSPS resistente ao glifosato, em que dita enzima EPSPS resistente a glifosato possui uma Km para fosfoenolpiruvato (PEP) entre cerca de 1 e cerca de 150uM e uma Kj (glifosato)/ Km (PEP) entre cerca de 500 e cerca de 1000.

19. Planta, caracterizada pelo fato de que tem estavelmente incorporado em seu genoma o constructo de DNA compreendendo uma seqüência de nucleotideos que codifica um polipeptideo EPSPS, dito polipeptideo EPSPS tendo uma Km para PEP entre cerca de 1 e cerca de 150uM e uma Kj (glifosato) / Km (PEP) entre cerca de 500 e cerca de 1000, dita planta exibindo tolerância a herbicida glifosato.

20. Planta de acordo com a reivindicação 19, caracterizada pelo fato de que dita planta é uma planta de soja.

21. Planta de acordo com a reivindicação 19, caracterizada pelo fato de que dita planta é uma planta de milho.

22. Planta de acordo com a reivindicação 19, caracterizada pelo fato de que dita planta é selecionada do grupo consistindo de milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada, e couve.

23. Método para medir a liberação de fosfato por uma enzima, caracterizado pelo fato de que compreende incubar dita enzima na presença de um substrato da enzima e um ou mais componentes de reação selecionados do grupo consistindo de: a) xantina oxidase a uma concentração de pelo menos -1 U/ml; b) purina nucleosideo fosforilase a uma concentração maior do que 0,1 U/ml; e, c) N-acetil-3,7-dihidroxifenoxacina a uma concentração maior do que 100 μΜ; por onde a liberação de fosfato é associada com a formação do composto fluorescente resorufina.

24. Método de acordo com a reivindicação 23, caracterizado pelo fato de que dita enzima é EPSPS.