BRPI0610520A2

BRPI0610520A2 - polinucleotìdeo, vetor, constructo de dna recombinante, processos para transformar uma célula hospedeira, para conferir ou aperfeiçoar a resistência a colletotrichum e a podridão do colmo, para alterar o nìvel de expressão de uma proteìna capaz de conferir resistência a colletotrichum e a podridão do colmo de identifição de plantas resistentes a colletotrichum, para determinar a presença ou ausência do lócus de rcg1, sistema de computador para identificar uma planta resistente a infecção por colletotrichum, marcador genético, métodos para a produção de planta e de um produto de milho, e usos

Info

Publication number: BRPI0610520A2
Application number: BRPI0610520-3A
Authority: BR
Inventors: Karen E Broglie; Karlene H Butler; Marymar G Butruille; Alexandre Da Silva Conceicao; Travis J Frey; James A Hawk; Jennifer S Jaqueth; Elizabeth S Jones; Dilbag S Multani; Petra J Wolters
Original assignee: Du Pont; Univ Delaware; Pioneer Hi Bred Int
Priority date: 2005-04-04
Filing date: 2006-04-04
Publication date: 2010-06-22
Also published as: US20180112280A1; US20080072341A1; WO2006107931A3; MX2007012302A; US20090035765A1; US20080016595A1; US8884126B2; US20060225151A1; US9884896B2; CA2604351A1; US8084671B2; BRPI0610520B1; EP1874935B2; US20060223102A1; WO2006107931A2; CA2604351C; EP1874935B1; US20160201079A1; US20080022426A1; US7619133B2

Abstract

A presente invenção refere-se a seqfiências de polinucleotídeos que codificam um gene, o qual confere resistência ao patógeno de planta Colletotrichum, o qual causa podridão de caule por antracnose, ressecamento de folha e doença nas pontas em milho e outros cereais. A invenção refere-se ainda a plantas e sementes contendo genes quiméricos que compreendem as referidas seqüências de polinucleotídeos, as quais aumentam ou conferem resistência ao patógeno de planta Colletotrichum, e a processos de produção das referidas plantas e sementes. A invenção refere-se ainda a seqüências que podem ser usadas como marcadores moleculares, os quais são úteis na identificação da região de interesse em linhagens de milho, resultantes de novas cruzas e que podem rápida e eficazmente introgredir o gene de linhagens de milho contendo o referido gene em outras linhagens de milho que não contêm o referido gene, de modo a torná-las resistentes ao Colletotrichum e resistentes à podridão de caule.

Description

POLINUCLEOTÍDEOS E PROCESSOS DE PRODUÇÃO DE PLANTASRESISTENTES A PATOGENOS DE FUNGOS

CAMPO DA INVENÇÃO

Esta invenção se refere às composições e métodosutilizáveis na criação ou aperfeiçoamento de resistência apatógeno em plantas. Adicionalmente, a invenção refere-se aplantas que tenham sido geneticamente engenheiradas com ascomposições da invenção.

FUNDAMENTOS DA INVENÇÃO

Colletotrichum graminicola (Ces) (Cg), mais comumenteconhecido como antracnose, é o agente causador da queimadas folhas por antracnose, podridão de colmo por antracnose(ASR) e morte descendente que afeta Zea mays (L.), tambémconhecida como milho {maize ou com) . É a única podridão decolmo comum conhecida que também causa uma queima dasfolhas (Bergstrom, et al. , (1999), Plant Disease, 83:596-608, White, D.G. (1998), Compendium of Com Diseases, pp.1-78). Sabe-se que ela ocorre nos Estados Unidos desde 1855e ela tem sido relatada nas Américas, Europa, África, Ásiae Austrália (McGee, D.C. (1988), Maize Diseases: AReference Source for Seed Technologists, APS Press, St.Paul, MN; White, (1998) acima mencionado; White, et al.,(1979) Proc. Annu. Com Sorghum Res Conf (34th) , 1-15).Somente nos Estados Unidos, mais de 37,5 milhões de acressão infestados anualmente com perdas médias de produção de6,6% em todo o Pais (ver Figura 1) . As perdas de produçãosão devidas tanto ao baixo peso de grão em plantasinfectadas como ao acamamento, ou seja, a murcha dasplantas devida à fraqueza nos colmos causada pela infecção(Dodd, J., (1980), Plant Disease, 64:533-537). As plantasacamadas são mais difíceis de colher e são susceptíveis aoutras doenças. Tipicamente após a infecção, a partesuperior do colmo morre primeiramente enquanto o colmo maisbaixo ainda está verde. Externamente, a infecção pode serreconhecida por placas manchadas de preto no anel maisexterno do colmo, enquanto internamente o tecido da medulada planta fica com aparência descolorida ou preta. Ainoculação ocorre por inúmeras maneiras. As raizes podemcrescer através dos fragmentos do colmo e se tornareminfectadas. Isso se torna um problema crescente na medidaem que os métodos de agricultura de plantio direto são maisamplamente adotados devido aos seus benefícios ambientais.O fungo pode também infectar os colmos através de dano porinseto e outras feridas (ver White (1998) acima). Ainfecção do colmo pode ser precedida pela infecção da folhaque causa a queima da folha e prove o inóculo para ainfecção do colmo. Há controvérsia na literatura técnicacom referência ao número de diferentes variedades ou raçasde Cg presentes na natureza. O patógeno é transmitido pelovento ou por lotes de semente contaminada. Os esporospermanecem viáveis por até 2 anos (ver McGee (1988) acimamencionado; Nicholson, et al., (1980), Phytopathology,70:255-261; Warren, H.L. (1977), Phytopathology, 67:160-162; Warren, et al., (1975), Phytopathology, 65:620-623).Os agricultores podem combater a infecção por doençasfúngicas de milho, tal como a antracnose, através do uso defungicidas, mas estes apresentam efeitos ambientaisadversos e requerem o monitoramento de campos e técnicas dediagnóstico para determinar qual o fungo que está cusando ainfecção de modo que o fungicida correto possa ser usado.Particularmente, para lavouras em campos amplos, tal como ado milho, isto é dificil. O uso de linhagens que portamfontes genéticas ou transgênicas de resistência é maisprática se os genes responsáveis pela resistência puderemser incorporados em um germoplasma elite de altaprodutividade sem reduzir a produção. As fontes genéticasde resistência a Cg têm sido relatadas. Foram identificadasdiversas linhagens de milho que portam algum nivel deresistência a Cg (ver White et al. (1979) acima). Estasincluem A556, MP305, H21, SP288, CI88A e FR16. Uma análisedo tipo testcross de translocação reciproca usando a A556indicou que os genes que controlam a resistência comrelação à posição ASR estão nos longos ramos doscromossomos 1, 4 e 8, assim como em ambos os ramos docromossomo 6 (Carson, M.L. (1981), Sources of inheritanceof resistance to anthracnose stalk rot of com. Ph.D.Thesis, University of Illinois, Urbana-Champaign). Aintrogressão de resistência derivada de tais linhagens écomplexa. Foi relatado que uma outra endogâmica, a LB31,porta um único gene dominante que controla a resistênciarelativa a ASR, mas parece ser instável, especialmente napresença de infestação de broca de milho Europeu (Badu-Apraku et al., (1987) Phytopathology 11 : 957-959). Foiverificado que a linhagen MP305 porta dois genes dominantespara resistência, um com um efeito maior e um com efeitomenor (Carson (1981) acima). A MP305 foi tornada disponívelpel Universidade do Mississipe através do Sistema Nacionalde Germoplasma de Planta (GRIN ID: NSL 250298) operado peloDepartamento de Agricultura dos Estados Unidos. VerCompilação de Germoplasma de Melhoramento de Milho NorteAmericano, J.T. Gerdes et al., Crop Science Society ofAmerica, 1993. A semente de MP305 pode ser obtida atravésde Paul Williams, Geneticista Supervisor de Pesquisa USDA-ARS, "Corn Host Plant Resistance Research Unit", Box 9555,340 Dorman Hall, Mississippi State, MS 39762.

Foi relatado que há dois genes ligados no ramo longodo cromossomo 4 que confere resistência a Cg (Toman, etal., (1993), Phytopathology, 83: 981-986; Cowen, N et al.(1991) Maize Genetics Conference Abstracts 33). Foi tambémrelatada a existência de um lócus de caractere quantitativo(QTL) de significativa resistência no cromossomo 4 (Jung,et al., (1994), Theoretical and Applied Genetics, 89:413-418). Jung et al. (acima) relatou que o UMC15 pode serusado para selecionar o QTL no cromossomo 4 na MP305 esugeriu que o QTL está em uma região 12cM do cromossomo 4entre o UMC15 e o UMC66. De fato, como discutido em maioresdetalhes mais adiante, a região entre o UMC15 e o UMC66,como relatado no mapa genético neighbors 4 IBM2, é deaproximadamente 129 cM, e a seleção com relação ao QTL, namaneira sugerida por Jung et al. (1994, acima), seria, namelhor das hipóteses, selecionar um grande intervalocromossômico com considerável arraste de ligação e efeitofenotipico negativo, e, na pior das hipóteses, umarecombinação dupla poderia ocorrer entre os dois marcadoresresultando em uma seleção falso positiva para o lócus deRegi.

Muito trabalho tem sido feito no mecanismo deresistência à doença em plantas em geral. Alguns mecanismosde resistência são não-patogênicos específicos pornatureza, ou a chamada "resistência de não-hospedeiro".Esses podem estar baseados na estrutura da parede celularou mecanismos de proteção similares. Entretanto, apesar deem algumas plantas estar ausente um sistema imunológico comanticorpos circulantes e os outros atributos de um sistemaimunológico de mamífero, elas possuem outros mecanismospara se proteger especificamente contra patógenos. O maisimportante e mais estudado desses mecanismos é o dos genesde resistência da planta a doenças, ou genes "R". Uma dasmuitas revisões deste mecanismo de resistência e os genes Rpode ser encontrada em Bekhadir et al., (2004), CurrentOpinion in Plant Biology 7:391-399. Há cinco classesconhecidas de genes R: proteínas intracelulares com umsitio de ligação a nucleotideo (NBS) e uma repetição ricaem leucina (LRR); proteínas transmembrana com um domínioextracelular LRR (TM-LRR); LRR transmembrana e extracelularcom um domínio quinase citoplásmica (TM-CK-LRR) ; proteínasustentada no sinal de membrana com um dominio citoplásmicoespiral-espiralada (MSAP-CC); e quinases associadas amembrana com um sitio de miristilação N-terminal (MAK-N)(ver, por exemplo: Cohn, et al., (2001), Immunology, 13:55-62; Dangl, et al. (2001), Nature, 411:826-833).

O gene de resistência das concretizações da presenteinvenção codifica um novo gene R relacionado ao tipo NBS-LRR. Apesar de múltiplos genes NBS-LRR terem sidodescritos, eles diferem amplamente em sua resposta adiferentes patógenos e ação exata. No conhecimento doDepositante, o novo gene R aqui descrito é o único quecomprovadamente prove resistência a Cg.

SUMÁRIO DA INVENÇÃO

As concretizações desta invenção estão baseadas nomapeamento refinado, clonagem e caracterização do generesponsável pela maior porção do fenótipo de resistência apartir da linhagem MP305, na introgressão de um intervalocromossômico truncado com o lócus de resistência de MP305em outras linhagens com pouco ou nenhum arraste de genes,na demonstração do uso daquele gene como um transgene e nouso de marcadores moleculares para mover o gene ou otransgene para dentro das linhagens elite usando técnicasde melhoramento.

As concretizações incluem um polinucleotídeo isoladocompreendendo uma seqüência de nucleotideos codificante deum polipeptideo capaz de conferir resistência aColletotrichum, sendo que o polipeptideo possui umaseqüência de aminoácidos de pelo menos 50%, pelo menos 75%,pelo menos 80%, pelo menos 85%, pelo menos 90%, e pelomenos 95% de identidade, quando comparada com a SEQ ID No:3ou as seqüências depositadas junto à Agricultural ResearchService (ARS) Culture Collection em 22 de fevereiro de2006, como Depósito de Patente No. NRRL B-30895, com baseno algoritmo de alinhamento de Needleman-Wunsch, ou umcomplemento da seqüência de nucleotideos, sendo que ocomplemento e a seqüência de nucleotideos são compostos domesmo número de nucleotideos e são 100% complementares.

Concretizações adicionais da presente invenção incluemum vetor compreendendo o polinucleotideo de umaconcretização da presente invenção, tal como a SEQ ID No:3,ou as seqüências do plasmidio depositado como Depósito dePatente No. NRRL-30895, e um constructo de DNA recombinantecompreendendo o polinucleotideo de uma concretização dapresente invenção operacionalmente ligado a pelo menos umaseqüência de regulação. Uma célula de planta, bem como umaplanta, cada uma compreendendo o constructo de DNArecombinante de uma concretização da presente invenção, euma semente compreendendo o constructo de DNA recombinanteque também são concretizados pela presente invenção.

Os métodos concretizados pela presente invençãoincluem: (1) um método para transformar uma célulahospedeira, incluindo uma célula de planta, compreendendo atransformação da célula hospedeira com o polinucleotideo deuma concretização da presente invenção e regeneração de umaplanta a partir da célula de planta transformada, e (3)métodos para conferir ou melhorar a resistência aColletotrichum e/ou podridão do colmo, compreendendo atransformação de uma planta com o constructo de DNArecorabinante de uma concretização da presente invenção,conferindo e/ou melhorando, por esse meio, a resistência aColletotrichum ou à podridão do colmo.

Concretizações adicionais incluem métodos dedeterminação da presença ou ausência dos polinucleotideosde uma concretização da presente invenção, ou o lócus doRegi, em uma planta de milho, compreendendo pelo menos umdentre: (a) isolar moléculas de ácido nucléico a partir daplanta de milho e determinar se um gene Regi está presenteou ausente pela amplificação de seqüências homólogas aopolinucleotideo, (b) isolar moléculas de ácido nucléico apartir da planta de milho e realizar uma hibridizaçãoSouthern, (c) isolar proteínas a partir da planta de milhoe realizar um western blot usando anticorpos para aproteína Regi, (d) isolar proteínas a partir da planta demilho e realizar um ensaio ELISA usando anticorpos para aproteína Regi, ou (e) demonstrar a presença de seqüênciasde mRNA derivadas do transcripto de mRNA de Regi e únicopara o Regi, determinando, por esse meio a presença dopolinucleotideo ou do lócus de Regi na planta de milho.

Também são concretizados pela presente invenção osmétodos para alterar o nivel de expressão de uma proteínacapaz de conferir resistência a Colletotrichum ou àpodridão do colmo em uma planta ou célula de plantacompreendendo: (a) transformar uma célula de planta com oconstructo de DNA recombinante de uma concretização dapresente invenção e (b) deixar crescer a célula de plantatransformada sob condições que são apropriadas paraexpressão do constructo de DNA recombinante, sendo que aexpressão do constructo de DNA recombinante resulta naprodução de níveis alterados de uma proteína capaz deconferir resistência a Colletotrichum ou à podridão docolmo no hospedeiro transformado.

Um método adicional concretizado pela presenteinvenção é um método para conferir ou melhorar aresistência a Colletotrichum e/ou podridão do colmo em umaplanta de milho, compreendendo: (a) cruzar uma primeiraplanta de milho em que está ausente o lócus de Regi com umasegunda planta de milho contendo o lócus de Regi paraproduzir uma população segregante, (b) realizar o screeningda população segregante com relação a um membro contendo olócus de Regi com um primeiro ácido nucléico, não incluindoo UMC15a ou o UMC66, capaz de hibridizar com um segundoácido nucléico ligado a ou localizado dentro do lócus deRegi, e (c) selecionar um membro para posterior cruzamentoe seleção.

São também concretizações da presente invenção osmétodos para melhorar a resistência a Colletotrichum e/oupodridão do colmo, ou para fazer a introgressão deresistência a Colletotrichum e/ou podridão do colmo em umaplanta de milho, compreendendo a realização da seleçãoassistida por marcador da planta de milho com um marcadorde ácido nucléico, sendo que o marcador de ácido nucléicoespecificamente hibridiza com uma molécula de ácidonucléico tendo uma primeira seqüência de ácido nucléico queestá ligada a uma segunda seqüência de ácido nucléico queestá localizada no lócus de Regi da MP305 e selecionar aplanta de milho com base na seleção assistida por marcador.Os marcadores específicos FLP, MZA e o SNP especifico deRegi aqui revelados são aspectos adicionais da invenção.

As concretizações adicionais são: uma fonte doadoraaperfeiçoada de germoplasma para realizar a introgressão deresistência ou melhorar a resistência a Colletotrichum ou àpodridão do colmo em uma planta de milho, dito germoplasmacompreendendo a DE811ASR (BC5) e progênie derivada damesma. A dita progênie pode ser ainda caracterizada comocontendo as seqüências de Regi da DE811ASR (BC5) aquireveladas, os marcadores moleculares em ou geneticamenteligados ao Regi, resistência ou resistência aperfeiçoada aColletotrichum ou quaisquer combinações das mesmas.

As concretizações adicionais incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção dos alelos de pelo menos 2 marcadores na planta demilho, sendo que pelo menos um dos marcadores está em oudentro do intervalo cromossômico abaixo do UMC2041 e acimado gene Regi, e pelo menos um dos marcadores está em oudentro do intervalo abaixo do gene Regi e acima do UMC2200.

As concretizações adicionais incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção de alelos de pelo menos 2 marcadores na planta demilho, sendo que pelo menos um dos marcadores está em oudentro do intervalo cromossômico abaixo do UMC2041 e acimado gene Regi, e pelo menos um dos marcadores está em oudentro do intervalo abaixo do gene Regi e acima do UMC2200.Concretizações semelhantes englobadas por este processoincluem pelo menos um dos marcadores estando em ou dentrodo intervalo cromossômico abaixo do UMC1086 e acima do geneRegi, em ou dentro do intervalo cromossômico abaixo doUMC2285 e acima do gene Regi, e pelo menos um dosmarcadores está em ou dentro do intervalo abaixo do geneRegi e acima do UMC2200, em ou dentro do intervalo abaixodo gene Regi e acima do UMC2187, ou em ou dentro dointervalo abaixo do gene Regi e acima do UMC15a.Concretizações adicionais relacionadas ao mesmo processoincluem aquelas em que pelo menos um dos marcadores é capazde detectar um polimorfismo localizado em uma posiçãocorrespondente aos nucleotideos 7230 e 7535 da SEQ ID No:137, nucleotideos 11293 e 12553 da SEQ ID No: 173,nucleotideos 25412 e 29086 da SEQ ID No: 137, ounucleotideos 43017 e 50330 da SEQ ID No: 137.Concretizações adicionais incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção de alelos de pelo menos 2 marcadores na planta demilho, sendo que pelo menos um dos marcadores em ou dentrodo intervalo cromossômico abaixo do UMC2041 e acima do geneRegi é selecionado dos marcadores listados na Tabela 16, epelo menos um dos marcadores em ou dentro do intervaloabaixo do gene Regi e acima do UMC2200 é também selecionadodos marcadores listados na Tabela 16. As concretizaçõesincluem processos para identificar plantas de milho queapresentam resistência recentemente conferida ou melhoradaa Colletotrichum pela seleção de pelo menos quatromarcadores ou pelo menos seis, sendo que pelo menos dois outrês dos marcadores estão em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, e pelomenos dois ou três dos marcadores estão em ou dentro dointervalo abaixo do gene Regi e acima do ÜMC2200.Concretizações adicionais incluem este mesmo processoquando os dois ou três marcadores em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, bemcomo os dois ou três marcadores em ou dentro do intervaloabaixo do gene Regi e acima do UMC2200, são selecionadosdaqueles listados na Tabela 16. Uma outra concretizaçãodeste processo inclui a detecção do alelo 7 no MZA1112,detecção do alelo 2 no MZA2591, ou detecção do alelo 8 noMZA3434. As plantas e sementes de milho produzidas pelosprocessos concretizados são também concretizações dainvenção, incluindo aquelas plantas de milho que nãocompreendem alelos iguais aos da MP305 em ou acima doUMC2041, ou em ou abaixo do UMC2200 nos lócus mostrados naTabela 16.

Outras concretizações incluem processos paraidentificar plantas de milho que apresentam resistênciarecentemente conferida ou melhorada a Colletotrichum peladetecção de alelos de pelo menos dois marcadores na plantade milho, sendo que pelo menos um dos marcadores está em oudentro do intervalo cromossômico abaixo do UMC2041 e acimado gene Regi, e pelo menos um dos marcadores está em oudentro do intervalo abaixo do gene Regi e acima do UMC2200,e quando o processo detecta a presença ou ausência de pelomenos um marcador localizado dentro do gene Regi. Talconcretização adicional inclui uma modificação desteprocesso na qual quatro marcadores são selecionados, em quedois dos marcadores estão dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos doisdos marcadores estão dentro do intervalo abaixo do geneRegi e acima do UMC15a. Uma concretização adicional desteprocesso inclui o gene Regi que tenha sido introgredido apartir de uma planta de milho doadora, incluindo a MP305 oua DE811ASR(BC5), em uma planta de milho receptora paraproduzir uma planta de milho introgredida. Este processotambém inclui a possibilidade de quando a planta de milhointrogredida for selecionada para um evento de recombinaçãoabaixo do gene Regi e acima do UMClõa, de modo que a plantade milho introgredida retenha o primeiro intervalocromossômico derivado da MP305 abaixo do gene Regi e acimado UMC15a, e não retenha um segundo intervalo cromossômicoderivado da MP305 em ou abaixo do UMC15a. As plantas esementes de milho produzidas por esses processos são tambémconcretizações da invenção. As plantas de milhointrogredidas concretizadas pela invenção incluem aquelasque são conversões de lócus de Regi de PH705, PH5W4, PH51Kou PH87P, ou progênie das mesmas.

Uma concretização adicional da invenção é um processode identificação de uma planta de milho que apresentaresistência melhorada a infecção por Colletotrichum, peladetecção, na planta de milho, da presença ou ausência depelo menos um marcador no lócus do Regi, e seleção daplanta de milho na qual pelo menos um marcador estápresente. As concretizações incluem aquelas quando pelomenos um marcador está em ou dentro da SEQ ID No: 137, etambém quando o pelo menos um marcador é capaz de detectarum polimorfismo localizado em uma posição na SEQ ID No:137correspondente . à posição entre os nucleotideos 1 e 536,entre os nucleotideos 7230 e 7535, entre os nucleotideos11293 e 12553, entre os nucleotideos 25412 e 29086; e entreos nucleotideos 43017 e 50330, e também quando pelo menosum marcador está em ou dentro da seqüência codificante deRegi, ou localizado em ou dentro do polinucleotideoapresentado na SEQ ID NO: 1. Uma outra concretização incluiaquela quando o processo detecta um único polimorfismo denucleotideo em uma posição na SEQ ID No:l correspondente auma ou mais das posições 413, 958, 971, 1099, 1154, 1235,1250, 1308, 1607, 2001, 2598, e 3342. Os marcadoresincluídos pelos processos dessas concretizações incluem osmarcadores de SNP C00060-01 e C00060-02, marcadores quedetectam uma seqüência de mRNA derivada do transcripto demRNA do Regi e única para Regi, e marcadores de FLP em umamplicon gerado por um par de primers apresentado nestadescrição, tais como aqueles das SEQ ID Nos: 35-42, e seuscomplementos. Uma outra concretização inclui aquela quandoo processo detecta a presença ou ausência de pelo menosdois marcadores dentro do lócus de Regi, incluindo oC00060-01 e o C00060-02. As plantas e sementes de milhoproduzidas por esses processos são também concretizações dainvenção. Plantas de milho introgredidas concretizadas pelainvenção incluem aquelas que são conversões do lócus deRegi da PH705, PH5W4, PH51K ou PH87P, ou progênie dasmesmas. Tais concretizações incluem semente de milhocompreendendo um primeiro intervalo cromossômico derivadoda MP305 definido por BNLG2162 e UMC1051, e nãocompreendendo um segundo intervalo cromossômico derivado daMP305 acima do UMC2041 ou abaixo do UMC1051, e quando asemente de milho compreende o gene de Regi e, quandocrescida, produz uma planta de milho que apresentaresistência à infecção por Colletotrichum. Sementes dasconcretizações também incluem semente de milhocompreendendo um primeiro intervalo cromossômico derivadoda MP305 entre, mas não incluindo, o UMC2285 e o UMC15a, enão compreendendo um segundo intervalo cromossômicoderivado da MP305 em ou acima do UMC2285 ou em ou abaixo doUMC15a, e, além disso, tal semente de milho que compreendeo gene Regi e, quando crescida, produz uma planta de milhoque apresenta resistência à infecção por Colletotrichum. Asplantas e células de planta de milho oriundas desta sementeestão também incluídas nas concretizações da invenção.

Concretizações adicionais incluem semente de umavariedade de milho designada DE811ASR(BC5) , ou a semente demilho depositada como número de acesso ATCC PTA-7434, ouuma semente de progênie derivada a partir daquelavariedade, que compreende o gene Regi, que quando crescida,produz uma planta que apresenta resistência melhorada ourecentemente conferida a infecção por Colletotrichum. Asplantas e células de planta crescidas a partir destasemente são também concretizações, assim como a semente daprogênie que retém um primeiro intervalo cromossômicoderivado da MP305 ou da DE811ASR(BC5) dentro, mas nãoincluindo, o UMC2285 e o UMC15a, e a semente da progênieque não compreende um segundo intervalo cromossômico daMP305 em ou acima do UMC2285 ou em ou abaixo do UMC15a. Asplantas e células de planta da semente acima estãoincluídas como concretizações. A semente da progênie que éuma conversão do lócus de Regi da PH705, PH5W4, PH51K ouPH87P, ou uma progênie das mesmas é também concretizada nainvenção, assim como o são as sementes da progênie quecompreendem pelo menos dois ou mais dos alelos 7 naMZA11123, alelo 2 na MZA2591, ou alelo 8 na MZA3434. Asconcretizações adicionais incluem a semente da progênie quecompreende um nucleotídeo citosina na MZA2591.32, umnucleotideo timina na MZA2591.35, e um nucleotideo citosinana MZA3434.17.Concretizações adicionais incluem um sistema decomputador para identificar uma planta de milho queapresenta resistência recentemente conferida ou melhorada ainfecção por Colletotrichum compreendendo uma base de dadosque compreende uma informação de escore de alelo para umaou mais plantas de milho com relação a quatro ou mais lócusde marcador que estão proximamente ligados a ou dentro dolócus de Regi, e instruções que examinam a dita base dedados para determinar a herança do intervalo cromossômicoou porções do mesmo definido para quatro ou mais lócus demarcador e computar se sim ou se não uma ou mais plantas demilho compreende o gene Regi. Concretizações adicionaisincluem um sistema de computador para identificar umaplanta de milho que apresenta resistência recentementeconferida ou melhorada para infecção por Colletotrichumcompreendendo uma base de dados que compreende informaçãode escore de alelos para uma ou mais plantas de milho comrelação a um ou mais lócus de marcador dentro do lócus deRegi, e instruções que examinam dita base de dados paradeterminar a herança do lócus de Regi. A informação deescore de alelos para uma ou mais plantas de milho paratais sistemas de computador podem adicionalmentecompreender dois, três, ou mais lócus de marcador dentro dolócus de Regi.

As concretizações também incluem marcadores em oudentro das SEQ ID Nos: 140 até 146 para a MZA3434, MZA2591,MZA11123, MZA15842, MZA1851, MZA8761 e MZA11455,respectivamente. Outras concretizações incluem marcadoresgenéticos localizados em ou no lócus de Regi ou no geneRegi, incluindo aquelas localizadas na SEQ ID No: 137, porexemplo, aquelas localizadas nas regiões correspondentesaos nucleotideos entre 1 e 536, entre 7230 e 7535, entre11293 e 12553, entre 25412 e 29086, e a região entre osnucleotideos 43017 e 50330. Os marcadores concretizadostambém incluem aqueles localizados na SEQ ID No: 1, taiscomo aqueles localizados em ou dentro das posições denucleotideos 550-658 da SEQ ID No: 1, ou aquelaslocalizadas em ou dentro das posições de nucleotideos 1562-1767 da SEQ ID No: 1. Os marcadores das concretizaçõesincluem aqueles marcadores localizados nos ampliconsgerados por um par de primers, sendo que o primeiro primeré uma seqüência de número impar oriunda da SEQ ID No: 23até 41, e sendo que o segundo primer é uma seqüência denúmero par oriunda da SEQ ID No: 24 até 42.

Concretizações adicionais incluem plantas de milhoobteniveis por um método compreendendo: cruzamento da MP305ou DE811ASR(BC5) [No. de Depósito PTO-7434] como umaprimeira planta parental, com uma planta diferente na qualestá ausente um lócus de Regi, como uma segunda plantaparental, para obter, por esse meio, a progêniecompreendendo o lócus de Regi da primeira parental; eopcionalmente, ainda, compreendendo uma ou mais etapasadicionais de melhoramento para obter a progênie de uma oumais gerações posteriores que compreendem o lócus de Regida primeira parental. Tais plantas de milho concretizadasincluem ambas as plantas endogâmicas e híbridas. Assementes de tais plantas, incluindo aquelas que sãohomozigotas e heterozigotas com relação ao lócus de Regi, esão concretizados pela invenção os métodos de obtenção deprodutos de milho resultante do processamento daquelassementes. É também uma concretização da invenção o uso detal semente em alimento ou ração ou na produção de umproduto de milho, tais como farinha de milho, cereal demilho e óleo de milho.

BREVE DESCRIÇÃO DOS DESENHOS

A Figura 1 é o mapa dos Estados Unidos mostrando agravidade de infestação pela podridão do colmo porantracnose por município, em 2002.

A Figura 2 (a, b, c) é um alinhamento de uma seqüênciade polipeptídeo das concretizações (SEQ ID No: 3)comparando-a com outros polipeptídeos NBS-LRR conhecidos.

A Figura 3 é um gráfico produzido pelo softwareWindows QTL Cartographer mostrando uma análise estatísticada chance (eixo dos Y) de que o lócus responsável pelofenótipo de resistência a Cg esteja localizado em umaposição particular ao longo do cromossomo (eixo dos X) comodefinido pelos marcadores de FLP.

A Figura 4 é um blot de gel de eletroforese dealíquotas de reações de RT-PCR que revelam a presença deuma banda de 260 pb presente nas amostras derivada de ambasas plantas resistentes, a infectada e a não-infectada, masausente para as amostras susceptíveis. Os fragmentos de RT-PCR foram obtidos a partir de 12,5 ng de RNA total oriundodo tecido de colmo da DE811 e da DE811ASR. O cDNA obtidopor transcrição reversa foi amplificado usando primersespecíficos de Regi e primers de rRNA 18S como um padrãointerno.

A Figura 5 é um diagrama esquemático da estratégia demarcação com Mu (Mu-tagging) usada para validar o geneRegi.

A Figura 6 é a estrutura do Regi mostrando alocalização de quatro diferentes sitios de inserção domutator.

A Figura 7 (a-b) é uma série de imagens de mapagenético com resolução aumentada do mapa da região próximaao gene Regi. As distâncias no mapa para 7 (a) no mapaassinalado "A" estão em cM e em relação ao mapa genético 4Neighbors IBM2. As distâncias no mapa para 7 (b) no mapaassinalado "B" foram desenvolvidas usando 184 indivíduosoriundos da população BC7, e as distâncias no mapa para7 (b) no mapa assinalado "C" foram desenvolvidas usando 1060indivíduos oriundos da população BC7. O mapeamento genéticona população BC7 aumentou a resolução do mapa mais do que10 vezes, quando comparado com o mapa publicado. Alocalização dos marcadores mostrada à direita de cada mapaé baseada na extrapolação de sua localização no mapafísico.

A Figura 8(a-b) é uma imagem do mapa genéticomostrando o intervalo cromossômico com o gene Regi emDE811ASR (BC3), o tamanho reduzido do intervalocromossômico com o gene Regi obtido em DE811ASR (BC5) e oadicional tamanho reduzido do intervalo cromossômico emendogâmicas obtido por meio do uso, inicialmente, daDE811ASR (BC5) como a fonte doadora. Para todos osmarcadores, as distâncias do mapa mostradas foram relatadasno mapa neighbors IBM2 disponível publicamente no GDB demilho, separadamente para a MZA15842, FLP27 e FLP56 para asquais as posições no mapa foram extrapoladas usando aanálise de regressão relativa aos mapas de alta resoluçãona Figura 7 (b) , para os mapas B e C, usando as posições deUMC2285, PHI093 e CSU166a as quais foram comuns em ambos osmapas .

A Figura 9 (a-b) mostra em: (a) o alinhamento daregião não-colinear oriunda de DE811ASR (BC5) com relação aB73 e a Mol7. Os tamanhos do BAC na Figura 9 (a) sãoestimativos; (b) uma porção da região não-colinear comoapresentada na SEQ ID No: 137 na qual reside o Regi,incluindo as regiões repetitivas situadas nele, assim comoos exons 1 e 2 de Regi.

A Figura 10 (a-b) mostra as distribuições de tamanhomédio de lesão de folha em diferentes plantas individuaisem 15 dias após a inoculação com Cg nas linhagensDE811ASR(BC5) e DE811, respectivamente.

A Figura 11 mostra uma comparação de tamanho médio delesão de folha em plantas de DE811 e DE811ASR(BC5)infectadas com Cg nos dias 7 e 15 após a inoculação.

A Figura 12 mostra a gravidade média da doença quatroa cinco semanas após a inoculação com Cg em colmos dehíbridos derivados do cruzamento de DE811ASR(BC5) e DE811para a linhagem indicada.

A Figura 13 mostra o aperfeiçoamento da produtividadena maturidade após a inoculação com Cg em híbridosderivados do cruzamento de DE811ASR(BC5) para a linhagemindicada, em comparação com a produtividade de híbridosderivados do cruzamento de DE811 para a linhagem indicada.

A Figura 14 mostra a gravidade da doença em 5diferentes localidades causada por Cg em colmos delinhagens endogâmicas derivadas de DE811ASR(BC5) ou deMP305, quatro a cinco semanas após a inoculação. Asdiferenças entre as linhagens que foram positivas enegativas com relação ao gene Regi são estatisticamentesignificativas em um valor de P de menos que 0,05.

A figura 15 mostra a progressão da doença em colmosrepresentativos oriundos de linhagens PH705 endogâmicas quesão positivas e negativas com relação a Regi.A Figura 16 mostra a progressão da doença em colmosrepresentativos oriundos de linhagens PH87P endogâmicas quesão positivas e negativas com relação a Regi.

A Figura 17 mostra a gravidade da doença quatro acinco semanas após a inoculação em 5 diferentes localidadescausada por Cg em colmos de hibridos derivados docruzamento de DE811ASR(BC5) para a linhagem indicada. Asdiferenças entre as linhagens que são positivas e negativascom relação ao gene Regi são estatisticamentesignificativas em um valor P de menos que 0,05, exceto paraa localidade 5.

A Figura 18 mostra a progressão da doença em colmosrepresentativos oriundos de hibridos criados a partir daslinhagens PH4CV e PH705 que são positivas e negativas comrelação a Regi.

A Figura 19 mostra a progressão da doença em colmosrepresentativos oriundos de hibridos criados a partir daslinhagens PH705 e PH87P que são positivas e negativas comrelação a Regi.

A Figura 20 mostra o método de contagem de escore paraa gravidade da doença em colmos de milho. Aos colmos é dadoum escore, designado antgr75, que representa o número deinternódulos (até 5, incluindo o internódulo inoculado) queestão mais que 75% descoloridos. Estes resultados em umescore variando de 0 a 5, sendo que 0 indica menos que 75%de descoloração no internódulo inoculado, e 5 indica 75% oumais de descoloração dos primeiros cinco internódulos,incluindo o internódulo inoculado.

A Figura 21 mostra um contig no mapa fisico de B73 queé homólogo à região no interior da qual é inserida aDE811ASR (BC5) contendo a região não-colinear de Regi, oque demonstra que muitas .B73 derivadas de cromossomosartificiais bacterianos (BACs) estão disponíveis na regiãode interesse a partir da qual a informação de seqüênciapode ser obtida.

A Figura 22 mostra o alinhamento do mapa genéticocontendo os marcadores MZA e público com os mapas fisicosde Mol7 e B73. As distâncias de mapa genético foramdesenvolvidas pela utilização de 1060 indivíduos a partirda população de mapeamento BC7. Uma análise de umabiblioteca BAC de Mol7 também mostrou o lócus de Regi comosendo não-colinear com a correspondente região de Mol7. Alocalização dos marcadores mostrada por linhas pontilhadascom relação ao mapa de B73 são extrapolações a partir dalocalização no mapa fisico de Mol7. A localização dosmarcadores mostrada pelas linhas pontilhadas com relação aomapa de Mol7 são extrapolações da localização no mapafisico de B73.A Figura 23 mostra os oligos para os marcadores dehibridização de Regi desenhado para uso com reaçõesInvader™.

A Figura 24 mostra os oligos para os marcadores dehibridização de Regi desenhados para uso com reaçõesTaqMan®.

A Figura 25 mostra os resultados de um northern blotobtido a partir de aproximadamente 1,5 mg de RNA rico empolyA isolado a partir de plantas resistentes esusceptíveis nos dias 0, 3, 6, 9 e 13 após a inoculação(dpi) . A membrana foi sondada com um fragmento de primeraleatório de Regi marcado de 420 pb. O tecido resistente éoriundo de DE811ASR(BC5) e o tecido susceptível é oriundode DE811.

A Figura 26 mostra que a amplificação por PCR usandopares de primers específicos para Regi somente amplifica nalinhagem resistente DE811ASR(BC5) e na parental doadoraMP305, mas não na linhagem susceptível DE811, com exceçãode FLP110F-R, a qual amplifica a região do sitio de ligaçãoespiral espiralada-nucleotideo, a qual é altamenteconservada, e, portanto, amplifica uma região em qualquerlugar no genoma que não seja Regi na linhagem DE811. Foiusada uma ladder de 100 pb para fazer o fragmento sobmedida.

DESCRIÇÃO DETALHADA DA INVENÇÃOAs concretizações da presente invenção provêemcomposições e métodos (ou processos) dirigidos à indução deresistência em plantas a patógeno, particularmenteresistência a fungos. As composições são novas seqüênciasde nucleotideos e de aminoácidos que conferem ou melhoram aresistência de plantas a patógenos fúngicos.

Especificamente, certas concretizações provêempolipeptideos tendo a seqüência de aminoácidos apresentadaem SEQ ID No: 3, e variantes e fragmentos da mesma. Sãoainda providas moléculas de ácido nucléico isoladas, evariantes e fragmentos das mesmas, que compreendemseqüências de nucleotideos que codificam a seqüência deaminoácidos mostrada na SEQ ID No:3.

As seqüências de nucleotideos que codificam opolipeptideo da SEQ ID No: 3 são apresentadas nas SEQ IDNos: 1 e 4. As plantas, células de planta, sementes emicrorganismos compreendendo uma seqüência de nucleotideosque codifica um polipeptideo das concretizações são tambémaqui reveladas.

Foi feito um depósito da molécula de ácido nucléico deRegi em 22 de fevereiro de 2006 junto à AgriculturalResearch Service (ARS) Culture Collection, guardada naMicrobial Genomics and Bioprocessing Research Unit doNational Center for Agricultural Utilization Research(NCAUR), sob as disposições do Tratado de Budapeste. Foidado ao depósito o seguinte número de acesso: NRRL B-30895.O endereço do NCAUR é 1815 N. University Street, Peoria,IL, 61604. Este depósito será mantido sob os termos dotratado de Budapeste para o Reconhecimento Internacional doDepósito de Microrganismos para os Propósitos deProcedimento de Patente. Este depósito foi feito meramentecomo uma conveniência para aqueles técnicos no assunto enão é uma admissão de que o depósito seja requerido deacordo com' o §112 do U.S.C. 35. O depósito ficarádisponível ao público irrevogavelmente e sem restrição oucondição após a publicação de uma patente. Entretanto, deveser compreendido que a disponibilidade de um depósito nãoconstitui uma licença para praticar o objeto da invenção emdetrimento dos direitos de patente concedidos por açãogovernamental.

Uma amostra de 2500 sementes de DE811ASR (BC5) foramdepositadas junto à American Type Culture Collection(ATCC), 10801 University Blvd., Manassas, VA 20110-2209,USA em 13 de março de 2006 e atribuído o No. de DepósitoPTO-7434. O acesso a este depósito ficará disponível,durante a pendência do pedido, ao Representante de Patentese de Marcas Registradas, a pessoas indicadas peloRepresentante para serem habilitadas para tanto sobsolicitação, e correspondentes funcionários em repartiçõesde patentes estrangeiras nas quais seja depositado o pedidode patente. Este depósito será mantido sob os termos doTratado de Budapeste sobre o Reconhecimento Internacionalde Depósito de Microrganismos para os Propósitos deProcedimento de Patente. O depósito ficará disponível aopúblico irrevogavelmente e sem restrição ou condição após apublicação de uma patente. No entanto, deve ficar entendidoque a disponibilidade do depósito não constitui uma licençapara praticar o objeto da invenção ou métodos em detrimentodios direitos de patente.

O polipeptideo de comprimento completo dasconcretizações (SEQ ID No:3) compartilha variados graus dehomologia com polipeptideos conhecidos da familia NBS-LRR.

Em particular, o novo polipetideo das concretizaçõescompartilha homologia com as proteínas NBS-LRR isoladas deOryza sativa (Nos. De Acesso NP_910480 (SEQ ID No: 14),NP_910482 (SEQ ID No: 16), NP_921091 (SEQ ID No: 17) eNP_910483 (SEQ ID No: 15)) e de Hordeum vulgare (No. deAcesso AAG37354 (SEQ ID No: 18); Zhou et ai., (2001) PlantCell 13:337-350). A Figura 1 prove um alinhamento daseqüência de aminoácidos apresentada na SEQ ID No: 3 com asproteínas antifúngicas de O. sativa e de H. vulgare (SEQ IDNos: 14-18).

Os alinhamentos de aminoácidos usando o programa GAPindicam que a SEQ ID No:3 compartilha aproximadamente 42,3%de similaridade de seqüência com a proteína antifúngica deO. sativa NP_910480 (SEQ ID No: 14), 41,7% de similaridadede seqüência com a proteína de O. sativa NP_910482 (SEQ IDNo: 16), 56,9% de similaridade com a proteína de O. sativaNP_921091 (SEQ ID No: 17) e 42,1% de similaridade deseqüência com a proteína de O. sativa NP_910483 (SEQ ID No:15). Além disso, a SEQ ID No: 3 compartilha aproximadamente42,8% de similaridade de seqüência com a proteina de H.vulgare AAG37354 (SEQ ID No: 18).

O grupo NBS-LRR de genes-R é a maior classe de genes-Rdescobertos até hoje. Em Arabidopsis thaliana, estima-seque mais de 150 estejam presentes no genoma (Meyers, etal., (2003), Plant Cell, 15:809-834; Monosi, et al.,(2004), Theoretical and Applied Genetics, 109:1434-1447),enquanto que em arroz, estima-se em aproximadamente 500genes NBS-LRR (Monosi, (2004) supra) . A classe NBS-LRR degenes R está compreendida por duas subclasses. A classe 1de genes NBS-LRR contém um dominio semelhante a TIR-Toll/Interleucina-1 na sua extremidade N' , a qual, atéhoje, foi encontrada em dicotiledôneas (Meyers, (2003)acima mencionado; Monosi, (2004) acima mencionado). Asegunda classe de NBS-LRR contém tanto um dominio espiral-espiralado ou um dominio (nt) na sua extremidade N (Bai, etal. (2002) Genome Research, 12:1871-1884; Monosi, (2004)acima mencionado; Pan, et al., (2000), Journal of MolecularEvolution, 50:203-213). A classe 2 de NBS-LRR foiencontrada e ambas as espécies, monocotiledôneas edicotiledôneas (Bai, (2002) acima mencionado; Meyers,(2003) acima mencionado; Monosi, (2004) acima mencionado;Pan, (2000) acima mencionado).

O dominio NBS do gene parece desempenhar um papel desinalização nos mecanismos de defesa da planta (van derBiezen, et al., (1998), Current Biology: CB, 8:R226-R227).

A região LRR parece ser a região que interage com osprodutos AVR do patógeno (Michelmore, et al. , (1998),Genome Res., 8:1113-1130; Meyers, (2003) acima citado).Esta região LRR, em comparação com o domínio NBS está sobuma pressão de seleção muito maior para a diversificação(Michelmore, (1998) acima citado; Meyers, (2003) acimacitado; Palomino, et al., (2002), Genome Research, 12:1305-1315). Os dominios LRR também são encontrados em outroscontextos; esses motifs de residuos 20-29 estão presentesem arranjos in tandem em inúmeras proteínas com funçõesdiversas, tais como interações hormônio-receptor, inibiçãode enzima, adesão celular e tráfego celular. Inúmerosestudos recentes revelaram o envolvimento de proteínas LRRno desenvolvimento inicial de mamíferos, desenvolvimentoneural, polarização celular, regulação de expressão de genee sinalização de apoptose.

O gene das concretizações está nitidamente relacionadoao NBS-LRR da família de classe 2, mas não se ajustacompletamente ao molde clássico. A extremidade amino possuihomologia com os chamados sitios de ligação a nucleotideo(NBS). Há uma região rica em leucina também localizada,como esperado, a jusante do NBS. Entretanto, diferentementedas proteínas NBS-LRR previamente estudadas, a região ricaem leucina carece da natureza repetitiva sistemáticaencontrada nos dominios LRR mais clássicos, muito menosconsistentemente seguindo o padrão de repetição Lxx tipicoe, em particular, não tendo exemplos de seqüências deconsenso descritas por Wang et al. ((1999) Plant J. 19:55-64; ver, especialmente, a Figura 5) ou Bryan et al.((2000), Plant Cell 12:2033-204 5; ver, especialmente, aFigura 3) .

Como a região LRR é a porção receptora de um NBS-LRR,quando uma nova LRR, tal como a desta descrição, forencontrada, a faixa de sua atividade, ou seja, a faixa depatógenos aos quais ela responderá, não é imediatamenteóbvia a partir da seqüência. O gene das concretizações foiisolado com base no fenótipo de resistência a Cg, e,portanto, a nova LRR responde a Cg. Entretanto, não ficaexcluído o fato de que ela responde a outros patógenos nãotestados no trabalho feito até agora.

Os ácidos nucléicos e polipeptideos das concretizaçõesencontram uso em métodos para conferir ou melhorar aresistência em plantas a fungos. Conseqüentemente, ascomposições e métodos revelados aqui são utilizáveis naproteção de plantas contra patógenos fúngicos. Os termos"resistência a patógeno", "resistência a fungo" e"resistência a doença" têm a intenção de significar o fatode que a planta evita os sintomas da doença que são oresultado de interações planta-patógeno. Ou seja, é feita aprevenção de patógenos causarem doenças em plantas e ossintomas de doença associados, ou, alternativamente, ossintomas de doença causados pelo patógeno são minimizadosou diminuídos, tais como, por exemplo, a redução deestresse e perda de produtividade associada. Osespecialistas na técnica saberão reconhecer que ascomposições e métodos aqui revelados podem ser usados comoutras composições e métodos disponíveis na técnica paraproteger plantas do ataque de patógenos.

Em conseqüência, os métodos das concretizações podemser utilizados para proteger plantas de doenças,particularmente aquelas doenças que são causadas porpatógenos de fungos de planta. Como aqui usado, o termo"resistência a fungo" se refere a resistência melhorada outolerância com relação a um patógeno de fungo em comparaçãocom aquela de uma planta do tipo selvagem. Os efeitos podemvariar desde um leve aumento na tolerância aos efeitos dopatógeno fúngico (por exemplo, inibição parcial) atéresistência total, tal como a planta não ser afetada pelapresença do patógeno fúngico. Um nivel aumentado deresistência contra um patógeno fúngico particular ou contraum espectro mais amplo de patógenos fúngicos constitui aresistência "melhorada" ou aperfeiçoada contra fungos. Asconcretizações da invenção também melhorarão ouaperfeiçoarão a resistência da planta a patógeno de fungo,de modo que a resistência da planta a um patógeno ou apatógenos fúngicos aumentará. 0 termo "melhorar" se referea aperfeiçoar, aumentar, amplificar, multiplicar, elevar,fazer surgir e semelhantes. Aqui, as plantas da invençãosão descritas como sendo resistentes a infecção por Cg outendo resistência melhorada a infecção por Cg, comoresultado do lócus de Regi da invenção. Conseqüentemente,elas tipicamente apresentam resistência melhorada à doençaquando comparadas com plantas equivalentes que sãosusceptíveis à infecção por Cg porque lhes falta o lócus deRegi. Por exemplo, usando o sistema de contagem de escoredescrito no Exemplo 11 (ver também a Figura 20), elastipicamente apresentam um decréscimo de um ponto, de doispontos ou de três pontos ou de mais pontos no escore deinfecção, ou mesmo uma redução do escore para 1 ou 0,quando comparadas com plantas equivalentes que sãosusceptíveis a infecção por Cg porque lhes falta o lócus deRegi.

Em aspectos particulares, os métodos para conferir oumelhorar resistência de uma planta a fungos compreendem aintrodução, em uma planta, de pelo menos um cassete deexpressão, sendo que o cassete de expressão compreende umaseqüência de nucleotideos codificante de um polipeptideoantifúngico das concretizações operacionalmente ligado a umpromotor que dirige a expressão na planta. A plantaexpressa o polipeptideo, conferindo, por esse meio, aresistência antifúngica sobre a planta, ou aperfeiçoando onível de resistência inerente da planta. Em concretizaçõesparticulares, o gene confere resistência ao patógenofúngico Cg.

A expressão de um polipeptideo antifúngico dasconcretizações pode ser direcionada para tecidosespecíficos de planta onde a resistência ao patógeno éparticularmente importante, tais como, as folhas, asraízes, os colmos, ou os tecidos vasculares. Tal expressãotecido-preferida pode ser realizada por meio de promotoresraiz-preferidos, folha-preferidos, tecido vascular-preferidos, colmo-preferidos ou semente-preferidos.

Como aqui usado, o termo "ácido nucléico" incluireferência a um polimero de desoxirribonucleotideos ou deribonucleotideos, tanto na forma de simples-fita como na dedupla-fita, e a menos que seja limitado de outra forma,engloba análogos conhecidos (por exemplo, ácidos nucléicosde peptideo) tendo a natureza essencial de nucleotideosnaturais na medida em que eles hibridizam com ácidosnucléicos de simples-fita de uma maneira semelhante aosnucleotideos de ocorrência natural.

Os termos "polipeptídeo", "peptideo", e "proteína" sãoaqui usados indistintamente para se referir a um polimerode resíduos de aminoácidos. Os termos se aplicam aospolímeros de aminoácidos nos quais um ou mais residuos deaminoácido é um análogo quimico artificial de um aminoácidocorrespondente de ocorrência natural, assim como aospolímeros de aminoácidos de ocorrência natural. Ospolipeptídeos das concretizações podem ser produzidos tantoa partir de um ácido nucléico aqui revelado, como pelo usode técnicas de biologia molecular padrão. Por exemplo, umaproteína truncada das concretizações pode ser produzida porexpressão de um ácido nucléico recombinante dasconcretizações em uma célula hospedeira apropriada, oualternativamente, pela combinação de procedimentos ex vivo,tal como digestão com protease e purificação.Como aqui usados, os termos "codificar" ou"codificado", quando usados no contexto de um ácidonucléico especifico, significa que o ácido nucléicocompreende a informação de requisito para dirigir atradução da seqüência de nucleotideos para uma proteinaespecificada. A informação pela qual uma proteina écodificada é especificada pelo uso de códons. Um ácidonucléico codificante de uma proteina pode compreenderseqüências não-traduzidas (por exemplo, introns) dentro deregiões traduzidas do ácido nucléico ou tais seqüênciasnão-traduzidas interpostas (por exemplo, tal como no cDNA)podem estar ausentes.

As concretizações da invenção englobampolinucleotideos isolados ou substancialmente purificadosou composições de proteina. Um polinucleotideo ou proteina"isolado(a)" ou "purificado(a)", ou porção biologicamenteativa do mesmo, está substancialmente ou essencialmenteisento(a) de componentes que normalmente acompanham ouinteragem com o polinucleotideo ou proteina comoencontrado(a) no seu ambiente de ocorrência natural.Portanto, um polinucleotideo ou proteina isolado(a) oupurificado(a) está substancialmente isento(a) de outromaterial celular, ou meio de cultura produzido por técnicarecombinante (por exemplo, amplificação por PCR), ousubstancialmente isento(a) de precursores químicos, quandosintetizados(as) quimicamente. De modo ótimo, umpolinucleotideo "isolado" está isento de seqüências (porexemplo, seqüências codificantes de proteina) quenaturalmente flanqueiam o polinucleotídeo (ou seja,seqüências localizadas nas extremidades 5' e 3' dopolinucleotideo) no DNA genômico do organismo a partir doqual o polinucleotideo é derivado. Por exemplo, nas váriasconcretizações, o polinucleotideo isolado pode conter menosque cerca de 5 kb, cerca de 4 kb, cerca de 3 kb, cerca de 2kb, cerca de 1 kb, cerca de 0,5 kb, ou cerca de 0,1 kb daseqüência de nucleotideos que flanqueia naturalmente opolinucleotideo no DNA genômico da célula a partir da qualo polinucleotideo é derivado. Uma proteína que ésubstancialmente isenta de material celular incluipreparações de proteina tendo menos do que cerca de 30%,cerca de 20%, cerca de 10%, cerca de 5%, ou cerca de 1% (empeso seco) de proteina contaminante. Quando a proteina dasconcretizações, ou uma porção biologicamente ativa damesma, for recombinantemente produzida, de modo ótimo, omeio de cultura representa menos do que cerca de 30%, cercade 20%, cerca de 10%, cerca de 5%, ou cerca de 1% (em pesoseco) de precursores químicos ou substâncias químicas não-protéicas de interesse.

Os fragmentos e variantes das seqüências denucleotideos reveladas e proteínas codificadas por essemeio estão também englobadas pelas concretizações. O termofragmento tem a intenção de significar uma porção daseqüência de nucleotideos ou uma porção da seqüência deaminoácidos e, portanto, da proteina codificada por essemeio. Os fragmentos de uma seqüência de nucleotideos podemcodificar fragmentos de proteina que retenham a atividadebiológica da proteína natural e, assim, a capacidade deconferir, na planta, resistência a fungos.

Alternativamente, os fragmentos de uma seqüência denucleotideos que são utilizáveis como sondas dehibridização não necessariamente codificam proteínas defragmentos que retenham a atividade biológica. Portanto, osfragmentos de uma seqüência de nucleotideos pode variar depelo menos cerca de 15 nucleotideos, cerca de 50nucleotideos, cerca de 100 nucleotideos, e até a seqüênciade nucleotideos de comprimento completo codificante dospolipeptideos das concretizações.

Um fragmento de uma seqüência de nucleotideos quecodifica uma porção biologicamente ativa de um polipeptideodas concretizações codificará pelo menos cerca de 15, cercade 25, cerca de 30, cerca de 40, ou cerca de 50 aminoácidoscontíguos, ou até o número total de aminoácidos presente nopolipeptideo de comprimento completo das concretizações(por exemplo, 980 aminoácidos para o peptideo codificadopela SEQ ID No:l). Os fragmentos de uma seqüência denucleotideos que são utilizáveis como sondas ou primers dePCR, em geral, não necessitam codificar uma porçãobiologicamente ativa de uma proteína.

Como aqui usado, o termo "seqüência de comprimentocompleto", com referência a um polinucleotideoespecificado, significa que ela possui a seqüência inteirade ácido nucléico de uma seqüência natural. O termo"seqüência natural" tem a intenção de significar umaseqüência endógena, ou seja, uma seqüência não-engenheiradaencontrada no genoma de um organismo.

Portanto, um fragmento de uma seqüência denucleotideos das concretizações pode codificar uma porçãobiologicamente ativa de um polipeptideo, ou ele pode ser umfragmento que pode ser usado como uma sonda de hibridizaçãoou primer de PCR usando métodos revelados mais adiante. Umaporção biologicamente ativa de um polipeptideoantipatogênico pode ser preparada pelo isolamento de umaporção de uma das seqüências de nucleotideos dasconcretizações, expressando a porção codificada da proteínae avaliando a capacidade de a porção codificada da proteínaconferir ou melhorar a resistência a fungos em uma planta.As moléculas de ácido nucléico que são fragmentos de umaseqüência de nucleotideos das concretizações compreendempelo menos cerca de 15, cerca de 20, cerca de 50, cerca de75, cerca de 100, ou cerca de 150 nucleotideos, ou até onúmero de nucleotideos presente na seqüência denucleotideos de comprimento completo aqui revelada (porexemplo, 4212 nucleotideos para a SEQ ID No: 1) .

O termo "variantes" tem a intenção de significarseqüências substancialmente similares. Parapolinucleotideos, uma variante compreende uma deleção e/ouadição de um ou mais nucleotideos em um ou mais sitiosinternos dentro do polinucleotideo natural e/ou umasubstituição de um ou mais nucleotideos em um ou maissitios no polinucleotideo natural. Como aqui usado, umpolinucleotídeo ou polipeptideo "natural" compreende umaseqüência de nucleotideos ou seqüência de aminoácidos deocorrência natural, respectivamente. Os especialistas natécnica saberão reconhecer que variantes dos ácidosnucléicos das concretizações serão construídos de modo queo quadro aberto de leitura seja mantido. Parapolinucleotideos, as variantes conservativas incluemaquelas seqüências que, por causa da degeneração do códigogenético, codificam a seqüência de aminoácidos de um dospolipeptideos das concretizações. As variantes alélicas deocorrência natural, tais como aquelas que podem seridentificadas com o uso de técnicas de biologia molecularamplamente conhecidas, como, por exemplo, com as técnicasde reação em cadeia da polimerase (PCR) e de hibridizaçãocomo esboçadas mais adiante. Os polinucleotideos variantestambém incluem polinucleotideos derivados sinteticamente,tais como aqueles gerados, por exemplo, pelo uso demutagênese sitio-dirigida, mas que ainda codificam umaproteína das concretizações. Em geral, as variantes de umpolinucleotideo particular das concretizações terá pelomenos cerca de 40%, cerca de 45%, cerca de 50%, cerca de55%, cerca de 60%, cerca de 65%, cerca de 70%, cerca de75%, cerca de 80%, cerca de 85%, cerca de 90%, cerca de91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de95%, cerca de 96%, cerca de 97%, cerca de 98%, cerca de 99%ou mais de identidade de seqüência com relação àquelepolinucleotideo particular, como determinado pelosprogramas e parâmetros de alinhamento de seqüênciadescritos aqui em algum lugar.As variantes de um polinucleotideo particular dasconcretizações (ou seja, o polinucleotideo de referência)podem também ser avaliadas por comparação da percentagem deidentidade de seqüência entre o polipeptideo codificado porum polinucleotideo variante e o polipeptideo codificadopelo polinucleotideo de referência. Assim, por exemplo, sãorevelados os polinucleotideos isolados que codificam umpolipeptideo com uma dada percentagem de identidade deseqüência com relação ao polipeptideo de SEQ ID No:3. Aidentidade de seqüência percentual entre quaisquer doispolipeptideos pode ser calculada usando os programas eparâmetros de alinhamento de seqüências descritos aqui emalgum lugar. Quando qualquer dado par de polinucleotideosdas concretizações é avaliado por comparação da identidadede seqüência percentual compartilhada pelos doispolipeptideos que ele codifica, a identidade de seqüênciapercentual entre os dois polipeptideos codificados tem pelomenos cerca de 40%, cerca de 45%, cerca de 50%, cerca de55%, cerca de 60%, cerca de 65%, cerca de 70%, cerca de75%, cerca de 80%, cerca de 85%, cerca de 90%, cerca de91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de95%, cerca de 96%, cerca de 97%, cerca de 98%, cerca de 99%ou mais de identidade de seqüência.

O termo proteina "variante" tem a intenção designificar uma proteina derivada da proteina nativa pordeleção ou adição de um ou mais aminoácidos em um ou maissitios internos na proteina natural e/ou substituição de umou mais aminoácidos em um ou mais sitios na proteinanatural. As proteínas variantes englobadas pelasconcretizações são biologicamente ativas, ou seja, elascontinuam a possuir a atividade biológica desejada daproteina natural, isto é, a capacidade de conferir oumelhorar a resistência da planta a patógeno de fungo comoaqui descrito. Tais variantes podem resultar, por exemplo,de' polimorfismo genético ou de manipulação pelo homem. Asvariantes biologicamente ativas de uma proteina natural dasconcretizações terão pelo menos cerca de 40%, cerca de 45%,cerca de 50%, cerca de 55%, cerca de 60%, cerca de 65%,cerca de 70%, cerca de 75%, cerca de 80%, cerca de 85%,cerca de 90%, cerca de 91%, cerca de 92%, cerca de 93%,cerca de 94%, cerca de 95%, cerca de 96%, cerca de 97%,cerca de 98%, cerca de 99% ou mais de identidade deseqüência com relação à seqüência de aminoácidos para aproteina natural como determinada pelos programas eparâmetros de alinhamento de seqüências aqui descritos emalgum lugar. Uma variante biologicamente ativa de umaproteina das concretizações pode diferir daquela proteinapor tão pouco quanto cerca de 1-15 residuos de aminoácido,tão pouco quanto cerca de 1-10, tal como cerca de 6-10, tãopouco quanto cerca de 5, tão pouco quanto 4, 3, 2, ou atémesmo 1 residuo de aminoácido.

As proteínas das concretizações podem ser alteradas dediversas maneiras, incluindo substituições, deleções,truncagens e inserções de aminoácidos. Os métodos pararealizar tais manipulações são, em geral, conhecidos doestado da técnica. Por exemplo, as variantes e fragmentosda seqüência de aminoácidos das proteínas antipatogênicaspodem ser preparadas por meio de mutações no DNA. Osmétodos para mutagênese e alterações de polinucleotideossão bem conhecidos no estado da técnica. Ver, por exemplo,Kunkel (1985) Proc. Natl. Rcad. Sei. USA 82:488-492; Kunkelet al. (1987) Methods in Enzymol. 154:367-382; patente US4.873.192; Walker e Gaastra, eds. (1983) Techniques inMolecular Bíology (MacMillan Publishing Company, New York)e as referências aqui citadas. A orientação de comorealizar apropriadas substituições de aminoácidos que nãoafetem a atividade biológica da proteína de interesse podeser encontrada no modelo de Dayhoff et al. (1978) Atlas ofProtein Sequence and Structure (Natl. Biomed. Res. Found.,Washington, D.C.), aqui incorporado a titulo de referência.As substituições conservativas, tal como a troca de umaminoácido por um outro tendo propriedades similares podemser o modo ótimo.

Portanto, os genes e polinucleotideos dasconcretizações incluem ambas, as seqüências de ocorrêncianatural e as formas mutantes. Da mesma maneira, asconcretizações englobam ambas, as proteínas de ocorrêncianatural e as variações e formas modificadas das mesmas.Tais variantes continuarão a possuir a capacidade desejadade conferir ou melhorar a resistência da planta a patógenode fungo. Obviamente, as mutações que serão feitas no DNAcodificante da variante não devem ocorrer fora do quadro deleitura e, de modo ótimo, não criarão regiõescomplementares que possam produzir estrutura secundária demRNA (ver EP 0075444) .

Não se espera que as deleções, inserções esubstituições das seqüências de proteina englobadas aquiproduzam mudanças radicais nas características da proteina.Entretanto, quando for difícil predizer o efeito exato dasubstituição, deleção ou inserção antes de realizá-la, osespecialistas na técnica saberão reconhecer que o efeitoserá avaliado pelo screening de plantas transgênicas quetenham sido transformadas com a proteina variante paraaveriguar o efeito na capacidade da planta resistir aoataque patogênico do fungo.

Os polinucleotideos e proteínas variantes tambémenglobam as seqüências e proteínas derivadas deprocedimentos mutagênicos ou recombinogênicos, incluindo,mas não estando limitados a, procedimentos tal como o decombinações aleatórias de DNA. O especialista na técnicapode imaginar modificações que alterem a faixa de patogenoscom relação aos quais a proteina responde. Com talprocedimento, uma ou mais diferentes seqüênciascodificantes de proteina podem ser manipuladas para criaruma nova proteina que possua as propriedades desejadas.Desta maneira, são geradas bibliotecas de polinucleotideosrecombinantes a partir de uma população de polinucleotideosde seqüências relacionadas compreendendo regiões deseqüência que possuem substancial identidade de seqüência epodem ser homologamente recombinadas in vitro ou in vivo.Por exemplo, usando esta abordagem, os motifs de seqüênciacodificantes de um domínio de interesse podem sercombinados aleatoriamente entre o gene de proteína dasconcretizações e outros genes de proteína conhecidos paraobter um novo gene codificante de uma proteína com umapropriedade de interesse aperfeiçoada, tal como capacidadeaumentada de conferir ou melhorar a resistência da planta apatógeno de fungo. As estratégias para combinar DNAaleatoriamente são conhecidas no estado da técnica. Ver,por exemplo, Stemmer (1994) Proc. Natl. Acad. Sei. USA91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameriet al. (1997) Nature Biotech. 15:436-438; Moore et al.(1997) J. Mol. Biol. 272:336-347; Zhang et al. (1997) Proc.Natl. Acad. Sei. USA 94:4504-450.9; Crameri et al. (1998)Nature 391:288-291; e patentes US 5.605.793 e US 5.837.458.

Os polinucleotideos das concretizações podem serusados para isolar as seqüências correspondentes a partirde outros organismos, particularmente outras plantas. Destamaneira, métodos tais como PCR, hibridização e semelhantespodem ser usados para identificar tais seqüências com basena sua homologia de seqüência com relação às seqüênciasaqui apresentadas. As seqüências isoladas com base na suaidentidade de seqüência com relação às seqüências inteirasaqui apresentadas ou com relação a variantes ou fragmentosdas mesmas estão englobados pelas concretizações. Taisseqüências incluem seqüências que são ortólogas dasseqüências reveladas. O termo "ortólogas" tem a intenção designificar genes derivados de um gene ancestral comum e quesão encontrados em diferentes espécies como resultado deuma especialização. Os genes encontrados em diferentesespécies são considerados ortólogos quando suas seqüênciasde nucleotideos e/ou suas seqüências de proteína codificadacompartilham pelo menos cerca de 60%, cerca de 70%, cercade 75%, cerca de 80%, cerca de 85%, cerca de 90%, cerca de91%, cerca de 92%, cerca de 93%, cerca de 94%, cerca de95%, cerca de 96%, cerca de 97%, cerca de 98%, cerca de99%, ou mais de identidade de seqüência. As funções dosortólogos são, com freqüência, altamente conservadas entreas espécies. Portanto, polinucleotídeos isolados quecodificam uma proteína que confere ou melhora a resistênciada planta a patógeno de fungo e que hibridiza sob condiçõesestringentes com as seqüências aqui reveladas, ou comvariantes ou fragmentos das mesmas, estão englobados pelasconcretizações.

Em uma abordagem de PCR, os primers deoligonucleotídeos podem ser desenhados para uso em reaçõesde PCR para amplificar as correspondentes seqüências de DNAa partir do cDNA ou do DNA genômico extraído de qualquerorganismo de interesse. Os métodos para desenhar primers dePCR e clonagem de PCR são, em geral, conhecidos no estadoda técnica e estão descritos em Sambrook et al. (1989)Molecular Cloning: A Laboratory Manual (2d ed., Cold SpringHarbor Laboratory Press, Plainview, New York). Ver tambémInnis et al., eds. (1990) PCR Protocols: A Guide to Methodsand Applications (Academic Press, New York); Innis eGelfand, eds. (1995) PCR Strategies (Academic Press, NewYork); e Innis e Gelfand, eds. (1999) PCR Methods Manual(Academic Press, New York). Os métodos de PCR conhecidosincluem, mas não estão limitados a, métodos usando primersemparelhados, primers nested, primers únicos específicos,primers degenerados, primers gene-especificos, primersvetor-especificos, primers com emparelhamento desigualparcial, e semelhantes.

Nas técnicas de hibridização, o todo ou parte de umpolinucleotideo conhecido é usado como uma sonda queseletivamente hibridiza com outros polinucleotideoscorrespondentes presentes em uma população de fragmentos deDNA genômico clonado ou fragmentos de cDNA (ou seja,bibliotecas genômicas ou de cDNA) a partir de um organismoconhecido. As sondas de hibridização podem ser fragmentosde DNA genômico, fragmentos de cDNA, fragmentos de RNA, ououtros oligonucleotideos, e podem ser marcados com um grupodetectável, tal como 32P, ou qualquer outro marcadordetectável. Assim, por exemplo, as sondas para hibridizaçãopodem ser feitas por meio de marcação de oligonucleotideossintéticos baseados nos polinucleotideos dasconcretizações. Os métodos de preparação das sondas parahibridização e para a construção do cDNA e bibliotecasgenômicas são, em geral, conhecidos no estado da técnica eestão descritos em Sambrook et al. (1989) acima citado.

Por exemplo, o polinucleotideo inteiro aqui revelado,ou uma ou mais porções do mesmo, pode ser usado como umasonda capaz de especificamente hibridizar com oscorrespondentes polinucleotideos e RNAs mensageiros. Paraalcançar a hibridização específica sob uma variedade decondições, tais sondas incluem seqüências que são únicas e,de modo ótimo, têm um comprimento de pelo menos cerca de 10nucleotídeos, um comprimento de pelo menos cerca de 15nucleotídeos, ou um comprimento de pelo menos cerca de 20nucleotídeos. Tais sondas podem ser usadas para amplificaros correspondents polinucleotideos a partir de um organismoconhecido por meio de PCR. Esta técnica pode ser usada paraisolar seqüências codificantes adicionais a partir de umorganismo desejado ou como um ensaio de diagnóstico paradeterminar a presença de seqüências codificantes em umorganismo. As técnicas de hibridização incluem screening dehibridização de bibliotecas de DNA plaqueado (tanto placascomo colônias); ver, por exemplo, Sambrook et al. (1989)acima citado.

A hibridização de tais seqüências pode ser realizadasob condições estringentes. Os termos "condiçõesestringentes" ou "condições de hibridização estringentes"tem a intenção de significar condições sob as quais umasonda hibridizará com sua seqüência alvo com relação a umgrau detectavelmente maior do que outras seqüências (porexemplo, pelo menos duas vezes acima do background). Ascondições estringentes são seqüência-dependentes e serãodiferentes em diferentes circunstâncias. Pelo controle daestringência da hibridização e/ou das condições de lavagem,as seqüências alvo que forem 100% complementares comrelação à sonda podem ser identificadas (sondagemhomóloga). Alternativamente, as condições de estringênciapodem ser ajustadas para permitir algum emparelhamentodesigual em seqüências de modo que graus mais baixos desimilaridade sejam detectados (sondagem heteróloga) . Emgeral, uma sonda tem um comprimento menor do que cerca de1000 nucleotideos, de modo ótimo, um comprimento menor que500 nucleotideos.

Tipicamente, condições estringentes serão aquelas nasquais a concentração de sal é menor do que cerca de 1,5 Mde ion Na, tipicamente concentração de cerca de 0,01 a 1,0M de ion Na (ou outros sais) em pH 7,0 a 8,3 e atemperatura é de pelo menos cerca de 30°C para sondascurtas (por exemplo, 10 a 50 nucleotideos) e pelo menoscerca de 60°C para sondas longas (por exemplo, maiores doque 50 nucleotideos). Condições estringentes também podemser alcançadas com a adição de agentes desestabilizantes,tal como formamida. Condições de baixa estringênciaexemplificativas incluem a hibridização com uma soluçãotampão de formamida a 30 a 35%, NaCl 1 M, SDS a 1% (dodecilsulfato de sódio) a 37°C, e uma lavagem em IX a 2X SSC (20XSSC = NaCl 3,0 M /citrato trissódico 0,3 M) a umatemperatura de 50 a 55°C. Condições de moderadaestringência exemplificativas incluem hibridização emformamida a 40 a 45%, NaCl 1,0 M, SDS a 1% a 37°C, e umalavagem em 0,5X a IX SSC a uma temperatura de 55 a 60°C.Condições de alta estringência exemplificativas incluemhibridização em formamida a 50%, NaCl 1 M, SDS 1% a a 37°C,e uma lavagem final em 0,1X SSC a umatemperatura de 60 a65°C por pelo menos 30 minutos. De modo ótimo, os tampõesde lavagem podem compreender cerca de 0,1% a cerca de 1% deSDS. A duração de hibridização é, em geral, menor do quecerca de 24 horas, usualmente de cerca de 4 a cerca de 12horas. A duração do tempo de lavagem será pelo menos umperiodo de tempo suficiente para alcançar o equilíbrio.

Especificidade é tipicamente uma função das lavagenspós-hibridização, sendo os fatores críticos a força iônicae a temperatura da solução de lavagem final. Para oshíbridos de DNA-DNA, o ponto de fusão térmico (Tm) pode seraproximado a partir da equação de Meinkoth e Wahl (1984)Anal. Biochem. 138:267-284: Tm = 81,5°C + 16,6 (log M) +0,41 (%GC) - 0,61 (% form) - 500/L; onde M é a molaridadede cátions monovalentes, %GC é a percentagem denucleotideos guanosina e citosina no DNA, % form é apercentagem de formamida na solução de hibridização, e L éo comprimento do hibrido em pares de base. A Tm é atemperatura (sob força iônica e pH definidos) na qual 50%de uma seqüência alvo complementar hibridiza com uma sondaperfeitamente emparelhada. A Tm é reduzida por cerca 1°Cpara cada 1% de emparelhamento desigual; assim, a Tm, ahibridização, e/ou as condições de lavagem podem serajustadas para hibridizar com seqüências da identidadedesejada. Por exemplo, se forem desejadas seqüências com>90% de identidade, a Tm pode ser diminuída 10°C. Em geral,condições estringentes são selecionadas para serem cerca de5°C mais baixas do que a Tm para a seqüência especifica eseu complemento em uma força iônica e pH definido.Entretanto, condições severamente estringentes podemutilizar uma hibridização e/ou lavagem a 1, 2, 3, ou 4°Cmais baixa do que a Tm; condições moderadamenteestringentes podem utilizar uma hibridização e/ou lavagemem 6, 7, 8, 9, ou 10°C mais baixa do que a Tm; condições debaixa estringência podem utilizar uma hibridização e/oulavagem em 11, 12, 13, 14, 15, ou 20°C mais baixa do que aTm. Usando a equação, as composições de hibridização elavagem, e a Tm desejada, aqueles especialistas na técnicasaberão reconhecer que as variações na estringência dassoluções de hibridização e/ou lavagem estão inerentementedescritas. Se o grau desejado de emparelhamento desigualresultar em uma Tm menor que 45°C (solução aquosa) ou 32°C(solução de formamida), o modo ótimo será aumentar aconcentração de SSC de forma que uma temperatura mais altapossa ser usada. Uma orientação detalhada para ahibridização de ácidos nucléicos é encontrada em Tijssen(1993) Laboratory Techniques in Biochemistry and MolecularBiology—Hybridization with Nucleic Acid Probes, Part I,Capitulo 2 (Elsevier, New York); e Ausubel et al., eds.(1995) Current Protocols in Molecular Biology, Capitulo 2(Greene Publishing and Wiley-Interscience, New York). VerSambrook et al. (1989) acima citado.

Vários procedimentos podem ser usados para checar apresença ou ausência de uma seqüência particular de DNA,RNA ou de uma proteina. Eles incluem, por exemplo, Southernblots, northern blots, western blots, e análise ELISA.Técnicas tais como essas são bastante conhecidas no estadoda técnica e existem muitas referências que fornecemprotocolos detalhados. Tais referências incluem Sambrook etal. (1989) acima citado, e Crowther, J.R. (2001), The ELISAGuidebook, Humana Press, Totowa, NJ, USA.

Os seguintes termos são usados para descrever asrelações de seqüência entre dois ou mais polinucleotideosou polipeptideos: (a) "seqüência de referência", (b)"janela de comparação", (c) "identidade de seqüência" e (d)"percentagem de identidade de seqüência".

(a) Como aqui usada, a "seqüência de referência" éuma seqüência definida usada como base para a comparação deseqüências. Uma seqüência de referência pode ser umsubconjunto ou a integralidade de uma seqüênciaespecificada; por exemplo, como um segmento de um cDNA decomprimento completo ou seqüência de gene, ou o cDNAcompleto ou seqüência de gene.

(b) Como aqui usada, a "janela de comparação" fazreferência a um segmento contiguo e especificado de umaseqüência de polinucleotideo, sendo que a seqüência depolinucleotideo na janela de comparação pode compreenderadições ou deleções (ou seja, gaps) comparada com aseqüência de referência (a qual não compreende adições oudeleções) para o alinhamento ótimo de doispolinucleotideos. Em geral, a janela de comparação temcomprimento de pelo menos cerca de 20 nucleotideoscontíguos, e opcionalmente, pode ter cerca de 30, cerca de40, cerca de 50, cerca de 100, ou ser mais longa. Aquelesespecialistas na técnica entendem que para evitar uma altasimilaridade com uma seqüência de referência devido àinclusão de gaps na seqüência do polinucleotideo, étipicamente introduzida uma penalidade de gap e é subtraídado número de pareamentos.

Os métodos de alinhamento de seqüências paracomparação são bastante conhecidos no estado da técnica.Portanto, a determinação da identidade de seqüênciapercentual entre quaisquer duas seqüências pode serrealizada usando um algoritmo matemático. Exemplos nãolimitativos de tais algoritmos matemáticos são osalgoritmos de Myers e Miller (1988) CABIOS 4:11-17; oalgoritmo de alinhamento local de Smith et al. (1981) Adv.Appl. Math. 2:482; o algoritmo de alinhamento global deNeedleman e Wunsch (1970) J. Mol. Biol. 48:443-453; ométodo de alinhamento de busca-por-local de Pearson eLipman (1988) Proc. Natl. Acad. Sei. 85:244 4-24 48; oalgoritmo de Karlin e Altschul (1990) Proc. Natl. Acad.Sei. USA 872264, modificado como em Karlin e Altschul(1993) Proc. Natl. Acad. Sei. USA 90:5873-5877.

As implementações em computador desses algoritmosmatemáticos podem ser utilizadas para comparação deseqüências para determinar a identidade de seqüência. Taisimplementações incluem, mas não estão limitadas a: CLUSTALno programa PC/Gene (disponível a partir deIntelligenetics, Mountain View, Califórnia); o programaALIGN (Versão 2.0) e GAP, BESTFIT, BLAST, FASTA, e TFASTAno GCG Wisconsin Genetics Software Package, Versão 10(disponível a partir de Accelrys Inc., 9685 Scranton Road,San Diego, Califórnia, USA) . Os alinhamentos usando essesprogramas podem ser realizados usando os parâmetros dedefault. O programa CLUSTAL está bem descrito por Higginset al. (1988) Gene 73:237-244 (1988); Higgins et al. (1989)CABIOS 5:151-153; Corpet et al. (1988) Nucleic Acids Res.16:10881-90; Huang et al. (1992) CABIOS 8:155-65; e Pearsonet al. (1994) Meth. Mol. Biol. 24:307-331. O programa ALIGNé baseado no algoritmo de Myers e Miller (1988) acimacitado. Podem ser usadas uma tabela de peso de resíduoPAM120, uma penalidade de comprimento de gap de 12, e umapenalidade de gap de 4 com o programa ALIGN para compararseqüências de aminoácidos. Os programas BLAST de Altschulet al (1990) J. Mol. Biol. 215:403 são baseados noalgoritmo de Karlin e Altschul (1990) acima citado. Asbuscas de nucleotídeos BLAST podem ser realizadas com oprograma BLASTN, escore = 100, comprimento de palavra = 12,para obter seqüências de nucleotídeos homólogas a umaseqüência de nucleotídeos codificante de uma proteína dasconcretizações. As buscas de proteína BLAST podem serrealizadas com o programa BLASTX, escore = 50, comprimentode palavra = 3, para obter seqüências de aminoácidoshomólogas a uma proteína ou polipeptídeo dasconcretizações. Para obter os alinhamentos com gap parafinalidade de comparação, pode ser usado o Gapped BLAST (emBLAST 2.0) como descrito em Altschul et al. (1997) NucleicAcids Res. 25:3389. Alternativamente, pode ser usado o PSI-BLAST (em BLAST 2.0) para realizar uma busca iterada quedetecta relações distantes entre moléculas (ver Altschul etal. (1997) acima citado). Quando se utiliza o BLAST, GappedBLAST, PSI-BLAST, podem ser usados os parâmetros de defaultdos programas respectivos (por exemplo, BLASTN paraseqüências de nucleotideos, BLASTX para proteínas) (verwww.ncbi.nlm.nih.gov). 0 alinhamento também pode serrealizado manualmente por inspeção.

A menos que seja estabelecido diferentemente, osvalores de identidade/similaridade de seqüência aquiprovidos se referem ao valor obtido usando o GAP Versão 10utilizando os seguintes parâmetros: % de identidade e % desimilaridade para uma seqüência de nucleotideos usando oPeso de Gap de 50 e o Peso de Comprimento de 3, e a matrizde contagem de escore nwsgapdna.cmp; % de identidade e % desimilaridade para uma seqüência de aminoácidos usando oPeso de Gap de 8 e o Peso de Comprimento de 2, e a matrizde contagem de escore BLOSUM62; ou qualquer programaequivalente ao mesmo. 0 termo "programa equivalente" tem aintenção de significar qualquer programa de comparação deseqüência que, para quaisquer duas seqüências em questão,gera um alinhamento tendo nucleotideo idêntico oupareamentos de residuos de aminoácido e uma idênticaidentidade de seqüência percentual quando comparado com oalinhamento correspondente gerado pelo GAP Versão 10.

O GAP usa o algoritmo de Needleman e Wunsch (1970) J.Mol. Biol. 48:443-453 para encontrar o alinhamento de duasseqüências completas que maximize o número de pareamentos eminimize o número de gaps. O GAP considera todos osalinhamentos e posições de gap possíveis e cria oalinhamento com o maior número de bases emparelhadas e omenor número de gaps. Ele possibilita a provisão de umapenalidade de criação de gap e uma penalidade de extensãode gap em unidades de bases emparelhadas. O GAP precisa terum ganho de número de pareamentos de penalidade de criaçãode gap para cada gap que ele insere. Se for escolhida umapenalidade de extensão de gap maior do que zero, o GAPprecisa, adicionalmente, ter um ganho para cada gapinserido do comprimento do gap vezes a penalidade deextensão de gap. Os valores de penalidade de criação de gapde default e os valores de penalidade de extensão de gap naVersão 10 do GCG Wisconsin Genetics Software Package paraseqüências de proteina são 8 e 2, respectivamente. Paraseqüências de nucleotideos a penalidade de criação de gapde default é 50 enquanto que a penalidade de extensão degap de default é 3. As penalidades de criação de gap e deextensão de gap podem ser expressas como um número inteiroselecionado do grupo de números inteiros consistindo de 0até 200. Portanto, por exemplo, as penalidades de criaçãode gap e de extensão de gap podem ser 0, 1, 2, 3, 4, 5, 6,7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 oumaiores.

O GAP apresenta um membro da família dos melhoresalinhamentos. Pode haver muitos membros nesta familia, enenhum outro membro possui a melhor qualidade. O GAPapresenta quatro valores de mérito para alinhamentos:Qualidade, Razão, Identidade e Similaridade. A qualidade éo métrico maximizado de modo a alinhar as seqüências. ARazão é a qualidade dividida pelo número de bases nosegmento mais curto. A Identidade Percentual é apercentagem dos símbolos que realmente emparelham. ASimilaridade Percentual é a percentagem dos símbolos quesão similares. Os símbolos que atravessam a partir dos gapssão ignorados. É contado o escore de uma similaridadequando o valor da matriz de contagem de escore para um parde símbolos for maior que ou igual a 0,50, a similaridadelimiar. A matriz de contagem de escore usada na Versão 10..do GCG Wisconsin Genetics Software Package é BLOSUM62 (verHenikoff e Henikoff (1989) Proc. Natl. Acad. Sei. USA89:10915).

(c) Como aqui usada, a "identidade de seqüência" ou"identidade" no contexto de duas seqüências depolinucleotideo ou polipeptideo faz referência aos resíduosnas duas seqüências que são as mesmas quando alinhadas paraa máxima correspondência ao longo de uma janela decomparação especificada. Quando a percentagem de identidadede seqüência é usada com referência a proteínas, éreconhecido que as posições de resíduo que não foremidênticas freqüentemente diferem por substituiçõesconservativas de aminoácidos, onde resíduos de aminoácidosão substituídos por outros resíduos de aminoácidos compropriedades químicas semelhantes (por exemplo, carga ouhidrofobicidade) e, portanto, não mudam as propriedadesfuncionais da molécula. Quando as seqüências diferem emsubstituições conservativas, a identidade de seqüênciapercentual pode ser ajustada para cima para corrigir anatureza conservativa da substituição. Seqüências quediferem por tais substituições conservativas são ditaspossuírem "similaridade de seqüência" ou "similaridade". Osmeios para fazer este ajuste são bastante conhecidosdaqueles especialistas na técnica. Tipicamente isto envolvea contagem de escore de uma substituição conservativa comoum emparelhamento desigual parcial ao invés de umemparelhamento desigual total, aumentando, por esse meio, apercentagem de identidade de seqüência. Assim, por exemplo,quando a um aminoácido idêntico for dado um escore de 1 e auma substituição não-conservativa for dado um escore dezero, a uma substituição conservativa é dado um escoreentre zero e 1. A contagem de escore de substituiçõesconservativas é calculada, por exemplo, como implementadano programa PC/GENE (Intelligenetics, Mountain View,Califórnia).

(d) Como aqui usada, a "percentagem de identidade deseqüência" significa o valor determinado por comparação deduas seqüências alinhadas de modo ótimo ao longo de umajanela de comparação, sendo que a porção da seqüência depolinucleotídeo na janela de comparação pode compreenderadições ou deleções (ou seja, gaps) quando comparada com aseqüência de referência (a qual não compreende adições oudeleções) para o alinhamento ótimo das duas seqüências. Apercentagem é calculada para determinar o número deposições nas quais ocorre a idêntica base de ácido nucléicoou o idêntico residuo de aminoácido em ambas as seqüênciaspara produzir o número de posições pareadas, dividindo onúmero de posições pareadas pelo número total de posiçõesna janela de comparação, e multiplicando o resultado por100 para produzir a percentagem de identidade de seqüência.

O uso do termo "polinucleotideo" não tem a intenção delimitar as concretizações a polinucleotideos compreendendoDNA. Aqueles especialistas na técnica reconhecerão quepolinucleotideos podem compreender ribonucleotideos ecombinações de ribonucleotideos e desoxirribonucleotideos.Tais desoxirribonucleotideos e ribonucleotideos incluemambos, as moléculas de ocorrência natural e os análogossintéticos. Os polinucleotideos das concretizações tambémenglobam todas as formas de seqüências incluindo, mas nãoestando limitadas a, formas de simples-fita, formas dedupla-fita e semelhantes.

Os polinucleotideos isolados das concretizações podemser incorporados em constructos de DNA recombinante capazde introdução e replicação em uma célula hospedeira. Um"vetor" pode ser um constructo tal que inclui um sistema dereplicação e seqüências que são capazes de transcrição etradução de uma seqüência codificante de polipeptideo emuma dada célula hospedeira. Inúmeros vetores apropriadospara a transfecção estável de plantas transgênicas têm sidodescritos, por exemplo, Pouwels et al. , Cloning Vectors: ALaboratory Manual, 1985, supp. 1987; Weissbach e Weissbach,Methods for Plant Molecular Biology, Academic Press, 1989;e Flevin et al., Plant Molecular Biology Manual, KluwerAcademic Publishers, 1990. Tipicamente, os vetores deexpressão em planta incluem, por exemplo, um ou mais genesde planta clonados sob o controle de transcrição deseqüências de regulação 5' e 3' e um marcador selecionáveldominante. Tais vetores de expressão em planta também podemconter uma região de regulação de promotor (por exemplo,uma expressão de região de regulação de controle induzivelou constitutivo, regulada por condições ambientais ou dedesenvolvimento, ou célula- ou tecido-especifica) , um sitiode partida de iniciação de transcrição, um sitio de ligaçãoa ribossomo, um sinal de processamento de RNA, um sitio determinação de transcrição, e/ou um sinal de poliadenilação.

Os termos "constructo recombinante", "cassete deexpressão", "constructo de expressão", "constructoquimérico", "constructo", "constructo de DNA recombinante"e "fragmento de DNA recombinante" são aqui usadosindiferentemente e são fragmentos de ácido nucléico. Umconstructo recombinante compreende uma combinaçãoartificial de fragmentos de ácido nucléico, incluindo, masnão estando limitado a, seqüências de regulação ecodificantes que não são encontradas juntas na natureza.

Por exemplo, um constructo de DNA recombinante podecompreender seqüências de regulação e seqüênciascodificantes que são derivadas de diferentes fontes earrumadas em uma maneira diferente daquela encontrada nanatureza. Tais constructos podem ser usados por si mesmosou podem ser usados em conjugação com um vetor. Se forusado um vetor, então a escolha do vetor é dependente dométodo que será usado para transformar as célulashospedeiras, como é bastante conhecido dos especialistas natécnica. Por exemplo, pode ser usado um vetor plasmidial.

Os especialistas na técnica estão bem familiarizados com oselementos genéticos que devem estar presentes no vetor dede modo a transformar com sucesso, selecionar e propagarcélulas hospedeiras que compreendem quaisquer dosfragmentos de ácido nucléico isolado das concretizações. 0screening para obter as linhagens que apresentam o nivel epadrão de expressão desejado dos polinucleotideos ou dolócus de Regi pode ser realizado por amplificação, análiseSouthern de DNA, análise northern da expressão de mRNA,análise immunoblotting de expressão de proteina, análisefenotipica, e semelhantes.

O termo "construeto de DNA recombinante" se refere aum construeto de DNA montado a partir de fragmentos deácido nucléico obtido de diferentes fontes. Os tipos eorigens dos fragmentos de ácido nucléico podem ser muitodiversos.

Em algumas concretizações, são adicionalmente providoscassetes de expressão compreendendo um promotoroperacionalmente ligado a uma seqüência de nucleotideosheteróloga das concretizações. Os cassetes de expressão dasconcretizações encontram uso na geração de plantastransformadas, células de planta e microrganismos e naprática de métodos para induzir resistência da planta apatógeno de fungo aqui revelada. 0 cassete de expressãoincluirá seqüências de regulação 5' e 3' operacionalmenteligadas a um polinucleotideo das concretizações. 0 termo"operacionalmente ligado" tem a intenção de significar umaligação funcional entre dois ou mais elementos. As"seqüências de regulação" se referem a nucleotideoslocalizados a montante (seqüências não-codificantes 5' ) ,dentro ou a jusante (seqüências não-codificantes 3') de umaseqüência codificante, e que podem influenciar atranscrição, o processamento de RNA, a estabilidade, atradução da seqüência codificante associada. As seqüênciasde regulação podem incluir, mas não estão limitadas a,promotores, seqüências lider de tradução, introns eseqüências de reconhecimento de poliadenilação. Porexemplo, uma ligação operável entre um polinucleotideo deinteresse e uma seqüência de regulação (um promotor, porexemplo) é uma ligação funcional que permite a expressão dopolinucleotideo de interesse. Os elementos operacionalmenteligados podem ser contínuos ou não-continuos. Quando usadopara se referir a uma união de duas regiões codificantes deproteína, o termo operacionalmente ligado tem a intenção designificar que as regiões codificantes estão no mesmoquadro de leitura. O cassete pode ainda conter pelo menosum gene adicional para ser co-transformado dentro doorganismo. Alternativamente, o(s) gene(s) adicional(ais)pode(m) ser provido(s) em cassetes múltiplos de expressão.Tal cassete de expressão é provido com uma pluralidade desitios de restrição e/ou sitios de recombinação parainserção do polinucleotideo que codifica um polipeptideoantipatogênico para ficar sob a regulação de transcriçãodas regições de regulação. O cassete de expressão podeadicionalmente conter genes marcadores selecionáveis.

O cassete de expressão incluirá, na direção detranscrição 5'-3', uma região de iniciação de transcrição(ou seja, um promotor), região de iniciação de tradução, umpolinucleotideo das concretizações, uma região determinação da tradução e, opcionalmente, uma região determinação de transcrição funcional no organismohospedeiro. As regiões de regulação (ou seja, promotores,regiões de regulação de transcrição e regiões de terminaçãode tradução) e/ou o polinucleotideo das concretizaçõespodem ser nativos/análogos com relação à célula hospedeiraou de uma em relação à outra. Alternativamente, as regiõesde regulação e/ou os polinucleotideos das concretizaçõespodem ser heteterólogas com relação à célula hospedeira oude uma em relação à outra. Como aqui usado, o termo"heterólogo", com referência a uma seqüência é umaseqüência que se origina de espécies estrangeiras, ou, se apartir da mesma espécie, está substancialmente modificadacom relação à sua forma natural em composição e/ou lócusgenômico por deliberada intervenção humana. Por exemplo, umpromotor operacionalmente ligado a um polinucleotideoheterólogo é oriundo de uma espécie diferente da espécie apartir da qual o polinucleotideo foi derivado, ou se damesma/análoga espécie, um ou ambos estão substancialmentemodificados com relação à sua forma original e/ou lócusgenômico, ou o promotor não é o promotor natural para opolinucleotídeo operacionalmente ligado.

A região de terminação opcionalmente incluida pode sernatural com relação à região de iniciação de transcrição,pode ser natural com relação ao polinucleotideo deinteresse operacionalmente ligado, pode ser natural comrelação à planta hospedeira, ou pode ser derivada de umaoutra fonte (ou seja, estrangeira ou heteróloga) comrelação ao promotor, ao polinucleotideo de interesse, aohospedeiro, ou a qualquer combinação dos mesmos. Estãodisponíveis regiões de terminação convenientes a partir doplasmidio-Ti de A. tumefaciens, tais como as regiões determinação da octopina sintase e nopalina sintase. Vertambém Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al.(1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell2:1261^-1272; Munroe et al. (1990) Gene 91:151-158; Bailaset al. (1989) Nucleic Acids Res. 17:7891-7903; e Joshi etal. (1987) Nucleic Acids Res. 15:9627-9639. Emconcretizações particulares, é usado o terminador do geneII do inibidor de protease de batata (Pinll) . Ver, porexemplo, Keil et al. (1986) Nucl. Acids Res. 14:5641-5650;e An et al. (1989) Plant Cell 1:115-122, aqui incorporadosa título de referências em sua integralidade.

Inúmeros promotores podem ser usados na prática dasconcretizações, incluindo o promotor natural da seqüênciade polinucleotídeo de interesse. Os promotores podem serselecionados com base no resultado desejado. Uma amplafaixa de promotores de planta é discutida na recenterevisão de Potenza et al. (2004) In Vitro Cell Dev Biol -Plant 40:1-22, aqui incorporada a titulo de referência. Porexemplo, os ácidos nucléicos podem ser combinados compromotores constitutivos, tecido-preferidos, patógeno-induziveis ou outros promotores para expressão em plantas.

Tais promotores constitutivos incluem, por exemplo, opromotor de núcleo do promotor Rsyn7 e outros promotoresconstitutivos descritos no WO 99/43838 e patente US6.072.050; o promotor de núcleo de 35S de CaMV (Odell etal. (1985) Nature 313:810-812); actina de arroz (McElroy etal. (1990) Plant Cell 2:163-171); ubiquitina (Christensenet al. (1989) Plant Mol. Biol. 12:619-632 e Christensen etal. (1992) Plant Mol. Biol. 18:675-689); pEMU (Last et al.(1991) Theor. Appl. Genet. 81:581-588); MAS (Velten et al.(1984) EMBO J. 3:2723-2730); promotor da ALS (US5.659.026), e semelhantes. Outros promotores constitutivosincluem, por exemplo, os descritos nas patentes US5.608.149; US 5.608.144; US 5.604.121; US 5.569.597; US5.466.785; US 5.399.680; US 5.268.463; US 5.608.142; e US6.177.611.

Algumas vezes, pode trazer beneficio a expressão dogene a partir de um promotor induzivel, particularmente apartir de um promotor patógeno-induzivel. Tais promotoresincluem aqueles oriundos de proteínas patogênese-relacionadas (proteínas PR), as quais são induzidas aseguir à infecção por um patógeno, por exemplo, proteínasPR, proteínas SAR, beta-1,3-glucanase, chitinase, etc. Ver,por exemplo, Redolfi et al. (1983) Neth. J. Plant Pathol.89:245-254; Uknes et al. (1992) Plant Cell 4:645-656; e VanLoon (1985) Plant Mol. Virol. 4:111-116. Ver também WO99/43819, aqui incorporado a título de referência.

São de interesse os promotores que resultam emexpressão de uma proteína localmente em ou perto do sítiode infecção pelo patógeno. Ver, por exemplo, Marineau etal. (1987) Plant Mol. Biol. 9:335-342; Matton et al. (1989)Molecular Plant-Microbe Interactions 2:325-331; Somsisch etal. (1986) Proc. Natl. Acad. Sei. USA 83:2427-2430;Somsisch et al. (1988) Mol. Gen. Genet. 2 : 93-98; e Yang(1996) Proc. Natl. Acad. Sei. USA 93:14972-14977. Vertambém, Chen et al. (1996) Plant J. 10:955-966; Zhang etal. (1994) Proc. Natl. Acad. Sei. USA 91:2507-2511; Warneret al. (1993) Plant J. 3:191-201; Siebertz et al. (1989)Plant Cell 1:961-968; patente US 5.750.386 (nematódeo-induzível); e as referências aqui citadas. De particularinteresse é o promotor induzível para o gene PRms de milho,cuja expressão é induzida pelo patógeno Fusariummoniliforme (ver, por exemplo, Cordero et al. (1992)Physiol. Mol. Plant Path. 41:189-200).

Adicionalmente, como os patógenos entram nas plantasatravés de feridas ou danos provocados por insetos, podeser usado um promotor ferida-induzível nas construções dasconcretizações. Tais promotores ferida-induzíveis incluemgene de inibidor de proteinase de batata (pin II) (Ryan(1990) Ann. Rev. Phytopath. 28:425-449; Duan et al. (1996)Nature Biotechnology 14:4 94-4 98); wunl e wun2, patente US5.428.148; winl e win2 (Stanford et al. (1989) Mol. Gen.Genet. 215:200-208); sistemina (McGurl et al. (1992)Science 225:1570-1573); WIP1 (Rohmeier et al. (1993) PlantMol. Biol. 22:783-792; Eckelkamp et al. (1993) FEBS Letters323:73-76); gene' MPI (Corderok et al. (1994) Plant J.6(2):141-150); e semelhantes, aqui incorporados a titulo dereferência.

Os promotores quimico-regulados podem ser usados paramodular a expressão de um gene em uma planta através daaplicação de um regulador quimico exógeno. Dependendo doobjetivo, o promotor pode ser um promotor quimico-induzivel, quando a aplicação da substância química induz aexpressão gênica, ou um promotor quimico-suprimivel, quandoa aplicação da substância quimica suprime a expressãogênica. Os promotores quimico-induziveis são conhecidos noestado da técnica e incluem, mas não estão limitados a,promotor In2-2 de milho, que é ativado por antídotos deherbicida de benzeno-sulfonamida, promotor GST de milho,que é ativado por compostos eletrofilicos hidrofóbicos quesão usados como herbicidas pré-emergentes, e promotor PR-lade tabaco, que é ativado por ácido salicilico. Outrospromotores quimico-regulados de interesse incluempromotores esteróide-responsivos (ver, por exemplo, opomotor glucocorticóide-induzivel em Schena et al. (1991)Proc. Natl. Acad. Sei. USA 88:10421-10425 e McNellis et al.(1998) Plant J. 14 (2) : 247-257) e promotores tetraciclina-induzivel e tetraciclina-suprimivel (ver, por exemplo, Gatzet al. (1991) Mol. Gen. Genet. 227:229-237, e patentes US5.814.618 e US 5.789.156), aqui incorporados a titulo dereferência.

Os promotores tecido-preferidos podem ser utilizadospara direcionar a expressão melhorada dos polipeptideos dasconcretizações dentro de um tecido de planta particular.Por exemplo, um promotor tecido-preferido pode ser usadopara expressar um polipepetideo em um tecido de planta ondea resistência à doença é particularmente importante, taiscomo, por exemplo, as raizes, colmo ou as folhas. Ospromotores tecido-preferidos incluem Yamamoto et al. (1997)Plant J. 12 (2) :255-265; Kawamata et al. (1997) Plant CellPhysiol. 38 (7) :792-803; Hansen et al. (1997) Mol. GenGenet. 254(3):337-343; Russell et al. (1997) TransgenicRes. 6(2):157-168; Rinehart et al. (1996) Plant Physiol.112(3):1331-1341; Van Camp et al. (1996) Plant Physiol.112(2):525-535; Canevascini et al. (1996) Plant Physiol.112(2):513-524; Yamamoto et al. (1994) Plant Cell Physiol.35(5):773-778; Lam (1994) Results Probl. Cell Differ.20:181-196; Orozco et al. (1993) Plant Mol Biol.23(6) :1129-1138; Matsuoka et al. (1993) Proc Natl. Acad.Sei. USA 90(20):9586-9590; e Guevara-Garcia et al. (1993)Plant J. 4 (3) :495-505. Tais promotores podem sermodificados, se necessário, para expressão fraca.

Os promotores tecido vascular-preferidos sãoconhecidos no estado da técnica e incluem aquelespromotores que seletivamente dirigem a expressão em, porexemplo, tecido de xilema e tecido de floema. Os promotorestecido vascular-preferidos incluem, mas não estão limitadosa, promotor do gene de prunasin hidrolase de Prunusserotina (ver, por exemplo, Pedido de Patente Internacionalpublicado WO 03/006651), e também aqueles encontrados noPedido de Patente de No. de série 10/109.488.

Os promotores colmo-preferidos podem ser usados paradirigir a expressão de um polipeptideo das concretizações.Promotores colmo-preferidos exemplificativos incluem opromotor do gene MS8-15 de milho (ver, por exemplo, patenteUS 5.986.174 e Pedido de Patente Internacional publicado WO98/00533), e aqueles encontrados em Graham et al. (1997)Plant Mol Biol 33(4): 729-735.

Os promotores folha-preferidos são conhecidos noestado da técnica. Ver, por exemplo, Yamamoto et al. (1997)Plant J. 12 (2) :255-265; Kwon et al. (1994) Plant Physiol.105:357-67; Yamamoto et al. (1994) Plant Cell Physiol.35 (5) :773-778; Gotor et al. (1993) Plant J. 3:509-18;Orozco et al. (1993) Plant Mol. Biol. 23(6) :1129-1138; eMatsuoka et al. (1993) Proc. Natl. Acad. Sei. USA90 (20) :9586-9590.

Os promotores raiz-preferidos são conhecidos no estadoda técnica e podem ser selecionados dos muito disponiveis apartir da literatura ou isolados pela primeira vez a partirde várias espécies compatíveis. Ver, por exemplo, Hire etal. (1992) Plant Mol. Biol. 20 (2):207-218 (gene deglutamina sintetase raiz-específico de soja); Keller eBaumgartner (1991) Plant Cell 3 (10):1051-1061 (elemento decontrole raiz-específico no gene GRP 1.8 de feijãofrancês); Sanger et al. (1990) Plant Mol. Biol. 14(3):433-443 (promotor raiz-específico do gene da manopina sintase(MAS) de Agrobacterium tumefadens) ; e Miao et al. (1991)Plant Cell 3(l):ll-22 (clone de cDNA de comprimentocompleto codificante de glutamina sintetase (GS)citosólica, que é expressado em raízes e nódulos de raiz desoja). Ver também Bogusz et al. (1990) Plant Cell 2(7):633-641, onde são descritos dois promotores raiz-específicosisolados de genes de hemoglobina oriundos do não-legumefixador de nitrogênio Parasponia andersonii e o não-legumenão-fixador de nitrogênio relacionado Trema tomentosa. Ospromotores desses genes foram ligados a um gene repórter de(3-glucuronidase e introduzidos em ambos, o não-legumeNicotiana tabacum e o legume Lotus corniculatus, e em ambasas circunstâncias, a atividade de promotor raiz-específicoficou preservada. Leach e Aoyagi (1991) descrevem suaanálise dos promotores dos genes raiz-induzíveis rolC erolD altamente expressados de Agrobacterium rhizogenes (verPlant Science (Limerick) 79 (1) : 69-76) . Eles concluíram queo enhancer e os determinantes do DNA tecido-preferido estãodissociados naqueles promotores. Teeri et al. (1989) usarama fusão de gene ao lacZ para mostrar que o gene de T-DNA deAgrobacterium codificante da octopina sintase éespecialmente ativo na epiderme da ponta da raiz e que ogene TR2' é específico para raiz na planta intacta e éestimulado por meio de ferimento em tecido de folha, umacombinação especialmente desejável de características parauso com um gene inseticida ou larvicida (ver EMBO J.8(2):343-350) . O gene TR1', fundido ao nptll (neomicinafosfotransferase II) mostrou semelhantes características.Promotores raiz-preferidos adicionais incluem o promotor dogene VfENOD-GRP3 (Kuster et al. (1995) Plant Mol. Biol.29 (4) :759-772) ; e o promoter de rolB (Capana et al. (1994)Plant Mol. Biol. 25 (4) :681-691. Ver também patentes US5.837.876; US 5.750.386; US 5.633.363; US 5.459.252; US5.401.836; US 5.110.732; e US 5.023.179.

Os promotores semente-preferidos incluem ambos, ospromotores "semente-especificos" (aqueles promotores ativosdurante o desenvolvimento de semente, tais como ospromotores de proteínas de reserva de semente), bem como ospromotores "semente-germinadores" (aqueles promotoresativos durante a germinação da semente). Ver Thompson etal. (1989) BioEssays 10:108, aqui incorporado a titulo dereferência. Tais promotores semente-preferidos incluem, enão estão limitados a, Ciml (mensagem citocinina-induzida);CZ19B1 (zeina de 19 kDa de milho); milps (mio-inositol-1-fosfato sintase) (ver WO 00/11177 e patente US 6.225.529;aqui incorporadas a titulo de referência) . O gamma-zeina éum promotor endosperma-especifico preferido. O glob-1 é umpromotor embrião-especifico preferido. Para dicotiledôneas,os promotores semente-especificos incluem, e não estãolimitados a, (3-faseolin de feijão, napin, (3-conglicinin,lectina de soja, cruciferina, e semelhantes. Para asmonocotiledôneas, os promotores semente-especificosincluem, e não estão linmitados a, zeína de 15 kDa demilho, zeina de 22 kDa, zeina de 27 kDa, g-zeina, waxy,shrunken 1, shrunken 2, globulin 1, etc. Ver também WO500/12733, onde são descritos promotores semente-preferidosoriundos dos genes endl e end2; aqui incorporados a titulode referência.

São conhecidas modificações adicionais de seqüênciapara melhorar a expressão gênica em um hospedeiro celular.Elas incluem a eliminação de seqüências codificantes desinais espúrios de poliadenilação, sinais de sitio deprocessamento exon-intron, repetições semelhantes atransposon e outras tais seqüências bem caracterizadas quepodem ser prejudiciais à expressão gênica. 0 teor de G-C daseqüência pode ser ajustado a niveis médios para um dadohospedeiro celular, como calculado com referência aos genesconhecidos expressados na célula hospedeira. Quandopossivel, a seqüência é modificada para evitar estruturashairpin de mRNA secundário.

Os cassetes de expressão podem adicionalmente conterseqüências lider 5'. Tais seqüências lider podem atuar paramelhorar a tradução. Os lideres de tradução são conhecidos25 do estado da técnica e incluem: lideres de picornavirus,por exemplo, lider de EMCV (região não-codificante 5' deEncefalomiocardite) (Elroy-Stein et al. (1989) Proc. Natl.Acad. Sei. USA 8 6:612 6-6130); lideres de potyvirus, porexemplo, líder de TEV (Tobacco Etch Vírus) (Gallie et al.(1995) Gene 165 (2): 233-238), líder MDMV (Maize Dwarf MosaicVírus), e proteína de ligação de cadeia-longa deimunoglobulina humana (BiP) (Macejak et al. (1991) Nature353:90-94); líder não-traduzido oriundo do mRNA de proteínade capa do vírus de mosaico de alfafa (AMV RNA 4) (Joblinget al. (1987) Nature 325:622-625); líder de vírus demosaico de tabaco (TMV) (Gallie et al. (1989) in MolecularBiology of RNA, ed. Cech (Liss, New York), pp. 237-256); elíder de vírus mosqueado clorótico de milho (MCMV) (Lommelet al. (1991) Virology 81:382-385). Ver também,Della-Cioppa et al. (1987) Plant Physiol. 84:965-968.Também podem ser utilizados outros métodos conhecidos demelhorar a tradução, por exemplo, introns, e semelhantes.

No preparo do cassete de expressão, os váriosfragmentos de DNA podem ser manipulados de modo a prover asseqüências de DNA na orientação própria e, quandoapropriado, no quadro de leitura próprio. Para estafinalidade, podem ser empregados adaptadores e linkers paraunir os fragmentos de DNA ou podem estar envolvidas outrasmanipulações para prover os sítios de restriçãoconvenientes, a remoção do DNA supérfluo, a remoção dossítios de restrição, ou semelhantes. Para este propósitopodem estar envolvidos, mutagênese in vitro, reparo deprimer, restrição, anelamento, re-substituições, porexemplo, transições e transversões.

O cassete de expressão também pode compreender um genede marcador selecionável para a seleção de célulastransformadas. Os genes de marcador selecionável sãoutilizados para a seleção de células ou tecidostransformados. Os genes de marcador incluem genescodificantes de resistência a antibiótico, tais comoaqueles codificantes de neomicina fosfotransferase II (NEO)e higromicina fosfotransferase (HPT), assim como os genesque conferem resistência a compostos herbicidas, tais comoglufosinato de amônio, bromoxinil, imidazolinonas, e 2,4-diclorofenoxiacetato (2,4-D). Os marcadores selecionáveisadicionais incluem marcadores fenotipicos tais como (S-galactosidase e proteínas fluorescentes tais como proteínaverde fluorescente (GFP) (Su et al. (2004) BiotechnolBioeng 85:610-9 e Fetter et al. (2004) Plant Cell 16:215-28), proteína ciano fluorescente (CYP) (Bolte et al. (2004)J. Cell Science 117:943-54 e Kato et al. (2002) PlantPhysiol 125:913-42), e proteína amarelo fluorescente(PhiYFP™ a partir de Evrogen, ver, Bolte et al. (2004) J.Cell Science 117:943-54). Para marcadores selecionáveisadicionais, ver, em geral, Yarranton (1992) Curr. Opin.Biotech. 3:506-511; Christopherson et al. (1992) Proc. Natl.Acad. Sei. USA 89:6314-6318; Yao et al. (1992) Cell 71:63-72; Reznikoff (1992) Mol. Microbiol. 6:2419-2422; Barkley etal. (1980) em The Operon, pp. 177-220; Hu et al. (1987) Cell48:555-566; Brown et al. (1987) Cell 49:603-612; Figge etal. (1988) Cell 52:713-722; Deuschle et al. (1989) Proc.Natl. Acad. Aci. USA 86:54 00-54 04; Fuerst et al. (1989)Proc. Natl. Acad. Sei. USA 86:254 9-2553; Deuschle et al.(1990) Science 248:480-483; Gossen (1993) Tese de Ph.D.,Universidade de Heidelberg; Reines et al. (1993) Proc. Natl.Acad. Sei. USA 90:1917-1921; Labow et al. (1990) Mol. Cell.Biol. 10:3343-3356; Zambretti et al. (1992) Proc. Natl.Acad. Sei. USA 89:3952-3956; Baim et al. (1991) Proc. Natl.Acad. Sei. USA 88:5072-507 6; Wyborski et al. (1991) NucleicAcíds Res. 19:4647-4653; Hillenand-Wissman (1989) TopicsMol. Struc. Biol. 10:143-162; Degenkolb et al. (1991)Antimicrob. Agents Chemother. 35:1591-1595; Kleinschnidt etal. (1988) Biochemistry 27:1094-1104; Bonin (1993) Tese dePh.D., Universidade de Heidelberg; Gossen et al. (1992)Proc. Natl. Acad. Sei. USA 8 9:5547-5551; Oliva et al. (1992)Antimicrob. Agents Chemother. 36:913-919; Hlavka et al.(1985) Handbook of Experimental Pharmacology, Vol. 78(Springer-Verlag, Berlin); Gill et al. (1988) Nature334:721-724. Tais descrições são aqui incorporadas a titulode referência.

A lista acima de genes de marcador selecionável nãosignifica ser limitativa. Qualquer gene de marcadorselecionável pode ser usado nas concretizações.

O gene das concretizações pode ser expressado como umtransgene de modo a produzir plantas resistentes a Cg.Usando os diferentes promotores descritos em algum lugarnesta descrição, será possibilitada a sua expressão em umaforma modulada em diferentes circunstâncias. Por exemplo,podem ser desejados niveis mais altos de expressão emcolmos para melhorar a resistência à podridão do colmocausada por Cg. Em ambientes onde a queima das folhascausada por Cg for mais do que um problema, as linhagenscom niveis mais altos de expressão em folhas podem serusadas. Entretanto, também se pode inserir o gene inteiro,tendo ambos, o promotor e a seqüência codificante,naturais, como um transgene. Finalmente, o uso do gene dasconcretizações como um transgene possibilitará a rápidacombinação com outros caracteres, tal como a resistência ainseto ou a herbicida.

Em certas concretizações, as seqüências de ácidonucléico das concretizações pode ser montada com qualquercombinação de seqüências de polinucleotideo de interesse deforma a criar plantas com um desejado fenótipo. Estamontagem pode ser realizada por uma combinação de genesdentro do constructo de DNA, ou por meio de cruzamento deRegi com uma outra linhagem que compreende a combinação.Por exemplo, os polinucleotideos das concretizações podemser montados com quaisquer outros polinucleotideos dasconcretizações ou com outros genes. As combinações geradastambém podem incluir cópias múltiplas de qualquer um dospolinucleotideos de interesse. Os polinucleotideos dasconcretizações também podem ser montados com qualquer outrogene ou combinação de genes para produzir plantas com umavariedade de combinações de caracteres desejados,incluindo, mas não estando limitados a, caracteresdesejáveis para alimentação animal, tal como genes de altoteor de óleo (por exemplo, patente US 6.232.529);aminoácidos equilibrados (por exemplo hordotioninas(patentes US 5.990.389; US 5.885.801; US 5.885.802; e US5.703.409); cevada de alto teor de lisina (Williamson etal. (1987) Eur. J. Biochem. 165:99-106; e WO 98/20122); eproteínas de alto teor de metionina (Pedersen et al. (1986)J. Biol. Chem. 261:6279; Kirihara et al. (1988) Gene71:359; e Musumura et al. (1989) Plant Mol. Biol. 12:123)); aumentada digestibilidade (por exemplo, proteínas dereserva modificadas (Pedido de Patente US de No. de Série10/053.410, depositado em 7 de novembro de 2001); etioredoxinas (Pedido de ' Patente US de No. de Série10/005.429, depositado em 3 de Dezembro de 2001)), cujasdescrições são aqui incorporadas a título de referência. Ospolinucleotídeos das concretizações também podem sermontados com os caracteres desejáveis para resistência ainsetos, a doenças ou a herbicidas (por exemplo, proteínastóxicas de Bacillus thuringiensis (patentes US 5.366.892;US 5.747.450; US 5.737.514; US 5.723.756; US 5.593.881;Geiser et al (1986) Gene 48:109); lectinas (Van Damme etal. (1994) Plant Mol. Biol. 24:825); genes dedesintoxicação de fumonisina (patente US 5.792.931); genesde avirulêcia e de resistência a doenças (Jones et al.(1994) Science 266:789; Martin et al. (1993) Science262:1432; Mindrinos et al. (1994) Cell 78:1089); mutantesde acetolactato sintase (ALS) que conduzem a resistência aherbicida, tal como as mutações S4 e/ou Hra; inibidores deglutamina sintase, tais como fosfinotricina ou basta (porexemplo, gene bar); e resistência a glifosato (genes EPSPS,genes GAT tais como aqueles descritos no Pedido de Patentepublicado US US2004/0082770, também o WO02/36782 e oWO03/092360)) ; e caracteres desejáveis para processamentoou produtos de processo tal como alto teor em óleo (porexemplo, patente US 6.232.529 ); óleos modificados (porexemplo, genes de ácido graxo desnaturase (patente US5.952.544; WO 94/11516)); amidos modificados (por exemplo,ADPG pirofosforilases (AGPase), amido sintases (SS),enzimas de ramificação de amido (SBE) e enzimas de des-ramificação de amido (SDBE)); e polímeros ou bioplásticos(por exemplo, patente US 5.602.321; beta-cetotiolase,poliidroxibutirato sintase, e acetoacetil-CoA redutase(Schubert et al. (1988) J. Bacteriol. 170:5837-5847)facilitam a expressão de poliidroxialcanoatos (PHAs)),cujas descrições são aqui incorporadas a titulo dereferência. Também pode-se combinar os polinucleotideos dasconcretizações com polinucleotideos que forneçam caracteresagronômicos, tais como esterilidade masculina (por exemplo,ver patente US 5.583.210), resistência de colmo, tempo deflorescência, ou caracteres de tecnologia de transformaçãotais como regulação do ciclo da célula ou direcionamento dogene (por exemplo, WO 99/61619; WO 00/17364; WO 99/25821),cujas descrições são aqui incorporadas a titulo dereferência.

Essas combinações montadas podem ser criadas porqualquer método, incluindo, mas não estando limitado a,melhoramento por cruzamento de plantas por qualquermetodologia convencional ou por TopCross®, ou transformaçãogenética. Se os caracteres forem montados por transformaçãogenética de plantas, as seqüências de polinucleotideo deinteresse podem ser combinadas em qualquer momento e emqualquer ordem. Por exemplo, uma planta transgênicacompreendendo um ou mais caracteres desejados pode serusada como o alvo para introduzir caracteres adicionais porsubseqüente transformação. Os caracteres podem serintroduzidos simultaneamente em um protocolo de co-transformação com os polinucleotideos de interesse providospor qualquer combinação de cassetes de transformação. Porexemplo, se duas seqüências forem introduzidas, as duasseqüências podem estar contidas em cassetes detransformação separados (trans) ou contidos no mesmocassete de transformação (eis). A expressão das seqüênciaspode ser dirigida pelo mesmo promotor ou por promotoresdiferentes. Em certos casos, pode ser desejável introduzirum cassete de transformação que reprimirá a expressão dopolinucleotideo de interesse. Isto pode ser aliado aqualquer combinação de outros cassetes de supressão oucassetes de super-expressão para gerar a combinaçãodesejada de caracteres na planta.

Os métodos das concretizações podem envolver, e nãoficarem limitados a, introdução de um polipeptideo oupolinucleotideo em uma planta. 0 termo "introdução" tem aintenção de significar a apresentação de um polinucleotideoa uma planta. Em algumas concretizações, o polinucleotideoserá apresentado de tal maneira que a seqüência ganhaacesso ao interior da célula da planta, incluindo suainserção potencial no genoma de uma planta. Os métodos dasconcretizações não dependem de um método particular paraintroduzir uma seqüência em uma planta, dependem somente dofato de que o polinucleotideo tenha condições de ganharacesso ao interior de pelo menos uma célula da planta. Osmétodos para introduzir polinucleotideos no interior deplantas são conhecidos no estado da técnica, incluindo, masnão estado limitados a, métodos de transformação estável,métodos de transformação transiente e métodos mediados porvirus.

O termo "transformação" se refere à transferência deum fragmento de ácido nucléico para dentro do genoma de umorganismo hospedeiro, resultando em herança geneticamenteestável. Os organismos hospedeiros contendo os fragmentosde ácido nucléico transformado são referidos comoorganismos "transgênicos". O termo "célula hospedeira" serefere à célula no interior da qual a transformação doconstructo de DNA recombinante acontece e pode incluir umacélula de levedura, uma célula bacteriana e uma célula deplanta. Exemplos de métodos de transformação incluem atranformação Agrojbacterium-mediada (De Blaere et ai., 1987,Meth. Enzymol. 143:211) e a transformação por partículaacelerada ou tecnologia de transformação "arma de gene"(Klein et al., 1987, Nature (London) 327:70-73; patenteUS 4.945.050), entre outras.

O termo "transformação estável" tem a intenção designificar o fato de que o constructo de nucleotideosintroduzido em uma planta integra o genoma da planta e écapaz de ser herdado pela progênie da mesma. Os termos"transformação transiente" ou "expressão transiente" tem aintenção de significar o fato de que o polinucleotideo éintroduzido na planta e não se integra no genoma da plantaou que um polipeptideo é introduzido em uma planta.

Os protocolos de transformação, assim como osprotocolos de introdução de polipeptideos ou de seqüênciasde polinucleotideos em plantas pode variar dependendo dotipo de planta ou célula de planta, ou seja,monocotiledônea ou dicotiledônea, que é o alvo datransformação. Métodos apropriados para introduzirpolipeptideos e polinucleotideos em células de plantaincluem a microinjeção (Crossway et al. (1986)Biotechniques 4:320-334), a eletroporação (Riggs et al.(1986) Proc. Natl. Acad. Sei. USA 83:5602-5606, atransformação AgroJbacterium-mediada (patentes US 5.563.055e US 5.981.840), transferência direta de gene (Paszkowskiet al. (1984) EMBO J. 3:2717-2722), e aceleração balísticade partícula (ver, por exemplo, Sanford et al., patentes US4.945.050; US 5.879.918; US 5.886.244; e US 5.932.782;Tomes et al. (1995) in Plant Cell, Tissue, and OrganCulture: Fundamental Methods, ed. Gamborg and Phillips(Springer-Verlag, Berlin); McCabe et al. (1988)Biotechnology 6:923-926); e transformação de Lecl (WO00/28058) . Ver também Weissinger et al. (1988) Ann. Rev.Genet. 22:421-477; Sanford et al. (1987) ParticulateScience and Technology 5:27-37 (cebola); Christou et al.(1988) Plant Physiol. 87:671-674 (soja); McCabe et al.(1988) Bio/Technology 6:923-926 (soja); Finer e McMullen(1991) In Vitro Cell Dev. Biol. 27P:175-182 (soja); Singhet al. (1998) Theor. Appl. Genet. 96:319-324 (soja); Dattaet al. (1990) Biotechnology 8:736-740 (arroz); Klein et al.(1988) Proc. Natl. Acad. Sei. USA 85:4305-4309 (milho);Klein et al. (1988) Biotechnology 6:559-563 (milho);patentes US 5.240.855; US 5.322.783 e US 5.324.646; Kleinet al. (1988) Plant Physíol. 91:440-444 (milho); Froram etal. (1990) Biotechnology 8:833-839 (milho); Hooykaas-VanSlogteren et al. (1984) Nature (London) 311:763-764;patente US 5.736.369 (cereais); Bytebier et al. (1987)Proc. Natl. Acad. Sei. USA 84:5345-5349 (Liliaceae); De Wetet al. (1985) in The Experimental Manipulation of OvuleTissues, ed. Chapman et al. (Longman, New York), pp. 197-209 (pólen); Kaeppler et al. (1990) Plant Cell Reports9:415-418 e Kaeppler et al. (1992) Theor. Appl. Genet.84:560-566 (transformação mediada por sonda); D'Halluin etal. (1992) Plant Cell 4:1495-1505 (eletroporação); Li etal. (1993) Plant Cell Reports 12:250-255 e Christou e Ford(1995) Annals of Botany 75:407-413 (arroz); Osjoda et al.(1996) Nature Biotechnology 14:745-750 (milho viaAgrobacterium tumefaciens) ; todas as quais são aquiincorporadas a titulo de referência.

Os métodos são bem conhecidos no estado da técnicapara a inserção direcionada de um polinucleotideo em umalocalização especifica no genoma da planta. Em umaconcretização, a inserção do polinucleotideo em umadesejada localização genômica é alcançada usando um sistemade recombinação sitio-especifica. Ver, por exemplo,W099/25821, W099/25854, WO99/25840, W099/25855 eW099/25853, todos os quais são aqui incorporados a titulode referência. Em resumo, o polinucleotideo dasconcretizações pode estar contido em cassete detransferência flanqueado por dois sitios de recombinaçãonão-idênticos. O cassete de transferência que é introduzidoem uma planta possui estavelmente incorporado em seu genomaum sitio alvo que é flanqueado por dois sitios derecombinação não-idênticos que correspondem aos sitios docassete de transferência. É provida uma recombinaseapropriada e o cassete de transferência é integrado nositio alvo. O polinucleotideo de interesse é, por essemeio, integrado em uma posição cromossômica especifica nogenoma da planta.

As células que foram transformadas podem ser deixadasa crescer até plantas de acordo com maneiras convencionais.Ver, por exemplo, McCormick et al. (1986) Plant CellReports 5:81-84. Essas plantas podem, então, ser deixadas acrescer e serem tanto polinizadas com a mesma estirpetransformada ou com estirpes diferentes, e ser identificadaa progênie resultante tendo a expressão constitutiva dacaracterística fenotipica desejada. Duas ou mais geraçõespodem ser crescidas para assegurar que a expressão dacaracterística fenotipica desejada fique estavelmentemantida e seja herdada e, depois, sementes sejam colhidaspara assegurar que a expressão da característica fenotipicadesejada tenha sido alcançada. Desta maneira, asconcretizações fornecem semente transformada (tambémreferidas como "semente transgênica") tendo um constructode nucleotideos das concretizações, por exemplo, um cassetede expressão das concretizações, estavelmente incorporadono seu genoma.

Como aqui usado, o termo "planta" pode ser uma plantacompleta, qualquer parte da mesma, ou uma célula ou culturade tecido derivado de uma planta. Portanto, o termo"planta" pode se referir a qualquer um entre: plantasinteiras, componentes ou órgãos de planta (incluindo, masnão limitados a embriões, pólen, óvulos, sementes, folhas,flores, ramos, fruta, grãos (kernels), espigas, sabugos,palha, colmos, raizes, pontas de raiz, anteras, esemelhantes), tecidos de planta, células de planta,protoplastos de planta, culturas de tecido de célula deplanta a partir das quais a planta de milho pode serregenerada, calos de planta, aglomerados de planta esementes de planta. Uma célula de planta é uma célula que éretirada tanto diretamente de uma semente de uma plantaquanto da planta, ou derivada através do cultivo de umacélula retirada de uma planta. O termo grão {grain) tem aintenção de significar a semente madura produzida paraagricultores comerciais para propósitos diferentes docrescimento ou reprodução da espécie. A progênie, asvariantes e as mutantes das plantas regeneradas tambémestão incluídas dentro do escopo das concretizações, desdeque essas partes compreendam os polinucleotideosintroduzidos.

As concretizações da invenção podem ser usadas paraconferir ou melhorar a resistência a patógeno fúngico deplanta ou para proteger plantas do ataque de patógemofúngico, especialmente milho (Zea mays) . Serão protegidasdiferentes partes da planta do ataque de patógenos,incluindo, mas não estando limitadas a colmos, espigas,folhas, raizes e pendões. Outras espécies de planta tambémpodem ser de interesse na prática das concretizações dainvenção, incluindo, mas não estando limitadas a, outrasplantas monocotiledôneas de cultivo.

Quando apropriado, os polinucleotideos podem serotimizados para se obter expressão aumentada no organismotransformado. Por exemplo, os polinucleotideos podem sersintetizados usando códons planta-preferidos para expressãomelhorada. Ver, por exemplo, Campbell e Gowri (1990) PlantPhysiol. 92:1-11 para uma discussão da utilização de códonhospedeiro-preferido. Estão disponíveis no estado datécnica os métodos para sintetizar genes planta-preferidos.Ver, por exemplo, patentes US 5.380.831 e US 5.436.391, eMurray et al. (1989) Nucleic Acids Res. 17:477-498, aquiincorporados a titulo de referência.

As concretizações da presente invenção podem sereficazes contra uma diversidade de patógenos de planta,particularmente patógenos fúngicos, tais como, por exemplo,Colletotrichum, incluindo Cg. As concretizações da presenteinvenção também podem ser eficazes contra a podridão docolmo de milho, incluindo podridão do colmo por antracnose,sendo que o agente causador é o Colletotrichum. Outrosfungos patogênicos de planta e oomicetos (muitos, destesúltimos, historicamente têm sido considerados fungos,apesar de que agora os taxonomistas modernos estãoclassificando-os separadamente) incluem, mas não estãolimitados aos seguintes: Soja: Phytophthora megasperma fsp.glycinea, Macrophomina phaseolina, Rhizoctonia solani,Sclerotinia sclerotiorum, Fusarium oxysporum, Diaporthephaseolorum var. sojae (Phomopsis sojae), Diaporthephaseolorum var. caulivora, Sclerotium rolfsii, Cercosporakikuchii, Cercospora sojina, Peronospora manshurica,Colletotrichum dematium (Colletotichum truncatum),Corynespora cassiicola, Septoria glycines, Phyllostíctasojicola, Alternaria alternata, Microsphaera diffusa,Fusarium semitectum, Phialophora gregata, Glomerellaglycines, Phakopsora pachyrhízi, Pythium aphanidermatum,Pythium ultimum, Pythium debaryanum, Fusarium solani;Canola: Albugo cândida, Alternaria brassicae,Leptosphaeria maculans, Rhizoctonia solani, Sclerotiniasclerotiorum, Mycosphaerella brassiccola, Pythium ultimum,Peronospora parasitica, Fusarium roseum, Alternariaalternata; Alfalfa: Pythium ultimum, Pythium irregulare,Pythium splendens, Pythium debaryanum, Pythiumaphanidermatum, Phytophthora megasperma, Peronosporatrifoliorum, Phoma medicaginis var. medicaginis, Cercosporamedicaginis, Pseudopeziza medicaginis, Leptotrochilamedicaginis, Fusarium oxysporum, Verticillium albo-atrum,Aphanomyces euteiches, Stemphylium herbarum, Stemphyliumalfalfae, Colletotrichum trifolii, Leptosphaerulinabriosiana, Uromyces striatus, Sclerotinia trifoliorum,Stagnospora meliloti, Stemphylium botryosum, Leptotrochilamedicaginis; Trigo: ürocystis agropyri, Alternariaalternata, Cladosporium herbarum, Fusaríum graminearum,Fusarium avenaceum, Fusarium culmorum, Ustilago tritici,Ascochyta tritici, Cephalosporium gramineum, Collotetrichumgraminicola, Erysiphe graminis f.sp. tritici, Pucciniagraminis f.sp. tritici, Puccinia recôndita f.sp. tritici,Puccinia striiformis, Pyrenophora tritici-repentis,Septoria nodorum,' Septoria tritici, Septoria avenae,Pseudocercosporella herpotrichoides, Rhizoctonia solani,Rhizoctonia cerealis, Gaeumannomyces graminis var. tritici,Pythium aphanidermatum, Pythium arrhenomanes, Pythiumultimum, Bipolaris sorokiniana, Claviceps purpurea,Tilletia tritici, Tilletia laevis, Ustilago tritici,Tilletia indica, Rhizoctonia solani, Pythium arrhenomannes,Pythium gramicola, Pythium aphanidermatum; Girassol:Plasmophora halstedii, Sclerotinia sclerotiorum, Septoriahelianthi, Phomopsis helianthi, Alternaria helianthi,Alternaria zinniae, Botrytis cinerea, Phoma macdonaldii,Macrophomina phaseolina, Erysiphe cichoracearum, Rhizopusoryzae, Rhizopus arrhizus, Rhizopus stolonifer, Pucciniahelianthi, Verticillium dahliae, Erwinia carotovorum pv.carotovora, Cephalosporium acremonium, Phytophthoracryptogea, Albugo tragopogonis; Milho: Fusarium moniliformevar. subglutinans, Erwinia stewartií, Fusarium moniliforme,Gibberella zeae (Fusarium graminearum), Stenocarpella maydi(Diplodia maydis), Pythium irregulare, Pythium debaryanum,Pythium graminicola, Pythium splendens, Pythium ultimum,Pythium aphanidermatum, Aspergillus flavus, Bipolarismaydis 0, T (Cochliobolus heterostrophus), Helminthosporiumcarbonum I, II & III (Cochliobolus carbonum) , Exserohilumturcicum I, II & III, Helminthosporium pedicellatum,Physoderma maydis, Phyllosticta maydis, Kabatiella maydis,Cercospora sorghi, Ustilago maydis, Puccinia sorghi,Puccinia polysora, Macrophomina phaseolina, Penicilliumoxalicum, Nigrospora oryzae, Cladosporium herbarum,Curvularia lunata, Curvularia inaequalis, Curvulariapallescens, Trichoderma vir ide, Claviceps sorghi, Erwiniachrysanthemi pv. zea, Erwinia carotovora, Diplodiamacrospora, Sclerophthora macrospora, Peronosclerosporasorghi, Peronosclerospora philippinensis, Peronosclerosporamaydis, Peronosclerospora sacchari, Sphacelotheca reiliana,Physopella zeae, Cephalosporium maydis, Cephalosporiumacremonium; Sorgo: Exserohilum turcicum, Colletotrichumgraminicola (Glomerella graminicola), Cercospora sorghi,Gloeocercospora sorghi, Ascochyta sorghina, Pucciniapurpurea, Macrophomina phaseolina, Perconia circinata,Fusarium moniliforme, Alternaria alternata, Bipolarissorghicola, Helminthosporium sorghicola, Curvularia lunata,Phoma insidiosa, Ramulispora sorghi, Ramulisporasorghicola, Phyllachara sacchari, Sporisorium reilianum(Sphacelotheca reiliana), Sphacelotheca cruenta,Sporisorium sorghi, Claviceps sorghi, Rhizoctonia solani,Acremonium strictum, Sclerophthona macrospora,Peronosclerospora sorghi, Peronosclerospora philippinensis,Sclerospora graminicola, Fusarium graminearum, Fusariumoxysporum, Pythium arrhenomanes, Pythium graminicola, etc.O termo "germoplasma" se refere ao material genéticode um indivíduo ou oriundo de um indivíduo (por exemplo,uma planta) , de um grupo de indivíduos (por exemplo, umalinhagem, variedade ou família de planta) , ou de um clonederivado de uma linhagem, variedade, espécie ou cultura. 0germoplasma pode ser parte de um organismo ou célula, oupode ser separado a partir do organismo ou célula. Emgeral, o germoplasma prove o material genético com umacomposição molecular especifica que prove uma fundamentação(base) fisica para uma ou todas as qualidades hereditáriasde um organismo ou cultura de célula. Como aqui usado, ogermoplasma inclui células, sementes ou tecidos a partirdos quais novas plantas podem ser crescidas, ou partes deplanta, tais como folhas, caules, pólen, ou células quepodem ser cultivadas até se tornarem uma planta completa.

O termo "alelo" se refere a uma ou mais diferentesseqüências de nucleotideos que ocorrem em um lócusespecifico. Um primeiro alelo é encontrado em umcromossomo, enquanto que um segundo alelo ocorre na mesmaposição no homólogo daquele cromossomo, por exemplo, comoocorre para diferentes cromossomos de um indivíduoheterozigoto, ou entre diferentes homozigotos ou indivíduosheterozigotos em uma população. Um "alelo favorável" é oalelo em um lócus particular que confere, ou contribuipara, um fenótipo agronomicamente desejável, por exemplo,resistência à infecção por Cg. Um alelo favorável de ummarcador é um alelo de marcador que segrega com o fenótipofavorável. Uma forma alélica favorável de um segmento decromossomo é um segmento de cromossomo que inclui umaseqüência de nucleotideo que contribui para o desempenhoagronômico superior em um ou mais lócus genéticosfisicamente localizados no segmento do cromossomo. O termo"freqüência de alelo" se refere à freqüência (proporção oupercentagem) de um alelo dentro de uma população, ou umapopulação de linhagens. Pode-se estimar a freqüência dealelos dentro de uma população pela média de freqüências dealelos de uma amostra de indivíduos a partir daquelapopulação.

Um alelo se correlaciona "positivamente" com umcaractere quando o alelo está ligado ao caractere e quandoa presença do alelo é um indicador de que o caractere ouforma de caractere desejada ocorrerá em uma planta quecompreende o alelo.

Um indivíduo é "homozigoto" se ele possuir somente umtipo de alelo em um dado lócus (por exemplo, um indivíduodiplóide possui uma cópia do mesmo alelo em um lócus paracada um dos dois cromossomos homólogos) . Um indivíduo é"heterozigoto" se mais do que um tipo de alelo estiverpresente em um dado lócus (por exemplo, um indivíduodiplóide com uma cópia de cada um dos dois diferentesalelos) . Um caso especial de uma situação heterozigota équando um cromossomo possui um alelo de um gene e no outrocromossomo falta completamente aquele gene, lócus ou regiãoem outras palavras, tem uma deleção com relação aoprimeiro cromossomo. Esta situação é referida como"hemizigota". O termo "homogeneidade" indica que membros deum grupo possuem o mesmo genótipo em um ou mais lócusespecíficos. Em contraste com isso, o termo"heterogeneidade" é usado para indicar que indivíduosdentro do grupo diferem em genótipo em um ou mais lócusespecíficos.

As concretizações provêem não somente um gene e suasvariantes funcionais para uso em aplicações transgênicas,mas também seqüências e processos que permitem que o genede resistência Regi seja transportado entre linhagens demilho usando melhoramento assistido por marcador. Asconcretizações também se referem às plantas produzidas poresses processos que retêm um intervalo cromossômicotruncado compreendendo o gene de resistência Regi.

Um mapa genético é uma representação gráfica de umgenoma (ou uma porção de um genoma tal como um cromossomosimples) onde as distâncias entre os marcos de limite em umcromossomo são medidas pelas freqüências de recombinaçãoentre os marcos de limite. As recombinações entre marcos delimite genéticos podem ser detectadas usando umadiversidade de marcadores genéticos moleculares (tambémchamados de marcadores moleculares) que são aqui descritosem maiores detalhes.

Para que os marcadores sejam utilizáveis em detectarrecombinações, eles precisam detectar diferenças, oupolimorfismos, dentro de uma população que está sendomonitorada. Para marcadores moleculares, isto significadiferenças ao nivel de DNA devido às diferenças deseqüência de polinucleotideo (por exemplo, SSRs, RFLPs,FLPs, SNPs) . A variabilidade genética pode ser de qualquerorigem, por exemplo, inserções, deleções, duplicações,elementos de repetição, mutações pontuais, eventos derecombinação, ou a presença e seqüência de elementos detransposição. Os marcadores moleculares podem ser derivadosde ácidos nucléicos genômicos ou expressados (por exemplo,ESTs) . Os ESTs são em geral bem conservados dentro de umaespécie, enquanto que outras regiões de DNA (tipicamentenão-codificante) tendem a acumular polimorfismos e,portanto, podem ser mais variáveis entre indivíduos damesma espécie. Um grande número de marcadores molecularesde milho é conhecido no estado da técnica e estãopublicados ou disponíveis a partir de várias fontes, taiscomo o recurso de internet Maize GDB e o recurso deinternet Arizona Genomics Institute rodado pela Universidadedo Arizona.

Os marcadores moleculares podem ser usados em umadiversidade de aplicações de melhoramento de planta (ver,por exemplo, Staub et al. (1996) Hortscience 31: 729-741;Tanksley (1983) Plant Molecular Biology Repórter. 1: 3-8).

Uma das principais áreas de interesse é aumentar aeficiência de retrocruzamento e introgressão de genes usandoa seleção marcador-assistida (MAS). Um marcador molecularque mostra ligação com um lócus que afeta um desejadocaractere fenotípico prove uma ferramenta utilizável para aseleção do caractere em uma população de plantas. Isto éparticularmente verdade quando o fenótipo é difícil de seranalisado, por exemplo, muitos caracteres de resistência adoenças, ou ocorre em um estágio mais tardio nodesenvolvimento de plantas, por exemplo, características degrão. Na medida em que os ensaios de marcador de DNA sãomenos trabalhosos e ocupam menos espaço físico do que afenotipagem de campo, populações muito grandes podem seranalisadas, aumentando as chances de encontrar umrecombinante com o segmento alvo oriundo da linhagem doadoratransportado para a linhagem receptora. Quanto mais próximafor a ligação, mais utilizável será o marcador, na medida emque a recombinação é menos provável ocorrer entre o marcadore o gene causador do caractere, o que pode resultar emfalsos positivos. Com o uso de marcadores flanqueadoresdiminuem as chances de que a seleção de falso positivoocorra, tanto quanto seja necessário um evento de duplarecombinação. A situação ideal é ter um marcador no própriogene, de modo que a recombinação não possa ocorrer entre omarcador e o gene. Tal marcador é chamado um "marcadorperfeito".

Quando um gene é introgredido por MAS, não é somente ogene que é introduzido mas também as regiões flanqueadoras(Gepts. (2002). Crop Sei; 42: 1780-1790). Isto é referidocomo "arraste de ligação". No caso em que a planta doadorafor altamente não-relacionada com relação à plantareceptora, como no caso do lócus de Regi que está sendointrogredido a partir da MP305, uma fonte exótica, emendogâmicas elite, essas regiões flanqueadoras portam genesadicionais que podem codificar caracteres agronomicamenteindesejáveis. Este "arraste de ligação" também poderesultar em produtividade reduzida ou outrascaracterísticas agronômicas negativas mesmo após múltiplosciclos de retrocruzamento na linhagem de milho elite. Istotambém é algumas vezes referido como "arraste deprodutividade". O tamanho da região flanqueadora pode serdiminuído por retrocruzamento adicional, apesar de que istonão é sempre bem sucedido na medida em que os melhoristasnão têm controle sobre o tamanho da região .ou sobre osbreakpoints de recombinação (Young et al. (1998) Genetics120:57 9-585). No melhoramento clássico, usualmente, ésomente por acaso que recombinações que são selecionadascontribuem para a redução no tamanho do segmento da doadora(Tanksley et al. (1989). Biotechnology 7: 257-264). Mesmoapós 20 retrocruzamentos deste tipo, espera-se encontrar umaporção bastante grande do cromossomo da doadora ainda ligadaao gene que está sendo selecionado. Com marcadores,entretanto, é possível selecionar aqueles raros indivíduosque tenham experimentado recombinação perto do gene deinteresse. Em 150 plantas retrocruzadas, há 95% de chance deque pelo menos uma planta tenha experimentado um crossover(cruzamento) dentro de 1 cM do gene, com base em umadistância no mapa de meiose simples. Os marcadorespossibilitarão identificação inequívoca desses indivíduos.Com um retrocruzamento adicional de 300 plantas, pode haveruma chance de 95% de um crossover dentro de uma distância nomapa de meiose simples de 1 cM, gerando um segmento em tornodo gene alvo de menos que 2 cM com base em uma distância nomapa de meiose simples. Isto pode ser realizado em duasgerações com marcadores, enquanto que requereria uma médiade 100 gerações sem marcadores (ver Tanksley et al., acimamencionado). Quando a localização exata de um gene éconhecida, uma série de marcadores flanqueadores no entornodo gene pode ser utilizada para selecionar recombinações emdiferentes tamanhos de população. Por exemplo, emrecombinações de tamanhos menores de população pode seresperada uma distância adicional do gene, de modo quemarcadores flanqueadores mais distais devem ser requeridospara detectar a recombinação.

A disponibilidade de mapas de ligação integrada dogenoma de milho contendo densidades aumentadas demarcadores de milho públicos facilitou o mapeamentogenético de milho e do MAS. Ver, por exemplo, o mapaNeighbors 4 IBM2 [online], [recuperado em 21-3-2006].Recuperação feita a partir do sitio de Internet:<URL:http://www.maizegdb.org/ cgi-bin/displaymaprecord.cgi?id=871214>.

Os componentes chave para a implementação do MAS são:

(i) definir a população dentro da qual a associaçãomarcador-caractere será determinada, a qual pode ser umapopulação segregante, ou uma população aleatória ouestruturada; (ii) monitorar a segregação ou associação demarcadores polimórficos com relação ao caractere edeterminar a ligação ou associação usando métodosestatísticos; (iii) definir um conjunto de marcadoresdesejáveis com base nos resultados da análise estatística e(iv) usar e/ou extrapolar esta informação ao conjunto atualde germoplasma de melhoramento para possibilitar as decisõesda seleção baseada em marcador. Os três tipos de marcadordescritos neste relatório podem ser. usados em protocolos deseleção assistida por marcador; marcadores de repetiçãosimples de seqüência (SSR, também conhecida comomicrossatélite), marcadores de polimorfismo simples denucleotídeos (SNP) e marcadores polimórficos de comprimentode fragmento (FLP). As SSRs podem ser definidas comocorridas relativamente curtas de DNA repetido em tandem comcomprimentos de 6 pb ou menos (Tautz (1989) Nucleic AcidResearch 17: 6463-6471; Wang et al. (1994) Theoretical andApplied Genetics, 88:1-6) . Os polimorfismos surgem devido àvariação no número de unidades de repetição, provavelmentecausada por deslizamento durante a replicação de DNA(Levinson e Gutman (1987) Mol Biol Evol 4: 203-221). Avariação no comprimento da repetição pode ser detectadapelo desenho de primers de PCR para as regiõesflanqueadoras não-repetitivas conservadas (Weber e May(1989) Am J Hum Genet 44:388-396). As SSRs são altamenteapropriadas para o mapeamento e para o MAS na medida em queelas são multi-alélicas, co-dominantes, reproduzíveis ereceptivas à automação de alta produção (Rafalski et al.(1996) Generating and using DNA markers in plants. In:Non-mammalian genomic analysis: a practical guide. Academicpress . pp 75-135) .Por exemplo, no Exemplo 5 mais adiante, é provido umperfil de marcador de SSR de MP305. Este perfil de marcadorfoi gerado por eletroforese em gel dos produtos deamplificação gerados pelos pares de primers para essesmarcadores. A contagem de escore de genótipo de marcador ébaseada no tamanho do fragmento amplificado, o qual, nestecaso, foi medido por meio de peso de par de bases dofragmento. Apesar do fato de que a variação no primer usadoou nos procedimentos de laboratório podem afetar o peso dopar de bases relatado, os valores relativos permanecerãoconstantes independentemente do primer especifico ou dolaboratório usado. Portanto, quando se compara linhagens,os perfis de SSR que estão sendo comparados devem serobtidos a partir do mesmo laboratório, de modo que sejamusados os mesmos primers e equipamento. Por esta razão,quando se compara plantas ou marcadores específicos delinhagens vis à vis, é preferível determinar que taisplantas linhagens possuam os mesmos (ou diferentes) alelosem lócus específicos (por exemplo, pode-se dizer que se umaplanta não compreende o intervalo cromossômico derivado daMP305 em ou abaixo do UMC15a, ela não compreenderá alelosiguais à MP305 em todos os lócus em ou abaixo do UMC15alistados na Tabela 6 no Exemplo 5). Um serviço de SSR paramilho está disponível ao público em uma base contratual pormeio de marcos de DNA em Saint-Jean-sur-Richelieu, Quebec,Canadá.

Vários tipos de marcadores de FLP podem ser gerados.Mais comumente, primers de amplificação são usados paragerar polimorfismos de comprimento de fragmento. Taismarcadores de FLP são, em muitas maneiras, similares aosmarcadores de SSR, exceto pelo fato de que a regiãoamplificada pelos primers não é tipicamente uma regiãoaltamente repetitiva. Além disso, a região amplificada, ouamplicon, terá suficiente variabilidade entre ogermoplasma, freqüentemente devido a inserções ou deleções,de modo que os fragmentos gerados pelos primers deamplificação podem ser distinguidos entre indivíduospolimorficos, e de que é reconhecido que tais indelsocorrem freqüentemente em milho (Bhattramakki et al.(2002). Plant Mol Biol 48, 539-547; Rafalski (2002b), acimacitado). O termo "indel" se refere a uma inserção oudeleção, sendo que uma linhagem pode ser referida comotendo uma inserção com relação a uma segunda linhagem, ou asegunda linhagem pode ser referida como tendo uma deleçãocom relação à primeira linhagem. Os marcadores de MZA aquirevelados são exemplos de marcadores de FLP amplificadosque haviam sido selecionados porque eles estão em estreitaproximidade com relação ao gene Regi.

Os marcadores de SNP detectam substituições denucleotideos em par de bases simples. De todos os tipos demarcadores moleculares, os SNPs são os mais abundantes,tendo, portanto, o potencial para prover a resolução maisalta de mapa genético (Bhattramakki et al. 2002 PlantMolecular Biology 48:539-547). Os SNPs podem ser analisadosem um nível ainda mais alto de produção do que as SSRs, emum assim chamado modo 'ultra-alta-produção' ( yultra-high-throughput'), na medida em que eles não requerem grandesquantidades de DNA e a automação do ensaio pode ser direta.Os SNPs também têm o compromisso de serem sistemas de custorelativamente baixo. Esses três fatores juntos tornam osSNPs altamente atrativos para uso em MAS. Diversos métodosestão disponíveis para a genotipagem do SNP, incluindo, masnão estando limitados a, hibridização, extensão de primer,ligação de oligonucleotideo, clivagem por nuclease,miniseqüenciamento e esferas codificadas. Tais métodosforam revisados em: Gut (2001) Hum Mutat 17 pp. 475-492;Shi (2001) Clin Chem 47, pp. 164-172; Kwok (2000)Pharmacogenomics 1, pp. 95-100; Bhattramakki e Rafalski(2001) Discovery and application of single nucleotidepolymorphism markers in plants. In: R.J. Henry, Ed, PlantGenotyping: The DNA Fingerprinting of Plants, CABIPublishing, Wallingford. Uma ampla faixa de tecnologiascomercialmente disponíveis utilizam esses e outros métodospara examinar os SNPs, incluindo Masscode™ (Qiagen),Invader® (Third Wave Technologies), SnapShot® (AppliedBiosystems), Taqman® (Applied Biosystems) e Beadarrays™(Illumina).

Inúmeros SNPs juntos dentro de uma seqüência, ouatravés de seqüências ligadas, podem ser usados paradescrever um haplótipo para qualquer genótipo particular(Ching et al. (2002), BMC Genet. 3:19 pp Gupta et al. 2001,Rafalski (2002b) , acima citado) . Os haplótipos podem sermais informativos do que os SNPs simples e podem ser maisdescritivos do que qualquer genótipo particular. Porexemplo, um SNP simples pode ser o alelo >T" para a MP305,mas o alelo AT' também pode ocorrer na população demelhoramento de milho que está sendo utilizada para osparentais recorrentes. Neste caso, um haplótipo, porexemplo, uma série de alelos em marcadores de SNP ligados,pode ser mais informativo. Uma vez que um haplótipo únicotenha sido designado para uma região cromossômica dadoadora, esse haplótipo pode ser usado naquela população ouem qualquer subconjunto da mesma para se determinar se umindivíduo possui um gene particular. Ver, por exemplo,WO2003054229. O uso de plataformas de detecção de marcadorde alta produção automatizadas conhecidas daquelesespecialistas na técnica torna este processo altamenteeficiente e eficaz.

Como aqui descrito, muitos dos primers listados nasTabelas 1 e 2 podem ser usados como marcadores de FLP paraselecionar lócus de Regi. Esses "primers também podem serconvertidos nesses marcadores para SNP ou outros marcadoresestettturalmente semelhantes ou funcionalmente equivalentes(SSRs, CAPs, indels, etc), nas mesmas regiões. Umaabordagem muito produtiva para a conversão de SNP estádescrita em Rafalski (2002a) Current opinion in plantbiology 5 (2) : 94-100 e também em Rafalski (2002b) PlantScience 162: 329-333. No uso de PCR, os primers sãoutilizados para amplificar segmentos de DNA a partir deindivíduos (preferencialmente endogâmicos) que representama diversidade na população de interesse. Os produtos de PCRsão seqüenciados diretamente em uma ou ambas as direções.As seqüências resultantes são alinhadas e os polimorfismossão identificados. Os polimorfismos não estão limitados aPolimorfismos Simples de Nucleotideos (SNPs), mas tambémincluem indels, CAPS, SSRs, e VNTRs (número variável derepetições em tandem). Especificamente com relação àinformação refinada de mapa aqui descrita, pode-seprontamente usar a informação aqui provida para obter SNPs(e outros marcadores) polimórficos adicionais dentro daregião amplificada pelos primers listados nesta descrição.

Os marcadores dentro da região descrita do mapa pode serhibridizada com BACs ou outras bibliotecas genômicas, oualinhadas, por meios eletrônicos, com seqüências genômicaspara encontrar novas seqüências na mesma localizaçãoaproximada com relação aos marcadores descritos.

Em adição aos SSR's, FLPs e SNPs acima descritos,outros tipos de marcadores moleculares são tambémamplamente utilizados, incluindo, mas não estando limitadosa, marcadores [tags) de seqüências expressadas (ESTs) emarcadores de SSR derivados de seqüências EST, e DNApolimórfico aleatoriamente amplificado (RAPD). Como aquiusado, o termo "Marcador Genético" se referirá a qualquermarcador baseado em ácido nucléico, incluindo, mas nãoestando limitado a, Polimorfismo de Comprimento deFragmento de Restrição (RFLP), Repetição Simples deSeqüência (SSR), DNA Polimórfico Aleatoriamente Amplificado(RAPD), Seqüências Polimórficas Clivadas Amplificadas(CAPS) (Rafalski e Tingey, 1993, Trends in Genetics 9:275-280) , Polimorfismo de Comprimento de Fragmento Amplificado(AFLP) (Vos et al., 1995, Nucleic Acids Res. 23:4407-4414),Polimorfismo Simples de Nucleotideo (SNP) (Brookes, 1999,Gene 234:177-18 6), Região Amplificada de SeqüênciaCaracterizada (SCAR) (Paran e Michelmore, 1993, Theor.Appl. Genet. 85:985-993), Sitio Marcado {Tagged) deSeqüência (STS) (Onozaki et ai., 2004, Euphytica 138:255-262), Polimorfismo de Conformação de Simples Fita (SSCP)(Orita et al., 1989, Proc Natl Acad Sei USA 8 6:27 66-277 0),Repetição de Seqüência Inter-Simples (ISSR) (Blair et al.,1999, Theor. Appl. Genet. 98:780-792), PolimorfismoAmplificado Inter-Retrotransposon (IRAP), PolimorfismoAmplificado de Retrotransposon-Microsatélite (REMAP)(Kalendar et al. , 1999, Theor. Appl. Genet. 98:704-711), uraproduto de clivagem de RNA (tal como um tag Lynx) esemelhantes.

Mais genericamente, o termo "marcador molecular" podeser usado para se referir a um marcador genético, comodefinido acima, ou a um produto codificado pelo mesmo (porexemplo, uma proteina) usado como um ponto de referênciaquando se identifica um lócus ligado. Um marcador pode serderivado de seqüências genômicas de nucleotideos ou deseqüências expressadas de nucleotideos (por exemplo,oriundo de um RNA processado {spliced) , de um cDNA, etc),ou a partir de um polipeptideo codificado. O termo tambémse refere às seqüências de ácido nucléico complementares aou flanqueando as seqüências de marcador, tais como osácidos nucléicos usados como sondas ou pares de primercapazes de amplificar a seqüência de marcador. Uma "sondade marcador molecular" é uma seqüência de ácido nucléico oumolécula que pode ser usada para identificar a presença deum lócus de marcador, por exemplo, uma sonda de ácidonucléico que é complementar a uma seqüência de lócus demarcador. Alternativamente, em alguns aspectos, uma sondade marcador se refere a uma sonda de qualquer tipo que écapaz de distinguir (ou seja, genótipo) o alelo particularque está presente em um lócus de marcador. Ácidos nucléicossão "complementares" quando eles hibridizam especificamenteem solução, por exemplo, de acordo com as regras depareamento de bases de Watson-Crick. Alguns dos marcadoresaqui descritos também são referidos como marcadores dehibridização quando localizados em uma região de indel, talcomo a região não-colinear aqui descrita. Isto é devido aofato de que a região de inserção é, por definição, umpolimorfismo vis à vis uma planta sem a inserção. Portanto,o marcador precisa somente indicar se a região de indelestá presente ou ausente. Qualquer apropriada tecnologia dedetecção de marcador pode ser usada para identificar talmarcador de hibridização, por exemplo, a tecnologia de SNPé usada nos exemplos aqui fornecidos.

Um "ácido nucléico genômico" é um ácido nucléico quecorresponde, em seqüência, a um ácido nucléico hereditárioem uma célula. Exemplos comuns incluem DNA genômico denúcleo e amplicons do mesmo. Um ácido nucléico genômico é,em alguns casos, diferente de um RNA processado (spliced) ,ou um correspondente cDNA, em que o RNA spliced ou o cDNA éprocessado, por exemplo, por meio da maquinaria deprocessamento, para remover introns. Os ácidos nucléicosgenômicos opcionalmente compreendem seqüências não-transcritas (por exemplo, seqüências estruturais docromossomo, regiões de promotor, regiões de enhancer, etc.)e/ou não-traduzidas (por exemplo, introns), enquanto que oRNA spliced/cDNA tipicamente não possuem seqüências nãotranscritas ou introns. Um "ácido nucléico template" é umácido nucléico que serve como um molde em uma reação deamplificação (por exemplo, uma reação de amplificaçãobaseada em polimerase, tal como PCR, uma reação deamplificação mediada por ligase, tal como LCR, uma reaçãode transcrição, ou semelhante). Um ácido nucléico templatepode ser genômico na origem, ou, alternativamente, pode serderivado de seqüências expressadas, por exemplo, um cDNA ouum EST.

O termo "amplificar", no contexto de amplificação deácido nucléico é qualquer processo pelo qual são produzidascópias adicionais de um ácido nucléico selecionado (ou deuma forma transcrita do mesmo). Métodos tipicos deamplificação incluem vários métodos de replicação baseadosem polimerase, incluindo a reação em cadeia de polimerase(PCR), métodos mediados por ligase, tais como a reação emcadeia de ligase (LCR) e métodos de amplificação baseada empolimerase de RNA (por exemplo, por transcrição) . Um"amplicon" é um ácido nucléico amplificado, por exemplo, umácido nucléico que é produzido por amplificação de um ácidonucléico template por qualquer método de amplificaçãodisponível (por exemplo, PCR, LCR, transcrição ousemelhantes).

Os perfis de isozima e as características morfologicasligadas também podem, em alguns casos, ser indiretamenteusados como marcadores. Mesmo que eles não detectemdiretamente diferenças de DNA, eles freqüentemente sãoinfluenciados por diferenças genéticas específicas.Entretanto, os marcadores que detectam variação de DNA sãomuito mais numerosos e polimórficos do que os marcadores deisozima ou morfológicos (Tanksley (1983) Plant MolecularBiology Repórter 1:3-8).

Os alinhamentos de seqüência ou contigs também podemser usados para encontrar seqüências a montante ou ajusante dos marcadores específicos listados aqui. Essasnovas seqüências, próximas dos marcadores descritos aqui,são depois usadas para descobrir e desenvolver marcadoresfuncionalmente equivalentes.

Por exemplo, diferentes mapas físicos ou genéticos sãoalinhados para localizar marcadores equivalentes nãodescritos neste relatório, mas que estão dentro de regiõessimilares. Esses mapas podem estar dentro de espécies demilho, ou mesmo ao longo de outras espécies, as quais nãotenham sido geneticamente ou fisicamente alinhadas commilho, tais como arroz, trigo, cevada ou sorgo.Como observado no Exemplo 2, pelo uso de seqüênciascomuns oriundas da região flanqueadora do lócus de Regi quehibridizou com BACs nas bibliotecas do Mol7 de do BAC deB73, os BACs oriundos de ambas as bibliotecas foramdispostos com o BAC oriundo da região flanqueadora homólogaDE811ASR(BC5) do lócus de Regi em uma rota diferente(tiling path) como mostrado na Figura 9(a). Os BACs de B73públicos c0113f01 e c0117el8 foram identificados comodiretamente norte e sul, respectivamente, do lócus de Regi.

Com esta informação, uma tiling path não-contiguaestendida de BACs de B73 entre os marcadores genéticosUMC2285 e UMC15a, UMC2285 e UMC2187, UMC1086 e UMC2200, ouUMC2041 e UMC2200, pode ser criada por alinhamento demarcadores genéticos dentro desta região com o mapa fisicodo BAC de B73. A informação de alinhamento dos mapasgenético e fisico de B73 é obtida a partir da base de dadosdo genoma de milho do Arizona Genomics Institute disponívelna world wide web, acessado pela entrada do seguinteendereço na web com o prefixo "www.">:genome.arizona.edu/fpc/maize/#webagcol. Na vista WebChrom,pode-se selecionar os marcadores genéticos nas vizinhançasdo gene Regi e obter um link com o contig fisico onde essesmarcadores estão localizados. Pelo alinhamento do mapafisico com o mapa genético feito dessa maneira, pode-seencontrar um plethora de BACs de B73 na região entre osintervalos cromossômicos definidos pelos marcadoresgenéticos UMC2285 e UMC15a, UMC2285 e UMC2187, UMC1086 eUMC2200, ou UMC2041 e UMC2200. Os BACs podem ser usadospelos especialistas na técnica para desenvolver novosmarcadores para introgressão do lócus de Regi nogermoplasma de milho. Em particular, tais marcadoresgenéticos são utilizáveis no rastreamento do lócus de Regiem quaisquer linhagens nas quais o lócus de Regi ou o geneRegi tenha sido introgredido, e na seleção do genoma deparental recorrente em um programa de retrocruzamento.

Por exemplo, a informação de seqüência da região nasvizinhanças do lócus de Regi pode ser usada para desenharmarcadores polimórficos que serão utilizáveis emintrogressão e seleção do gene ou lócus de Regi em outrogermoplasma de milho. Há muitos B73 derivados decromossomos artificiais bacterianos (BACs) disponíveis naregião de interesse a partir da qual a informação deseqüência pode ser obtida. Um exemplo de BACs na região deinteresse é ilustrada na Figura 21, a qual mostra um contigno mapa fisico de B73 que é homólogo à região de Regi emDE811ASR (BC5) [Figura 21 encontrada em 10-03-2006] .Buscada a partir do sitio de Internet <URL:http://www.genome.arizona.edu/egi-bin//WebAGCoL/WebFPC/WebFPC Direct v2.1.cgi?name=maize&contig=187&marker=ssul>. A informação de seqüência é obtidatanto através de informação que já está disponível aopúblico (por exemplo, seqüência-terminal de BAC, seqüênciade Tags de Seqüência Expressada (ESTs) que hibridizam comBACs nesta região, sondas do tipo overgo (sobreposição) quefreqüentemente se relacionam com esses ESTs, etc.) ou paraobter nova seqüência pelo seqüenciamento direto de clonesde BAC nesta região. A partir desta seqüência podem serdeterminadas quais regiões são, em maioria, únicas usandodiversos métodos diferentes conhecidos dos especialistas natécnica. Por exemplo, pelo uso do software de predição degene ou pela técnica de blasting da seqüência contra todasas seqüências disponíveis de milho, pode-se selecionar aseqüência não-repetitiva. A seqüência de baixo número decópias pode ser usada para desenvolver uma ampla série demarcadores baseados em ácido nucléico. Esses marcadores sãousados para realizar o screening do material de planta noqual o lócus de Regi está presente e o material de plantano qual o lócus de Regi está ausente. Se for desejado ummarcador fora do lócus de Regi, então os marcadores sãousados para realizar o screening do material de planta noqual o lócus de Regi está presente e o material de plantano qual o lócus de Regi está ausente para se determinar seo marcador é polimórfico em tal germoplasma. Os marcadorespolimórficos são então usados na introgressão assistida pormarcador e na seleção da região de Regi e, de modo ótimo,também na seleção do genoma do parental recorrente, emoutro germoplasma de milho. Portanto, com a localização dolócus de Regi identificada e estabelecida sua associaçãocom a resistência a Colletotrichum, os especialistas natécnica podem utilizar qualquer número de marcadoresexistentes, ou prontamente desenvolver novos marcadores,que podem ser usados na introgressão ou identificação dapresença ou ausência do lócus de Regi em germoplasma, eselecionar o genoma do parental recorrente em um programade retrocruzamento.Em um mapa genético, a ligação de um marcadormolecular a um gene ou a um outro marcador molecular émedida como uma freqüência de recombinação. Em geral, osdois lócus mais próximos (por exemplo, os dois marcadoresde SSR) estão no mapa genético mais próximos do que elesficam um do outro no mapa fisico. Uma distância genéticarelativa (determinada pela sobreposição de freqüências,medida em centimorgans; cM) pode ser proporcional àdistância fisica (medida em pares de base, por exemplo, empares de quilobases [kb] ou em mega-pares de bases [Mbp] )que separa dois lócus ligados entre si em um cromossomo. Aausência de proporcionalidade precisa entre cM e adistância fisica pode resultar da variação em freqüênciasde recombinação para diferentes regiões cromossômicas, porexemplo, algumas regiões cromossômicas são recombinação dotipo "hot spots", enquanto outras regiões não mostramqualquer recombinação, ou somente demonstram raros eventosde recombinação. Alguns dos dados de introgressão e deinformação de mapeamento sugerem que a região em torno dolócus de Regi é uma daquelas que possuem uma grandequantidade de recombinação.

Em geral, quanto mais próximo um marcador estiver deum outro marcador, se medido em termos de recombinação oudistância fisica, mais fortemente eles estão ligados.Quanto mais próximo um marcador estiver de um gene quecodifica um polipeptideo que confere um fenótipo particular(resistência a doença), se medido em termos de recombinaçãoou de distância fisica, melhor aquele marcador será paramarcar o caractere fenotipico desejado. Se possível, omelhor marcador é aquele que fica dentro do próprio gene,na medida em que ele sempre permanecerá ligado com o genecausador do fenótipo desejado.

A variabilidade genética de mapeamento também pode serobservada entre diferentes populações da mesma espécie decultura, incluindo milho. A despeito desta variabilidade nomapa genético que pode ocorrer entre populações, o mapagenético e a informação de marcador derivada de umapopulação geralmente permanece utilizável ao longo demúltiplas populações na identificação de plantas comcaracteres desejados, contra-seleção de plantas comcaracteres indesejáveis e na orientação de MAS.

Na localização de marcadores equivalentes ao longo demapas genéticos, uma população de mapeamento pode ser usadapara confirmar se qualquer marcador equivalente está dentroda região aqui descrita e, portanto, utilizável na seleçãode Regi. Usando este método, o marcador equivalente,juntamente com os marcadores listados aqui, é mapeado nadita população de mapeamento. Qualquer marcador equivalenteque fique dentro da mesma região pode ser usado paraselecionar o Regi. As populações de mapeamento conhecidasdo estado da técnica e que podem ser usadas para estafinalidade incluem, mas não ficam limitadas a, populaçõesIBM e a população T218 X GT119 IF2 descrita em Sharopova,N. et al. (2002) Plant Mol Biol 4 8 (5) : 4 63-4 81 e Lee, M. etal. (1999): Tools for high resolution genetic mapping inmaize - status report. Proc. Plant Animal Genome VII,January 17-21, 1999, San Diego, USA, P. 146; a populaçãoUMC 98, descrita em Davis, G.L. et al. (1999) Genetics152 (3) : 1137-72 e em Davis, M.D. et al., (1998) The 1998 UMCMaize Genetic Map: ESTs, Sequenced Core Markers, andNonmaize Probes as a Foundation for Gene Discovery, MaizeGenetics Conference Abstracts 40.

Como aqui usado, o termo "introgressão" e"introgredir" se referirá a mover um gene ou lócus de umalinhagem para uma outra por: (1) cruzamento de indivíduosde cada linhagem para criar uma população; e (2) seleção deindivíduos que portam o gene ou lócus desejado. Após cadacruzamento, o processo de seleção é repetido. Por exemplo,o gene das concretizações, ou o lócus contendo-o, pode serintrogredido para um parental recorrente que não sejaresistente, ou seja, somente parcialmente resistente,significando que é sensível ou susceptível ou parcialmentesensível ou susceptível a Cg. A linhagem parentalrecorrente com o gene ou lócus introgredido possui, então,resistência melhorada ou recentemente conferida a Cg. Estalinhagem na qual o lócus de Regi foi introgredido éreferida aqui como uma conversão de lócus de Regi.

0 processo de introgressão é freqüentemente referidocomo "retrocruzamento" quando o processo é repetido duas oumais vezes. Na introgressão ou retrocruzamento, a parental"doadora" se refere à planta parental com o gene ou lócusdesejado a ser introgredida. A parental "receptora" (usadauma ou mais vezes) ou parental "recorrente" (usada duas oumais vezes) se refere à planta parental na qual o gene oulócus está sendo introgredido. Por exemplo, ver Ragot, M.et al. (1995) Marker-assisted backcrossing: a practicalexample, in Techniques et Utilisations des MarqueursMoleculaires (Les Colloques, Vol. 72, pp. 45-56) e Openshawet al., (1994) Marker-assisted Selection in BackcrossBreeding, Analysis of Molecular Marker Data, pp. 41-43. Ocruzamento inicial dá origem à geração Fl; o termo "BC1"então se refere ao segundo uso do parental recorrente, o"BC2" se refere ao terceiro uso do parental recorrente eassim por diante.

No caso do Regi, onde a seqüência do gene e as regiõesmuito próximas estão disponíveis, os marcadores de DNAbaseados no próprio gene ou em seqüências proximamenteligadas podem ser desenvolvidos para seleção direta do genedoador no background do parental recorrente. Apesar depoder ser usada qualquer seqüência de DNA polimórficooriundo da região cromossômica que porta o gene, asseqüências providas nas concretizações permitem o uso demarcadores de DNA dentro ou próximas do gene, minimizando aseleção de falso positivo para o gene. Os marcadores deflanqueamento limitam o tamanho dos fragmentos do genomadoador introduzidos no background do receptor, minimizando,assim, o chamado "arraste de ligação" que significa aintrodução de seqüências indesejáveis da linhagem doadora eque pode impactar no desempenho da planta em germoplasmaelite diferente. As concretizações provêem múltiplosexemplos de marcadores de DNA que podem ser assim usados, eos especialistas na técnica serão capazes de usar asseqüências genômicas providas para criarem até mesmo maismarcadores. Um exemplo é usar marcadores que hibridizam (nocaso de ensaios de RFLP) ou anelam (no caso de ensaios dePCR) especificamente (exclusivamente) com seqüênciasproximamente ligadas, incluindo aquelas dentro do lócus. Emprincipio, as seqüências que também hibridizam ou anelam emalgum lugar no genoma podem ser usadas se diversosmarcadores forem usados em combinação. Quando são usadasreações de PCR, na prática, o comprimento dos primersusados na reação de amplificação devem ter pelo menos cercade 15 nucleotideos, mas dependendo das seqüências e dascondições de hibridização, qualquer comprimento que forneçaanelamento especifico pode ser usado, tal como cerca de 16,cerca de 17, cerca de 18, cerca de 19, cerca de 20, cercade 21, cerca de 22, cerca de 23, cerca de 24, cerca de 25,cerca de 26, cerca de 27, cerca de 28 ou mais longas. Parareações de PCR, o termo "anelar" é comumente usado, e, comoaqui usado, deve ser entendido como tendo o mesmosignificado de "hibridizar".

Portanto, com o uso de marcadores e processos aquidescritos, pode-se produzir uma planta compreendendo umintervalo cromossômico truncado que compreende o lócus deRegi e/ou o gene Regi. O termo "intervalo cromossômico" ou"segmento cromossômico" se refere a um intervalo linearcontíguo de DNA genômico que reside na planta em um únicocromossomo, usualmente definido com referência a doismarcadores que definem os dois pontos extremos do intervalocromossomico. O intervalo especificado pode incluir osmarcadores nos pontos extremos (por exemplo, um ou maismarcadores em ou dentro do intervalo cromossomico definidopor marcador A e marcador B) ou pode excluir os marcadoresnos pontos extremos do intervalo (por exemplo, um ou maismarcadores dentro do intervalo cromossomico definido pelomarcador A e marcador B) . Um intervalo cromossomicotruncado se refere a um intervalo cromossomico que foireduzido em tamanho pela seleção de um ou mais eventos derecombinação que reduziram o tamanho do intervalocromossomico. Um "evento cromossomico" se refere àocorrência de recombinação entre cromossomos homólogos, ese refere a uma localização cromossômica especifica ondetal recombinação tenha ocorrido (por exemplo, umarecombinação do intervalo cromossomico interno aos pontosextremos do cromossomo terão um evento de recombinação emcada extremo do intervalo cromossomico). O intervalocromossomico truncado pode ser definido com referência a umou ambos os novos marcadores nos pontos extremos dosegmento. O comprimento dos dois segmentos cromossômicospode ser medido tanto em centimorgans como em pares debases. Os elementos genéticos ou genes localizados em umúnico intervalo cromossomico são fisicamente ligados. Otamanho de um intervalo cromossomico não é particularmentelimitado, mas, no contexto das concretizações da presenteinvenção, em geral, os elementos genéticos localizadosdentro de um intervalo cromossômico também são ligadosgeneticamente.

Pelo uso dos processos das concretizações, é possívelselecionar uma planta que compreende um intervalocromossômico truncado compreendendo o gene Regi.Especificamente, com respeito à invenção descrita emmaiores detalhes nos exemplos mais adiante, o intervalocromossômico pode ser reduzido a um comprimento de 12cM oumenos, 10 cM ou menos, 8 cM ou menos, 6 cM ou menos, 4 cMou menos, 3cM ou menos, 2,5 cM ou menos, 2 cM ou menos, 1,5cM ou menos, 1 cM ou menos, 0,7 5 cM ou menos, 0,50 cM oumenos, ou 0,25 cM ou menos, em cada caso como medido comrespeito às distâncias do mapa como mostrado no mapagenético Neighbors 4 do IBM2 colocado em prática em 21 demarço de 2006. Quando medido em pares de bases, o intervalocromossômico pode ser reduzido a um comprimento de 15 mpbou menos, 10 mpb ou menos, 5 mpb ou menos, 3 mpb ou menos,1 mpb ou menos, 500 kpb ou menos, ou 250 kpb ou menos. Osespecialistas na técnica podem compreender que é desejávelcausar uma quebra na região cromossômica bem próxima àseqüência codificante de Regi (por exemplo, dentro de 5kpbou menos, dentro de 4 kpb ou menos, 3 kpb ou menos, 2 kpbou menos, 1 kpb ou menos, ou 0,5 kpb ou menos), de modo queo promotor e os outros elementos de regulação a montantefiquem não-ligados a partir da seqüência codificante.

O termo "lócus", em geral, se refere a uma regiãogeneticamente definida de um cromossomo que porta um geneou, possivelmente, dois ou mais genes tão proximamenteligados que geneticamente eles se comportam como um únicolócus responsável por um fenótipo. Quando aqui usado comrespeito ao Regi, o "lócus de Regi" se referirá à regiãodefinida do cromossomo que porta o gene Regi incluindo suasseqüências de regulação associadas, mais a região vizinhado gene Regi que é não-colinear com B73, ou qualquer porçãomenor do mesmo que retém o gene Regi e as seqüências deregulação associadas. Este lócus também foi referido emalgum lugar como o lócus de ASR, e será aqui referido comoo lócus de Regi.

Um "gene" deve se referir a uma região genéticacodificante especifica dentro de um lócus, incluindo assuas seqüências de regulação associadas. A regiãocodificante do transcripto primário de Regi, referida aquicomo a "seqüência codificante de Regi", será usada paradefinir a posição do gene Regi, e os especialistas natécnica compreendem que as seqüências de regulaçãoassociada estarão dentro de uma distância de cerca de 4 kba partir da seqüência codificante de Regi, com o promotorlocalizado a montante. Uma concretização da presenteinvenção é o isolamento do gene Regi e a demonstração deque ele é o gene responsável pelo fenótipo conferido pelapresença do lócus.

Como aqui usados, os termos "ligado" ou "ligação"(como distinguido do termo "operacionalmente ligado") devese referir à ligação genética ou fisica dos lócus ou genes.Os lócus ou genes são considerados geneticamente ligados sea freqüência de recombinação entre eles for menor do quecerca de 50%, como determinado em um mapa de meiosesimples. Eles são progressivamente mais ligados se afreqüência de recombinação for cerca de 40%, cerca de 30%,cerca de 20%, cerca de 10% ou menos, como determinado em ummapa de meiose simples. Dois ou mais genes são fisicamenteligados (ou sintênicos) se ficar demonstrado que eles estãolocalizados em uma única porção de DNA, tal como umcromossomo. Genes geneticamente ligados, na prática,estarão- fisicamente ligados (ou sintênicos), mas adistância fisica exata (número de nucleotideos) pode nãoter sido ainda calculada. Como aqui usado, o termo"proximamente ligado" se refere a marcadores geneticamenteligados dentro de 15 cM ou menos, incluindo sem limitação12 cM ou menos, 10 cM ou menos, 8 cM ou menos, 7 cM oumenos, 6 cM ou menos, 5 cM ou menos, 4 cM ou menos, 3 cMou menos, 2 cM ou menos, 1 cM ou menos e 0,5 cM ou menos,como calculado no mapa genético neighbors 4 de IBM2disponível ao público no website Maize GDB anteriormentereferenciado nesta descrição. Uma seqüência de DNA, talcomo um oligonucleotideo curto representando uma seqüênciadentro de um lócus ou uma complementar da mesma, é tambémligada àquele lócus.

Uma "linhagem" ou "estirpe" é um grupo de indivíduosde parentesco idêntico que são geralmente endogâmicos emalgum grau e que são geralmente homozigotos e homogêneos namaioria dos lócus.Uma "linhagem ancestral" ou "progenitor" é umalinhagem parental usada como fonte de genes, por exemplo,para o desenvolvimento de linhagens elite. A "progênie" sãoos descendentes da linhagem ancestral, e podem estarseparados dos seus ancestrais por muitas gerações demelhoramento. Por exemplo, muitas linhagens elite sãoprogênies de B73 ou Mol7. Uma "estrutura pedigree" define arelação entre um descendente e cada ancestral que deuorigem àquele descendente. Uma estrutura pedigree pode seexpandir por uma ou mais gerações, descrevendo relaçõesentre os descendentes e seus pais, avós, bisavós, etc.

Uma "linhagem elite" ou "variedade elite" é umalinhagem ou variedade agronomicamente superior que resultoude muitos ciclos de melhoramento e seleção para odesempenho agronômico superior. Uma "linhagem eliteendogâmica" é uma linhagem elite que é uma endogâmica e quemostrou ser utilizável para produzir variedades híbridas deprodutividade suficientemente alta e agronomicamenteajustadas (uma "variedade hibrida elite"). Numerosaslinhagens e variedades elite estão disponíveis e sãoconhecidas daqueles especialistas na técnica demelhoramento de milho. Semelhantemente, "germoplasma elite"é um germoplasma agronomicamente superior, tipicamentederivado de e/ou capaz de dar origem a uma planta comdesempenho agronômico superior, tal como uma linhagem elitede milho existente ou recentemente desenvolvida.Por outro lado, uma "linhagem de milho exótica" ou"germoplasma de milho exótico" é o germoplasma derivado demilho não pertencente a uma linhagem elite disponível,variedade elite ou germoplasma elite. No contexto de umcruzamento entre duas plantas de milho, uma linhagemexótica ou germoplasma exótico não é proximamenterelacionada pelo descendente da linhagem elite, variedadeelite ou germoplasma elite com o qual é cruzado. Maiscomumente, a linhagem exótica ou germoplasma exótico éselecionada para introduzir novos elementos genéticos(tipicamente novos alelos) em um programa de melhoramento.

Unidades, prefixos e símbolos podem ser indicados porsua forma aceita do SI. A menos que seja indicado de mododiferente, os ácidos nucléicos são escritos da esquerdapara a direita na orientação 5' para 3' ; as seqüências deaminoácidos são escritas da esquerda para a direita emorientação amino para carboxil, respectivamente. As faixasnuméricas são inclusivas dos números que definem a faixa.

Os aminoácidos podem ser aqui referidos tanto por seussímbolos de três letras comumente conhecidos ou pelossímbolos de uma letra recomendado pela Comissão deNomenclatura Bioquímica da IUPAC-IUB. Da mesma forma, osnucleotideos podem ser referidos por seus códigos de umaletra comumente aceitos. Os termos acima definidos são maiscompletamente definidos por referência à descrição como umtodo.Com relação às direções do mapa aqui observadas, aoinvés dos termos 5' e 3', são usados os termos "norte" e"acima" (por exemplo, um marcador norte do gene Regi serefere a um marcador acima do gene Regi, como determinadocom referência aos mapas providos em uma orientaçãovertical, tal como as Figuras 7 e 8, e à esquerda do geneRegi, como determinado com referência aos mapas providos emuma orientação horizontal, tal como a Figura 22) . Da mesmaforma, são usados os termos "sul" e "abaixo" (por exemplo,um marcador sul do gene Regi se refere a um marcador abaixodo gene Regi, como determinado com referência aos mapasorientados verticalmente aqui providos, e para a direita dogene Regi, como determinado com referência aos mapasorientados horizontalmente providos aqui). Maisespecificamente, acima da seqüência codificante de Regi serefere ao cromossomo acima, ou norte do transcriptoprimário na SEQ ID No:l (perto de FLP110F) , e abaixo daseqüência codificante de Regi se refere ao cromossomoabaixo ou sul do transcripto primário na SEQ ID NO:l (pertode FLPA1R). Ver Figura 26. Os termos "proximal" e "distai"são termos relativos, significando, respectivamente, maisperto e mais afastado de uma localização especificada (porexemplo, o gene Regi) quando usado para comparar doispontos em um mapa com relação à localização especificada.

O termo "sistemas de computador" se refere, em geral,a vários sistemas automatizados usados para realizaralgumas ou todas as etapas dos métodos aqui descritos. Otermo "instruções" se refere ao código computacional queinstrui o sistema de computador para realizar algumas outodas as etapas do método. Adicionalmente, para praticaralgumas ou todas as etapas do método, sistemas digitais ouanalógicos, por exemplo, compreendendo um computadordigital ou analógico, também pode controlar uma variedadede outras funções tal como um mostrador visivel ao usuário(por exemplo, para permitir a visualização dos resultadosdo método pelo usuário) e/ou o controle dos aspectos desaida (por exemplo, para assistir na seleção assistida pormarcador ou no controle do equipamento de campoautomatizado).

Certos métodos aqui descritos são opcionalmente (etipicamente) implementados via um programa ou programas decomputador (por exemplo, que armazenam e podem ser usadospara analisar dados de marcador molecular). Portanto, asconcretizações provêem sistemas digitais, por exemplo,meios legíveis por computador, e/ou sistemas integradoscompreendendo instruções (por exemplo, concretizados emsoftware apropriado) para realizar os métodos aquirevelados. O sistema digital incluirá informação (dados)correspondente ao genótipo de planta para um conjunto demarcadores genéticos e, opcionalmente, valores fenotípicose/ou relações de familia. O sistema também pode ajudar umusuário a realizar a seleção assistida por marcador paraRegi de acordo com os métodos aqui revelados, ou podecontrolar o equipamento de campo com seleção, colheita e/ouesquemas de melhoramento automatizados.As aplicações desktop padrão, tal como o software deprocessamento de palavra (por exemplo, Microsoft Word™ ouCorel WordPerfect™) e/ou software de base de dados (porexemplo, software de planilha eletrônica, tal comoMicrosoft Excel™, Corel Quattro Pro™, ou programas de basede dados tal como Microsoft Access™ ou Paradox™) podem seradaptados às concretizações pela entrada de dados os quaissão alimentados na memória de um sistema digital, e pelarealização de uma operação como observado aqui nos dados.

Por exemplo, os sistemas podem incluir o softwareprecedente tendo os dados genotipicos apropriados e,opcionalmente, os dados de pedigree, que são usados emconjugação com uma interface de usuário (por exemplo, umGUI em um sistema de operação padrão tal como o sistemaWindows, Macintosh ou LINUX) para realizar qualquer análiseobservada aqui, ou simplesmente para adquirir os dados (porexemplo, em uma planilha eletrônica) a serem usados nosmétodos aqui revelados. 0 computador pode ser, por exemplo,um PC (máquina Intel x8 6 ou Pentium chip-compativel DOS™,OS2™, WINDOWS™, WINDOWS NT™, WINDOWS95™, WINDOWS98™, LINUX,compatível com o Apple, compatível com o MACINTOSH™,compatível com o Power PC, ou um compatível com o UNIX (porexemplo, estação de trabalho SUN™)) ou outro computadorcomercialmente comum que é conhecido dos especialistas natécnica. O software para realizar análise de associaçãoe/ou predição de valor fenotipico pode ser construído porum especialista na técnica usando linguagem de programaçãopadrão tal como Visualbasic, Fortran, Basic, Java, ousemelhantes, de acordo com os métodos aqui revelados.Qualquer controlador de sistema ou computadoropcionalmente inclui um monitor o qual pode incluir, porexemplo, um mostrador de tubo de raios catódicos ("CRT"),um mostrador de painel plano (por exemplo, um mostrador decristal liquido de matriz ativa) ou outros. Os circuitos decomputador são freqüentemente colocados em uma caixa, aqual inclui numerosos chips de circuito integrado, taiscomo microprocessador, memória, circuitos de interface eoutros. A caixa também, opcionalmente, inclui uma unidadede disco rígido, uma unidade de disco flexível, uma unidaderemovível de alta capacidade, tal como um CD-ROM gravável,e outros elementos periféricos comuns. Os dispositivos deentrada, tais como um teclado ou mouse opcionalmentefornecem a entrada para o usuário e para a seleção pelousuário de genótipo de marcador genético, valor fenotípicoos semelhantes no sistema computacional relevante.

O computador tipicamente inclui software apropriadopara receber instruções do usuário, tanto na forma deentrada de usuário em um conjunto de campos de parâmetro,por exemplo, em um GUI, ou na forma de instruçõesprogramadas, por exemplo, programadas para uma variedade dediferentes operações específicas. O software então converteessas instruções em uma linguagem apropriada para instruiro sistema a executar qualquer operação desejada. Porexemplo, um sistema digital pode instruir a seleção deplantas compreendendo certos marcadores, ou controlar amaquinaria de campo para colheita, seleção, cruzamento oupreservação de culturas de acordo com o método relevanteaqui revelado.

A invenção também pode ser concretizada dentro da redede circuitos de um circuito integrado especifico deaplicação (ASIC) ou dispositivo lógico programável (PLD).

Em tal caso, a invenção é concretizada em uma linguagem dedescritor legivel por computador que pode ser usada paracriar um ASIC ou PLD. A invenção também pode serconcretizada dentro da rede de circuitos ou processadoreslógicos de uma variedade de outros aparelhos digitais, taiscomo PDAs, sistemas de computador laptop, mostradores,equipamento de edição de imagem, etc.

EXEMPLOS

As concretizações da invenção são adicionalmentedefinidas nos exemplos a seguir, nos quais todas as partese percentagens são em peso e graus Celsius, a menos queseja estabelecido diferentemente. Deve ficar compreendidoque esses exemplos, apesar de indicarem concretizações dainvenção, são dados a titulo de ilustração somente. Apartir da discussão acima e desses exemplos, osespecialistas na técnica podem determinar ascaracterísticas essenciais das concretizações destainvenção e, sem se afastar do espirito e escopo da mesma,podem fazer várias mudanças e modificações para adaptá-la avárias utilizações e condições. Portanto, váriasmodificações das concretizações da invenção, em adiçãoàquelas mostradas e descritas aqui, ficarão evidentesàqueles especialistas na técnica a partir da descriçãoprecedente. Tais modificações também têm a intenção deficar dentro do escopo das reivindicações em anexo. Adescrição de cada referência apresentada aqui é incorporadaa titulo de referência em sua integralidade. Os Exemplos 1-4 e 7-12 são reais. Os Exemplos 5, 6 e 13 são reais emparte e proféticos em outra parte.

EXEMPLO 1

MAPEAMENTO REFINADO DO LÓCUS DE Regi PARA UMA REGIÃOESPECÍFICA DE 4L

De modo a mapear e clonar o gene responsável pelaresistência da linhagem de milho MP305 a Cg, linhagens quetinham sido previamente criadas e que diferiamgeneticamente tão pouco quanto possivel uma da outra, comexceção da presença do lócus responsável pelo fenótiporesistente. Tais linhagens são chamadas linhagensisogênicas próximas. Para esta finalidade, a DE811 foicruzada com a MP305 e a progênie foi retrocruzada com alinhagem sensivel DE811, por três vezes, sendo feita a cadaretrocruzamento a seleção com relação à resistência a Cg ede diferença com relação às características de DE811(Weldekidan and Hawk, (1993), Maydica, 38:189-192). Alinhagem resultante foi designada de DE811ASR (BC3)(Weldekidan and Hawk, (1993) acima mencionado). Estalinhagem foi usada como ponto de partida para o mapeamentorefinado do lócus de Regi. Foi primeiro necessário saberaproximadamente onde, no genoma de milho, ele estavalocalizado. Usando métodos genéticos padrão, Jung et al.((1994) acima citado) localizou previamente o lócus no ramolongo do cromossomo 4.

Na medida em que o lócus de Regi havia sidopreviamente mapeado no ramo longo do cromossomo 4 de milho,usando a informação sobre marcadores próximos ao lócusobtidos por Jung et al. (1994) acima citado, todos osmarcadores de repetição de seqüência simples (SSR),disponíveis ao público ou privados, localizados na regiãodo cromossomo designado 4.06-4.08, foram analisados paradeterminar se esses marcadores eram polimórficos entre asduas linhagens isogênicas próximas DE811 e DE811ASR (BC5).A linhagem DE811ASR (BC5) foi derivada da linhagem DE811ASR(BC3) descrita por Weldekidan e Hawk (1993), acimamencionado, através de dois retrocruzamentos com a DE811sob seleção com relação à resistência a Cg, seguidos por 5gerações de autofecundação e seleção para obter a linhagemBC5. A linhagem BC5 foi retrocruzada duas vezes mais com aDE811 para criar a população segregante BC7 usada para omapeamento refinado. De forma a possibilitar a condução daavaliação fenotipica em base familiar, os indivíduos BC7foram autofecundados para criar famílias BC7S1.

A partir desta análise, foi descoberto que doismarcadores de SSR, PHI093 e UMC2041, são polimórficos.Usando o mapa neighbors de B73 X Mol7 (IBM) (Lee et al.(2002) Plant Mol Biol 48:453-61; Sharopova et al. , (2002)Plant Mol Biol 48:463-81) inter-pareado (inter-mated)publicamente disponível (Coe et al. (2002) Plant Physiol.128:9-12; Gardiner, et al., (2004), Plant Physiol.,134:1317-1326; Yim et al., (2002) Plant Physiol. 130:1686-1696) , as seqüências de três marcadores próximos dePolimorfismo de Comprimento de Fragmento de Restrição(RFLP), CD0365, CSU166 e CD0127, foram usadas para criarmarcadores polimórficos de Comprimento de Fragmento (aquidesignados FLPs) . Os FLPs são marcadores que podem seranalisados usando eletroforese em gel ou qualquer métodosimilar de separação de fragmentos de alta resoluçãoseguindo-se uma reação de PCR usando os primers de umaseqüência definida. Foi verificado que os três marcadoressão polimórficos. Os FLPs usados no mapeamento do lócus deRegi estão resumidos na Tabela 1. Quaisquer primers para osFLPs de MZA mostrados na Tabela 1, a qual também tem osmesmos nomes de marcadores MZA mostrados na Tabela 2,amplificarão a região interna de FLP para a seqüênciainterna mostrada na Tabela 2. A temperatura de anelamentopara todos os primers listados na Tabela 1 é de 60°C.

De modo a determinar se a presença desses três FLPspolimórficos e dois SSRs polimórficos estava associada como fenótipo de resistência, indicando que a região portadorado lócus de Regi foi localizada em um segmento cromossomicocontendo esses três marcadores, foi criada uma tabela naqual foram alimentados os status fenotipicos de 4784indivíduos determinados por observação de campo e os statusgenotipicos com relação a cada um dos cinco marcadores,determinado pela análise de tamanho de fragmento. Estesdados foram submetidos seqüencialmente aos programas desoftware Joinmap (Van Ooijen, et al., (2001), PlantResearch International, Wageningen, the Netherlands) eWindows QTL Cartographer (Wang, et al., (2004), (online,versão 2.0 recuperada em 14-06-2004 e versão 2.5 recuperadaem 22-02-2005)) ; recuperado a partir da North CarolinaState University Statistical Genetics e do website deBioinformática na Internet em <URL:

http://statgen.ncsu.edu/qtlcart/WQTLCart.htm>. O primeiroprograma determina a ordem dos marcadores ao longo daregião cromossômica. O segundo programa determina se umalelo particular de um marcador (uma forma particular dasduas formas polimórficas do marcador) estásignificativamente associado com a presença do fenótipo. Osmarcadores para os quais a presença de um ou dos outrosalelos é mais significativamente associada com o fenótipode resistência mais provavelmente estão mais próximos dogene responsável pelo fenótipo de resistência. A Figura 3representa um gráfico produzido pelo QTL de WindowsCartographer mostrando uma análise estatística da chance(eixo dos Y) de que o lócus responsável pela resistência aCg esteja localizado em uma posição particular ao longo docromossomo (eixo dos X) como definido pelos marcadores FLP.

A partir do mapa fisico e genético integrado, comodescrito por Fengler, et al., ((2004) Plant and AnimalGenome XII Abstract Book, Página 192 (Pôster número P487),10-14 de janeiro, San Diego, Califórnia) e Gardiner, (2004)acima mencionado, é possivel identificar dois contigs decromossomo bacteriano (BAC), derivados de uma biblioteca deBAC de Mol7, cultivando os acima mencionados marcadoresgenéticos.

Entretanto, os dois contigs de BAC contendo osmarcadores flanqueadores da região de interesse continhamum gap de tamanho desconhecido. De modo a identificaradicionais BACs para fazer a ponte deste gap, foi usado umdenso mapa genético contendo marcadores (Fengler, (2004)acima citado) com posições conhecidas no mapa fisico paraencontrar marcadores adicionais geneticamente ligados amarcadores previamente ligados identificados nos doiscontigs de BAC. Esses marcadores adicionais na Tabela 2,foram usados para identificar contigs de BAC a partir deuma biblioteca de B73 a qual fechou o gap fisico entre ospreviamente encontrados contigs de BAC Mol7-derivados (Coeet al. (2002) acima citado; Gardiner (2004) acima citado;Yim et al. (2002) acima citado. Quatro marcadores,MZA11455, MZA6064, MZA2591 e MZA15842, foram usados parafinalidades de mapeamento. Na Tabela 2, "E" significa"externo" e "I" significa "interno", os quais,respectivamente, se referem aos primers externo e internousados durante o PCR nested. O conjunto externo é usado naprimeira rodada de PCR, após a qual as seqüências internassão usadas para uma segunda rodada de PCR nos produtos daprimeira rodada. Isto aumenta a especificidade da reação.As letras em caixa-alta indicam porções do primer baseadasem seqüências de vetor, as quais são mais tarde usadas paraseqüenciar os produtos de PCR. Elas não são seqüências demilho. Para os primers de MZA nested internos forward, aporção em caixa-alta da seqüência é a SEQ ID No:126, e paraos primers de MZA nested internos reversos, a porção emcaixa-alta é a SEQ ID No:127. As seqüências mostradas naTabela 2 para os primers de MZA nested internos forwardsão, portanto, uma combinação da SEQ ID No: 126 mais a SEQID No: para cada respectivo primer. De modo semelhante, asseqüências mostradas na Tabela 2 para os primers nested deMZA internos reversos são uma combinação da SEQ ID No: 127mais a SEQ ID No: para cada respectivo primer. Essascombinações estão indicadas na coluna de SEQ ID No: daTabela 2. A temperatura de anelamento para todos os primerslistados na Tabela 2 é de 55°C. Todos os marcadoresapresentados na Tabela 2 mostraram polimorfismo dentro deum painel diverso de germoplasma de milho, incluindo aMP305 e as linhagens de milho mostradas na Tabela 18.

As seqüências das extremidades de diversos dessesBACs, assim como os ESTs conhecidos a serem localizadosnesses BACs, foram usados de modo a identificar novosmarcadores com os quais é feito o posterior estreitamentode faixa na qual o lócus está localizado. Os marcadoresadicionais usados para esta finalidade são designados FLP8,FLP27, FLP33, FLP41, FLP56 e FLP95 na Tabela 1. De formasimilar àquela descrita acima, foram feitas as correlaçõesfenotipicas e genotipicas. Foi determinado que o lócusmuito provavelmente estava localizado entre o FLP 8 e o FLP27 (ver Figura 3).Tabela 1: Marcadores e pares de primers usados nos Exemplos 1, 4 e 5

<table>table see original document page 131</column></row><table><table>table see original document page 132</column></row><table>

Tabela 2: Pares de Primers de MZA Nested Usados no Examplo 1

<table>table see original document page 132</column></row><table><table>table see original document page 133</column></row><table>EXEMPLO 2

ISOLAMENTO DE CLONES DE BAC A PARTIR DE LINHAGENSRESISTENTES E IDENTIFICAÇÃO DE GENES CANDIDATOS NA REGIÃODO LÓCUS DE RCG1

De maneira a isolar o gene responsável pelo fenótipoconferido pelo lócus de Regi, os BACs contendo a regiãoentre os marcadores FLP 8 e FLP 27 foram isolados a partirde uma biblioteca BAC preparada a partir da linhagemresistente DE811ASR (BC5). Esta biblioteca foi preparadausando técnicas padrão para a preparação de DNA genômico(Zhang et al. (1995) Plant Journal 7:175-184) seguida peladigestão parcial com HindIII e ligação dos fragmentos detamanho selecionado para uma forma modificada do vetorcomercialmente disponível pCCIBAC™ (Epicentre, Madison,USA). Após a transformação em células de E. coli EPI300™seguindo as instruções do fornecedor (Epicentre, Madison,USA), 125.184 clones recombinantes foram dispostos em 326placas de microtitulação de 384 poços. Esses clones foramentão colocados em filtros de nylon (Hybond N+, AmershamBiosciences, Piscataway, USA).

A biblioteca foi sondada com sondas deoligonucleotideos de sobreposição (sondas overgo; Ross et<3l. (1999) Screening large-insert librar ies byhybridization, p. 5.6.1-5.6.52, In A. Boyl, ed. CurrentProtocols in Human Genetics. Wiley, New York) desenhadas nabase de seqüências encontradas nas seqüências BAC mostradasno exemplo anterior para estarem presentes entre o FLP8 e oFLP27. Foi feita análise de busca BLAST para submeter ascreening as seqüências repetidas e identificar asseqüências únicas para o desenho da sonda. A posição e ointer-espaçamento das sondas ao longo do contig foiverificada por PCR. Para cada sonda, foram desenhados doisoligos de 24-meros auto-complementares sobre 8 pb. Seuanelamento resultou em um overgo de 40 pb, no qual os doisoverhangs de 16 pb foram preenchidos. As sondas usadasdesta maneira são apresentadas na Tabela 4. Observe-se quealgumas dessas sondas foram baseadas em marcadores tambémusados no Exemplo 1 e Tabela 1, mas as seqüências exatassão diferentes na medida em que elas foram produzidas paraserem usadas como sondas overgo ao invés de somente primersde PCR. As sondas para hibridização foram preparadas comodescrito (Ross et al. (1999) acima citado), e os filtrospreparados pela colocação em rede da biblioteca BAC foramhibridizados como descrito por (Ross et al. (1999) acimacitado). Foi usada a análise de Phosphorimager para adetecção de sinais de hibridização. Depois disso, asmembranas foram separadas das sondas pela colocação dasmesmas em uma solução recém-fervida de 0,1X SSC e 0,1% SDSe deixadas a resfriar até a temperatura ambiente na soluçãodurante a noite.

Os BACs que deram um sinal positivo foram isolados apartir das placas. Foram usados o mapeamento de restrição,os experimentos de PCR com primers correspondentes aosmarcadores previamente usados e as seqüências obtidas apartir das extremidades de cada BAC para determinar a ordemdos BACs que cobrem a região de interesse. Quatro BACs quese espalharam pela região inteira foram selecionados paraseqüenciamento. Esses BACs foram seqüenciados usandotécnicas de seqüenciamento do tipo shotgun padrão e asseqüências foram montadas usando o Phred/Phrap/Consedsoftware package (Ewing et al. (1998) Genome Research,8:175-185).

Após a montagem, as seqüências consideradas comoestando na região mais próxima do lócus com base nos dadosde mapeamento foram anotadas, significando que foramdeduzidas as possíveis regiões codificantes de gene e asregiões representando elementos repetitivos. As regiõescodificantes de genes (regiões gênicas) foram buscadasusando o fGenesH software package (Softberry, Mount Kisco,New York, USA). O fGenesH permitiu a predição de uma porçãode uma proteína que, quando submetida ao BLAST (BLASTx/nr),mostrou parcial homologia ao nivel de aminoácido comrelação a uma porção de uma proteína de arroz que foiverificada como codificante de uma proteína que confereresistência, em arroz, à doença. A porção da seqüência demilho que apresentou homologia com relação a esta proteínafoi localizada como estando na extremidade de uma extensãocontígua da seqüência consenso de BAC e pareceu sertruncada. De modo a obter a representação completa do geneno BAC de milho, foi usada a seqüência de aminoácidos dearroz em uma análise de tBLASTn contra todas as outrasseqüências consenso oriundas do mesmo clone de BAC demilho. Isto resultou na identificação de uma seqüênciaconsenso representando a extremidade 3' do gene de milho.

Entretanto, a porção central do gene não foi representadanas seqüências assim obtidas. Os primers de PCR foramdesenhados com base nas regiões 5' e 3' do gene putativo eusados em um experimento de PCR com DNA do BAC de milhooriginal como um template. A seqüência do produto de PCRresultante continha a seqüência que faz a ponte dosfragmentos 5' e 3' previamente isolados.

A DE811ASR (BC5) foi depositada junto à ATCC, e osmétodos aqui descritos podem ser usados para obter o clonede BAC compreendendo o lócus de Regi. Como mostrado naFigura 9 (a), o intervalo cromossômico de DE811ASR (BC5) como lócus de Regi é não-colinear com relação à regiãocorrespondente de B73 e Mol7 (ver Figuras 9 e 22), comodeterminado pela análise de bibliotecas de BAC.

Usando a seqüência comum que hibridiza com BACs nasbibliotecas de BAC da Mol7 e da B73, os correspondentesBACs oriundos de ambas as bibliotecas foram dispostas emuma rota tracejada como mostrado na Figura 22. Foram dadosnomes mais curtos aos BACs de B73 na Figura 22 parafinalidade de ilustração. A Tabela 3, a seguir, mostra a IDde BAC para cada designação indicada na Figura 22. Os BACsde B73 disponíveis ao público, c0113f01 e c0117el8 sãodiretamente norte e sul, respectivamente, da região indeldo lócus de Regi, com a deleção ocorrendo na B73. Ainformação desses dois BACs pode ser vista em diversossítios da Web, incluindo o website de GDB de milho(maizegdb.org), o website Gramene (gramene.org) e a base dedados do genoma de milho do Arizona Genomics Institute(genome.arizona.edu). O website do Arizona GenomicsInstitute também prove o Mapa FPC de Agarose de Milho,versão 19 de julho de 2005, o qual identifica os BACscontíguos em relação a c0113f01 e c0117el8. Pela buscanessas bases de dados, foi identificada uma multidão deBACs que formam um contig das regiões flanqueadoras dolócus de Regi. Portanto, a localização precisa do lócus deRegi e do gene Regi foi agora identificada em ambos osmapas fisico e genético de milho (ver Figuras 7(a,b) e 22).

Tabela 3: Designações de BAC na Figura 22, as quaisforam parte tanto do contig 187 (B73a até B73p) como docontig 188 (B73q até B73af) do B73 como mostrado no websitedo Arizona Genomics Institute acima mencionado

<table>table see original document page 138</column></row><table><table>table see original document page 139</column></row><table>

A seqüência completa do gene putativo é apresentada naSEQ ID No: 1. O gene contém um intron, desde o nucleotideo950 até o nucleotideo 1452 da SEQ ID No: 1. Foi usada PCRde tanscriptase reversa utilizando o RNA preparado a partirde plantas da DE811ASR (BC5) para determinar os limites dointron. A seqüência codificante da proteina do gene éapresentada na SEQ ID No: 2, e a tradução em aminoácidos éapresentada na SEQ ID No: 3. A proteina predita possui umpeso molecular de 110,76 kD.A extremidade amino a partir aproximadamente dosaminoácidos 157 até 404 tem homologia com relação aoschamados sitios de ligação a nucleotideo (NBS) . Há umaregião com homologia vaga com relação aos domínios de LRRlocalizados aproximadamente a partir dos aminoácidos 528até 846. Entretanto, diferentemente das proteínas de NBS-LRR anteriormente estudadas, a região rica em leucinacarece de natureza repetitiva sistemática (Lxx) encontradaem domínios de LRR mais clássicos e, em particular, semcircunstâncias das seqüências consenso descritas por Wanget al. ((1999), Plant J. 19:55-64) ou Bryan et al. ((2000),Plant Cell 12:2033-2045). Como mostrado na Figura 2 (a, b ec) , o gene possui vaga homologia com relação à familia dosgenes de arroz e com relação a um gene de cevada. A maiorparte da homologia está na extremidade amino terminal daproteína; a extremidade carboxil é bastante distinta. Istoé demonstrado pelo uso do estilo negrito, na Figura 2 (a, be c), os quais são aminoácidos idênticos ao gene dasconcretizações, enquanto que aqueles não idênticos nãoestão mostrados em negrito.

Tabela 4. Oligonucleotideos anelados para sintetizar sondasovergo

<table>table see original document page 140</column></row><table><table>table see original document page 141</column></row><table>

EXEMPLO 3

COMPARAÇÃO DA ESTRUTURA GENÉTICA NA REGIÃO DO LÓCUS DERCG1 ENTRE LINHAGENS RESISTENTE E SUSCEPTÍVEL E PERFIS DEEXPRESSÃO DE GENES CANDIDATOS ENCONTRADOS NAQUELA REGIÃOENTRE LINHAGENS RESISTENTE E SUSCEPTÍVEL

Tendo encontrado um gene candidato na regiãogeneticamente definida para portar o lócus responsável pelofenótipo de resistência à antracnose, foram feitos esforçospara primeiramente determinar se haveriam outros genespresentes na região e, em segundo lugar para determinar seos padrões de expressão do gene candidato eram consistentescom o seu papel putativo. Fu e Dooner ((2002), Proc NatlAcad Sei 99:9573-9578) e Brunner et al. ((2005), Plant Cell17:343-360) demonstraram que diferentes linhagensendogâmicas de milho podem ter significativos rearranjos eausência de colinearidade entre si. A comparação de taisgenomas ao longo das regiões maiores pode, portanto, sercomplexa. Tal comparação dos genomas de Mol7 (Missouri 17)e DE811ASR (BC5) revelou que, na região onde o genecandidato é encontrado na DE811ASR (BC5), está presente umagrande inserção com relação à Mol7. As regiões dentro e nasvizinhanças da inserção foram seqüenciadas e escaneadas comrelação a possíveis genes. Um gene codificante de umasubunidade de Ribulose bisfosfato carboxilase (Rubisco, umaproteina envolvida na fixação de carbono após afotossintese, cujo gene está presente em múltiplas cópiasno genoma de milho) foi encontrado em ambos os genomas, daDE811ASR (BC5) e da Mol7, exatamente a jusante da posiçãodo gene Regi. Foi encontrado um pseudo-gene (um genetornado não-funcional devido a mutações que rompem aseqüência codificante) relacionado com uma proteina dereserva vegetativa, presente somente no genoma de DE811ASR(BC5) a alguma distância a montante do gene Regi. O únicogene estruturalmente intacto provavelmente para codificaruma proteina com uma função possivelmente relacionada comresistência a doença foi o gene Regi isolado no exemploanterior. Do mesmo modo, foram localizados outros genesimprováveis de estarem envolvidos com a resistência àdoença a uma maior distância da posição mais provável dolócus, assim como um grande número de seqüênciasrepetitivas.

Para determinar se um gene Regi foi transcrito, equando, foram usadas duas técnicas. Primeiramente foramexaminados os perfis de RNA de materiais de plantaresistente e susceptível usando o Seqüenciamento deAssinatura Massivãmente Paralela (Massively ParallelSignature Sequencing - MPSS; Lynx Therapeutics, Berkeley,USA). Resumidamente, bibliotecas de cDNA foram construídase imobilizadas em microcontas como descrito em Brenner etal. (Brenner, S. et al. (2000) Nat. Biotechnol. 18(6):630-634). A construção da biblioteca sobre um suportesólido permite que a biblioteca seja disposta em umamonocamada e milhares de clones sejam submetidos à análisede seqüência de nucleotideos em paralelo. A análise resultaem uma seqüência de "assinatura" de 17-meros cujafreqüência de ocorrência é proporcional à abundânciadaquele transcripto no tecido da planta. O cDNA derivado deRNA preparado a partir da DE811ASR (BC5) e da DE811(linhagem controle, susceptível a Cg) foi submetida aanálise de MPSS. A inspeção por bioinformática das" assinaturas resultantes mostrou que a seqüência deassinatura, aqui referida como Lynxl9, (SEQ ID No: 19)estava presente em 43 partes por milhão (ppm) nas amostrasde RNA oriundas de colmos não-infectados de DE811ASR (BC5)e em 65 ppm em colmos resistentes infectados 9 dias após ainoculação (DPI) com Cg. Esta seqüência de assinatura nãofoi detectada em bibliotecas de cDNA de colmos não-infectados ou infectados por Cg da linhagem de milhosusceptível DE811. Uma análise da seqüência de Regi indicaque o marcador (tag) de 17-meros está presente nosnucleotideos 3945 a 3961 da SEQ ID No: 1 na região não-traduzida 3' putativa do gene.

A prova adicional de que o Regi é exclusivamenteexpressado em linhagens de milho que são derivadas da MP305e resistentes à podridão do colmo por antracnose foi obtidapelos experimentos de RT-PCR. O RNA total foi isolado apartir de colmos não-infectado e infectado por Cg delinhagens de milho, resistente (DE811ASR1 (BC5)) esusceptível (DE811), usando RNA STAT-60™ (Iso-TexDiagnostics, Friendswood, Texas, USA). O RNA total (250 ng)de amostras resistente e susceptível de 0, 3, 6, 9, e 13DPI foi copiado para o cDNA e amplificado usando um kitGeneAmp® RNA-PCR (Applied Biosystems, Foster City,Califórnia, USA) . A reação de sintese de cDNA foi montadade acordo com o protocolo do kit usando hexâmerosaleatórios como primers e incubada a 42°C por 45 minutos.Para realizar a PCR, foram usados o KEB131 (SEQ ID No: 20)e o KEB138 (SEQ ID No: 21), ambos desenhados a partir daseqüência não-traduzida 3' putativa do Regi, como osprimers a montante e a jusante, respectivamente. O cDNA foiamplificado por 30 ciclos consistindo de 1 minuto a 94°C, 2minutos a 50°C e 3 minutos a 72°C seguido por uma extensãode 7 minutos a 72°C. Como mostrado na Figura 4, aeletroforese em gel de agarose de uma aliquota dos RT-PCRsrevelou a presença de uma banda de 260 pb presente nasamostras derivadas de ambas as plantas resistentes, ainfectada e a não-infectada, mas ausente nas amostrassusceptíveis. A análise de seqüência de DNA confirmou ofato de que este fragmento correspondia ao nt 3625 até 3884da seqüência de Regi consistente com o produto deamplificação predito a partir dos primers KEB131 e KEB138.

EXEMPLO 4

ISOLAMENTO DAS LINHAGENS CONTENDO INSERÇÕES MU NO GENECANDIDATO

Um método um fenótipo, inserção de umpara determinar se um gene é responsável poré romper geneticamente o gene através daelemento de transposição (a chamada marcaçãopor transposon) e depois determinar se o fenótipo relevanteda planta está alterado, neste caso, de resistente a Cgpara susceptível a Cg. Em milho, isto pode ser feito usandoo elemento mutator (Mu) (Walbot, V. (1992) Annu. Rev. PlantPhysiol. Plant Mol. Biol. 43:49-82). A estratégia básica,esboçada na Figura 5, foi a de introduzir elementos mutatorativos em linhagens portadoras do gene de resistência,isolando as plantas homozigotas com relação ao gene deresistência através da análise de marcadores de DNAassociados, assim como de resistência a Cg pela inoculaçãocom Cg, depois cruzando aquelas plantas homozigotas com umalinhagem susceptível de "teste". Se o gene de resistênciafor dominante, em principio, toda a progênie resultantedeve ser resistente, mas heterozigota com relação ao gene.

Entretanto, se um elemento Mu inserido no gene resistenteem um modo que rompe sua função, aquele indivíduo deve sersusceptível a Cg. O gene rompido pode depois ser isolado ecaracterizado.

A MP305 foi cruzada com quinze diversos estoquesmutator (linhagens portadoras de elementos mutator ativos).As Fls resultantes foram inter-casadas (cruzadas uma com aoutra) em todas as combinações possíveis. Para rastrear aregião cromossômica 4L na qual foi descoberto que o lócusde resistência reside (ver Exemplo 1), uma variedade demarcadores de DNA conhecidos como estando nas vizinhançasdo lócus, a partir do trabalho descrito no Exemplo 1, foiselecionada e usada nas materiais marcados com Mu. Cerca de1500 plantas da progênie oriundas do processo de inter-cruzamento foram examinadas com relação à resistência a Cge com relação à presença desses marcadores. A análise dosmarcadores foi feita usando tanto Southern blots (Botsteinet al., (1980) Am. J. Hum. Gen. 32:314-331) para marcadoresde RFLP como por PCR para marcadores de FLP como descritono Exemplo 1. As plantas que foram homozigotas para todosos marcadores testados e resistentes a Cg foramselecionadas e submetidas a teste de cruzamento comlinhagens de teste susceptíveis (A63, EH6WA e EF09B). Cercade 16.000 sementes de teste de cruzamento geradas a partirdessas plantas homozigotas e resistentes foram depoisplantadas e foram usadas como parentais femininos(significando que os pendões produtores de pólen foramremovidos) e cruzadas com as linhagens de testesusceptíveis usadas como masculinas. Todas as plantasfemininas foram submetidas a screening com relação àsusceptibilidade a Cg. Mais de dez plantas susceptíveis(mutantes knockout putativas) foram identificadas. Asemente polinizada aberta de cada uma dessas plantassusceptíveis foi colhida, juntamente com oito irmãsresistentes como controle.

Foi extraído o DNA de um conjunto de 24 mudas(crescidas em toalhas de papel) de cada um dos knockoutsputativos e das irmãs resistentes controle. Este DNA foiusado como tamplate para a amplificação da seqüênciaflanqueadora oriunda do sitio de inserção-de-Mu usandoprimers gene-especificos em combinação com um primerconsenso desenhado a partir de repetições invertidasterminais (TIR) oriundas da seqüência do elemento Mutator(SEQ ID No: 125) . Em outras palavras, os produtos de PCRdevem somente ser observados se um elemento Mu tiver sidoinserido no gene candidate isolado no Exemplo 2. Os primersFLP110F, FLP110R, FLP111F, FLP111R, FLP112F, FLP112R,FLP113F, e FLPA1R foram usados como primers gene-especificos (ver Tabela 1) . Os produtos amplificados porPCR foram submetidos a blotting sobre membranas ehibridizados com uma sonda de DNA a partir do genecandidato isolado no Exemplo 2. Os produtos de PCR quemostraram forte hibridização foram excisados a partir dogel, purificados, clonados e seqüenciados. As seqüênciasresultantes foram analisadas por meio de alinhamento comseqüências oriundas do gene candidato e Mu-TIR. Oselementos Mutator causam uma duplicação direta de 9 pb e ositio de inserção. Com base na informação da seqüênciaflanqueadora e em uma duplicação direta de 9 pb, foramidentificadas quatro inserções independentes no exon 1 dogene candidato (Figura 5) . Uma inserção (ml77) foidetectada aproximadamente 97 pb a montante do códon deiniciação, na região não-traduzida 5' do gene. Um evento deinserção comum, 270 pb a jusante do códon de iniciação, foidetectado em três plantas susceptíveis: ml64, ml59 e ml79.

Foi descoberto que a planta susceptível ml71 contém duasinserções-Mu, 556 pb e 286 pb a jusante do códon deiniciação. Quando foram realizados Southern blots usando aregião do exonl do gene como uma sonda de DNA, o padrão dehibridização modificado observado posteriormente confirmouesses resultados.Este e os exemplos precedentes podem ser resumidoscomo se segue. O trabalho inicial citado no Exemplo 1mostrou que um lócus previamente observado como conferindoresistência a Cg foi localizado no ramo longo do cromossomo4 de milho. A natureza deste lócus, sua exata localizaçãoou gene(s) codificado(s) por ele eram completamentedesconhecidos. O trabalho feito no Exemplo 1 demonstra queo lócus pode ser mapeado para uma região muito pequena doramo longo do cromossomo 4. O Exemplo 2 demonstra que hásomente um gene a ser encontrado nesta região cromossômicaprovavelmente sendo dito gene de resistência. Ele codificauma nova forma de uma proteína NBS-LRR, uma família deproteínas conhecidas por estarem envolvidas na resistênciaa patógenos, mas que variam amplamente em sua seqüência eespecificidade de resistência. O Exemplo 3 mostra que estegene está presente somente na linhagem de resistência, enão na linhagem susceptível isogênica, e que ostranscriptos correspondentes a este gene são encontrados nalinhagem resistente, indicando que o gene é expressado, eque esses transcriptos são encontrados somente na linhagemresistente. O Exemplo 4 demonstra que, nos quatro eventosindependentemente isolados de inserção Mu, quando o gene érompido pela inserção de um elemento Mu, o fenótipo dessasplantas é mudado de resistente para susceptível a Cg.Tomados em conjunto, esses dados fornecem evidênciadecisiva de que o objeto das concretizações desta invençãoé um gene que pode melhorar ou conferir resistência a Cg emplantas de milho.EXEMPLO 5

RETROCRUZAMENTO DO LÓCUS DE RCG1 EM LINHAGENSSUSCEPTÍVEIS

Foi feita a introgressão de um lócus de Regi em umaendogâmica para confirmar o fato de que o lócus de Regipode ser retrocruzado com sucesso em endogâmicas, e que oshíbridos produzidos com a linhagem endogâmica com o lócusde Regi deve ter resistência a Cg melhorada ou conferida. ADE811ASR (BC5) também foi desenvolvida e usada como umafonte doadora aperfeiçoada para a introgressão do lócus deRegi. Em seguida, diversas endogâmicas adicionais foramutilizadas como parentais recorrentes de modo a usarmétodos, aqui descritos, de melhoramento assistido pormarcador para introgredir eficientemente o lócus de Regi emuma diversidade de backgrounds genéticos endogâmicos ehibridos, melhorando ou conferindo, por esse meio,resistência a Cg. Cada um desses exemplos é discutido emmaiores detalhes a seguir.

Prova de Conceito (PH09B)

A MP305 é uma linhagem endogâmica de cor de grãobranca com forte resistência a Cg, mas seu florescimentotardio, baixa produtividade e fracas característicasagronômicas a tornam uma parem tal doadora pobre na ausênciado uso dos métodos aqui descritos de melhoramentoassistidos por marcador. Um perfil de marcador molecular daMP305 é provido na Tabela 6. Os primers usados para as SSRsrelatadas na tabela podem ser construídos a partir deseqüências disponíveis ao público encontradas no GDB deMilho na World Wide Web em maizegdb.org (patrocinado peloUSDA Agricultural Research Service), em Sharopova et al.(Plant Mol. Biol. 48 (5-6) : 463-481) , e/ou em Lee et al.(Plant Mol. Biol. 48(5-6); 453-461). Um UMC15a é ummarcador de RFLP, e o escore relatado é baseado no sitio derestrição EcoRl.

Para demonstrar o valor fenotipico do lócus de Regi, olócus foi primeiramente introgredido na linhagem PH09B(patente US 5.859.354) até o estágio BC3 como se segue. Apopulação Fl derivada do cruzamento entre a MP305 e alinhagem PH09B foi retrocruzada uma vez mais com a linhagemPH09B, resultando em uma população BC1. As mudas foramplantadas e retrocruzadas novamente com a linhagem PH09Bpara desenvolver uma população BC2. 0 DNA foi preparado apartir de punções de folha das famílias BC2. Paradeterminar quais famílias BC2 plantar para posterioresretrocruzamentos, foi realizada genotipagem no DNA dasfamílias BC2 usando ou primers para marcadoresflanqueadores da região de interesse, UMC2041, PHI093 eCSU166 (ver Tabela 1) . As sementes oriundas da família BC2foram plantadas e as plantas individuais foram genotipadascontra a presença da versão MP305 daquela região docromossomo usando os mesmos três marcadores acima anotados.As plantas positivas foram retrocruzadas com a linhagemPH09B uma vez mais para desenvolver as populações BC3. Assementes dessas populações BC3 foram plantadas e as plantasforam autofecundadas para obter famílias BC3S1 segregantespara a região de interesse, assim como as famílias BC3S1faltando a região de interesse. Essas famílias foram usadaspara a comparação fenotípica (BC3S1 segregantes versusBC3S1 sem a região de interesse).

De forma a observar o desempenho do gene Regi, em umasituação heterozigota, tal como seria encontrada em umhíbrido comercial, foram feitos cruzamentos de testeapropriados. Especificamente, famílias BC3S1 segregantespara a região de interesse foram plantadas e plantasindividuais BC3S1 foram genotipadas. Foram usadas asplantas homozigotas para o gene Regi, assim como as plantashomozigotas para o alelo nulo (faltando o gene em ambos oscromossomos) dentro de cada família, para realizar oscruzamentos de teste com as endogâmicas PH2EJ (patente US6.333.453), PH2NO (patente US 6.124.533), PH4CV (patente US6.897.363) e PH8CW (patente US 6.784.349).

No caso de ambas as linhagens BC3S1 e os híbridos, asdiferenças fenotípicas observadas indicaram significativoaperfeiçoamento com relação à resistência de ASR emlinhagens e híbridos contendo a região portadora de Regi. Oefeito do lócus de Regi introgredido nas famílias BC3S1 eos híbridos de cruzamento de teste derivados resultou em umaperfeiçoamento em termos de ambos, no número deinternódulos infectados e no número de internódulosinfectados em mais do que 75%. Os escores usando um sistemade contagem de escore visual comumente usado pelosmelhoristas de planta são mostrados na Tabela 5 maisadiante. Os dados nitidamente demonstram que o uso detécnicas de cruzamento para transportar o gene dasconcretizações para outras linhagens geneticamentecompetentes em usar o gene resultam em resistênciamelhorada a Cg.

Tabela 5: Efeito da região Regi introgredida no grau deresistência à podridão do colmo por antracnose em familiasBC3S1 e cruzamentos de teste derivados

<table>table see original document page 152</column></row><table>Tabela 6

<table>table see original document page 153</column></row><table>

DE811ASR(BC5) como a Doadora mais Provável para Uso emRetrocruzamentoApesar de a MP305 ter sido utilizada no experimentoacima, como está ilustrado na Figura 8 (a), a DE811ASR(BC5)retém um intervalo cromossômico da MP305 menor com o lócusde Regi do que a DE811ASR (BC3) (e, é claro, também aMP305), e, portanto, é particularmente utilizável como umafonte doadora do gene Regi. Foi mostrado que o intervalocromossômico estreitado oriundo a fonte DE811ASR(BC5) estáassociado com um fenótipo agronômico aperfeiçoado. Vinte eduas plantas oriundas da linhagem derivada DE811ASR(BC3),20 plantas oriundas da linhagem derivada the DE811ASR(BC5),cinco plantas DE811 e cinco plantas MP305 foram crescidasem uma casa de vegetação de novembro de 2005 até março de2006 e foram recolhidos dados com relação à altura daplanta e altura da espiga; foram observadas as datas quando50% das plantas soltaram pólen (midshed), quando 50% dasplantas tinham um visual de brotos de espiga (midves) equando 50% das plantas tinham os estilo-estigmas apontandonas brotações de espiga {midslk) ; e a cor do grão. Namedia, a linhagem DE811ASR(BC5) foi mais curta que aDE811ASR (BC3) (293 cm versus 345 cm) e a localização daespiga foi mais baixa na DE811ASR (BC5) do que naDE811ASR (BC3) (146 cm versus 183 cm), os quais sãocaracteres positivos em termos de desenvolvimento devariedade elite. A DE811ASR(BC5) foi mais precoce comrelação a midshed, midves e midslk quando comparada com aDE811ASR(BC3). A característica de midshed foiaproximadamente 1 dia mais cedo, a midves foiaproximadamente 6 dias mais cedo e a midslk foiaproximadamente 3 dias mais cedo para a DE811ASR(BC5)quando comparada à DE811ASR(BC3) . Os grãos da DE811ASR(BC5)tiveram uma cor marrom-amarelada (bronze) enquanto que osgrãos de DE811ASR(BC3) tiveram uma capa amarelo pálida. Asdatas para midshed, midves e midslk foram similares para aDE811ASR(BC5) e para a DE811, enquanto que a MP305 foiaproximadamente 11 dias mais tarde para midshed e nãoproduziu 50% de brotos de espiga visiveis, nem 50% deestilo-estigmas durante o periodo de crescimento. Apesar deque esses dados são baseados somente em umas poucas plantaspara a DE811 e para a MP305, e as espigas não foramproduzidas naquelas poucas linhagens, esses resultados decasa de vegetação se assemelham com observações dessaslinhagens no campo. Esses dados indicam que a DE811ASR(BC5)se assemelha à parental recorrente DE811 muito maisproximamente do que a DE811ASR(BC3). Portanto, aDE811ASR(BC5) é uma excelente fonte doadora inicial dolócus de Regi e do gene Regi, em ambos os aspectos,genotipicamente e fenotipicamente. Adicionalmente, aDE811ASR(BC5) é particularmente utilizável quando daintrogressão do lócus de Regi no germoplasma com adaptaçãosemelhante à DE811.

A DE811 foi desenvolvida por J. Hawk (Hawk, J.A.(1985). Crop Science Vol 25: p716) e foi descrita como umalinhagem endogâmica dentada amarela originada deautofecundação e seleção de seis gerações em um programa depedigree escolhidas dentre aquelas de um cruzamento de B68com uma endogâmica derivada de [B37 Ht X (duplo cruzamentode C103 X Mp3204) sei.]. A DE811 desenvolveu o estilo-estigma de 1 a 2 dias mais tarde do que a B73 em testes emDelaware, mas 4 dias mais tarde do que a B73 emMissouri. Os ensaios limitados de produtividade indicaramque a DE811 possui satisfatória capacidade de combinação. Éuma boa formadora de estilo-estigma (forma bons estilo-estigmas, um componente da flor fêmea de milho importantepara a fertilização) e liberadora de' pólen e pode sercruzada com germoplasma de maturidade precoce paraadaptação ao nordeste dos Estados Unidos e para germoplasmade maturidade mais tardia para adaptação ao sudeste dosEstados Unidos. Portanto, a DE811ASR (BC5), em combinaçãocom os marcadores e métodos de melhoramento aqui revelados,é utilizável como uma fonte doadora inicial paraintrogressão do gene Regi em uma ampla diversidade degermoplasma, incluindo o germoplasma adaptado a todas asregiões dos Estados Unidos onde o Cg está presente.

Criação de Conversões de Lócus de Regi Endogâmico

Seguindo-se aos testes para a introgressão bem-sucedida de lócus de Regi em PH09B descrita acima, foramrealizadas conversões de lócus de Regi adicionais em outraslinhagens endogâmicas. A primeira série tinha 5retrocruzamentos, sendo a MP305 e a DE811ASR(BC5) asdoadoras. Para a segunda série de retrocruzamentos, foramusados marcadores moleculares para reduzir o intervalocromossômico nas conversões de BC5 oriundas da primeirasérie. Essas conversões de BC5 foram selecionadas parapermutas {crossovers) abaixo do gene Regi. Aquelas plantasselecionadas. foram depois retrocruzadas para criar ageração BC6. As plantas com crossovers acima do gene foramselecionadas na geração BC6.

Primeira Série de Retrocruzamentos

Na primeira série, foi usada a DE811ASR(BC5) como aprimeira fonte doadora, mas introgressões paralelas tambémforam feitas para as mesmas endogâmicas usando a MP305 comouma fonte doadora. Esses dados, descritos em maioresdetalhes mais adiante, mostram que enquanto a DE811ASR(BC5}é a doadora preferida em muitas situações, a MP305 tambémpode ser eficazmente usada com os métodos de melhoramentoassistido com marcador das concretizações ensinadas aqui.

As linhagens endogâmicas elite primariamente adaptadasàs condições de crescimento norte-americanas foramselecionadas para uso como parentais recorrentes. Aslinhagens endogâmicas inicialmente selecionadas para usocomo parentais recorrentes foram as linhagens PH0R8 (US6.717.036), PH7CH (US 6.730.835), PH705 (US 6.903.25),PH5W4 (US 6.717.040), PH51K (US 6.881.881) e PH87P (US6.888.051). Cada uma dessas linhagens foi cruzada com aDE811ASR (BC5) assim como com a MP305. A geração Flderivada de cada um desses cruzamentos foi retrocruzada umavez com a respectiva linhagem endogâmica, resultando em umaprimeira geração de retrocruzamento (a parental recorrenteBC1) . As mudas foram plantadas e o DNA foi preparado apartir de punções de folha. As reações de PCR foramrealizadas usando primers para marcadores que flanqueiam aregião de interesse; foram usados UMC1466, UMC1418,BNLG2162, UMC1086, UMC2041, UMC1612, CSU166, UMC1051,ÜMC2187, UMC1371, e UMC1856 nas primeiras rodadas de BC(ver Tabela 1) enquanto que, nas últimas rodadas de BC,foram usados UMC1418, BNLG2162, UMC1051, UMC2041, UMC2187,UMC1371 e UMC1856. As mudas cujas reações de PCR deram umresultado positivo (significando que o lócus de Regiderivado de MP305 estava presente) foram depoisadicionalmente retrocruzadas com as respectivas linhagensendogâmicas para produzir uma BC2. Este procedimento,chamado "genotipagem", identifica a composição genética deuma planta no sitio de um marcador particular. Essas etapasforam repetidas para o desenvolvimento das . parentaisrecorrentes BC3, BC4 e BC5. A análise mostra que, apóscinco retrocruzamentos, essas linhagens retinham umintervalo cromossômico significativamente truncadocompreendendo o lócus de Regi, e, com base em observaçõesvisuais, não foi observada nenhuma indicação de efeitosnegativos resultantes da presença do lócus de Regi.

A seleção de parental recorrente também foi realizadapela seleção das plantas fenotipicamente mais parecidas coma parental recorrente. Usando esses métodos genotipicos efenotipicos, foram selecionadas conversões de altaqualidade com uma alta percentagem de parental recorrenteao longo de todo o genoma.Este exemplo também ilustra o fato de que osmarcadores flanqueadores não são usados exclusivamente paraselecionar tanto dentro como fora do gene Regi. As mudascujas reações de PCR deram um resultado positivo(significando que o lócus de Regi derivado da MP305 estavapresente) foram depois adicionalmente retrocruzadas com asrespectivas linhagens endogâmicas para produzir oretrocruzamento final (a geração BC5 parental recorrente)nesta primeira série. Quando os marcadores polimórficosflanqueadores mais próximos determinaram que o gene estavapresente, foi usado o próximo conjunto de marcadorespolimórficos flanqueadores duplos mais distais com relaçãoao gene para a seleção do parental recorrente. Portanto, ouso de marcadores que flanqueiam o gene Regi ou o lócus doRegi serve para clarear a recombinação que ocorre naregião.

Segunda Série de Retrocruzamento

As conversões do lócus de Regi endogâmicas feitasusando as SSRs que flanqueiam o lócus de Regi na primeirasérie de retrocruzamento foram depois usadas como doadorasem uma rodada sucessiva de retrocruzamentos. Para estaprimeira série de retrocruzamentos, foram desenvolvidosmarcadores de SNP para o gene Regi que possibilita aseleção assistida com marcador em um modo de alta produção,como descrito no Exemplo 13, para selecionar com relação aogene Regi. Os marcadores de SNP também foram desenhados naregião em torno do lócus de Regi, permitindo que osmarcadores flanqueadores sejam usados para selecionar forado intervalo cromossômico de MP305 que rodeia o lócus deRegi, e para selecionar o genótipo parental recorrente,reduzindo, por esse meio, grandemente o arraste de ligação.

É somente através do mapeamento fisico e clonagem do geneque é possível tal seleção precisa de parental recorrenteassistida com marcador.

Primeiramente, as plantas BC5 parentais recorrentesresultantes da primeira série de retrocruzamentos forammais uma vez submetidas a screening com um conjunto demarcador mais preciso, e a recombinação foi selecionadapara o sul do gene Regi. Os marcadores f lanqueadoresfirmemente ligados ao gene Regi (MZA8761, MZA1851, UMC1051,e UMC2187) foram usados para selecionar o parentalrecorrente para o sul do gene em pequenos tamanhos depopulação de aproximadamente 40 progênies (ver Figura 8 (a-b) ) . Essas progênies foram depois analisadas usando osmarcadores de FLP aqui revelados, para mais precisamentedeterminar o ponto de recombinação. Estes dados mostraramque foram selecionadas algumas progênies com genomaparental recorrente de menos que 1 cM (com base nasdistâncias de mapa genético Neighbors IBM2) do sul do geneRegi, como mostrado na Figura 8 (b) . Outra progênie tinhagenoma parental recorrente de menos que 4 cM do sul do geneRegi. Essas conversões de BC5 selecionadas com marcadorforam depois usadas como doadores, e cruzadas com contra-partes aproximadamente isogênicas de PH705, PH5W4, PH51K ePH87P como as parentais recorrentes para dar a populaçãoBC6. Os marcadores no gene Regi foram novamente usados paraselecionar com relação ao Regi, com marcadoresflanqueadores com relação ao norte do Regi, desta vez sendousado para selecionar o parental recorrente. Nesta rodadade seleções, as recombinações foram detectadas em cada umadas populações entre o Regi e o marcador MZA15842. Aposição do MZA15842 no mapa genético Neighbors IBM2 podeser extrapolada a partir da sua posição no mapa de altaresolução mostrado na Figura 7(b), mapa B, usando regressãocom relação aos marcadores flanqueadores UMC2285 e PHI093.Isto colocou o MZA15842 em 520, 5 cM no mapa genéticoNeighbors IBM2. Portanto, como mostrado na Figura 8 (b), emduas rodadas de retrocruzamento, o genoma doador foireduzido a um segmento de menos que 6 cM em cada população,ou menos que 0,8% do cromossomo 4, com base nas distânciasdo mapa genético Neighbors IBM2, e em algumas progênies osegmento foi de menos que 2,1 cM, ou menos que 0,25% docromossomo 4. Para fins de comparação, o intervalocromossômico de MP305 com o lócus de Regi em DE811ASR (BC3)foi de 131 cM, ou aproximadamente 16% do cromossomo 4, combase nas distâncias do mapa genético Neighbors IBM2. Ésomente através do mapeamento fisico e clonagem do gene queé possível tal seleção precisa e eficiente de parentalrecorrente assistida com marcador.

Análise Posterior

Portanto, como resultado do mapeamento refinado dalocalização do gene Regi, pode-se utilizar quaisquer doismarcadores flanqueadores que são geneticamente ligados como gene Regi para selecionar uma pequena região cromossômicacom crossovers ao norte e ao sul do gene Regi. Isto trazcomo beneficio a redução do arraste de ligação, o qual podeser um fator de confusão quando se tenta introgredir umgene especifico oriundo de germoplasma não adaptado, talcomo a MP305, para um germoplasma elite, tal como aslinhagens endogâmicas observadas acima. As Figuras 7 e 22 ea Tabela 16 mostram muitas combinações de marcadores queflanqueiam o gene e o lócus de Regi que podem ser usadaspara este propósito. Alguns marcadores flanqueadoresespecíficos que podem ser usados para selecionar intervaloscromossômicos truncados que incluem o gene ou o lócus deRegi são UMC2285 e UMC15a, UMC2285 e UMC2187, UMC1086 eUMC2200, UMC2041 e UMC2200, UMC2041 e PHI093, MZA11455 eUMC15a, MZA11455 e MZA3434, MZA15842 e MZA3434, e FLP8 eFLP33. Opcionalmente, em ou dentro de cada um dessesintervalos cromossômicos, pode-se utilizar pelo menos 1, 2,3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 ou maismarcadores de modo a localizar o evento de recombinação eselecionar o gene Regi ou o lócus de Regi com a máximaquantidade de genótipo parental recorrente. Adicionalmente,pode-se ter pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,13, 14, 15, ou mais marcadores entre a extremidade norte detal intervalo cromossômico e o topo do gene Regi e/ou entrea extremidade sul de tal intervalo cromossômico e o fundodo gene Regi.É vantajoso ter marcadores flanqueadores estreitamenteligados para a seleção de um gene, e é altamente vantajosoter marcadores dentro do próprio gene. Isto é umaperfeiçoamento sobre o uso de um único marcador ou demarcadores flanqueadores distantes, na medida em que, comum único marcador ou com marcadores flanqueadoresdistantes, a ligação associada com o Regi pode ser quebradae, por seleção de tais marcadores é mais provável queocorra a seleção inadvertidamente de plantas sem o geneRegi. Na medida em que a seleção assistida com marcador éfreqüentemente usada, ao invés da seleção fenotipica, umavez que a associação marcador-caractere tenha sidoconfirmada, o resultado inauspicioso de tal erro pode ser aseleção de plantas que não são resistentes a Cg e descartarplantas que são resistentes a Cg. Neste aspecto, osmarcadores dentro do gene Regi são particularmenteutilizáveis, já que eles, por definição, permanecerãoligados com resistência a Cg como melhorado ou conferidopelo gene. Além disso, os marcadores dentro do lócus deRegi são justamente utilizáveis por uma razão similar.Devido à sua proximidade muito estreita com relação ao geneRegi, muito provavelmente eles permanecem ligados ao geneRegi. Uma vez introgredidas com o gene Regi, taisendogâmicas elite podem ser usadas para a produção desemente híbrida e como fonte doadora de posteriorintrogressão do gene Regi em outras linhagens endogâmicas.

Portanto, os dados nitidamente mostram que a progênieendogâmica convertida pelo uso da DE811ASR(BC5) como umafonte doadora retém o intervalo cromossômico truncado daMP305. As endogâmicas compreendendo o intervalocromossômico truncado da MP305 são muito úteis como aspróprias fontes doadoras e não há necessidade de reverterpara a DE811ASR (BC5) como uma fonte doadora. Pelo uso demelhoramento assistido com marcador como acima descrito, ointervalo cromossômico truncado de MP305 pode ser aindareduzido em tamanho quando for necessário sem preocupaçãode perder a ligação entre os marcadores e o gene Regi.Fenotipicamente, um intervalo cromossômico reduzido estáassociado com o desempenho agronômico aperfeiçoado, comofoi demonstrado para a DE811ASR(BC5) versus a DE811ASR(BC3)acima descritas.

EXEMPLO 6

Uso do Regi como um transgene para criar plantas demilho resistentes

O gene Regi também pode ser expressado como umtransgene, permitindo a modulação de sua expressão emdiferentes circunstâncias. Os exemplos a seguir mostramcomo o gene Regi pode ser expressado em diferentes maneiraspara combater diferentes doenças ou proteger diferentesporções da planta, ou simplesmente mover o gene Regi paradiferentes linhagens de milho como um transgene, como umaalternativa para o método descrito no Exemplo 5.

EXEMPLO 6A:Neste exemplo, o gene Regi é expressado usando seupróprio promotor. A região a montante do gene Regi foiseqüenciada usando os mesmos BACs que, no Exemplo 2,forneceram as seqüências da seção codificante de proteinado gene. A seqüência 5' de 1684 pb até o ATG estáapresentada na SEQ ID No: 24. De modo a transformar o geneRegi completo, incluindo o promotor e a região codificantede proteina, um fragmento de 5910 pb que se estende desde aposição 41268 até a posição 47176 na SEQ ID No: 137 foiamplificado por PCR usando o clone de BAC #24 (pk257m7)como template de DNA. Para possibilitar a clonagem usando aTecnologia Gateway® (Invitrogen, Carlsbad, USA), sitiosattB foram incorporados em primers de PCR, e o produtoamplificado foi clonado no vetor pDONR221 por reação derecombinação BP Gateway®. O fragmento resultante,flanqueado por sitios attL, foi transportado pela reação derecombinação LR Gateway® em um vetor binário. O DNA doconstrueto foi depois usado para a transformação de milhocomo descrito no Exemplo 7.

EXEMPLO 6B:

De modo a expressar o gene Regi através da planta emum baixo nivel, a região codificante do gene e seuterminador são colocados atrás dos promotores tanto do genede actina de arroz (patentes US 5.641.876 e US 5.684.239)como do gene F3.7 (patente US 5.850.018). Para possibilitara clonagem usando a Tecnologia Gateway® (Invitrogen,Carlsbad, USA), sítios attB são incorporados nos primers dePCR que são usados para amplificar o gene Regi começando 35pb a montante do seu códon de iniciação. É adicionado umsitio Notl ao primer attBl. 0 produto de Regi amplificado éclonado no vetor pDONR221 pela reação de recombinação BPGateway® (Invitrogen, Carlsbad, USA) . Após a clonagem, ogene Regi resultante é flanqueado por sitios attL e possuium único sitio Notl no 35 pb a montante do códon deiniciação. Depois disso, os fragmentos de promotor sãoamplificados por PCR usando primers que contêm sitios Notl.Cada promotor é fundido ao sitio Notl do Regi. Na etapafinal, o gene quimérico é transportado pela reação derecombinação LR Gateway® (Invitrogen, Carlsbad, USA) para ovetor binário PHP20622. Isto é usado para a transformaçãode milho como descrito no Exemplo 7.

EXEMPLO 6C:

De modo a expressar o gene Regi através da planta emum alto nivel, a região codificante do gene e seuterminador foram colocados atrás do promotor da região 5'não-traduzida e de um intron de um gene de ubiquitina demilho (Christensen et al. (1989) Plant Mol. Biol. 12:619-632; Christensen et al. (1992) Plant Mol. Biol. 18:675-689) . Para possibilitar a clonagem usando a TecnologiaGateway® (Invitrogen, Carlsbad, USA), sitios attB foramincorporados nos primers de PCR que foram usados paraamplificar o gene Regi começando no pb 142 a montante docódon de iniciação. 0 produto de amplificação foi clonadono pDONR221 (Invitrogen, Carlsbad, USA) usando uma reaçãode recombinação BP Gateway® (Invitrogen, Carlsbad, USA).Após a clonagem, o gene Regi resultante foi flanqueado porsitios attL. Na etapa final, o clone Regi foi transportadopor meio de uma reação de recombinação LR Gateway(Invitrogen, Carlsbad, USA) para um vetor que continha opromotor de ubiquitina de milho, a região 5' não-traduzidae o primeiro intron do gene de ubiquitina como descrito porChristensen et al. (acima mencionado) seguido por sitiosATTR1 e R2 Gateway® para a inserção do gene Regi, atrás docassete de expressão de ubiquitina. O vetor também continhaum gene marcador apropriado para transformação de milho, demodo que o plasmideo resultante, portanto o gene quimérico(promotor de ubiquitina de milho - região não-traduzida 5'de ubiquitina - intron 1 de ubiquitina - Regi), foiapropriado para a transformação de milho como descrito no Exemplo 7.

EXEMPLO 6D:

De modo a expressar o gene de Regi sob condições debaixo nivel de expressão colmo-preferida, a regiãocodificante do gene e seu terminador são colocados atrás dopromotor do gene Br2 (Pedido de Patente US No. de Série10/931.077). O fragmento descrito no Exemplo 6b contendo aregião codificante de Regi flanqueada pelos sitios attL econtendo um sitio único Notl 35 pb a montante do códon deiniciação de Regi é usado para possibilitar a clonagemusando a Tecnologia Gateway® (Invitrogen, Carlsbad, USA) .Os fragmentos de promotor tanto do Br2 como do ZM-419 sãoamplificados por PCR usando primers que contêm sitios Notl.Cada promotor é fundido ao sitio Notl de Regi. Na etapafinal, o construeto de gene quimérico é transportado pormeio de reação de recombinação LR Gateway (Invitrogen,Carlsbad, USA) para o vetor binário PHP20622. Este é usadopara a transformação de milho como descrita no Exemplo 7.

EXEMPLO 7

Transformação de milho mediada por Agrobacterium eregeneração de plantas transgênicas

Os construetos de DNA recombinante preparados noExemplo 6a e 6c foram usados para preparar plantastransgênicas de milho como se segue.

O milho foi transformado com construetos depolinucleotideo selecionados descritos no Exemplo 6a e 6cusando o método de Zhao (patente US 5.981.840, e Pedido dePatente PCT publicado W098/32326). Resumidamente, embriõesimaturos foram isolados a partir de milho e os embriõesforam contatados com uma suspensão de Agrobacterium, naqual as bactérias foram capazes de transferir o construetode polinucleotideo a pelo menos uma célula de pelo menos umdos embriões imaturos (etapa 1: a etapa de infecção). Nestaetapa, os embriões imaturos foram imersos em uma suspensãode Agrobacterium para a iniciação da inoculação. Osembriões foram co-cultivados por um tempo com oAgrobacterium (etapa 2: a etapa de co-cultivo). Os embriõesimaturos foram cultivados em meio sólido seguindo-se aetapa de infecção. A seguir deste periodo de co-cultivo,foi realizada uma etapa opcional de "descanso". Nesta etapade descnaso, os embriões foram incubados na presença depelo menos um antibiótico conhecido por inibir ocrescimento de Agrobacterium sem a adição de um agente deseleção para os transformantes de planta (etapa 3: etapa dedescanso). Os embriões imaturos foram cultivados em meiosólido com antibiótico, mas sem um agente de seleção, paraa eliminação do Agrobacterium e para uma fase de descansodas células infectadas. Em seguida, os embriões inoculadosforam cultivados em meio contendo um agente de seleção, e ocalo transformado crescido foi recuperado (etapa 4: a etapade seleção). O calo foi então regenerado para plantas(etapa 5: a etapa de regeneração), e os calos crescidos nomeio de seleção foram cultivados em meio sólido pararegenerar as plantas.

EXEMPLO 8

Avaliação da planta transgênica

As plantas transgênicas foram produzidas como descritono Exemplo 7 usando constructos descritos nos Exemplos 6a e6c, respectivamente. Para ambos os constructos, do geneRegi natural e do gene Regi de ubiquitina, foram gerados 30eventos independentes e 10 eventos de controle de vetorsomente.Discos de folha de cada evento transgênico de genenatural foram colhidos para isolamento do RNA total. O RT-PCR foi realizado usando os primers específicos de geneFLP111F e FLP111R apresentados nas SEQ ID Nos: 37 e 38. Em30 dos 30 eventos transgênicos, a banda de RT-PCR esperadade 637 pb estava presente, indicando a expressão doconstructo' de gene natural. Os ensaios de doença foramrealizados na casa de vegetação nos mesmos 30 eventostransgênicos de Regi natural para determinar se as plantaseram resistentes a Cg. Para realizar isto, primeiramenteforam feitos os ensaios de queima das folhas em 5 plantasirmãs de cada evento usando os procedimentos descritos noExemplo 10. Foi verificado que um único evento mostrou umasignificativa redução na doença com relação às plantascontrole nas quais está ausente o constructo do gene Reginatural. As plantas que foram submetidas ao ensaio dequeima de folha foram deixadas a desenvolver por duassemanas após a antese e, depois, adicionalmente testadaspela inoculação de Cg no interior do primeiro internódulode colmo alongado. Esses ensaios de infecção de colmomostraram um único evento transgênico que expressa otransgene Regi natural como sendo mais resistente àinfecção por Cg quando comparado com as plantas controle.Entretanto, este evento diferiu do evento positivoidentificado via os ensaios de infecção de folha.

As plantas transformadas com o constructo de Regi deubiquitina descritos no Exemplo 6c foram analisadas de ummodo semelhante. A análise de RT-PCR mostrou que 28 dos 30eventos transgênicos continham a esperada banda detranscripto, indicando a expressão do constructo de Regi deubiquitina. Quando os ensaios de infecção de folha foramrealizados em 5 plantas a partir de cada um dos 30 eventos,foi identificado um único evento que mostrou uma reduçãoestatisticamente significativa na doença comparada com asplantas controle. As plantas transgênicas foramadicionalmente analisadas pelos ensaios de infecção decolmo. Foram encontrados três eventos como apresentandoaumenta resistência à podridão do colmo quando comparadoscom as plantas controle nas quais está ausente o gene Regide ubiquitina. Esses eventos transgênicos não incluem oprimeiro evento positivo identificado no ensaio de queimade folha.

Os resultados desses experimentos foram consideradosencorajadores com relação aos eventos que mostraram algumaresistência, mas inconclusos, no geral, por diversasrazões. Eventos positivos mostrando resistência aumentada àdoença pelo ensaio de queima da folha falharam emcorrelacionar tais eventos com aqueles identificados peloensaio de infecção do colmo. Isto é o oposto do controlepositivo DE811ASR(BC5) que mostra um nitido aumento deresistência com relação à DE811 em ambos os ensaios dequeima de folha e de infecção de colmo. Adicionalmente, osensaios dos tansgênicos primários mostraram um grau maisalto de variabilidade quando comparados com os ensaios decontroles de DE811 ou DE811ASR (BC5) . Isto foifreqüentemente visto nas replicatas e também através doseventos de controle negativo. Esta última observação podetornar dificil a discriminação dos eventos positivos dosnegativos. As causas possíveis para a natureza inconclusados resultados dos ensaios de doença incluem, mas não estãolimitadas, às que se seguem. É bem conhecido dosespecialistas na técnica que aquelas plantas transgênicasque são derivadas de cultura de tecido apresentam maiorvariabilidade de planta para planta com relação às plantascontrole que são derivadas de semente. Além disso, aexpressão em transformantes primários, ou seja, plantas queforam submetidas ao processo de transformação e regeneraçãocomo descrito no Exemplo 7, é freqüentemente não previsíveldevido ao estresse dos procedimentos de cultura de tecido.

Se, de fato, os eventos forem negativos, os quais não podemser determinados neste ponto, há diversas razões técnicaspara que isto ocorra. Os ensaios realizados também nãodeterminaram se a proteína codificada pelo gene Regi estárealmente presente nas linhagens transgênicas - somente apresença de um segmento do mRNA predito foi analisadousando o RT-PCR. Pode ser que artefatos tenham sidointroduzidos no cassete gênico durante a transformação -não foram realizados exaustivos Southern blots eseqüenciamento para determinar a integridade do construetocompleto nas linhagens transgênicas. De modo a se estudarmais apuradamente essas linhagens transgênicas, as plantasdas últimas gerações serão crescidas em grandes quantidadessob condições de campo e analisadas com relação àresistência à doença. Pode ser antecipado que essas futurasplantas transgênicas apresentarão mais nitidamenteresistência aumentada a Cg.

EXEMPLO 9

Análise de Distribuição do Gene Regi ao longo doGermoplasma e Identificação de Variantes da Seqüência deRegi

Em seguida à identificação, seqüenciamento emapeamento refinado de Regi, outras linhagens foramsubmetidas a screening com relação ao gene Regi. Paradeterminar a presença do gene Regi em outro germoplasma demilho, foram usadas combinações dos primers específicosFLP111F e FLP111R assim como FLP113F e FLPA1R paraamplificar o DNA genômico a partir de um painel diverso delinhagens endogâmicas de milho, incluindo aquelas listadasna Tabela 18 e a F2834T, por reação em cadeia dapolimerase. Em somente 14 (incluindo a MP305) , de um painelde linhagens endogâmicas de milho, foi detectado um produtode amplificação, indicando que o gene Regi é o únicopresente em uma percentagem muito pequena das linhagensendogâmicas que foram submetidas a screening. Portanto, emadição ao uso da MP305 ou da DE811ASR (BC5) como fontedoadora, outras fontes contendo o gene Regi também podemser usadas como uma fonte doadora. Por exemplo, podem serusadas as linhagens endogâmicas disponíveis ao públicoTX601 (disponível sob a ID ^Ames 22763' a partir doNational Plant Germplasm System (NPGS)) e F2834T(disponível sob a ID 'Ames 27112' a partir do NPGS) asquais contêm o gene Regi como fontes doadoras emcruzamentos com outras linhagens endogâmicas de milho quenão contêm o gene Regi, e seleção com relação ao gene Regipelo uso de marcadores como aqui descrito.

Variantes do gene Regi também foram identificadas eanalisadas com- relação a polimorfismos simples denucleotideos (SNPs). Os SNPs foram identificados emposições na Seqüência ID número 1 correspondentes a uma oumais das posições 413, 958, 971, 1099, 1154, 1235, 1250,1308, 1607, 2001, 2598 e 3342 (ver Tabela 7) . Nem todas asvariantes alélicas do gene Regi indicaram um fenótiporesistente. Conseqüentemente, esses SNPs podem ser usadoscomo marcadores para identificar e rastrear precisamente aseqüência de Regi em um programa de melhoramento de plantae para distinguir entre variantes alélicas resistentes esusceptíveis. Além disso, esses SNPs indicam que háseqüências que mostram o fenótipo resistente e que podemser usadas em métodos e produtos aqui revelados. Tambémpode ser verificado que quatro outras linhagens contêm umalelo de Regi: BYD10, 7F11, CML261 e CML277. O testerealizado em 10 plantas não forneceu dados suficientespara determinar conclusivamente se a linhagem 7F11 éresistente. Não há dados disponíveis com relação àresistência das linhagens BYD10, CML261 e CML277, e oseqüenciamento desses alelos não foi completado.Tabela 7

<table>table see original document page 175</column></row><table>

Comprimento da seqüência Consenso = 4212 nucleotídeos. SEQ ID No : 1 é a seqüência de Rcg1. Para as linhagens restantes, a seqüência disponível se expandiu desde o códon de início "atg" no primeiro exon até o códon de parada "tga" no segundo exon. A posição consenso ébaseada na SEQ ID No: 1.EXEMPLO 10

Linhagens contendo o gene Regi são resistentes aqueima de folha induzida por Antracnose

As linhagens aproximadamente isogênicas DE811 eDE811ASR descritas no Exemplo 1 foram testadas com relaçãoàs diferenças de resistência à queima de folha causada porCg usando o procedimento a seguir. Quatro agulhas comuns decostura caseira foram coladas a um suporte de metal de modoque os orifícios para a linha se estendessem para fora dapeça de metal, sendo que todas as quatro agulhas seestenderam por igual distância. Esse conjunto foimergulhado em uma suspensão de esporos de Cg a 5 X IO6esporos/mL e depois empurrado através da superfície de umafolha jovem de milho de modo que a folha ficasse ferida eas feridas fossem simultaneamente inoculadas com osesporos. Uma mecha de algodão úmido foi colocada na nervuracentral perto do sitio de inoculação e a área inteira foicoberta com filme plástico e, sobre este, um pano refletor,ambos amarrados com uma faixa para mantê-la úmida eprotegida. As plantas foram deixadas nesse estado por 50-54horas em uma casa de vegetação padrão, após o que a faixa,o pano e o filme plástico foram removidos. Nos dias 7 e 15após a inoculação, o tamanho da lesão foi medido eregistrado em unidades de centímetros quadrados.

A Figura 10 (a-b) mostra a distribuição de tamanhos delesão 15 dias após a inoculação ao longo do todo das folhasindividuais. Os tamanhos de lesão variam em cada conjuntode dados, mas virtualmente todos os das folhas da DE811(Figura 10b) tinham tamanhos de lesão significativamentemaiores do que as maiores lesões a serem encontradas nasfolhas da DE811ASR(BC5) (Figura 10a). Os dados estãoresumidos para ambos os conjuntos de dados, os do dia 7 eos do dia 15 após a inoculação, como visto na Figura 11. Emambos os dias 7 e 15, o tamanho médio de lesão foi menornas folhas portadoras do gene Regi. A diferença se tornoumaior ao longo do tempo, à medida que o fungo tivesse tempopara crescer e causar dano adicional, de modo que enquantoa diferença é de aproximadamente duas vezes nos dias 7, nosdias 15 ela é mais do que quatro vezes e, de fato, o fungofez somente progresso minimo nas folhas da DE811ASR(BC5).Esses resultados demonstram claramente que a presença dolócus contendo o gene Regi confere resistência à queima defolha por antracnose.

EXEMPLO 11

Linhagens hibridas derivadas da DE811ASR(BC5) possuemmais alta produtividade do que as hibridas da DE811 quandoinfectadas com Colletotrichum graminicola

De forma a demonstrar que as hibridas de milhocontendo o gene Regi possuem mais alto potencial deprodutividade quando infectados com Cg em comparação com aslinhagens hibridas sem Regi, a DE811ASR (BC5) e a DE811, aslinhagens isogênicas descritas no Exemplo 1, foram, cadauma delas, cruzadas com as linhagens endogâmicas B73Ht eMol7Ht, as quais são ambas susceptíveis a Cg.

As linhagens híbridas foram crescidas e avaliadas comrelação à resposta a Cg em 2005, em seis localidades emcinco estados diferentes dos Estados Unidos da América.Para cada linhagem híbrida, foram plantadas trêsreplicações de quatro fileiras a aproximadamente 74.000plantas por hectare. As plantas foram inoculadas com Cg nabase do colmo aproximadamente 10 dias após a florescência.

A primeira fileira de cada parcela de quatro fileiras foiavaliada para verificar se as inoculações tinham sido bemsucedidas, através da determinação da resposta a Cg quatroa cinco semanas após a inoculação. Os colmos foram rachadose a progressão da doença foi contabilizada em escore pormeio de observação da cor preta característica do fungo àmedida que ele se espalha ascendentemente no colmo. Osíndices de doença foram conduzidos como descrito por Junget al. (1994) Theoretical and Applied Genetics, 89:413-418). O número total de internódulos descoloridos maior doque 75% (antgr75) foi registrado nos primeiros cincointernódulos (ver Figura 20) . Isto forneceu um escore dedoença variando de 0 a 5, sendo que zero indica seminternódulos que sejam mais do que 75% descoloridos e 5indicando a completa descoloração dos primeiros cincointernódulos. As duas parcelas centrais foram colhidas namaturidade fisiológica através da máquina de ceifar edebulhar e foi determinada a produtividade de grão emkg/ha.Os resultados resumidos oriundos de todas aslocalidades são mostrados na Figura 12 com relação àgravidade da doença e na Figura 13 com relação àprodutividade. Os dados mostram que os híbridos contendo oRegi (DE811ASR(BC5)/B73Ht e DE811ASR(BC5)/Mol7Ht) possuemmuito menos progresso de doença do que os híbridos sem oRegi (DE811/B73Ht e DE811/Mol7Ht) . Os ' altos escoresrelativos ao progresso da doença nos híbridos susceptíveis(ausência do Regi) mostram a infecção bem sucedida doexperimento com Cg. Além disso, os dados mostram que,quando infectados com Cg, os híbridos contendo Regi possuemuma produtividade maior do que os híbridos com ausência doRegi. As diferenças das comparações em pares individuaissão significantes em P<0,05.

Esses resultados demonstram claramente que, por meiodo uso dos métodos das concretizações, podem ser criadoshíbridos que produzam mais kg de grão por hectare quandoinfectados com Cg.

EXEMPLO 12

Conversões de lócus de Regi de endogâmicos e híbridosderivados de DE811ASR (BC5) ou MP305 são resistentes apodridão de colmo induzida por Colletotrichum graminicola

De modo a demonstrar que as linhagens comerciais demilho podem ser tornadas resistentes a podridão do colmoinduzida por Cg, as MP305 e DE811ASR (BC5) foram cruzadascom PH87P, PH5W4, e PH705. A progênie resultante foicruzada novamente com as três linhagens (ou seja, aslinhagens foram usadas como parentais recorrentes em umprograma de retrocruzamento) mais três vezes, a cada vezsendo feita a seleção com relação à presença do gene Regiusando marcadores moleculares, como descrito no Exemplo 5acima. Como controles, foram também coletadas linhagensselecionadas de retrocruzamento nas quais estava ausente ogene Regi a partir do mesmo programa de retrocruzamento.

Após terem sido completados três retrocruzamentos, diversasversões foram selecionadas e autofecundadas para obter asfamílias BC3S1. Plantas individuais de BC3S1 foramgenotipadas e as plantas positivas homozigotas e negativashomozigotas com relação ao Regi foram autofecundadas paraobter familias BC3S2, as quais foram depois fenotipadas. Asversões de BC3S2 contendo Regi e, como controles, versõesselecionadas sem o gene, foram plantadas em parcelas defileiras simples contendo aproximadamente 25 plantas porfileira. O experimento foi reproduzido em cinco diferenteslocalidades em cinco diferentes estados dos Estados Unidos,designadas Localidades 1, 2, 3, 4 e 5. A aproximadamenteduas semanas após a florescência, as plantas foraminoculadas com Cg na base do colmo. Quatro a cinco semanasmais tarde os colmos foram rachados e foi avaliado oprogresso da doença por estimativa visual da quantidade dedoença no colmo. Um escore visual foi assinalado para cadacolmo com base no grau de infecção de cada internódulo comrelação ao internódulo infectado e os quatro internódulosacima do internódulo de inoculação. Portanto, um baixoescore indica resistência à doença. Os resultadoscompilados para todas as fileiras e localidades estãoresumidos na Figura 14. Imagens representativas de duaslinhagens são mostradas nas Figuras 15 e 16. Os dadosmostram que em todas as localidades, cada uma das linhagensendogâmicas elite foi tornada mais resistente à doença pelapresença do gene Regi.

A semente de milho vendida aos agricultores é"híbrida", indicando que ela é mais comumente o resultadode um cruzamento de duas parentais endogâmicas, referidascomo um híbrido de cruzamento simples. Muitos anos demelhoramento e experiência de produção mostraram que o usode híbridos de cruzamento simples resulta em produtividadesmais altas. Portanto, é importante, para aplicaçõescomerciais, que o gene Regi funcione nas plantas híbridas(aquelas do campo de produção do agricultor), mesmo queesteja presente em somente um dos dois parentais usado paraproduzir a semente hibrida de cruzamento simples. Uma daslinhagens endogâmicas com a qual a linhagem de Regi tenhasido cruzada, a PH705, foi assim usada para criar a sementehibrida por cruzamento com a PH4CV, uma endogâmica eliteque não porta o gene Regi. As sementes híbridas resultantesforam usadas em experimentos idênticos àqueles descritospara as linhagens endogâmicas como discutido acima econtabilizado em escore da mesma maneira em todas as cincolocalidades. Os dados estão resumidos para todas aslocalidades na Figura 17, a qual também mostra o desempenhoda endogâmica PH705, e imagens representativas mostradasnas Figuras 18 e 19. Como pode ser visto, uma nitidadiferença no progresso da doença foi observado em todas aslocalidades para o hibrido PH705 x PH5W4 e em quatro dascinco localidades para o PH705 x PH87P. Na quintalocalidade, as condições ambientais foram muitoestressantes para o crescimento da planta, resultando emplantas que estavam em fraca condição. Sob essas condições,as medidas de resistência da planta à doença freqüentementenão são confiáveis.

Os resultados com ambas as linhagens, a endogâmica ecombinações hibridas contendo Regi, nitidamente demonstramque, usando os métodos das concretizações, pode-se criarlinhagens utilizáveis comercialmente, as quais sãoresistentes a podridão do colmo induzida por Cg.

EXEMPLO 13

Marcadores dentro da seqüência codificante de Regilocalizações de marcador e desenho dentro do lócus de Regie haplótipos para a região cromossômica flanqueadora

Três niveis de localização de marcador podem serutilizados como o resultado de um mapeamento refinado eclonagem do gene Regi, marcadores desenhados dentro daseqüência codificante de Regi, marcadores desenhados dentroda região não-colinear que identifica o lócus de Regi (masfora da seqüência codificante de Regi) e marcadoresdesenhados dentro da região colinear flanqueadora.

Marcadores dentro da seqüência codificante de Regi

Seguindo-se à identificação e ao mapeamento refinadodo gene Regi, foram desenhados marcadores de hibridizaçãoque funcionarão em plataformas de SNP. Na medida em que ogene Regi ocorre em uma região não co-linear do genoma demilho, os marcadores de hibridização estarão presentes emlinhagens compreendendo o gene Regi e ausentes em linhagensque não compreendem o gene Regi. Esses marcadoresidentificam seqüências de polinucleotideo especificas paraa seqüência codificante de Regi listada na SEQ ID No: 1.Como observado na Tabela 7, há outras linhagens de milhocom variantes da seqüência codificante de Regi apresentadana SEQ ID No: 1, e esses marcadores também foram desenhadospara também identificar essas variantes de seqüênciacodificante de Regi.

Para realizar isso, foi criado um mapa consenso daseqüência codificante de Regi a partir de diferentesfontes, como mostrado na Tabela 7. Este mapa consensoalinhou 4209 bases da seqüência codificante de Regi isoladada MP305 com 3451 bases oriundas da PHBTB e 3457 basesoriundas da PH26T. O gene Regi em ambas, PHBTB e PH26T,mostrou resistência à antracnose. Em seguida, os segmentosda seqüência codificante de Regi foram submetidos ao BLASTcontra diversas bases de dados incluindo a NT (DNA Públicoa partir do NCBI) e os mais altos sucessos de homologiaforam alinhados com a seqüência consenso de Regi paradeterminar os segmentos que compartilhavam alta homologia etinham segmentos comuns com outros genes de resistência nafamília NBS-LRR. As regiões únicas para a seqüênciacodificante de Regi e comuns entre as diferentes fontes deRegi foram selecionadas para o desenho do marcador.Especificamente, na medida em que os primers FLP111F eFLP111R produziram um único amplicon que confiavelmentediagnosticou a presença de Regi oriundo de diferentesfontes, as regiões em que FLP111F e FLP111R hibridizaramforam, portanto, tomadas como alvo para o desenvolvimentode um desenho de marcador de SNP.

Um marcador Invader™ {Third Wave Technologies,Madison, WI) foi desenhado usando um segmento de 1413pb apartir da seqüência consenso que continha ambos os sitiosdo primer, sendo que as regiões do primer em si foramtornadas alvo com relação à sonda e hibridização do oligodo Invader™. Os primers foram desenhados em torno de cadasítio de sonda para dar um tamanho de amplicon abaixo de150 pb. Este marcador indicou a presença da seqüênciacodificante de Regi com fluorescência devida àhibridização, sendo que a ausência da seqüência codificantede Regi resultou em não-fluorescência. Um sinal defluorescência controle também pode ser gerado pelo desenhode um marcador que hibridiza com um segundo gene de milhoaltamente conservado, de modo que a presença da seqüênciacodificante de Regi resulta em f luorescência de doiscorantes {Regi e o gene conservado) e a ausência de Regiresulta em fluorescência devida ao gene conservado somente.Esta fluorescência 'controle' pode ser usada para reduzir oerro laboratorial por meio da distinção entre as situaçõesem que o Regi está de fato ausente e a situação em que umfalso negativo tenha ocorrido por causa de uma reaçãofalha. Tais marcadores não estão limitados a uma plataformade detecção de marcador especifico. Os marcadores Taqman®(Applied Biosystems) também foram desenhados para a mesmalocalização (par de primers FLP111F e FLP111R) , que foramusados da mesma meneira que para os marcadores Invader™. Osmarcadores estão mostrados na Tabela 15 e Figuras 23 e 24.

Os desenhos de marcador C00060-01-A e C00060-02-Aforam testados para uma ampla variedade de fontes e foramaltamente bem sucedidos em identificar plantas quecontinham o lócus de Regi e o gene Regi, independentementeda fonte do lócus de Regi ou do gene Regi. Esses marcadorestambém foram usados contra um conjunto controle de perto de100 linhagens endogâmicas diversas conhecidas como nãoportadoras do gene, e nenhuma fluorescência foi detectadano conjunto controle. As plantas em que um ou ambos osdesenhos de marcador, C00060-01-A e C00060-02-A,confirmadas como tendo o Regi incluem aquelas mostradas naTabela 7.

Portanto, este exemplo mostra que, com base noensinamento aqui provido, podem ser construídos marcadoresque identificam a seqüência codificante de Regi em umadiversidade de fontes.

Marcadores dentro do lócus de Rcgl

Podem ser desenhados marcadores para o lócus de Rcgl

em adição a ou ao invés de usar marcadores dentro daprópria- seqüência codificante de Rcgl. A distância fisicapróxima entre a seqüência codificante de Rcgle a região não-colinear torna improvável o fato de que a ligação entremarcadores dentro da região não-colinear, mas fora daseqüência codificante de Regi, seja perdida através derecombinação. Da mesma forma que com marcadores para aseqüência codificante de Rcgl, um marcador mostrando comopresente ou ausente seria suficiente para identificar olócus de Rcgl.

Para desenhar marcadores para esta região, foiseqüenciado um segmento de 64.4 60 pb da região não-colinearincluindo o gene Regi e a região diretamente ao norte dogene Rcgl. Os BACs nesta região foram rompidos em sub-clones com comprimento de aproximadamente 800 nucleotideose seqüenciados. Estas seqüências foram depois montadas paraconstruir a seqüência BAC, e as regiões gênicas erepetitivas foram identificadas. As regiões repetitivasforam identificadas de modo a evitar a colocação demarcadores em regiões repetitivas. Semelhantemente, asseqüências com alta homologia com relação a seqüências demilho conhecidas foram facilmente evitadas por meio de umabusca simples de BLAST. Foram evitadas as seqüênciaspotenciais que contivessem SSRs, corridas de As, Ts ou Gs,ou que resultassem na geração de sondas de baixo teor de GCque podem causar problemas dentro da plataforma Invader™(ver Figura 9(b) e Tabela 17).

Os segmentos selecionados foram depois colocados nosoftware Invader Creator™ (Third Wave, Madison, WI) , o qualgera oligos para uma reação Invader™. Isto produziu umdesenho sense e um antisense para todos os SNPs. Foramselecionados os desenhos sense com os melhores escores esem penalidades. Apesar de esses marcadores terem sidodesenhados, eles ainda não foram testados.

Foram desenhados primers usando o Primer3 (Steve Rozene Helen J. Skaletsky (2000) Primer3 disponível na Web parausuários em geral e para programadores em biologia. In:Krawetz S, Misener S (eds) Bioinformatics Methods andProtocols: Methods in Molecular Biology. Humana Press,Totowa, NJ, pp 365-386) . Os primers foram selecionados forados components Invader™, e foram selecionados os primerspreferidos perto de ou abaixo do comprimento de 150 pb. Atemperatura e o comprimento do primer foram ajustados paraser o mais utilizável pela plataforma Invader™, apesar deque, se forem usados com outras plataformas de detecção, osprimers devem ser otimizados para uso com tais plataformas.

Marcadores na região co-linear e haplotipos associadosMarcadores proximamente ligados flanqueando o lócus deRegi podem ser eficazmente usados para selecionar umaplanta de progênie que tenha herdado o lócus de Regi de umaparental que compreende o lócus de Regi. Os marcadores aquidescritos, tais como aqueles listados na Tabela 16, assimcomo outros marcadores geneticamente ou fisicamentemapeados com relação ao mesmo segmento cromossômico, podemser usados para selecionar um segmento cromossômicotruncado compreendendo o lócus de Regi. Tipicamente, umconjunto desses marcadores será usado (por exemplo, 2 oumais, 3 ou mais, 4 ou mais, 5 ou mais) na regiãoflanqueadora acima do gene e conjunto semelhante na regiãoflanqueadora abaixo do gene. Opcionalmente, como descritoacima, um marcador dentro do gene Regi e/ou do lócus deRegi também pode ser usado. Os parentais e sua progênieforam submetidos a screening com relação a esses conjuntosde marcadores, e os marcadores que são polimórficos entreos dois parentais são usados para seleção. Os marcadorespolimórficos mais próximos do gene Regi ou do lócus de Regisão usados para selecionar com relação ao gene ou ao lócus.Em um programa de introgressão, isto permite a seleção dogenótipo do gene Regi ou do lócus de Regi nos marcadorespolimórficos mais próximos, e seleção com relação aogenótipo do parental recorrente nos marcadores polimórficosmais distantes. Como descrito em maiores detalhes noExemplo 5 acima, este processo permitiu a seleção eficientede um segmento cromossômico truncado compreendendo o lócusde Regi.O processo descrito acima requer conhecimento dosgenótipos dos parentais usados no cruzamento.Opcionalmente, podem ser usados haplótipos de maneira que ogene Regi ou o lócus de Regi possa ser selecionado semprimeiramente genotipar os parentais específicos usados nocruzamento. Esta é uma maneira altamente eficiente deselecionar o lócus de Regi, especialmente na ausência deuso de marcadores dentro do gene Regi ou do lócus de Regi.

Todas as plantas a serem usadas no programa demelhoramento, tal como um programa de introgressão de gene,são submetidas a screeníng com marcadores. Podem ser usadosos marcadores aqui revelados ou marcadores equivalentes nomesmo segmento cromossômico. Os haplótipos de planta (umasérie de SNP ou outros marcadores em desequilíbrio deligação) são observados. O haplótipo da planta resistenteem torno do lócus de Regi é comparado com o haplótipo dasoutras plantas a serem usadas que não compreendem o lócusde Regi. Um haplótipo único com relação à planta resistenteem torno do lócus de Regi é então usado para seleção, eeste haplótipo identificará especificamente o segmentocromossômico oriundo da planta resistente com o lócus deRgcl.

Com base em uma análise da MP305 e um conjunto diversode várias centenas de linhagens de milho, incluindo as 50linhagens de milho públicas mostradas na Tabela 18, foiidentificado um único haplótipo de SNP para o segmentocromossômico da MP305 com o lócus de Regi. Este haplótipode SNP identifica de modo único o segmento cromossômico daMP305 que se estende ao longo de MZA3434, MZA2591 eMZA11123. Ver Figura 22, SEQ ID NoO: 140, 141 e 142, eTabelas 8, 9 e 10.

Primeiramente, os pares de primer denscritos na Tabela2 para os três MZA's foram usados para identificar oshaplótipos. Os pares de primers MZA3434 E forward e reverseforam usados para amplificar o DNA genômico do conjunto delinhagens de milho. Os fragmentos de PCR foramposteriormente purificados por amplificação com os pares deprimers MZA3434 I forward e reverse. Este processo foirepetido para a MZA2591 e a MZA11123. Os fragmentos de PCRresultants foram seqüenciados na direção forward e reversee as seqüências foram alinhadas para dar uma seqüênciaconsenso (ver as seqüências apresentadas em SEQ ID Nos:140, 141 e 142). Os SNPs e indels dentro dessas seqüênciasconsenso são mostrados nas Tabelas 8, 9 e 10. Essas sériesde SNPs e indels foram comparados com o conjunto degenótipos.

Para a MZA3434, o haplótipo 8 foi um raro alelo dehaplótipo e foi o único para a MP305 e para somente umaoutra linhagem de milho. Este processo foi repetido para aMZA2591, e foi verificado que a MP305 possui o haplótipo 2em MZA2591, o qual foi compartilhado por somente duasoutras linhagens de milho. A MP305 foi a única linhagem demilho a possuir ambos, o haplótipo 8 em MZA3434 e ohaplótipo 2 em MZA2591 e, portanto, a combinação dessesdois haplótipos, 8 em MZA3434 e 2 em MZA2591, identifica demodo único a região cromossômica da MP305 compreendendo olócus de Regi. A MP305 também tinha um haplótipoinformativo em MZA11123. Foi verificado que a MP305 possuio haplótipo 7, que era compartilhado com 66 outraslinhagens de milho, mas nenhuma dessas linhagens de milhotinha o haplótipo 8 em MZA3434, ou haplótipo 2 em MZA2591.Portanto, qualquer combinação de 2 haplótipos em MZA3434,MZA2591 ou MZA11123 pode ser usado para identificar de modoúnico a MP305 dentre esses genótipos. Os haplótipos podemdepois ser interrogados por seqüenciamento do fragmento oupelo desenho de marcadores para cada SNP ou indel dentro deum fragmento.

Os polimorfismos dentro dos haplótipos podem serusados para marcar o haplótipo. Os chamados 'Tag-SNPs', ouxhaplótipo-tags' podem ser muito úteis no melhoramento deplantas, na medida em que pode ser determinada maisinformação do que o polimorfismo em si via extrapolaçãopara o haplótipo. Um haplótipo pode ser definido como umasérie de polimorfismos ao longo das seqüências e eles podemser denomonados 'haplótipos de longa-faixa'.

Foram observados raros polimorfismos dentro dehaplótipos que devem ser usados como 'marcadores (tags) dehaplótipo'. Por exemplo, tanto os SNPs MZA2591.32 (alelo c)ou MZA2591.35 (alelo t) podem ser usados para marcar ohaplótipo 2 em MZA2591, e da mesma maneira que o haplótipo2, ambos foram únicos para a MP305 e duas outras linhagensde milho. A combinação dos SNPs MZA2591.32 (alelo c) eMZA2591.35 (alelo t) combinada com o MZA3434.17 (alelo c)deu um haplotipo de *longa-faixa' que pode ser usado paradistinguir a MP305 de todos os outros genótipos no estudo.

Adicionalmente, outros marcadores, MZA15842, MZA11455,MZA8761 e MZA1851 também mostraram polimorfismo com aMP305. Para o MZA15842, somente 18 das outras linhagens demilho compartilharam haplotipo igual ao da MP305; para oMZA11455, somente 43 das outras linhagens de milhocompartilharam haplotipo igual ao da MP305; para o MZA8761,somente cerca de metade das outras linhagens de milhocompartilhou haplotipo igual ao da MP305; e para o MZA1851,somente cerca de metade das outras linhagens de milhocompartilhou haplotipo igual ao da MP305. Foramdesenvolvidas seqüências consenso para esses marcadores queestão apresentadas nas SEQ ID Nos: 143-146. Os SNPs eindels dentro de três seqüências consenso estão mostradosnas Tabelas 11-14. Quatro exemplos de haplótipos únicosusando os marcadores de MZA são:

MZA11123 (haplotipo 7)

MZA15842 (haplotipo 3)

MZA8761 (haplotipo 1)e

MZA11123 (haplotipo 7)

MZA15842 (haplotipo 3)

MZA1851 (haplotipo 1)e<table>table see original document page 193</column></row><table>

Múltiplas combinações no seio de todos os marcadoresaqui revelados, ou outros marcadores dentro da regiãotambém conterão haplótipos únicos que identificam' o lócusde Regi.

Tabela 8: Polimorfismos de MZA3434M='Mutante': difere do consenso; W=,tipo selvagem': igualao consenso

<table>table see original document page 193</column></row><table>Tabela 9: Polimorfismos de MZA2591

<table>table see original document page 194</column></row><table>Table 9 (cont.): Polimorfismos de MZA2591

<table>table see original document page 195</column></row><table>Tabela 10: Polimorfismos de MZA11123

<table>table see original document page 196</column></row><table>Tabela 11: Polimorfismos de MZA15842

<table>table see original document page 197</column></row><table>Tabela 12: Polimorfismos de MZA8761

<table>table see original document page 198</column></row><table>Tabela 13: Polimosrfismos de MZA1851

<table>table see original document page 199</column></row><table>Tabela 14: Polimorfismos de MZA11455

<table>table see original document page 200</column></row><table>Tabela 15: Marcadores dentro da Seqüência Codificante de Regi

<table>table see original document page 201</column></row><table><table>table see original document page 202</column></row><table>Tabela 16: Marcadores contidos dentro dos intervaloscromossômicos definidos que podem ser usados paraselecionar o Regi

Os marcadores públicos são retirados do mapa 4neighbors IBM2, enquanto que as localizações relativas dosmarcadores Pioneer (prefixo *MZA') foram determinados pormeio de mapeamento com relação ao mesmo mapa genético e pormeio da localização no mapa fisico.

<table>table see original document page 203</column></row><table><table>table see original document page 204</column></row><table>Tabela 17: Marcadores dentro do Lócus de Regi

<table>table see original document page 205</column></row><table>Tabela 18: Lista de Linhagens Públicas usadas em AnáliseHaplótipos

<table>table see original document page 206</column></row><table>LISTAGEM DE SEQÜÊNCIAS

1) INFORMAÇÕES GERAIS:

I.a) (1) Requerente: E.I. DUPONT DE NEMOURS ANDCOMPANY

I.b) Endereço: 1007 Market Street, Wilmington,Delaware 19898 (US)

I.a) (2) Requerente: PIONEER HI-BRED INTERNATIONALINC.

I.b) Endereço: 7100 N.w., 62nd Avenue, Johnston, Iowa50131-1014 (US)

I.a) (2) Requerente: UNIVERSITY OF DELAWARE

I.b) Endereço: Office of Vice Provost of Research,210 Hullihen Hall, Newark, Delaware,19716 (US)

II) Dados de Prioridade Unionista: US - No.60/668.241 de 04/04/2005 e US - No.60/75.664 de 28/04/2005

III) Titulo da Invenção: POLINÜCLEOTÍDEOS EPROCESSOS DE PRODUÇÃO DE PLANTAS RESISTENTES APATÓGENOS DE FUNGOS

IV) Número de Seqüências: 232 (duzentos e trinta eduas).

V) Formato para leitura em computador:

V.a) Meio utilizado: disquete de 3,5 polegadas.

V.b) Computador utilizado: compatível com IBM PC.

V.c) Sistema operacional: PC-DOS/MS-DOS (FastSEQfor Windows Version 4.0 - software usadopara criar Lista de Seqüências).

2) INFORMAÇÕES GERAIS DAS SEQÜÊNCIAS:I.a) Número identificador da seqüência: SEQ ID No: 1

II) Caracteristicas da seqüência:II.a) tamanho: 4212Il.b) tipo: DNAII.c) organismo: Zea mays

III) Caracteristicas

III.1 .aIII.1 .bIII. l.c

III.1 .aIII. l.bIII .l.c

III. 1 .aIII. l.bIII.l.c

III.1.aIII. l.bIII .l.c

III. 1 .aIII .l.b

Nome/chave: geneLocalização: (0) ... (0)outra informação relevante

nucleotideos para Regi

Seqüência de

Nome/chave: exonLocalização: (143) ... (948)outra informação relevante: exon 1

Nome/chave: exonLocalização: (1452) ... (3588)outra informação relevante: exon 2

Nome/chave: intronLocalização: (949) ... (1451)outra informação relevante: intron 1

Nome/chave: CDSLocalização: (143) ... (948)

Nome/chave: CDSLocalização: (1452) ... (3588)

IV) Seqüência: 1aaaaccctca ccacattttc ctcaaccaca tgatggagat tggggctact agatactatg 60cctggtggta gactggtagc tgatgtcttt ggaccagtag ttggtgctag atttgtgaac 120tctaccaagg tgagaaacgg ag atg gag gct gcc ctg ctg age ggg ttc ate 172

Met Glu Ala Ala Leu Leu Ser Gly Phe lie15 10

aaa acc ate ctg cca agg etc ttc tca ctg gta caa ggg aga tac aag 220Lys Thr lie Leu Pro Arg Leu Phe Ser Leu Vai Gln Gly Arg Tyr Lys15 20 25

ctg cac aag ggc etc aag age gac ate aaa tcg ctg gag aaa gag etc 268Leu His Lys Gly Leu Lys Ser Asp lie Lys Ser Leu Glu Lys Glu Leu30 35 40

cat atg ate gct gtt aca ate gat gaa caa ate tcg ctg ggg agg aag 316His Met lie Ala Vai Thr lie Asp Glu Gln lie Ser Leu Gly Arg Lys45 50 55

gat cag gga gct gtg ctg age etc tca att gat gag ctg cat gaa ctg 364Asp Gln Gly Ala Vai Leu Ser Leu Ser lie Asp Glu Leu His Glu Leu60 65 70

gct cac caa ate gag gac tec ata gat cgc ttc ttg tac cat gtg acc 412Ala His Gln lie Glu Asp Ser lie Asp Arg Phe Leu Tyr His Vai Thr75 80 85 90

agg gag cag caa gea tec ttt ttt cgt cgg act gta cgg tcg ceg aag 460Arg Glu Gln Gln Ala Ser Phe Phe Arg Arg Thr Vai Arg Ser Pro Lys95 100 105

act ctg ttg tca cgt cag cgg ctg gct gcc gag gtt cag ttc ctg aag 508Thr Leu Leu Ser Arg Gln Arg Leu Ala Ala Glu Vai Gln Phe Leu Lys110 115 120

aag ata ceg gag gag gcg cac cag cga gag aag agg tac agg gtc ttc 556Lys lie Pro Glu Glu Ala His Gln Arg Glu Lys Arg Tyr Arg Vai Phe125 130 135gcc ggc ctt tct tcc tct acc cgg cac act gaa tcg tct tcc tgt tcg 604Ala Gly Leu Ser Ser Ser Thr Arg His Thr Glu Ser Ser Ser Cys Ser140 145 150

tct gta tct gat ccg cac aca ctt aag gcc gac gtc gtc ggc ate gac 652Ser Vai Ser Asp Pro His Thr Leu Lys Ala Asp Vai Vai Gly lie Asp155 160 165 170

ggt cec agg gac gag ctt gtg cag cag tta acc gaa gag gea gag ggc 700Gly Pro Arg Asp Glu Leu Vai Gln Gln Leu Thr Glu Glu Ala Glu Gly175 180 185

cta aca aag cag etc aag gtg ate tcc ate gtc ggg ate cat ggc tcc 748Leu Thr Lys Gln Leu Lys Vai lie Ser lie Vai Gly lie His Gly Ser190 195 200

ggc aag acc gtc ctt gcc aga gag gta tac gag age gac gtc ggc cgg 796Gly Lys Thr Vai Leu Ala Arg Glu Vai Tyr Glu Ser Asp Vai Gly Arg205 210 215

cag ttc agt etc cgg gea tgg gtt tct gct act gac aga ggt ccg aga 844Gln Phe Ser Leu Arg Ala Trp Vai Ser Ala Thr Asp Arg Gly Pro Arg220 225 230

gag gtg etc atg gag ate etc cga aat ttt ggt agg cca gtg gtg gat 892Glu Vai Leu Met Glu lie Leu Arg Asn Phe Gly Arg Pro Vai Vai Asp235 240 245 250

age tct agt att gac cag ctt acg gta gat etc agg aaa cac ttg ggt 940Ser Ser Ser lie Asp Gln Leu Thr Vai Asp Leu Arg Lys His Leu Gly255 260 265

gag aaa ag gtgaaaaaaa cctcttcttt atgttattta ttatttatga agtttcttca 998Glu Lys Ser

actacgggtt ttcatgttca aattgcctct ctgaacttcg aaaacgttta ataccaattg 1058

aattgaggat cttagctttg gaaaagcggt agtgttttga cgttttgcat acatttetea 1118

ccgttatttt attcatttat aatttagagt ttaagcagta tattcatttt gaaatttatg 1178

agatttctgt ctgcacgctt acttccatgc ccaaaacatg tccgattgag aacagaaggt 1238

aattttgttt gatctttgag atcagacaca ctgattgagt agtaacagga aacaagtgct 1298

caccaatcac ccaagtcact tacaaagaat ttcatgctta caaaacacac tgattgttaa 1358

ggatagagac tatgtttgat ctgcatagtt tgaattttga ttatgtcatc gtcgattgtt 1418

atcattaact tttgttggaa atttctcttg tag c tat ttc att gta ate gat 1470

Tyr Phe lie Vai lie Asp270 275

ggc atg caa aca gat cag tgg age acc att gaa act gcc ttc cca gaa 1518Gly Met Gln Thr Asp Gln Trp Ser Thr lie Glu Thr Ala Phe Pro Glu280 285 290

aac aat gtt gtt age age aga gta att gtt aca aca aca ate cgg tca 1566Asn Asn Vai Vai Ser Ser Arg Vai lie Vai Thr Thr Thr lie Arg Ser295 300 305

gta gct aat tct tgc age tct tct aac ggt tat gtg cac aaa atg aaa 1614Vai Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Vai His Lys Met Lys310 315 320aga ctt agt gac gaa cac tca gag caa ttg ttt ate aag aaa gct tgc 1662Arg Leu Ser Asp Glu His Ser Glu Gln Leu Phe lie Lys Lys Ala Cys325 330 335

cca aca aaa tat tca ggt tat act cga ceg gaa tca aaa gaa gtt ctg 1710Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys Glu Vai Leu340 345 350 355

aag aaa tgt gat ggt caa cca ctt gct ctt gtt act atg ggc caa ttc 1758Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Vai Thr Met Gly Gln Phe360 365 370

ttg agg aaa aat ggt tgg cec aca gga cec aac tgc gaa aat gtg tgt 1806Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu Asn Vai Cys375 380 385

aga gat ctt aga cga cat ctg gag cag gat gat aca ttg gag aga atg 1854Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu Glu Arg Met390 395 400

cga agg gtg ctt ate cac age tta tet agt ctt cet age cat gtt cec 1902Arg Arg Vai Leu lie His Ser Leu Ser Ser Leu Pro Ser His Vai Pro405 410 415

aaa gcc tgc ctt ttg tat ttt ggt atg ttt cca tgt gat cat cec ata 1950Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp His Pro lie420 425 430 435

aag agg aag age ctg atg agg cga tgg tta gea gag gga ttt gta caa 1998Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly Phe Vai Gln440 445 450

aca cag cet tca tet agt gaa aac ttc aac acc etc ata gac cgg aat 2046Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu lie Asp Arg Asn455 460 465

att att gag cec ate ggc ata tgt aac gat gat cag gta aag aca tgc 2094lie lie Glu Pro lie Gly lie Cys Asn Asp Asp Gln Vai Lys Thr Cys470 475 480

aaa aca tat ggc atg atg cac gag ttc att ttg tta atg tec acc tec 2142Lys Thr Tyr Gly Met Met His Glu Phe lie Leu Leu Met Ser Thr Ser485 490 495

cat gac ttc att acc ctg ctt tgt aat aat aaa gtt gaa cac aaa tat 2190His Asp Phe lie Thr Leu Leu Cys Asn Asn Lys Vai Glu His Lys Tyr500 505 510 515

gtg cgt cgg ctt tet etc cat cat cat agt gct aca agt ggc agt ttt 2238Vai Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser Gly Ser Phe520 525 530

tcg gtc ate gac tta tet ctt gtt aga tet ctg atg gtt ttt ggg gag 2286Ser Vai lie Asp Leu Ser Leu Vai Arg Ser Leu Met Vai Phe Gly Glu535 540 545

gct ggc aaa act att ttg agt ttc cga aag tac gag cta ttg aga gtc 2334Ala Gly Lys Thr lie Leu Ser Phe Arg Lys Tyr Glu Leu Leu Arg Vai550 555 560ttg gat ctt gaa caa tgt acc gac ttg gaa gat gat cac etc aaa gac 2382Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His Leu Lys Asp565 570 575

ata tgc aac ctt ttt ctt atg aaa tat cta age etc gga gaa act att 2430lie Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly Glu Thr lie580 585 590 595

aga agt ctt cca aag gag ata gaa aaa ctg aag etc ttg gag aca ctt 24 78Arg Ser Leu Pro Lys Glu lie Glu Lys Leu Lys Leu Leu Glu Thr Leu600 605 610

gac ttg agg aga aca aag gtg aaa aca cta cet ata gag gtc etc ctg 2526Asp Leu Arg Arg Thr Lys Vai Lys Thr Leu Pro lie Glu Vai Leu Leu615 620 625

etc cec tgt tta etc cat ctg ttt ggg aag ttc caa ttt tet gat aaa 2574Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe Ser Asp Lys630 635 640

ate aag ata aca agt gac atg cag aag ttt ttc tta act gga cag agt 2622lie Lys lie Thr Ser Asp Met Gln Lys Phe Phe Leu Thr Gly Gln Ser645 650 655

aac tta gag aca ctt tca gga ttt ate aca gat ggg tet caa gga ttg 2670Asn Leu Glu Thr Leu Ser Gly Phe lie Thr Asp Gly Ser Gln Gly Leu660 665 670 675

cca cag atg atg aat tae atg aat tta aga aag ctt aag ata tgg ttt 2718Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys lie Trp Phe680 685 690

gag agg agt aag aga age acc aac ttc acc gat ctt gtg aat gct gtc 2766Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Vai Asn Ala Vai695 700 705

caa aag ttc ate cat gat gac aaa gag age aat gat cca cgt tet cta 2814Gln Lys Phe lie His Asp Asp Lys Glu Ser Asn Asp Pro Arg Ser Leu710 715 720

tca ctt cat ttc gat gac ggc act gaa aac ate ctg aac tet ttg aag 2862Ser Leu His Phe Asp Asp Gly Thr Glu Asn lie Leu Asn Ser Leu Lys725 730 735

gct cet tgt tac ctt agg tca ttg aag tta aaa ggg aat ttg ctg gaa 2910Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn Leu Leu Glu740 745 750 755

ctt cec cag ttt gtc ata tca atg cgg ggt etc cgg gag ata tgc ctt 2958Leu Pro Gln Phe Vai lie Ser Met Arg Gly Leu Arg Glu lie Cys Leu760 765 770

tca tca aca aaa ttg aca tcg ggc etc ctt gea aca etc gct aac ttg 3006Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu Ala Asn Leu775 780 785

aaa ggc ttg cag cat etc aag ctg att gea gat gtc ctt gaa gat ttt 3054Lys Gly Leu Gln His Leu Lys Leu lie Ala Asp Vai Leu Glu Asp Phe790 795 800ate att gaa ggt cag gea ttc ctg ggg ctg cta cac cta tgt ttt gtclie lie Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu Cys Phe Vai805 810 815

3102

cta gaa cgt gcc acc tta cca ata att gaa gga gga gct ttg ceg tacLeu Glu Arg Ala Thr Leu Pro lie lie Glu Gly Gly Ala Leu Pro Tyr820 825 830 835

3150

etc ate tca ctt aag cta ate tgc aaa gat cta gtt ggc etc ggt gacLeu lie Ser Leu Lys Leu lie Cys Lys Asp Leu Vai Gly Leu Gly Asp840 845 850

3198

ate aaa ate aac cgc etc aaa tgt ctt aag gaa gtc agt cta gat catlie Lys lie Asn Arg Leu Lys Cys Leu Lys Glu Vai Ser Leu Asp His855 860 865

3246

aga gtc gct tcg gaa aca aga gaa ate tgg gaa aaa gct gcc gag aag 3294Arg Vai Ala Ser Glu Thr Arg Glu lie Trp Glu Lys Ala Ala Glu Lys870 875 880

cat cca aac cgg ceg aaa gta ttg ttg gtc aac tca tet gat gaa ageHis Pro Asn Arg Pro Lys Vai Leu Leu Vai Asn Ser Ser Asp Glu Ser885 890 895

3342

gaa att aag gct gta gac tgt tet gtt gct tca aga cca gct gtg agtGlu lie Lys Ala Vai Asp Cys Ser Vai Ala Ser Arg Pro Ala Vai Ser900 905 910 915

3390

gag gct aat gga act tet cec atg tca gag gtt gat gta cga gag gatGlu Ala Asn Gly Thr Ser Pro Met Ser Glu Vai Asp Vai Arg Glu Asp920 925 930

3438

gac att cag atg ata ctt aac cag ggg etc tet gcc gct gct gag aaaAsp lie Gln Met lie Leu Asn Gln Gly Leu Ser Ala Ala Ala Glu Lys935 940 945

3486

cag atg aat tgt gea gtt cag cca agt tca aaa gct gaa ctg aac tetGln Met Asn Cys Ala Vai Gln Pro Ser Ser Lys Ala Glu Leu Asn Ser950 955 960

3534

gat ttc aat aat att agt ttc cca gag gtt gcg ctt ggt tta acc gagAsp Phe Asn Asn lie Ser Phe Pro Glu Vai Ala Leu Gly Leu Thr Glu965 970 975

3582

ctg tga attgcttgga attgaaatgt gtcttcatac acctattgat ccttgattgt

Leu *

980

3638

ccatggtcagcaaatcttttcaacaatggcttcgcttttacaacggtttgtacagggatcctgaaaagaccagatgctaattcatgtacaaaagtatcag

tttcgttgcagttgttaaggattaattttttacagatatgagttgctggatcataactagttttgtaacagttcgcagttataataccggtttcaacggt

cttgcagcatccataaattgtttctgcttggtgatgccatgttgctagaagatggttgaaataaagcatagggcctggactgattgctgttgtcccgcgc

attactatgacatattatagaatctacaaagtcattttgatattgatacagataatttgccctttgcttctttatcatgttgttatataacate

ggctagtatccacaacaagcttteatcattctttgcagcaacttcagtttgattgtttccctacttttttttatccagcttctatattta-

atgtaaattatggtatgtctattttgcaattatatgcaagactcgaaggcttcagtgtcagaagttacttgtttatttgttactatagtt

3698375838183878393839984058411841784212I.a) Número identificador da seqüência: SEQ ID No: 2

II) Características da seqüência:II.a) tamanho: 2943

II.b) tipo: DNA

II. c) organismo: Zea mays

III) Características:

III.1.a)Nome/chave: gene

III. l.b) Localização: (1) ... (2943)

III.l.c) outra informação relevante: Regiãocodificante somente do gene Regi

III.1.a)Nome/chave: CDS

III.l.b) Localização: (1) ... (2943)

IV) Seqüência: 2

atg gag gct gcc ctg ctg age ggg ttc ate aaa acc ate ctg cca agg 48Met Glu Ala Ala Leu Leu Ser Gly Phe lie Lys Thr lie Leu Pro Arg10 15

etc ttc tca ctg gta caa ggg aga tac aag ctg cac aag ggc etc aag 96Leu Phe Ser Leu Vai Gln Gly Arg Tyr Lys Leu His Lys Gly Leu Lys25 30

age gac ate aaa tcg ctg gag aaa gag etc cat atg ate gct gtt aca 144Ser Asp lie Lys Ser Leu Glu Lys Glu Leu His Met lie Ala Vai Thr35 40 45

ate gat gaa caa ate tcg ctg ggg agg aag gat cag gga gct gtg ctg 192lie Asp Glu Gln lie Ser Leu Gly Arg Lys Asp Gln Gly Ala Vai Leu50 55 60

age etc tca att gat gag ctg cat gaa ctg gct cac caa ate gag gac 240Ser Leu Ser lie Asp Glu Leu His Glu Leu Ala His Gln lie Glu Asp65 70 75 80

tcc ata gat cgc ttc ttg tac cat gtg acc agg gag cag caa gea tcc 288Ser lie Asp Arg Phe Leu Tyr His Vai Thr Arg Glu Gln Gln Ala Ser85 90 95

ttt ttt cgt cgg act gta cgg tcg ceg aag act ctg ttg tca cgt cag 336Phe Phe Arg Arg Thr Vai Arg Ser Pro Lys Thr Leu Leu Ser Arg Gln100 105 110

cgg ctg gct gcc gag gtt cag ttc ctg aag aag ata ceg gag gag gcg 384Arg Leu Ala Ala Glu Vai Gln Phe Leu Lys Lys lie Pro Glu Glu Ala115 120 125

cac cag cga gag aag agg tac agg gtc ttc gcc ggc ctt tet tcc tetHis Gln Arg Glu Lys Arg Tyr Arg Vai Phe Ala Gly Leu Ser Ser Ser130 135 140acc cgg cac act gaa tcg tct tec tgt tcg tet gta tet gat ceg cac 480Thr Arg His Thr Glu Ser Ser Ser Cys Ser Ser Vai Ser Asp Pro His145 , 150 155 160

aca ctt aag gcc gac gtc gtc ggc ate gac ggt cec agg gac gag ctt 528Thr Leu Lys Ala Asp Vai Vai Gly lie Asp Gly Pro Arg Asp Glu Leu165 170 175

gtg cag cag tta acc gaa gag gea gag ggc cta aca aag cag etc aag 576Vai Gln Gln Leu Thr Glu Glu Ala Glu Gly Leu Thr Lys Gln Leu Lys180 185 190

gtg ate tec ate gtc ggg ate cat ggc tec ggc aag acc gtc ctt gcc 624Vai lie Ser lie Vai Gly lie His Gly Ser Gly Lys Thr Vai Leu Ala195 200 205

aga gag gta tac gag age gac gtc ggc cgg cag ttc agt etc cgg gea 672Arg Glu Vai Tyr Glu Ser Asp Vai Gly Arg Gln Phe Ser Leu Arg Ala210 215 220

tgg gtt tct gct act gac aga ggt ceg aga gag gtg etc atg gag ate 720Trp Vai Ser Ala Thr Asp Arg Gly Pro Arg Glu Vai Leu Met Glu lie225 230 235 240

etc cga aat ttt ggt agg cca gtg gtg gat age tct agt att gac cag 768Leu Arg Asn Phe Gly Arg Pro Vai Vai Asp Ser Ser Ser lie Asp Gln245 250 255

ctt acg gta gat etc agg aaa cac ttg ggt gag aaa agg tat ttc att 816Leu Thr Vai Asp Leu Arg Lys His Leu Gly Glu Lys Arg Tyr Phe lie260 265 270

gta ate gat ggc atg caa aca gat cag tgg age acc att gaa act gcc 864Vai lie Asp Gly Met Gln Thr Asp Gln Trp Ser Thr lie Glu Thr Ala275 280 285

ttc cca gaa aac aat gtt gtt age age aga gta att gtt aca aca aca 912Phe Pro Glu Asn Asn Vai Vai Ser Ser Arg Vai lie Vai Thr Thr Thr290 295 300

ate cgg tca gta gct aat tct tgc age tct tct aac ggt tat gtg cac 960lie Arg Ser Vai Ala Asn Ser Cys Ser Ser Ser Asn Gly Tyr Vai His305 310 315 320

aaa atg aaa aga ctt agt gac gaa cac tca gag caa ttg ttt ate aag 1008Lys Met Lys Arg Leu Ser Asp Glu His Ser Glu Gln Leu Phe lie Lys325 330 335

aaa gct tgc cca aca aaa tat tca ggt tat act cga ecg gaa tca aaa 1056Lys Ala Cys Pro Thr Lys Tyr Ser Gly Tyr Thr Arg Pro Glu Ser Lys340 345 350

gaa gtt ctg aag aaa tgt gat ggt caa cca ctt gct ctt gtt act atg 1104Glu Vai Leu Lys Lys Cys Asp Gly Gln Pro Leu Ala Leu Vai Thr Met355 360 365

ggc caa ttc ttg agg aaa aat ggt tgg cec aca gga cec aac tgc gaa 1152Gly Gln Phe Leu Arg Lys Asn Gly Trp Pro Thr Gly Pro Asn Cys Glu370 375 380aat gtg tgt aga gat ctt aga cga cat ctg gag cag gat gat aca ttg 120CAsn Vai Cys Arg Asp Leu Arg Arg His Leu Glu Gln Asp Asp Thr Leu385 390 395 400

gag aga atg cga agg gtg ctt ate cac age tta tet agt ctt cet age 1248Glu Arg Met Arg Arg Vai Leu lie His Ser Leu Ser Ser Leu Pro Ser405 410 415

cat gtt cec aaa gcc tgc ctt ttg tat ttt ggt atg ttt cca tgt gat 1296His Vai Pro Lys Ala Cys Leu Leu Tyr Phe Gly Met Phe Pro Cys Asp420 425 430

cat cec ata aag agg aag age ctg atg agg cga tgg tta gea gag gga 1344His Pro lie Lys Arg Lys Ser Leu Met Arg Arg Trp Leu Ala Glu Gly435 440 445

ttt gta caa aca cag cet tca tet agt gaa aac ttc aac acc etc ata 1392Phe Vai Gln Thr Gln Pro Ser Ser Ser Glu Asn Phe Asn Thr Leu lie450 455 460

gac cgg aat att att gag cec ate ggc ata tgt aac gat gat cag gta 1440Asp Arg Asn lie lie Glu Pro lie Gly lie Cys Asn Asp Asp Gln Vai465 470 475 480

aag aca tgc aaa aca tat ggc atg atg cac gag ttc att ttg tta atg 1488Lys Thr Cys Lys Thr Tyr Gly Met Met His Glu Phe lie Leu Leu Met485 490 495

tec acc tec cat gac ttc att acc ctg ctt tgt aat aat aaa gtt gaa 1536Ser Thr Ser His Asp Phe lie Thr Leu Leu Cys Asn Asn Lys Vai Glu500 505 510

cac aaa tat gtg cgt cgg ctt tet etc cat cat cat agt gct aca agt 1584His Lys Tyr Vai Arg Arg Leu Ser Leu His His His Ser Ala Thr Ser515 520 525

ggc agt ttt tcg gtc ate gac tta tet ctt gtt aga tet ctg atg gtt 1632Gly Ser Phe Ser Vai lie Asp Leu Ser Leu Vai Arg Ser Leu Met Vai530 535 540

ttt ggg gag gct ggc aaa act att ttg agt ttc cga aag tac gag cta 1680Phe Gly Glu Ala Gly Lys Thr lie Leu Ser Phe Arg Lys Tyr Glu Leu545 550 555 560

ttg aga gtc ttg gat ctt gaa caa tgt acc gac ttg gaa gat gat cac 1728Leu Arg Vai Leu Asp Leu Glu Gln Cys Thr Asp Leu Glu Asp Asp His565 570 575

etc aaa gac ata tgc aac ctt ttt ctt atg aaa tat cta age etc gga 1776Leu Lys Asp lie Cys Asn Leu Phe Leu Met Lys Tyr Leu Ser Leu Gly580 585 590

gaa act att aga agt ctt cca aag gag ata gaa aaa ctg aag etc ttg 1824Glu Thr lie Arg Ser Leu Pro Lys Glu lie Glu Lys Leu Lys Leu Leu595 600 605

gag aca ctt gac ttg agg aga aca aag gtg aaa aca cta cet ata gag 1872Glu Thr Leu Asp Leu Arg Arg Thr Lys Vai Lys Thr Leu Pro lie Glu610 615 620gtc etc ctg etc cec tgt tta etc cat ctg ttt ggg aag ttc caa ttt 1920Vai Leu Leu Leu Pro Cys Leu Leu His Leu Phe Gly Lys Phe Gln Phe625 630 635 640

tet gat aaa ate aag ata aca agt gac atg cag aag ttt ttc tta act 1968Ser Asp Lys lie Lys lie Thr Ser Asp Met Gln Lys Phe Phe Leu Thr645 650 655

gga cag agt aac tta gag aca ctt tca gga ttt ate aca gat ggg tet 2016Gly Gln Ser Asn Leu Glu Thr Leu Ser Gly Phe lie Thr Asp Gly Ser660 665 670

caa gga ttg cca cag atg atg aat tac atg aat tta aga aag ctt aag 2064Gln Gly Leu Pro Gln Met Met Asn Tyr Met Asn Leu Arg Lys Leu Lys675 680 685

ata tgg ttt gag agg agt aag aga age acc aac ttc acc gat ctt gtg 2112lie Trp Phe Glu Arg Ser Lys Arg Ser Thr Asn Phe Thr Asp Leu Vai690 695 700

aat gct gtc caa aag ttc ate cat gat gac aaa gag age aat gat cca 2160Asn Ala Vai Gln Lys Phe lie His Asp Asp Lys Glu Ser Asn Asp Pro705 710 715 720

cgt tet cta tca ctt cat ttc gat gac ggc act gaa aac ate ctg aac 2208Arg Ser Leu Ser Leu His Phe Asp Asp Gly Thr Glu Asn lie Leu Asn725 730 735

tet ttg aag gct cet tgt tac ctt agg tca ttg aag tta aaa ggg aat 2256Ser Leu Lys Ala Pro Cys Tyr Leu Arg Ser Leu Lys Leu Lys Gly Asn740 745 750

ttg ctg gaa ctt cec cag ttt gtc ata tca atg cgg ggt etc cgg gag 2304Leu Leu Glu Leu Pro Gln Phe Vai lie Ser Met Arg Gly Leu Arg Glu755 760 765

ata tgc ctt tca tca aca aaa ttg aca tcg ggc etc ctt gea aca etc 2352lie Cys Leu Ser Ser Thr Lys Leu Thr Ser Gly Leu Leu Ala Thr Leu770 775 780

gct aac ttg aaa ggc ttg cag cat etc aag ctg att gea gat gtc ctt 2400Ala Asn Leu Lys Gly Leu Gln His Leu Lys Leu lie Ala Asp Vai Leu

785 790 795 800

gaa gat ttt ate att gaa ggt cag gea ttc ctg ggg ctg cta cac cta 244 8Glu Asp Phe lie lie Glu Gly Gln Ala Phe Leu Gly Leu Leu His Leu805 810 815

tgt ttt gtc cta gaa cgt gcc acc tta cca ata att gaa gga gga gct 24 96Cys Phe Vai Leu Glu Arg Ala Thr Leu Pro lie lie Glu Gly Gly Ala820 825 830

ttg ceg tac etc ate tca ctt aag cta ate tgc aaa gat cta gtt ggc 254 4Leu Pro Tyr Leu lie Ser Leu Lys Leu lie Cys Lys Asp Leu Vai Gly835 840 845

etc ggt gac ate aaa ate aac cgc etc aaa tgt ctt aag gaa gtc agt 2592Leu Gly Asp lie Lys lie Asn Arg Leu Lys Cys Leu Lys Glu Vai Ser850 855 860cta gat cat aga gtc gct tcg gaa aca aga gaa ate tgg gaa aaa gct 2640Leu Asp His Arg Vai Ala Ser Glu Thr Arg Glu lie Trp Glu Lys Ala865 870 875 880

gcc gag aag cat cca aac cgg ceg aaa gta ttg ttg gtc aac tca tet 2688Ala Glu Lys His Pro Asn Arg Pro Lys Vai Leu Leu Vai Asn Ser Ser885 890 895

gat gaa age gaa att aag gct gta gac tgt tet gtt gct tca aga cca 2736Asp Glu Ser Glu lie Lys Ala Vai Asp Cys Ser Vai Ala Ser Arg Pro900 905 910

gct gtg agt gag gct aat gga act tet cec atg tca gag gtt gat gta 2784Ala Vai Ser Glu Ala Asn Gly Thr Ser Pro Met Ser Glu Vai Asp Vai915 920 925

cga gag gat gac att cag atg ata ctt aac cag ggg etc tet gcc gct 2832Arg Glu Asp Asp lie Gln Met lie Leu Asn Gln Gly Leu Ser Ala Ala930 935 940

gct gag aaa cag atg aat tgt gea gtt cag cca agt tca aaa gct gaa 2880Ala Glu Lys Gln Met Asn Cys Ala Vai Gln Pro Ser Ser Lys Ala Glu945 950 955 960

ctg aac tet gat ttc aat aat att agt ttc cca gag gtt gcg ctt ggt 2928Leu Asn Ser Asp Phe Asn Asn lie Ser Phe Pro Glu Vai Ala Leu Gly965 970 975

tta acc gag ctg tga 2943Leu Thr Glu Leu *980

5 I.a) Número identificador da seqüência: SEQ ID No: 3

II) Características da seqüência:II.a) tamanho: 980

II. b) tipo: Proteína

10 II.c) organismo: Zea mays

III) Característica:

III. a)Nome/chave: DOMÍNIO

III.b) Localização: (157) ... (404)15 III.c) outra informação relevante: Região

mostrando homologia com o domínio dositio de ligação a nucleotideo (NBS)

III.a)Nome/chave: DOMÍNIOIII.b) Localização: (528) ... (843)20 III.c) outra informação relevante: Região

mostrando homologia com o domínio derepetição rico em leucina (LRR)<table>table see original document page 219</column></row><table><table>table see original document page 220</column></row><table>Leu Pro Tyr 835 Leu Ile Ser Leu Lys Leu Ile 840 Cys Lys Asp 845 Leu Vai Gly

Leu Gly Asp 850 Ile Lys Ile Asn 855 Arg Leu Lys Cys Leu 860 Lys Glu Vai Ser

Leu Asp His Arg Vai Ala Ser Glu Thr Arg Glu Ile Trp Glu Lys Ala

865 870 875 880

Ala Glu Lys His Pro 885 Asn Arg Pro Lys Vai 890 Leu Leu Vai Asn Ser 895 Ser

Asp Glu Ser Glu Ile Lys Ala Vai Asp Cys Ser Vai Ala Ser Arg Pro

900 905 910

Ala Vai Ser Glu Ala Asn Gly Thr Ser Pro Met Ser Glu Vai Asp Vai

915 920 925

Arg Glu Asp Asp Ile Gln Met Ile Leu Asn Gln Gly Leu Ser Ala Ala

930 935 940

Ala Glu Lys Gln Met Asn Cys Ala Vai Gln Pro Ser Ser Lys Ala Glu

945 950 955 960

Leu Asn Ser Asp Phe 965 Asn Asn Ile Ser Phe 970 Pro Glu Vai Ala Leu 975 Gly

Leu Thr Glu Leu

980

I.a) Número identificador da seqüência: SEQ ID No: 4

II) Características da seqüência:II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer do

oligonucleotideo a20Cforw4881

IV) Seqüência: 4

cagggcctac ttggtttagt aata 24

I.a) Número identificador da seqüência: SEQ ID No: 5

II) Características da seqüência:II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer do

oligonucleotideo a20Crev4920IV) Seqüência: 5gggtactaca ctagcctatt acta 24

I.a) Número identificador da seqüência: SEQ ID No: 6

II) Características da seqüência:II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer dooligonucleotideo a20fisl9forwlllO

IV) Seqüência: 6

cggttacaag gtctacccaa tctg 24

I.a) Número identificador da seqüência: SEQ ID No: 7

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III.c) outra informação relevante: Primer dooligonucleotideo a20fisl9revll49

IV) Seqüência: 7gtcaaacaga tagccgcaga ttgg 24

I.a) Número identificador da seqüência: SEQ ID No: 8

II) Características da seqüência:

II.a) tamanho: 24II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer dooligonucleotideo n07fisl3for'w5152 4

IV) Seqüência: 8tacaaaacta ctgcaacgcc tata 24I.a) Número identificador da seqüência: SEQ ID No: 9

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer dooligonucleotídeo n07fisl3rev51563

IV) Seqüência: 9

cctcacccca agtatatata ggcg 24

I.a) Número identificador da seqüência: SEQ ID No: 10

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III.c) outra informação relevante: Primer dooligonucleotídeo n07Bforwl0439/53434

IV) Seqüência: 10

cattggacct cttccccact aaga 24

I.a) Número identificador da seqüência: SEQ ID No: 11

II) Características da seqüência:

II.a) tamanho: 24Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer do

oligonucleotídeo n07Brevl0478/53473

IV) Seqüência: 11tccttgagtc cagtgctctt agtg 24I.a) Número identificador da seqüência: SEQ ID No: 12

II) Características da seqüência:

II,a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer dooligonucleotideo n07Aforw4333

IV) Seqüência: 12

gaaactaggc gcgtcaggtt ttat 24

I.a) Número identificador da seqüência: SEQ ID No: 13

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Caracteristica:

III.c) outra informação relevante: Primer do

oligonucleotideo n07Arev4372

IV) Seqüência: 13

aaggcagcca ctgaaaataa aacc 24

I.a) Número identificador da seqüência: SEQ ID No: 14

II) Características da seqüência:

II.a) tamanho: 954

II.b) tipo: Proteína

II. c) organismo: Oryza sativa

III) Característica:

III. a)Nome/chave: PEPTÍDEO

III.b) Localização: (0) ... (0)

III.c) outra informação relevante: np_910480,Arroz NBS-LRRIV) Seqüência: 14

Met Glu Gly Ala Vai Phe Ser Leu Thr Glu Gly Ala Vai Arg Ser Leu

1 5 10 15

I>eu Cys Lys Leu Gly Cys Leu Leu Thr Glu Asp Thr Trp Leu Vai Gln

20 25 30

Gly Vai His Gly Glu lie Gln Tyr lie Lys Asp Glu Leu Glu Cys Met

35 40 45

Asn Ala Phe Leu Arg Asn Leu Thr lie Ser Gln He His Asp Asp Gln

50 55 60

Vai Arg lie Trp Met Lys Gln Vai Arg Glu He Ala Tyr Asp Ser Glu

65 70 75 80

Asp Cys lie Asp Glu Phe lie His Asn Leu Gly Glu Ser Ser Glu Met

85 90 95

Gly Phe Phe Gly 100 Gly Leu lie Ser Met 105 Leu Arg Lys Leu Ala Cys Arg 110

His Arg lie 115 Ala Leu Gln Leu Gln 120 Glu Leu Lys Ala Arg 125 Ala Gln Asp

Vai Gly Asp Arg Arg Ser Arg Tyr Gly Vai Glu Leu Ala Lys Ala Thr

130 135 140

His Glu Glu Ala His Pro Arg Leu Thr Arg His Ala Ser Leu His He

145 150 155 160

Asp Pro Gln Leu His 165 Ala Leu Phe Ala Glu 170 Glu Ala Gln Leu Vai Gly 175

lie Asp Glu Pro Arg Asn Glu Leu Vai Ser Trp Leu Met Glu Glu Asp

180 185 190

Leia Arg Leu Arg Vai Leu Ala lie Vai Gly Phe Gly Gly Leu Gly Lys

195 200 205

Thr Thr 210 Leu Ala Arg Met Vai 215 Cys Gly Ser Pro Vai 220 Vai Lys Ser Ala

Asp Phe Gln Cys Cys Pro Leu Phe lie He Ser Gln Thr Phe Asn He

225 230 235 240

Arg Ala Leu Phe Gln 245 His Met Vai Arg Glu 250 Leu He Gln Glu Pro His 255

Lys Ala Met Ala lie Ala Gly Cys Lys His Gly Leu lie Thr Asp Asp

260 265 270

Tyr Leu Glu Gly Met Glu Arg Trp Glu Vai Ala Ala Leu Thr Lys Asn

275 280 285

Leu Arg Arg Tyr Phe Gln Asp Lys Arg Tyr He Vai He Leu Asp Asp

290 295 300

lie Trp Thr Vai Ser Ala Trp Glu Ser He Arg Cys Ala Leu Pro Asp

305 310 315 320

Asn Leu Lys Gly Ser Arg lie lie Vai Thr Thr Arg Asn Ala Asp Vai

325 330 335

Ala Asn Thr Cys 340 Cys Ser Arg Pro Gln 345 Asp Arg He Tyr Asn He Gln 350

Arg Leu Ser 355 Glu Thr Thr Ser Arg 360 Glu Leu Phe Phe Lys 365 Lys He Phe

Gly Phe 370 Ala Asp Asp Lys Ser 375 Pro Thr Asp Glu Phe 380 Glu Glu Vai Ser

Asn Ser Vai Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala He Vai Asn

385 390 395 400lie Gly Ser Leu Leu Ala Ser Lys Thr Asn Arg Thr Lys Glu Glu Trp

405 410 415

Gln Lys Vai Cys Asn Asn Leu Gly Ser Glu Leu Glu Asn Asn Pro Thr

420 425 430

Leu Glu Gly Vai Lys Gln Vai Leu Thr Leu Ser Tyr Asn Asp Leu Pro

435 440 445

Tyr His Leu Lys Ala Cys Phe Leu Tyr Leu Ser lie Phe Pro Glu Asn

450 455 460

Tyr Vai lie Lys Arg Gly Pro Leu Vai Arg Arg Trp lie Ala Glu Gly

465 470 475 480

Phe Vai Ser Gln Arg His Gly Gln Ser Met Glu Gln Leu Ala Glu Ser

485 490 495

Tyr Phe Asp Glu Phe Vai Ala Arg Ser lie Vai Gln Pro Vai Arg Thr

500 505 510

Asp Trp Thr Gly Lys Vai Arg Ser Cys Arg Vai His Asp Leu Met Leu

515 520 525

Asp Vai lie Vai Ser Arg Ser lie Glu Glu Asn Phe Ala Ser Phe Leu

530 535 540

Cys Asp Asn Gly Ser Thr Leu Ala Ser His Asp Lys lie Arg Arg Leu

545 550 555 560

Ser lie His Ser Ser Tyr Asn Ser Ser Gln Lys Thr Ser Ala Asn Vai

565 570 575

Ser His Ala Arg Ser Phe Thr Met Ser Ala Ser Vai Glu Glu Vai Pro

580 585 590

Phe Phe Phe Pro Gln Leu Arg Leu Leu Arg Vai Leu Asp Leu Gln Gly

595 600 605

Cys Ser Cys Leu Ser Asn Glu Thr Leu His Cys Met Cys Arg Phe Phe

610 615 620

Gln Leu Lys Tyr Leu Ser Leu Arg Asn Thr Asn Vai Ser Lys Leu Pro

625 630 635 640

His Leu Leu Gly Asn Leu Lys His Leu Glu Thr Leu Asp lie Arg Ala

645 650 655

Thr Leu lie Lys Lys Leu Pro Ala Ser Ala Gly Asn Leu Ser Cys Leu

660 665 670

Lys His Leu Phe Ala Gly His Lys Vai Gln Leu Thr Arg Thr Ala Ser

675 680 685

Vai Lys Phe Leu Arg Gln Ser Ser Gly Leu Glu Vai Ala Thr Gly Vai

690 695 700

Vai Lys Asn Met Vai Ala Leu Gln Ser Leu Vai His lie Vai Vai Lys

705 710 715 720

Asp Lys Ser Pro Vai Leu Arg Glu lie Gly Leu Leu Gln Asn Leu Thr

725 730 735

Lys Leu Asn Vai Leu Leu Arg Gly Vai Glu Glu Asn Trp Asn Ala Phe

740 745 750

Leu Glu Ser Leu Ser Lys Leu Pro Gly Pro Leu Arg Ser Leu Ser lie

755 760 765

His Thr Leu Asp Glu Lys Glu His Ser Leu Ser Leu Asp Asn Leu Ala

770 775 780

Phe Vai Glu Ser Pro Pro Leu Phe lie Thr Lys Phe Ser Leu Ala Gly

785 790 795 800

Glu Leu Glu Arg Leu Pro Pro Trp lie Pro Ser Leu Arg Asn Vai Ser

805 810 815

Arg Phe Ala Leu Arg Arg Thr Glu Leu His Ala Asp Ala lie Gly Vai

820 825 830

Leu Gly Asp Leu Pro Asn Leu Leu Cys Leu Lys Leu Tyr His Lys Ser

835 840 845Tyr Ala Asp Asn Cys lie Vai Phe

850 855Lys Leu Leu lie lie Asp Asn Leu865 870Asp Ala Gly Ser Vai Thr Asn Leu885

Arg Glu Pro Lys Tyr Gly lie Ser900

Lys Glu lie Glu Phe Phe Gly Asp915 920Vai Ala Ser Cys Vai Lys Ala His

930 935Asp Lys Trp Asn lie Vai Thr Glu945 950

Cys His Gly Lys Phe Vai Lys Leu860

Glu Arg lie Glu Lys Met Gln Phe875 880Glu Arg Leu Thr Leu Ser Phe Leu

890 895Gly Leu Glu Asn Leu Pro Lys Leu905 910lie lie Leu Ser Vai Vai Thr Lys925

Pro Asn His Pro Arg Vai lie Gly940

Tyr Ala

I.a) Número identificador da seqüência: SEQ ID No: 15

II) Características da seqüência:II.a) tamanho: 953

II. b) tipo: Proteína

II.c) organismo: Oryza sativa

III) Característica:

III. a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)

III.c) outra informação relevante: np_910483,Arroz NBS-LRR

IV) Seqüência: 15

Met Glu Gly Ala lie Phe Ser Vai Ala Glu Gly Thr Vai Arg Ser Leu

5 10 15

Leu Ser Lys Leu Ser Ser Leu Leu Ser Gln Glu Ser Trp Phe Vai Arg

20 25 30

Gly Vai His Gly Asp lie Gln Tyr lie Lys Asp Glu Leu Glu Ser Met

35 40 45

Asn Ala Phe Leu Arg Tyr Leu Thr Vai Leu Glu Asp His Asp Thr Gln

50 55 60

Vai Arg lie Trp Met Lys Gln Vai Arg Glu lie Ala Tyr Asp Ala Glu

70 75 80

Asp Cys lie Asp Gln Phe Thr His His Leu Gly Glu Ser Ser Gly lie

85 90 95

Gly Phe Leu Tyr Arg Leu lie Tyr lie Leu Gly Lys Leu Cys Cys Arg

100 105 110

His Arg lie Ala Met Gln Leu Gln Glu Leu Lys Ala Arg Ala Gln Asp

65 115 120 125

Vai Ser Glu Arg Arg Ser Arg Tyr Glu Vai Met Leu Pro Lys Thr Thr

130 135 140

Leu Gln Gly Ala Gly Pro Arg Leu Thr Arg His Ala Ser Arg His Leu

145 150 155 160

Asp Pro Gln Leu His Ala Leu Phe Thr Glu Glu Ala Gln Leu Vai Gly

165 170 175Leu Asp Glu Pro 180 Arg Asp Lys Leu Vai 185 Arg Trp Vai Met Glu 190 Ala Asp

Pro Cys Arg Arg Vai Leu Ala lie Vai Gly Phe Gly Gly Leu Gly Lys

195 200 205

Thr Thr Leu Ala Arg Met Vai Cys Glu Asn Pro Met Vai Lys Gly Ala

210 215 220

Asp Phe His Cys Cys Pro Leu Phe lie Vai Ser Gln Thr Phe Asn lie

225 230 235 240

Arg Thr Leu Phe Gln Tyr Met lie Arg Glu Leu lie Gln Arg Pro Asn

245 250 255

Lys Ala Met Ala Vai Ala Gly Gly Lys His Gly His Thr Met Asp Gly

260 265 270

Asn Met Asp 275 Gly Met Glu Arg Trp 280 Glu Vai Ala Vai Leu 285 Ala Glu Lys

Vai Arg Gln Tyr Leu Leu Asp Lys Tyr lie Vai lie Phe Asp Asp lie

290 295 300

Trp Thr lie Ser Ala Trp Glu Ser lie Arg Cys Ala Leu Pro Asp Asn 305 310 315 320

Lys Lys Gly Ser Arg 325 Vai lie lie Thr Thr 330 Arg Asn Glu Asp Vai 335 Ala

Asn Thr Cys Cys Ser Gly Pro Gln Asp Gln Vai Tyr Lys Met Gln Arg

340 345 350

Leu Ser Asp 355 Ala Ala Ser Arg Glu 360 Leu Phe Phe Lys Arg 365 lie Phe Gly

Ser Ala Asp lie Ser Ser Asn Glu Glu Leu Asp Glu Vai Ser Asn Ser

370 375 380

lie Leu Lys Lys Cys Gly Gly Leu Pro Leu Ala lie Vai Ser lie Gly

385 390 395 400

Ser Leu Vai Ala Ser 405 Lys Thr Asn Arg Thr 410 Lys Glu Glu Trp Gln 415 Lys

lie Cys Asp Asn 420 Leu Gly Ser Glu Leu 425 Glu Thr Asn Pro Thr 430 Leu Glu

Vai Ala Lys 435 Gln Vai Leu Thr Leu 440 Ser Tyr Asn Asp Leu 445 Pro Tyr His

Leu Lys 450 Ala Cys Phe Leu Tyr 455 Leu Ser lie Phe Pro 4 60 Glu Asn Tyr Vai

lie Arg Arg Gly Pro Leu Vai Arg Arg Trp lie Ala Glu Gly Phe Vai

4 65 470 475 480

Asn Gln Arg His Gly 485 Leu Ser Met Glu Glu 4 90 Vai Ala Glu Ser Tyr 495 Phe

Asp Glu Phe Vai 500 Ala Arg Ser lie Vai 505 Gln Pro Vai Lys lie 510 Asp Trp

Ser Gly Lys 515 Vai Arg Thr Cys Arg 520 Vai His Asp Met Met 525 Leu Glu Vai

lie lie Ser Lys Ser Leu Glu Glu Asn Phe Ala Ser Phe Leu Cys Asp

530 535 540

Asn Gly His Pro Leu Vai Cys His Asp Lys lie Arg Arg Leu Ser lie

545 550 555 560

His Asn Ser His Asn Ser Vai Gln Arg Thr Arg Vai Ser Vai Ser His

565 570 575

Vai Arg Ser Phe 580 Thr Met Ser Ala Ser 585 Vai Glu Glu Vai Pro 590 Met Phe<table>table see original document page 229</column></row><table>III) Característica:

III.a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)

III.c) outra informação relevante: np_910482,Arroz NBS-LRR

IV) Seqüência: 16

<table>table see original document page 230</column></row><table>Lys Lys Gly Ser355

Asn Thr Cys Cys370

Leu Ser Asp Ala385

Met Ala Asp Ala

Asp Ser lie Leu420

lie Gly Ser Leu435

Gln Lys Vai Cys450

Leu Glu Gly Thr465

Tyr His Leu Lys

His Vai lie Lys500

Phe Vai Thr Gln515

Tyr Phe Asp Glu530

Asp Trp Ser Gly545

Glu Vai lie Vai

Cys Asp Asn Gly580

Ser lie Arg Ser595

Vai Ala His Vai610

Pro Phe Phe Phe625

Gly Ser Arg Cys

Phe Gln Leu Lys660

Pro Arg Leu IIe675

Glu Thr Leu Ile690

Leu Lys His Leu705

Ser Vai Lys Phe

Vai Ile Arg Asn740

Lys Glu His Pro755

Arg Lys Leu Ser770

Arg Ile Ile Vai

360

Cys Arg Pro Gln

375

Ala Ser Arg Glu

390

Gly Ala Pro Asp

405

Lys Lys Cys Gly

Leu Ala Ser Lys

440

Asp Asn Leu Gly

455

Lys Gln Vai Leu

470

Ala Cys Phe Leu

485

Arg Gly Pro Leu

Arg His Gly Leu

520

Phe Vai Ser Arg

535

Lys Vai Arg Ser

550

Ser Lys Ser Leu

5 65

Thr Glu Leu Vai

Ser Ser Tyr Ser

600

Arg Thr Phe Arg

615

Pro Gln Leu Arg

630

Met Ser Asn Lys

645

Tyr Leu Ser Leu

Gly Asn Leu Asn

680

Lys Lys Leu Pro

695

Leu Ala Gly His

710

Leu Arg Pro Ser

725

Met Ala Lys Leu

Ser Vai Phe Gln

7 60

Vai Leu Phe Tyr

775

Thr Thr Arg Asn

Asp Arg Ile Tyr380

Leu Phe Phe Lys395

Asp Asp Glu Leu410

Gly Leu Pro Leu425

Pro Asn Arg Ser

Ser Glu Leu Glu460

Thr Leu Ser Tyr475

Tyr Leu Ser Ile490

Vai Arg Met Trp505

Ser Met Glu Gln

Ser Met Vai His540

Cys Lys Vai His555

Glu Glu Asn Phe570

Ser His Asp Lys585

Ser Ala Gln Arg

Met Ser Pro Ser620

Leu Leu Arg Vai635

Asn Leu Asp Cys650

Arg Asn Thr Ser665

His Leu Glu Thr

Ser Ser Ala Ala700

Lys Glu Gln Leu715

Ser Gly Leu Lys730

Gln Ser Leu Vai745

Glu Ile Ala Leu

Gly Ile Glu Vai780

Glu Asp Vai Ala

365

Lys Ile Gln Arg Arg Ile Phe Gly

400

Lys Gln Vai Ser

415

Ala Ile Vai Ser

430

Lys Glu Glu Trp

445

Ser Asn Pro Thr

Asn Asp Leu Pro

480

Phe Pro Glu Asn

495

Ile Ala Glu Gly

510

Vai Gly Glu Arg

525

Leu Vai Arg Ile

Asp Ile Met Leu

560

Ala Ser Phe Phe

575

Ile Arg Arg Leu

590

Thr Ser Asn Ser

605

Ile Asp Asn Ile

Leu Asp Met Gln

640

Ile Cys Arg Phe

655

Vai Ser Ile Leu

670

Leu Asp Ile Arg 685

Asn Leu Thr Cys

Thr Arg Thr Ser

720

Met Ser His Gly

735

His Vai Glu Ile

750

Leu Gln Asn Leu

765

Asn Trp Lys ProPhe Leu Glu Leu Leu Asn Met Leu Ser Gly Ser Vai Arg Ser Leu Ser

785 790 795 800

lie Asp lie Phe Asp Ala Gln Gly Asn lie Ser lie Ser Ser Leu Glu

805 810 815

Met Leu Ser Ser Leu Vai Ser Pro Pro lie Phe lie Thr Ser Phe Ser

820 825 830

Leu Thr Gly Lys Leu Gly Ser Leu Pro Pro Trp Vai Ala Ser Leu Arg

835 840 845

Ser Vai Ser Arg Leu Thr Leu Arg Arg Ser Gln Leu Arg Ala Asp Ala

850 855 860

lie His Vai Leu Gly Gly Leu Gln Asn Leu Leu Cys Leu Lys Leu Tyr

8 65 870 875 880

His Lys Ser Tyr Ala Asp Asp Arg Leu Vai Phe Pro Gln Gly Gly Phe

885 890 895

Ala Arg Vai Lys Leu Leu lie Asp Asp Asn Leu Vai Asn Leu Glu Lys

900 905 910

Leu His Phe Asn Glu Gly Ser Met Pro Asn Leu Glu Arg Leu Thr Leu

915 920 925

Ser Phe Leu Arg Glu Pro Lys Asp Gly lie Ser Gly Leu Asn Asn Leu

930 935 940

Leu Lys Leu Lys Glu Vai Glu Phe Phe Gly Asn lie Vai Ser Ser Vai

945 950 955 960

Vai Ser Lys Vai Vai Ser Cys Vai Lys Asp His Pro Asn His Pro Arg

965 970 975

Vai Vai Gly Asp Lys Trp Asn lie Vai Thr Vai Tyr Asn

980 985

I • a) Número identificador da seqüência: SEQ ID No: 17

5

II) Características da seqüência:II.a) tamanho: 998

II.b) tipo: Proteína

II.c) organismo: Oryza sativa

10

III) Característica:

III.a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)

III.c) outra informação relevante: np_921091.1,

Resistência a doença em arroz

IV) Seqüência: 17

Met Glu Thr Ala Vai Leu Ser Ala Vai Leu Arg Thr Leu Gly Pro Lys

1 5 10 15

Leu Tyr Ala Phe Leu Arg Asp Gly His Asp Leu Leu Arg Arg Asp Leu

20 25 30

Glu Arg Asp Vai His Tyr lie Arg Asn Glu Leu Ala Met lie Ala Ala

35 40 45

Ala He Glu Glu His Asp Arg Arg Pro Pro Pro Ala Ala Gly Asp Vai 50 55 60

Arg Ser Ala Trp lie Arg Gly Vai Arg Asp Leu Ala Cys Asp Met Glu

65 70 75 80Asp Cys Vai Asp Arg Phe Vai His

85

Ser Met Gly Ala Arg Ala Lys Phe

100

Arg Lys Ser Glu Glu Leu Ser Arg

115 120

Ala Gly Glu Pro Ser Cys Trp Vai

130 135

Leu Pro Ala Ser Ser Ser Glu Ala

145 150

Gly Met Asp Gly Pro Arg Asp Glu

165

Gln Gly Gln Leu Lys Vai He Ser

180

Lys Thr Leu Leu Ala Arg Gln He

195 200

Gln Phe His Pro Arg He Trp Vai

210 215

Asp Vai Leu Met Asp lie Leu Gln

225 230

Cys His Ala Ser Asn Leu Vai Vai

245

Lys Arg Phe Phe Vai Vai He Asp

260

Ser Ser Phe Arg Asn Ala Phe Pro

275 280

Vai lie Vai Thr Thr Ala He Gln

290 295

Arg Asn Ser His Vai Tyr Vai Met

305 310

Arg Gln Leu Phe Leu Lys Glu Ala

325

Ser Glu Ala He Leu Lys Lys Cys

340

Thr Thr Ala Gln Phe Leu Gln Ser

355 360

Cys Ala Lys Leu Cys Asp Asn Leu

370 375

Thr Leu Ala Arg Met Lys Arg Vai

385 390

Pro Gly His Vai lie Lys Ala Cys

405

Ser Gly His Pro Vai Arg Arg Lys

420

Glu Gly Phe Vai Gly Ala Asp His

435 440

lie Asp Ser Phe Glu Glu Leu Vai

450 455

Asp Vai Ser Ser Asn Thr Glu Vai

465 470

Met Leu Glu Phe He Leu His Lys

485

Phe Leu Tyr Gly cnn Gln Ala Arg Leu

500

7/123

Arg Ala Thr Gly His Gly Leu Ala

90 95

Ala Ala Vai He Gln Glu Leu Arg

105 110

Leu Arg Ala Ser Tyr Ala Ala Ala

125

Ala Thr Gly Ser Ser Ala Leu Thr

140

His Thr Leu Ala Ser Asp He Vai

155 160

He Leu Glu Leu He Gly Glu Thr

170 175

He Vai Gly Phe Gly Gly Leu Gly

185 190

Tyr Glu Ser Asp Ala Vai Ala Ala

205

Arg Ala Ala Gly Lys Asn Ala Glu

220

Gln Leu Gly Met Pro Vai His His

235 240

Asn Leu Arg Asn Cys Leu Glu Ser

250 255

Asp Met Gln Arg Glu Tyr Trp Asn 265 270

Ser Asp Thr Gly Leu Ser Ser He

285

Ser He Ala Asn Ala Cys Ser Ser

300

Arg Thr Leu Asn Glu Glu His Ser

315 320

Ser Trp Lys Asp Tyr Pro Pro Gly

330 335

Asp Gly Leu Pro Leu Ala Leu Vai

345 350

Arg Cys Gln Gln Gln Pro Leu Gly

365

Gly Lys His Leu Vai Thr Glu Asp

380

Leu Vai His His Tyr Ser Ser Leu

395 400

Leu Leu Tyr Leu Gly He Phe Pro

410 415

Thr Leu He Arg Arg Trp Ser Ala

425 430

His Arg Ser Ser Leu Asp Vai Ala

445

Asn Arg Ser He He Gln Pro Vai

4 60

Lys Thr Cys Gln Thr His Gly Met

475 480

Ser He Cys Asp Asn Phe He Thr

4 90 495

Pro Asp Lys He Arg Cys Vai Ser

505 510<table>table see original document page 234</column></row><table>Vai Lys Arg Pro Ala945

Ser Leu Pro Ala Lys965

Gln Ser Ser Gly Thr980

Ser Gln Arg His Phe995

Arg Glu Glu Ser Asp

950

Met Ala Arg Leu Leu970

Gln Gly Glu Leu Ser985

Ser

lie Ser Ala Ala Leu Ala955 960Gly Ala Ala Ser lie His975

Cys Gly Gly Asn Gly Ala990

I.a) Número identificador da seqüência: SEQ ID No: 18

II) Características da seqüência:II.a) tamanho: 958

II.b) tipo: Proteína

II. c) organismo: Herdeum vulgare

III) Característica:

III. a)Nome/chave: PEPTÍDEOIII.b) Localização: (0) ... (0)

III.c) outra informação relevante: AAG37354,Proteina de resistência a oidio de cevada

IV) Seqüência: 18

Met Asp lie Vai Thr Gly Ala lie Ser Asn Leu lie Pro Lys Leu Gly

1 5 10 15

Glu Leu Leu Thr 20 Glu Glu Phe Lys Leu 25 His Lys Gly Vai Lys 30 Lys Asn

lie Glu Asp Leu Gly Lys Glu Leu Glu Ser Met Asn Ala Ala Leu lie

35 40 45

Lys lie Gly Glu Vai Pro Arg Glu Gln Leu Asp Ser Gln Asp Lys Leu

50 55 60

Trp Ala Asp Glu Vai Arg Glu Leu Ser Tyr Vai lie Glu Asp Vai Vai

65 70 75 80

Asp Lys Phe Leu Vai 85 Gln Vai Asp Gly lie 90 Gln Phe Asp Asp Asn 95 Asn

Asn Lys Phe Lys Gly Phe Met Lys Arg Thr Thr Glu Leu Leu Lys Lys

100 105 110

Vai Lys His 115 Lys His Gly lie Ala 120 His Ala lie Lys Asp 125 lie Gln Glu

Gln Leu 130 Gln Lys Vai Ala Asp 135 Arg Arg Asp Arg Asn 140 Lys Vai Phe Vai

Pro His Pro Thr Arg Thr lie Ala lie Asp Pro Cys Leu Arg Ala Leu

145 150 155 160

Tyr Ala Glu Ala Thr Glu Leu Vai Gly lie Tyr Gly Lys Arg Asp Gln

165 170 175

Asp Leu Met Arg Leu Leu Ser Met Glu Gly Asp Asp Ala Ser Asn Lys

180 185 190

Arg Leu Lys 195 Lys Vai Ser lie Vai 200 Gly Phe Gly Gly Leu 205 Gly Lys Thr

Thr Leu 210 Ala Arg Ala Vai Tyr 215 Glu Lys lie Lys Gly 220 Asp Phe Asp CysArg Ala Phe Vai Pro Vai Gly Gln Asn Pro His Met Lys Lys Vai Leu225 230 235 240

Arg Asp lie Leu lie Asp Leu Gly Asn Pro His Ser Asp Leu Ala Met

245 250 255

Leu Asp Ala Asn Gln Leu lie Lys Lys Leu Arg Glu Phe Leu Glu Asn

260 265 270

Lys Arg Tyr Leu Vai lie lie Asp Asp lie Trp Asp Glu Lys Leu Trp

275 280 285

Glu Gly lie Asn Phe Ala Phe Ser Asn Arg Asn Asn Leu Gly Ser Arg

290 295 300

Leu lie Thr Thr Thr Arg lie Vai Ser Vai Ser Asn Ser Cys Cys Ser305 310 315 320

Ser His Gly Asp Ser Vai Tyr Gln Met Glu Pro Leu Ser Vai Asp Asp

325 330 335

Ser Arg lie Leu Phe Trp Lys Arg lie Phe Pro Asp Glu Asn Gly Cys

340 345 350

Leu Asn Glu Phe Glu Gln Vai Ser Arg Asp lie Leu Lys Lys Cys Gly

355 360 365

Gly Vai Pro Leu Ala lie lie Thr lie Ala Ser Ala Leu Ala Gly Asp

370 375 380

Gln Lys Met Lys Pro Lys Cys Glu Trp Asp lie Leu Leu Gln Ser Leu385 390 395 400

Gly Ser Gly Leu Thr Glu Asp Asn Ser Leu Glu Glu Met Arg Arg lie

405 410 415

Leu Ser Phe Ser Tyr Ser Asn Leu Pro Ser His Leu Lys Thr Cys Leu

420 425 430

Leu Tyr Leu Cys lie Tyr Pro Glu Asp Ser Lys lie His Arg Asp Glu

435 440 445

Leu lie Trp Lys Trp Vai Ala Glu Gly Phe Vai His His Glu Asn Gln

450 455 460

Gly Asn Ser Leu Tyr Leu Leu Gly Leu Asn Tyr Phe Asn Gln Leu lie465 470 475 480

Asn Arg Ser Met lie Gln Pro lie Tyr Gly Phe Asn Asp Glu Vai Tyr

485 490 495

Vai Cys Arg Vai His Asp Met Vai Leu Asp Leu lie Cys Asn Leu Ser

500 505 510

Arg Glu Ala Lys Phe Vai Asn Leu Leu Asp Gly Ser Gly Asn Ser Met

515 520 525

Ser Ser Gln Gly Asn Cys Arg Arg Leu Ser Leu Gln Lys Arg Asn Glu

530 535 540

Asp His Gln Ala Lys Pro lie Thr Asp lie Lys Ser Met Ser Arg Vai545 550 555 560

Arg Ser lie Thr lie Phe Pro Pro Ala lie Glu Vai Met Pro Ser Leu

565 570 575

Ser Arg Phe Asp Vai Leu Arg Vai Leu Asp Leu Ser Arg Cys Asn Leu

580 585 590

Gly Glu Asn Ser Ser Leu Gln Leu Asn Leu Lys Asp Vai Gly His Leu

595 600 605

Thr His Leu Arg Tyr Leu Gly Leu Glu Gly Thr Asn lie Ser Lys Leu

610 615 620

Pro Ala Glu lie Gly Lys Leu Gln Phe Leu Glu Vai Leu Asp Leu Gly625 630 635 640

5Asn Asn His Asn Leu 645 Lys Glu Leu

Arg Leu Ile Tyr 660 Leu Asn Leu Phe

Gly Vai Leu 675 Gln Asn Leu Thr Ser 680

Vai Ser Vai Asn Ile Ile Ala Gln

690 695

Arg Vai Leu Asp Ile Cys Phe Arg

705 710

Asp Phe Vai Lys Ser Leu Cys Asn

725

Ile Glu Cys Asn 740 Ser Arg Glu Thr

Leu Gly Glu Arg Trp Vai Pro Pro

755 760

Ser Met Pro Ser Gln Leu Ser Ala

770 775

Pro Ser His Leu Ser Asn Leu Ser

785 790

Asp Vai Gln Gln Asp Asp Vai Glu

805

Arg Arg Leu Phe Ile Ile Thr Ser

820

Vai Ile Arg Ala Asp Gly Phe Arg

835 840

Cys Gly Ser Ala Thr Gln Ile Leu

850 855

Ala Vai Arg Vai Trp Phe Ser Leu

865 870

Gly Asn Arg Gly Phe Asp Leu Gly

885

Arg Glu Phe Vai 900 Ser Vai Tyr Met

Glu Ala Lys 915 Glu Ala Glu Ala Ala 920

Pro Ser His Pro Arg Ile Tyr Ile

930 935

Gly Ala His Asp Asp Asp Leu Cys

945 950

Pro Ser Thr Vai Cys Asn Phe Arg 650 655

Gly Cys Pro Vai Vai Pro Pro Vai

665 670

Ile Glu Vai Leu Arg 685 Gly Ile Leu

Glu Leu Gly Asn Leu Glu Arg Leu

700

Asp Gly Ser 715 Leu Asp Leu Tyr Lys 720

Leu His His Ile Glu Ser Leu Arg 730 735

Ser Ser Phe Glu Leu Vai Asp Leu

745 750

Vai His Phe Arg Glu 765 Phe Vai Ser

Leu Arg Gly Trp Ile Lys Arg Asp

780

Glu Leu Ile 795 Leu Ser Ser Vai Lys 800

Ile Ile Gly Gly Leu Leu Cys Leu

810 815

Thr Asp Gln Thr Gln Arg Leu Leu

825 830

Cys Thr Vai Asp Phe 845 Arg Leu Asp

Phe Glu Pro Gly Ala Leu Pro Arg

860

Gly Vai Arg Vai Thr Lys Glu Asp

875 880

Leu Gln Gly Asn Leu Phe Ser Leu

890 895

Tyr Cys Gly Gly Ala Arg Vai Gly 905 910

Vai Arg Arg Ala Leu Glu Ala His

925

Gln Met Arg Pro 940 His Ile Ala Lys

Glu Asp Glu 955 Glu Glu Asn

5 I.a) Número identificador da seqüência: SEQ ID No: 19

II) Características da seqüência:II.a) tamanho: 17

II. b) tipo: DNA

10 II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Marcador (Tag)

de Seqüência de Assinatura de MPSS

15IV) Seqüência: 19gatctcataa ctaggat 17

I.a) Número identificador da seqüência: SEQ ID No: 20

II) Características da seqüência:II.a) tamanho: 2 0

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de KEB131

IV) Seqüência: 20

tgatccttga ttgtccatgg 20

I.a) Número identificador da seqüência: SEQ ID No: 21

II) Características da seqüência:II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de KEB138

IV) Seqüência: 21

ccattacttcr catatatact 20

I.a) Número identificador da seqüência: SEQ ID No: 22

II) Características da seqüência:II.a) tamanho: 1684

II.b) tipo: DNA

II. c) organismo: Zea mays

III) Características:

III. 1.a)Nome/chave: PromotorIII.l.b) Localização: (0) ... (0)

III.l.c) outra informação relevante: Região depromotor do RegiIV) Seqüência: 22

actgtcgggg

catcageata

agtgactcga

acttccgtct

ccttggcttc

gggcatttaa

gaggtgaccg

tgcgccactc

ccgaaggcgc

cccggaagac

ggaagacggc

agacggcgaa

cggcgaactc

cgaactccgc

aactccgcct

cgcctcgccc

cggcttcgga

aacgtcatca

gtccggccag

gcccccagct

tgtccctcca

ccagatctct

acacgtagca

aggaaggacc

gctctcttgg

agcgcacctg

gctcggctcc

tgggctgggg

gaca

accataatta

aagctgcaaa

tcgcgcttca

cgcccgaggc

gctcagaagc

cgcaaaggtg

ccgtcactcc

cgactgcagt

cacggcgaac

ggcgaactcc

gaactccgct

ctccgctccg

cgctccgccc

tccgcccgac

cgcccgaccc

gaccccctgg

ggaaacccca

tcaccctacc

ctccgccaga

ctcttacggc

tcaggctccg

ccggctgcca

ctctgctaca

agggtcttct

ggccgctcgc

acctgggcgc

ggccgcctcg

cacgcagcac

ggggtaccctggcctgatggcccgagcctaccccctttttaaccttgactgcctgacaccaccgctccacgccactcgactccgctccgcgctccgcccgccgcccgacccccgaccccagaccccagggcccagggctccagggctcggctcgggctcgcgtcgccctgccgaatcgacggggcaatgaagcaggacaaccgcaccacccatcggcatgtccccattgtcagagaaggtttccctcaccgggacgaacacctctcccccactcactcgt

caagacgcctgcacgattaagcctcggccgatggcggacaaaatcaccactctatcctgatggccagtctagagtgagtcccgaccccagaccccagggcccagggctcggggctcggacctcggactcgagactcaggcactccgccctgccacagcaacctagagcactcgggtcacgtggcgctccacgtcagcagggatagccacgtacctagggcacacctgggttggccgcgcgcgcgtggacgcgaaggccgcctccgcgctccggcttaggg

aattetcagegtcagggatcaaggcagccgcatcaccggcaccgactgaccacgcgccccgacagaaggatgacaggcaaggctcggacttcggactcgggactcgggcttcgggctaagggctaagacctaagacccggggcctcggccctgaaggcaaagaccgccacgagaacaagacgagctctatgactcgaccgacatcacgccactagctctccctctccttaggaccgaggacttgtaacccgggacttccagcccacgcgcaccocctgtc

tggtaaccccagtccacacgacetegagagttgcccaaggcaaattgcagcggcagagcccagcgccgccctaggccttgcgggctaagagctaagacccaagacccggaacccggaagacggaagacggaagacgacgaggacgacttcgactcaacctgtcaacaggaccggcgtctcgacgacggcgctccaacagcagcaggatgccctccgctagcgactataaacgggacaggcccctactgcacctctctcactcgacccatctcgaaacgcc

60

120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

1020

1080

1140

1200

1260

1320

1380

1440

1500

1560

1620

1680

1684

I.a) Número identificador da seqüência: SEQ ID No: 23

II) Caracteristicas da seqüência:II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer de

oligonucleotideo de FLP8 Reverso

IV) Seqüência: 23acatgggtcc aaagatcgac 20I.a) Número identificador da seqüência: SEQ ID No: 24

II) Características da seqüência:II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP8 Forward

IV) Seqüência: 24

catggaagcc ccacaataac 20

I.a) Número identificador da seqüência: SEQ ID No: 25

II) Características da seqüência:

II.a) tamanho: 20II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP27 Reverso

IV) Seqüência: 25gcatgcccca tctggtatag 20

I.a) Número identificador da seqüência: SEQ ID No: 26

II) Características da seqüência:II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP27 Forward

IV) Seqüência: 26agccctattt cctgctcctg 20I.a) Número identificador da seqüência: SEQ ID No: 27

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP33 Reverso

IV) Seqüência: 27

gcattcacat gttcctcacc 20

I.a) Número identificador da seqüência: SEQ ID No: 28

II) Características da seqüência:

II.a) tamanho: 20II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de FLP33 Forward

IV) Seqüência: 28ctgtcgttcg gttttgcttc 20

I.a) Número identificador da seqüência: SEQ ID No: 29

II) Características da seqüência:II.a) tamanho:'20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de FLP41 Reverso

IV) Seqüência: 29ctgtaaggca cccgatgttt 20I.a) Número identificador da seqüência: SEQ ID No: 30

II) Características da seqüência:II.a) tamanho: 20

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP41 Forward

IV) Seqüência: 30

tgtgttcgca tcaaaggtgt 20

I.a) Número identificador da seqüência: SEQ ID No: 31

II) Características da seqüência:

II.a) tamanho: 21II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP56 Reverso

IV) Seqüência: 31tgtccagggt tacagaaaac g 21

I.a) Número identificador da seqüência: SEQ ID No: 32

II) Características da seqüência:II.a) tamanho: 21

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de FLP56 Forward

IV) Seqüência: 32ggtctgggaa tgctaaagag g 21I.a) Número identificador da seqüência: SEQ ID No: 33

II) Caracteristicas da seqüência:II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP95 Forward

IV) Seqüência: 33atttcgacgg agggttcttc 20

I.a) Número identificador da seqüência: SEQ ID No: 34

II) Caracteristicas da seqüência:

II.a) tamanho: 20II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP95 Reverso

IV) Seqüência: 34gcagcaggag gagctcatag 20

I.a) Número identificador da seqüência: SEQ ID No: 35

II) Caracteristicas da seqüência:II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP110 Forward

IV) Seqüência: 35atggaggctg ccctgctgag 20I.a) Número identificador da seqüência: SEQ ID No: 36

II) Caracteristicas da seqüência:II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP110 Reverso

IV) Seqüência: 36

cgtatacctc tctggcaagg acgg 24

I.a) Número identificador da seqüência: SEQ ID No: 37

II) Caracteristicas da seqüência:

II.a) tamanho: 25II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP111 Forward

IV) Seqüência: 37ttcctgttcg tctgtatctg atccg 25

I.a) Número identificador da seqüência: SEQ ID No: 38

II) Caracteristicas da seqüência:II.a) tamanho: 25

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP111 Reverso

IV) Seqüência: 38tttgattccg gtcgagtata acctg 25I.a) Número identificador da seqüência: SEQ ID No: 39

II) Características da seqüência:

II.a) tamanho: 25

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP112 Forward

IV) Seqüência: 39gaaactgcct tcccagaaaa caatg 25

I.a) Número identificador da seqüência: SEQ ID No: 40

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP112 Reverso

IV) Seqüência: 40caagatcggt gaagttggtg cttc 24

I.a) Número identificador da seqüência: SEQ ID No: 41

II) Características da seqüência:

II.a) tamanho: 25

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de FLP113F Forward

IV) Seqüência: 41atcacagatg ggtctcaagg attgc 25I.a) Número identificador da seqüência: SEQ ID No: 42

II) Características da seqüência:II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de AlexlR Reverso

IV) Seqüência: 42ttccaagcaa ttcacagctc 20

I.a) Número identificador da seqüência: SEQ ID No: 43

II) Características da seqüência:

II.a) tamanho: 2 4II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl612 Forward

IV) Seqüência: 43aggtccaggt tacagagcaa gaga 24

I.a) Número identificador da seqüência: SEQ ID No: 44

II) Características da seqüência:II.a) tamanho: 24

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl612 Reverso

IV) Seqüência: 44gctagtaggt gcatggtggt ttct 24I.a) Número identificador da seqüência: SEQ ID No: 45

II) Características da seqüência:

II.a) tamanho: 2 4

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umc2041 Forward

IV) Seqüência: 45

ctacacaagc atagaggcct ggag 24

I.a) Número identificador da seqüência: SEQ ID No: 46

II) Características da seqüência:

II.a) tamanho: 23II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de umc2041 Reverso

IV) Seqüência: 46cagtacgaga cgatggagga cat 23

I.a) Número identificador da seqüência: SEQ ID No: 47

II) Características da seqüência:

II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de cdol27 Forward

IV) Seqüência: 47tgctgttgtt actcgggttg 20I.a) Número identificador da seqüência: SEQ ID No: 48

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de cdol27 Reverso

IV) Seqüência: 48

ctctgcctca gcacaaattc 20

I.a) Número identificador da seqüência: SEQ ID No: 49

II) Características da seqüência:

II.a) tamanho: 2 6

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de phi093 Forward

IV) Seqüência: 49agtgcgtcag cttcatcgcc tacaag 26

I.a) Número identificador da seqüência: SEQ ID No: 50

II) Características da seqüência:

II.a) tamanho: 30

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de phi093 Reverso

IV) Seqüência: 50

aggccatgca tgcttgcaac aatggataca 30I.a) Número identificador da seqüência: SEQ ID No: 51

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de cdo365 Forward

IV) Seqüência: 51

cttccagagg caaagcgtag 20

I.a) Número identificador da seqüência: SEQ ID No: 52

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA ' "

II. c) organismo: Seqüência artifical

III.) Característica:

III. c) outra informação relevante: Primer de

oligonucleotideo de cdo365 Reverso

IV.) Seqüência: 52tgtcacccat gatccagttg 20

I.a) Número identificador da seqüência: SEQ ID No: 53

II) Características da seqüência:

II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de csul66 Forward

IV) Seqüência: 53tattgtgcac gtcaccttgg 20I.a) Número identificador da seqüência: SEQ ID No: 54

II) Características da seqüência:

II.a) tamanho: 20

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de csul66 Reverso

IV) Seqüência: 54

gggcagactt actgctggag 20

I.a) Número identificador da seqüência: SEQ ID No: 55

II) Características da seqüência:

II.a) tamanho: 2 0

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umc2285 Forward

IV) Seqüência: 55atctgcctcc ttttccttgg 20

I.a) Número identificador da seqüência: SEQ ID No: 56

II) Características da seqüência:

II.a) tamanho: 2 0

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umc2285 Reverso

IV) Seqüência: 56aagtagctgg gcttggaggg 20I.a) Número identificador da seqüência: SEQ ID No: 57

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de MZA11455 Forward

IV) Seqüência: 57acgaagcaat ttcaccttcc 20

I.a) Número identificador da seqüência: SEQ ID No: 58

II) Características da seqüência:

II.a) tamanho: 23

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de MZA11455 Reverso

IV) Seqüência: 58tgtggaacta accctcagca tag 23

I.a) Número identificador da seqüência: SEQ ID No: 59

II) Características da seqüência:

II.a) tamanho: 19

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de MZA6064 Forward

IV) Seqüência: 59cgagaaccgg agaagaagg 19I.a) Número identificador da seqüência: SEQ ID No: 60

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Reverso

IV) Seqüência: 60ttgggctgct gtattttgtg 20

I.a) Número identificador da seqüência: SEQ ID No: 61

II) Características da seqüência:

II.a) tamanho: 19

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA158 41 Forward

IV) Seqüência: 61gacgcagctg tgaagttgg 19

I.a) Número identificador da seqüência: SEQ ID No: 62

II) Características da seqüência:

II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA15841 Reverso

IV) Seqüência: 62caccggaata ccttgaccac 20I.a) Número identificador da seqüência: SEQ ID No: 63

II) Caracteristicas da seqüência:

II.a) tamanho: 2 4

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl086 Forward

IV) Seqüência: 63

catgaaagtt ttcctgtgca gatt 24

I.a) Número identificador da seqüência: SEQ ID No: 64

II) Caracteristicas da seqüência:

II.a) tamanho: 25

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl086 Reverso

IV) Seqüência: 64gggcaacttt agaggtcgat ttatt 25

I.a) Número identificador da seqüência: SEQ ID No: 65

II) Caracteristicas da seqüência:

II.a) tamanho: 21

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umc!4 66 Forward

IV) Seqüência: 65gatccactag ggtttcgggg t 21I.a) Número identificador da seqüência: SEQ ID No: 66

II) Caracteristicas da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de umcl466 Reverso

IV) Seqüência: 66

cgaatagtgg tctcgcgtct atct 24

I.a) Número identificador da seqüência: SEQ ID No: 67

II) Características da seqüência:

II.a) tamanho: 21

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de umcl418 Forward

IV) Seqüência: 67gagccaagag ccagagcaaa g 21

I.a) Número identificador da seqüência: SEQ ID No: 68

II) Características da seqüência:

II. a) 'tamanho: 24

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de umcl418 Reverso

IV) Seqüência: 68tcacacacac actacactcg caat 24I.a) Número identificador da seqüência: SEQ ID No: 69

II) Características da seqüência:II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de BNLG2162 Forward

IV) Seqüência: 69caccggcatt cgatatcttt 20

I.a) Número identificador da seqüência: SEQ ID No: 70

II) Características da seqüência:

II.a) tamanho: 20Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de BNLG2162 Reverso

IV) Seqüência: 70gtctgctgct agtggtggtg 20

I.a) Número identificador da seqüência: SEQ ID No: 71

II) Características da seqüência:II.a) tamanho: 20

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotídeo de csul66 Forward

IV) Seqüência: 71aaatatcggc tttggtcacg 20I.a) Número identificador da seqüência: SEQ ID No: 72

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de csul66

IV) Seqüência: 72tcgtccttcc tcaattcgac 20

I.a) Número identificador da seqüência: SEQ ID No: 73

II) Características da seqüência:

II.a) tamanho: 24II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl051 Forward

IV) Seqüência: 73aatgatcgaa atgccattat ttgt 24

I.a) Número identificador da seqüência: SEQ ID No: 74

II) Características da seqüência:II.a) tamanho: 2 4

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl051 Reverso

IV) Seqüência: 74ctgatctgac taaggccatc aaac 24I.a) Número identificador da seqüência: SEQ ID No: 75

II) Caracteristicas da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de umc2187 Forward

IV) Seqüência: 75

acccaacaag tcttaatcgg gttt 24

I.a) Número identificador da seqüência: SEQ ID No: 76

II) Caracteristicas da seqüência:

II.a) tamanho: 2 4

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de umc2187 Reverso

IV) Seqüência: 76gtccacccta cctctcaaca aaca 24

I.a) Número identificador da seqüência: SEQ ID No: 77

II) Caracteristicas da seqüência:

II.a) tamanho: 23

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl371 Forward

IV) Seqüência: 77catgtgaatg gaagtgtccc ttt 23I.a) Número identificador da seqüência: SEQ ID No: 78

II) Características da seqüência:II.a) tamanho: 2 4

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl371 Reverso

IV) Seqüência: 78gcatcctttt cgtttcaaat atgc 24

I.a) Número identificador da seqüência: SEQ ID No: 79

II) Características da seqüência:

II.a) tamanho: 24II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer de

olgonucleotideo de umcl856 Forward

IV) Seqüência: 79agatctgttt tgctttgctc tgct 24

I.a) Número identificador da seqüência: SEQ ID No: 80

II) Características da seqüência:II.a) tamanho: 2 4

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de umcl856 Reverso

IV) Seqüência: 80catgccttta ttctcacaca aacg 24I.a) Número identificador da seqüência: SEQ ID No: 81

II) Características da seqüência:II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA1215 Primer

Forward Nested Externo

IV) Seqüência: 81agcccaattc tgtagatcca a 21

I.a) Número identificador da seqüência: SEQ ID No: 82

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 82tgcatgcacc ggatccttc 19

I.a) Número identificador da seqüência: SEQ ID No: 83

II) Características da seqüência:II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 83

agcagcagac gatgcaaaga 20I.a) Número identificador da seqüência: SEQ ID No: 84

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) orqanismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 84

aggctggcgg tggacttga 19

I.a) Número identificador da seqüência: SEQ ID No: 85

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA1216 Primer

Forward Nested Externo

IV) Seqüência: 85

ccggcctacg gcaacaagaa 20

I.a) Número identificador da seqüência: SEQ ID No: 86

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 86

agggtacggt gacccgaag 19I.a) Número identificador da seqüência: SEQ ID No: 87

II) Caracteristicas da seqüência:II.a) tamanho: 20

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 87ttcgagacgc tgtcgtacct 20

I.a) Número identificador da seqüência: SEQ ID No: 88

II) Caracteristicas da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 88acgacgcatg gcactagcta 20

I.a) Número identificador da seqüência: SEQ ID No: 89

II) Caracteristicas da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA3434 Primer

Forward Nested Externo

IV) Seqüência: 89tgtaccgcga gaactccaI.a) Número identificador da seqüência: SEQ ID No: 90

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 90ttgcattcac atgttcctca c 21

I.a) Número identificador da seqüência: SEQ ID No: 91

II) Caracteristicás da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 91

ctactacgac ggccgcta 18

I.a) Número identificador da seqüência: SEQ ID No: 92

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 92ttgcagtagt tttgtagcag g 21I.a) Número identificador da seqüência: SEQ ID No: 93

II) Caracteristicas da seqüência:

II.a) tamanho: 22

5 II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA2591 Primer

Forward Nested Externo

IV) Seqüência: 93agtaaataac agcattgacc tc 22

I.a) Número identificador da seqüência: SEQ ID No: 94

II) Caracteristicas da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

Reverso Nested Externo

IV) Seqüência: 94tccaacggcg gtcactcc 18

I.a) Número identificador da seqüência: SEQ ID No: 95

II) Caracteristicas da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Caracteristica:

Forward Nested Interno

IV) Seqüência: 95ctatataaca gggccctgga a 21I.a) Número identificador da seqüência: SEQ ID No: 96

II) Características da seqüência:

II.a) tamanho: 20

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 96cacaaagccc acaagctaag 20

I.a) Número identificador da seqüência: SEQ ID No: 97

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:.

III. c) outra informação relevante: Primer deoligonucleotideo de MZA11123 Primer

Forward Nested Externo

IV) Seqüência: 97accacaatct gaagcaagta g 21

I.a) Número identificador da seqüência: SEQ ID No: 98

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 98cacagaaaca tctggtgctg 20I.a) Número identificador da seqüência: SEQ ID No: 99

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 99aaagaccaag aaatgcagtc c 21

I.a) Número identificador da seqüência: SEQ ID No: 100

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 100agacatcacg taacagtttc c 21

I.a) Número identificador da seqüência: SEQ ID No: 101

II) Características da seqüência:

II.a) tamanho: 2 0

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA15842 Primer

Forward Nested Externo

IV) Seqüência: 101ctcgattggc atacgcgata 20I.a) Número identificador da seqüência: SEQ ID No: 102

II) Características da seqüência:

II.a) tamanho: 20

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 102

ttccttctcc acgcagttca 20

I.a) Número identificador da seqüência: SEQ ID No: 103

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 103

agaaggtatt tgccatggct ta 22

I.a) Número identificador da seqüência: SEQ ID No: 104

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 104

gtttcacttg ctgaaggcag tc 22I.a) Número identificador da seqüência: SEQ ID No: 105

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA11455 Primer

Forward Nested Externo

IV) Seqüência: 105gaccgatgaa ggcaattgtg a 21

I.a) Número identificador da seqüência: SEQ ID No: 106

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 106accaaatagt cctagataat gg 22

I.a) Número identificador da seqüência: SEQ ID No: 107

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 107ttcaaccttc tgactgacac at 22I.a) Número identificador da seqüência: SEQ ID No: 108

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 108taaacatagt cataaaaatt ac 22

I.a) Número identificador da seqüência: SEQ ID No: 109

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA6064 Primer

Forward Nested Externo

IV) Seqüência: 109tcgaatgtat tttttaatgc gg 22

I.a) Número identificador da seqüência: SEQ ID No: 110

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 110atccacaatg gcacttgggt 20I.a) Número identificador da seqüência: SEQ ID No: 111

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 111cagctatttt tgtcttcttc ct 22

I.a) Número identificador da seqüência: SEQ ID No: 112

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 112ggtcagattc caattcggac 20

I.a) Número identificador da seqüência: SEQ ID No: 113

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA11394 Primer

Forward Nested Externo

IV) Seqüência: 113tcgtcctaac agcctgtgttI.a) Número identificador da seqüência: SEQ ID No: 114

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 114gtccggatca aatggatcgt 20

I.a) Número identificador da seqüência: SEQ ID No: 115

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 115aacagcctgt gttgaataag gt 22

I.a) Número identificador da seqüência: SEQ ID No: 116

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 116cgtgttccgt cgagggagtI.a) Número identificador da seqüência: SEQ ID No: 117

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA8761 Primer

Forward Nested Externo

IV) Seqüência: 117ttctttgatt ctactcttga gc 22

I.a) Número identificador da seqüência: SEQ ID No: 118

II) Características da seqüência:

II.a) tamanho:

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 118cttcaggac gcctgagatt 20

I.a) Número identificador da seqüência: SEQ ID No: 119

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 119tagagctttc tgaactgata gc 22I.a) Número identificador da seqüência: SEQ ID No: 120

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 120

ttggcattta gcttctctcc a 21

I.a) Número identificador da seqüência: SEQ ID No: 121

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA1851 Primer

Forward Nested Externo

IV) Seqüência: 121

atatattgca ccacttaaag cc 22

I.a) Número identificador da seqüência: SEQ ID No: 122

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 122

gggtgttatc acttgttcta taI.a) Número identificador da seqüência: SEQ ID No: 123

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 123tggagtcctt gaccatttgc 20

I.a) Número identificador da seqüência: SEQ ID No: 124

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 124tatatgcact tctagcgagt at 22

I.a) Número identificador da seqüência: SEQ ID No: 125

II) Características da seqüência:

II.a) tamanho: 32

Il.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deconsenso de oligonucleotideo degeneradodesenhado a partir das repetiçõesinvertidas terminais (TIR) oriundas daseqüência do elemento MutarorIV) Seqüência: 125agagaagcca acgccawcgc ctcyatttcg tc 32

I.a) Número identificador da seqüência: SEQ ID No: 126

II) Características da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III.c) outra informação relevante: Primer deoligonucleotideo usado ligado emcombinação com primers internos de MZA deforma a seqüenciar produtos de PCR

IV) Seqüência: 126tgtaaaacga cggccagt ^8

I.a) Número identificador da seqüência: SEQ ID No: 127

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo usado ligado emcombinação com primers internos de MZA deforma a seqüenciar produtos de PCR

IV) Seqüência: 127ggaaacagct atgaccatg 19

I.a) Número identificador da seqüência: SEQ ID No: 128

II) Características da seqüência:

II.a) tamanho: 1698

II.b) tipo: DNA

II.c) organismo: Seqüência artificialIII) Características:

III.l.c) outra informação relevante: Promotor deRegi com 14 pb de seqüência deoligonucleotideo de clonagem adicionadana extremidade 5'

IV) Seqüência: 128

gaggctcggg ggctactgtc ggggaccata attaggggta ccctcaagac gcctaattct 60cagctggtaa cccccatcag cataaagctg caaaggcctg atgggcacga ttaagtcagg 120gatcagtcca cacgagtgac tcgatcgcgc ttcacccgag cctagcctcg gccgaaggca 180gccgacctcg agagacttcc gtctcgcccg aggcccccct ttttatggcg gacacatcac 240cggcttgccc aaggccttgg cttcgctcag aagcaacctt gactaaatca ccacaccgac 300tgaccaaatt gcaggggcat ttaacgcaaa ggtggcctga cacctctatc ctgacacgcg 360cccccggcag agccgaggtg accgccgtca ctccaccgct ccactggcca gtctgacaga 420aggacagcgc cgcctgcgcc actccgactg cagtgccact cgacagagtg agtctgacag 480gcaactaggc cttgccgaag gcgccacggc gaactccgct ccgcccgacc ccagggctcg 540gactcgggct aagacccgga agacggcgaa ctccgctccg cccgacccca gggctcggac 600tcgggctaag acccggaaga cggcgaactc cgctccgccc gaccccaggg ctcggactcg 660ggctaagacc cggaagacgg cgaactccgc tccgcccgac cccagggctc ggactcgggc 720taagacccgg aagacggcga actccgctcc gcccgacccc agggctcgga ctcgggctaa 780gacccggaag acggcgaact ccgctccgcc cgaccccagg gctcagactc aggctaagac 840ccggaagacg acgaaactcc gcctcgcccg accccagggc tcggactccg ccctggcctc 900ggccggacga cttccgcctc gcccgacccc ctggctcggg ctcggccaca gcaactgaag 960gcaagactca acctcggctt cggaggaaac cccacgtcgc cctgcctaga gcacagaccg 1020ccacgtcaac aggaaacgtc atcatcaccc taccccgaat cgactcgggt cacggagaac 1080aagaccggcg tctcgtccgg ccagctccgc cagaggggca atgatggcgc tccacgagct 1140ctatgacgac ggcggccccc agctctctta cggcagcagg acaacgtcag cagggactcg 1200accgctccaa cagctgtccc tccatcaggc tccgccgcac caccgatagc cacgacatca 1260cgccagcagg atgcccagat ctctccggct gccacatcgg catgtaccta gggcactagc 1320tctccctccg ctagacacgt agcactctgc tacatcccca ttgtacacct gggtcctctc 1380cttacgacta taaaaggaag gaccagggtc ttetcagaga aggttggccg cgcgggaccg 1440aggacgggac aggcgctctc ttggggccgc tcgcttccct cacccgcgtg gacgcttgta 1500acccccctac tgcaagcgca cctgacctgg gcgcgggacg aacacgaagg ccgcgggact 1560tccacctctc tcacgctcgg ctccggccgc ctcgcctctc ccccctccgc gctcgcccac 1620gcgctcgacc catctgggct ggggcacgca gcacactcac tcgtcggctt agggaccccc 1680tgtctcgaaa cgccgaca 1698

I.a) Número identificador da seqüência: SEQ ID No: 129

II) Características da seqüência:

II.a) tamanho: 20

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer Forward Nested ExternoIV) Seqüência: 129

aacaacaagg cgacggtgat 20

I.a) Número identificador da seqüência: SEQ ID No: 130

II) Características da seqüência:

II.a) tamanho: 20

Il.b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III.c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer

Reverso Nested Externo

IV) Seqüência: 130tcatcttcgt cgtcctcatc 20

I.a) Número identificador da seqüência: SEQ ID No: 131

II) Características da seqüência:

II.a) tamanho: 18

II. b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer Forward Nested Interno

IV) Seqüência: 131

gatcatcctg ccggagtt 18

I.a) Número identificador da seqüência: SEQ ID No: 132

II) Características da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II.c) organismo: Seqüência artifical

III) Característica:III.c) outra informação relevante: Primer deoligonucleotideo de MZA16510 Primer

Reverso Nested Interno

IV) Seqüência: 132aaccgaaaac acaccctc 18

I.a) Número identificador da seqüência: SEQ ID No: 133

II) Caracteristicas da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

III. c) outra informação relevante: Primer deoligonucleotideo de MZA1719 Primer

Forward Nested Externo

IV) Seqüência: 133ccagcggtag attatataca g 21

I.a) Número identificador da seqüência: SEQ ID No: 134

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Externo

IV) Seqüência: 134cggtttggtc tgatgaggc 19

I.a) Número identificador da seqüência: SEQ ID No: 135

II) Características da seqüência:II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Forward Nested Interno

IV) Seqüência: 135ctcgggaacc ttgttggga 19

I.a) Número identificador da seqüência: SEQ ID No: 136

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artifical

III) Característica:

Reverso Nested Interno

IV) Seqüência: 136

tgaaatccag aacctccttt g 21

I.a) Número identificador da seqüência: SEQ ID No: 137

II) Características da seqüência:

II.a) tamanho: 50330

II.b) tipo: DNA

II. c) organismo: Zea mays

III) Características:

III. 1.a)Nome/chave: misc_fature

III.l.b) Localização: (0) ... (0)

III.l.c) outra informação relevante: Seqüêncianão-colinear

III.1.a)Nome/chave: repeat_region

III.l.b) Localização: (537) ... (7229)

III.l.c) outra informação relevante: regiãoaltamente repetitivaIII.1.a)Nome/chave: repeat_region

III.l.b) Localização: (7536) ... (11292)

III. l.c) outra informação relevante: regiãoaltamente repetitiva

III.1.a)Nome/chave: repeat_region

III.l.b) Localização: (12554) ... (25411)

III.l.c) outra informação relevante: regiãoaltamente repetitiva

III.1.a)Nome/chave: repeat_region

III.l.b) Localização: (29087) ... (43016)

III.l.c) outra informação relevante: regiãoaltamente repetitiva

III.1.a)Nome/chave: misc_feature

III.l.b) Localização: 48839, 48840, 48841, 48842,

48843, 48844, 48845, 48846, 48847, 48848,

48849, 48850, 48851, 48852, 48853, 48854,

48855, 48856, 48857, 48858, 48859, 48860,

48861, 48862, 48863, 48864, 48865, 48866,

48867, 48868, 48869, 48870, 48871

III.l.c) outra informação relevante: n = A, T, Cou G

IV) Següência: 137

taaaaacttg atttagaaac tcagctagtggctgcatgtc tagaggtaga ggagtagactagtatactca gccttgcttg tggcataattggagtgactt ggccgtccat cttgccaccggctgaggagg agcatgagga gtgatgggacttagtttatt tccgctgcac ttcgaacaatgatgatgatg gtgatgtaat aatttaatacatttgctctg tgactcacct tcgagtgagatcggactaga tccgagggat tgacgggttagcggggctta ggcacttaag ttggaataatggatgaaata gcaatttttc ctaaccctttgattgaatct tggggatcct tgttcttgaccatgtggttt gtgcatccgc tgtcgataatcaaggcaaat ttaggcttgg gtcttaggtattacaatagt cttagagacc caaatgcaagtcctagcaat taccttctta tcctttctacaaattgtaca aggttcattc attactttcctatgatgaac aacatttttc ctagcaaattaatcatggca tgagaatcaa aagcatcataatcatgatac atgaaagcac ggttcttttgctccttggcg gagatggaag ccttatggctaagaccatcc ttaattgagg ggtgtctacctttgtcaaat tcactcttgc tagtcttaagcaatttagaa attgaaacta ggcgttcactattgcaaact acaacatgtt ctacacaaga

cttttggcaa ccaaacccca cagccaaaca 60cctcacaccg ggtaagtcta gctgagtatt 120tttacaggtt ctctggagga aatggttgct 180ggttggactg tcgagtggga ccctgccttg 240aggcttcccc atctctctat ttatttaccg 300gatggttact tttgcaaaaa ctccgaggat 360tctgacatgt atggttttat gctttattgt 420ttgtggtact tgatcctgtc agtggccgtg 480ttcccaatta agtgtggtct agcctctaag 540tcgggcagtt ccgccacaaa tagagtgctc 600caccttgcct tggttcccat cactgaatat 660gtaggaagag aacatcctct tttcccccgt 720ccagcttgag cccccggatg cataaacctg 780cccaactcat gttgggtcct acaaggttag 840tcttgtctcc cttacatttg gcccctaatt 900aaatagcaaa ggaagcattg caagcataat 960tagggacatg aacaatattt attctaggca 1020tttatcatgc ataatagaag aactagaagc 1080acttctatac acattcctag aatgtctcct 1140agcactacta gccatagggg ccttcccttt 1200tgttaagttc ttgacttccc tcttgaagcc 1260aatcgtgtag gcatcccttg caaattttag 1320ttgagcatta agactagcca cttcatcatt 1380acaagcatca acattaaaat ctttacacct 1440tgttgattta ttagctattt ctaacttagc 1500actcaaatca tcatttatgc tctttaagctacaagaaagc atttcattcc ttttaatttccttatcatgt tcttcataca aaagatcctccaaggcatca attaattcat taatcttatcacatgaatag tctatttcat catcgctagaagtatcacga gtgcttacct tcttttccctgaagagggac gatttgttga aggcggtggccgaacaatcc gagtcccact ccttgccaagcttcttcttt tccctcttgt tcccttgttcgataaaatga ccaatcttac cacatttgaagttgggatgc tccttacgac cctttagcgcttcttcatca ttaagcccgg ccgcctcaacgctcctcgtt gctttgagag caatggtttgatcaacgtat ctagcctcct tgatcatcatctcgggcgtc atcttggtgt acctaggattaaggacagta aaagacttta gcattaggcgtccatagctc cttattttgt tgacgagggtttcgcccctg atcattgcga atctcccaagcatggtgacg tcgtttccct catgagagatatccaagccg ctcaccttat ggtattcatcagcttgtgca tttttgtgaa tttgctcattgtgcattcca ttttctacta tctcccatatcattttgtga ctccaaaatc cgtagtcctcaatggaaagc aaatgagcat tgaaactttgtgaattaacc gtcttctttt tctcgtagtcttcgtcgctg tcgtagtaga ctatctccttgtttcttttg tggcccgacc ccgagtcagtggactccttc tccttatcat tgaccaccattgattagtcc ctttcttgaa gagaacggctgggtgaatag gtgatcctgt aaaacttgaaagcacgatta aagccaagtg gctagagagggattaatcac atatagacac agtggtttattactccacgt tgtggcgtcc caacggacgaaaagacccac ttgaatacca cggtgttttgatctccacaa cttggagcct ctcgcccttaaagggaggga tgagcaacgc acacaagacacacaacacga gctctcaaca caactcaaagtatcacaaag aatcaaatgc gcggaatcgagcttggtgta ctcctccatg cgcctaggggccgttgagat cattccaaga aggcaattctccggtgcacc accggacact gtccggtgcggttggagatt cagagtcgtt ggcgcaccggtgcccccttc tgaccgttgg ctctgccacgggcccggctg actgttggct caccggacagtatagccgta caccaccgtc aaagtcccgagcaccggaca ctgtccggtg caccaccggatggctgtaca cagccaactt ctccaaaatttacattagtc ttcaaaacaa tgtactaagtcttcttgagt ccatggcaca atttaacactaaatatttag aaatggccca agggcacattagagctcccc ctcgacaaag ccgaagctcgcttactgggc gatgaaaagg agctctaccacatatccatc gctgaaggac aggagctattccatgtagca cctcgagccc tcgttgggaacgcggtggcc gacgccacta ggattgtacgacagacgcac ctgcccgctc agaccctgcagtggggtctg gacctcgtcg gtccattgcagtcgccatcg acaaattctc caagtggatcgagcaggcgg tggcgttctt caccaacatcatcaccgaca atggcaccca gttcactggc

agaaatagag tcatgacatg tagacaattc 1560taaagcaagg gatttttgtg cctctacaaa 1620ttgcttttct aataacctgt ttctatcatt 1680aactttagtt ctatctaggc ccttgaataa 1740ttcttcatca cttgaggaag cgtaagtact 1800tgccatgagg caggtgtgat gctcattggg 1860ggcgagtcct ttgttgtcgg agtcggacga 1920gtgtgcctcg cccttagcct tcttgtaagt 1980ctggtcacta tcattatcgg gacaattagc 2040gcatgagcgt ttcccctttg tcttgttctt 2100cgtcttgaaa cgcttgatga tgagggccat 2160ttgtgccacc ttgctaggta gcgcctcctt 2220aggctcttgg attaggccat tcaatgcatc 2280ccgcccgctt acgaactttc caagtatctc 2340ctcacgaata ttgttcacaa gatgtggatc 2400gacgacgtcg tggtccgtcc atcgcgtgct 24 60cttgagccgg ttgtatgttt gggttggttc 2520ttctccctcc accaactcca tcttggtgag 2580cttgagggtg tcccaaatct gcttggcatt 2640cctgcacaat gaagctagaa gaaaagtagt 2700aatgaacatg ggactatccg tactatcaaa 27 60acttggatgg agagagaata agtggttgtg 2820tccatcaaag tgggggggtt' taccgagggg 2880cggaatatga gaataatcaa aggaaaagat 2940gttgtcatcg tccttttggg aagaggaaga 3000gatgcgcctt gttttcttct tcctcccgtc 3060aggcttgtca tcctttagat cattgacgaa 3120ccccttgccc ttaggatcca tctcttcggg 3180ctgataccaa ttgagagcac ctagaggggg 3240acttaatgcc acaaaacttg attagtagtt 3300agttcttgca agacccgata accacaagag 3360cccgtggttc ggccaagttc aacacttgcc 3420gggttgcaat caacccctct caagtggtcc 3480ctttgcttta ctatatcccg cttgcgagga 3540cactttgatg ttcacaaaga agcacggagt 3600caaaattaga gtgacaatac gcacacaagt 3660agttctctac tcaaatggag ctctagttgc 3720agtcttggtg cttagtaatg cttagagaat 3780tcccttttat agccccaagg cagctatgaa 3840tgccttctgt cgcctggcgc accagacagt 3900gatttctttc cttctttggc gaagccgacc 3960acactgtccg gtgcacaccg gacagtccgg 4020cgtcgcgcgc gaattacgcg gccgaccgtt 4080tccggtgcac caccggacag tctggtgaat 4140gagcagccat ttgacagacg ccagcctggc 4200cagtccggtg caccccgacg agcagccttt 4260gtttctccta tttctagcac ttagacacaa 4320ctagaaacat acctttaatc ttgatttgca 4380tatgcacttg tgttggacac ttaatcacca 4440tccctttcac ctgcaatatc tccaccaagg 4500gtgactggcg cggcgcgcca agtcgttcgt 4560ccgcatcccc tcaggcatcc tccaacgatg 4620gcaagagata cactcgaggg cttgcggtca 4680cgccttccga caaggcttct actggccgac 4740ctcctgccaa gggtgtcaat tctacgcaag 4800gacaataccc atcacttggt catttgttgt 4860aaaggcacct ggggcttctc gcacctgctg 4920gaggtccgac ccctaaccag catcaggtcc 4 980gtccatcgct tcagggtccc gaactccatc 5040aagaggttcc tggacttctg cgaggaccac 5100cacatccggg tggactgggc cgccgtggctgccaacggta tgctcctgca aggactaaaaggcaagcaat ggatgaagga actaccctcgtgagccacgg gcttctcacc gttctttctagacttagagt acggttcccc gaggatgaggcgagaagact cactggacca gctggaggagcgatatcagc agtctcgacg ctaccacgccggagacttgg tgcttcggct gcggcaagactgggaggggc cattcatcat ctccaagattaatcaaggcg aggtctacaa caacgcttggtaagatgttt tcaagtcgtt catatacctcaggaagggtc agccttgcct cggcaaagccaccccctctg cgtaaaaaat ttcctcggaatttttgactg cttcgatagc gggatcctgacgaccgagcc gagggactcc tacgcctccgtgataagtaa ctcacgctcg gataagcgataaacttttct gccagaacga ttttcgtgccggacgagtaa gagtgcacgt aagcggcgagcgggatacgg atacctcact catcaccttcattctgttac cgacgaacaa gtccagatacacaacacaac aatgatatgt ttgggcctcaacaaactctc cctgcaggtt cagacatcagctccaccttc ggcggaatct ggcccggcctcctcgaagat ggaagccaac accaagctcgcccggcccgg gcaaacgcct cgaccggccggacatcagcc cgactcatgg cctcgacagcgacctggcca ggttccagcc gccgctgttg-ctaggccaac gaagcttctt ctcgagccgactccggctcc ggctcatcgc agagcggccggggtggcaag gccgaccgag ccgagggactcgtcaccttc cgcagtgggc aactcacactagtcctggtg ctcgaaatga ggaagaaacaggcctcgaca gccataatga acaaacaccgcggttccact cccgcgggta tgaacaaccttctagttggc tcgccgccga ccgctccatcctgaacagca gcagcgatga cctcagggcatccccactcg aggggcgagg acaagctatcgtggcgccga gaaaccttct ctggctgccagcccaccaac acccgccggg ccgtgaccaacagggttgcc tcgagtcgcg gcaccggttcacggtcgata tagccaaaag cgggccagcacagtcaagtt gtctgcaggc tcacgtccccccccaggggg tccctggacc aacgagtaaatggcgcgaga cggaacacag agggggggaagtggatgcgc ttgcagtagg gggttacaagtgttcgtcgg cccgtcctcc cgcgcgaccatttatagatg taagaagagg gtccaggtgttctggcagag aggagccaga gccctatgtagagccctgtg catgcgatgt cgtggccgtcactgttgggg ctgtcgggac cttgctgacggccgtcgtca tggccgcacg cggggagccagggacaccga tcttgttccc tgtagcctgaccctgtggcg tggtcggtcc gagcccaagggaggtcgggg ttgggtgagg acgcgattccgggtcgggcg aggcggagac catcctccgaggcgaggcgg agtccatctt ccgaggccgagcggagactt ctcctgaggc cgaggcctaactgaggctgg actcagctgc tgtcagcctcgggcaggcgg cgctgttttc ttgtcaggtcactttggccc taccgactga ggaacgtgcg

caccccatga caaatgggca agtggagcgt 516Cccgaggatct acaacgacct caacaagttt 5220gtggtctgga gtctgaggac gacgccaagc 5280gtctatgggg ccgaggctat cttgcccata 534 0gcgtacgacg accaaagcaa ctagaccagc 5400gctcaggacg tggccttgct acacttggca 5460cgaggtgttc ggccccgaga cctccaagtg 5520gctcgagggc gccacaagct tactcctccc 5580ttgaagcccg gaacttacaa gctggccaac 5640aacatccgac aactacattg cttttaccct 5700attttctatt caaataaagt ctaaccgtta 5760cgaccctccc tcgggggcta gaagggggga 5820aaagtctttc tgccagaaca tctttcgcgc 5880aaacgacgga gtacacgtaa gcggcaaggc 5940ggatacggat acctcactca tcaccttctg 6000tttgctgacc gaacaagtgt taacgctcga 6060ttctcgacta tatcgataac agaatcctac 6120gccgaccgag ccgaggaact cctatgcctc 6180tgtgaaaagt aactctcgct cggataaacg 6240tcgaaataag aggaaaggaa acgcagcttt 6300gcggccgcga aaaacatacg cacactacag 6360cagagggagc agcagcaccc tcgacgtcgt 6420tggacggcga cgtgggcgga aggatctcca 6480ggccatcata gccaaggtct ccgtaagggt 6540ctccgtagcc tcagccagct gtcccccgag 6600ctgactccgg ggttggtccc gccagcggac 6660cacctcctcg accagggagg ccaagtgctc 6720ctcagcctct gtccacactg acaccgctgc 6780agggttcttt aactgagcaa gagaagcctt 6840cctacgcctc cgggatatgg atacctcact 6900tggttaagcg gttcagctag ccgacaggcg 6960tggtattgca ctcaaatacc tagatgttca 7020gcactcaagg tgccattaca aacggaactc 7080ccacatcgga gggcctgcgg gacgacaaac 7140agcagcgaca acgacctccg ctccgggcgg 7200gacgctgctg cgacaaggcc ctcgcccgca 7260aaagccgaag agccggaggt ccgaccgcag 7320ccacctcagc accgacgacg gcagccacct 7380tgtgctcggt tggcactgtt gggtcatgcg 744 0cgcagtcgag aaggcgcggg aggaggcgcg 7500gtaatggcga cagcaggcga gcggaagcag 7560tacctggcgc gccaactgtc ggcgtttcga 7620ttgtcgctgc gtgccccagc ccagatgggt 7680aaccgcggct tcgtgttgtc ctgcgccaga 7740cgtccacgag ggagagaaag agagagtgcc 7800ccctcccgta tgagggccct ggaccttcct 7860acaatggggg tgtagcaata tgctaacgtg 7920catgccaacg tggctgtcgg agaggtgcta 7980ggaggagcac ttgagccctg tagaagcaca 8040tctccttact tccgtaaggg gctgagagcc 8100tcattacttg ttaccggggc gagcctggat 8160gctagctagg ggtagggtaa tgatgatccc 8220tcgggcgagg cggaaactcc tcctgaggcc 8280ttctgaggtc ggggccgagg tcgagccctg 8340ggtcgaggtc gaggctgagc cctggggtca 8400ggcgagggcc gagccctagg gtcgggcaag 8460ggtcgggcga ggcggagctt cctgtggcgc 8520atcttggcag gtggcacagc agtcggagcg 8580agtcagtgga ggggcgacgt gactgcggtc 8640tcaggataag gtgtcaggcg atccttgcat 8700tgaatgctcc tgcgatacag tcggttggtgaagcctgccc gagctgggcc tcgggcgagtctcgggcgag gcgtgaatcc gcctgggtctaggcgagatc gcgtcccttg tcacacccggataatcacca ggtgtgctgg gaccaagtctgaatgtcaca tctttactac ataacaggagataaggagac aacggtccag caacccaaagtcacgaactc atcgcagcat cctccatgcgtggggggggt gagacagcaa gagtgagctcgaataatgtg catgatctcg ccaaaggtgggaggatggtt agagctgagc attgcttttaaagtataagt aaataccaac ccaattaagtatgcaatgca tatgacaaat tgagtttaaggctgctcatg accgtgagct cggctagtatctttacccac aagtcatgtt acccatttgcccaaggaggc gaggcagggt aacactacgaaacccgctac agtttatagg aagctccaataaaatcaacc aaggacctcc ctacactgactaaggtagtc ctccactggc tttcctaattggtggcacgt gtttctcaag ttaagctctagaacataaat agaataacaa aataactggaccatgtaaag caatagcaaa ctacccaagtacaatctagg gtaacctatt gggtcccatcaacgaatatt attgggtaac agaagtgatcgctcagctac ttcaacctgc tgctcaccagacaatacaaa caagcacaat atatagagaatacacagtaa taatctatgc attaaaataaagttatagat tttaagttat ggattttcaaaggaattaaa tttcttactg ttttcatgacaattacaaaa atttagaaag tggaatggagattattgaag ttctagcaat tattttcctaaatttcaaac agctctggat cgagcctcaaaattttctaa gactcagaat actatgcagtggtttctctt acaaaactga cccgcgaaggaagtggacgg cccagattaa ttcatacaacggatacgaaa tccatgaccg agagagttcctataaccagt ggctcagatt tcatctgcgaccattcagat cgaacgatcc acatctagttacagatcaaa ggcccacggc aagcgcttctgacagggcac cgcggcggcg ccatcgccggacccgagcga taaatggtgc aaacgggagatttaccgtga atcgagtagc aggactcgccagttgatgcc cgacgaggaa tttcccggccagcccgcgtt cgggtatccc tcacgaacacccccagggtt gaatcgaccg aggcggtcatggtgcgcaac tggttttcct gatagtgggcccccgatgca ccgacccaca atcgccaagggatggccgaa gcacagcaca gcaggtggacttggggcgag cagggaggag aagaggaacaaggaggggac gaacaggtca cgctggcgcgaggacgttaa ccgggcggcg ctagaatcctgcggcgggca ggtgtgccgc cagcgctgtataggggtccg cgatttccgt gaatcgggcacgaagcggag gaaatgtagg gagggagaaggctgggtgac cctggaatgt ggggcccgcctgaggggcgt tgggtcgtgc ggtatcggaagcccaagtag tgttttattg tttttctttttcccatttaa attcaaattt agtggtggatatggcatggg tgaacttatt tattttcaatctccaaatta gagtttaaat gctatgtgtccatttatttt actatccaca aatgcacaat

aggcgatctg gccaaggttg cttcactgcg 8760cgggggtgcg ctcgtttctt tgaggaggcc 8820actgttcctg cccgaggctg ggctcgagcg 8880atttcagggc accaagaccc gggcgcgaac 8940cacacatatg atgattcatg gcacaggatc 9000ttctatacaa aataaataag taattacatt 9060ttgactggga gacgacgacc tagatctctc 9120cctcatcctg cggtacttgt tcttgacctg 9180acatacgttc atcgctcaac aagttgtggg 9240gagctcacgt gaagtgtaag gcttaccaaa 9300aagttggtca aaattttatt agcaattact 9360agtagaacaa aagtaacaac atcacctgcg 9420ttccataatt taatcatcag agagtcctga 9480accagtttta cactctgcag aggttgtacc. 9540gaagggatcg cgacttccca tacacctcta 9600ggcctttaca aagttccact agcttcagaa 9660gcagggttct tgcctgaccg ccatcgcagc 9720cactccccta ctgcccttgc ccctttcggg 9780aatcagccaa gagcgtccat aaacccttgt 9840tgttccaatt aacattaatg atcttgacat 9900acatagatat gataattaat tatcccaaat 9960gattcagggg taaacaaggt aatgagataa 10020aaaattaacc tatgcatgaa tagtgataat 10080aagggcacaa cttgccttta atgagcacct 10140gatcctcatt cacgggctct tctactcgcc 10200atcaacatca caccaaacat gtaaacaaac 10260aatcctagga acagaaatca taattttcgg 10320aggttttatg tgtttaaaat agattaagtg 10380aaaacagagg ctctaagtga tagagaatta 10440taatttgggg ttcatataca ttttctatga 10500ttaaaaatcc cttttccaat ttatttactc 10560ttaccgaaaa gtgcaggggc ttctgcgcat 10620ggacggcggg tttattcctc ggttttccag 10680ggtatcagcc gatctcggcc gcaggatgtg 10740ttaacaaatc ggtatgcacc caaggcccac 10800acgtcattga cctaacctaa ccatcggatc 10860aggaggtatg ctgtatataa tctcgctcgt 10920tgaacccgat ctaatctaga tcgttcgtac 10980cttccccctc cggccacccg tgcggccagg 11040caacacggtc ggtcggcccc tacagcctta 11100ggaagagatg caaaaccaaa tgggagcgat 11160gcccacggag acacgcaggt tcacagcaag 11220atggctcgcc cagtcgactg gagagcgcct 11280cccaaaccac atgccgaggc tgtagagtcg 11340ttctcccctg accacggcga agagcggcac 11400accggcgtga aattaggccg ccaactcgcg 11460cttctgctgc gcaaacgagt tccccgctgt 11520ggcagcggac cagtcgcggc ggcgcacaga 11580gcggcttcgg gtgttatagg cgcagggtaa 11640atgccgcacc tatatgacga gtccgggctg 11700ggggcttcgg cagaggccgt tgcgggagta 11760cgcggggtcg gggcacggag gttgttgcgc 11820cgagctcacc agcgccaccg gttttgcgca 11880aagaccactg ccggctgggt ggataagtta 11940tggcggcgac gcgaaggcca cacgagcgag 12000aaaaaagaat gggccgaaag tgaggattcg 12060tcttattttt tttcaaattc aactttaaat 12120ctatcttcac attaatttcc caacttaaac 12180atttatttta ttaaaactag tgctatgttt 12240ccttaatata ttaatatatg ggtactaaca 12300caagtaaaaa ctcagcatga tgcataattt 12360atttgagtgt cttctattaa ttatttattgatagggataa cccacacaca tgtaaaggaaaagtgggtgt tacatccctt gagtggacggctgcagtttg cgctgatggt gattaccagcttatggtacc cgacaactgg tatggacgagtataacctcc gtgaacaggg aaatgtgtgtcacgggagcg ggaagctcag tggtggttgaaccttacagc aattgccttt ctctaagaaaagcatgtatg atataggtct ctttctctttagtgtattca cccatattta tttatgttttcttgattgag agggctgtgt ctgcacccagtctactgcgc ttcatcttct ggctctctcgatttaaactc tgtactattt gaagaaaggattgtatcaca tttgagtccc aaaggatcggtaggggtacc ctcaagacgc ctaattctcaaaggcctgat gggtacgatt aagtcagggacgcccgagcc tagcctcggc caagggcagcgccccccttt gtaatggcgg acacacctccagcaaccctg actaaatcgc cgtgccgactgtggcctgac acctttatcc tgacacgcgcctccaccgct ctactgacca gtctgacagacagtgccact cgacagagtg agtctgacaggaactccgct ccgcccgacc ccagggctcgctccgctccg cccgacccag ggctcggactgctccgcccg accccagggc tcggactcggccgcccgacc ccagggctcg gactcgggctcccgacccag ggctcggact cgggctcagcgacccagggc tcggactccg ccctggcctcatggctcgga ctcggcctcg gcaacagaagccacgtcgcc cgacctaggg cgcaggcccgtaccccgagc cgactcgggt cacggagaaccagatggaca atgatggcgc cccacaagctcggaagcagg gcaacgtcag caaggactcgtccgtcgctc ctccgacagc cacgacatcagccacattgg catgtaccta gggcgctagctacacccccc attgtacacc tggatcctctcttcttagag gaggttggcc gcgcggggacctcgcttccc tcacccgcgt ggacgcttgtggcgcgggac gaacacgaag gccgcgggatcctcgcctct ccccccttcg cgctcgaccccgtcggctcg gggacccccc ggtctcgaaatgctgcgtgc tgacgaacag cttcccgtcatccggcccgg gacggtgctc cgtttcgggaacgacatgat actccttcct ccgccgcgcggccggcggcg gaatcggcga catcttcccctccgtcctct cccccgccga cggaggaggagcgcttcgtc ggctgtcgag cgaatcgacggcgtcgacct cgcgttcgag atggaggcagagcaagaaga cgacgccagc gcgctcgcggggatgacggt gcaaccagtc cccgatgtgacgactaactc ccatcttacg tcatttcgactggcgggcgc tctcgttgag gcaagtgcaagggaccggtt gacggacgtc tcaacctacgccagcatcta ttgggatttc tctggacttgccgcatgcga ctactgcctc tccgactgttgctgcggccc aagccgcgaa tgtttccacgatcttggcat gccggaggac ggtgattttcgggagctagc tgtggtcctc gttccggcgggcggggcgca ggctaggctc gacgagggaatagggcaggt atgggcgggc caacccccggctccagcacc gcgtcgccaa cgatgtcagg

tatagatgag gtgtccacat gaaatggtaa 12420tataatctct ccttttagat ttttcttaca 12480agccttgacc tgaattgcgc ccaacagcct 12540cgagtttagg agtcttgggg gtacccctaa 12600tctggtgtgg tatgacaatt agagattttc 12660gtaagtgcat actgaaaaag aaaacaaggc 12720gtattttgtt acttttaagt ctttgggaaa 12780atgaagagtg acttcaactc caccaaataa 12840acgggagcgc ggtgggcttg cggaatacct 12900tcagcagccg aagacttctt ttctgctatg 12960ttctgcctgt ggcttgggct agtatatttt 13020agcttgtacc cccgtattgt aataactctt 13080atgtgtttac tagcctcatg ggactactaa 13140gacgcttcag aaaatgtcgg ggaccataat 13200gctggtaacc cccatcagca taaagctgca 13260tcagtccaca cgagtgactc gatcacgctt 13320cgacctcgag agacttccgt ctcgcccgag 13380ggctcgcccg aggccctggc ttcgcttaga 13440gaccaggttg caggagcatt taacgcaaag 13500cccccggcag agccgaagtg accgccgtca 13560aggacagcgc cgcctgcgcc actccgactg 13620gcaatcaggc cttgccaaag gcgccatagg 13680gactcgggct aagacccgga agacggcgaa 13740cgggctaaga cccggaagac ggcgaactcc 13800gctaagaccc ggaagacggc gaactccgct 13860aagacccgga agacggcgaa ctccgctccg 13920cccagaagac gacgaaactc cgcctcgccc 13980ggccgaacga cctccgcctc gcccgaccca 14040acagactcaa cctcggcttc ggaggagccc 14100ccacgtcaac aaggagcgcc atcatcatcc 14160aagactggcg tcccatctgg ccagctccgc 14220ctgtgacgac ggcggctctc agctctctta 14280accgctccaa cagctgtccc tccgccaggc 14340cgccagcaag gtgccaagac ctctccggct 14400tctctctccg ctagacacgt agcactctgc 14 460ccttacgact ataaaaggaa ggaccagggc 14520gaggacgaga catgcgctct cttggggccg 14580aaccccccta ctgcaagcgc acccgacctg 14640ctccacctct ctcacgcccg tctcaggcca 14700atctgggctg gggcacgcag cacactcact 14760cgccgacagt tggcgcgcca ggtaggggcc 14820agctccagat gggcagtctc cagaaacctc 14 880gtctcgagtt catgtccttc aacggcagct 14940acaacgacaa tggcggccga caacccgccc 15000gcgtggcgga agaacaacat tcgagctcgc 15060ggcgaggcaa ccaaggccaa gcgggaggcc 15120tccccagcgc cccgacggaa ggcacgccgg 15180gcgccgtccc cccgcgacac gctgatcccg 15240gaagcctgca ggacgtcgcc ctcgtacctg 15300ctacgtcgct cctcgtcgac caaaaggtac 15360tcggcctcaa cccgccaagc gacctcgctt 15420ccccactggg gtttcgtatg cggtcgcctt 15480ggccctccga gtccgaggaa gatgacgatc 15540gcaaccccag tgccatgcgg gacttcatga 15600ccgacggaag tcgcagcctt gacgatgagg 15660ttgagctggg ggatccctcc gaaggcaacc 15720ctaggcccgt gcctcgcgcc gacatcccgc 15780ggggtcacga cccacagctc gagcgagtcc 15840caggagcgct tgagacgatc cgccgagacg 15900gccggagaaa tacgtcacct gccccagggt 15960gtcaggccgc cgcccgcatc cagcgqqgtt 16020ggtcagaacc tggcagccgc agcgatgctc ctccgcgcga tgccggagcc atcaaccacc 16080gagggtcggc gaatccaggg agagctcaag aatcttctgg aaggcgctgc ggcctgacgg 16140gccgagagca ctgcctcccg aaggtaggga tatccctcgg aacctcatgc cgcgacttcc 16200cgattcatgc gggaagcctc ggtctacacc gggcgcacgc gtaacaccgc gcctgcggcc 16260ccgggccacc tcggcaacga gcaccatcga cgcgaccgtc gggcccacct cgacgaaagg 16320gtgcgccgag gctaccaccc caggcgtggg ggacgctacg acagcgggga ggatcggagt 16380ccctcgcccg aaccacccgg cccgcaggcc ttcagtcggg ccatccgacg ggcgccgttc 16440ccgacccggt tccgaccccc gactactatc gcgaagtact cgggggaaac gagaccggaa 16500ctgtggctcg cggactaccg cctggcctgc caactgggtg gaacggacga cgacaacctc 16560atcatccgta acctccccct gttcctctcc gacactgctc gcgcctggtt ggagcacctg 16620cctccggggc agatctccaa ctgggacgac ttggtccaag ccttcgctgg caatttccag 16680ggcacatacg tgcgcccogg gaattcttgg gaccttcgaa gctgccggca acagccggga 16740gagtctctcc gggactacat ccggcgattc tcgaagcagc gcaccgagct gcccaacatc 16800accgactcgg atgtcatcgg cgcgttcctc gccggcacca cttgccgcga cctggtgagc 16860aagctgggtc gcaagacccc caccagggcg agcgagctga tggacatcgc caccaagttc 16920gcctctggcc aggaggcggt tgaggctatc ttccgaaagg acaagcagcc ccagggccgc 16980ccgtcggaag aggctcccga ggcgtctact ccgcgcggcg ccaagaagaa aggcaagaag 17040aagtcgcaat cgaaacgcgg caccgctgat gcggaccttg tcgccgccgc cgagtacaag 17100aaccctcgga agccccccgg aggtgctaac ctcttcgaca agatgctcaa ggagccgtgc 17160ccctaccatc agggacccat caagcacacc ctcgaggagt gcgtcatgct tcggcgtcac 17220ttccacaggg ccgggccacc cgccgagggt ggcagggctc gcaacgacga caaaaacgaa 17280gatcaccaag caggagagtt ccccgaggtc cgcgactgct tcatgatcta cggtgggcat 17340gcggcgaacg cctcggcttg gcaccacaag caagagcgcc gggaggtctg ctcggtgaag 17400gtggcggcgc cagtctacct agactggtcc gacaagccca tcaccttcga ccaggccgac 174 60caccccgacc acgtgccgag cccggggaaa tacccgctcg tcgtcgaccc cgtcatcggc 17520gacgtcaggc tcaccaaggt cctgatggat gggggcagct gcctcaacat catctatgcc 17580gagaccctca agctcctgcg cgtcgatcag tcctccgtcc gggcaggcgc tgcgccattc 17 640cacgggatcg tccctgggaa gcgcgtccag cccttcggac gactcgacct ccccgtctgc 17700ttcggaacgc cctccaactt ccgaagggag accctgacgt tcgaggtggt cgggttccga 17760ggaacctacc acgcggtact ggggaggcca tgctacgcga agttcatggc cgtccccaac 17820tacacctact tgaagctcaa gatgccgggc cccaacgggg tcatcaccgt cggccccacg 17880tacaaacacg cgttcgaatg cgacgtggag tgcgtggagt acgccgaggc cctcgccgag 17 940tccgaggccc tcatcgccga cctggagaac ctctccaagg aggtgccagc cgtgaagcgt 18 000cacgccggca acttcgagcc agcggagacg gttaaggccg tccctctcga ccccagtggc 18060gacacctccg agcagatccg gattgggtcc gggctcgacc ccaaatagga agcagtgctc 18120gtcgactttc tccgcgcaaa cgccgatgtc tttgcatgga gtccctcgga catgcctggc 18180ataccgaggg atgtcgtcga acactcgctg gatactcgga cctgagtctg atccgtcagg 18240cagcctctgc gcctcggtca tcaaggaagg gtcggccttg cctcggcaga gcccgaccct 18300ccctcggggg ctaaaagggg ggaacccctc tgcgtcgaga ttgggcatac ttctccgcat 18360cgaaaatttt caatcaaaaa aggggcctct tgcgttctcc tggctatgtc agaagcaggg 18420tttcaaggag cgaacatggg tacatgtaaa tggcaaggcc gactgagccg agggactcct 18480gtgcctccgg gttagggata cctcactcat cacctgccac gaagaatgac ccaactcgag 18540aagccaccct attattgaca agctaggacg aacacgcaga tggaaagaaa ggagggtacg 18600acttcatgca agaaagacaa agtgttcagg cctcagcggc cacggtgaga cgcgcatcca 18660acaagaaatt gttcaaacaa gaattaggcg ccgccttggg aaggagccgc gccctcagct 18720tcgtccccgc cgtcggtgag gtccatctcg gcctccggtg atggcgcagg gggaaggatc 18780tccgcctcáa aggtggtcgc cagcaccgtg ctcggacccg cggcgaccgc gtcaagccgc 18840tggacctctg ccagggcagc atcgtcttcg tcaggaagac agtacccctc actaacccgc 18900tccaggtcca cgacgtagtg ggaagcgagc acggcgaagg cccgcctgac gccgtggtgt 18960agcgcctcgc ggactctgcc gcgcgtgtga tcacccaagg ctcgaaggcg gctttgaggg 19020gagcttcctg aagggacgtc gccagagccg aggatacgat aaaagtccga gacggcctcg 19080gacatggccg cgaggtcagc ttccctctgc tcggcagctc cggcaagcgc ctcggcgagc 19140gccttggcgg actcatcaag ggcggactca agctctgcga gcaaccagga gaaatacctc 19200aagcacaagc aaaggaaacg gacaagaaca agaaccaggg aggaccaaga catacctccg 19260gctcggacac gatgctccga ggccgcgacc tgggccgcgg ctaggtcggc cgcgagggtc 19320tcagctcggc tttcggcctc ggcagcccgg ccccgagatt ggtcccgctc ctcgacgacc 19380tgggcgagct ccgatcgctg ccgttgcgcc tccgcacgcg ctgctgccgc ctcggccctc 19440aggtcggcgc agagcagctg gaggtccgct accttggcat cctgctgaga aaggcgcgcg 19500gtagccccgg cgagcgagga cctcagggat cgcagcgagc cctagacgtc gacctcgcgg 19560cggatgaacg acgacttggc ggcgctccgg tctgacagat cctggggaaa ggaaacaggg 19620cgtcacgacg agtgcctcgc tcacagaaggggattttggg gacgtctctg cagaaaacctcctcagcaca ctcgcggagc tcatcccaggagacagggtc cgaggcctcg ccggtccggattcgccacac agcgatgagg ctgtcacccgcttctgaggc cttgggcgcc gacgcatcagctccgacagg gacggcgaca acctcggcgggcgggctcag ggccacgttg gcgtcagccgaagagccggc ctcgggagcc cgcttctcagaagtaccccg cgaaagggtt ggctgaatgaccggcgccgt cttgagggcc ttccggggtgtggatataaa aaaagaggag gaaagaaagaagacgaagac gtcccgggat actcacccacaggtctcttg gatcccggct cccaaggcgggcgccaccct cgccgtggac gcccgggaaggagggtcacc cccatgcgcc accggtgcgacctggccctc cggagccacc tcagctcctcgcccccgtgc ctcggactgg gaccccgacgcgcgcggggg ctggctcgac gactcctggcgggcggccat gtcgtcctcc tcctcatcatgcgacggctc cctcgggagt ccttccctctcccgagcccg cctccgctcg cgggcccgggcctccgcggc gactcgccgc gctgcacggtagggcttgtg ccaccccaca tcctaaaaggcggaacgacc caatgtacga agaaggaaggggtcggggcg catccgaagc tgggagtatgacacccgcca ttggagggcg ttgaagggaaagtcagcctc tggggtcatc tcctagagcgtccgacggtg gatggcagcg atcactcccgtcagggcctg gagaaggggc tcgaggttctaggcgtcggt ggcagcagta actactctcttccggaggta gaaccaccgg cgctgccacctgtactgtga cgcccgcgac tgcctcagcacacggaccct cctctcctcc gtcgacaagggcaaatccca atggggggcg atccccaagtcctgcgagat ggagttgggg gagaggttatctcgcataaa gcggcccgtc ggcacaccgacgacgtaccc cagcggtggg gacggagcgggctgcttatc ggtgaggggg cggagcaaacctgtcaccgt ggaaaaaggc cacggatcactcaccaaaat ggaagagatg gcggcgcggggactaaagtt tcccgggttg cgaaaacctacgtcaccgga ccccctctcg agtatatgaacccggaccgg acgcgggatt cgaaaaacgcgcgcacgcgc aacggccgcc ccgccaaccaacaggcggcg cctctggcag gagaagcggatcaaaaaagg tacgccacgt cgttcgattttgcaacaggg accgggaaag ggggatacccggctccgagc ccccctactg atcagaggtttcgcctcaga tcgcgtgggc ccgacacccaccgaagggct ccatggccgc ctcaggctacttcgaaggct ggcccccgaa gggttcacagggggtacgtt cgatacataa ccgaggctcgtccgagacca gcgggaacga tcttgtaacgcggaccccgt cgccagggga ccgggtccggctctgggccc ctagccgacc cccaacgaacttgcagctca ccggagacac catgttcggtcctcctcctt gcggaaaggc gacgtaggggtcgtcctctc gccctgtgca gaggctcgggaccgttgaca gcgtcaacat accagcccgaacggccagtt cgcatgaggg aacaaccaga

aaaaaggtat gcctgaaacc gctacctgga 19680ccagcgatga ccggagcgac cccaccgttg 19740actggtcctc ctgctcatcg tcgagaacga 19800atcggagcaa cgggcgccgg gcctcggggc 19860gctggacgga tcgcgcgtcc acgcccacct 19920ccatcccgac actggcggca actggtcgct 19980tggcgggcgc cggcatggcc ggcacgacag 20040cctcctcaac cacgatggcc gcctcggcag 20100agaccggcga cgcccgagcc ccctgcggtg 20160caaggcccgg ggcggcgctg gccacacagt 20220ccaggtcggt ctggccatga ctttgcttgc 20280tcacggccga gacatatgaa tgggaagcca 20340ttcgggccat tatccaccgc gcctgggggg 20400ccgccgaggt ccgcttcgcc ggcattttcg 20460aagattgccc gggcgcggtt gcgacgacct 20520gcggcggccc ctcgggagcg gacgccctga 20580cggccgaggg aacaggtgac acctcgggtc 20640ccccaactcc ggggactgat ggtgtcggcc 20700cgcaccccga gccggggccg aggccgagac 20760cgtcgtcatc gtcgtcgtcg ggcgtctccg 20820cctgctggcg acggcgcttc tccaaggcgt 20880ccttctccgc gtccttcttt ttcttcttct 20940ccaccgcatc ctccgggacc cgtggcaggg 21000aggggagaaa ggaacccgat cataaggacc 21060agcgaacact caccaaagtt acgcacccct 21120cgtgggggtc cggcttcccc atcgcagccg 21180gaggatcagg ggacattcgc gagccctccc 21240acagccgccg ctccgccaat ggaagcaccc 21300cagcggtgag tcccccctcc cgcaactcct 21360tctgtctctc gtgcggggtc ctgtggcgcc 21420gggagaacgg tgggagcaac tcaccgtcat 21480ccttgttcga ggacgcaaga atggcaggaa 21540aaagagtgca gccgccggcc cgcaccgctg 21600cgaaaagctc ggcgaggaag agatgagtcc 21660acccttcgca taccgctacg aagatagcgg 21720gcaattccac cccgtagtgg aacaggatag 21780atccccgctc gtggaaggag acgaagctca 21840ctccacccac gggaggaatc cactctggcc 21900cctcgccgac cagctcctcc agatcgctcg 21960gcggggggat tatggtcact cgatccgcca 22020gggcagggag ggcggttttt tctcttctcc 22080aagggaaagg aaggaagaag agcaaagaac 22140ggccagggcg aaaccgtttc cagcgctcca 22200gaggcgaaac agccgttcct cgaacggctc 22260ctcgccccgt cgcattaact ccgcggcggg 22320cgacgcttcg ccttcgccgt aataaccgcg 22380cgtatccttt tttcctcttt ctctatctct 22440cgaaaaggat ccttctctgt gaaggaaccg 22500cgaaggctgg ccctccgagg ggttcaacag 22560ctactggtca ggggttcgaa ggccggcccc 22620tcgggctccg cacccattac tgatcagggg 22680tcgcctcaga cgccgagcga gggatgacca 22740ggctgcgctc ccgaggtacc ctaggacatt 22800gaatcccatc ggagggaggc atcgagccct 22860caaatcaccc gcaggtactt ttgggcgtgc 22920ggggcacgga cgtccactcg gattacccgc 22980gcccatcgag ggtaacatgg cgctctcccc 23040cgtatgtaaa aaagccgagt ctgtccctga 23100ggctgctctc gcaaacccgg ctccggccaa 23160gagcttgggc cctgaccgtg cacccgggct 23220ccagccgaag cattacgcaa ggcattaaga 23280cctcgaagga gtgtaaccac tcctccgagg cctcgggggc tacacccggc gggtgcgctc 23340gcgcgcaccc accggaacaa aatgcaaccg agaaaggctg gtccccttgc aaaaaagtgc 23400gacgaaagcc tccaagcgag tgctaacact cccttcgagg ctcgggggct actgtcgggg 23460accataatta ggggtaccct caagacgcct aattctcagc tggtaacccc catcagcata 23520aagctgcaaa ggcctgatgg gtacgattaa gtcagggatc agtccacacg agtgactcga 23580tcacgcttcg cccgagccta gcctcagcca agggcagccg acctcgagag acttccgtct 23640cggccgaggc ccccctttgt aacggcggac acacctccgg ctcgcccgag gccctggctt 23700tgcttagaag caaccctgac taaatcgccg tgccgactga ccaggttgca ggagcattta 23760acgcaaaggt ggtctgacac ctttatcctg acacgcgccc cccggcagag ccgaagtgac 23820cgccgtcact ccaccgctct actgaccagt ctgacagaag gacagcgccg tctgcgccac 23880tccgactgca gtgccactcg acagagtgag tctgacaggc agtcaggcct taccaaaggc 23940gccataggga actccgctcc gcccgacccc agggctcgga ctcgggctat gacccggaag 24000acggcgaact ccgctccgcc cgacccaggg ctcggactcg ggctaagacc cggaagacgg 24060cgaactccgc tccgcccgac cccagggctc ggactcgggc taagacccgg aagacggcga 24120actccgctcc gcccgacccc agggctcgga ctcgggctaa gacccggaag acggcgaact 24180ccgctccgcc cgaccccagg gctcggactc gggctaagac ccggaagacg gcgaactccg 24240ctccgcccga cccagggctc ggactcgggc tcagccccag aagacgacga aactccgcct 24300cgcccgaccc agggctcgga ctccgccctg gcctcggccg aatgacctcc gcctcgcccg 24360acccagggct cggactcggg ctaagacccg gaagacggcg aactccgctc cgcccgaccc 24420cagggctcgg actcgggcta agacccggaa gacggcgaac tccgctccgc ccgacccatg 24480gctcggactc gggcttagcc ccagaagacg acgaaactcc gcctcgcccg acccagggct 24540cggactccgc cctggcctcg gccgaacgac ctccgcctcg cccgacccaa tggctcggcc 24600tcggcctcgg caacagaaga cagactcaac ctcggcttcg gaggagcccc cacgtcgccc 24660gacctagggc gcaggcccgc cacgtcaaca aggagcgcca tcatcatcct accccgagcc 24720gactcgggtc acggagaaca agaccggcgt cccatctggc cagctccgcc agatggacaa 24780tgatggcgcc ccacaagctc tgtgacgacg gcggctctca gctctcttac ggaagcaggg 24840cgacgtcagc aaggactcga ccgctccaac agctgtccct ccgccaggct ccgtcgctcc 24900tccgacagcc acgacatcac gccagcaagg tgccaagacc tctccggctg ccacattggc 24960atgtacctag ggcgctagct ctctctccgc tagacacgta gcactctgct acacccccca 25020ttgtacacct ggatcctctc cttacgacta taaaaggaag gaccagggcc ttcttagagg 25080aggttggccg cgcggggacg aggacgagac atgcgctctc ttggggccgc tcgcttccct 25140cacccgcgtg gacgcttgta acccccctac tgcaagcgca cccgacctgg gcgcgggacg 25200aacacgaagg ctgcgggatc tccacctctc tcacgcccgt ctccggccac ctcgcctctc 25260cccccttcgc gctcgcccac acgctcgacc catctgggct ggggcacgca gcacactcac 25320tcgtcggctc ggggaccccc cggtctcgaa acgccgacag aaaataaggc catattttcg 25380gcggctaggg tctagccgcc gaaagtagct tattttcggc ggccacaagt cagtcgccga 25440aaattacctg ttcttttcgg tgggcctctg acggccgccg aaaataacaa gtgccgaaaa 25500tagtatttaa aaatacaaaa aataacagaa aattcataca ataacagaaa attcatactt 25560gagtccacaa cataaaactt aagtccatac aaacataaag tccacaaata gtccatacaa 25620acataaagtc cacaaatagt ccattacaaa gcacaatgcc gcacaaagct aactccatca 25680catatcgggg tcgttggagt tgtgtccact accttcagaa gcgaaaaact cgttgacgaa 25740gtcgtgtaac gggtttagat tctaaagaaa aaagaagaca ttaataacga tattagttac 25800atgtatgacc actattcaaa caaattgttt ctcaaactaa cctctcatgg agtagctccc 25860tcccctgcat atgctcctcc tggtgctggt atgagcggtg gtggcgtgtt gtggcccatg 25920accccggatc cctacaaaat caagtttagt aaagatttga aattagattg atacaaacga 25980caagtcttaa ctaaattgaa gcacctgagg tggaggtggc ggagcatgta atccccactg 26040aggcatcgac ggctgaaact gagggaaaac aaatggttgt tgttgtgcct gctgtggaaa 26100ccaagaccgt tgcaaatata atatgttagt tatagaacca atatcgagcg tgttgagaag 26160aaataagaca ctcacgttca ttgcttgttg ggcctgtgcg ttgtaagcag ccatgtactc 26220tgattgctct ttgaggaatg ccatttgttg ttgccgcagc tcttcacgaa actttttttg 26280ctactccctc atagcctcct ccatgctaga tacagagcgg caactacgcc tgctactaca 26340acaacccgcc tgcgcgcggg cggtcggcgg cgcgcaggcg tgggcggcgg acagcgcgcg 26400ggcgtgggtg gctgatttgg gagaggagag agagagagga aaaacaaaga agaagaaggg 26460cgtcggtttt aaaaagacta ttttcggcgg ccccctggca cagccgccga aaatagcgtt 26520actttcggtg gccctctgac acagccgccg aaagtagcct tatttccggc ggctgtgtga 26580gaggccaccg aaaatagcct tatttccggc ggttgtggca ggccgccaaa aatagcagat 26640aattttcggc ggctataggt gggccatcga aaattacatt ggccgccgaa aatgttcaac 26700agtgttgttg tgatagcaac caacaggtat gagccacaat actacacatt gcaacttggg 26760aaagtaattt actggtcacc atatttccga atagctggtt atgatatgat atttacaaat 26820cttccaattc attccttcag cttaaatgaa tctcattaat tcatctagga aacatctggg 26880ctgaaacgtc agaacaacag tgttttctac tgttaacatg atccgtttat cttgtaaaaa 26940acaaggtttt gtaaatggat ttatttttat gctcaaactt aaattqaaca attcaatcac 27000gcacaattgc tatgctgaca gaagtttatg acaagtttga gcataatgtt gtaataataa 27060tgagaccctt catgatcttg ttgttattcc acatttccat ctctcctcga agcatagcag 27120tgcccaccat tttctaccga gtcagcaaca ataatctagg ctgaaagaac aatggacaac 27180agcttcgtgt gttgtccatc tagtagtcct ttgaataaca gtataatatg cttatgagaa 27240tcaatattat tttcatggca cacttgtttt tttcatgaat agtttcattt ttgtagataa 27300ttttcagttc tctgtcacag gtacaatatt tgcctatggt gttacaagga gtggaaagat 27360acatacgatg catgtgggaa aacttattac aatatttttc ctttaataag ttttaccttt 27420gtagagtgta tgtttctagt cataggcttt gaagtatgcc tcatgctacc aattaacatg 27480caaaaacttg gactaatctt actgatacta agatctaaca tagttgtcaa cctccttggt 27540tggacatttt agttgctttt gttgtattaa gcttttaatt ctctacaggc tgaggatgat 27600gatggcactg atcttttcgg gacgaaaccg aagaggacaa gaaggctgct gatgagcatg 27660tccctaccaa ggtctcttat agaaagtctc tttatcgaag aggacaagaa gtgctaacct 27720acattatttc agttaggggc atgcctttga gaagtctctt tacaatgcaa cgggcaaaat 27780gcccccgaag caaccctagg gatgatgccg gatccaagtg agacagggca tatagtggga 27840ggggaagcaa tgggggcata cctgacgacg ttagagagaa agagggcgag gactttggcg 27900acgaagccgg gtagcaggtt gacaatatta atgtacttga cgcagagact cgagacgggt 27960gcgacgtcgt agctgtgcag tgcctcaacg atctccaccg gcttcatcag cgggaaggag 28020agctcgccct cccctccgtc gcaggcacca caggtaaact gctgcattga cgacttcctg 28080gcgatggctt cctctgtcac tcaaagccgc ggccgccgcg cgctcggcgc atatccttgg 28140ccgggctggt gtgaggaggt ctaggatggt ggccgggttc cgtcgtacga tctcattccc 28200aacgcctagg tcctcgacgc cgccaacggg aggcgcgggg cccagcgctg ccaacaagta 28260tggggcctac cgcgcgtggt tgatgagcct gccatgccgg ttccacctgc gggagctggt 28320aggccgcctt gcgtcgaaag cctccgtgga ggccatgacc gagggtgcgg catggcgggg 28380ccgcgtggtc ttgtcactct ccgagctgct gcaccagccg ctgcgccggc tcggcccgtc 28440cctgtagggt cgcgtcgtcg ggcggggggg gattggattt gtggtggggt gcgtgggcgg 28500gcatcacgcg tggcgatggc actggaagca cggggaacag ggcaggtgta gggtgggggc 28560aggcgatgga atggcgcggc atgcttgcgg ccgattgtcc ttgcgtggat ggaggggatt 28620gcgggctcga ggatgaggat ggcgggatgc gcgcgccttt cgtcgatcga acgtgggcac 28680gggacgagga ttgcattgcg cggccacgcg ggggcgagat tggcgtcgtc ggtgggatgt 28740aggcttcgat gactgtcagc ggggtgggac gtgaatcacg ggggcgaaac aattgctatt 28800ttagcccttc taacgtgggc tctctgctat tatgtgaccc tctgtctatg acttgtgtga 28860ccatttgtgt ctatgatttg tgggactggt ggtaaaatag agaagttcac aactgagagt 28920gacaaaatag caaattctcc cacgggggcg ggggcacgac gcaccagtgt ggacgtccac 28980actatagcct tatagagtag tggagattat tttttttaat taaactatac ttaatatttc 29040tacttaacat aatatttgat gtaacatgga cgactaaact tttccctcaa gccggtatta 29100caaggacaco gggacacgtg ctgtgcggtg acaaaactgt cggggaccat aattaggggt 29160accctcaaga cgcctaattc tcagctggta acccccatca gcataaagct gcaaaggcct 29220gatgggcacg attaagtcag ggatcagtcc acacgagtga ctcgatcgcg cttcacccga 29280gcctagcctc ggccgaaggc agccgacctc gagagacttc cgtctcgccc gaggcccccc 29340tttttatggc ggacacatca ccggcttgcc caaggccttg gcttcgctca gaagcaacct 29400tgactaaatc accacaccga ctgaccaaat tgcaggggca tttaacgcaa aggtggcctg 29460acacctctat cctgacacgc gcccccggca gagccgaggt gaccgccgtc actccaccgc 29520tccactggcc agtctgacag aaggacagcg ccgcctgcgc cactccgact gcagtgccac 29580tcgacagagt gagtctgaca ggcaactagg ccttgccgaa ggcgccacgg cgaactccgc 29640tccgcccgac cccagggctc ggactcgggc taagacccgg aagacggcga actccgctcc 29700gcccgacccc agggctcgga ctcgggctaa gacccggaag acggcgaact ccgctccgcc 29760cgaccccagg gctcggactc gggctaagac ccggaagacg gcgaactccg ctccgcccga 29820ccccagggct cggactcggg ctaagacccg gaagacggcg aactccgctc cgcccgaccc 29880cagggctcgg actcgggcta agacccggaa gacggcgaac tccgctccgc ccgaccccag 29940ggctcagact caggctaaga cccggaagac gacgaaactc cgcctcgccc gaccccaggg 30000ctcggactcc gccctggcct cggccggacg acttctgcct cgcccgaccc cctggctcgg 30060gctcggccac ggcaactgaa ggcaagactc aacctcggct tcggaggaaa ccccacgtcg 30120ccctgcctag agcacagacc gccacgtcaa taggaaacgt catcatcacc ctaccccgaa 30180tcgactcggg tcacggagaa caagaccggc gtctcgtccg gccagctccg ctagaggggc 30240aatgatggcg ctccacgagc tctatgacga cggcggcccc cagctctctt acggcagcag 30300gacaacgtca gcagggactc gaccgctcca acagctgtcc ctccatcagg ctccgccgca 30360ccaccgatag ccacgacatc acgccagcag gatgcccaga tctctccggc tgccacatcg 30420tcatgtacct agggcactag ctctccctcc gctagacacg tagcactctg ctacatcccc 30480attgtacacc tgggtcctct ccttacgact ataaaaggaa ggaccagggc cttctcagag 30540aaggttggcc gcgcgggacc gaggacgggà caggcgctct cttggggccg ctcgcttccc 30600tcacccgcgt ggacgcttgt aaccccccta ctgcaagcgc acctgacctg ggcgcgggac 30660gaacacgaag gccgcgggac ttccacctct ctcacgctcg gctccggccg cctcgcctct 30720cccccctccg cgctcgccca cgcgctcgac ccatctgggc tggggcacgc agcacactca 30780ctcgtcggct tagggacccc cctgtctcga aacgccgaca gttggcgcgc caggtagggg 30840cacgctgcgt gctgacgaat agctccccgt caagctccag atgggcagtc tccagcaacc 30900tctccggccc gggacggtgc ttcgtttcgg ggctctcgag ttcatgtcct tcgacggcag 30960ctacgacatg atacttcttc caccgccgtg cgaccacgac aatggcggcc gacaacccgc 31020ccgccggcgg cggaatcgac gacgtctacc ccgcgtggtg gaaaagcaac attcgggctc 31080gctccgttct ctcccccgcc aacggaggag gaggcggggc cgtcaaggcc agacgggaga 31140ccgcgcttcg ccggccgtcg agcgaatcga cgcccccgac gccccgacgg aaggcacgcc 31200ggacaccgac ctcgcgttca agacggaggc aagcgccgtc cccccgcggc acgacgaccc 31260cgagcaagaa gacgacgccg gcgcgctcgc ggaaagcctg caggacgtcg ccctcgaacc 31320agagatgacg gcgcaaccag tccccgatgt gactacgtcg ctcctcgtcg accaaaaggt 31380aacgactaac tcccatcttg cgtcatttcg actcggcctc aacccgccaa acgacctcgt 31440tttggcgggc gccctcattg aggcgagtgc aaccccactg aggttctgta tgcgatcgcc 31500ttgggaccga ctgacggacg tctcgaccta cgggccctct gggtccgagg aagatgacga 31560ccccagcatc ggttgggatt tctccggact tggcaacccc agtgtcgtgc cggacttcat 31620ggccgcatgt gactactgtc tgtccgactg ttccgatgca agccgcagcc ttggcgacga 31680gagctgcggc ccaagccgcg aatgtttcca catcgagcta gggaatccca ccgaaggcaa 31740ccatcttggc atgccggagg atggtgatct ccctaggccg gtgcctcgcg ccgacatccc 31800acgggagcta gctgtggtcc ccgctccggc ggggggttac gacccacaac tcgagcaagt 31860ccgcgaggcg caggccaggc tcaacgaggg aacgggagcg cttgagccga tccgtcggga 31920cgtcggacag gcatgggtgg gccaacccct ggccggagaa atacgtcatc tgccccaagg 31980tctccagcac cgcgtcgcca acgacatcag gatcaggccg ccgcccgcat ccagcggggt 32040cggtcagaac ctggcaaccg cagcaatgct catccgcgcg atgccggagc cgtcaaccac 32100cgagggtcgg cggatccagg gagaactcaa gaatctcctg gaaggcgccg cggcccggcg 32160ggccgagagc actgcatccc gaaggcaagg atatccctcg gaacctcatg ccgcgacttc 32220ccgattcatg cgggaagcct cggtctacac cgggcgcacg cgcaacaccg cgcctgcggc 32280cccgggccac ctcggcaacg agcaccatcg acacgaccgt cgggctcacc tcgacgaaag 32340ggtgcgccga ggctatcacc ccaggcgtgg gggacgttac gacagcgggg aggatcggag 32400tccttcgccc gaaccacccg gtccgcaggc tttcagtcgg gccatccgac gggcgccatt 32460cccgacccgg ttccgacccc cgactactat cgtaaagtac tcgggggaaa cgagaccgga 32520gctgtggctc gcggactacc gccttgcctg ccaactgggt ggaacggacg acgacaacct 32580catcatccgc aacctccccc tgttcctctc cgacactgct cgtgcctggt tggagcacct 32640gcctccgggg cagatttcca actgggacga cttggtccaa gccttcgctg gcaatttcca 32700gggcacatac gtgcgccccg ggaattcctg ggaccttcga agctgccggc aacagccggg 32760ggagtcgctc cgggactaca tccagcgatt ctcgaagcag cacaccgagc tgcccaacat 32820caccgactcg gatgtcatcg gcgcgttcct cgccggcacc acttgccgcg acctggtgag 32880caagctgggt cgcaaaaccc ccaccagggc cagcgagctg atggacatcg ccaccaagtt 32940cgcctccggc caggaggcgg tcgaggctat cttccgaaag gacaagcagc cccagggccg 33000cccgtcggaa gaagctcccg agacgtctgc tccgcgcggc gccaagaaga aaggcaagaa 33060gaagtcgcaa tcgaaacgcg acgccgccga cgcggacctt gtcgccgccg ccgagtataa 33120gaaccctcgg aagcccccca gaggtgcaaa cctcttcgac aagatgctca aggagccgtg 33180cccctaccat cagaggcccg tcaagcacac cctcgaggag tgcgttatgc ttcggcgtca 33240tttccacagg gccgggccac ccgccgaggg tggcagggcc cacgacgaca acaagaacga 33300agaataccca gcaggggggt tccccgaggt ccgcgactgc ttcatgatct acggagggca 33360tgcggcgaat gcctcggctc ggcaccgcaa gcaagagcgc cgggaggtct gctcgttgaa 33420ggtggcggcg ccagtctaoc tagactggtc cgacaagccc atcactttcg accgagccga 33480ccaccccgac catgtgccga gcccggggaa atacccgctc gtcgtcgacc ccgttgtcgg 33540cgatgtcagg ctcaccaagg tcctgatgga cgggggcagc tgcctcaaca tcatctacgc 33600cgagaccctc aagctcctgc gcgtcgatcc gtccaccgtc cgagcaggcg ctgcgccctt 33660ccacgggatc atccctggga agcgcgtcca gcccctcggg cgactcgacc tcccagtctg 33720cttcgggaca ccctccaact tccgaaggaa gaccctgacg ttcgaagtgg tcgggttccg 33780aggaacctac cacgccgtgt tagggaggcc atgctacgcg aagttcatgg ccgtccccaa 33840ctacacctac ctgaagctca agatgccggg ccccaacggg gtcatcaccg tcggccccac 33900gtacaaacac gcgttcgaat gcgacgtgga gtgcgtggag tacgccgagg ccctcgccga 33960gtccgaggcc ctcatcgccg acctggagaa cctctccaag gaggtcccag acgtgaagcg 34020ccatgccggc aacttcgagc cagcggagac ggtcaaggcc gtccccctcg accccagcgg 34080cgacaccacc aagcagatcc ggatcggttc cgggctcgac cccaaatagg aagcagtgct 34140cgtcgacttt ctccgcgcaa acgccgacgt ctttgcgtgg agtccctcgg acatgcccgg 34200cataccgagg gatgtcgccg agcactcgct ggatattcgg gccggagccc gacccgtcag 34260acagcctctg cgccgattcg acgaggagaa gcgcagagcg attggcgaag agatccacaa 34320gctaatggcg gcagggttca tcaaagaggtgcttgtgagg aagaaagggg ggaaatggcgagcatgtccg aaggttccct accctctgcctgggtgcgaa accctgtcct tcctcgatgcagagtccgac cagctcgcga cctctttcatcatgccgttc ggcctgagga atgcaggcgccggcgaacac atcggtcgca cagtcgaggcgaaggctccc aacctcctct ccgaccttgaagtcaagctt aatcctgaga agtgtgtcttcatcgtctct gagcgaggca tcgaggccaaggggcccatc aaggacttaa aaggggtacaccgcttcatc tcacgcctcg gcgaaagaggcgagtgtttc gtttggaccc ctgaggccgatacaaaggcg ccagtcttgg tgccgccggccgcgaccact caggtggtta gcgccgcgatattgcccgtt cagaggccgg tttacttcatctacccacaa gttcaaaagc tgctgtatgcctacttcgag tcccatccgg tgactgtggtgtgccgagag gcctcgggca ggatcgcaaactcgttcgcc cctcggaagg ccatcaagtcggtcgacacc caactaccaa cgactccgatcgggtcgctg atgaagacgg gggccggtgcgcacttgcgc tacgtgctgc gcctccacttagctctggtc aacggattgc ggatcgccattggtgattcg cagctcgtca tcgaccaagtgatggaggcc tactgcgacg aggttcggcgcaaccatatc gctcggcgct acaacgaaacgcgaacgaca gtccccccgg acgtcttctccgacgacgcg cccgagcccg aggtatcctccgaggtaccc tcggttcagc ccgaggcacccgagggcagg gcattgaacg tcgaggaagggcaggccccg tacctgcaat atctccgtcgtcggcgggta gcgcgacgcg ccaagtcattccatcgcagc ccctcgggca tcctccagcggctgcaagaa gtacactcgg gggcttgcggaaatgctttc cggcaaggct tctactggccccgcacctgc gaagggtgcc aattctatgcgcagacaata cccatcacct ggcccttcgcgcaaaaggcg cccgggggct acacgcacctgatcgaggtc cgacctctga acagcatcagcatcatccat cgcttcgggg tcccgaactccggcaaaaaa ttcttggatt tttgcgaggaggctcatccc atgtcgaatg ggcaagtagacaagcctcgg atctacaacg acctcaacaactcggtggtc tggagcctaa ggacgacgcccctggtctat ggggctgaag ctatcctgccgagggcctac accgagcaaa gcaaccaagcggaagctcgg gacagggcct tactacactcccacgcccga ggggtccggt cccgagaactacaagacgcc cgagggaggc acaagctcaccaaagttctg aagcccggaa catacaagctcgcttggaac atcaaacagc tacgtcgcttatacctcgca cctacgcaaa gtttagttgtcccgaccctc cctcgggggc taaaaggggggaaaaaggac ctctttttag caggatttctatcctggaaa cgacgaggta cacgtaagcacgcctccggg atacggatac ctcactcgtctaaagcgact ccgtggaccg aacgagtcatccttcaagct ttctcgacta aatcggggacaagcggcaag gccgaccgag ccgagggattcgtcccttcc gcgaaaagca actctcgctc

attccatccc aaatggcttg ccaaccctgt 3438Cgatgtgtgta gactacactg gtctcaacaa 3444Ctcgcatcgac caaatcgtgg attccactgc 3450Cctactcgggg tatcaccaga tccggatgaa 34560cacgccgttc ggcatgtact gctacgtcac 34620gacgtaccag cggtgcatga accatgtgtt 34680ctacgtcgat gacatcgtag tcaagacacg 34740agtgacattc cggtgtctca aggcgaaagg 34800cggggtgccc cgaggcatgc tcctagggtt 34860cccggagaag atcgcggcca tcaccagcat 34920gagggtcatg ggatgcctcg cggccctgag 34980tctgcccctg taccgccttt taaggaaagc 35040ggaagccctc ggcaacctaa aggcgctcct 35100ggacggagaa accctcttgg tctacgtcgc 35160tgtggtcgaa aggcaggagg aagggcatac 35220cagcgaagtg ctgtccgaga ctaagatccg 35280tgtgatcctg acgaggcgga agctacgaca 35340gtcatccttc cccctggggg agatcatcca 35400gtgggcagtg gagatcatgg gcgaaacgat 35460ccaagtgttg gcggatttcg tggctgaatg 35520ccaaccggag ctctggacca tgtttttcga 35580gggcctgctc ttcatctcgc ccctcggaaa 35640cccggcgtcc aacaatgtgg ccgagtacga 35700cgagctaggg gtcagacgcc tcgacgcccg 35760catgaagaac tcccactgcc gcgacccgaa 35820cctggaagac aagttcttcg ggctcgagct 35880cgcagacgag ctggcgaaga tagcctcggg 35940ccgggatctg catcaaccct ccgtcaagct 36000ggctcagccc gaggtaccct cggctcagcc 36060ctcggcccag cccgaggtac tctcggcccc 36120gcagagcggg gccacgccag accaggattg 36180aggagagcta cccctcgacc aagtcgaggc 36240cgtcttgctg ggcgacgaag aggagctcta 36300atgcatctcc atcgccgaag gtcgggaact 36360ccaccacgca gcaccccgag cccttgttgg 36420aacggcggtg gctgacgcca ctagaattgt 36480gaagcggaca cacctgcccg ctcaggctct 36540tgtatggggt ctggacctcg tcggtccctt 36600gctggtcgcc atcgacaaat tctccaagtg 36660gtccgagcag gcggtggcat tcttcaccaa 36720catcatcacc gacaacggca cccagttcac 36780tcatcatatc cgggtggact gggccgccgt 36840gcgtgccaac ggcatgattc tacaagggct 36900gttcggcagg cgatggatga aggaactccc 36960gagtcgtgcc acgggcttca cgccgttttt 37020cactgacctg gaatacggct ccccaagggc 37080cagccgagag gaatcgctgg accagttgga 37140ggcgcggtac caacagtccc tgcgacgtta 37200ccaggtgggc gacctggtgc ttcggctgcg 37260gcccccctgg aaagggccgt tcgtcatcgc 37320ggccaacaat caaggcgaga tctacggcaa 37380ctacccttaa gatgttttca agttgttcac 37440caaggaaggg tcggcctagc ctcggcaaag 37500gagaccccct ctgcgtcgaa ttttttcctc 37560tccgtgcttc ttgactactt tggaaagcgg 37620gccaaggctg accaagccga gggactccta 37680cccttctgcg ataagtaact tgcgctcgga 37740cacgttcgga agctctcctg ccgaagcagt 37800agggcctcat ggacgggtga aagtacgcgt 37860cccacgcctc tgggatacgg atacctcact 37920acacaaacat ccctattacc gacagagtcc 37980agatgctcga aacaagagga aaaaaggacgttctggcctc ggcggccgca gaaagcgcacggtcttcacg ccgaagggag ccgtagcacccgacccagcc tcgggcggcg ccgaggtccagcggctcaac cggttacccc tggggcctcgtccaaggcct cgactgaccg acttgggcgttccggccaac caggttcccc attctcgagctacccccggc ctcgatccac caaagggcgggcctcacgta acaaggccga acgggccgagtcacccgtca ccttgacacg gggcaactcaaggcgagact tagtgctcgg aaatgaggaaatgttcaggc ctcgacagcc acaatgaacgacggaactcc ggttccccct ccgcaggtaccggagcaacg gaagaccgac gaacggcgcggcgacttctg ctccgggggg ccgaacagcgtcaggaggcc cccgcccgtg ccaaaactcggatggaggtc agcccgtggc cggtcccggctgccgtggca gacgccgacg ccgcaaggggcacgctgcag ctgccggacg ccacgggcaaggagcgggcc accgcccacg caggggctgattggtgatga aaatccttga ggctgaggaaccccaccatc aagctggagg tcgccatctcgctgcgtggt gaaaatcctt gaagccgaacttgcgttcct ccaacgagga ggcggaaaggagacgggaag acccggcgct taagggaggatccctccttt taaaggcaac tcccctacgttccaacacgc tccaaggccc tcccctgcgagccggctcag ggcagaagaa gccaaaccgctacaggcgac cccccatttc cgcccagaccgcggcatgca accgcgccag atggacgcgccccaggccca cgcgtcgagc aactggcacgcacttgtgcc accgtcgcgc ctcttcggttcaacagcgcc agactggcgc gtcggtcaaagtggcaggcg ggcgggcgca gcggtcacgtcagcaagaga gcctcctctc acggcgtgaaggatcacccg cgcgcaacgg ccgccccgccgcgggacacg cggcgcttct ggcaggaggaccgcgtcaga aaaggtacgc cacgtcgtctctctatctct tgcatcaggg accggggaaggaaggaaccg ggctccgcgc cccccattacgggttcaaca gccgcctcag atcgcgtgggaggccggccc tccgaagggc tccacggccgctgatcaggg gttcgaaggc tggcccccgaagggatgacc aggggtacgt tcgatacatacctaggacat atccgagacc agcgggaacgcatcgagccc tcggaccccg tcgccaggggtttgggcgtg cctctgggcc cctagccgacggattacccg cttgcagctc accggagacagcgcactccc ccctcctcct tgcggaaaggctgtccctga tcgtcctctc gccctgtgcagctccggcca aatcgttgac agcgtcaacagcacccgggc tacggccagt tcgcatgaggaagtattaag acctcgaagg agtgtaacca=gggtgcgct cgcgcgcacc caccggaacgcaaaaaagtg cgacaaaagc ctccaagcgatactgtcggg gaccataatt aggggtacccccatcagcat aaagctgcaa aggcctgatggagtgactcg atcgcgcttc acccgagcctgacttccgtc tcgcctgagg ccccccttttgccttggctt cgctcagaag caaccttgacggggcattta acgcaaaggt ggcctgacac

cagcttcgca agcgcggcga gggcgtgttc 38040gctacaagat gatctgatcc tgcaggctcg 38100ctcggcatcg acgacgtcta cagcaaagcc 38160ggggctcctc caggaatccg gcccgagcag 38220ggcaaccggc ttccaagggc gctagcccga 38280cggcaccgct gacgggcgac acggctaggc 38340caactccgcc tctgttcaca ctgatatcgc 38400ccgaggggtc ccttcaacta agctagaaga 38460ggattcctac gcctccggga tacggatacc 38520tgcttggtaa agcggtttag ataataaaac 38580aaaacacggc tccgtgccaa aattacatac 38640aactcactgg cattcgaagt gccattacaa 38700gaacaacccc actccgaggg ggaaggcctg 38760ccgtcacctg ctccagcagt ggcgacgacg 38820gcaacgctga cctcagggtg gatgccgctg 38880tgaggcaagg acgggcagaa ggccgtagaa 38940cgccgcgccg gcggaagaac ctcttccggc 39000ccccgaagcc actcgcggct gaagaacagg 39060tgcccgcttc tccccccatc actgagtgaa 39120ccccaactcg gcactctccc ctccccagcc 39180ggggcagagg ccacagcccg gctcgctttc 39240gggtgaccgc cggtgaaggg gtgcgaccgg 39300gatggctgag aggtaccaac tcccatggag 39360cggcggatat cccccatccg ggggcttgga 39420agaagacatg gtcgccttac gaaaggagcc 39480gcgcccccag gcgccgcggg ccgagtcttc 39540ctcgggggct gggtcccgca tgtcatgcaa 39600cgcgcatggt gcgcacgacc gtccagcggt 39660aacaggcaga aggggcgagc agccatgcag 39720ttctccaact tctgacacgc cagcctgggg 39780ccagttgctg catgcaagca accgcaccgc 39840gcgaagccta tgccacgact cgaggcgacc 39900gcgaccgaaa gtgggccggc agtaatagcg 39960cgtcagccag gctcacgtcc catcctgaga 40020gacggtgcac ccgtgacccg ttcctcgaac 40080aaccactcgc cccgtcgcat taactccgcg 40140gcgcgcgacg cttcacctcc gccttaataa 40200gatttcgtat ccttttccat tttcctcttt 40260ggggataccc cgagagggat ccttctccgc 4032Ctgatcagggg ttcgaaggct ggccccccga 4038Ccccgacaccc actactggtc aggggttcga 4044Ccctcaggcta ctcgggctcc gcgcccatta 40500agggttcaca gtcgcctcag acaccgagcg 40560accgaggctc gggctgcgct cccgaggtac 40620atcttgtaac ggaatcccat cggagggagg 40680accgggtccg gcaagtcacc cgcatgtact 40740ccccaacgaa cggggcacgg acgtccactc 40800ccatgttcgg tgcccatcga gggtaacatg 40860cgacgtaggg gcgtatgtaa aaagccgagt 40920gaggctcggg ggctgctctc gcaaaaaccg 40980taccagcccg agagcttggg ccccgaccgt 41040gaacgaccag accagccgaa gcgctaagcg 41100ctcctccgag gcctcggggg ctacacccgg 41160aaatgcaacc gagaaaggct ggtccccttg 41220gtgctaacac tcccttcgag gctcgggggc 41280tcaagacgcc taattctcag ctggtaaccc 41340ggcacgatta agtcagggat cagtccacac 41400agcctcggcc gaaggcagcc gacctcgaga 41460tatggcggac acatcaccgg cttgcccaag 41520taaatcacca caccgactga ccaaattgca 41580ctctatcctg acacgcgccc ccggcagaqc 41640cgaggtgacc gccgtcactc caccgctcca ctggccagtc tgacagaagg acagcgccgc 41700ctgcgccact ccgactgcag tgccactcga cagagtgagt ctgacaggca actaggcctt 41760gccgaaggcg ccacggcgaa ctccgctccg cccgacccca gggctcggac tcgggctaag 41820acccggaaga cggcgaactc cgctccgccc gaccccaggg ctcggactcg ggctaagacc 41880cggaagacgg cgaactccgc tccgcccgac cccagggctc ggactcgggc taagacccgg 41940aagacggcga actccgctcc gcccgacccc agggctcgga ctcgggctaa gacccggaag 42000acggcgaact ccgctccgcc cgaccccagg gctcggactc gggctaagac ccggaagacg 42060gcgaactccg ctccgcccga ccccagggct cagactcagg ctaagacccg gaagacgacg 42120aaactccgcc tcgcccgacc ccagggctcg gactccgccc tggcctcggc cggacgactt 42180ccgcctcgcc cgaccccctg gctcgggctc ggccacagca actgaaggca agactcaacc 42240tcggcttcgg aggaaacccc acgtcgccct gcctagagca cagaccgcca cgtcaacagg 42300aaacgtcatc atcaccctac cccgaatcga ctcgggtcac ggagaacaag accggcgtct 42360cgtccggcca gctccgccag aggggcaatg atggcgctcc acgagctcta tgacgacggc 42420ggcccccagc tctcttacgg cagcaggaca acgtcagcag ggactcgacc gctccaacag 42480ctgtccctcc atcaggctcc gccgcaccac cgatagccac gacatcacgc cagcaggatg 42540cccagatctc tccggctgcc acatcggcat gtacctaggg cactagctct ccctccgcta 42600gacacgtagc actctgctac atccccattg tacacctggg tcctctcctt acgactataa 42660aaggaaggac cagggtcttc tcagagaagg ttggccgcgc gggaccgagg acgggacagg 42720cgctctcttg gggccgctcg cttccctcac ccgcgtggac gcttgtaacc cccctactgc 42780aagcgcacct gacctgggcg cgggacgaac acgaaggccg cgggacttcc acctctctca 42840cgctcggctc cggccgcctc gcctctcccc cctccgcgct cgcccacgcg ctcgacccat 42900ctgggctggg goacgcagca cactcactcg tcggcttagg gaccccctgt ctcgaaacgc 42960cgacaaaaac cctcaccaca ttttcctcaa ccacatgatg gagattgggg ctactagata 43020ctatgcctgg tggtagactg gtagctgatg tctttggacc agtagttggt gctagatttg 43080tgaactctac caaggtgaga aacggagatg gaggctgccc tgctgagcgg gttcatcaaa 43140accatcctgc caaggctctt ctcactggta caagggagat acaagctgca caagggcctc 43200aagagcgaca tcaaatcgct ggagaaagag ctccatatga tcgctgttac aatcgatgaa 43260caaatctcgc tggggaggaa ggatcaggga gctgtgctga gcctctcaat tgatgagctg 43320catgaactgg ctcaccaaat cgaggactcc atagatcgct tcttgtacca tgtgaccagg 43380gagcagcaag catccttttt tcgtcggact gtacggtcgc cgaagactct gttgtcacgt 43440cagcggctgg ctgccgaggt tcagttcctg aagaagatac cggaggaggc gcaccagcga 43500gagaagaggt acagggtctt cgccggcctt tcttcctcta cccggcacac tgaatcgtct 43560tcctgttcgt ctgtatctga tccgcacaca cttaaggccg acgtcgtcgg catcgacggt 43620cccagggacg agcttgtgca gcagttaacc gaagaggcag agggcctaac aaagcagctc 43680aaggtgatct ccatcgtcgg gatccatggc tccggcaaga ccgtccttgc cagagaggta 43740tacgagagcg acgtcggccg gcagttcagt ctccgggcat gggtttctgc tactgacaga 43800ggtccgagag aggtgctcat ggagatcctc cgaaattttg gtaggccagt ggtggatagc 43860tctagtattg accagcttac ggtagatctc aggaaacact tgggtgagaa aaggtgaaaa 43920aaacctcttc tttatgttat ttattattta tgaagtttct tcaactacgg gttttcatgt 43980tcaaattgcc tctctgaact tcgaaaacgt ttaataccaa ttgaattgag gatcttagct 44040ttggaaaagc ggtagtgttt tgacgttttg catacatttc tcaccgttat tttattcatt 44100tataatttag agtttaagca gtatattcat tttgaaattt atgagatttc tgtctgcacg 44160cttacttcca tgcccaaaac atgtccgatt gagaacagaa ggtaattttg tttgatcttt 44220gagatcagac acactgattg agtagtaaca ggaaacaagt gctcaccaat caccaagtca 44280cttacaaaga atttcatgct tacaaaacac actgattgtt aaggatagag actatgtttg 44340atctgcatag tttgaatttt gattatgtca tcgtcgattg ttatcattaa cttttgttgg 44400aaatttctct tgtagctatt tcattgtaat cgatggcatg caaacagatc agtggagcac 44460cattgaaact gccttcccag aaaacaatgt tgttagcagc agagtaattg ttacaacaac 44520aatccggtca gtagctaatt cttgcagctc ttctaacggt tatgtgcaca aaatgaaaag 44580acttagtgac gaacactcag agcaattgtt tatcaagaaa gcttgcccaa caaaatattc 44640aggttatact cgaccggaat caaaagaagt tctgaagaaa tgtgatggtc aaccacttgc 44700tcttgttact atgggccaat tcttgaggaa aaatggttgg cccacaggac ccaactgcga 44760aaatgtgtgt agagatctta gacgacatct ggagcaggat gatacattgg agagaatgcg 44820aagggtgctt atccacagct tatctagtct tcctagccat gttcccaaag cctgcctttt 44880gtattttggt atgtttccat gtgatcatcc cataaagagg aagagcctga tgaggcgatg 44940gttagcagag ggatttgtac aaacacagcc ttcatctagt gaaaacttca acaccctcat 45000agaccggaat attattgagc ccatcggcat atgtaacgat gatcaggtaa agacatgcaa 45060aacatatggc atgatgcacg agttcatttt gttaatgtcc acctcccatg acttcattac 45120cctgctttgt aataataaag ttgaacacaa atatgtgcgt cggctttctc tccatcatca 45180tagtgctaca agtggcagtt tttcggtcat cgacttatct cttgttagat ctctgatggt 45240ttttggggag gctggcaaaa ctattttgag tttccgaaag tacgagctat tgagagtctt 45300ggatcttgaa caatgtaccg acttggaaga tgatcacctc aaagacatat gcaacctttt 45360tcttatgaaa tatctaagcc tcggagaaacactgaagctc ttggagacac ttgacttgagggtcctcctg ctcccctgtt tactccatctcaagataaca agtgacatgc agaagtttttttcaggattt atcacagatg ggtctcaaggaagaaagctt aagatatggt ttgagaggaggaatgctgtc caaaagttca tccatgatgaacttcatttc gatgacggca ctgaaaacattaggtcattg aagttaaaag ggaatttgctgggtctccgg gagatatgcc tttcatcaaccgctaacttg aaaggcttgc agcatctcaacattgaaggt caggcattcc tggggctgctcttaccaata attgaaggag gagctttgccagatctagtt ggcctçggtg acatcaaaattctagatcat agagtcgctt cggaaacaagtccaáaccgg ccgaaagtat tgttggtcaaagactgttct gttgcttcaa gaccagctgtagaggttgat gtacgagagg atgacattcatgctgagaaa cagatgaatt gtgcagttcatttcaataat attagtttcc cagaggttgcgaattgaaat gtgtcttcat acacctattgcacttgcagc atattactat gaggctagtaggccataaat tgcatattat agcacaacaatttttctgct tgaatctaca aatttcatcatggtgatgcc atgtcatttt gactttgcaggagttgctag aatattgata caacttcagtaggatggttg aagataattt gcgattgtttcaataaagca tacctttgct tcctacttttttgggcctgg actttatcat gtttatccagggtgattgct gttgttatat aatctatattgttgtcccgc gccatctttt tacaaataatcacgcctata gatggccaaa cggcggtccgctggcccagg cacgtcatgc cgggtcagctatgttaaaaa acagtgtaag agttggagttaagacacttg gtgaagctat ctaaccaataatataaattg tatatatgta tatacattttcgggctgtgc cagcactacg gactgaggcttcttgcaagc attagattgt ttctgagactaggttgctga attggatgaa gcaacaatgaatttgttatt tttaaacgtt agttattgctccagttttta ttgatgcctg actttaacaaaagtttgagt tcagtgactt attttagaaactctgtatgg tggaattatg tcattttatactttcttcta actgctcact tcattggccgaccataacat cagatagtta aatcaaaaaaaaaaatcttg aaattttttg gtggatagttgcacgtgtaa ccgactagta ctaagtgaatttatatgaac gaatattgta ggtaaatgagatctggtacg tcaaaaccac gtatgtaccagactgaagta aagaatctca tccatcgactaggtcccaaa catgtcacca cttaccaattaactagcaaa agttgctgtc tccacaaactttcagaaacc gtggtagcat tgacattttaagcgtcttgt acatttattc tctcacagtaattccattgg agaatagcgg actttttgtttgcaattagc cactctgccc ttttgcgttatttctcattg ccaggtcact tgtttttgaaaacaattaga actgacatta ccgaagaaacnnnnnnnnnn nnnnnnnnnn nnnnnnnnnnttnnnnnnnn gnnngnnggn aatnnnannncnntagttta atttgtttac cctcccagga

tattagaagt cttccaaagg agatagaaaa 45420gagaacaaag gtgaaaacac tacctataga 45480gtttgggaag ttccaatttt ctgataaaat 45540cttaactgga cagagtaact tagagacact 45600attgccacag atgatgaatt acatgaattt 45660taagagaagc accaacttca ccgatcttgt 45720caaagagagc aatgatccac gttctctatc 45780cctgaactct ttgaaggctc cttgttacct 45840ggaacttccc cagtttgtca tatcaatgcg 45900aaaattgaca tcgggcctcc ttgcaacact 45960gctgattgca gatgtccttg aagattttat 46020acacctatgt tttgtcctag aacgtgccac 4 6080gtacctcatc tcacttaagc taatctgcaa 4 6140caaccgcctc aaatgtctta aggaagtcag 4 6200agaaatctgg gaaaaagctg ccgagaagca 4 6260ctcatctgat gaaagcgaaa ttaaggctgt 4 6320gagtgaggct aatggaactt ctcccatgtc 46380gatgatactt aaccaggggc tctctgccgc 4 6440gccaagttca aaagctgaac tgaactctga 4 6500gcttggttta accgagctgt gaattgcttg 4 6560atccttgatt gtccatggtc agtttcgttg 46620tcatgtaaat tacaaatctt ttgttgttaa 46680gctggtatgt ctcaacaatg gcattaattt 4 6740ttattttgca atttcgcttt tatacagata 46800catatatgca agcaacggtt tgagttgctg 46860ttactcgaag gctacaggga tctcataact 46920ccttcagtgt cactgaaaag acttttgtaa 4 6980ttgaagttac ttcagatgct aagttcgcag 47040ctgtttattt gtttcatgta caataatacc 47100tatactatag ttaaagtatc agtttcaacg 47160ccatcacaaa tatttcaaat taacccgatg 47220gcacgggcca gatgccttcg ggccacaact 47280cattagcccg ttcgattaaa tcagcgtaaa 47340tgaacccatg ccctgattaa agaagggcaa 47400gaacatcatg ctcaaatatt ttaatattga 47460tttataaaat ttaaaaaatt ataatcgtgt 47520acagcccaag cacggcacga cgttcttggc 47580acattggcgc aatggactcg atggtgtttg 47640tttgtcacac taacagtaaa atgaaaggtt 47700acgaagtagc ataatttata tgaagtacat 47760tcacttcata ttttgatata tcttttttat 47820tttgagctca caaactttct cttatttggt 47880atttttgttc gttcagccag tcgttgtgaa 47940tattgtacca agacatattg gatgtagtaa 48000atattatacg gagagcggag acaataaata 48060tatataggta ttgttgtaag ccgtcgcaac 48120tccccacttg tgggaattgt gagattgttt 48180taacataata ttccttttgt taacaccttg 48240tatgttttaa cttttgtatc tggtagaatg 48300gctgctaata tatgcagctt cccagatcag 48360aaatctctta tttacttggc cttcccatga 48420gcaggtcaat tcgtttcttt agcgccttat 48480ctcatctgga tagtttcggc ttgaatacgt 48540acagctaact cctgtgcaaa gatgcggctt 48600ttatttagtt tcagctctct ggttgcaact 48660cctacattct atctagcaag gcagccaatg 48720ggctgtgcgg aagaaacatt tctacaaaca 48780agttaagtca aaagcttgtt ggttggatnn 48840nnnnnnnngt tcnttcttgc gttccgttgn 48900taaannagnn actnaatnnn aagnttatac 48960atattgcacg cctcgatgta ggcctccact 49020cagactttat ttgggtactt tagtattggggtgtgctcat ttttatcctt ggttccgcttatagaacaga agggcaaaag tgagcaaaaaccagcaaaac cgagggcacc actataaaaagagtggaggc ctaaatagag gcttgctaatataaaatatc cactgaaatt agaaaattgaatgagggttc gtccgtcttc caacctgattaaaattgagt gcggtctgtg cccccgctaaggttcacaca tatgtggtgt gattgaagggctgtcttcgc tgaagtgtca ttcagtggtgcagagaacat tacaagttaa cataactgaagcctgcaaca gtcaatttgt tctgattcctgacgagaaaa gcagttctaa gccggttgaacagactgaac ctcattgtgg atggcaatatcagcatgttt tgtccatccc catggcaatgttgaggatca ggggacaagt caatcttgtgtctgaaatat cacatcgagc gattgtgtgtactgaagttt tcatttttct caagtcataagttatggagg ggacaaatag agcaaaatgtgaaaaggaaa cataatctgt tcatccgctgaacctacaac ccattgtcac cgttgctctatgttctaggc ggatggcgac ggcgattagg

gtttttatag tggtgccctc ggttttgctg 4908Ctattttgctc agttttgccc ttccagtgct 4914Caaaacacaac taaggataaa aatgagcaca 4920Cccccaatact aaagtaccca aataaagtct 4926Ctattagacct ttataactac attaaataag 4932Cgtgaggtctg tgcccccgct aagccgtcca 4938Caaataagata aaatatccac taaaattaga 4944Cgccgcccaac ccaaccttga tgaatttcct 4950Cttacacgaaa aacctcacaa ccccgatggc 4956Catcaggaaca aatcccatcc caaactcaag 4962Cgttgaaccag atggtggtca gaatgagaag 4968Ctttgtgcagg ctgctacagg ttgttctcct 4974Cttcgtgcagg atgcatacaa cagaaccatg 4980Cttttttcaat ctctgatact agtaccaagt 4986Cgcatagagat agaactttct ataaatagtc 49920aaatcctaag taatacggag tacaagtttg 49980gcgcgcctac tagctcatga aagtcctggt 50040attatgcagg atgttataac tccacagagg 50100ggatggaaac atagaacaca gcaggctgcg 50160acacaaaagc aagaacctct atttgagtgg 50220ttgggtcttc agaagaaatt ttgactagaa 50280catcgtttct ccttcatgaa 50330

I.a) Número identificador da seqüência: SEQ ID No: 138

II) Características da seqüência:

II.a) tamanho: 507

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA3434

IV) Seqüência: 138

gtcatgtccc ccctcattag aggcgctact ggacatgtgg aagctgccat gttcggctgc 60aacgacgcca cccaggtgta caaggagctg caggaggcca tcaaatccta cccggacgcc 120ttccaccgcg tcatcggctt cgacaacatc aagcagacgc agtgcgtcag cttcatcgcc 180tacaagcccc cgggcagcga ctagaccgcg cccgccggcc gccccccgcc ggctagctag 240ctagctagct cctgcgtgag ctagtagcta gctagtgcca tgcgtcgtct ctgtcgttcg 300gttttgcttc ggggtcaccg tgtacccttt gcttgcttgg tttcttcttt ccttttttcc 360tttttttttt cttcttttcc ccggccatgg ttcctttgct ttccagcagt tctctgctgg 420atgtaatgta tccattgttg caagcatggc cttgcattgg ctacctctat acctgctaaa 480aaactactgc aaatggtcat agctgtc 507I.a) Número identificador da seqüência: SEQ ID No: 139

II) Características da seqüência:II.a) tamanho: 650

Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Seqüênciaconsenso processada de MZA2591

IV) Seqüência: 139

asggtaccaa ctaaaagggc ctggaatcat ggaagcccac aataaccagg agcgagctac 60ctgcgaagcc acatctctcc ttcctcttca tcgatagtac tcatctccat attcaggtaa 120ataacatcgt ctgcatgccg cgcgccccta atagcatctc gatcacattt ttgtgttctt 180gacttctcct cggaagcctt cttgtttaac aaacttatat tagtcgttgg tcgatctttg 240gacccacatg taaatcttgg ttcgcgtccg ccgtgcagtg cagaggcaca agctaagcca 300tgagcaacgg tggtaaccgc agcaggggcg gcgcgaggtt cgagctgcag ctgcacctgt 360cgccgccgcc gcccgtggct aggagggtgt aggtttactg cgtatgctac tgcagcgact 420cgtcttcttc cccgagctcg tgcgtgtcgt ctgactgcat tccagggagc aattcgccga 480ttgtaatcgg cgcctgcacg cggtgcatga tgtactgcat ggtgtccaag aatgacttcc 540ccacctgcat caactgcaag cagccctgcc tcgtgtacct cctccactgc tcttggcccc 600tgctgcagcg gcaccggcaa ggccaattaa aakgacttca acctttcgta 650

I.a) Número identificador da seqüência: SEQ ID No: 140

II) Características da seqüência:

II.a) tamanho: 731

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA11123

IV) Seqüência: 140

tcaaatcctg gggggaaacc ttccgggtgg gtcattgcaa aatgggcagt ttatgggctc 60cttaatgatg gggggtcacg gttcgggggt tttttcggcc gggaccatgt ttcggtctct 120tcttaatata ataccgggag gcagtttttc ctcctccccg gccgcgtttt ttagtgtaaa 180tatgcaaatg taccatcttg attggcttct atgatctaca ttttagtgta ggctgcaagt 240ccacgagctt tgaaaagtta cacaatctgg attatttgca agtcgtaaac acttatagga 300ctcagtgact agattggacc agcctgttgc attcatgcaa ttgttaggct aattgtcatt 360tcaccttcag tctacaatga aatggttaac atagtgcatg gatttcttcc attggtacat 420caataataat atccaacagc gctaatgaga tgtacgtctt gtttccagat gttacagatc 480caactgcaaa tggtgcagcg tggcgctgct gggccgccca gtaacgagaa tactgagcac 540acagaagaat gactgaatct gtgaacagac acttctgcat cgtggtgtaa taataaggag 600aatactgatg agcacacacg ctgaagaatc tgtaaatagg cggcgatgag gatgggacaa 660aagaaagcca aggattggcg atacctgggc tggggaaact gtacgggtaa aaacttaata 720agggggttta a 731

I.a) Número identificador da seqüência: SEQ ID No: 141

II) Características da seqüência:

II.a) tamanho: 704

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial.

III) Características:

III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA15842

IV) Seqüência: 141

taaccacccg cctggctaat tgttccgacc atttttatag cctgcatggc ttacattgtc 60

ttcacgaggg tcaacaggat attcagattg cgcatttgga cttaaaacca gcaaatatat 120

tacttgacag tgacatggtt cctaaacttg ctgattttgg tatgtcaagg ctcttcagtc 180

tcgaacaagt ttatatcctt gcttccaagc ctatgggaac aatgtaagct cattaagttt 240

actgaatgtg ctttcttgat cttatatggc ttgcaacacc tttgaaactt atttggttta 300

aaagacacat ttaattttcc ttcattagta catgtgtcct gaagtataag gaaaccttag 360

ttcgttaact caaaagattt ctatttggct aagtttatag agaagagtat tagcatatac 420

catattaaaa agctagctat gaaaatatat ttcatagtgg gtttaatgat gatcatttga 480

tactccctct gccccaattt ataatccgtt taactttttt actctaagtt tgatcgactc 540

gtcttattca aaacttatgc gagaaaatgg aaaattcaaa gccatactta aagcatatta 600

tatgctaaat gacatcacag taaaaattaa taacaattat gattttttta ataggacgaa 660

ttggtcaaag ttagggtaaa aaagtcaaac aaattataaa ttgg 704

I.a) Número identificador da seqüência: SEQ ID No: 142

II) Características da seqüência:

II.a) tamanho: 665

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA1851

IV) Seqüência: 142

aaaaaggaaa tttttttttt taaaaaaaac ggaggctcta acagggctct gggtagtggc 60ccaaactgtg ccaatatgga taatggaaga ttcttggggc agagtattaa gggaagttgt 120ttttttcttc ttcttttggt tggtcttttt aagctgaatg gatgacatga ttgcctatgt 180tatgtattgg gtaattttag ttgtcaaaat atatctttac agctatacgc tatcgctgtg 240ctctgagcac ctcaaaacat ccaggtgatgatgggacttt tttcgaagag ggccattcttccacaactgt ttccgcttga tggcaacaatattcatatgg atatggtcga actgacttgctattttgagc otatgatggt tccctttggcggcttcaatc atactggtgc aatttacgagtgcagacagc agatccgcat gtcttggagaggaaa

acatctacac atggggttgg ggaggcgcca 300ccggtggaca gctggtgagt tgctttcaga 360gtgcggcatg cataatcccc acaggacacc 420tacttgcagg gacatggaaa cgacgtagac 4 80acgaatgcca gagccgtcca tgtatcgtgt 540tgctccgagg actttgactg acgtgagact 600cttaggttag ttatcaaata tactcgctga 660

I.a) Número identificador da seqüência: SEQ ID No: 143

II) Caracteristicas da seqüência:

II.a) tamanho: 698

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA8761

IV) Seqüência: 143

tgccaaaggg ggaacagtta aggctttata gaagggraag atttggttca ggtaactggg 60ctcacatttg ttactatttg gaatcatagg ggttcaagca tttaaaaaga actgggatcc 120ctaccaccag tttggagtgt tccacaaata cacttttatg tccttgggca tcgccaaggg 180ctgctttttt ttctttgggt attcctgtta actcagatgc tcaaaaattg ggacaatatt 240gacatgccct cttgattaga agtgtttgta gtttgtaatt tgcatcttat actttcatga 300gtactcgagc cattgttgtg ttctcagttg atgtaatttc attatttaaa cttcttgttg 360ggttgtctaa tggaatgcaa aaaaaatact tgaaaaatga cagatagcag atccagcagc 420aattgaggca atggtagata aagtaattgc tgataatcca aagcaacttg agcagtaccg 4 80tgctggaaaa actaagctac aaggattttt tgctggccag gtttgtcaat tgatgactag 540cactgtttgt cccttcagct aggatgtatt atcagtgatc atatttgttt caattgatta 600taggtgatga aagcatcgaa gggaaggcca acccagtttt gttgaataaa attcttgaaa 660aattcttgga gagaagtttt tgctaaattt tatataaa 698

I.a) Número identificador da seqüência: SEQ ID No: 144

II) Caracteristicas da seqüência:

II.a) tamanho: 521

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Seqüênciaconsenso processada de MZA11455IV) Seqüência: 144

ttgaggcaat ttaaataagc attgcaggga aggcccagta caaacgttca accttctgac 60

tgacacatgt tgtggaacta accctcagca taggagcaag agaaaaatga ctgggaagag 120

aatgactggg aagagagatt gtttgcatgc acgtagcaga tatctgagag ctacagagga 180

aagctgggaa atagaagaag ctctaaaaca aggagtgttt ctggaaattc tttagttttc 240

aaaaaacact ttctgaaaat gtgtgtacaa gaaaattcca ggaaggtgaa attgcttcgt 300

tgactgcagt gggaagggga aagagagaag ctagaatctc atgtcgagta atccagtaca 360

atgtgttctt ttgtctggtc taaattcttg taacagctct tcctatgatg gaagaatcca 420

ttcaacaatt ccacctatga ttactggatt gagtatgttg aataggttgg ttgaggctat 480

ctagtaattt tatgactatt taatttattt ataactattt a 521

I.a) Número identificador da seqüência: SEQ ID No: 145

II) Características da seqüência:

II.a) tamanho: 18

Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer dooligonucleotideo C00060-01-F1

IV) Seqüência: 145

ggtcttcgcc ggcctttc 18

I.a) Número identificador da seqüência: SEQ ID No: 146

II) Características da seqüência:

II.a) tamanho: 25

II. b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer dooligonucleotideo C00060-02-F1

IV) Seqüência: 146ggtcagtagc taattcttgc agctc 25I.a) Número identificador da seqüência: SEQ ID No: 147

II) Características da seqüência:

II.a) tamanho: 17

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer dooligonucleotideo C00060-01-F-Taq

IV) Seqüência: 147tcttcgccgg cctttct 17

I.a) Número identificador da seqüência: SEQ ID No: 148

II) Características'da seqüência:

II.a) tamanho: 2 6

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer dooligonucleotideo C00060-02-F-Taq

IV) Seqüência: 148cagagcaatt gtttatcaag aaagct 26

I.a) Número identificador da seqüência: SEQ ID No: 149

II) Características da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer dooligonucleotideo C00060-01-R1IV) Seqüência: 149

gggaccgtcg atgccgac 18

I.a) Número identificador da seqüência: SEQ ID No: 150

II) Caracteristicas da seqüência:

II.a) tamanho: 29

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Caracteristicas:

III.l.c) outra informação relevante: Primer dooligonucleotídeo C00060-02-R1

IV) Seqüência: 150

tttcctcaag aattggccca tagtaacaa 29

I.a) Número identificador da seqüência: SEQ ID No: 151

II) Caracteristicas da seqüência:

II.a) tamanho: 22

II. b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Primer dooligonucleotídeo C00060-01-R-Taq

IV) Seqüência: 151

gcggatcaga tacagacgaa ca 22

I.a) Número identificador da seqüência: SEQ ID No: 152

II) Caracteristicas da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Caracteristicas:III.l.c) outra informação relevante: Primer dooligonucleotídeo C00060-02-R-Taq

IV) Seqüência: 152ggttgaccat cacatttctt caga 24

I.a) Número identificador da seqüência: SEQ ID No: 153

II) Características da seqüência:

II.a) tamanho: 25

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer dooligonucleotídeo FLP111RB

IV) Seqüência: 153caggttatac tcgaccggaa tcaaa 25

I.a) Número identificador da seqüência: SEQ ID No: 154

II) Características da seqüência:

II.a) tamanho: 30

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda dooligonucleotídeo C00060-01-PCA

IV) Seqüência: 154acggacgcgg aggaacagga agacgattca 30

I.a) Número identificador da seqüência: SEQ ID No: 155

II) Características da seqüência:II. a) tamanho: 2 9

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda dooligonucleotideo C00060-02-PCA

IV) Seqüência: 155

acggacgcgg agctcgaccg gaatcaaaa 29

I.a) Número identificador da seqüência: SEQ ID No: 156

II) Características da seqüência:

II.a) tamanho: 2 6

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Sonda dooligonucleotideo C00060-01-P-Taq

IV) Seqüência: 156

cctctacccg gcacactgaa tcgtct 26

I.a) Número identificador da seqüência: SEQ ID No: 157

II) Características da seqüência:

II.a) tamanho: 32

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda dooligonucleotideo C00060-02-P-Taq

IV) Seqüência: 157

cccaacaaaa tattcaggtt atactcgacc ggI.a) Número identificador da seqüência: SEQ ID No: 158

II) Caracteristicas da seqüência:

II.a) tamanho: 259

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0001-01

IV) Seqüência: 158tttagaaact cagctagtgc ttttggcaac caaaccccac agccaaacag ctgcatgtct 60agaggtagag gagtagactc ctcacaccgg gtaagtctag ctgagtatta gtatactcag 120ccttgcttgt ggcataattt ttacaggttc tctggaggaa atggttgctg gagtgacttg 180gccgtccatc ttgccaccgg gttggactgt cgagtgggac cctgccttgg ctgaggagga 240gcatgaggag tgatgggac 259

I.a) Número identificador da seqüência: SEQ ID No: 159

II) Caracteristicas da seqüência:

II.a) tamanho: 34

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Oligo

Invader para Marcador PHD0001-01

IV) Seqüência: 159tgccacaagc aaggctgagt atactaatac tcat 34

I.a) Número identificador da seqüência: SEQ ID No: 160

II) Caracteristicas da seqüência:

II.a) tamanho: 26

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: SondaInvader para Marcador PHD0001-01IV) Seqüência: 160cgcgccgagg gctagactta cccggt 26

I.a) Número identificador da seqüência: SEQ ID No: 161

II) Características da seqüência:II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer de

oligonucleotideo Forward para MarcadorPHD0001-01

IV) Seqüência: 161

tagtgctttt ggcaaccaaa cc 22

I.a) Número identificador da seqüência: SEQ ID No: 162

II) Características da seqüência:

II.a) tamanho: 22

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para Marcador

PHD0001-01

IV) Seqüência: 162

ccatttcctc cagagaacct gt 22

I.a) Número identificador da seqüência: SEQ ID No: 163

II) Características da seqüência:

II.a) tamanho: 259

Il.b) tipo: DNAII. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0002-01

IV) Seqüência: 163

ggcttcccca tctctctatt tatttaccgt tagtttattt ccgctgcact tcgaacaatg 60atggttactt ttgcaaaaac tccgaggatg atgatgatgg tgatgtaata atttaatact 120ctgacatgta tggttttatg ctttattgta tttgctctgt gactcacctt cgagtgagat 180tgtggtactt gatcctgtca gtggccgtgt cggactagat ccgagggatt gacgggttat 240tcccaattaa gtgtggtct 259

I.a) Número identificador da seqüência: SEQ ID No: 164

II) Características da seqüência:

II.a) tamanho: 36

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Oligo

Invader para Marcador PHD0002-01

IV) Seqüência: 164ggccactgac aggatcaagt accacaatct cactct 36

I.a) Número identificador da seqüência: SEQ ID No: 165

II) Características da seqüência:

II.a) tamanho: 27

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0002-01

IV) Seqüência: 165cgcgccgagg gaaggtgagt cacagagI.a) Número identificador da seqüência: SEQ ID No: 166

II) Características da seqüência:

II.a) tamanho: 23

Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer de

oligonucleotideo Forward para MarcadorPHD0002-01

IV) Seqüência: 166ggatgatgat gatggtgatg taa 23

I.a) Número identificador da seqüência: SEQ ID No: 167

II) Características da seqüência:

II.a) tamanho: 22

II. b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

PHD0002-01

IV) Seqüência: 167

ccgtcaatcc ctcggatcta gt 22

I.a) Número identificador da seqüência: SEQ ID No: 168

II) Características da seqüência:

II.a) tamanho: 269

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0003-01IV) Seqüência: 168

acgctgctgc gacaaggccc tcgcccgcataagccgaaga gccggaggtc cgaccgcaggcacctcagca ccgacgacgg cagccacctggtgctcggtt ggcactgttg ggtcatgcgcgcagtcgaga aggcgcggga ggaggcgcg

ccccactcga ggggcgagga caagctatca 60tggcgccgag aaaccttctc tggctgccac 120cccaccaaca cccgccgggc cgtgaccaat 180agggttgcct cgagtcgcgg caccggttcc 240

I.a) Número identificador da seqüência: SEQ ID No: 169

II) Características da seqüência:

II.a) tamanho: 21

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: OligoInvader para Marcador PHD0003-01

IV) Seqüência: 169

tggctgccgt cgtcggtgct t 21

I.a) Número identificador da seqüência: SEQ ID No: 170

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0003-01

IV) Seqüência: 170cgcgccgagg gaggtggtgg cagc 24

I.a) Número identificador da seqüência: SEQ ID No: 171

II) Características da seqüência:

II.a) tamanho: 22II.b) tipo: DNAII. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0003-01

IV) Seqüência: 171

ggacaagcta tcaaagccga ag 22

I.a) Número identificador da seqüência: SEQ ID No: 172

II) Características da seqüência:

II.a) tamanho: 2 0

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Primer de

oligonucleotideo Reverso para MarcadorPHD0003-01

IV) Seqüência: 172

caaccgagca cattggtcac 20

I.a) Número identificador da seqüência: SEQ ID No: 173

II) Características da seqüência:

II.a) tamanho: 279

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Seqüência

SNP para Marcador PHD0004-01

IV) Seqüência: 173

cacgaacacc ccaaaccaca tgccgaggct gtagagtcgc cccagggttg aatcgaccga 60

ggcggtcatt tctcccctga ccacggcgaa gagcggcacg gtgcgcaact ggttttcctg 120

atagtgggca ccggcgtgaa attaggccgc caactcgcgc cccgatgcac cgacccacaa 180

tcgccaaggc ttctgctgcg caaacgagtt ccccgctgtg atggccgaag cacagcacag 240

caggtggacg gcagcggacc agtcgcggcg gcgcacaga 279I.a) Número identificador da seqüência: SEQ ID No: 174

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: OligoInvader para Marcador PHD0004-01

IV) Seqüência: 174tggcggccta atttcacgcc ggtt 24

I.a) Número identificador da seqüência: SEQ ID No: 175

II) Características da seqüência:

II.a) tamanho: 28II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0004-01

IV) Seqüência: 175cgcgccgagg gcccactatc aggaaaac 28

I.a) Número identificador da seqüência: SEQ ID No: 176

II) Características da seqüência:II.a) tamanho: 21

II. b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0004-01

IV) Seqüência: 176ggtcatttct cccctgacca c 21I.a) Número identificador da seqüência: SEQ ID No: 177

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.1.c) outra informação relevante: Primer de

oligonucleotideo Reverso para MarcadorPHD0004-01

IV) Seqüência: 177agcagaagcc ttggcgatt 19

I.a) Número identificador da seqüência: SEQ ID No: 178

II) Características da seqüência:

II.a) tamanho: 300

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0005-01

IV) Seqüência: 178

ttggggcgag cagggaggag aagaggaacaaggaggggac gaacaggtca cgctggcgcgaggacgttaa ccgggcggcg ctagaatcctgcggcgggca ggtgtgccgc cagcgctgtataggggtccg cgatttccgt gaatcgggca

gcggcttcgg gtgttatagg cgcagggtaa 60atgccgcacc tatatgacga gtccgggctg 120ggggcttcgg cagaggccgt tgcgggagta 180cgcggggtcg gggcacggag gttgttgcgc 240cgagctcacc agcgccaccg gttttgcgca 300

I.a) Número identificador da seqüência: SEQ ID No: 179

II) Características da seqüência:

II.a) tamanho: 23

Il.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: OligoInvader para Marcador PHD0005-01IV) Seqüência: 179cgctactccc gcaacggcct ctt 23

I.a) Número identificador da seqüência: SEQ ID No: 180

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0005-01

IV) Seqüência: 180cgcgccgagg gccgaagccc ca 22

I.a) Número identificador da seqüência: SEQ ID No: 181

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0005-01

IV) Seqüência: 181ctatatgacg agtccgggct ga 22

I.a) Número identificador da seqüência: SEQ ID No: 182

II) Características da seqüência:

II.a) tamanho: 19II.b) tipo: DNA

II.c) organismo: Seqüência artificialIII) Características:

III.1.c) outra informação relevante: Primer deoligonucleotídeo Reverso para MarcadorPHD0005-01

IV) Seqüência: 182acccctagcg caacaacct 19

I.a) Número identificador da seqüência: SEQ ID No: 183

II) Características da seqüência:

II.a) tamanho: 290

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Seqüência

SNP para Marcador PHD0006-01

IV) Seqüência: 183

cgaagcggag gaaatgtagg gagggagaag aagaccactg ccggctgggt ggataagtta 60gctgggtgac cctggaatgt ggggcccgcc tggcggcgac gcgaaggcca cacgagcgag 120tgaggggcgt tgggtcgtgc ggtatcggaa aaaaaagaat gggccgaaag tgaggattcg 180gcccaagtag tgttttattg tttttctttt tcttattttt tttcaaattc aactttaaat 240tcccatttaa attcaaattt agtggtggat ctatcttcac attaatttcc 290

I.a) Número identificador da seqüência: SEQ ID No: 184

II) Características da seqüência:

II.a) tamanho: 23

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Oligo

Invader para Marcador PHD0006-01

IV) Seqüência: 184

tcgctcgtgt ggccttcgcg tct 23I.a) Número identificador da seqüência: SEQ ID No: 185

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0006-01

IV) Seqüência: 185cgcgccggg gccgccaggc g 21

I.a) Número identificador da seqüência: SEQ ID No: 186

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotídeo Forward para MarcadorPHD0006-01

IV) Seqüência: 186ggctgggtgg ataagttagc tg 22

I.a) Número identificador da seqüência: SEQ ID No: 187

II) Características da seqüência:

II.a) tamanho: 21

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotídeo Reverso para MarcadorPHD0006-01IV) Seqüência: 187cactttcggc ccattctttt t 21

I.a) Número identificador da seqüência: SEQ ID No: 188

II) Caracteristicas da seqüência:II.a) tamanho: 300

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Seqüência

SNP para Marcador PHD0007-01

IV) Seqüência: 188

caacttaaac atggcatggg tgaacttatttgctatgttt ctccaaatta gagtttaaatggtactaaca catttatttt actatccacatgcataattt atttgagtgt cttctattaagaaatggtaa atagggataa cccacacaca

tattttcaat atttatttta ttaaaactag 60gctatgtgtc ccttaatata ttaatatatg 120aatgcacaat caagtaaaaa ctcagcatga 180ttatttattg tatagatgag gtgtccacat 240tgtaaaggaa tataatctct ccttttagat 300

I.a) Número identificador da seqüência: SEQ ID No: 189

II) Caracteristicas da seqüência:

II.a) tamanho: 58

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. 1.c) outra informação relevante: Oligo

Invader para Marcador PHD0007-01

IV) Seqüência: 189

tttctccaaa ttagagttta aatgctatgt gtcccttaat atattaatat atgggtat 58

I.a) Número identificador da seqüência: SEQ ID No: 190

II) Caracteristicas da seqüência:

II.a) tamanho: 36

II.b) tipo: DNAII.c) organismo: Seqüência artificial

III) Características:

III.1.c) outra informação relevante: Sonda

Invader para Marcador PHD0007-01

IV) Seqüência: 190

cgcgccgagg ctaacacatt tattttacta tccaca 36

I.a) Número identificador da seqüência: SEQ ÍD No: 191

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0007-01

IV) Seqüência: 191

ttaaacatgg catgggtgaa ct 22

I.a) Número identificador da seqüência: SEQ ID No: 192

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer de

oligonucleotideo Reverso para MarcadorPHD0007-01

IV) Seqüência: 192tgcatcatgc tgagttttta cttg 24I.a) Número identificador da seqüência: SEQ ID No: 193

II) Características da seqüência:

II.a) tamanho: 274

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Seqüência

SNP para Marcador PHD0008-01

IV) Seqüência: 193

cggcggccac aagtcagtcg ccgaaaattagccgaaaata acaagtgccg aaaatagtattacaataaca gaaaattcat acttgagtccaaagtccaca aatagtccat acaaacataatgccgcacaa agctaactcc atcacatatc

cctgttcttt tcggtgggcc tctgacggcc 60ttaaaaatac aaaaaataac agaaaattca 120acaacataaa acttaagtcc atacaaacat 180agtccacaaa tagtccatta caaagcacaa 240gggg 274

I.a) Número identificador da seqüência: SEQ ID No: 194

II) Características da seqüência:

II.a) tamanho: 51

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Oligo

Invader para Marcador PHD0008-01

IV) Seqüência: 194

tttgtatgga ctatttgtgg actttatgtt tgtatggact taagttttat t 51

I.a) Número identificador da seqüência: SEQ ID No: 195

II) Características da seqüência:

II.a) tamanho: 29

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0008-01IV) Seqüência: 195cgcgccgagg gttgtggact caagtatga 29

I.a) Número identificador da seqüência: SEQ ID No: 196

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0008-01

IV) Seqüência: 196cgaaaataac aagtgccgaa aa 22

I.a) Número identificador da seqüência: SEQ ID No: 197

II) Características da seqüência:

II.a) tamanho: 23

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0008-01

IV) Seqüência: 197ggcattgtgc tttgtaatgg act 23

I.a) Número identificador da seqüência: SEQ ID No: 198

II) Características da seqüência:

II.a) tamanho: 259

II.b) tipo: DNAII. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Seqüência

SNP para Marcador PHD0009-01

IV) Seqüência: 198

cgttggagtt gtgtccacta ccttcagaag cgaaaaactc gttgacgaag tcgtgtaacg 60ggtttagatt ctaaagaaaa aagaagacat taataacgat attagttaca tgtatgacca 120ctattcaaac aaattgtttc tcaaactaac ctctcatgga gtagctccct cccctgcata 180tgctcctcct ggtgctggta tgagcggtgg tggcgtgttg tggcccatga ccccggatcc 240ctacaaaatc aagtttagt 25 9

I.a) Número identificador da seqüência: SEQ ID No: 199

II) Características da seqüência:

II.a) tamanho: 49

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Oligo

Invader para Marcador PHD0009-01

IV) Seqüência: 199

gggagctact ccatgagagg ttagtttgag aaacaatttg tttgaatat 49

I.a) Número identificador da seqüência: SEQ ID No: 200

II) Características da seqüência:

II.a) tamanho: 34

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Sonda

Invader para Marcador PHD0009-01

IV) Seqüência: 200

cgcgccgagg gtggtcatac atgtaactaa tatc 34I.a) Número identificador da seqüência: SEQ ID No: 201

II) Características da seqüência:

II.a) tamanho: 2 4

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0009-01

IV) Seqüência: 201aagtcgtgta acgggtttag attc 24

I.a) Número identificador da seqüência: SEQ ID No: 202

II) Características da seqüência:

II.a) tamanho: 19

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0009-01

IV) Seqüência: 202cagcaccagg aggagcata 19

I.a) Número identificador da seqüência: SEQ ID No: 203

II) Características da seqüência:

II.a) tamanho: 250

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0010-01IV) Seqüência:

aaagatttga aattagattgtggaggtggc ggagcatgtaaaatggttgt tgttgtgccttatagaacca atatcgagcgggcctgtgcg

203

atacaaacga caagtcttaaatccccactg aggcatcgacgctgtggaaa ccaagaccgttgttgagaag aaataagaca

ctaaattgaa gcacctgagg 60ggctgaaact gagggaaaac 120tgcaaatata atatgttagt 180ctcacgttca ttgcttgttg 240

250

I.a) Número identificador da seqüência: SEQ ID No: 204

II) Caracteristicas da seqüência:

11.a) tamanho: 34

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Oligo

Invader para Marcador PHD0010-01

IV) Seqüência: 204

gcaggcacaa caacaaccat ttgttttccc tcat 34

I.a) Número identificador da seqüência: SEQ ID No: 205

II) Caracteristicas da seqüência:

II.a) tamanho: 26

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0010-01

IV) Seqüência: 205

cgcgccgagg gtttcagccg tcgatg 26

I.a) Número identificador da seqüência: SEQ ID No: 206

II) Caracteristicas da seqüência:

II.a) tamanho: 22

II.b) tipo: DNAII.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0010-01

IV) Seqüência: 206ggagcatgta atccccactg ag 22

I.a) Número identificador da seqüência: SEQ ID No: 207

II) Características da seqüência:

II.a) tamanho: 22

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0010-01

IV) Seqüência: 207tctcaacacg ctcgatattg gt 22

I.a) Número identificador da seqüência: SEQ ID No: 208

II) Características da seqüência:

II.a) tamanho: 259

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0011-01

IV) Seqüência: 208atttccggcg gttgtggcag gccgccaaaa atagcagata attttcggcg gctataggtg 60ggccatcgaa aattacattg gccgccgaaa atgttcaaca gtgttgttgt gatagcaacc 120aacaggtatg agccacaata ctacacattg caacttggga aagtaattta ctggtcacca 180tatttccgaa tagctggtta tgatatgata tttacaaatc ttccaattca ttccttcagc 240ttaaatgaat ctcattaat 259I.a) Número identificador da seqüência: SEQ ID No: 209

II) Características da seqüência:

II.a) tamanho: 40

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Oligo

Invader para Marcador PHD0011-01

IV) Seqüência: 209

agttgcaatg tgtagtattg tggctcatac ctgttggttt 40

I.a) Número identificador da seqüência: SEQ ID No: 210

II) Características da seqüência:

I.a) tamanho: 2 9

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante:

Invader para Marcador PHD0011-01

IV) Seqüência: 210cgcgccgagg gctatcacaa caacactgt

Sonda

29

I.a) Número identificador da seqüência: SEQ ID No: 211

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer de

oligonucleotideo Forward para MarcadorPHD0011-01

IV) Seqüência: 211taggtgggcc atcgaaaatt ac 22I.a) Número identificador da seqüência: SEQ ID No: 212

II) Caracteristicas da seqüência:

II.a) tamanho: 2 4

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0011-01

IV) Seqüência: 212ttcggaaata tggtgaccag taaa 24

I.a) Número identificador da seqüência: SEQ ID No: 213

II) Caracteristicas da seqüência:

II.a) tamanho: 2 69

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0012-01

IV) Seqüência: 213ttgtaaaaaa caaggttttg taaatggattttcaatcacg cacaattgct atgctgacagtaataataat gagacccttc atgatcttgtgcatagcagt gcccaccatt ttctaccgagatggacaaca gcttcgtgtg ttgtccatc

tatttttatg ctcaaactta aattgaacaa 60aagtttatga caagtttgag cataatgttg 120tgttattcca catttccatc tctcctcgaa 180tcagcaacaa taatctaggc tgaaagaaca 240

I.a) Número identificador da seqüência: SEQ ID No: 214

II) Caracteristicas da seqüência:

II.a) tamanho: 51

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: OligoInvader para Marcador PHD0012-01

IV) Seqüência: 214gtggaataac aacaagatca tgaagggtct cattattatt acaacattat t

I.a) Número identificador da seqüência: SEQ ID No: 215

II) Características da seqüência:

II.a) tamanho: 31

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: SondaInvader para Marcador PHD0012-01

IV) Seqüência: 215cgcgccgagg gctcaaactt gtcataaact t 31

I.a) Número identificador da seqüência: SEQ ID No: 216

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0012-01

IV) Seqüência: 216

tcaatcacgc acaattgcta tg 22

I.a) Número identificador da seqüência: SEQ ID No: 217

II) Características da seqüência:

II.a) tamanho: 22

II.b) tipo: DNAII. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0012-01

IV) Seqüência: 217agaaaatggt gggcactgct at 22

I.a) Número identificador da seqüência: SEQ ID No: 218

II) Características da seqüência:

II.a) tamanho: 259

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0013-01

IV) Seqüência: 218

tacaatattt gcctatggtg ttacaaggag tggaaagata catacgatgc atgtgggaaa 60acttattaca atatttttcc tttaataagt tttacctttg tagagtgtat gtttctagtc 120ataggctttg aagtatgcct catgctacca attaacatgc aaaaacttgg actaatctta 180ctgatactaa gatctaacat agttgtcaac ctccttggtt ggacatttta gttgcttttg 240ttgtattaag cttttaatt 259

I.a) Número identificador da seqüência: SEQ.ID No: 219

II) Características da seqüência:

II.a) tamanho: 4 5

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Oligo

Invader para Marcador PHD0013-01

IV) Seqüência: 219

ccaagttttt gcatgttaat tggtagcatg aggcatactt caaatI.a) Número identificador da seqüência: SEQ ID No: 220

II) Características da seqüência:

II.a) tamanho: 31

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante:

Invader para Marcador PHD0013-01

IV) Seqüência: 220cgcgccgagg gcctatgact agaaacatac a

Sonda

31

I.a) Número identificador da seqüência: SEQ ID No: 221

II) Características da seqüência:

II.a) tamanho: 22

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Primer de

oligonucleotídeo Forward para MarcadorPHD0013-01

IV) Seqüência: 221

acatacgatg catgtgggaa aa 22

I.a) Número identificador da seqüência: SEQ ID No: 222

II) Características da seqüência:

II.a) tamanho: 22

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotídeo Reverso para MarcadorPHD0013-01IV) Seqüência: 222aatgtccaac caaggaggtt ga

I.a) Número identificador da seqüência: SEQ ID No: 223

II) Caracteristicas da seqüência:II.a) tamanho: 269

II.b) tipo: DNA

II. c) organismo: Seqüência artificiai

III) Caracteristicas:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0014-01

IV) Seqüência: 223

attggatttg tggtggggtg cgtgggcggg catcacgcgt ggcgatggca ctggaagcac 60ggggaacagg gcaggtgtag ggtgggggca ggcgatggaa tggcgcggca tgcttgcggc 120cgattgtcct tgcgtggatg gaggggattg cgggctcgag gatgaggatg gcgggatgcg 180cgcgcctttc gtcgatcgaa cgtgggcacg ggacgaggat tgcattgcgc ggccacgcgg 240gggcgagatt ggcgtcgtcg gtgggatgt 269

I.a) Número identificador da seqüência: SEQ ID No: 224

II) Caracteristicas da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Caracteristicas:

III. l.c) outra informação relevante: OligoInvader para Marcador PHD0014-01

IV) Seqüência: 224ccgccatcct catcctcgag ccct 24

I.a) Número identificador da seqüência: SEQ ID No: 225

II) Caracteristicas da seqüência:

II.a) tamanho: 25

II.b) tipo: DNAII.c) organismo: Seqüência artificial

III) Características:

III.1.c) outra informação relevante: Sonda

Invader para Marcador PHD0014-01

IV) Seqüência: 225

cgcgccgagg gcaatcccct ccatc 25

I.a) Número identificador da seqüência: SEQ ID No: 226

II) Características da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II.c) organismo: Seqüência artificial

III) Características:

III.l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0014-01

IV) Seqüência: 226

cttgcggccg attgtcct 18

I.a) Número identificador da seqüência: SEQ ID No: 227

II) Características da seqüência:

II.a) tamanho: 18

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. 1.c) outra informação relevante: Primer de

oligonucleotideo Reverso para MarcadorPHD0014-01

IV) Seqüência: 227accgacgacg ccaatctc 18I.a) Número identificador da seqüência: SEQ ID No: 228

II) Características da seqüência:

II.a) tamanho: 210

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: SeqüênciaSNP para Marcador PHD0015-01

IV) Seqüência: 228

aattgctatt ttagcccttc taacgtgggc tctctgctat tatgtgaccc tctgtctatg 60acttgtgtga ccatttgtgt ctatgatttg tgggactggt ggtaaaatag agaagttcac 120aactgagagt gacaaaatag caaattctcc cacgggggcg ggggcacgac gcaccagtgt 180ggacgtccac actatagcct tatagagtag 210

I.a) Número identificador da seqüência: SEQ ID No: 229

II) Características da seqüência:

II.a) tamanho: 39

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: OligoInvader para Marcador PHD0015-01

IV) Seqüência: 229cccgtgggag aatttgctat tttgtcactc tcagttgtt 39

I.a) Número identificador da seqüência: SEQ ID No: 230

II) Características da seqüência:

II.a) tamanho: 32

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Sonda

Invader para Marcador PHD0015-01IV) Seqüência: 230cgcgccgagg gaacttctct attttaccac ca

I.a) Número identificador da seqüência: SEQ ID No: 231

II) Características da seqüência:

II.a) tamanho: 24

II.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Forward para MarcadorPHD0015-01

IV) Seqüência: 231

tgacttgtgt gaccatttgt gtct 24

I.a) Número identificador da seqüência: SEQ ID No: 232

II) Características da seqüência:

II.a) tamanho: 19

Il.b) tipo: DNA

II. c) organismo: Seqüência artificial

III) Características:

III. l.c) outra informação relevante: Primer deoligonucleotideo Reverso para MarcadorPHD0015-01

IV) Seqüência: 232gtccacactg gtgcgtcgt 19

Claims

1. Polinucleotideo isolado, caracterizado pelo fato deque compreende um polinucleotideo selecionado do grupoconsistindo de:(a) uma seqüência de nucleotideos codificante de umpolipeptideo que confere resistência aColletotrichum, sendo que o polipeptideo possuiuma seqüência de aminoácidos com pelo menos 75%de identidade quando comparada à SEQ ID No.:3 combase no algoritmo de alinhamento de Needleman-Wunsch;(b) um complemento da seqüência de nucleotideos,sendo que o complemento e a seqüência denucleotideos consistem do mesmo número denucleotideos e são 100% complementares, e(c) uma seqüência de nucleotideos codificante de umpolipeptideo que confere ou aperfeiçoa aresistência a Colletotrichum, sendo que opolipeptideo possui uma seqüência de aminoácidoscom identidade de pelo menos 75% quando comparadaà seqüência do plasmidio depositado como Depósitode Patente No. NRRL B-30895 com base no algoritmode alinhamento de Needleman-Wunsch.

2. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de aminoácidosdo polipeptideo e a seqüência de aminoácidos da SEQ ID No.: 3 possuem pelo menos 90% de identidade baseada no algoritmode alinhamento de Needleman-Wunsch.

3. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de aminoácidosdo polipeptideo e a seqüência de aminoácidos da SEQ ID No.: 3 possuem pelo menos 95% de identidade baseada no algoritmode alinhamento de Needleman-Wunsch.

4. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de nucleotideoscompreende a SEQ ID No.: 3.

5. Polinucleotideo de acordo com a reivindicação 1,caracterizado pelo fato de que a seqüência de nucleotideoscompreende a seqüência do plasmidio depositado comoDepósito de Patente No. NRRL B-30895.

6. Vetor, caracterizado pelo fato de que compreende opolinucleotideo como definido na reivindicação 1.

7. Constructo de DNA recombinante, caracterizado pelofato de que compreende o polinucleotideo como definido nareivindicação 1, operacionalmente ligado a pelo menos umaseqüência de regulação.

8. Processo para transformar uma célula hospedeira,caracterizado pelo fato de que compreende a transformaçãoda célula hospedeira com o polinucleotideo como definido nareivindicação 1.

9. Processo de acordo com a reivindicação 8,caracterizado pelo fato de que a célula hospedeira é umacélula de planta.

10. Processo de acordo com a reivindicação 9,caracterizado pelo fato de que a célula de planta é oriundade milho.

11. Célula de planta, caracterizada pelo fato de quecompreende o constructo de DNA recombinante como definidona reivindicação 7.

12. Célula de planta, caracterizada pelo fato de quecompreende o polinucleotideo como definido na reivindicação 1 .

13. Célula de planta de acordo com a reivindicação 12,caracterizada pelo fato de que a dita célula de planta éoriunda de milho.

14. Processo para produzir uma planta, caracterizado pelofato de que compreende a transformação de uma célula deplanta com o constructo de DNA recombinante como definidona reivindicação 7 e a regeneração de uma planta a partirda célula da planta transformada.

15. Planta, caracterizada pelo fato de que compreende oconstructo de DNA recombinante como definido nareivindicação 7.

16. Planta de acordo com a reivindicação 15, caracterizadapelo fato de que a planta é milho.

17. Semente, caracterizada pelo fato de que compreende oconstructo de DNA recombinante como definido nareivindicação 7.

18. Semente de acordo com a reivindicação 17,caracterizada pelo fato de que dita semente é semente demilho.

19. Processo para conferir ou aperfeiçoar a resistência aColletotrichum, caracterizado pelo fato de que compreende atransformação de uma planta com o constructo de DNArecombinante como definido na reivindicação 7, conferindoou aperfeiçoando, por esse meio, a resistência aColletotrichum.

20. Processo para determinar a presença ou ausência dopolinucleotideo como definido na reivindicação 1 em umaplanta de milho, caracterizado pelo fato de que compreendepelo menos um dentre:(a) isolar moléculas de ácido nucleico de dita plantade milho e amplificar as seqüências homólogas dopolinucleotideo como definido na reivindicação 1;ou(b) isolar moléculas de ácido nucleico de ditasplantas de milho e realizar a hibridizaçãoSouthern; ou(c) isolar proteínas de dita planta de milho erealizar um western blot usando anticorpos para aproteína Regi; ou(d) isolar proteínas de dita planta de milho erealizar um ensaio ELISA usando anticorpos para aproteína Regi; ou(e) demonstrar a presença de seqüências de mRNAderivadas do transcripto do mRNA Regi e únicopara Regi, determinando, por esse meio, apresença do polinucleotideo como definido nareivindicação 1 na dita planta de milho.

21. Processo para determinar a presença ou ausência dolócus de Regi em uma planta de milho, caracterizado pelofato de que compreende pelo menos um dentre:(a) isolar moléculas de ácido nucleico de dita plantade milho e amplificar as seqüências homólogas dopolinucleotideo como definido na reivindicação 1;ou(b) isolar moléculas de ácido nucleico de dita plantade milho e realizar a hibridização Southern; ou(c) isolar proteínas de dita planta de milho erealizar um western blot usando anticorpos para aproteína Regi; ou(d) isolar proteínas de dita planta de milho erealizar um ensaio ELISA usando anticorpos para aproteína Regi; ou(e) demonstrar a presença de seqüências de mRNAderivadas do transcripto do mRNA Regi e únicopara Regi, determinando, por esse meio, apresença do lócus de Regi na dita planta demilho.

22. Processo para alterar o nivel de expressão de umaproteína capaz de conferir resistência a Colletotrichum emuma célula de planta, caracterizado pelo fato de quecompreende:(a) transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; e(b) colocar para crescer a célula de plantatransformada sob condições que são apropriadaspara a expressão do constructo de DNArecombinante sendo que a expressão do constructode DNA recombinante resulta na produção de niveisalterados de uma proteina capaz de conferirresistência a Colletotrichum na célula de plantatransformada.

23. Processo para alterar o nivel de expressão de umaproteina capaz de conferir resistência a podridão do colmoem uma célula de planta, caracterizado pelo fato de quecompreende:(a) transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; e(b) colocar para crescer a célula de plantatransformada sob condições que são apropriadaspara a expressão do constructo de DNArecombinante sendo que a expressão do constructode DNA recombinante resulta na produção de niveisalterados de uma proteina capaz de conferirresistência a podridão do colmo na célula deplanta transformada.

24. Processo para alterar o nivel de expressão de umaproteína capaz de conferir resistência a Colletotrichum emuma célula de planta, caracterizado pelo fato de quecompreende:(a) transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; e(b) regenerar a planta transformada a partir dacélula de planta transformada; e(c) colocar para crescer a célula de plantatransformada sob condições que são apropriadaspara a expressão do constructo de DNArecombinante sendo que a expressão do constructode DNA recombinante resulta na produção de niveisalterados de uma proteína que é capaz de conferirresistência a Colletotrichum na célula de plantatransformada.

25. Processo para alterar o nivel de expressão de umaproteína capaz de conferir resistência a podridão do colmoem uma célula de planta, caracterizado pelo fato de quecompreende:a. transformar uma célula de planta com o constructode DNA recombinante como definido nareivindicação 7; eb. regenerar a planta transformada a partir dacélula de planta transformada; ec. colocar para crescer a planta transformada sobcondições que são apropriadas para a expressão doconstructo de DNA recombinante sendo que aexpressão do constructo de DNA recombinanteresulta na produção de niveis alterados de umaproteina que é capaz de conferir resistência apodridão do colmo na célula de plantatransformada.

26. Processo para conferir ou aperfeiçoar a resistência aColletotrichum em uma planta de milho, caracterizado pelofato de que compreende:(a) o cruzamento de uma primeira planta de milho emque está ausente o lócus de Regi com uma segundaplanta de milho contendo o lócus de Regi paraproduzir uma população segregante;(b) realizar o screening de dita população segregantecom relação a um membro contendo o lócus de Regicom um primeiro ácido nucléico, não incluindo oUMC15 ou o UMC66, capaz de hibridizar com umsegundo ácido nucléico ligado ao lócus de Regi; e(c) selecionar dito membro para posterior cruzamentoe seleção.

27. Processo de acordo com a reivindicação 26,caracterizado pelo fato de que dito primeiro ácido nucléicoé selecionado do grupo consistindo de:(a) uma seqüência compreendendo um fragmento de pelomenos cerca de 18 nucleotideos contíguosselecionado de SEQ ID No.: 1;(b) uma seqüência compreendendo um fragmento de pelomenos 18 nucleotideos contíguos selecionado dogrupo consistindo de SEQ ID Nos.: 4-13 e SEQ IDNos.: 23-124;(c) uma seqüência que hibridiza com dito segundoácido nucléico, sendo que dito segundo ácidonucléico possui uma seqüência de ácido nucléicode SEQ ID No.: 1; e(d) uma seqüência que hibridiza com dito segundo ácidonucléico, na qual dito segundo ácido nucléicopossui a seqüência de ácido nucléico selecionadado grupo consistindo de SEQ ID Nos.: 4-13 e SEQID Nos.: 23-124.

28. Processo de acordo com a reivindicação 26,caracterizado pelo fato de que a segunda planta de milho éa MP305.

29. Processo de acordo com a reivindicação 26,caracterizado pelo fato de que a segunda planta de milho éa DE811ASR(BC5).

30. Processo para conferir ou aperfeiçoar a resistência apodridão do colmo, caracterizado pelo fato de quecompreende:(a) cruzar uma primeira planta de milho na qual estáausente o lócus de Regi para produzir umapopulação segregante;(b) realizar o screening de dita população segregantecom relação a um membro contendo o lócus de Regicom um primeiro ácido nucleico, não incluindo oUMC15 ou o UMC66, capaz de hibridizar com umsegundo ácido nucleico ligado ao lócus de Regi; e(c) selecionar dito membro para posterior cruzamentoe seleção.

31. Processo de introgressão de resistência ou deresistência aperfeiçoada com relação a Colletotrichum emuma planta de milho, caracterizado pelo fato de quecompreende a realização de seleção assistida por marcadorde dita planta de milho com um marcador de ácido nucléico,sendo que dito marcador de ácido nucléico especificamentehibridiza com uma molécula de ácido nucléico tendo umaprimeira seqüência de ácido nucléico que está ligada a umasegunda seqüência de ácido nucléico que está localizada nolócus de Regi da MP305 e selecionar dita planta de milhocom base em dita seleção assistida por marcador.

32. Processo de acordo com a reivindicação 31,caracterizado pelo fato de que dita introgressão deresistência ou resistência aperfeiçoada a Colletotrichum érealizada por retrocruzamento com uma parental de milhorecorrente que não é resistente a Colletotrichum.

33. Processo de acordo com a reivindicação 31,caracterizado pelo fato de que dita seqüência de marcadorde primeiro ácido nucléico compreende um fragmento de pelomenos cerca de 18 nucleotideos contíguos selecionados deSEQ ID Nos.: 4-13 e SEQ ID Nos.: 23-124 e complementos dasmesmas.

34. Processo de introgressão de resistência ou deresistência aperfeiçoada a podridão do colmo em uma plantade milho, caracterizado pelo fato de que compreende arealização da seleção assistida por marcador de dita plantade milho com um marcador de ácido nucléico, sendo que ditomarcador de ácido nucléico hibridiza com uma molécula deácido nucléico tendo uma primeira seqüência de ácidonucléico que é ligada a uma segunda seqüência de ácidonucléico que está localizada no lócus de Regi e selecionardita planta de milho com base na seleção assistida pormarcador.

35. Processo de identificação de uma planta de milho queapresenta resistência recentemente conferida ouaperfeiçoada a infecção por Colletotrichum, caracterizadopelo fato de que dito processo compreende detectar, nosalelos de planta de milho, pelo menos dois marcadores,sendo que pelo menos um de ditos marcadores está em oudentro do intervalo cromossomico abaixo do UMC2041 e acimado gene Regi, e pelo menos um de ditos marcadores está emou dentro do intervalo cromossomico abaixo do gene Regi eacima do UMC2200.

36. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro do intervalo cromossomicoabaixo do UMC108 6 e acima do gene Regi, e pelo menos um deditos marcadores está em ou dentro do intervalocromossomico abaixo do gene Regi e acima do UMC2200.

37. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro do intervalo cromossomicoabaixo do UMC2285 e acima do gene Regi, e pelo menos um deditos marcadores está em ou dentro do intervalocromossomico abaixo do gene Regi e acima do UMC2187.

38. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos um deditos marcadores está em ou dentro do intervalocromossômico abaixo do gene Regi e acima do UMC15a.

39. Processo de acordo com a reivindicação 38,caracterizado pelo fato de que compreende ainda a seleçãode pelo menos quatro marcadores, sendo que pelo menos doisde ditos marcadores estão dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos doisde ditos marcadores estão dentro do intervalo cromossômicoabaixo do gene Regi e acima do UMC15a.

40. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos um de ditosmarcadores está em ou dentro da SEQ ID No.: 137, sendo quepelo menos um marcador é capaz de detectar um polimorfismolocalizado em uma posição selecionada do grupo consistindoda:(a) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 7230 e 7535;(b) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 11293 e 12553;(c) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 25412 e 29086; e(d) posição na SEQ ID No.:137 correspondente aosnucleotideos entre 43017 e 50330.

41. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que o pelo menos um de ditosmarcadores que está em ou dentro do intervalo cromossômicoabaixo do UMC2041 e acima do gene Regi é selecionado dosmarcadores listados na Tabela 16, e sendo que pelo menos ummarcador em ou dentro do intervalo cromossômico abaixo dogene Regi e acima do UMC2200 é selecionado dos marcadoreslistados na Tabela 16.

42. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que compreende ainda a seleçãode pelo menos quatro marcadores, sendo que pelo menos doisde ditos marcadores estão em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, e pelomenos dois de ditos marcadores estão em ou dentro dointervalo cromossômico abaixo do gene Regi e acima doUMC2200.

43 . Processo de acordo com a reivindicação 42,caracterizado pelo fato de que os pelo menos doismarcadores em ou dentro do intervalo cromossômico abaixo doUMC2041 e acima do gene Regi são selecionados a partir dosmarcadores listados na Tabela 16, e sendo que os pelo menosdois marcadores em ou dentro do intervalo cromossômicoabaixo do gene Regi e acima do UMC2200 são selecionados apartir dos marcadores listados na Tabela 16.

44. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que compreende ainda a seleçãode pelo menos seis marcadores, sendo que pelo menos três deditos marcadores estão em ou dentro do intervalocromossômico abaixo do UMC2041 e acima do gene Regi, e pelomenos três de ditos marcadores estão em ou dentro dointervalo cromossômico abaixo do gene Regi e acima doUMC2200.

45. Processo de acordo com a reivindicação 44,caracterizado pelo fato de que os pelo menos trêsmarcadores em ou dentro do intervalo cromossômico abaixo doUMC2041 e acima do gene Regi são selecionados a partir dosmarcadores listados na Tabela 16, e em que os pelo menostrês marcadores que estão em ou dentro do intervalocromossômico abaixo do gene Regi e acima do UMC2200 sãoselecionados a partir dos marcadores listados na Tabela 16.

46. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que dito processo compreendeainda detectar pelo menos dois ou mais dentre: (a) alelo 7em MZA11123, (b) alelo 2 em MZA2591 e (c) alelo 8 emMZA3434.

47. Planta de milho, caracterizada pelo fato de que éobtenivel pelo processo como definido na reivindicação 46.

48. Semente, caracterizada pelo fato de que é da planta demilho como definida na reivindicação 47.

49. Planta de milho obtida pelo processo como definido nareivindicação 35, caracterizada pelo fato de que a plantade milho não compreende os mesmos alelos como providos naMP305 em ou acima do UMC2041 ou em ou abaixo do UMC2200 noslócus mostrados na Tabela 16.

50. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que compreende ainda dadostransmitidos eletronicamente ou armazenados eletronicamenterepresentantes dos alelos detectados em um meio de leiturapor computador.

51. Processo de acordo com a reivindicação 35,caracterizado pelo fato de que detecta ainda, na planta demilho, a presença ou ausência de pelo menos um marcadordentro do gene Regi.

52. Processo de acordo com a reivindicação 51,caracterizado pelo fato de compreende ainda a seleção depelo menos quatro marcadores, sendo que pelo menos dois deditos marcadores estão dentro do intervalo cromossômicoabaixo do UMC2285 e acima do gene Regi, e pelo menos doisde ditos marcadores estão dentro do intervalo cromossômicoabaixo do gene Regi e acima do UMC15a.

53. Processo de acordo com a reivindicação 51,caracterizado pelo fato de que o gene Regi é colocado porintrogressão, a partir de uma planta de milho doadora, emuma planta de milho receptora para produzir uma planta demilho introgredida.

54. Processo de acordo com a reivindicação 53,caracterizado pelo fato de que a planta de milho doadora éa MP305 ou a DE811ASR(BC5).

55. Processo de acordo com a reivindicação 53,caracterizado pelo fato de que a planta de milhointrogredida é selecionada para um evento de recombinaçãoabaixo do gene Regi e acima do UMC15a, de modo que a plantade milho introgredida retém um primeiro intervalocromossômico derivado da MP305 abaixo do gene Regi e acimado UMC15a, e não retém um segundo intervalo cromossômicoderivado da MP305 em ou abaixo do UMC15a.

56. Planta de milho introgredida, caracterizada pelo fatode que é obtenivel pelo processo como definido nareivindicação 55.

57. Semente de planta de milho introgredida, caracterizadapelo fato de que a planta é a planta de milho introgredidacomo definida na reivindicação 56.

58. Planta de milho introgredida produzida pelo processocomo definido na reivindicação 55, caracterizada pelo fatode que a planta de milho introgredida é uma conversão delócus de Regi da PH705, PH5W4, PH51K ou PH87P, ou umaprogênie das mesmas.

59. Processo de identificação de uma planta de milho queapresenta resistência aperfeiçoada a infecção porColletotr ichum, caracterizado pelo fato de que ditoprocesso compreende detectar na planta de milho a presençaou ausência de pelo menos um marcador no lócus de Regi, eselecionar a planta de milho na qual pelo menos um marcadorestá presente.

60. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que o pelo menos um marcadorestá em ou dentro da SEQ ID No.: 137.

61. Processo de acordo com a reivindicação 60,caracterizado pelo fato de que o pelo menos um marcador écapaz de detectar um polimorfismo localizado em uma posiçãoselecionada do grupo consistindo da:(a) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 1 e 536;(b) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 7239 e 7535;(c) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 11293 e 12553;(d) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 25412 e 29086; e(e) posição na SEQ ID No.: 137 correspondente aosnucleotideos entre 43017 e 50330.

62. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que o pelo menos um marcadorestá em ou dentro da seqüência codificante do Regi.

63. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que a seqüência codificante daRegi compreende uma seqüência de nucleotideos codificantede um polipeptideo, sendo que o polipeptideo possui umaseqüência de aminoácidos com pelo menos 95% de identidadequando comparada com a SEQ ID No.:3 baseada no algoritmo dealinhamento de Needleman-Wunsch.

64. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que o pelo menos um marcadorestá em ou dentro do polinucleotideo definido na SEQ ID No.: 1.

65. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que pelo menos um marcadordetecta um polimorfismo simples de nucleotideos em umaposição na seqüência de nucleotideos definida como SEQ IDNo. : 1 correspondente a uma ou mais posições 413, 958, 971, 1099, 1154, 1235, 1250, 1308, 1607, 2001, 2598, e 3342.

66. Processo de acordo comcaracterizado pelo fato de que oum marcador de SNP selecionado C00060-01 e C00060-02.

67. Processo de acordo com a reivindicação 62,caracterizado pelo fato de que o pelo menos um marcador éum marcador de FLP em um amplicon gerado por um par deprimers compreendendo um primeiro e um segundo primer,sendo que o primeiro primer é selecionado do grupoconsistindo da:a reivindicação 62, pelo menos um marcador édo grupo consistindo de(a) seqüência definida na SEQ ID No.: 35 e ocomplemento da mesma;(b) seqüência definida na SEQ ID No.: 37 e ocomplemento da mesma;(c) seqüência definida na SEQ ID No.: 39 e ocomplemento da mesma; e(d) seqüência definida na SEQ ID No.: 41 e ocomplemento da mesma;e sendo que o segundo primer é selecionado do grupoconsistindo da:(a) seqüência definida na SEQ ID No.: 36 e ocomplemento da mesma;(b) seqüência definida na SEQ ID No.: 38 e ocomplemento da mesma;(c) seqüência definida na SEQ ID No.: 40 e ocomplemento da mesma; e(d) seqüência definida na SEQ ID No.: 42 e ocomplemento da mesma.

68. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que o pelo menos um marcadordetecta uma seqüência de mRNA derivada do transcripto demRNA Regi e único para Rcg1.

69. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que dito processo compreendeainda a detecção na planta de milho da presença ou ausênciade pelo menos dois marcadores dentro do lócus de Regi.

70. Processo de acordo com a reivindicação 69,caracterizado pelo fato de que os pelo menos doismarcadores são o C00060-01 e o C00060-02.

71. Processo de acordo com a reivindicação 70,caracterizado pelo fato de que o lócus de Regi é colocadopor introgressão, a partir de uma planta de milho doadora,em uma planta de milho receptora para produzir uma plantade milho introgredida.

72. Processo de acordo com a reivindicação 71,caracterizado pelo fato de que a planta de milho doadora éa MP305 ou a DE811ASR(BC5).

73. Planta de milho introgredida, caracterizada pelo fatode que é obtenivel pelo processo como definido nareivindicação 72.

74. Semente de uma planta de milho introgredida,caracterizada pelo fato de que dita planta é a planta demilho introgredida como definida na reivindicação 73.

75. Planta de milho introgredida produzida pelo processocomo definido na reivindicação 72, caracterizada pelo fatode que a planta de milho introgredida é uma conversão dolócus de Regi da PH705, PH5W4, PH51K ou da PH87P, ou de umaprogênie da mesma.

76. Processo de acordo com a reivindicação 59,caracterizado pelo fato de que compreende dadoseletronicamente transmitidos ou eletronicamente armazenadosrepresentando a presença ou ausência do pelo menos ummarcador em um meio de leitura em computador.

77. Semente de milho, caracterizada pelo fato de quecompreende um primeiro intervalo cromossômico derivado daMP305 definido por BNLG2162 e UMC1051, e não compreendendo um segundo intervalo cromossômico derivado da MP305 acimado BNLG2162 ou abaixo do UMC1051.

78. Semente de milho de acordo com a reivindicação 77,caracterizada pelo fato de que dita semente de milhocompreende o gene Regi e, quando crescida, produz umaplanta de milho que apresenta resistência a infecção porColletotrichum.

79. Semente de milho, caracterizada pelo fato de quecompreende um primeiro intervalo cromossômico derivado daMP305 entre, mas não incluindo, o MZA15842 e o UMC15a, enão compreendendo um segundo intervalo cromossômicoderivado da MP305 em ou acima do MZA15842 ou em ou abaixodo UMC15a.

80. Semente de milho de acordo com a reivindicação 79,caracterizada pelo fato de que dita semente de milhocompreende o gene Regi e, quando crescida, produz umaplanta de milho que apresenta resistência a infecção porColletotrichum.

81. Semente de milho, caracterizada pelo fato de que é deuma variedade designada DE811ASR(BC5), ou uma semente daprogênie derivada da mesma que compreende o gene Regi, quequando crescida, produz uma planta que apresentaresistência aperfeiçoada ou recentemente conferida ainfecção por Colletotrichum.

82. Semente de acordo com a reivindicação 81,caracterizada pelo fato de que uma amostra representativade dita variedade de milho DE811ASR(BC5) foi depositadacomo número de acesso ATCC PTA-7434.

83. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que dita semente de progênieretém um primeiro intervalo cromossômico derivado da MP305ou da DE811ASR(BC5) dentro do, mas não incluindo, UMC2285 eUMC15a.

84. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que dita semente de progênieretém um primeiro intervalo cromossômico derivado da MP305ou da DE811ASR(BC5) dentro do, mas não incluindo, MZA15842e UMC15a.

85. Planta, caracterizada pelo fato de que é produzida ápartir da semente como definida em qualquer uma dasreivindicações 77 a 84.

86. Célula de planta, caracterizada pelo fato de que é daplanta como definida na reivindicação 85.

87. Semente de progênie de acordo com a reivindicação 84caracterizada pelo fato de que a semente de progênie é umaconversão do lócus de Regi de PH705, PH5W4, PH51K ou PH87P,ou de uma progênie das mesmas.

88. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que a semente de progêniecompreende pelo menos dois ou mais dentre: (a) alelo 7 noMZA11123, (b) alelo 2 no MZA2591, ou (c) alelo 8 noMZA3434.

89. Planta de milho, caracterizada pelo fato de que éproduzida pela semente de progênie como definida nareivindicação 88.

90. Semente de progênie de acordo com a reivindicação 81,caracterizada pelo fato de que a semente de progêniecompreende um nucleotídeo citosina no MZA2591.32, umnucleotideo timina no MZA2591.35, e um nucleotideo citosinano MZA3434 .17 .

91. Planta de milho, caracterizada pelo fato de que éproduzida pela semente de progênie como definidareivindicação 96.

92. Sistema de computador para identificar uma planta demilho que apresenta resistência recentemente conferida ouaperfeiçoada a infecção por Colletotrichum, caracterizadopelo fato de que o sistema compreende:(a) uma base de dados compreendendo uma informação deescore de alelos para uma ou mais plantas demilho com relação a quatro ou mais lócus demarcador proximamente ligados ou dentro do lócusde Regi, e(b) instruções que examinem a dita base de dados paradeterminar a hereditariedade do intervalocromossômico ou porções do mesmo definida pelosquatro ou mais lócus de marcador e computar ainformação se uma ou mais plantas de milhocompreendem ou não o gene Regi.

93. Sistema de computador para identificar uma planta demilho que apresenta resistência recentemente conferida ouaperfeiçoada a infecção por Colletotrichum, caracterizadopelo fato de que o sistema compreende:(a) uma base de dados compreendendo informação deescore de alelos para uma ou mais plantas demilho com relação a um ou mais lócus de marcadordentro do lócus de Regi, e(b) instruções que examinem dita base de dados paradeterminar a hereditariedade do lócus de Regi.

94. Sistema de computador de acordo com a reivindicação 93, caracterizado pelo fato de que a informação de escorede alelos para uma ou mais plantas de milho adicionalmentecompreende dois ou mais lócus de marcador dentro do lócusde Rcg1.

95. Sistema de computador de acordo com a reivindicação-93, caracterizado pelo fato de que a informação de escorede alelos para uma ou mais plantas de milho adicionalmentecompreende três ou mais lócus de marcador dentro do lócusde Rcg1.

96. Marcador genético, caracterizado pelo fato de que estáem ou dentro de uma seqüência selecionada do grupoconsistindo de: <table>table see original document page 357</column></row><table>

97. Marcador genético, caracterizado pelo fato de estarlocalizado em ou no lócus de Rcg1.

98. Marcador genético de acordo com a reivindicação 97,caracterizado pelo fato de que o marcador genético está emSEQ ID No.: 137, em uma região selecionada do grupoconsistindo da:(a) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 1 e 536;(b) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 7230 e 7535;(c) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 11293 e 12553;(d) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 25412 e 29086; e(e) região em SEQ ID No.: 137 correspondente aosnucleotideos entre 43017 e 50330.

99. Marcador genético de acordo com a reivindicação 97,caracterizado pelo fato de que o marcador genético está emou dentro do gene Regi.

100. Marcador genético de acordo com a reivindicação 99,caracterizado pelo fato de que o marcador genético está emSEQ ID No.: 1, em ou dentro da posição selecionada do grupoconsistindo de: (a) posição 550-658 da SEQ ID No.: 1; (b)posição 1562-1767 da SEQ ID No.: 1.

101. Marcador genético de acordo com a reivindicação 99,caracterizado pelo fato de que o marcador genético está emum amplicon gerado por um par de primers compreendendo umprimeiro e um segundo primer, sendo que o dito primeiroprimer é selecionado do grupo consistindo de:(a) SEQ ID No.: 23 e o complemento da mesma;(b) SEQ ID No.: 25 e o complemento da mesma;(c) SEQ ID No.: 27 e o complemento da mesma;(d) SEQ ID No.: 29 e o complemento da mesma;(e) SEQ ID No.: 31 e o complemento da mesma;(f) SEQ ID No.: 33 e o complemento da mesma;(g) SEQ ID No.: 35 e o complemento da mesma;(h) SEQ ID No.: 37 e o complemento da mesma;(i) SEQ ID No.: 39 e o complemento da mesma; e(j) SEQ ID No.: 41 e o complemento da mesma,e sendo que o segundo primer é selecionado do grupoconsistindo de:(a) SEQ ID No.: 24 e o complemento da mesma;(b) SEQ ID No.: 26 e o complemento da mesma;(c) SEQ ID No.: 28 e o complemento da mesma;(d) SEQ ID No.: 30 e o complemento da mesma;(e) SEQ ID No.: 32 e o complemento da mesma;(f) SEQ ID No.: 34 e o complemento da mesma;(g) SEQ ID No.: 36 e o complemento da mesma;(h) SEQ ID No.: 38 e o complemento da mesma;(i) SEQ ID No.: 40 e o complemento da mesma; e(j) SEQ ID No.: 42 e o complemento da mesma.

102. Planta de milho, caracterizada pelo fato de que éobtenivel pelo método compreendendo: o cruzamento da MP305ou DE811ASR(BC5) [Depósito No. PTO-7434], como uma primeiraplanta parental, com uma planta diferente na qual estáausente um lócus de Regi, como uma segunda parental,obtendo-se, por esse meio, a progênie compreendendo o lócusde Rcg1 da primeira parental e, opcionalmente, aindacompreendendo uma ou mais etapas de melhoramento para obtera progênie de uma ou mais gerações posteriorescompreendendo o lócus de Regi da primeira parental.

103. Planta de milho de acordo com a reivindicação 102,caracterizada pelo fato de que é uma planta de milhoendogâmica.

104. Planta de milho de acordo com a reivindicação 102,caracterizada pelo fato de que é uma planta de milhohíbrida.

105. Semente da planta como definida em qualquer uma dasreivindicações 102 a 104, caracterizada pelo fato de quecontém um lócus de Regi.

106. Semente da planta definida na reivindicação 105,caracterizada pelo fato de que é homozigota com relação adito lócus de Regi.

107. Semente da planta como definida na reivindicação 105,caracterizada pelo fato de que é heterozigota com relação adito lócus de Regi.

108. Método de obtenção de um produto de milho,caracterizado pelo fato de que compreende o provimento desemente que inclui uma semente como definida em qualqueruma das reivindicações 105 a 107 e processamento de ditasemente para obter dito produto.

109. Método de obtenção de um produto de milho,caracterizado pelo fato de que compreende o crescimento deuma planta como definida em qualquer uma das reivindicações 102 a 104, obter a semente da mesma e processamento de ditasemente para obter dito produto.

110. Uso da semente como definida em qualquer uma dasreivindicações 105 a 107, caracterizado pelo fato de que éem alimento ou forragem ou na produção de um produto demilho.

111. Método ou uso de acordo com qualquer uma dasreivindicações 108 a 110, caracterizado pelo fato de quedito produto é farinha de milho, amido de milho, cereal demilho ou óleo de milho.