BRPI0616979A2

BRPI0616979A2 - molécula de ácido nucléico isolada do café (coffea spp), moléculas de mrna e cdna, oligonucleotìdeo, vetor, célula hospedeira, planta fértil e método de modular sabor ou aroma de grãos de café

Info

Publication number: BRPI0616979A2
Application number: BRPI0616979-1A
Authority: BR
Inventors: Maud Lepelley; Gerald Cheminade; James Gerard Mccarthy; Chenwei Lin; Steven D Tanksley; Vincent Petiard
Original assignee: Univ Cornell; Nestec Sa
Priority date: 2005-10-07
Filing date: 2006-10-10
Publication date: 2011-07-05
Also published as: WO2007044751A2; US8362328B2; ECSP088355A; AU2006302107A1; US20090158456A1; CA2625350A1; AP2008004413A0; CN101326194A; WO2007044751A3; EP1940868A2

Abstract

MOLéCULA DE áCIDO NUCLéICO ISOLADA DO CAFé (COFFEA SPP), MOLéCULAS DE mRNA E cDNA, OLIGONUCLEOTìDEO, VETOR, CéLULA HOSPEDEIRA, PLANTA FéRTIL E MéTODO DE MODULAR SABOR OU AROMA DE GRãOS DE CAFé. A presente invenção refere-se a polinucleotídeos e polipeptídeos envolvidos na via biossintética de ácidos clorogónicos na planta de café são revelados. Também revelados são métodos para usar estes polinucleotídeos e polipeptídeos para a manipulação de sabor, aroma, e outras características de feijões de café, como também para a proteção de plantas de café contra doenças ou tensão oxidativa.

Description

Relatório Descritivo da Patente de Invenção para "MOLÉCULADE ÁCIDO NUCLÉICO ISOLADA DO CAFÉ (COFFEA SPP), MOLÉCULASDE mRNA E cDNA, OLIGONUCLEOTÍDEO, VETOR, CÉLULA HOSPE-DEIRA, PLANTA FÉRTIL E MÉTODO DE MODULAR SABOR OU AROMADE GRÃOS DE CAFÉ".

Campo da Invenção

A presente invenção refere-se ao campo de biotecnologia agrí-cola. Em particular, a invenção caracteriza polinucleotídeos de plantas decafé que codificam enzimas envolvidas na via de fenilpropanóide, conduzin-do à síntese de ácido clorogênico, como também métodos para usar estespolinucleotídeos para regulação de gene e manipulação de sabor, aroma eoutras características dos feijões de café, e na proteção do pé de café dedoença e tensão oxidativa.

Antecedentes da Invenção

Várias publicações, incluindo patentes, pedidos de patente pu-blicados e artigos escolares, são citados ao longo do relatório descritivo. Ca-da uma destas publicações é aqui incorporada por referência, em sua totali-dade. Citações não completamente expostas dentro do relatório descritivopodem ser encontradas no término do relatório descritivo.

Aroma e sabor de café são componentes fundamentais na pre-ferência de consumidor para variedades e marcas de café. Caules de aromae sabor característicos de café de uma série complexa de reações químicasque envolvem precursores de sabor (reações de Maillard) que ocorrem du-rante a torrefação do feijão. Precursores de sabor incluem compostos quími-cos e biomoléculas presentes no feijão de café verde. Até agora, mais de800 químicas e biomoléculas foram identificadas como contribuindo para osabor e aroma do café (Flament, I. 2002 Coffee Flavor Chemistry J. Wiley, U.K.).

Porque os consumidores de café estão ficando cada vez maissofisticados, é desejável produzir café com aroma e sabor melhorados parasatisfazer as preferências do consumidor. Tanto aroma como sabor podemser artificialmente conferidos em produtos de café através de meios quími-cos. Vide, por exemplo, Patente U. S. N9 4.072.761 (aroma) e Patente U. S.Nq 3.962.321 (sabor). Porém, até agora, há pouca informação com relação àinfluência dos componentes do grão de café natural como polissacarídeos,proteínas, pigmentos, e lipídios. Em aroma e sabor de café. Um método é selecionar variedades do germplasma existente tendo características de sa-bor superiores. Uma desvantagem para este método é que, freqüentemente,as variedades de qualidade mais alta também possuem traços agronômicosnegativos significativos, como rendimento fraco e resistência baixa a doen-ças e tensões ambientais. É também possível selecionar variedades novasde ensaios de criação em que variedades com traços industriais e agronômi-cos diferentes são cruzadas e sua progênie é triada para qualidade alta edesempenho agronômico bom. Porém, este último método é muito duradou-ro, com um experimento de cruzamento e seleção em três estações de cres-cimento tomando um mínimo de 7-8 anos. Desse modo, um método alterna- tivo para intensificar a qualidade do café seria usar técnicas de biologia mo-lecular para intensificar aqueles elementos responsáveis pelo sabor e aromaque são encontrados naturalmente no feijão de café, ou adicionar elementosintensificadores de aroma e sabor que não ocorrem naturalmente nos feijõesde café. Engenharia genética é particularmente adaptada para alcançar es- tes fins. Por exemplo, proteínas de café de espécies de café diferentes po-dem ser trocadas. Na alternativa, a expressão de genes que codifica proteí-nas de café de ocorrência natural que positivamente contribuem para o sa-bor do café pode ser intensificada. Inversamente, a expressão de genes quecodifica proteínas de café de ocorrência natural que negativamente contribu- em para o sabor do café pode ser suprimida.

Cafés de variedades e origens diferentes exibem variações dequalidade de sabor e aroma significativos e quando as amostras de grãosverdes são assadas e processadas da mesma maneira. As diferenças dequalidade são uma manifestação nas variações químicas e físicas dentro das amostras de grãos que resultam principalmente das diferenças das con-dições de crescimento e processamento, e também das diferenças no fundogenético tanto da planta materna como do grão. No nível de composiçãoquímica, pelo menos parte da qualidade do sabor pode ser associada àsvariações nos níveis de metabólitos pequenos, como açúcares, ácidos, fenó-licos, e cafeína encontrados associados ao grão de variedades diferentes. Éaceito que haja outras moléculas de sabor e precursor de sabor menos ca-racterizado. Além disso, é provável que variações estruturais dentro do grãotambém contribuam para as diferenças na qualidade do café. Um métodopara encontrar novos componentes no grão de café ligados à qualidade docafé é estudar os genes e proteínas diferencialmente expressos durante amaturação das amostras de grãos em variedades diferentes que possuemcaracterísticas de qualidade diferentes. Similarmente, genes e proteínas queparticipam na biossíntese de moléculas de sabor e de precursor de saborpodem ser estudados.

Ácidos clorogênicos são exemplos de moléculas de sabor e deprecursor de sabor candidatos. Ácidos clorogênicos (CGA) é um grupo im-portante de compostos não-voláteis encontrados em grão de café verde.CGA são compostos de uma família de ésteres entre certos ácidos trans-cinâmicos (caféicos e ferúlicos) e ácido quínico (Clifford et al., 2000). No fei-jão de café, a maioria do CGA pode ser categorizada como pertencendo auma das três classificações: ácidos cafeoilquínicos (CQA; 3-CQA, 4-CQA, e5-CQA); ácidos dicafeoilquínicos (diCQA; 3,4-diCQA, 3,5-diCQA, e 4,5-diCQA); e ácidos feruloilquínicos (FQA). No grão de café verde maduro, osníveis de CGA são variáveis, variando de aproximadamente 7,88% a 14,4%em uma base de substância seca (DMB) para Coffea canephora (robusta), eaproximadamente 3,4% a 4,8% em uma DMB para Coffea arabica (Ky et al.,2001). Clifford sugeriu que o teor de CGA em Coffea canephora varia de 7%a 10% em uma DMB enquanto que Coffea arabica varia de 5 a 7,5% emuma DMB. (Clifford et al., 1985). Em C. canephora, CQA é estimado com-preender 67% do teor de CGA total, e diCQA compreende aproximadamente20%, e FQA compreende aproximadamente 13%. Em C. arabica, CQA,diCQA e FQA corresponderam em média a 80, 15, e 5% do teor de CGAtotal, respectivamente (Ky et al., 2001).

Muito é conhecido a cerca da via de fenilpropanóide prematuraque conduz à síntese de CGA em plantas. (Dixon, R., e Paiva1 N., 1995Plant Cell 7, 1085-1097; Douglas, C.J. 1996 Trends Plant Sci., 1 171-178).

Uma visão geral desta via biossintética é resumida graficamente na Figura 1(Hoffmann et al. 2004). A primeira etapa envolve a conversão de fenilalaninaem ácido cinâmico através de amônia de fenilalanina Iiase (PAL). Quatrogenes de PAL diferentes Foram caracterizados em Arabidopsis, e aquelesgenes parecem entrar em dois grupos diferentes (Raes, J et al. 2003, PlantPhysiology 133, 1051-1071). A expressão e atividades das isoformas de PALdiferentes representam um ponto de ramificação principal entre metabolismoprimário e secundário em plantas, e como tal, as isoformas de PAL diferen-tes estão sob controle regulador complexo. (Dixon, R., e Paiva, N., 1995Plant Cell 7, 1085-1097; Rohde, A., et al. 2004 Plant Cell, 16 p2749-2771). Apróxima enzima na via é trans-cinamato-4-hidroxilase (C4H) (número de a-cesso BAA24355; CYP73A5 Arabidopsis thaliana) que converte ácido cinâ-mico em ácido p-cumárico. Até agora, apenas um gene foi encontrado paraesta monooxigenase dependente de P450 em Arabidopsis, enquanto queem algumas outras plantas, dois ou mais genes de C4H foram encontradosque entram em duas classes distintas (Reas et al., 2003). A próxima etapana via é realizada através de 4-cumarato:Co Iigase (4CL). Pelo menos qua-tro genes de 4CL e nove genes semelhantes a 4CL foram identificados nogenoma de Arabidopsis (Raes et al. 2003). 4CL forma ésteres entre os CoAe compostos fenólicos como ácido p-cumárico, ácido caféico, ácido ferúlico,ácido 5-hidroxiferúlico, e ácido sinápico (Hu et al. 1998).

Embora as enzimas envolvidas com a parte prematura da via defenilpropanóide fossem conhecidas por vários anos, as acil transferases ne-cessárias para a próxima etapa, hidroxicinamoil-CoA transferase (HCT) (ta-baco) e hidroxicinamoil-CoA: quinato hidroxicinamoil transferase (HQT) (detomate e tabaco) foram purificadas apenas recentemente, e suas seqüênciasde DNA correspondentes clonadas e estudadas (Hoffmann et al. 2003 J. BiolChem 278, 95-103; Niggeweg et al. 2004 Nature Biotechnology, 22, 746-754). Estas enzimas catalisam formação de éster entre p-cumaroil-CoA oucafeoil-CoA e chiquimato ou quinato para gerar CGA. HCT foi também mos-5trado catalisar a reação reversa, isto é, degradação de CGA (Hoffmann etai., 2003). Apenas um gene que codifica uma enzima para esta etapa, umHCT, foi identificada em Arabidopsis (Raes, et al. 2003). A próxima etapa davia de fenilpropanóide, a hidroxilação da posição 3 de cumarato, foi elucida- da apenas recentemente. Schoch et al. descobriram que uma proteína deP450 de Arabidopsis (CYP98A3) foi capaz de hidroxilar a posição 3 de cu-marato, mas apenas quando foi estereficada com chiquimato ou quinato.(2001 J. Biol Chem 276, 36566-36574). Três genes que codificam esta en-zima, que é chamada p-cumarato 3-hidroxilase (C3H), foram identificados no genoma de Arabidopsis. Porém, Raes et al. (2003) descobriu que apenasum destes genes (C3H1) é expressado em todos os tecidos examinados,enquanto que os outros dois genes são expressados apenas em um númerolimitado de tecidos e em tempos particulares durante o desenvolvimento.

O modelo atual da via de fenilpropanóide (Figura 1) sugere que as atividades diretas e reversas de HCT/HQT representem um papel na mo-dulação dos níveis de precursor de lignina, e desse modo influencia as quan-tidades e tipos de lignina sendo formada nas plantas. Após a hidroxilaçãomediada por C3H, cafeoil-CoA pode ser liberada de qualquer ácido quínicode cafeoil ou ácido chiquímico de cafeoil por HCT/HQT e é depois submetida à atividade de cafeoil-CoA 3-0 metitransferase (CCoAOMT) resultando naformação de feruloil CoA (Zhang e Chinnappa 1997 J. Biosci. 22, 161-175 ;Zhong et al. 1998. Plant Cell 10, 2033-2046). CCoAOMT pode também meti-lar 5-hidroxiferuloil-CoA para sinapoil-CoA (Zhong et al. 1998). Há sete ge-nes de CCoAOMT putativos em Arabidopsis, e como em outras plantas, pa- recem ser duas classes de genes de CCoAOMT (Zhong et al. 1998; Raes etal. 2003). Três classes de CCoAOMT distintas foram agora caracterizadasem tabaco (Maury et al, 1999). Genes 1 de CCoAOMT da classe incluem oúnico gene de CCoAOMT de Arabidopsis recém caracterizado, CCoAOMT-1, e a maior parte dos genes de CCoAOMT caracterizados em outras plan-tas. Os genes de CCoAOMT putativos restantes entram na classe 2 (Raes etal. 2003). CCoAOMT-1 de Arabidopsis é o gene mais altamente expresso,com expressão detectada em todos os tecidos examinados; expressão infe-rior de CCoAOMT-5 e CCoAOMT-7 de Arabidopsis pode também ser detec-tada em todos os tecidos, e expressão baixa de CCoAOMT-2, -3, -4, e -6pode ser detectada em tecidos específicos (Raes et al. 2003). Devido suaexpressão ubíqua relativamente alta, acredita-se que CCoAOMT-1 de Arabi-dopsis, e provavelmente ortólogos em outras plantas, representem um papelfundamental na lignificação que é associado ao desenvolvimento das células(Raes et al. 2003).

Inicialmente, muitos estudos da via de fenilpropanóide focaliza-ram em entender o fluxo geral de precursores para a síntese de flavonóides,antocianinas,-as formas diferentes de lignina, e como a via foi regulada. Po-rém, devido à evidência crescente que dietas ricas em antioxidantes podereduzir o risco de câncer e doença degenerativa protegendo contra tensõesoxidativas (Bazzano, L., et al. 2002; Astley, S., 2003) estudos mais recentesavaliaram metabólitos intermediários da via de fenilpropanóide que estãopresentes em níveis altos e foi descoberto possuir atividade antioxidante alta(Hoffmann et al. 2004, Niggeweg et al. 2004). Por exemplo, os ácidos cloro-gênicos constituem um grupo importante de antioxidantes em fertilizantescomo maçãs, pêras, tomate, batata, e berinjela, como também grão de caféverde e assado (feijões). Além do fato que o aporte dietético de CGA é me-Ihor alcançado mediante consumo de fertilizantes, esta classe de moléculastambém mostre biodisponibilidade significativa (Nardini et al. 2002, J. AgricFood Chem. 50, 57355741; Couteau1 et al., 2001, J. Applied Microbiol. 90,873-881; Clifford, M., 2004, Planta Med 70, 1103-1114.). O envolvimento deCGA na redução de tensões oxidativas foi demonstrado mais diretamenteem plantas. Por exemplo, Shadle et al. (2003) demonstraram que sobreex-pressão da enzima PAL em tabaco, que é responsável pela primeira etapana biossíntese de CGA, resultou em um aumento de aproximadamente cincovezes no teor de CGA com relação às plantas do tipo selvagem, e demons-trou resistência ao patógeno fúngico Cercospora nicotianae. Evidência adi-cional foi gerada por Niggeweg et al. (2004), da superprodução de HQT notomate usando um promotor constitutivo (2x promotor de 35S). Foi demons-trado que níveis mais altos de HQT, uma enzima diretamente envolvida nasíntese de CGA, resultou em níveis mais altos de CGA, resistência melhora-da à tensão oxidativa, e resistência aumentada da planta a um patógenomicrobiano. Há uma realização crescente do potencial para CGA dietéticofazer contribuições importantes ao fundo geral de antioxidante no plasma, eé possível que uma ou mais moléculas do tipo CGA poderiam ser transfor-madas em metabólitos novos ou adicionais possuindo atividades promotorasde saúde (vide, por exemplo, Clifford 2004). Além disso, é evidente que CGApode representar um papel na resistência das plantas às doenças. Dessemodo, há uma necessidade para melhor entender, como também facilitar asíntese e acumulação destes compostos nas plantas.

Ácidos clorogênicos são abundantes em café. Apesar do fatoque tais moléculas representam um papel importante na saúde das plantas ede humanos, e em sabor de café geral, aroma, e qualidade, poucos estudosanalisaram a via de fenilpropanóide de café, e dados como tais, disponíveissobre CGA em café são limitados. Campa et al. identificaram uma seqüênciade CCoAOMT putativa parcial (número de acesso AF534905) (Campa et al.,2003), e mapearam esta seqüência no genoma de café. Além disso, um dosdois alelos identificados para este gene foi descoberto ser associado ao ní-vel geral de ácidos clorogênicos. Bauman et al., isolaram duas seqüênciasde cDNA parciais que codificam de PAL de café (números de acesso A-AF27655 e AAF27654), e Campa et al., isolaram duas seqüências de cDNAque codificam PAL1 (número de acesso AAN32866) e PAL2 (número de a-cesso AAN32867) de café. Alinhamento de seqüência das regiões que so-brepõem as quatro proteínas correspondentes foi feito com Clustal W, e es-tas quatro seqüências foram descobertas estar altamente relacionadas, com94 a 99,5% de identidade prognosticado no nível de proteína, e maior que97,1% de identidade no nível de ácido nucléico. Este nível de identidade su-gere que estas quatro seqüências provavelmente representam um PAL decafé simples.

Ácidos clorogênicos são degradados progressivamente durantea torrefação de café (De Maria et al., 1995). De fato, estas alterações repre-sentam uma das alterações composicionais importantes que ocorrem duran-te este processo (Bicchi et al. 1995). Foi relatado que 8-10% do teor de CGAsão perdidos com cada 1% de perda de substância seca. (Clifford et al.1985, 1998). Durante a torrefação, CGA é transformado em uma série decompostos voláteis e não-voláteis (S. Homma, 2001). Por exemplo, isomeri-zação e hidrólise podem levar à geração de vários ácidos quínicos e quini-das, como também ácidos cinâmicos (Homma, 2001), com o último gruposendo também degradado por meio de descarboxilação em uma faixa decompostos fenólicos, incluindo compostos voláteis como 4-vinilguaiacol, queestá associado a um aroma de café típico (Homma 2001, Farah et al., 2005;e Rizzi1G., et al., 1993 "Flavor chemistry based on the thermally-induced de-carboxilação of p-hydroxycinnamic acids. In Food Flavors, Ingredients andComposition (ed. Charalambous) páginas 663-670 Elsevier Science Publi-shers, Amsterdã, Países Baixos).

Os produtos de degradação de CGA, particularmente a forma-ção de Iactonas de ácido clorogênico e Iactonas de ácido quínico, estão as-sociados à percepção de amargura em café preparado, e um aumento emacidez encontrado no café após preparo ter sido associado à geração deácidos quínicos livres (Homma, 2001, Leloup et al, 1995; e Buffo et al,2004). Mais recentemente, Muller e Hofmann descobriram que ácidos cloro-gênicos e seus produtos de degradação térmica agem como sítios de liga-ção de tiol (2005, J. Agric e Biol Chem 53, 2623-2629). Porque compostoscontendo tiol, como 2-furfuriltiol e 3-metil-2-buteno-1-tiol, são componentesimportantes de um aroma de café, foi proposto que os ácidos clorogênicos ecompostos relacionados reagem com os compostos de aroma em uma bebi-da de café, reduzindo o aroma de café eficazmente após preparo. (Muller eHofmann, 2005).

Embora esteja claro que os ácidos clorogênicos influenciam nosabor do café, ainda está obscuro se todos os ácidos clorogênicos tiveramum efeito equivalente. Portanto, há uma necessidade para gerar variedadesde café definidas com diferenças claras em seus perfis de CGA. Há duasrotas diferentes para a seleção de variedades de café com perfis diferentes.

A primeira é usar procriação e seleção clássicas, e este método pode sersignificativamente auxiliado pela informação genética acerca da via biossin-tética de CGA. Tal informação permitirá alelos dos genes fundamentais se-rem identificados e seguidos no material de procriação e progênie. O segun-do método global é diretamente alterar genes fundamentais específicos en-volvidos na síntese de CGA. Tal pode ser realizado por meio de mutagênesee seleção (TILLING), ou por meio da geração de alterações da expressão degene específica usando clonagem de gene e transformação de café. Grãodestas novos não-GMO, ou variedades de GMO1 que alteraram os perfis deCGA podem depois ser subseqüentemente avaliados por seu teor de produ-tos de degradação de ácido clorogênico e perfis de sabor após torrefação.Aqueles observados ser superiores em sabor e outras características podemdepois ser selecionados para estudos adicionais.

Teor de ácido clorogênico crescente em grão de café poderia le-var a um aumento em derivados de CGA voláteis implicados em aroma du-rante o processo de torrefação. Desse modo, modulando o teor de CGA nofeijão de café mediante modulação da produção das proteínas geneticamen-te responsáveis pela biossíntese de CGA é um meio novo para intensificar oaroma e sabor de bebidas de café e produtos de café produzidos de tais fei-jões de café geneticamente modificados. Teor de CGA intensificado no grãode café pode também positivamente contribuir para a saúde geral e bem-estar dos consumidores de bebidas de café e produtos produzidos de taisfeijões de café. Além disso, modulando o teor de CGA na planta de café temimplicações para saúde geral e resistência à doença na planta de café. Paracada uma destas razões, há uma necessidade de isolar polinucleotídeos epolipeptídeos da via biossintética de CGA em café e desenvolver métodosde utilizar aquelas moléculas para um ou mais dos propósitos acima men-cionados.

Sumário da Invenção

A invenção descrita aqui caracteriza genes que codificam enzi-mas na via de fenilpropanóide que leva à biossíntese de ácido clorogênicoem plantas de café, seus polipeptídeos codificados, e métodos para usarestes polinucleotídeos e polipeptídeos para regulação de gene e manipula-ção de sabor, aroma e outras características dos feijões de café.

Um aspecto da invenção caracteriza uma molécula de ácido nu-cléico isolada de café (Coffea spp.), tendo uma seqüência de codificaçãoque codifica uma enzima da via de fenilpropanóide. Em uma modalidade, aenzima é uma hidroxicinamoil-CoA chiquimato/quinato hidroxicinamoiltrans-ferase que é pelo menos 86,9% idêntica à SEQ ID Ne: 9 ou SEQ ID NQ: 10.Em outra modalidade, a enzima é uma de hidroxicinamoil-CoA quinato hi-droxicinamoiltransferase que é pelo menos 78,1% idêntica à SEQ ID Ns: 11ou SEQ ID Ne: 12. Em outra modalidade, a enzima é uma p-cumaroil 3' hi-droxilase que é pelo menos 82,9% idêntica à SEQ ID Ns: 13. Em outra mo-dalidade, a enzima é uma cafeoil-CoA 3-0 metitransferase que é pelo menos86,3% idêntica à SEQ ID N9: 14, SEQ ID N9: 15, ou SEQ ID Ne: 16.

Em certas modalidades, a molécula de ácido nucléico é um ge-ne que tem uma estrutura de leitura aberta compreendendo a seqüência decodificação. Alternativamente, ele pode compreender uma molécula de mR-NA produzida por transcrição daquele gene, ou uma molécula de cDNA pro-duzida por transcrição reversa da molécula de mRNA. A invenção tambémcaracteriza um oligonucleotídeo entre 8 e 100 bases em comprimento que écomplementar a um segmento da molécula de ácido nucléico acima mencionada.

Outro aspecto da invenção caracteriza um vetor que compreen-de as moléculas de ácido nucléico de codificação da enzima da via de fenil-propanóide acima descritas. Em certas modalidades, o vetor é um vetor deexpressão selecionado do grupo de vetores que consistem em vetores deplasmídeo, fagomídeo, cosmídeo, baculovírus, bacmídeo, bacterianos, delevedura e virais. Em certas modalidades, o vetor contém a seqüência decodificação da molécula de ácido nucléico operavelmente ligada a um pro-motor constitutivo. Em outras modalidades, a seqüência de codificação estáoperavelmente ligada a um promotor induzível. Em outras modalidades, aseqüência de codificação da molécula de ácido nucléico está operavelmenteligada a um promotor tecido-específico, como um promotor semente-específico, preferivelmente um promotor semente-específico de café.De acordo com outro aspecto da invenção, é fornecida uma cé-lula hospedeira transformada com o vetor acima mencionado. A célula hos-pedeira pode ser uma célula de planta, bacteriana, fúngica, de inseto oumamífera. Em certas modalidades, a célula hospedeira é uma célula deplanta selecionada de qualquer um de café, tabaco, Arabidopsis, milho, trigo,arroz, feijão-soja, cevada, centeio, aveia, sorgo, alfafa, trevo, óleo de canola,cártamo, girassol, amendoim, cacau, tomate, tomate-de-árvore, batata, pi-menta, berinjela, beterraba-açucareira, cenoura, pepino, alface, ervilha, ás-ter, begônia, crisântemo, delfínio, zínia, e grama. A invenção também carac-teriza .uma planta transgênica fértil produzida regenerando a célula de plantatransformada. Em uma modalidade específica, a planta transgênica fértil éuma espécie de Coffea.

Outro aspecto da invenção caracteriza um método para modularsabor ou aroma de feijões de café. O método compreende modular a produ-ção de uma ou mais enzimas da via de fenilpropanóide dentro de sementesde café. Em algumas modalidades, o método compreende produção cres-cente da uma ou mais enzimas da via de fenilpropanóide, por exemplo, au-mentando a expressão de uma ou mais genes de codificação da enzima davia de fenilpropanóide endógena dentro das sementes de café, ou introdu-zindo uma transgene de codificação da enzima da via de fenilpropanóide naplanta. Em outras modalidades, o método compreende produção decrescen-te da uma ou mais enzimas da via de fenilpropanóide, por exemplo, introdu-zindo uma molécula de ácido nucléico no café que inibe a expressão de umou mais genes de codificação da enzima da via de fenilpropanóide.

Outras características e vantagens da invenção serão entendi-das em referência aos desenhos, descrição detalhada e exemplos que se-guem.

Breve Descrição dos Desenhos

Figura 1: VIA DE FENILPROPANÓIDE. Esta representação davia de fenilpropanóide de planta é uma modificação de Hoffman et al., 2004,PAL, amônia de fenilalanina-liase; C4H, Cinamato 4-hidroxilase; 4CL, 4-hidroxicinamoil-CoA ligase; HCT, Hidroxicinamoil-coenzima A Chiquima-to/Quinato Hidroxicinamoiltransferase; HQT, hidroxicinamoil-CoA: quinatohidroxicinamoiltransferase; C3H, p-cumarato 3-hidroxilase; CCoAOMT1 Ca-feoil-CoA O-metiltransferase; CAD1 cinamil-álcool desidrogenase; CCR, cina-moil-CoA reductase; COMT I, ácido caféico/5-hidroxiferúlico O-metiltrans-ferase; F5H, ferulato 5-hidroxilase; SAD, sinapil-álcool desidrogenase.

Figura 2. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CcHCT DE Coffea canephora. A) Isolamento de um cDNAcontendo a ORF completa de HCT de C. canephora. Dois clones de cDNAforam obtidos cobrindo a ORF completa de CcHCT, o produto de RACE 5'(Race1_CcHC7) (SEQ ID N9: 17) contendo a terminação 5' do HCT-de C.canephora e um clone parcial de cDNA pcccwc22w14m23 (SEQ ID NQ: 18),J contendo a terminação 3' restante deste gene (vide métodos nos exemplos).Estas seqüências foram usadas para projetar os preparadores novos paraamplificar por PCR um fragmento de 1388bp fragmento (CcHCT em pML1) (SEQ ID N9: 1) de cDNA de BP409 de C. canephora (grão, estágio amarelo).A região não-transladada de 5' é mostrada como uma barra preta grossa, aregião de ORF é mostrada como uma barra listrada, e os códons de início(ATG) e parada (TGA) de iniciação de translação são indicados. A regiãonão-transladada de 3' é mostrada em linha preta fina. Β) A seqüência inseri- da de pML1 (SEQ ID N9: 1) foi alinhada com o pcccwc22w14m23 das se-qüências de cDNA (SEQ ID N9: 18) e Racel_CcHCT (SEQ ID N9: 17). O ali-nhamento foi feito usando o programa de CLUSTAL W (pacote Lasergene1DNASTAR) e manualmente otimizado. Ácidos nucléicos marcados em cinzaemparelharam com a seqüência inserida de pML1 (CcHCT) (SEQ ID N9: 1).

Figura 3. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CaHCT DE Coffea arabica. A) Isolamento de um cDNA con-tendo a ORF completa de HCT de Coffea arabica. Um fragmento de DNAgenômico (GW1_CaHC7) (SEQ ID N9: 19) codificando a terminação 5' deum HCT de C. arabica foi obtido (vide métodos nos exemplos) contendo uma sobreposição com o cDNA de HCT de C. canephora pcccwc22w14m23(SEQ ID N9: 18). A seqüência genômica de C. arabica continha quase umemparelhamento idêntico à seqüência de preparador de terminação 5' HCT-FullUpl (SEQ ID Ne: 50), assim este preparador foi usado com CcHCT-RIpara amplificar por PCR um fragmento de 1388pb (CaHCTem pML5) (SEQID NQ: 2) de cDNA de T2308 de C. arabica (grão, estágio amarelo). A regiãonão-transladada de 5' é mostrada como uma barra preta grossa, a região deORF é mostrada como uma barra listrada, os códons de início (ATG) e para-da de iniciação de translação (TGA) são indicados. A região não-transladadade 3' é mostrada como uma linha preta fina. A região genômica é mostradacomo uma linha cinza grossa. É observado que a maior parte da região não-transladada de 5' deste gene ainda não tinha sido definida. Β) A seqüênciainserida de pML5 foi alinhada com a seqüência genômica de C. arabicaGW1_CaHCT (SEQ ID Ne: 19) e a seqüência de cDNA de C. canephorapcccwc22w14m23 (SEQ ID N-: 18) usando CLUSTAL W e manualmenteotimizada. Ácidos nucléicos marcados em cinza emparelharam com a se-qüência inserida de pML5 (CaHCT) (SEQ ID N9: 2).

Figura 4. ALINHAMENTO DE SEQÜÊNCIA DE PROTEÍNA DECcHCT, CaHCT, CcHQTE CaHQTCOU OUTRAS SEQÜÊNCIAS PROTE-ÍNA DE HCT E HQT DE PLANTA. O alinhamento das seqüências de codifi-cação de proteína dos genes CcHCT (SEQ ID N5: 9), CaHCT (SEQ ID Ne:10), CcHQT(SEQ ID Ns: 11) e CcHQT(SEQ ID Ne: 12) com outras proteínasde HCT e de HQT disponíveis na base de dados de NCBI foi feito usando oCLUSTAL W (pacote Lasergene, DNASTAR). Aminoácidos marcados emcinza denotam os resíduos freqüentemente encontrados. Os nomes de genesão listados, com números de acesso dados entre parênteses. NtHCT (Nico-tiana tabacum, CAD47830 (SEQ ID Ns: 20)), AtHCT (Arabidpsis thaliana,NP_199704 (SEQ ID Ns: 21)), IbHCBT (Ipomea batatas, BAA87043.1 (SEQID N9: 22)), NtHQT (Nicotiana tabacum, CAE46932,1 (SEQ ID N9: 23)), eLeHQT (Lycopersicon esculentum, CAE46933.1 (SEQ ID N9: 24)). As caixasverdes e azuis indicam resíduos de aminoácidos conservados, HXXXD (SEQID N9: 25) e DFGWG (SEQ ID N9: 26) respectivamente. O X circulado naposição 272 na seqüência de proteína de pML3 representa um códon deparada codificado pela seqüência de inserção de pML3. Mas, como determi-nado no Exemplo 6, este códon de parada foi inserido durante a etapa dePCR como foi mostrado que a seqüência genômica codifica um Q nesta po-sição.

Figura 5. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CcHQT DE Coffea canephora. A) Isolamento de um cDNAcontendo a ORF completa para CcHQT de C. canephora. Dois fragmentosde cDNA (Race3_CcHQT (SEQ ID N9: 27) e pcccs30w13p12 (SEQ ID N9:28)) foram obtidos cobrindo a ORF completa de CcHQT (vide métodos nosexemplos). Estas seqüências foram usadas para projetar os preparadorespara amplificar por PCR o fragmento de 1534 pb {CcHQT em pML2) (SEQID NQ: 3) de BP409 de Coffea canephora (pericarpo, estágio verde pequeno).A região de codificação de proteína é mostrada como uma linha listrada, oscódons de início (ATG) e parada de iniciação de translação (TGA) são indi-cados. A região não-transladada de 3' é mostrada em linha preta fina. Sím-bolos são iguais aos das Figuras 2 e 3, Β). A seqüência inserida de pML2 foialinhada com as seqüências de cDNA Race3_CcHQT (SEQ ID Ns: 27) epcccs30w13p12 (SEQ ID N9: 28). O alinhamento foi feito usando o CLUS-TAL W e manualmente otimizado. Ácidos nucléicos marcados em cinza em-parelharam com a seqüência inserida de pML2 (CcHQT) (SEQ ID N9: 3).

Figura 6. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CaHQT DE Coffea arabica. A) Isolamento de um cDNA conten-do uma ORF completa que codifica CaHQT de C. arabica. Um fragmento decDNA de RACE de 5' (Race2_CaHQT) (SEQ ID N9: 29) foi obtido que codificaa terminação 5' de um HQT de C. arabica. Os preparadores HQT-Fullup2(SEQ ID N9: 52) e HQT-FullLow2 (SEQ ID N9: 53) previamente usados paraamplificar por PCR CcHQT foram também de forma bem sucedida usadospara amplificar um fragmento de 1533 pb (CaHQTem pML3) (SEQ ID N9: 4)de cDNA de T2308 de C. arabica (flores inteiras). Símbolos são iguais aos dasFiguras 2 e 3. Β) A seqüência inserida (SEQ ID N9: 4) de pML3 foi alinhadacom a seqüência de cDNA de C. arabica Race2_CaHQT(SEQ ID N9: 29) e aseqüência de C. canaphora pcccs30w13p12 (SEQ ID N9: 28). O alinhamentofoi feito usando CLUSTAL W e manualmente otimizado. Ácidos nucléicosmarcados em cinza emparelharam com a seqüência de dpML3 (CaHQf)(SEQ ID NQ: 4). A base cercada mostra um códon de parada na ORF de pML3(SEQ ID Ne: 4), como debatido no texto e na legenda para Figura 4.

Figura 7. ALINHAMENTO DE CcC3H COM OUTRAS SE-QÜÊNCIAS DE PROTEÍNA DE C3H DE PLANTA. O alinhamento da se-qüência de proteína (SEQ ID N2: 13) codificada por CcC3H (em pcccl20d10(SEQ ID N-: 5)) com outras proteínas de C3H altamente relacionadas na ba-se de dados de NCBI foi feito usando CLUSTAL W (Nota: estas proteínassão proteínas relacionadas a CYP, desse modo a proteína de Arabidopsis foioriginalmente AtCYP). Aminoácidos marcados em cinza emparelharam comaqueles na seqüência de CcC3H (SEQ ID N9: 13). AtCYP (Arabidopsis thaii-ana 22203) (SEQ ID Ne: 30), ObC3H (Ocimum basilicum, AAL99201) (SEQID N5: 31), LeC3H putativo (Lycopersicon escuientum, TC163965 (anotaçãode TIGR Tomato Gene Index) (SEQ ID N9: 32)).

Figura 8. Análise de expressão quantitativa de HQT HCT, C3H,CCoAOMTI, CC0AOMT2 e CCoAOMT3 em C. canephora (robusta, BP409)e C. arabica (arabica, T2308). A expressão de cada gene foi determinadapor RT-PCR quantitativa usando sondas específicas de TaqMan como des-critas nos métodos. O valor de RQ para cada amostra de tecido foi determi-nado normalizando o nível de transcrição do gene de teste versus o nível detranscrição do gene de rpl39 ubiquosamente expresso em cada amostra a-nalisada. Os dados mostrados representam valores médios obtidos de trêsreações de amplificação para cada amostra e as barras de erro indicam o SD.

Figura 9. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CaCCoAOMT-LI (pNT8) DE Coffea arabica A) Isolamento decDNA contendo a ORF completa para CCoAOMT-L1 (SEQ ID Ne: 7) de C.arabica. Um fragmento de cDNA (Race1_CcCCoAOMT-L1) (SEQ ID N9: 33)foi obtido de Coffea canephora (Grão, estágio amarelo) cobrindo a termina-ção 5' completa de ORF de CCoAOMT-L1 de Coffea canephora (SEQ ID N9:7) (vide métodos nos exemplos). Esta seqüência e a seqüência da inserçãocontidas em pcccs30w29k18 (SEQ ID N9: 34) foram usadas para projetar ospreparadores CCoAOMT-L1-FuIIUp (SEQ ID N9: 56) e CCoAOMT-L1 FullLow(SEQ ID N9: 57) para amplificar um fragmento de Coffea arabica T2308(Grão, estágio amarelo) contendo a ORF completa (CaCCoAOMT-LI empNT8) (SEQ ID Ng: 7). Símbolos são iguais aos das Figuras 2 e 3, Β). A se-qüência inserida de pNT8 (SEQ ID Ne: 7) foi alinhada com as seqüências decDNA Race 1 _CcCCoAOMT-L1 (SEQ ID N9: 33) e pcccs30w29k18 (SEQ IDN9: 34) usando o CLUSTALW e manualmente otimizadas. Bases marcadasem cinza emparelharam com a base mais freqüentemente encontrada na-quela posição.

Figura 10. ISOLAMENTO E CARACTERIZAÇÃO DA ORFCOMPLETA PARA CcCCoAOMT-L2 (pNT4) DE Coffea canephora. A) Iso-lamento de um cDNA contendo a ORF completa (SEQ ID N9: 8) para CCo-A0MT-L2 de C. canephora. Um fragmento de cDNA (Racel _CaCCoAOMT-L2) (SEQ ID N9: 35) foi obtido de Coffea arabica (Grão, estágio amarelo) co-brindo a terminação 5' completa de ORF de CCoAOMT-L2 de Coffea arabica(SEQ ID Ns: 8) (vide métodos nos exemplos). Esta seqüência e a seqüênciada inserção contidas em pcccs46w30m24 (SEQ ID Ne: 36) foi usada paraprojetar os preparadores CCoAOMT-L2-FullUp (SEQ ID Ne: 58) e CCoA-OMT-L2-FullLow (SEQ ID N9: 59), e estes preparadores foram usados paraamplificar um fragmento de BP409 de Coffea canephora (Grão, estágio ama-relo) denominado CcCCoAOMT-L2 (pNT4) (SEQ ID N9: 8). Os símbolos sãoiguais aos das Figuras 2 e 3. Β) A seqüência inserida (SEQ ID N9: 8) depNT4 foi alinhada com as seqüências de cDNA Racel_CaCCoAOMT-L2(SEQ ID N9: 35) e pcccs46w30m24 (SEQ ID N9: 36). O alinhamento foi feitousando o CLUSTALW e manualmente otimizado. Bases em cinza empare-lharam com o resíduo mais freqüentemente encontrado naquela posição.

Figura 11. ALINHAMENTO DE SEQÜÊNCIA DE PROTEÍNA DECcCCoAOMT-1 (pcccl15a11), CaCCoAOMT-LI (pNT8), E CcCCoAOMT-L2(pNT4). Um alinhamento das seqüências de proteína CcCCoAOMT-1, CaC-CoAOMT-LI e CcCCoAOMT-L2 (SEQ ID NOs: 14, 15, 16, respectivamente)codificadas por (SEQ ID NOs: 6, 7, 8, respectivamente) foi feito usandoCLUSTALW e manualmente otimizado. Aminoácidos marcados em cinzaemparelharam com o resíduo mais freqüentemente encontrado naquela po-sição. As interações de aminoácido a seguir foram caracterizadas na recenteestrutura de cristal do CCoAOMT de alfafa (Medicago sativa) complexadocom os produtos de reação (Ferrer et al, 2005): as caixas rosas indicam a-minoácidos que interagem com o grupo 3'-fosfato negativamente carregadoda metade de difosfato de 3'-5' adenosina de CoA, as caixas azuis indicamaminoácidos envolvidos em reconhecimento de substrato, e as caixas ver-des indicam aminoácidos envolvidos em ligação de íon de metal divalente ede co-fator.

Figura 12. ALINHAMENTO DE SEQÜÊNCIA DE PROTEÍNA DE CcCCoAOMT-1 (pcccl15a11), MsCCoAOMT, NtCCoAOMT, VvCCoAOMT,CaCCoAOMT-LI (pNT8), E CcCCoAOMT-L2 (pNT4). Um alinhamento dasseqüências de proteína MsCCoAOMT (SEQ ID Ne: 37), NtCCoAOMT (SEQID Ne: 38) e VvCCoAOMT (SEQ ID Ns: 39) disponíveis na base de dados deNCBI com as seqüências de proteína codificadas pelos genes CcCCoAOMT-1, CaCCoAOMT-LI e CcCCoAOMT-L2 (SEQ ID NOs: 6, 7, 8, respectiva-mente) foi feito usando CLUSTAL W e manualmente otimizado. Aminoácidosmarcados em cinza emparelharam com o resíduo mais freqüentemente en-contrado naquela posição. As interações de aminoácido a seguir foram ca-racterizadas na recente estrutura de cristal do CCoAOMT de alfafa (Medica-go sativa) complexado com produtos de reação (Ferrer e al, 2005): as caixasrosas indicam aminoácidos que interagem com o grupo de 3'-fosfato negati-vamente carregado da metade de 3'-5' difosfato de adenosina de CoA, ascaixas azuis indicam aminoácidos envolvidos no reconhecimento de substra-to, e as caixas verdes indicam aminoácidos envolvidos em ligação de íon demetal divalente e de co-fator. Números de acesso para seqüências de prote-ína disponíveis na base de dados de NCBI é dado entre parênteses: MsC-CoAOMT (Medicago sativa, AAC28973 (SEQ ID Ne: 37)), NtCCoAOMT (Ni-cotiana tabacum, AAC49913 (SEQ ID Ne: 38)), e VvCCoAOMT (Vitisvinifera,CAA90969 (SEQ ID Ne: 39)).

Figura 13. EXPRESSÃO E PURIFICAÇÃO DA PROTEÍNA DECcHCT RECOMBINANTE. A) Extratos de vários estágios da expressão epurificação da proteína fusão de GST-CcHCT recombinante(pGTPcl 03a_HCT) foram analisados por, A) usando 5-18% de SDS-PAGE etingimento com Coomassie blue e por B) usando a análise de western blot(vide métodos nos exemplos). Rotas em A; 1. Lisado total de células recom-binantes BI21 contendo pGTPc103a_HCT e induzido com 0,2 mM de IPTG2. Lisado de fração solúvel, 3. Fração insolúvel de lisado, 4. Primeira lava-gem de coluna de NiNTA com tampão de lavagem, 5 a 9 frações sucessivaseluídas da coluna de Ni-NTA usando tampão de eluição, escada de Peso 9.Rotas em B; 1. Material agrupado eluído da coluna de theNi-NTA. 2. Escadade peso.

Figura 14. EXPRESSÃO E PURIFICAÇÃO DA PROTEÍNA DECcHQT RECOMBINANTE. A) Extratos de vários estágios da expressão epurificação da proteína de fusão de GST-CcHQT recombinante(pGTPc103a_HQT) foi analisada por, A) usando 5-18% de SDS-PAGE e tin-gimento com Coomassie blue e por B) usando a análise de western blot (vi-de métodos nos exemplos). Rotas em A; 1. Lisado total de células recombi-nantes BI21 contendo pGTPc103a_HQT e introduzido com 0,2 mM de IPTG2. Lisado de fração solúvel, 3. Fração insolúvel de lisado, 4. Primeira lava-gem de coluna de NiNTA com tampão de lavagem, 5 a 9 frações sucessivaseluídas da coluna de Ni-NTA usando tampão de eluição, escada de Peso 9.Rotas em B; 1. Material agrupado eluído da coluna de Ni-NTA. 2. Escada depeso.

Figura 15 ANÁLISE DE EXPRESSÃO E PURIFICAÇÃO DECcCCoAOMT-1 (pNT16). A) A expressão da proteína de fusão de His-marcador-CcCCoAOMTI foi analisada em um gel a 12% de SDS-PAGE etingida com Coomassie azul. Rota A 1. Extrato bruto de células recombinan-tes BI21 contendo pNT16 e com indução de expressão usando 0,2% ded'arabinose, 2. Extrato bruto de Células recombinantes BI21 com pNT16 ecom supressão de expressão usando 0,1% de glicose. Rota B 1. Lisado car-regado em coluna de NiNTA, 2. Primeira fração de lavagem: 3. Segunda fra-ção de lavagem, 4 a 7, frações 1-4 eluídas da coluna de NiNTA usando tam-pão de eluição. MW: Marcador de peso molecular (Precision Plus PrestainedAll Blue #161-0373)).Figura 16. ANÁLISE DE CaCCoAOMT-LI (pNT12) EXPRES-SÃO E PURIFICAÇÃO. A) A expressão dA proteína de fusão His-marcador-CaCCoAOMT-LI foi analisada em um gel a 12% de SDS-PAGE e tingidacom Coomassie azul. ROTA A 1. Extrato bruto de células recombinantesB121 contendo pNT12 e com indução de expressão usando 0,2%d'arabinose, 2. Extrato bruto de células recombinantes B121 com pNT12 ecom supressão de expressão usando 0,1% de glicose MW: marcador de pe-so molecular (Precision Plus Prestained All Blue (Biorad #161-0373)). ROTAB 1-4 frações 1-4 eluídas da coluna de NiNTA usando tampão de eluição.MW: marcador de peso molecular (Unstained Precision Broad Range (Biorad#161-0362)).

Figura 17. ANÁLISE DE EXPRESSÃO E PURIFICAÇÃO DECcCCoAOMT-L2 (pNT17). A) A expressão da proteína de fusão de His-marcador-CcCCoAOMT-L2 foi analisada em um gel a 12% de SDS-PAGE etingidA com Coomassie azul. ROTA A 1. Extrato bruto de Células recombi-nantes BI21 contendo pNT17 e com indução de expressão usando 0,2%d'arabinose, 2. Extrato bruto de células recombinantes BI21 com pNT17 ecom supressão de expressão usando 0,1% de glicose, MW: marcador depeso molecular (Precision Plus Prestained All Blue (Biorad #161-0373)).ROTA B 1-4 frações 1-4 eluídas da coluna de NiNTA usando tampão de elu-ição. MW: marcador de peso molecular (Unstained Precision Broad Range(Biorad #161-0362)).

Figura 18. ANÁLISE DE ATIVIDADE PARA A PROTEÍNA RE-COMBINANTE DE HIS-MARCADOR-CcCCoAOMT1. Amostras das reaçõesde atividade descritas na seção de método foram carregadas em uma colunade HPLC e o perfil de elução foi medido a 324nm PAINEL A perfil de eluçãode HPLC das amostras de reação contendo 40 pg de proteína recombinantetiradas respectivamente a 0, 6, e 24 horas. PAINEL B perfil de HPLC de rea-ção de controle sem enzima adicionada nos mesmo pontos de tempo.

Figura 19. IDENTIFICAÇÃO DO PRODUTO DESCONHECIDODA PROTEÍNA DE CcCCoAOMTI COMO ÁCIDO FERÚLICO. O pico notempo de retenção de 14,8 min foi identificado como ácido ferúlico adicio-nando um ácido ferúlico "pico" diretamente na amostra de enzima de 24 ho-ras ilustrado na Figura 18 painel A. A absorbância de UV a 324 nm da amos-tra de 24 horas + e -"pico" é apresentada. A curva verde representa o perfilde elução da amostra de 24 h, e a curva amarela representa o perfil de elu-ção da amostra de 24 horas mais o "pico" de ácido ferúlico: o produto des-conhecido co-elui claramente com o "pico" de ácido ferúlico.

Figura 20. Perfil de elução de HPLC de amostra de 5CQA a40°C em tampão de atividade (controle negativo). A: espectro de HPLC emT=O1 B: espectro de HPLC em T2 hora. C: espectro de HPLC em T4 hora.

- Figura 21. Perfil de elução de HPLC das amostras tiradas de re-ação com HCT recombinante (liberado após clivagem com AcTEV protease)e substrato de 5CQA. A: perfil de HPLC de amostra em T = 0, B: perfil deHPLC de amostra após incubação de 4 h a 40°C. C: perfil de HPLC de a-mostra após incubação de 24 h a 40°C. O pico no tempo de retenção de a-proximadamente 14,4 min foi identificado como 5CQA por comparação deinjeção padrão. Similarmente, o pico em 2 min foi identificado como Coenzi-ma A.

Descrição Detalhada das Modalidades IlustrativasDefinições:

Vários termos relativos às moléculas biológicas e similares as-pectos da presente invenção são usados ao longo do relatório descritivo ereivindicações.

O termo "polipeptídeos, proteínas ou enzimas da via de fenilpro-panóide" refere-se aos polipeptídeos que participam na via de fenilpropanói-de que, entre outras coisas, conduz à biossíntese de ácido clorogênico emplantas, e mais especificamente, em plantas de café. Este termo abrange omecanismo específico de ação de cada respectiva proteína na via. Os poli-peptídeos incluem sem limitação, amônia de fenilalanina-liase, cinamato4-hidroxilase, 4-hidroxicinamoil-CoA Iigase (também referida como 4 cuma-roil-CoA ligase), hidroxicinamoil coenzima A chiquimato hidroxicinamoiltrans-ferase, hidroxicinamoil coenzima A quinato hidroxicinamoiltransferasep-cumarato 3-hidroxilase, cafeoil-CoA O-metiltransferase, cinamil-álcool de-sidrogenase, cinamoil-CoA reductase, ácido caféico/5-hidroxiferúlicoO-metiltransferase, ferulato 5-hidroxilase, sinapil-álcool desidrogenase, esimilares, como exemplificados aqui.

"Isolado" significa alterar "pela mão de homem" do estado natu-ral. Se uma composição ou substância ocorre em natureza, foi "isolada" sefoi alterada ou removida de seu ambiente original, ou ambos. Por exemplo,um polinucleotídeo ou um polipeptídeo naturalmente presentes em umaplanta ou animal vivos não são "isolados", mas o mesmo polinucleotídeo oupolipeptídeo separado dos materiais coexistente de seu estado natural são"isolados", como é empregado o termo aqui.

"Polinucleotídeo", também referido como "molécula de ácido nu-cléico". Em geral refere-se a qualquer polirribonucleotídeo ou polideoxrribo-nucleotídeo que podem ser RNA ou DNA inalterados ou RNA ou DNA modi-ficados. "Polinucleotídeos" incluem, sem limitação, DNA uni- e bifilamentar,DNA que é uma mistura de regiões uni e bifilamentares, RNA uni e bifila-mentar, e RNA que é mistura de regiões uni e bifilamentares, moléculas hí-bridas que compreendem o DNA e RNA que podem ser unifilamentares ou,mais tipicamente, bifilamentares ou uma mistura de regiões uni e bifilamen-tares. Além disso, "polinucleotídeo" refere-se às regiões trifilamentares com-preendendo RNA ou DNA ou RNA e DNA. O termo polinucleotídeo tambéminclui DNAs ou RNAs que contêm uma ou mais bases modificadas e DNAsou RNAs com cadeias principais modificadas para estabilidade ou por outrasrazões. Bases "modificadas" incluem, por exemplo, bases tritiladas e basesincomuns como inosina. Uma variedade de modificações pode ser feita aoDNA e RNA; desse modo, "polinucleotídeo" abrange formas química, enzi-mática ou metabolicamente modificadas de polinucleotídeos como tipica-mente encontrados na natureza, como também as formas químicas de DNAe RNA característicos de vírus e células. "Polinucleotídeo" também abrangepolinucleotídeos relativamente curtos, freqüentemente referidos como oligo-nucleotídeos.

"Polipeptídeo" refere-se a qualquer peptídeo ou proteína quecompreende dois ou mais aminoácidos unidos um ao outro por ligações depeptídeo ou ligações de peptídeo modificado, isto é, isósteres de peptídeo."Polipeptídeo" refere-se tanto às cadeias curtas, comumente referidas comopeptídeos, oligopeptídeos ou oligômeros, como às cadeias mais longas, emgeral referidas como proteínas. Polipeptídeos podem conter aminoácidosdiferentes dos 20 aminoácidos codificados pelo gene. "Polipeptídeos" inclu-em seqüências de aminoácido ou modificadas por processos naturais, comoprocessamento pós-translacional, ou por técnicas de modificação químicaque são bem conhecidas na técnica. Tais modificações são bem descritasem textos básicos e em monografias mais detalhadas, como também emuma literatura de pesquisa volumosa. Modificações podem ocorrer em qual-quer lugar em um polipeptídeo, incluindo a cadeia principal peptídica, as ca-deias laterais de aminoácido e os términos amino ou carboxila. Será apreci-ado que o mesmo tipo de modificação pode estar presente nos mesmosgraus ou variados em vários sítios em um polipeptídeo dado. Também, umpolipeptídeo dado pode conter muitos tipos de modificações. Polipeptídeospodem ser ramificados como resultado de ubiquitinação, e eles podem sercíclicos, com ou sem ramificação. Polipeptídeos cíclicos, ramificados e cícli-cos ramificados podem ser o resultado de processos naturais pós-translacionais ou podem ser feitos através de métodos sintéticos. Modifica-ções incluem acetilação, acilação, PAD-ribosilação, amidação, ligação cova-Iente de flavina, ligação covalente de uma metade de heme, ligação covalen-te de um nucleotídeo ou derivado de nucleotídeo, ligação covalente de umlipídio ou derivado de lipídio, ligação covalente de fosfotidilinositol, reticula-ção, ciclização, formação de ligação de dissulfeto, desmetilação, formaçãode reticulações covalentes, formação de cistina, formação de piroglutamato,formilação, gama-carboxilação, glicosilação, formação de âncora de GPI,hidroxilação, iodinação, metilação, miristoilação, oxidação, processamentoproteolítico, fosforilação, prenilação, racemização, selenoilação, sulfação,adição mediada por RNA de transferência de aminoácidos para proteínascomo arginilação, e ubiquitinação. Por exemplo, vide Proteins - Structure andMolecular Properties, 2ã Ed., Τ. E. Creightonl W. H. Freeman and Company,Nova Iorque, 1993 e Wold, F., Posttranslational Protein Modifications: Pers-pectives and Prospects,páginas 1-12 em Posttranslational Covalent Modifi-cation of Proteins, B, C. Johnson, Ed., Academic Press, Nova Iorque, 1983;Seifter et ai, Analysis for Protein Modifications and Nonprotein Cofactors,Meth Enzymol (1990) 182:626-646 e Rattan et ai, Protein Synthesis: Post-translational Modifieations and Aging, Ann NY Aead Sei (1992) 663:48-62.

"Variante" como o termo é aqui usado, é um polinucleotídeo oupolipeptídeo que diferem respectivamente de um polinucleotídeo ou polipep-tídeo de referência, mas retêm as propriedades essenciais. Uma variantetípica de um polinucleotídeo difere em seqüência de nucleotídeo de outropolinucleotídeo de referência. Alterações na seqüência de nucleotídeo davariante podem ou não alterar a seqüência de aminoácido de um polipeptí-deo codificado pelo polinucleotídeo de referência. Alterações de nucleotídeopodem resultar em substituições, adições, deleções, fusões e mutilações deaminoácido no polipeptídeo codificado pela seqüência de referência, comodebatido abaixo. Uma variante típica de um polipeptídeo difere em seqüên-cia de aminoácido do outro polipeptídeo de referência. Em geral, diferençassão limitadas de forma que as seqüências do polipeptídeo de referência e avariante são em geral estritamente similares e, em muitas regiões, idênticos.Uma variante e polipeptídeo de referência podem diferir em seqüência deaminoácido em uma ou mais substituições, adições ou deleções em qual-quer combinação. Um resíduo de aminoácido substituído ou inserido podeou não ser codificado pelo código genético. Uma variante de um polinucleo-tídeo ou polipeptídeo pode ser de ocorrência natural, como uma variantealélica, ou pode ser uma variante que não é conhecida ocorrer naturalmente.Variantes de polinucleotídeos de ocorrência natural e polipeptídeos de ocor-rência não-natural podem ser feitos através de técnicas de mutagênese ouatravés de síntese direta.

Em referência às plantas mutantes, os termos "mutante nulo" ou"mutante de perda-de-função" são usados para designar um organismo ouseqüência de DNA genômico com uma mutação que faz um produto de geneser não-funcional ou grandemente ausente. Tais mutações podem ocorrernas regiões de codificação e/ou reguladoras do gene, e pode ser alteraçõesde resíduos individuais, ou inserções ou deleções de regiões de ácidos nu-cléicos. Estas mutações podem também ocorrer nas regiões de codificaçãoe/ou reguladoras de similares genes que podem regular ou controlar um ge-ne e/ou proteína codificada, para fazer a proteína tornar-se não-funcional ougrandemente ausente.

O termo "substancialmente o mesmo" refere-se às seqüênciasde ácido nucléico ou de aminoácido tendo variações de seqüência que nãomaterialmente afetam a natureza da proteína (isto é a estrutura, característi-cas de estabilidade, especificidade de substrato e/ou atividade biológica daproteína). Com referência particular às seqüências de ácido nucléico, o ter-mo "substancialmente o mesmo" é intencionado referir-se à região de codifi-cação e à expressão de controle das seqüências conservadas, e refere-seprimariamente aos códons de degeneração que codificam o mesmo aminoá-cido, ou códons alternados que codificam aminoácidos suplentes conserva-dores no polipeptídeo codificado. Com referência às seqüências de aminoá-cido, o termo "substancialmente o mesmo" refer-se em geral às substituiçõese/ou variações conservadoras nas regiões do polipeptídeo não envolvido nadeterminação da estrutura ou função.

Os termos "por cento idêntico" e "por cento similar" são tambémaqui usados em comparações entre seqüências de aminoácido e de ácidonucléico. Quando referir às seqüências de aminoácido, "identidade" ou "porcento idêntico" refere-se ao por cento dos aminoácidos da seqüência de a-minoácido em questão que foi emparelhado com os aminoácidos idênticosna seqüência de aminoácido comparada por um programa de análise de se-qüência. "Por cento similar" refere-se ao por cento dos aminoácidos da se-qüência de aminoácido em questão que foi emparelhado com aminoácidosidêntico ou conservados. Aminoácidos conservados são aqueles que diferemem estrutura mas são similares em propriedades físicas de modo que apermuta de um para o outro não é apreciavelmente alterar a estrutura terciá-ria da proteína resultante. Substituições conservadoras são definidas emTaylor (1986, J. Theor. Biol. 119:205). Quando referir às moléculas de ácidonucléico, "por cento idêntico" refere-se ao por cento dos nucleotídeos da se-qüência de ácido nucléico em questão que foi emparelhado com os nucleotí-deos idênticos por um programa de análise de seqüência. Os termos "identi-dade" ou "idêntico" são usados alternadamente com os termos "homologia"ou "homólogo".

"Identidade" e "similaridade" podem ser facilmente calculadasatravés de métodos conhecidos. Seqüências de ácido nucléico e seqüênciasde aminoácido podem ser comparadas usando programas de computaçãoque alinham as seqüências similares dos ácidos nucléicos ou aminoácidos edesse modo definem as diferenças. Em metodologias preferidas, programa.BLAST (NCBI) e parâmetros usados nele são empregado, e o pacote Laser-gene do sistema de DNAstar (Madison, Wl) é usado para alinhar os frag-mentos de seqüência das seqüências de DNA genômicas, como tambémseqüências de cDNA e de proteína. Porém, alinhamentos equivalentes eavaliações de similaridade/identidade podem ser obtidos através do uso dequalquer software de alinhamento padrão. Por exemplo, o Pacote de GCGWisconsin versão 9.1, disponível do Genetics Computer Groups em Madi-son, Wisconsin, e os parâmetros predefinidos usados (penalidade de criaçãode intervalo = 12, penalidade de extensão de intervalo = 4) por aquele pro-grama podem também ser usados para comparar a identidade e similaridadedas seqüências.

"Anticorpos" como aqui usado inclui anticorpos policlonais e mo-noclonais, anticorpos quiméricos, de cadeia simples, e humanizados, comotambém fragmentos de anticorpo (por exemplo, Fab, Fab', F(ab')2 e Fv), in-cluindo os produtos de um Fab ou outra biblioteca de expressão de imuno-globulina. Com respeito aos anticorpos, o termo, Timunologicamente especí-fico" ou "específico" refere-se a anticorpos que ligam a um ou mais epítoposde uma proteína de interesse, mas que não reconhece substancialmente eliga a outras moléculas em uma amostra contendo uma população misturadade moléculas biológicas antigênicas. Ensaios de triagem para determinar aespecificidade de ligação de um anticorpo são bem conhecidos e habitual-mente praticados na técnica. Para um debate inclusivo de tais ensaios, videHarlow et al. (Eds.), Antibodies A Laboratory Manual; Cold Spring HarborLaboratory; Cold Spring Harbor, NY (1988), Capítulo 6.

O termo "substancialmente puro" refere-se a uma preparaçãocompreendendo pelo menos 50-60% em peso o composto de interesse (porexemplo, ácido nucléico, oligonucleotídeo, proteína, etc.). Mais preferivel-mente, a preparação compreende pelo menos 75% em peso, e o mais prefe-rivelmente 90-99% em peso o composto de interesse. Pureza é medida atra-vés de métodos apropriados para o composto de interesse (por exemplo,métodos cromatográficos, agarose ou eletroforese em gel de poliacrilamida,análise de HPLC, e similares).

Com respeito às moléculas de ácido nucléico unifilamentar, otermo "especificamente híbrida com" refere-se à associação entre duas mo-léculas de ácido nucléico unifilamentar de seqüência suficientemente com-plementar para permitir tal hibridação sob condições predeterminadas emgeral usadas na técnica (às vezes denominada "substancialmente comple-mentar"). Em particular, o termo refere-se à hibridação de um oligonucleotí-deo com uma seqüência substancialmente complementar contida dentro deum DNA unifilamentar ou molécula de RNA, para a exclusão substancial dehibridação do oligonucleotídeo com ácidos nucléicos unifilamentares da se-qüência não-complementar.

Uma "seqüência de codificação" ou "região de codificação" refe-rem-se a uma molécula de ácido nucléico que tem informação de seqüêncianecessária para produzir um produto de gene, quando a seqüência é ex-pressada. A seqüência de codificação pode compreender seqüências não-transladadas (por exemplo, íntrons ou regiões de 5' ou 3' não-transladadas)dentro de regiões transladadas, ou podem carecer de tais seqüências não-transladadas intervenientes (por exemplo, como em cDNA).

"íntron" refere-se às seqüências de polinucleotídeo em um ácidonucléico que não codifica informação relacionada com a síntese de proteína.Tais seqüências são transcritas em mRNA, mas são removidas antes datranslação do mRNA para uma proteína.

O termo "operavelmente ligado" ou "operavelmente inserido"significa que as seqüências reguladoras necessárias para expressão da se-qüência de codificação são colocadas em uma molécula de ácido nucléiconas posições apropriadas com relação à seqüência de codificação parapermitir expressão da seqüência de codificação. Por via de exemplo, umpromotor está operavelmente ligado com uma seqüência de codificaçãoquando o promotor for capaz de controlar a transcrição ou expressão daque-la seqüência de codificação. Seqüências de codificação podem ser opera-velmente ligadas de certo modo às seqüências de promotor ou reguladorasou orientação anti-sentido. O termo "operavelmente ligado" às vezes é apli-cado ao arranjo de similares elementos de controle de transcrição (por e-xemplo, intensificadores) em um vetor de expressão.

Seqüências de controle transcricionais e translacionais são se-qüências reguladoras de DNA, como promotores, intensificadores, sinais depoliadenilação, terminadores, e similares, que provêem a expressão de umaseqüência de codificação em uma célula hospedeira.

Os termos "promotor", "região de promotor" ou "seqüência depromotor" se referem em geral às regiões reguladoras transcricionais de umgene que pode ser encontrado no lado 5' ou 3' da região de codificação oudentro da região de codificação, ou dentro dos íntrons. Tipicamente, umpromotor é uma região reguladora de DNA capaz de ligar RNA polimeraseem uma célula e iniciar transcrição de uma seqüência de codificação a ju-sante (direção de 3'). A seqüência de promotor de 5' típica é ligada em seutérmino de 3' pelo sítio de iniciação de transcrição e estende-se a montante(direção de 5') para incluir o número mínimo de bases ou elementos neces-sários para iniciar transcrição dos níveis detectáveis acima da base. Dentroda seqüência de promotor está um sítio de iniciação de transcrição (conve-nientemente definido mapeando com nuclease S1), como também domíniosde ligação de proteína (seqüências de consenso) responsáveis pela ligaçãode RNA polimerase.

Um "vetor" é um replicon, como plasmídeo, fago, cosmídeo, ouvírus ao qual outro segmento de ácido nucléico pode ser operavelmente in-serido para provocar a replicação ou expressão do segmento.

O termo "constructo de ácido nucléico" ou "constructo de DNA"às vezes usado refere-se a uma seqüência de codificação ou seqüênciasoperavelmente ligadas às seqüências reguladoras apropriadas e inseridasem um vetor para transformar uma célula. Este termo pode ser usado alter-nadamente com o termo "DNA transformante" ou "transgene". Uma tal cons-tructo de ácido nucléico pode conter uma seqüência de codificação para umproduto de gene de interesse, junto com um gene marcador e/ou um generepórter selecionáveis.

Um "gene marcador" ou "gene marcador selecionável" é um ge-ne cujo produto de gene codificado confere uma característica que permiteuma célula contendo o gene a ser selecionado de entre células que não con-têm o gene. Vetores usados para engenharia genética tipicamente contêmum ou mais genes marcadores selecionáveis. Tipos de genes marcadoresselecionáveis incluem (1) genes de resistência a antibióticos, (2) genes tole-rância ou resistência a herbicidas, e (3) genes metabólicos ou marcadoresauxotróficos que permitem células transformadas sintetizar um componenteessencial, usualmente um aminoácido que, do contrário, as células não po-dem produzir.

Um "gene repórter" é também um tipo de gene marcador. Estetipicamente codifica um produto de gene que é ensaiável ou detectável atra-vés de meios de laboratório padrões (por exemplo, atividade enzimática, flu-orescência).

O termo "expressar", "expressado", ou "expressão" de um generefere-se à biossíntese de um produto de gene. O processo envolve transcri-ção do gene em mRNA e depois translação do mRNA em um ou mais poli-peptídeos, e abrange todas modificações pós-translacionais de ocorrêncianatural.

"Endógeno" refere-se a qualquer constituinte, por exemplo, umgene ou ácido nucléico, ou polipeptídeo que pode ser encontrado natural-mente dentro do organismo especificado.

Um "heterólogo" região de um constructo de ácido nucléico é umsegmento identificável (ou segmentos) da molécula de ácido nucléico dentrode uma molécula maior que não é encontrada em associação com a molécu-la maior em natureza. Desse modo, quando a região heteróloga codificar umgene, o gene usualmente será flanqueado por DNA que não flanqueia oDNA genômico no genoma do organismo fonte. Em outro exemplo, uma re-gião heteróloga é um constructo onde a própria seqüência de codificaçãonão é encontrada na natureza (por exemplo, um cDNA onde a seqüência decodificação genômica contém íntrons, ou seqüências sintéticas tendo códonsdiferentes que o gene nativo). Variações alélicas ou eventos mutacionais deocorrência natural não dão origem a uma região heteróloga de DNA comodefinida aqui. O termo "constructo de DNA", como definido acima, é tambémusado para referir-se a uma região heteróloga, particularmente uma constru-ída para o uso em transformação de uma célula.

Uma célula foi "transformada" ou "transfeccionada" por DNA e-xógeno ou heterólogo quando tal DNA foi introduzido dentro da célula. ODNA transformante pode ou não ser integrado (covalentemente ligado) nogenoma da célula. Em células procariotes, de levedura, e mamíferas, porexemplo, o DNA transformando pode ser mantido em um elemento episso-mal como um plasmídeo. Com respeito às células eucarióticas, uma célulaestavelmente transformada é uma em que o DNA transformante foi integradoem um cromossomo de forma que ele é herdado através de células-filhasatravés de replicação de cromossomo. Esta estabilidade é demonstrada pelahabilidade da célula eucariótica para estabelecer linhagens celulares ou clo-nes compreendidos de uma população de células-filhas contendo o DNAtransformando. Um "clone" é uma população de células derivada de umacélula simples ou antepassado comum através de mitose. Uma "linhagemcelular" é um clone de uma célula primária que é capaz de crescimento es-tável in vitro por muitas gerações.

"Grão", "semente", ou "feijão", referem-se à unidade de umaplanta em florescência de reprodução, capaz de desenvolver-se em outra talplanta. Como aqui usado, especialmente com respeito às plantas de café, ostermos são sinônima e alternadamente usados.

Como aqui usado, o termo "planta" inclui referência às plantasinteiras, órgãos de planta (por exemplo, folhas, talos, brotos, raízes), semen-tes, pólen, células de planta, organelas de células de planta, e progênie des-tas. Partes de plantas transgênicas são para ser entendidas dentro do esco-po da invenção para compreender, por exemplo, células de planta, proto-plastos, tecidos, calo, embriões como também flores, talos, sementes, pólen,frutas, folhas, ou raízes que originam em plantas transgênicas ou sua progê-nie.

Descrição:

Em um de seus aspectos, a presente invenção caracteriza mo-léculas de ácido nucléico de café que codifica uma variedade de proteínasque compreendem a via de fenilpropanóide que, entre outras funções, con-duz à biossíntese de ácido clorogênico. Exemplos representativos de molé-culas de ácido nucléico que codificam proteínas que compreendem a via defenilpropanóide foram identificados de bases de dados de mais de 47.000marcadores de seqüência expressos (ESTs) de várias bibliotecas de cDNAde Coffea canephora (robusta) feitas com RNA isolado de folhas jovens e dogrão e tecidos de pericarpo de cerejas colhidas em estágios diferentes dedesenvolvimento. ESTs foram identificados sobrepondo e "agrupados" emunigenes (contíguos) compreendendo seqüências de codificação completas.As seqüências de unigene foram anotadas executando uma pesquisa deBLAST de cada seqüência individual contra junto à base de dados de NCBI(National Center for Biotechnology) de proteína não-redundante.

O acima descrito analisa seqüências de gene reveladas que re-presentam várias enzimas importantes da via de fenilpropanóide na plantade café. cDNAs que representa as estruturas de leitura aberta completas(ORF) de várias destas seqüências foram agora obtidos. Estes cDNAs e su-as proteínas codificadas são referidos aqui como segue:<table>table see original document page 32</column></row><table>

As proteínas codificadas têm massas moleculares de aproxima-damente 48,06 kDa CcHCT (SEQ ID N9: 9), 48,19 kDa CaHCT (SEQ ID N5:10), 47,72 kDa CcHQT SEQ ID Ns: 11), 47,54 kDa CaHQT (SEQ ID N2: 12),57,9 kDa CcC3H (SEQ ID N9: 13), 27,97 kDa CcCCoAOMTI (SEQ ID N2:14), 25,71 kDa CaCCoAOM L1 (SEQ ID Ne: 15), e 26,3 kDa CcCCoAOMTL2 (SEQ ID N9: 16). Embora polinucleotídeos que codificam proteínas quecompreendem a via de fenilpropanóide de Coffea canephora e Coffea arabi-ca sejam descritos e exemplificados aqui, esta invenção é intencionada a-branger ácidos nucléicos e proteínas codificadas de outras espécies de Cof-fea que são suficientemente similares para ser usadas alternadamente comos polinucleotídeos de Coffea exemplificados e proteínas para os propósitosdescritos abaixo. Conseqüentemente, quando os termos polipeptídeos ouproteínas que "compreendem a via de fenilpropanóide" forem aqui usados, éintencionado abranger todas as proteínas de Coffea tendo as característicasfísicas, bioquímicas, e funcionais gerais descritas aqui, como também ospolinucleotídeos que as codificam.

Considerado em termos de suas seqüências, os polinucleotí-deos da invenção que codifica proteínas que compreendem a via de fenil-propanóide incluem variantes alélicas e mutantes naturais das SEQ ID Nss:1-8, que são provavelmente encontradas em variedades diferentes de C.canephora e C. arabica, e homólogos das SEQ ID N9®: 1-8 provavelmenteencontrados em espécies de café diferentes. Porque tais variantes e homó-logos são esperados possuir certas diferenças em seqüência de nucleotídeoe de aminoácido, esta invenção fornece polinucleotídeos isolados que codifi-cam proteínas que compreendem a via de fenilpropanóide que tem pelo me-nos cerca de 50%, preferivelmente pelo menos cerca de 60, 65, ou 70%,mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%,77%,. 78%, 79%, ou 80%, até mesmo mais preferivelmente 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, e até mesmo mais preferivelmente 90%,91%, 92%, 93%, 94%, 95%, e o mais preferivelmente 96%, 97%, 98% e 99%ou mais identidade com qualquer uma das SEQ ID Nes: 9-16, e compreendeuma seqüência de nucleotídeo que tem faixas equivalentes de identidade aqualquer uma das SEQ ID NQS: 1-8. Porque a variação de seqüência naturalprovavelmente existe entre as proteínas que compreendem a via de fenil-propanóide, e os genes que os codificam em variedades e espécies de cafédiferentes, alguém versado na técnica esperaria encontrar este nível de vari-ação, embora ainda mantendo as propriedades únicas dos polipeptídeos epolinucleotídeos da presente invenção. Uma tal expectativa é em parte devi-do à degeneração do código genético, como também ao sucesso evolutivoconhecido de variações de seqüência de aminoácido conservadoras queapreciavelmente não alteram a natureza da proteína codificada. Conseqüen-temente, tais variantes e homólogos são considerados substancialmenteiguais uns aos outros e são incluídos dentro do escopo da presente inven-ção.

As seqüências reguladoras de gene associadas aos genes quecodificam proteínas que compreendem a via de fenilpropanóide são de utili-dade prática e são considerados dentro do escopo da presente invenção. Qspromotores e outras seqüências reguladoras de gene de genes que codifi-cam proteínas que compreendem a via de fenilpropanóide de qualquer es-pécie de café podem ser obtidos pelos métodos descritos abaixo, e podemser utilizados de acordo com a presente invenção. Os elementos promotorese reguladores que controlam a especificidade de tecido e especificidadetemporal da expressão de genes que codificam proteínas que compreendema via de fenilpropanóide podem ser usados para tirar vantagem, alterar oumodificar a expressão das proteínas que compreendem a via de fenilpropa-nóide para a meta de intensificar o sabor e aroma de produtos de café pro-duzidos de feijões de.café que compreendem tais modificações, entre outrasutilidades.

As seções a seguir expõem os procedimentos gerais envolvidosna prática da presente invenção. À extensão que os materiais específicossão mencionados, é meramente para o propósito de ilustração, e não é in-tencionado a limitar a invenção. A menos que do contrário especificado, pro-cedimentos biológicos bioquímicos e moleculares gerais, como aqueles ex-postos em Sambrook et ai, Molecular Cloning, Cold Spring Harbor Labora-tory (1989) ou Ausubel et al. (eds), Current Protocols in Molecular Biology,John Wiley & Sons (2005) são usados.Moléculas de Ácido Nucléico. Proteínas e Anticorpos:

Moléculas de ácido nucléico da invenção podem ser preparadasatravés de dois métodos gerais: (1) elas podem ser sintetizadas de trifosfa-tos de nucleotídeo apropriados, ou (2) elas podem ser isoladas de fontesbiológicas. Ambos os métodos utilizam protocolos bem conhecidos na técnica.

A disponibilidade de informação de seqüência de nucleotídeo,como o cDNA que tem SEQ ID Nqs:: 1-8, permite preparação de uma molé-cula de ácido nucléico isolada da invenção através de síntese de oligonucle-otídeo. Oligonucleotídeos sintéticos podem ser preparados pelo método defosforamidita empregado nos Sintetizador de DNA Applied Biosystem 38A oudispositivos similares. A constructo resultante pode ser purificada de acordocom os métodos conhecidos na técnica, como cromatografia líquida de de-sempenho alto (HPLC). Polinucleotídeos longos, bifilamentares devem sersintetizados como uma molécula de DNA da presente invenção. Em está-gios, devido às limitações de tamanho inerente em métodos sintéticos deoligonucleotídeo atuais. Desse modo, por exemplo, uma molécula bifilamen-tar longa pode ser sintetizada como vários segmentos menores de comple-mentaridade apropriada. Segmentos complementares desse modo produzi-dos podem ser anelados de modo que cada segmento possua os términosaderentes apropriados para ligação de um segmento adjacente. Segmentosadjacentes podem ser ligados recozendo os términos aderentes na presençade DNA Iigase para constructo uma molécula bifilamentar longa inteira. Umamolécula de DNA sintética assim construída pode depois ser clonada e am-u plificada em um vetor apropriado.

De acordo com a presente invenção, ácidos nucléicos que têm ahomologia de seqüência de nível apropriado com parte ou todos dos genesde regiões de codificação e/ou reguladoras que codificam proteínas quecompreendem a via de fenilpropanóide podem ser identificados usando con-dições de hibridação e lavagem de severidade apropriada. Será apreciadopor aqueles versados na técnica que a estratégia acima mencionada, quan-do aplicada às seqüências genômicas, além de permitir as seqüências decodificação de isolamento para genes que codificam proteínas que compre-endem a via de fenilpropanóide, também permitirão isolamento de promoto-res e outras seqüências reguladoras de gene associadas aos genes que co-dificam proteínas que compreendem a via de fenilpropanóide, embora asseqüências reguladoras em si podem não compartilhar homologia suficientepara permitir hibridação adequada.

Como uma ilustração típica, hibridações podem ser executadas,de acordo com o método de Sambrook et al., usando uma solução de hibri-dação que compreende: 5X SSC, reagente de 5X Denhardt, 1,0% de SDS1100 Mg/ml de DNA de esperma de salmão fragmentado desnaturado, 0,05%de pirofosfato de sódio e até 50% de formamida. Hibridação é realizada a37-42°C por pelo menos seis horas. Seguindo hibridação, os filtros são lava-dos como segue: (1) 5 minutos em temperatura ambiente em 2X SSC e 1%de SDS; (2) 15 minutos em temperatura ambiente em 2X SSC e 0,1% deSDS; (3) 30 minutos-1 hora a 37°C em 2X SSC e 0,1% de SDS; (4) 2 horasa 45-55°C em 2X SSC e 0,1% de SDS, alterando a solução a cada 30 minutos.

Uma fórmula comum para calcular as condições de severidaderequeridas para alcançar hibridação entre as moléculas de ácido nucléico deuma homologia de seqüência especificada (Sambrook et al., 1989):

Tm = 81,5°C + 16,6Log [Na+] + 0,41 (% G+C) - 0,63 (% formamida) - 600/#bp em dúplex

Como uma ilustração da fórmula acima, usando [Na+] = [0,368]e 50% formamida, com teor de GC de 42% e um tamanho de sonda médiode 200 bases, a Tm é 57°C. A Tm de um dúplex de DNA diminui em 1 -1,5°C com cada 1 % de diminuição em homologia. Desse modo, alvos commais que cerca de 75% de identidade de seqüência seriam observados u-sando uma temperatura de hibridação de 42°C. Em uma modalidade, a hi-bridação fica a 37°C e a lavagem final fica a 42°C; em outra modalidade ahibridação fica a 42°C e a lavagem final fica a 50°C; e em ainda outra moda-lidade a hibridação fica a 42°C e lavagem final fica a 65°C, com as soluçõesde hibridação e de lavagem acima. Condições de severidade alta incluemhibridação a 42°C na solução de hibridação acima e uma lavagem final a65°C em 0,1 X SSC e 0,1% de SDS durante 10 minutos.

Ácidos nucléicos da presente invenção podem ser mantidos co-mo DNA em qualquer vetor de clonagem conveniente. Em uma modalidadepreferida, clones são mantidos em vetor de clonagem/expressão de plasmí-deo, como pGEM-T (Promega Biotech, Madison, Wl), pBluescript (Stratage-ne, La Jolla, CA), pCR4-TOPO (Invitrogen, Carlsbad, CA) ou pET28a+ (No-vagen, Madison, Wl) todos destes podem ser propagados em uma célulahospedeira de E. coli adequada.

Moléculas de ácido nucléico da invenção incluem cDNA, DNAgenômico, RNA, e fragmentos destes que pode ser uni-, bi- ou até mesmotrifilamentar. Desse modo, esta invenção fornece oligonucleotídeos (filamen-tos sense ou anti-sentido de DNA ou RNA) tendo seqüências capazes dehibridar com pelo menos uma seqüência de uma molécula de ácido nucléicoda presente invenção. Tais oligonucleotídeos são úteis como sondas paradetectar genes que codificam proteínas que compreendem a via de fenilpro-panóide ou mRNA em amostras de teste de tecido de planta, por exemplo,por amplificação de PCR1 ou para a regulação positiva ou negativa de genesde expressão que codificam proteínas que compreendem a via de fenilpro-panóide ou antes da translação do mRNA para as proteínas. Métodos emque oligonucleotídeos ou polinucleotídeos podem ser utilizados como son-das para tais ensaios incluem, mas não são limitados a: (1) hibridação in si-tu] (2) hibridação Southern (3) hibridação Northern; e (4) reações de amplifi-cação sortidas como reação em cadeia de polimerase (PCR, incluindo RT-PCR) e reação em cadeia de Iigase (LCR).

Polipeptídeos codificados por ácidos nucléicos da invenção po-dem ser preparados em uma variedade de modos, de acordo com os méto-dos conhecidos. Se produzidos in situ os polipeptídeos podem ser purifica-dos de fontes apropriadas, por exemplo, sementes, pericarpos, ou outraspartes de planta.

Alternativamente, a disponibilidade das moléculas de ácido nu-cléico que codificam os polipeptídeos permite produção das proteínas usan-do métodos de expressão in vitro conhecidos na técnica. Por exemplo, umcDNA ou gene pode ser clonado em um vetor de transcrição apropriado invitro, um tal pSP64 ou pSP65 para transcrição in vitro, seguido por transla-ção livre de célula em um sistema de translação livre de célula adequado,como reticulócitos de germe de trigo ou de coelho. Sistemas de transcrição ede translação in vitro estão comercialmente disponíveis, por exemplo, dePromega Biotech, Madison, Wl, BRL, Rockville, MD ou Invitrogen, Carlsbad,CA.

De acordo com uma modalidade preferida, quantidades maioresde polipeptídeos que compreendem a via de fenilpropanóide podem ser pro-duzidas através de expressão em um sistema procariótico ou eucarióticoadequado. Por exemplo, parte ou toda de uma molécula de DNA, como oscDNAs que tem SEQ ID NQS: 1-8, pode ser inserida em um vetor de plasmí-deo adaptado para expressão em uma célula bacteriana (como E. coli) ouuma célula de levedura .(como Saccharomyces cerevisiae), ou em um vetorde baculovírus para expressão em uma célula de inseto. Tais vetores com-preendem os elementos reguladores necessários para expressão do DNA nacélula hospedeira, posicionado em uma tal maneira a controlar a expressãodo DNA na célula hospedeira. Tais elementos reguladores requeridos paraexpressão incluem seqüências de promotor, seqüências de iniciação detranscrição e, opcionalmente, seqüências de intensificador.

Os polipeptídeos que compreendem a via de fenilpropanóideproduzidos por expressão de gene podem ser purificados em um sistemaprocariótico ou eucariótico recombinante de acordo com os métodos conhe-cidos na técnica. Em uma modalidade preferida, um sistema de expres-são/secreção comercialmente disponível pode ser usado, por meio do qual aproteína recombinante é expressada e depois disso segregada da célulahospedeira, para ser facilmente purificada do meio circunvizinho. Se vetoresde expressão/secreção não forem usados, um método alternativo envolvepurificar a proteína recombinante através de separação de afinidade, comopor interação imunológica com anticorpos que especificamente ligam à pro-teína recombinante. Tais métodos são comumente usados por médicos ver-sados.

Polipeptídeos da invenção podem também ser sintetizados eexpressos como proteínas de fusão com um ou mais domínios adicionaisligados a estas para, por exemplo, produzir um peptídeo mais imunogênico,isolar mais facilmente um peptídeo recombinantemente sintetizado, identifi-car e isolar anticorpos e células B de expressão de anticorpos, e similares.Domínios facilitadores de detecção e purificação incluem, por exemplo, pep-tídeos quelantes de metal como tratos de poli-histidina e módulos de histidi-na-triptofano que permitem purificação em metais imobilizados, domínios deproteína A que permitem purificação em imunoglobulina imobilizada, e o do-mínio utilizado no sistema de extensão/purificação por afinidade de FLAG(Immunex Corp, Seattle Wash.). A inclusão de umas seqüências Iigadorascliváveis como Fator Xa ou enterocinase (Invitrogen, San Diego Calif.) entreum domínio de purificação e o peptídeo ou polipeptídeo compreendendo omotivo facilita a purificação. Por exemplo, um vetor de expressão pode inclu-ir uma seqüência de ácido nucléico de codificação de epítopo ligada a seisresíduos de histidina seguido por uma tiorredoxina e um sítio de clivagem deenterocinase (vide por exemplo, Williams, Biochemistry 1995, 34: 1787-1797; Dobeli, Protein Expr. Purif. 1998, 12: 404-14,). Os resíduos de histidi-na facilitam a detecção e purificação enquanto o sítio de clivagem de entero-cinase provê um meio para purificar o epítopo do restante da proteína defusão. Tecnologia que pertence aos vetores que codificam proteínas de fu-são e aplicação de proteínas de fusão são bem descritas na literatura cientí-fica e de patente, (vide por exemplo, Kroll, DNA Ceii Biol. 1993, 12: 441-53).

Os polipeptídeos que compreendem a via de fenilpropanóidepodem ser analisados, preparados pelos métodos acima mencionados, deacordo com os procedimentos padrão.

Polipeptídeos que compreendem a via de fenilpropanóide purifi-cados de café, ou produzidos recombinantemente, podem ser usados paragerar anticorpos policlonais ou monoclonais, fragmentos de anticorpo ou de-rivados como definidos aqui, de acordo com os métodos conhecidos. Anti-corpos que reconhecem e ligam fragmentos dos polipeptídeos que compre-endem a via de fenilpropanóide da invenção são também contemplados,contanto que os anticorpos sejam específicos para polipeptídeos que com-preendem a via de fenilpropanóide. Por exemplo, se análises das proteínasou análises de Sourthern e de clonagem (vide abaixo) indicarem que os ge-nes clonados pertencem a uma família de multigene, então anticorpos mem-bro-específicos feitos para peptídeos sintéticos que correspondem às regi-ões não conservadas da proteína podem ser gerados.

Estojos que compreendem um anticorpo da invenção paraquaisquer dos propósitos descritos aqui são também inclusos dentro do es-copo da invenção. Em geral, um tal estojo inclui um antígeno de controlepara o qual o anticorpo é imunoespecífico.

Ácidos clorogênicos são prováveis de representar um papel emvários aspectos de saúde e bem-estar humana. Os ácidos clorogênicos fo-ram demonstrados ser antioxidantes poderosos in vitro (Rice-Evands, CA etal. 1996), exibem efeitos protetores contra dano de DNA in vitro (Shibata, Het al. 1999), exibem propriedades anticarcinogênicas e antimutagênicas, epodem por fim reduzir o risco de certos cânceres (Olthof, MR et al. 2001; eHollman, PC 2001), e podem proteger contra doença cardiovascular (Olthof,MR et al. 2001; e Hollman, PC 2001). Esta lista de benefícios de saúde atri-buível aos ácidos clorogênicos é intencionada ser ilustrativa e não exaustiva,e é presumido que há muitos outros efeitos de saúde benéficos atribuíveispara ácidos clorogênicos presentemente desconhecidos. Conseqüentemen-te, os polipeptídeos de café que compreendem a via biossintética de ácidosclorogênicos descritos e exemplificados aqui são esperados encontrar utili-dade em uma variedade de aplicações alimentícias, saúde, e de bem-estar.Por exemplo, os polipeptídeos de café que compreendem a via biossintéticade ácidos clorogênicos, ou seus respectivos produtos de ácido clorogênico,podem ser utilizados como suplementos dietéticos, ou em vários produtosalimentícios e de bebida.

Uma ou mais das aplicações acima mencionadas para os poli-peptídeos que compreendem a via de fenilpropanóide podem ser buscadasexplorando a disponibilidade dos polinucleotídeos que codificam polipeptí-deos que compreendem a via de fenilpropanóide descrita aqui para gerarquantidades significativas de proteína pura usando organismos recombinan-tes (por exemplo, no Picia pastoris de levedura ou em Lactobacilli compatí-veis com alimento, ou em células de planta), e depois testando as proteínasem ensaios novos ou estabelecidos para potencial antioxidante, potencialquimioprotetor ou quimioterapêutico, potencial para promover saúde cardio-vascular, e similares. Testagem similar pode ser realizada usando os ácidosclorogênicos produzidos por estas proteínas de acordo com meios adequa-dos estabelecidos ou desenvolvidos na técnica. Se as proteínas purificadasespecíficas, ou produtos de ácido clorogênico produzidos por tais proteínasforem descobertas ser particularmente úteis, versões naturais daquelas pro-teínas e seus produtos de ácido clorogênico também podem ser isoladas degrãos de café determinados ser ricos naqueles polipeptídeos particularesque compreendem a via de fenilpropanóide.Vetores, Células, Tecidos e Plantas:

Também caracterizados de acordo com a presente invenção sãovetores e estojos para produzir células hospedeiras transgênicas que con-têm um polinucleotídeo que codifica polipeptídeos que compreendem a viade fenilpropanóide, ou um oligonucleotídeo, ou homólogo, análogo ou vari-ante destes em uma orientação sense ou anti-sentido, ou um gene repórter eoutros constructos sob controle de promotores célula ou tecido-específicos eoutras seqüências reguladoras. Células hospedeiras adequadas incluem,mas não são limitadas a, células de planta, células bacterianas, levedura eoutras células fúngicas, células de inseto e células mamíferas. Vetores paratransformar uma ampla variedade destas células hospedeiras são bem co-nhecidos àqueles de habilidade na técnica. Eles incluem, mas não são limi-tados a, plasmídeos, fagemídeos, cosmídeos, baculovíruses, bacmídeos,cromossomos artificiais bacterianos (BACs), cromossomos artificiais de le-vedura (YACs), como também outros vetores bacterianos, de levedura e vi-rais. Tipicamente, estojos para produzir células hospedeiras transgênicasconterão um ou mais vetores apropriados e instruções para produzir as célu-las transgênicas usando o vetor. Estojos podem também incluir um ou maiscomponentes adicionais, como meios de cultura para cultivar as células, re-agentes para executar a transformação das células e reagentes para testaras células transgênicas para expressão de gene, para citar alguns.

A presente invenção inclui plantas transgênicas que compreen-dem uma ou mais cópias de um gene que codifica um polipeptídeo quecompreende a via de fenilpropanóide, ou seqüências de ácido nucléico queinibem a produção ou função dos polipeptídeos endógenos de uma plantaque compreendem a via de fenilpropanóide. Isto é realizado transformandocélulas de planta com um transgene que compreende parte ou toda de umaseqüência de codificação para um polipeptídeo que compreende a via defenilpropanóide, ou mutante, anti-sentido ou variante destes, incluindo RNA,controlado por seqüências reguladoras nativas ou recombinantes, comodescrito abaixo. Espécies de café de plantas transgênicas são preferidas,incluindo, sem limitação, C. abeokutae, C. arabica, C. arnoldiana, C. aruwe-miensis, C. bengalensis, C. canephora, C. congensis C. dewevrei, C. excel-sa, C. eugenioides ,and C. heterocalyx, C. kapakata, C. khasiana, C. liberica,C. moloundou, C. rasemosa, C. salvatrix, C.sessiflora, C. stenophylla, C. tra-vencorensis, C. wightiana e C. zanguebariae. Plantas de qualquer espéciesão também inclusas na invenção; estas incluem, mas não são limitadas a,tabaco, Arabidopsis e outras espécies "amigáveis de laboratório", plantaçõesde cereais como milho, trigo, arroz, feijão-soja cevada, centeio, aveias, sor-go, alfaia, trevo e similares, plantas produtoras de óleo como óleo de canola,cártamo, girassol, amendoim, cacau e similares, plantações vegetais comotomate, tomate-de-árvore, batata, pimenta, berinjela, beterraba açucareira,cenoura, pepino, alface, ervilha e similares, plantas hortícolas como áster,begônia, crisântemo, delfínio, petúnia, zínia, gramado e gramas e similares.

Plantas transgênicas podem ser geradas usando métodos detransformação de planta padrões conhecidos àqueles versados na técnica.

Estes incluem, mas não são limitados a, vetores de Agrobacterium, trata-mento de polietileno glicol de protoplastos, liberação biolística de DNA, mi-cro-feixe de laser UV, vetores de vírus gêmeos ou outros vetores virais deplanta, tratamento de fosfato de cálcio de protoplastos, eletroporação de pro-toplastos isolados, agitação de suspensões de célula em solução com mi-crocontas revestidas com o DNA transformante, agitação de suspensão decélula em solução com fibras de silício revestidas com DNA transformante,absorção de DNA direta, absorção de DNA mediada por lipossoma, e simila-res. Tais métodos foram publicados na técnica. Vide, por exemplo, Methodsfor Plant Molecular Biology (Weissbach & Weissbach, eds., 1988); Methodsin Plant Molecular Biology (Schuler & Zielinski, eds., 1989); Plant MolecularBiology Manual (Gelvin, Schilperoort, Verma, eds., 1993); e Methods in PlantMolecular Biology - A Laboratory Manual (Maliga, Klessig, Cashmore, Gruis-sem & Varner, eds., 1994).

O método de transformação depende da planta a ser transfor-mada. Vetores de Agrobacterium são freqüentemente usados para transfor-mar espécies de dicotiledônea. Vetores binários de Agrobacterium incluem,mas não são limitados a, BIN19 e derivados destes, a série de vetor de pBI,e vetores binário de pGA482, pGA492, pLH7000 (Acesso de GenBankAY234330) e qualquer um adequado dos vetores de pCAMBIA (derivadosdos vetores de pPZP construídos por Hajdukiewicz1 Svab & Maliga, (1994)Plant Mol Biol 25: 989-994, disponível de CAMBIA, GPO Box 3200, Canber-ra ACT 2601, Austrália ou por meio da rede mundial em CAMBIA.org). Paratransformação de espécies de monocotiledônea, bombardeio biolístico compartículas revestidas com DNA transformante e fibras de silício revestidascom DNA transformante é freqüentemente útil para transformação nuclear.Alternativamente, vetores de Agrobacterium "superbinários" foram usados deforma bem-sucedida para a transformação de arroz, milho e várias outrasespécies de monocotiledônea.

Constructos de DNA para transformar uma planta selecionadacompreendem uma seqüência de codificação de interesse operavelmenteligada às seqüências reguladoras de 5' apropriadas (por exemplo, as se-qüências promotoras e reguladoras translacionais) e seqüências reguladorasde 3' (por exemplo, terminadores). Em uma modalidade preferida, é utilizadauma seqüência de codificação que codifica um polipeptídeo que compreendea via de fenilpropanóide sob controle de seus elementos reguladores natu-rais de 5' e 3'. Em outras modalidades, as seqüências de codificação e regu-ladoras são trocadas para alterar o teor de proteína da semente da plantatransformada para uma melhoria fenotípica, por exemplo, em sabor, aromaou outra característica.

Em uma modalidade alternativa, a região de codificação do geneé colocada sob um promotor constitutivo poderoso, como o promotor de 35Sdo Vírus do Mosaico de Couve-flor (CaMV) ou o promotor de 35S do vírus domosaico de escrofulária. Outros promotores constitutivos contemplados para ouso na presente invenção incluem, mas não são limitados a: promotores deT-DNA manopina sintetase, nopalina sintase e octopina sintase. Em outrasmodalidades, um promotor de monocotiledônea forte é usado, por exemplo, opromotor de ubiquitina de milho, o promotor de actina de arroz ou o promotorde tubulina de arroz (Jeon et al., Plant Physiology. 123: 1005-14, 2000).Plantas transgênicas com seqüências de codificação para ex-pressar polipeptídeos que compreendem a via de fenilpropanóide sob umpromotor induzível são também contempladas estar dentro do escopo dapresente invenção. Promotores de planta induzíveis incluem o promotor con-trolado por repressor/operador de tetraciclina, os promotores de gene dechoque térmico, promotores induzidos por tensão (por exemplo, ferimento),promotores de gene responsivos à defesa (por exemplo, genes de amôniade fenilalanina liase), promotores de gene induzidos por ferida (por exemplo,genes de proteína de parede celular rica em hidroxiprolina), os promotoresde gene quimicamente-induzíveis (por exemplo, genes de nitrato reductase,genes de glucanase, genes de quitinase, etc.) e os promotores de gene in-duzíveis por escuridão (por exemplo, gene de asparagina sintetase) paracitar apenas alguns.

Promotores tecido-específicos e desenvolvimento-específicossão também contemplados para o uso na presente invenção. Exemplos não-Iimitativos de promotores semente-específicos incluem Cim 1 (mensageminduzida por citocinina), CZ19B1 (zeína de 19 kDa de milho), milps (mio-inositol-1-fosfato sintase), e celA (celulose sintase) (Pedido U. S. Ne09/377.648), feijão beta.-faseolina, napina, beta.-conglicinina, Iecitina de fei-jão-soja, cruciferina, zeína de 15 kDa de milho, zeína de 22 kDa, zeína de 27kDa, g-zeína, cera, shrunken 1, shrunken 2, e globulina 1, feijão-soja 11SIegumina (Báumlein et al., 1992), e proteína armazenamento semente 11Sde C. canephora (Marraccini et al., 1999, Plant Physiol. Biochem. 37: 273-282). Vide também WO 00/12733, onde são revelados os promotores se-mente-preferidos de genes end1 e de end2. Outros promotores semente-específicos de Coffea podem também ser utilizados, incluindo, mas não limi-tados ao promotor de gene de oleosina descrito no Pedido de PCTco-pendente de propriedade comum Nq US2006/026121, o promotor de ge-ne de deidrina descrito no Pedido de PCT co-pendente de propriedade co-mum Ne US2006/026234, e o promotor de gene de 9-cis-epoxicarotenóidedioxigenase descrito no Pedido de PCT co-pendente de propriedade comumN9 US2006/34402. Exemplos de similares promotores tecido-específicos in-cluem, mas não são limitados a: os promotores de gene de subunidade pe-quena de ribulose bisfosfato carboxilase (RuBisCo) (por exemplo, o promotorde subunidade pequena de café como descrito por Marracini et al., 2003) ouos promotores de gene de proteína Iigadora a/b de clorofila (CAB) para ex-pressão em tecido fotossintético; e os promotores de gene de glutamina sin-tetase raiz-específicos onde expressão em raízes é desejada.

A região de codificação é também operavelmente ligada a umaseqüência reguladora de 3' apropriada. Em modalidades onde a seqüênciareguladora de 3' nativa não é estiver em uso, a região de poliadenilação no-palina sintetase pode ser usada. Outras regiões reguladoras de 3' úteis in-cluem, mas não são limitadas à região de poliadenilação de octopina sinta-se.

A região de codificação selecionada, sob controle de elementosreguladores apropriados, é operavelmente ligada a um marcador de resis-tência de fármaco nuclear, como resistência de canamicina. Outros sistemasde marcadores selecionáveis úteis incluem genes que conferem resistênciasà antibiótico ou herbicidas (por exemplo, resistência à higromicina, sulfonilu-réia, fosfinotricina, ou glifosato) ou genes que conferem crescimento seletivo(por exemplo, fosfomanose isomerase, permitindo crescimento de células deplanta em manose). Genes marcadores selecionáveis incluem, sem limita-ção, genes que codificam resistência antibiótica, como aqueles codificandoneomicina fosfotransferase Il (ΝΕΟ), diidrofolato reductase (DHFR) e higro-micina fosfotransferase (HPT), como também genes que conferem resistên-cia aos compostos herbicidas, como EPSPS resistente a glifosato e/ou glifo-sato oxidorreducatase (GOX), Bromoxynil nitrilase (BXN) para resistência abromoxinil, genes de AHAS para resistência a imidazolinonas, genes de re-sistência à sulfoniluréia, e genes de resistência a 2,4-diclorofenoxiacetato(2,4-D).

Em certas modalidades, promotores e outras seqüências regu-ladoras de expressão são abrangidas pela presente invenção operavelmenteligadas aos genes repórteres. Genes repórteres contemplados para o uso nainvenção incluem, mas não são limitados a, genes que codificam proteínafluorescente verde (GFP), proteína fluorescente vermelha (DsRed), ProteínaFluorescente Ciana (CFP), Proteína Fluorescente Amarela (YFP), ProteínaFluorescente Laranja de Cerianthus (cOFP), fosfatase alcalina (AP), β-lactamase, cloranfenicol acetiltransferase (CAT), adenosina desaminase (A-DA), aminoglicosídeo fosfotransferase (neor, G418r) diidrofolato reductase(DHFR), higromicina-B-fosfotransferase (HPH), timidina cinase (TK), IacZ(codificando α-galactosidase), e xantina guanina fosforibosiltransferase (XG-PRT), Beta-Glucuronidase (gus), Fosfatase Alcalina Placentária (PLAP)1Fosfatase Alcalina Embrionária Segregada (SEAP), ou Luciferase de Vaga-lume ou Bacteriana (LUC). Como com muitos dos procedimentos padrãoassociados à prática da invenção, os artesãos versados estarão cientes dasseqüências adicionais que podem servir a função de um marcador ou repór-ter.

Modificações de seqüência adicionais são conhecidas na técni-ca intensificar a expressão de gene em um hospedeiro celular. Estas modifi-cações incluem eliminação das seqüências que codificam sinais de poliade-nilação supérfluos, sinais de sítio de encaixe de éxon-íntron, repetições se-melhantes a transposon, e outras tais seqüências bem caracterizadas quepodem ser deletérias à expressão de gene. Alternativamente, se necessário,o teor de G/C da seqüência de codificação pode ser ajustado em níveis pon-derados para um hospedeiro de célula de planta de café dado, como calcu-lado por referência aos genes conhecidos expressos em uma célula de plan-ta de café. Também, quando possível, a seqüência de codificação é modifi-cada para evitar estruturas de mRNA secundárias de alfinete prognostica-das. Outra alternativa para intensificar a expressão de gene é usar seqüên-cias líderes de 5'. Seqüências líderes de translação são bem conhecidas natécnica, e incluem o derivado de ação eis (ômega') da seqüência líder de 5'(omega) do vírus do mosaico de tabaco, as seqüências líderes de 5' do vírusdo mosaico de capim-cevadinha, vírus do mosaico de alfafa, e vírus de mo-saico de nabo amarelo.

As plantas são transformadas e depois disso triadas para umaou mais propriedades, incluindo a presença do produto de transgene, o mR-NA de codificação de transgene, ou um fenótipo alterado associado à ex-pressão do transgene. Deveria ser reconhecido que a quantidade de expres-são, como também o padrão tecido- e temporal-específico de expressão dostransgenes em plantas transformadas pode variar, dependendo da posiçãode sua inserção no genoma nuclear. Tais efeitos posicionais são bem co-nhecidos na técnica. Por este motivo, vários transformantes nucleares deve-riam ser regenerados e testados para expressão do transgene.

Métodos:

Os ácidos nucléicos e polipeptídeos da presente invenção po-dem ser usados em qualquer um de vários métodos por meio do qual osprodutos de proteína podem ser expressados em plantas de café para queas proteínas possam representar um papel na proteção da planta de infec-ção ou tensão oxidativa, e na intensificação de sabor e/ou aroma da bebidade café ou produtos de café por fim produzidos do feijão da planta de caféexpressando a proteína. Similarmente, os polipeptídeos da invenção podemser usados em qualquer um de vários métodos por meio dos quais os ácidosclorogênicos, e similares tais produtos fitoquímicos sintetizados pelos poli-peptídeos, podem representar um papel na proteção da planta de infecçãoou tensão oxidativa, e na intensificação de sabor e/ou aroma da bebida decafé ou produtos de café por fim produzidos do feijão da planta de café con-tendo os ácidos clorogênicos.

Com respeito à proteção da planta de doença, e mais especifi-camente, doença infecciosa, foi demonstrado que produção elevada de CGApode diminuir suscetibilidade das plantas à infecção microbiana. Por exem-plo, produção crescente de CGA na planta de tomate resultou em progres-são mais lenta e níveis mais baixos de infecção pelas bactérias Pseudomo-nas syringae. (Niggeweg R, et al. 2004). Similarmente, produção suprimidade CGA foi mostrada aumentar suscetibilidade de plantas de tabaco à infec-ção fúngica. (Maher EA et al. 1994). Tais estudos destacam a importância defenilpropanóides como CGA em sustentar a saúde de planta. Desse modo, ahabilidade para manipular produção de polipeptídeos que compreendem avia biossintética para ácidos clorogênicos em uma planta como café, ou atémesmo usar os polinucleotídeos e proteínas da invenção para monitorar ex-pressão de gene relevante, permitirá estudo e manipulação da resposta daplanta de café aos patógenos. Deste conhecimento, pode ser possível gerarplantas de café geneticamente modificadas com resistência aumentada apatógenos de planta, especialmente patógenos de planta de café. Exemplosde patógenos de café incluem Hemileia vastatrix, o agente etiológico da"Ferrugem de Café", e Colletotrichum coffeanum, o agente etiológico da"Doença do Fruto Cafeeiro", e Pseudomanas syringae pv. Garcae, o agenteetiológico da "Ferrugem de Café". Desse modo, um aspecto dos métodos dainvenção caracteriza para diminuir suscetibilidade de doença infecciosa emplantas, preferivelmente plantas de café, modulando a expressão de polipep-tídeos que compreendem a via de fenilpropanóide e o modulando o perfil deácidos clorogênicos na planta.

Com respeito à proteção da planta de tensão oxidativa, ácidosclorogênicos foram demonstrados ser antioxidantes potentes nas plantas emsi. Em muitas espécies de planta, tensões ambientais como luz alta, baixatemperatura, lesão ao tecido da planta, deficiência de nitrogênio, e infecçãoforam observadas desencadear biossíntese de CGA. (Grace SC. et al.,2000). Ácidos clorogênicos foram demonstrados ter propriedades desconta- minantes de radicais livres (Ohnishi M. et al. 1994), incluindo o descontami-nante do cátion de radical verde estável de ácido 2,2'-azinobis-(3-etilbenzotiazolino-6-sulfônico e o ânion de superóxido. (Grace SC et al.2000). Em plantas, oxidantes são formados, entre outras coisas sob condi-ções de tensão de luz como luz de excesso, ou por exposição aos poluentes ambientais, como ozônio. Portanto, a habilidade para manipular produção depolipeptídeos que compreendem a via biossintética para ácidos clorogênicosem uma planta, ou até mesmo usar os polinucleotídeos e proteínas da in-venção para monitorar tal expressão de gene, permitirá estudo e manipula-ção da resposta da planta de café às tensões ambientais e a geração deespécies oxidativas. Deste conhecimento, é possível gerar plantas de cafégeneticamente modificadas que são melhores equipadas para crescimentosaudável e produção de plantação sob condições de tensões ambientaisagudas ou prolongadas. Desse modo, um aspecto dos métodos da invençãocaracteriza intensificar descontaminação de radical livre em plantas, preferi-velmente plantas de café, modulando a expressão de polipeptídeos quecompreendem a via de fenilpropanóide e o modulando o perfil de ácidos clo-rogênicos na planta.

Com respeito ao sabor e aroma de grão de café assado, é espe-rado que os polipeptídeos que compreendem a via de fenilpropanóide exer-çam alguma influência na geração de sabores de café por meio da reaçãode Maillard que ocorre durante a torrefação, por meio do teor das proteínasem si, ou os produtos como ácidos clorogênicos que elas produzem. Proteí-nas, e particularmente produtos de degradação de proteína (peptídeos e a-minoácidos), representam um grupo importante de precursores de sabor(Spanier et al., 2004). Portanto, proteínas relativamente abundantes comoaquelas que compreendem a via de fenilpropanóide podem ser esperadasfazer alguma contribuição às reações geradoras de sabor que ocorrem du-rante a torrefação do café. Uma tal contribuição pode prover da concentra-ção das proteínas em si no feijão de café, ou da concentração dos ácidosclorogênicos por fim produzidos das proteínas. A habilidade para monitorar(por exemplo, através de procriação assistida por marcador) ou manipularperfis de expressão de proteína para polipeptídeos que compreendem a viade fenilpropanóide é fornecida pelos polinucleotídeos da presente invenção,de acordo com os métodos descritos aqui.

Desse modo, um aspecto dos métodos da presente invençãocaracteriza alterar o perfil de polipeptídeos que compreendem a via de fenil-propanóide em uma planta, preferivelmente café, compreendendo aumentarou diminuir uma quantidade ou atividade de um ou mais polipeptídeos quecompreendem a via de fenilpropanóide na planta. Por exemplo. Em umamodalidade da invenção, um gene que codifica um polipeptídeo que com-preende a via de fenilpropanóide sob controle de suas próprias seqüênciasde controle de expressão é usado para transformar uma planta para o pro-pósito de produção crescente daquele polipeptídeo na planta. Alternativa-mente, uma região de codificação para um polipeptídeo que compreende avia de fenilpropanóide é operavelmente ligada às regiões de controle de ex-pressão heteróloga, como promotores constitutivos ou induzíveis.

Em algumas modalidades, pode ser desejável ter produção di-minuída de um ou mais dos polipeptídeos que compreendem a via de fenil-propanóide na planta. Isto pode ser realizado por vários modos, por exem-plo, triando variantes de ocorrência natural para expressão diminuída de po-lipeptídeos que compreendem a via de fenilpropanóide, ou triar variantes deocorrência natural para níveis diminuídos dos vários ácidos clorogênicos.

Por exemplo, plantas mutantes de perda-de-função (nulas) podem ser cria-das ou selecionadas de populações de mutantes de planta correntementedisponíveis. Será também apreciado por aqueles de habilidade na técnicaque populações de planta mutante podem também ser tríadas para mutantesque sobreexpressam um polipeptídeo particular que compreende a via defenilpropanóide, utilizando um ou mais dos métodos descritos aqui. Popula-ções mutantes podem ser feitas por mutagênese química, mutagênese deradiação, e inserções de transposon ou de T-DNA, ou alvejando lesões lo-cais induzidas em genomas (TILLING, vide, por exemplo, Henikoff et al.,2004, Plant Physiol. 135(2): 630-636; Gilchrist & Haughn, 2005, Curr. Opin.Plant Biol. 8(2): 211-215). Os métodos para fazer populações mutantes sãobem conhecidos na técnica.

Os ácidos nucléicos da invenção podem ser usados para identi-ficar polipeptídeos mutantes que compreendem a via de fenilpropanóide emvárias espécies de planta. Em espécies como milho ou Arabidopsis ondelinhas de inserção de transposon estão disponíveis, preparadores de oligo-nucleotídeo podem ser projetados para triar linhas para inserções nos genesque codificam polipeptídeos que compreendem a via de fenilpropanóide.Mediante criação, uma linha de planta pode depois ser desenvolvida que éheterozigota ou homozigota para o gene interrompido.

Uma planta também pode ser criada para exibir um fenótipo si-milar àquele visto em mutantes nulos criados por técnicas mutagênicas. Ummutante nulo transgênico pode ser criado expressando uma forma mutantede um polipeptídeo selecionado que compreende a via de fenilpropanóidepara criar um "efeito negativo dominante". Embora não limitando a invençãoa qualquer um mecanismo, esta proteína mutante competirá com a proteínado tipo selvagem para interação de proteínas ou outros fatores celulares.Exemplos deste tipo de efeito "negativo dominante" são bem conhecidospara sistemas de inseto e vertebrados (Radke et al., 1997, Genetics 145:163-171; Kolch et al., 1991, Nature 349: 426-428).

Outro tipo de mutante nulo transgênico pode ser criado inibindoa translação de mRNA que codifica as enzimas da via de fenilpropanóide por"silenciamento de gene pós-transcricional". O gene das espécies alvejadaspara sub-regulação, ou um fragmento deste, pode ser utilizado para contro-lar a produção da proteína codificada. Moléculas anti-sentido de comprimen-to total podem ser usadas para este propósito. Alternativamente, oligonucle-otídeos anti-sentido alvejados podem ser utilizados para regiões específicasdo mRNA que são críticas para translação. O uso de moléculas anti-sentidopara diminuir os níveis de expressão de um gene predeterminado é conheci-do na técnica. Moléculas anti-sentido podem ser fornecidas in situ transfor-mando as células de planta com um constructo de DNA que, sob transcrição,produz as seqüências de RNA anti-sentido. Tais construções podem ser pro-jetadas para produzir seqüências anti-sentido de comprimento totais ou par-ciais. Este efeito de silenciamento de gene pode ser intensificado sobrepro-duzindo transgenicamente tanto RNA sense como anti-sentido da seqüênciade codificação de gene de forma que uma quantidade alta de dsRNA é pro-duzida (por exemplo, vide Waterhouse et al., 1998, PNAS 95: 13959-13964).Nesta consideração, seqüências contendo dsRNA que correspondem a par-te ou todo de pelo menos um íntron foram observadas particularmente efica-zes. Em uma modalidade, parte ou toda do filamento anti-sentido da se-qüência de codificação é expressada por um transgene. Em outra modalida-de, filamentos senses e anti-sentido de hibridação de parte ou toda da se-qüência de codificação para polipeptídeos que compreendem a via de fenil-propanóide são transgenicamente expressos.

Em outra modalidade, gene de codificação da enzima da via defenilpropanóides pode ser silenciado através do uso de uma variedade deoutras técnicas de silenciamento de gene pós-transcricional (silenciamentode RNA) que estão correntemente disponíveis para sistemas de planta. Si-lenciamento de RNA envolve o processamento de RNA bifilamentar (dsRNA)em 21-28 fragmentos de nucleotídeos pequenos por uma enzima com baseem RNase H ("Dicer" ou "parecido com Dicer"). Os produtos de clivagem quesão siRNA (RNA de interferência pequena) ou Mirna (micro-RNA) são incor-porados nos complexos efetores de proteína regulam a expressão de genede uma maneira seqüência-específica (para revisões de silenciamento deRNA em plantas, vide Horiguchi, 2004, Diferentiation 72: 65-73; Baulcombe,2004, Nature 431: 356-363; Herr, 2004, Biochem. Soe. Trans. 32: 946-951).

RNA de interferência pequena pode ser quimicamente sintetiza-do ou transcrito e amplificado in vitro, e depois liberado às células. Liberaçãopode ser através de microinjeção (Tuschl T et ai-, 2002), transfecção química(Agrawal N et ai., 2003), eletroporação ou transfecção mediada por Iiposso-ma catiônica (Brummelkamp TR et al., 2002; Elbashir SM et al., 2002), ouquaisquer outros meios disponíveis na técnica que serão apreciadao peloartesão versado. Alternativamente, o siRNA podem ser expressados intrace-lularmente inserindo modelos de DNA a siRNA nas células de interesse, porexemplo, por meio de um plasmídeo, (Tuschl T et al., 2002), e especifica-mente pode ser alvejado para selecionar as células. RNA de interferênciapequena foi de forma bem-sucedida introduzido em plantas. (Klahre U et al.,2002).

Um método preferido de silenciamento de RNA na presente in-venção é o uso de RNA de alfinete curto (shRNA). Um vetor contendo umaseqüência de DNA que codifica para uma seqüência de siRNA desejada par-ticular é liberado em uma célula alvo por uns meios comuns. Uma vez nacélula, a seqüência de DNA é transcrita continuamente para as moléculas deRNA que fazem um ciclo de volta para elas mesmas e formam estruturas dealfinete mediante emparelhamento da base intramolecular. Estas estruturas de alfinete, uma vez processadas pela célula, são equivalentes às moléculasde siRNA e são usadas pela célula para mediar o silenciamento de RNA daproteína desejada. Vários constructos de utilidade particular para silencia-mento de RNA em plantas são descritos por Horiguchi, 2004, supra. Tipica-mente, um tal constructo compreende um promotor, uma seqüência do genealvo a ser silenciado na orientação "sense", um espaçador, o anti-sentido daseqüência de gene alvo, e um terminador. Se expressão em mais ou todosos tecidos de planta for desejada, os promotores constitutivos fortes, como opromotor de 35S de CaMV, podem ser usados. Igualmente, os promotorestecido-específicos, desenvolventemente-específicos ou temporalmente-específicos podem ser selecionados em outras modalidades, como debatidomais acima.

Ainda outro tipo de mutante nulo sintético pode também ser cri-ado pela técnica de "co-supressão" (Vaucheret et al., 1998, Plant J. 16(6):651-659). As células de planta são transformadas com uma cópia do geneendógeno alvejado para repressão. Em muitos casos, isto resulta na repres-são completa do gene nativo como também do transgene. Em uma modali-dade, um gene que codifica um polipeptídeo que compreende a via de fenil-propanóide das espécies de planta de interesse é isolado e usado paratransformar células daquela mesma espécie.

Plantas mutantes ou transgênicas produzidas por quaisquer dosmétodos anteriores são também caracterizadas de acordo com a presenteinvenção. Preferivelmente, as plantas são férteis, assim sendo úteis parapropósitos de criação. Desse modo, mutante ou plantas que exibem um oumais dos fenótipos desejáveis acima mencionados podem ser usadas paracriação de plantas, ou diretamente em aplicações agrícolas ou hortícolas.

Elas vão também ser de utilidade como ferramentas de pesquisa para a elu-cidação adicional da participação de polipeptídeos que compreendem a viade fenilpropanóide em sabor, aroma e outras características de sementes decafé associadas aos pigmentos e fotossíntese. Plantas que contêm umtransgene ou uma mutação especificada podem também ser cruzadas complantas que contêm um transgene ou genótipo complementar para produzirplantas com fenótipos intensificados ou combinados.

A presente invenção também caracteriza composições e méto-dos para produzir, de uma maneira semente-preferida ou semente-específica, qualquer produto de gene heterólogo selecionado em uma plan-ta. Uma seqüência de codificação de interesse é colocada sob controle deum promotor de café semente-específico e outras seqüências reguladorasapropriadas, para produzir um gene quimérico semente-específico. O genequimérico é introduzido em uma célula de planta por qualquer um dos méto-dos de transformação descritos aqui ou conhecidos na técnica. Estes genesquiméricos e métodos podem ser usados para produzir uma variedade deprodutos de gene de interesse na planta, incluindo, mas não limitados a: (1)produtos de gene detectáveis como GFP ou GUS, como enumerados acima;(2) produtos de gene que conferem um benefício agronômico ou hortíGola,como aqueles cujas atividades da enzima resultam em produção de micro-nutrientes (por exemplo, pró-vitamina A, também conhecida como beta-caroteno) ou antioxidantes (por exemplo, ácido ascórbico, ácidos graxos deomega, licopeno, isoprenos, terpenos); ou (3) produtos de gene para contro-lar patógenos ou pestes, como descritos por Mourgues et al., (1998), TibTe-ch 16: 203-210 ou outros conhecidos ser protetores para sementes de plantaou prejudiciais aos patógenos.

Os exemplos a seguir são fornecidos para descrever a invençãoem maior detalhe. Os exemplos são intencionados a ilustrar, não limitar, ainvenção.

Exemplo 1

Material de Planta para Extração de RNA

Raízes recentemente colhidas, folhas jovens, talos, flores e frutaem estágios diferentes de desenvolvimento foram colhidos de Coffea arabicaL. cv. Caturra T-2308 e tecidos de folhas jovens foram colhidas de Coffeacanephora. var Robusta BP409 crescidas sob condições de estufa a Tours(25°C, 70 RH). Todos os outros tecidos de Coffea canephora BP-409 foramcrescidos no campo em East Oriental, Indonésia. Os estágios de desenvol-vimento são definidos como segue: fruta verde pequena (SG), fruta verdegrande (LG), fruta amarela (Y) e fruta vermelha (R). Tecidos frescos foramimediatamente congelados em nitrogênio líquido, depois armazenados a-80°C até usados para extração de RNA.Exemplo 2

Protocolos para extração de RNA Total, geração de Cdna, e condições dereação de PCR

Para descobrir as seqüências de DNA que codificam parte, ou to-das, das enzimas de HCT de café (HidroxicinamoiI-CoA chiquimato/quinatohidroxicinamoiltransferase), HQT (hidroxicinamoil-CoA quinato hidroxicinamoil-transferase), C3H (p-cumaroil 3' hidroxilase), e CCoAOMT (cafeoilCoA-3-Ο-metiltransferase), que controlam as etapas principais na síntese de ácidosclorogênicos (CGA) em café, as seqüências de unigene de café com similari-dade alta para seqüências de proteína de base de dados públicas que codifi-cam HCT, HQT, C3H, e CCoAOMT de plantas como tomate, tabaco e Arabi-dopsis foram descobertas usando o algoritmo de TBLASTN (Altschul et al.,1990). Um dos cDNA mais longos de cada unigene com as melhores repeti-ções para cada seqüência de proteína foi depois completamente seqüencia-da. Se a seqüência de proteína codificada no EST mais longo foi julgada nãoconter a ORF completa, ou marcha de genoma assistida por PCR de RACE 5'ou preparador foi usada para isolar as seqüências de codificação de proteínaperdidas. Uma vez a seqüência de estrutura de leitura aberta completa (ORF)para cada uma destes genes de café foi estabelecida, análise de expressãode gene era realizada para os respectivos genes para confirmar a informaçãode expressão preliminar observada da base de dados de EST.

RNA foi extraído de tecidos diferentes isto é, raiz, talo, folhas,flores, pericarpo e grão em quatro estágios de maturação diferentes-VerdePequeno ("SG"), Verde Grande ("LG"), Amarelo ("Y"), e Vermelho ("R") deCoffea arabica (T2308 04-2003) e Coffea canephora (BP409) de acordo comos métodos de Rogers et al. (1999).

Do RNA extraído, os cDNAs eram preparados de acordo comdois métodos diferentes. No primeiro método, cada amostra de cDNA especí-fica era preparada de 1 pg de RNA total e 50 ng oligo dT(i8) (Sigma ChemicalCo., St. Loius, MO) como segue: A amostra de 1 pg de RNA total e oligo dTfoi suspensa em um volume de 12 ul de água tratada com DEPC. Esta mistu-ra foi incubada a 70°C durante 10 min e depois rapidamente esfriada em gelo.Em seguida, 4,0 μΙ de tampão de primeiro filamento 5X (Invitrogen)1 2,0 μΙ de0,1 M DTT (Invitrogen) e 1,0 μΙ de mistura de dNTP (10 mM cada, Invitrogen)foram adicionados. Esta mistura de reação foi incubada a 42°C durante 2 min,e depois 1,0 μΙ de transcriptase reversa SuperScript Ill Rnase (200υ/μΙ) (Invi-trogen) foi adicionado. A reação foi subseqüentemente incubada a 25°C du-rante 10 min. e depois a 42°C durante 50 min, e seguido por inativação deenzima aquecendo a 70°C durante 10 min. As amostras de cDNA geradasforam depois diluídas dez vezes em água estéril e armazenadas a -20°C du-rante o uso em experimentos diferentes (RT-PCR, RT-PCR de tempo real,RACE 5' e 3', e os clones de isolamento de cDNA de comprimento total).

Sob o segundo método, as amostras de cDNA específicas forampreparadas de 1 μg de amostra de RNA total e 870 ng de oligo dT (ProIigo)suspensos em um volume final de 13 μΙ com água tratada com DEPC. Estamistura foi incubada a 65°C durante 5 min para desnaturar os ácidos nucléi-cos, e as amostras foram depois colocadas em gelo. Em seguida, Tampãode Reação de RT de Transcritor (Roche) foi adicionado a uma concentraçãode 1X, e 10,0 U de Inibidor de Ribonuclease (Sigma), 1 mM final de cadadNTP (Roche) e 10 U de Transcriptase Reversa de Transcritor (20υ/μΙ, Ro-che) foram adicionados. A 20 μΙ reação foi misturada através de vórtice edepois brevemente centrifugada. As misturas foram incubadas a 55°C duran-te 50 min, e depois 1,0 U de RNase H (Invitrogen) foi adicionado à reação,seguido por uma incubação a 37°C durante 30 min. As amostras foram de-pois armazenadas a -20°C.

Cinco reações de RACE 5' diferentes foram realizadas usando osistema de RACE 5' para Amplificação Rápida de estojo de Terminações decDNA (Invitrogen) de acordo com as especificações do fabricante. As prepa-rações de cDNA usadas neste experimento foram purificadas para removerqualquer nucleotídeo não-incorporado primeiro (visto que eles interfeririamna reação de cauda de DC). Purificação foi realizada usando Colunas deS.N.A.P (Invitrogen) de acordo com as instruções dadas pelo fabricante.Uma vez purificado, o cDNA era restabelecido em 50 μΙ_ de água esterilizadae depois armazenado a -20°C antes de ser usado para PCR de RACE 5'.Os experimentos de RACE 5' todos começaram com uma caudade TdT de cada cDNA purificada com S.N.A.P específico. A reação de caudade poli DC foi como segue: reações de 25 μΙ foram fixadas com 5 μΙ do cD-NA purificado, 11,5 μΙ de água tratada com DEPC, 5 μΙ 5x tampão de caudade TdT (Invitrogen), e 2,5 μΙ de 2 mM de dCTP. As reações foram depoisincubadas a 94°C durante 3 minutos, seguido esfriando em gelo. 1 μΙ de TdTfoi depois adicionado, e a reação foi incubada durante 10 minutos a 37°C. Asreações foram feitas aquecendo durante 10 minutos a 65°C, e foram depoiscolocadas em gelo.

A primeira rodada de Reações de PCR de RACE 5' foram realiza-das em um volume final de 50 μΙ, como segue: 5 μΙ de cada cDNA com cauda,5 μL de 10 χ tampão de PCR (tampão de ThermoPoI), 400 nM cada um doPreparador Gene Específico 1 (GSP1) e o Preparador de Âncora Com Ponte(AAP) (o GSP diferente e similares preparadores estão na Tabela 1), 200 μΜcada dNTP, e 2,5 U de Taq DNA polimerase (BioLabs). As condições de ciclode PCR da primeira rodada eram como segue: 94°C durante 2 min; depois94°C durante 1 min, temperatura de recozimento (observada na Tabela 2) para1 min e 72°C durante 2 min e 45 ciclos. Uma etapa final adicional de alonga-mento foi feita a 72°C durante 7 min. Produtos de PCR eram depois analisadospor eletroforese em gel de agarose e tingimento de brometo de etídio.

A segunda rodada de reações de PCR foi executada em um vo-lume final de 50 μΙ, como segue: 5 μΙ de 1% de produto de PCR diluído (Pri-meira Rodada); 5 μί de 10 χ tampão de PCR (tampão de LA Il Mg++ plus),200 nM de cada um do preparador de GSP2 (Preparador Gene Específico 2) e do Preparador de Amplificação Universal Com Ponte (AUAP) (vide prepa-radores na Tabela 1), 200 μΜ de cada dNTP, e 0,5 U de DNA polimeraseTakara LA Taq (Cambrex Bio Science). O protocolo de ciclismo foi como se-gue: 94°C durante 2 min; depois 94°C durante 1 min, temperatura de reco-zimento (observada na Tabela 2) para 1 min e 72°C durante 30 e 40 ciclosde 1 min. Uma etapa final adicional de alongamento foi feita a 72°C durante7 min. Produtos de PCR eram depois analisados em eletroforese em gel deagarose e tingimento de brometo de etídio;Tabela 1. Preparadores usados para experimentos de PCR RaceS'.

<table>table see original document page 58</column></row><table>

Tabela 2. Preparadores de experimentos de PCR de Race 5' e temperaturade recozimentos.

<table>table see original document page 58</column></row><table>As seqüências de cDNA existentes, e as seqüências novas de 5'obtidas de RACE 5' ou experimentos de marcha de genoma assistida porpreparador, foram usadas para projetar preparadores nas seqüências deUTR de 5' e 3' para amplificar a seqüência de cDNA alvo contendo as se-qüências de ORF completas de CcHCT, CaHCT, CcHQT, CaHQT, CaCCo-A0MT-L1, e CcCCoAOMT-L2. Todos do cDNA usado para isolar estas se-qüências de DNA de ORF completa foram preparados usando o primeirométodo de síntese de cDNA descrito acima. Os dois preparadores gene es-pecíficos foram projetados a montante na região do Códon de início de ATGe na UTR de 3' para cada gene e estes são dados na Tabela 3. O cDNA es-pecífico e temperaturas de anelamento usadas para as reações de PCR di-ferentes são dadas na Tabela 4.

Para CcHCT (pML1) (SEQ ID Ne: 1), CaHCT (pML5) (SEQ IDN2: 2), CcHQT (pML2) (SEQ ID Ne: 3), CaHQT (pML3) (SEQ ID N9: 4) eCcCCoAOMT-L2 (pNT4) (SEQ ID N9: 8), as reações de PCR foram executa-das em reações de 50 μΙ como segue: 5 μΙ de cDNA (tabela 4), 5 μί de 10 χtampão de PCR (Tampão de La PCR Il Mg"" plus), 800 nM de cada Prepa-rador Gene específico, 200 μΜ cada dNTP, e 0,5 U de DNA polimerase Ta-kara LA Taq (Cambrex Bio Science). Após desnaturar a 94°C durante 2 min,a amplificação consistiu em 35 ciclos (com exceção de CcCCoAOMT-L2(SEQ ID N9: 8) onde a amplificação era durante 40 ciclos) de 1 min a 94°C, 1min em temperatura de recozimento (Tabela 4), e alongamento por 2 min a72°C. Uma etapa final adicional de alongamento foi feita a 72°C durante 7min. Produtos de PCR foram depois analisados por eletroforese em gel deagarose e tingimento de brometo de etídio. Fragmentos do tamanho espera-do foram depois clonados em pCR4-TOPO usando Estojo de clonagem deTOPO TA para Seqüenciação (Invitrogen) de acordo com as instruções da-das pelo fabricante. As inserções dos plasmídeos gerados foram depois se-qüenciadas completamente.

Para CaCCoAOMT-LI (pNT8) (SEQ ID N9: 7), a reação de PCRfoi executada em reações de 50 μΙ como segue: 5 μί de cDNA (Tabela 4), 5μL de 10 χ tampão de PCR (Tampão de Reação de Pfu Clonado), 400 nM decada Preparador Gene específico, 200 μΜ de cada dNTP, e 1,25 U de DNApolimerase Pfu Turbo. Após desnaturar a 94°C durante 2 minutos, a amplifi-cação consistiu em 40 ciclos de 1 minuto a 94°C, 1 minuto a 55°C e 2 minu-tos a 72°C. Uma etapa final adicional de alongamento foi feita a 72°C duran-te 7 minutos. Produto de PCR foi depois analisado em eletroforese em gelde agarose e tingimento de brometo de etídio. O fragmento do tamanho es-perado foi depois clonado em uma orientação de 5' para 3' em pENTR/D-TOPO de acordo com as instruções dadas pelo fabricante (estojo de pENTRTOPO Cloning Direcional, Invitrogen). A inserção do plasmídeo gerado(pNT8) foi depois seqüenciada completamente.

TABELA 3. Preparadores usados para amplificacão de CDNA DE CcHQT(pML2). CaHQT (pML3). CcHCT (PMU), CaHCT (PML5). CcCCoAOMTI(PNT15), CaCCoAOMT-LI (pNT8), CcCCoAOMT-L2 (pNT4), E CcCCoA-

<table>table see original document page 60</column></row><table>Tabela 4. Temperaturas de recozimento de isolamento de ORF

<table>table see original document page 61</column></row><table>

cDNAs subclonados em plasmídeos foram seqüenciados de a-cordo com o protocolo a seguir. DNA de plasmídeo foi purificado do hospe-deiro usando estojos de Qiagen de acordo com as instruções dadas pelofabricante. DNA de plasmídeo recombinante preparado e produtos de PCRforam seqüenciados através de GATC Biotech AG (Konstanz, Alemanha)pelo método de terminação de dideóxi de Sanger et al. Os únicos fragmen-tos de PCR produzidos dos experimentos de RACE 5' e marcha de genomaforam ou seqüenciados sem purificação e clonando com os preparadoresespecíficos usados para sua amplificação, ou seqüenciados após clonagem.Análise de computador foi executada usando o pacote de software de LaserGene (DNASTAR). Homologias de seqüência foram verificadas junto às ba-ses de dados de GenBank usando os programas BLAST. (Altschul et al.1990).

RT-PCR de tempo real foi realizada de acordo com o protocolo aseguir. cDNA preparado pelo primeiro método descrito acima foi amplificadousando estojos de TaqMan-PCR como recomendado pelo fabricante (Appli-ed Biosystem1 Perkin-Elmer), e como previamente descrito por Privat et al.,2004. O tampão de TaqMan contém AmpRease® UNG (Uracil-N-glicosilase)que é ativo durante os primeiros 2 minutos a 50°C e é depois inativo a 95°Cno começo do ciclo de PCR.

Os preparadores de Q-PCR e sondas de TaqMan usados foramprojetados usando o software PRIMER EXPRESS (Applied Biosystem) e sãolistados na Tabela 5. Quantificação foi realizada usando o método de quanti- ficação relativa, com a proteína ribossômica constitutivamente expressadarpl39 como a referência de linha base. Para usar o método de quantificaçãorelativa, foi necessário mostrar que a eficiência de amplificação para as se-qüências de cDNA candidato foi aproximadamente equivalente à eficiênciade amplificação da seqüência de referência (seqüência de cDNA de rpl39) usando os preparadores e sondas definidos. Para determinar esta equiva-lência relativa, DNA de plasmídeo contendo as seqüências de cDNA apro-priadas foi diluído 1/1000, 1/10.000, 1/100.000, e 1/1.000.000 vezes, eusando as condições de Q-PCR descritas acima; o declive da curva Ct =f(quantidade de Log de DNA) foi calculado para cada conjunto de sonda de plasmídeo/preparador/TaqMan. Conjuntos de sonda de plasmídeo/prepara-dor/TaqMan dando curvas com declives perto de 3,32, que representa umaeficiência de 100%, são considerados aceitáveis. Os conjuntos de sonda deplasmídeo/preparador/TaqMan apresentados na Tabela 5 todos deram valo-res aceitáveis por Ct = f(quantidade de Log de DNA). Todas as Sondas deMGB foram marcadas na terminação 5' com a tintura de repórter fluorescen-te de 6-carboxifluoresceína (FAM) e na 3' com tintura de extintor 6-carbóxi-tetrametil-rodamina (TAMRA), exceto a sonda de RPL39 que foi marcada naterminação 5' com a tintura de repórter fluorescente VIC e na terminação 3'com TAMRA de extintor.

Tabela 5. Preparadores e sondas de TaaMan usados para experimentos deQ-RT-PCR. _

<table>table see original document page 62</column></row><table><table>table see original document page 63</column></row><table>

Exemplo 3

Isolamento e caracterização de um clone de cDNA DE Coffea canephoracodificando hidroxicinamoil-COA chiquimato/auinato hidroxicinamoilTRANS-FERASE (CcHCT)

Para encontrar um cDNA que codifica a HCT de café, a seqüên-cia de proteína de HCT de Nicotiana tabacum (número de acessoCAD47830 (SEQ ID Ns: 20)); Hoffmann et al., 2003) serviu como a seqüên-cia de consulta para uma pesquisa de BLAST junto ao conjunto de "unigene"5 usando o algoritmo de tblastn. A melhor repetição obtida foi unigene#123197 (valor de e = e-150), embora um segundo unigene de café(#125212) foi também observado estar altamente relacionado à seqüênciade HCT de N. tabacum (valor de e = e-108). Alinhamento das seqüências deDNA e de proteína in silico dos unigenes #123197 e #125212 indicaram queembora eles estejam potencialmente relacionados, estas duas seqüênciasde unigene codificaram genes de café diferentes.

Um cDNA que representa a terminação 5' de unigene #123197(pcccwc22w14m23) (SEQ ID NQ: 18), e desse modo codificando o cDNA decafé mais longo na base de dados relacionada à HCT de tabaco, foi isoladoe seqüenciado. A inserção de pcccwc22w14m23 (SEQ ID N9: 18) foi obser-vada ser 1465 pb de comprimento, e codifica uma seqüência de ORF parcialde 389 aminoácidos. Porque a proteína de tabaco de comprimento total erade 435 aminoácidos de comprimento, foi assumido que este cDNA de HCTde café estava carecendo de aproximadamente 150 pares de base (isto é, ocDNA de HCT de café de comprimento total seria esperado codificar maisaproximadamente 46 aminoácidos). Com base na parte significativa da se-qüência de HCT de café codificada por pcccwc22w14m23 (SEQ ID Ns: 18),preparadores específicos para o uso na técnica bem estabelecidos de PCRde RACE 5' foram inventados para isolar a terminação 5' da seqüência degene correspondente. Este experimento, usando cDNA feito pelo segundoMétodo descrito acima no Exemplo 2 de grão de RNA de C. canephora(BP409) no estágio desenvolvente Vermelho, e usando os Preparadores deGene 22w14m23-GSP1-Específicos (SEQ ID N9: 44) na PCR de PrimeiraRodada e 22w14m23-GSP2 (SEQ ID N9: 45) na PCR de segunda rodada,produziu um fragmento de PCR de aproximadamente 300 pares de base(comprimento estimado em gel de agarose) que foi diretamente seqüenciadocom Preparador Gene 22w14m23-GSP2 específico (SEQ ID Ng: 45). A se-qüência resultante (Racel_CcHCT) (SEQ ID N9: 17) era 209 pb de compri-mento e sobreposta na terminação 5' do clone de cDNA pcccwc22w14m23(SEQ ID N9: 18) (Figura 2a: 60 pb de seqüência de sobreposição).

Esta seqüência de HCT de terminação 5' de café recentementeisolada (Race1_CcHC7) (SEQ ID N9: 17), e a seqüência de codificação qua-se de comprimento total no cDNA pcccwc22w14m23 (SEQ ID N9: 18), permi-tiu o projeto de dois preparadores novos (HCT-FullUp1 (SEQ ID N9: 50) eCcHCΓ-R1 (SEQ ID N9: 51), Tabelas 3 e 4) para amplificação específica daseqüência de ORF completa do HCT de café usando cDNA feito pelo Méto-do 1 de RNA de grão de C. canephora (BP-409) no estágio de desenvolvi-mento amarelo. Este experimento de amplificação de PCR resultou na gera-ção da seqüência de cDNA CcHCT (SEQ ID NQ: 1) contida no plasmídeopML1 (Figura 2b). Análise de seqüência da inserção de pML1 (SEQ ID Ns: 1)indicou que este cDNA era 1388 pb de comprimento, com uma ORF comple-ta de 1305 pb que codifica um polipeptídeo de 434 aminoácidos (SEQ ID Ne:9) tendo um peso molecular estimado de 48,06 kDa. Alinhamento da se-qüência de proteína de HCT completa (SEQ ID N9: 9) com a seqüência deproteína da HCT de tabaco e uma seqüência relacionada de Arabidopsisfhaliana (número de acesso CAD47830 (SEQ ID Ns: 20) e NP_199704 (SEQID Ne: 21), respectivamente, vide Figura 4) confirmou que a anotação inicialdesta seqüência de café usando BLAST, isto é, a ORF de pML1 (SEQ ID Ne:1) codifica uma proteína de HCT de café. No nível de proteína, a seqüênciade café (SEQ ID Ne: 9) exibe 86,9% e 78,3% de homologia com as seqüên-cias de tabaco e de A. thaliana, respectivamente (Figura 4). Ao nível nucléi-co, a ORF completa da seqüência de café exibe 78,5% e 70% de homologiacom as seqüências de tabaco e A. thaliana de ORF completas, respectiva-mente. O alinhamento de seqüência de proteína também mostra que a se-qüência de HCT de pML1 de café tem duas seqüências conservadas,HXXXD (SEQ ID Ne: 25) e DFGWG (SEQ ID Ne: 26) que foi identificado co-mo regiões fundamentais em classe de proteínas aciltransferases de planta.

Exemplo 4

Isolamento e caracterização de um clone cDNA DE Coffea arabica codifi-cando hidroxicinamoil-COA chiquimato/guinato hidroxicinamoiltransferase(CaHCT)

DNA genômico total foi extraído de folhas frescas de T2308 deC. arabica colhidas da estufa usando o método de Crouzillat et al., (1996).Marcha assistida com preparador foi executada usando o estojo de Geno-meWalker Universal (BD Biosciences) de acordo com o protocolo sugeridopelo fabricante. As quatro bibliotecas de GenomeWaIker usadas aqui forampreviamente construídas de DNA genômico de T2308 de C. arabica que ti-nham sido digeridas com Dral1 EcoRV1 Pvul, Stul e depois ligadas em termi-nação cega ao GenomeWaIker Adaptor do estojo GenomeWaIker Universal.As digestões de DNA genômico e as reações de ligação de GenomeWaIkerAdaptor foram realizadas de acordo com as instruções do fabricante. Asquatro bibliotecas foram depois usadas como modelos em reações de PCRusando os preparadores gene-específicos de HCT-GSP (Tabela 6). As mis-tura de reação de PCR continham 10 μΙ de modelo de biblioteca de Geno-meWalker (1/100 diluído), 5 pL de 10 χ tampão de PCR (tampão de LA IlMg++ mais), 200 μΜ de cada dNTP, 400 nM de cada preparador (AP1 eHCT-GSP1), e 0,5 U de DNA polimerase Takara LA Taq (Cambrex Bio Sci-ence) em um volume final de 50 μΙ. As condições a seguir foram usadas paraa primeira PCR: após desnaturar durante 2 minutos a 95°C, os primeirossete ciclos foram executados a 95°C durante 25 s, seguido por um anela-mento e alongamento a 72°C durante 3 minutos. Um adicional de 31 ciclosfoi realizado, a 95°C durante 25 s, com uma temperatura de recozimen-to/elongação de 67°C durante 3 minutos. Uma etapa final adicional de alon-gamento foi realizada a 67°C durante 7 minutos. A segunda reação de PCRfoi exatamente fixa como descrito acima para a Primeira Rodada, salvo osubstrato de DNA 1 foi μΙ da primeira reação de amplificação que tinha sidodiluída 1/50 da primeira reação. As condições de ciclo de PCR eram 5 ciclosde desnaturação a 94°C durante 25 s, recozimento e alongamento 72°C du-rante 3 minutos. Um adicional de 25 ciclos foi realizado, a 95°C durante 25 se uma temperatura de recozimento/elongação de 67°C durante 3 minutos.Uma etapa final adicional de alongamento foi realizada a 67°C durante 7 mi-nutos. Os fragmentos de PCR resultantes foram separados através de ele-troforese em gel de agarose. Um produto de PCR da biblioteca nomeadaStul GW1 _CaHCT, mostrando uma única banda, foi depois clonado em p-CR4-TOPO usando Estojo de clonagem de TOPO TA para Seqüenciação(Invitrogen), depois PCR foi realizada em colônias isoladas positivas. O pro-duto de PCR com o comprimento esperado foi depois seqüenciado com pre-paradores T7 e de T3. A seqüência resultante (GW1-CaHC7) (SEQ ID Ne:19) era 685 pb de comprimento e sobrepôs a seqüência empcccwc22w14m23 (SEQ ID N6: 18) mais de 117 pb (Figura 3A, 3B). É obser-vado que esta seqüência genômica provavelmente codifique aproximada-mente 430 pb da região de 5' de não codificação do gene de CaHCT, e des-se modo codifique pelo menos parte deste promotor de genes.

Tabela 6. Preparadores usados para experimentos de GenomeWaIker.

<table>table see original document page 67</column></row><table>

O mesmo conjunto de preparadores específicos e condições dePCR usadas para isolar a ORF completa de HCT de C. canephora (CcHCT)foi empregado para isolar um cDNA que codifica uma ORF completa paraHCT de C. arabica (vide Exemplo 2 e Tabelas 3 e 4 para detalhes). cDNA foifeito usando Método 1 de RNA isolado de grão de C. arabica (T2308) no es-tágio amarelo e clonado em plasmídeo pML5 (Figura 3b). Análise de se-qüência da inserção de pML5 (SEQ ID Ns: 2) indicou que este cDNA era1388 pb de comprimento, com uma ORF completa de 1305 pb que codificaum polipeptídeo (SEQ ID NQ: 10) de 434 aminoácidos que têm um peso mo-lecular estimado de 48.186 kDa. Um alinhamento ótimo das inserções empML1 (CcHCT) (SEQ ID N5: 1) e pML5 (CaHCT) (SEQ ID Ne: 2) usandoCIustaIW mostra que as duas seqüências têm 98,9% de identidade no nívelde DNA, com diferenças de 14 nucleotídeos simples sendo observadas entreas duas seqüências. Estas diferenças dentro da seqüência de DNA para aORF translada em 5 alterações na seqüência de aminoácido (Figura 4). Éobservado que variações de seqüência poderiam ser esperadas mais signifi-cativas nas seqüências de UTR de 5' e 3' destes genes a maioria destasperdendo pML1 e pML5. Como mostrado na Figura 4, todas as quatro se-qüências de HCT têm a mesma seqüência (HHAAD) (SEQ ID Ne: 85) na cai-xa de HXXXD altamente conservada (SEQ ID Ne: 25). Isto também suporta acontenção que pML1 e pML5 codifiquem proteínas de HCT de café.Exemplo 5

Isolamento e caracterização de um clone de cDNA de Coffea canephora co-dificando hidroxicinamoil-COA quinato hidroxicinamoiltransferase (CcHQT)

As seqüências de proteína recentemente publicadas para HQTde tabaco (NtHQT, número de acesso CAE46932; Niggeweg et al., 2004) eHQT de tomate (LeHQT, número de acesso CAE46933, Niggeweg et al.,2004) foram empregadas em uma pesquisa junto ao conjunto de "unigene" 5usando o algoritmo de tblastn. Usando NtHQT de tabaco como a seqüênciade consulta, as duas melhores repetições foram unigene #125212 (valor dee = e-119) e unigene #123197 (valor de e = e-100). Usando LeHQT de toma-te como a seqüência de consulta, as duas melhores repetições foram tam-bém unigene #125212 (valor de e = e-127) e unigene #123197 (valor de e =e-103). As contagens de valor de e muito altas para unigene #125212 daspesquisas de BLAST com as seqüências de proteína de NtHQT e LeHQTfortemente indicaram que esta seqüência de unigene in silico era provávelde codificar uma proteína de HQT.

Um do EST mais longo para unigene #125212,(pcccs30w13p12) (SEQ ID Ne: 28) foi isolado da biblioteca de pericarpo ecompletamente seqüenciado. Análise de seqüência mostrou este cDNA codi-ficou uma inserção de 1056 pb contendo uma ORF parcial que codifica 292aminoácidos. A seqüência de polipeptídeo codificada por pcccs30w13p12(SEQ ID N9: 28) foi alinhada com as seqüências de proteína de HQT de ta-baco e de tomate usando o software de Megalign (pacote de software deLaser Gene, DNASTAR). Estes alinhamentos manualmente otimizados con-firmaram que a ORF parcial de pcccs30w13p12 (SEQ ID Ng: 28) provavel-mente codifique uma proteína de HQT. Estes alinhamentos também indica-ram que este clone de cDNA não continha uma ORF completa. A seqüênciade polipeptídeo codificada por pcccs30w13p12 (SEQ ID N9: 28) foi tambémalinhada com a seqüência de polipeptídeo codificada por cDNA mais longode unigene 123197 (pcccwc22w14m23) (SEQ ID N9: 18). Este alinhamentode proteína mostrou que estas duas seqüências eram significativamente di-ferentes (aproximadamente 61,3% de identidade no nível de aminoácido u-sando o Método de ClustalW), e desse modo, estas seqüências representamgenes diferentes.

O alinhamento das seqüências de proteína de HQT de tomate etabaco com a seqüência de ORF parcial de pcccs30w13p12 (SEQ ID Ns: 28)mostrou que esta seqüência de HQT de café careceu aproximadamente de140-150 aminoácidos na terminação N-terminal. Porém, com base na partesignificativa da seqüência de HQT de café codificada por pcccs30w13p12(SEQ ID N9: 28), preparadores específicos para o uso na técnica bem esta-belecida de PCR de RACE 5' foram inventados para isolar a terminação de5' perdida da seqüência de codificação de HQT de café. Usando o cDNApreparado pelo Método 1 usando RNA isolado de pericarpo de C. canephora(BP 409) (todos os estágios desenvolventes misturados) e os preparadorese condições de PCR expostos acima. No Exemplo 2 foi obtido um únicofragmento de aproximadamente 750 pb e diretamente seqüenciado usandopreparador 22m12-GSP2 específico (SEQ ID N9: 43) para amplificação dofragmento. A seqüência resultante (RACE3_CcHQ7) (SEQ ID N9: 27) era639 pb de comprimento e, sobrepôs a terminação 5' da seqüência empcccs30w13p12 (SEQ ID N9: 28) em 62 bp. (Figura 5a).

Esta seqüência de HQT de terminação 5' de C. canephora re-centemente isolada (RACE3_CcHQT) (SEQ ID N9: 27), e a seqüência decodificação no cDNA pcccs30w13p12 (SEQ ID N9: 28), permitiram o projetode dois preparadores novos capazes de especificamente amplificar a se-qüência de ORF completa de um CcHQTde HCT de café usando cDNA feitode RNA de pericarpo de C. canephora (BP-409) no estágio verde pequeno.(Tabelas 3 e 4). O cDNA obtido foi clonado em plasmídeo pML2 (Figura 5A e5B). Análise de seqüência da inserção em pML2 (SEQ ID N9: 3) indicou queeste cDNA era 1534 pb de comprimento e tinha uma ORF completa de 1293bp, codificando um polipeptídeo (SEQ ID N9: 11) de 430 aminoácidos tendoum peso molecular estimado dé 47,72kDa.

Alinhamento da seqüência de ORF completa de CcHQT (SEQID N9: 3) com as seqüências de HQT de tabaco e tomate previamente carac-terizadas, e a seqüência altamente relacionada de IbHCBT de Ipomea bata-tas acesso número BAA87043 (SEQ ID N9: 22) confirma a anotação inicialdesta seqüência de café da análise de BLAST, isto é, a ORF completa depML2 (SEQ ID N9: 3) codifica um proteína de HQT de café (SEQ ID N9: 11)5 (Figura 4). No nível de proteína, a seqüência de proteína de HQT de caféexibe 75,8%, 75,1% e 78,1% homologia às seqüências de tabaco, tomate eI. batatas, respectivamente. No nível de nucleotídeo, a seqüência de ORF deHQT de café exibe 72,1%, 70,1% e 71,1% de identidade com as seqüênciasde ORF de tabaco, tomate e I. batatas, respectivamente.

O alinhamento na Figura 4 também mostra que a seqüência deHQT de café de pML2 (SEQ ID N9: 11) tem as duas seqüências conserva-das, HXXXD (SEQ ID N9: 25) e DFGWG (SEQ ID N9: 26) que foram identifi-cadas como regiões fundamentais na classe de proteínas de planta acil-transferases (Yang et al. 1997, St-Pierre et al. 2000, Hoffmann et ai. 2003).

15 Como mostrado na Figura 4, todas as cinco seqüências de HQT têm quasea mesma seqüência (HT/NLSD) na caixa HXXXD altamente conservada(SEQ ID N9: 25), suportando também a contenção que pML2 codifica umaproteína de HQT de café.

Exemplo 6

Isolamento e caracterização de um clone de cDNA de Coffea arabica codifi-cando hidroxicinamoil-COA quinato hidroxicinamoiltransferase (CaHQT)

O mesmo conjunto de preparadores específicos e condições dePCR usado para isolar a ORF completa de HQT de C. canephora foi empre-gado para isolar um cDNA que codifica uma ORF completa para HQT de C.arabica (vide Exemplo 2 e Tabela 3 e 4). O cDNA empregado foi preparado,usando Método 1, de RNA isolado de flores de C. arabica (T2308) foramsubclonados e o fragmento de CaHQT específico amplificado para gerar oplasmídeo pML3 (Figura 6). Análise de seqüência da inserção em pML3 re-velou que este cDNA era 1533 pb de comprimento e tinha uma ORF poten-cialmente completa de 1293 pb que foi interrompido por um códon de paradasimples na posição 814-816 na seqüência de ORF (posição 272 na proteí-na). É presumido que esta mutação foi o resultado de uma mutação de pa-res de base simples (ÇAA para TAA) durante a amplificação de PCR comTaq DNA polimerase. Para assegurar que o códon de parada foi gerado porTaq e não é um códon de parada codificado por genoma, cDNA foi preparadousando Método 1 de RNA isolado de raízes de T2308 de C. arabica. Este cD-NA foi depois usado para amplificar por PCR a região do códon de parada.

A reação de PCR foi executada em um volume final de 50 μΙ,como segue; 5 pL de cDNA; 10 χ tampão de PCR (tampão de LA Il Mg++mais), 500 nM do preparador HQT-FullLup1 (5' CTGGAGGAAAGCAGAGA-AGCAT 3') (SEQ ID Ne: 86) e preparadores de HQT-FullLow2 (SEQ ID N9:52) (Tabela 3A), 200 μΜ de cada dNTP, 0,5 U de DNA polimerase TakaraLA Taq (Cambrex Bio Science). As condições de reação de PCR foram co-mo segue: 94°C durante 2 minutos; depois 94°C durante 1 minuto, 56°C du-rante 1 minuto e 72°C durante 2 e 40 ciclos. Uma etapa final adicional dealongamento foi realizada a 72°C durante 7 minutos. O produto de PCR foidepois analisado em eletroforese em gel de agarose e tingimento de brome-to de etídio.

Esta amplificação de PCR produziu um único fragmento de a-proximadamente 1600 pb. Este único fragmento (R-CaHQT) foi depois dire-tamente seqüenciado usando o preparador de HQT-FullLow2 (SEQ ID N9:52) (Tabela 4). Uma seqüência de 626 pb foi obtida que sobrepôs comple-tamente a seqüência de pML3 (CaHQT) (SEQ ID Ne: 4). A seqüência destefragmento de cDNA novo codificou a região que contém o sítio de mutação(98,9% homólogo na região de sobreposição de 626 pb), e no sítio de muta-ção, tinha ÇAA (para aminoácido esperado Q) e não TAA (PARADA) comoencontrado em pML3.

Comparação das seqüências de cDNA clonadas para CcHQT(SEQ ID Ng: 3) e CaHQT (SEQ ID Ns: 4) revelou 15 diferenças de nucleotí-deo simples. O alinhamento otimizado das seqüências de polipeptídeo deCcHQT (SEQ ID NQ: 11) e CaHQT (SEQ ID Ne: 12) revelou 7 diferenças deaminoácido (Figura 4).Exemplo 7

isolamento e caracterização de um clone de cDNA de Coffea canephora co-dificando P-cumaroil 3' hidroxilase CcC3H

Para encontrar cDNA de café que codifica a enzima p-cumaroilchiquimato 3'-hidroxilase (C3H), duas seqüências de proteína que codificamatividades de C3H bioquimicamente bem caracterizadas, a isoforma 2 de p-cumaroil chiquimato 3'-hidroxilase de Ocimun basilicum (Gangue et al.,2002; número de acesso AAL99201) e o citocromo de Arabidopsis P450CYP98A3 (Schoch et al., 2001; número de acesso 022203) foram usadaspara pesquisar o conjunto de "unigene" 5 usando o algoritmo de tblastn. Estapesquisa descobriu um unigene (#124852) exibindo um nível muito alto dehomologia às seqüências de proteína de C3H de O. basilicum e Arabidopsis.

Um cDNA que representa a terminação 5' do unigene #124852 (pcccl20d10(SEQ ID Ne: 5)), codificando potencialmente a ORF total desta proteína, foidepois isolado e seqüenciado.

A inserção de pcccl20d10 (SEQ ID N2: 5) foi determinada paraser 1728 pb de comprimento, e codificar uma ORF de 1527 pb. A seqüênciade proteína deduzida (SEQ ID N2: 13) compreende 508 aminoácidos, e temum peso molecular prognosticado de 57,9 kDa. A seqüência de proteína(SEQ ID N2: 13) de pcccl20d10 (SEQ ID Ne: 5) foi alinhada com as seqüên-cias de proteína homólogas de C3H de O. basilicum, A. thaliana, e uma se-qüência ortólogo de L. esculentum (Figura 7). Este alinhamento demonstrouque a proteína (SEQ ID N2: 13) codificada através de pcccl20d10 (SEQ IDN2: 5) compartilha, respectivamente, 75,1%, 73,9% e 82,9% homologia comestas seqüências de proteína. Desse modo, pode ser concluído que pcc-cl20d10 (SEQ ID N9: 5) codifica um cDNA de comprimento total para uma p-cumaroil chiquimato 3'-hidroxilase de C. canephora (CcC3H). Um alinhamen-to da seqüência de DNA que codifica a seqüência de ORF contida em pcc-cl20d10 (SEQ ID N2: 5) com as seqüências de DNA que codificam as se-qüências de ORF de C3H de O. basilicum e do citocromo P450 CYP98A3 deA. thaliana demonstrou que a seqüência de DNA de ORF de CcC3H com-partilha 69,4% e 69,2% de identidade com as seqüências de DNA de C3Hde O. basilicum e P450 CYP98A3 de A. thaliana.

Exemplo 8

Isolamento e caracterização de três clones de cDNA de Coffea canephoracodificando CCoAOMT

Para encontrar cDNA de café que codifica a enzima CCoAOMT,duas seqüências de proteína que codificam as atividades de CCoAOMT bemcaracterizadas, CCoAOMT de Nicotiana tabacum (número de acesso A-AC49913 (SEQ ID N9: 38) Martz et a!., 1998) e CCoAOMT de Medicago sati-va (alfafa) (número de acesso AAC28973 (SEQ ID N9: 37), Ferrer et al.,2005) foram usadas para pesquisar o conjunto de "unigene" 5 usando o al-goritmo de tblastn. Esta análise descobriu 3 unigenes que exibem níveis re-lativamente altos de homologia nas seqüências de proteína de N. tabacumCCoAOMT, #119965 (value = e-125 de e), #122801 (valor de e = e-63), e#119560 (valor de e = e-56). Estes unigenes foram também mostrados terhomologias relativamente altas à seqüência de proteína de M. sativa, isto é,#119965 (valor de e = e-127), #122801 (valor de e = e-64), e #119560 (valorde e = e-59).

Um do cDNA mais longo que representa a terminação 5' do uni-gene #119965 (pcccl15a11 (SEQ ID Ns: 6)), e potencialmente codificando aORF total desta proteína, foi depois isolado da biblioteca de folha e comple-tamente seqüenciado. A inserção de pcccl15a11 (SEQ ID N9: 6) foi determi-nado ser 1144 pb de comprimento e pra codificar uma ORF de 744 bp. Aseqüência de proteína de comprimento total deduzida (SEQ ID N9: 14) foideterminada ser 247 aminoácidos, com um peso molecular prognosticado de27,97 kDa. Figura 12 mostra um alinhamento otimizado da seqüência deproteína (SEQ ID N9: 14) de pcccl15a11 (SEQ ID N9: 6) com as seqüênciasde proteína de CCoAOMT de N. tabacum, e M. sativa revelou que a proteínade pcccl15a11 compartilha 85,1%, e 86,3% de homologia com estas se-qüências de proteína, respectivamente. Este alinhamento também demons-tra que a proteína de CcCCoAOMTI (SEQ ID N9: 14) contém todos os resí-duos de aminoácido que foram determinados por Ferrer et al. 2005. O grupode Ferrer determinou a estrutura da Cafeoil Coenzima A 3-O-Metiltransferase de alfaia através de cristalografia de raio X para a) interagirem reconhecimento da Co-enzima A, b) estar envolvido no reconhecimentode substrato, e c) estar envolvido em íon de metal divalente e ligação de co-fator. Desse modo, estes dados de alinhamento suportam a reivindicaçãoque pcccl15a11 (SEQ ID N9: 6) codifica um cDNA de comprimento total parauma Cafeoil CoA-O MetiITransferase de C. canephora (CcCCoAOMTI)(SEQ ID N2: 14).

É observado que as bases de dados públicas contêm uma se-qüência de cDNA parcial de C. canephora (Número de Acesso AF534905,codificando uma ORF de 108aa). Quando alinhada com CcCCoAOMTI(SEQ ID N9: 14), esta seqüência de base de dados exibe 97,5% de identida-de nas regiões apropriadas ao nível de DNA que indica o cDNA de C. cane-phora parcial (Número de Acesso AF534905) é provavelmente alélico aocDNA completo em CcCCoAOMTI, e que desse modo são dois alelos deCoffea canephora diferentes do mesmo gene.

O cDNA mais longo que representa a terminação 5' do unigene#122801 (cccs30w29k18), e codificando potencialmente uma proteína seme-lhante a CcCCoAOMT, foi isolado da biblioteca de grão de 30 semanas (30semanas após florescer) e completamente seqüenciado. A inserção depcccs30w29k18 (SEQ JD N9: 34) foi determinada ser 722 pb de comprimentoe codificar uma ORF parcial de 576 pb de comprimento. A seqüência de pro-teína parcial deduzida foi determinada codificar 191 aminoácidos. A seqüên-cia de polipeptídeo parcial codificada por pcccs30w29k18 (SEQ ID N9: 34) foialinhada e comparada com as seqüências de proteína de CCoAOMT de N.tabacum, e M. sativa. Este alinhamento mostrou que a seqüência de ORFinserida de pcccs30w29k18 (SEQ ID N9: 34) compartilhou 56,2% de identi-dade com ambas estas seqüências de proteína de planta CCoAOMT, poten-cialmente sugerindo esta proteína era uma proteína semelhante a CCoA-OMT. Este alinhamento também indicou que este clone de cDNA não conti-nha uma ORF completa.

Com base na seqüência codificada por pcccs30w29k18 (SEQ IDN9: 34), preparadores específicos foram inventados para isolar a terminação5' da seqüência de gene correspondente usando a técnica bem estabelecidade PCR de RACE 5'. Usando as condições de PCR de RACE descritas noExemplo 2 e Tabela 2 acima, os Preparadores de Gene 122801-GSPE1-específicos (SEQ ID Ns: 46) (PCR de RACE da primeira rodada) e 122801-GSP2 (SEQ ID Ne: 47) (PCR de RACE da segunda redonda), e cDNA prepa-rado pelo Método 1 usando RNA isolado de grão de BP409 de C. canephorano estágio amarelo de desenvolvimento produziu um fragmento de PCR de218 pares de base que foi clonado em pCR4-TOPO de acordo com o proto-colo previamente descrito e seqüenciado. A seqüência resultante (Ra-ce 1 _CcCCoAOMT-L1 em pNT13 (SEQ ID Ns: 33)) sobrepôs a terminação 5'do clone de cDNA pcccs30w29k18 (SEQ ID NQ: 34) (Figura 9A: 61 pb de se-qüência de sobreposição). Esta seqüência semelhante a CcCCoAOMT determinação 5' de café recentemente isolada (Race1_CcCCoAOMT-L1 (SEQID N5: 33)), e a seqüência de codificação parcial no pcccs30w29k18 de cD-NA (SEQ ID Ne: 34), permitiu o projeto de dois preparadores novos (CCoA-OMT-L1 -FuIIup (SEQ ID N9: 54) e CCoAOMT-L1-FullLow (SEQ ID Ne: 55),Tabelas 3 e 4) para especificamente amplificar a seqüência de ORF comple-ta do CaCCoAOMT-LI de café (SEQ ID Ne: 15) usando cDNA feito de RNAisolado de grão de C. arabica (T2308) (estágio de desenvolvimento amarelo)(Tabela 4).

A amplificação de PCR foi realizada em um volume final de 50μΙ, como segue: 5 μΙ de cDNA, 5 μΙ_ de 10 χ tampão de PCR (Tampão deReação de Pfu Clonado), 400 nM de ambos os preparadores específicos,200 μΜ de cada dNTP, e 1,25 U de DNA polimerase Pfu Turbo (Stratagene).As condições de ciclismo de PCR foram como segue: 94°C durante 2 min;depois 40 ciclos de 94°C durante 1 min, temperatura de recozimento 55°Cdurante 1 min, e 72°C durante 2 min. Uma etapa final adicional de alonga-mento foi feita a 72°C durante 7 min. Esta PCR resultou na geração de umfragmento de cDNA que foi clonado diretamente em vetor de pENTR/D-TOPO para formar o plasmídeo pNT8 (Figura 9B). Análise de seqüência dainserção de pNT8 (SEQ ID Ne: 7) indicou que este cDNA era 717 pb decomprimento (incluindo a seqüência de CACC usada na clonagem). O pias-mídeo pNT8 tem uma ORF completa de 690 pb que codifica um polipeptídeo(SEQ ID Ne: 15) de 229 aminoácidos tendo um peso molecular estimado de25,71 kDa.

O alinhamento apresentado na Figura 11 confirma que a ORFde CaCCoAOMT-LI (pNT8) em não um alelo de CcCCoAOMT-1 mas é cla-ramente um produto de gene diferente. Eficazmente, a seqüência de proteí-na CaCCoAOMT-LI (SEQ ID Ne: 15) codificada para ORF contida em pNT8(SEQ ID N9: 7) (54,6% de identidade de CcCCoAOMT-1). Além disso, estasproteínas mostram apenas 54,2%, 57,8% e 57,4% de identidade com proteí-nas MsCCoAOMT, NtCCoAOMT e de VvCCoAOMT caracterizadas (núme-ros de Acesso de Genbank são respectivamente AAC28973 (SEQ ID Ne:37), AAC49913 (SEQ ID N9: 38), e CAA90969 (SEQ ID N2: 39), vide Figura12). Como mostrado na Figura 12, cinco dos sítios caracterizados descritosna estrutura de cristal do CCoAOMT de alfafa são diferentes na seqüênciade proteína do CCoAOMT-L1 de Coffea. Dois de doze aminoácidos conser-vados que foram determinados estão implicados na ligação de co-fator (Fer-rer et al. 2005): isto é, Glu67 e Prol 39 de MsCCoAOMT são substituídosrespectivamente por um resíduo de Ala e um de Glu em CaCCoAOMT-LI(SEQ ID N2: 15), e três de seis resíduos envolvidos em reconhecimento desubstrato (Ferrer et al. 2005): isto é, Arg206, Tyr208 e Tyr212 são substituí-dos em proteína de CaCCoAOMT-LI (SEQ ID N9: 15) por um resíduo deAla, um de Glu, e um de Gly, respectivamente.

O cDNA mais longo que representa a terminação 5' do unigene#119560 (cccs46w30m24), e codificando uma ORF parcial potencialmentedesta proteína, foi depois isolado da biblioteca de grão de 46 semanas (46semanas após florescência) e completamente seqüenciado. Análise de se-qüência mostrou que este cDNA (SEQ ID N9: 36) codificou uma inserção 934pb. Um alinhamento da seqüência de DNA desta inserção com as seqüên-cias de proteína bem caracterizadas de NtCCoAOMT e MsCCoAOMT (Nú-meros de Acesso de Genbank AAC49913 (SEQ ID Ne: 38) e AAC28973(SEQ ID N9: 37), respectivamente) usando CLUSTALW provavelmente indi-ca que este cDNA contém um íntron. O alinhamento otimizado das seqüên-cias de DNA de NtCCoAOMT e MsCCoAOMT com inserção depcccs46w30m24 pelo programa de CLUSTALW produziu uma inserção de72 pb dentro da ORF cujas seqüências de DNA das outras seqüências decDNA de planta caracterizadas comparadas à seqüência da inserção depcccs46w30m24. Adicionalmente, a ORF de inserção de cccs46w30m24codificou uma seqüência de proteína truncada 92 aminoácidos mais curtaque NtCCoAOMT e MsCCoAOMT no término C devido a um códon de para-da dentro da seqüência de íntrons proposta de pcccs46w30m24.

Com base na observação que a seqüência de cDNA depcccs46w30m24 (SEQ ID Ns: 36) contém um íntron, uma seqüência proces-sada foi gerada in silico. O processamento de encaixe foi realizado a pb 426a 497 que representaram o íntron hipotético. Análise de seqüência da se-qüência de 862 pb encaixada resultante (seqüência de pcccs46w30m24 me-nos íntron hipotético) revelou que este cDNA continha uma ORF de 702bp,codificando uma proteína parcial de 233 aminoácidos. Esta seqüência depolipeptídeo hipotético foi depois alinhada com as seqüências de proteína deNtCCoAOMT e MsCCoAOMT descritas na seção anterior (Figura 12), reve-lando que a ORF parcial de pcccs46w30m24 compartilha 48,9% de identida-de com cada uma destas seqüências de CCoAOMT. Este proteína associa-da a esta ORF parcial foi chamada CcCCoAOMT-L2 (SEQ ID N9: 16).

Porém, como pcccs46w30m24 (SEQ ID Ng: 36) codifica umaparte significativa de uma seqüência semelhante a CCoAOMT de Coffeaprognosticada, isto permitiu o projeto de preparadores específicos para isolara seqüência de codificação de terminação de 5' perdida deste gene. ComcDNA preparado pelo Método 1 usando RNA isolado de grão de C. arabica(T-2308) em estágio amarelo, os preparadores 119560-GSP1 (SEQ ID Ng:48) (PCR de RACE de primeira rodada) e 119560-GSP2 (SEQ ID Ng: 49)(PCR de RACE de segunda rodada) e as condições de PCR observadas noExemplo 2 e na Tabela 2, foram obtidos em um único fragmento. Este frag-mento foi clonado diretamente no vetor de pCR4-T0P0 para dar pNT14 eseqüenciado usando o preparador universal T3. A seqüência inserida resul-tante (Racel_CaCCoAOMT-L2 (SEQ ID Ng: 35)) era 349 pb de comprimentoe, como esperado, sobrepôs a terminação 5' da seqüência empcccs46w30m24 (SEQ ID Ne: 36) (Figura 10A, com 224 pb da seqüência desobreposição). Esta seqüência semelhante a CCoAOMT de C. arabica re-centemente isolada de terminação 5' (Racel_CaCCoAOMT-L2) (SEQ ID NQ:35), e a seqüência de codificação no pcccs46w30m24 de cDNA (SEQ ID Ne:36), permitiram o projeto de dois preparadores novos CCoAOMT-L2-Fulll)p(SEQ ID N9: 58) e CCoAOMT-L2-FullLow (SEQ ID N9: 59) (Tabelas 3 e 4)capazes de especificamente amplificar a seqüência de ORF completa deCCoAOMT-L2 (SEQ ID N9: 8).

O cDNA usado para este experimento para amplificar a ORFcompleta de CC0AMT-L2 foi gerado através do Método 1 usando RNA isola-do de grão de C. canephora (BP-409) em estágio amarelo de desenvolvi-mento (mesmo cDNA usado para fazer o cDNA de comprimento total paraHCT, vide Tabela 4). Como descrito no Exemplo 2, o experimento foi reali-zado usando Takara LA Taq DNA polimerase (em um final 50 μΙ de volume,como segue: 5 μΙ de cDNA (Tabela 4), 5 μί de 10 χ tampão de PCR (LAPCR Il Mg2+), 800 nM de ambos os preparadores específicos, 200 μΜ decada dNTP, e 0,5 U de Takara LA Taq DNA polimerase (Cambrex Bio Sci-ence). As condições de ciclismo de PCR foram iguais às descritas no Exem-plo 2. Este experimento gerou um produto de PCR principal simples que foiclonado diretamente no vetor de pCR4-TOPO como descrito previamenteresultando no plasmídeo pNT4 (Vide Figura 10B para seqüência de DNA).pNT4 (SEQ ID N9: 8) codifica uma ORF completa de 717 pb que codifica umpolipeptídeo (SEQ ID Ng: 16) de 238 aminoácidos com um peso molecularestimado de 26,30 kDa.

Alinhamento de ORF completo da seqüência de CC0AOMT-L2de Coffea com as seqüências de CCoAOMT de Medicago sativa, Nicotianatabaeum e Vitisvinifera previamente caracterizadas (observadas acima) con-firma a anotação inicial de seqüência de Coffea parcial de pcccs46w30m24(SEQ ID Ne: 36) usando BLAST como proteína semelhante a CCoAOMT decafé (Figura 12). No nível de proteína, a seqüência de ORF de CcCCoA-OMT-L2 de café (pNT4) exibe 46,6% de identidade com a MsCCoAOMT,47% de identidade com a NtCCoAOMT-1 e 47,8 identidade com a seqüênciaproteína VvCCoAOMT. O alinhamento apresentado na Figura 11 entre a se-qüência de CcCoAOMT-L2 de Coffea (SEQ ID N9: 16) e a seqüência de pro-teína de CaCCoAOMT-LI de Coffea (SEQ ID N9: 15) descritas acima eCcCCoAOMT-1 (SEQ ID N9: 14) claramente mostra que estas três seqüên-cias de proteína representam grupos altamente relacionados diferentes de proteínas.

Um segundo alinhamento executado com todas as três proteí-nas (isto é, a CCoAOMT de café (SEQ ID N9: 14) e as duas proteínas seme-lhantes a CCoAOMT (SEQ ID NOs: 15 e 16)) com as proteínas de CCoA-OMT bem caracterizadas na Figura 12 claramente ilustra que a seqüênciada proteína de CcCCoAOMT-L2 de Coffea (SEQ ID N9: 16) é mais distante-mente relacionada à proteínas de CCoAOMT de planta bem caracterizadasque à proteína de CaCCoAOMT-LI (SEQ ID N9: 15). Além disso, é tambémobservado na Figura 12 que a seqüência de proteína de CcCCoAOMT-L2(SEQ ID N9: 16) tem várias alterações de aminoácido em regiões associadasao reconhecimento de substrato (número acesso de Medicago sativa A-AC28973 (SEQ ID N9: 37), Ferrer et al., 2005).

Exemplo 9

Sobre-expressão e caracterização de CCCCOAOMTI

A tecnologia de Gateaway (Invitrogen) composta de dois veto-res: pENTR/D-TOPO e do vetor de expressão pDEST17, foi usada para so-bre-produzir a proteína de CcCCoAOMTI (SEQ ID N9: 14). A estratégia con-sistiu em transferir a ORF de CcCCoAOMTI (SEQ ID N9: 6) para o primeirovetor (pENTR/D-TOPO) na estrutura com a seqüência de HisTag. Dois pre-paradores específicos foram projetados para realizar isto. O primeiro prepa-rador (CCoAOMTI-FuIIup (SEQ ID N9: 54) Tabela 3) inclui a seqüência es-pecífica para os primeiros códons da ORF (começando com o códon de co-meço ATG) e o adaptador de CACC necessário para direcionar clonagemem pENTR/D-TOPO é 5' para o códon de ATG. O segundo preparador(CCoAOMTI -FullLow, (SEQ ID N9: 55) Tabela 3) contém o códon de paradada ORF e várias bases (14bp) na 3' UTR.Depois, uma reação de PCR foi executada com os preparadoresespecíficos descritos acima e DNA polimerase Pfu Turbo (Statagene), quenão gera uma adenina na terminação 5' do produto e permite clonagem dire-ta de produto de PCR de CcCCoAOMTI em pENTR/D-TOPO. A amplifica-ção de PCR foi realizada em um volume final de 50 μΙ, como segue: 5 μΙ deplasmídeo de pcccl15a11 (1/50 diluído), 5 μΙ_ de 10 χ tampão de PCR (Tam-pão de Reação de Pfu Clonado), 400 nM de ambos os preparadores específi-cos, 200 μΜ de cada dNTP, e 1,25 U de DNA polimerase Pfu Turbo (Strata-gene). As condições de ciclismo de PCR foram como segue: 94°C durante 2minutos; depois 40 ciclos a 94°C durante 1 minuto, temperatura de recozimen-to 55°C durante 1 minuto, e 72°C durante 2 minutos. Uma etapa final adicionalde alongamento foi feita a 72°C durante 7 minutos. Este experimento pôs aORF de CcCCoAOMTI no vetor de pENTR/D-TOPO para formar o plasmídeopNT15.

Depois, pNT15 foi recombinado com pDEST17 (resistência àampicilina) de acordo com o protocolo GATEWAY sugerido pelo fabricante(Invitrogen) para produzir pNT16 em que a ORF está em estrutura empDEST17. Os produtos da recombinação foram transformados em célulascompetentes TopIO (Invitrogen) e clones que foram resistentes à ampicilina.Clones positivos foram verificados conter a inserção de CCoAOMTI por tria-gem de PCR com os preparadores específicos CCoAOMTI-FuIIUp (SEQ IDNe: 54) e CCoAOMTI -FullLow (SEQ ID N9: 55) descritos na TABELA 3. Apóspurificação, pNT16 foi depois transformado em células competentes BI21AI(para expressão de proteína) de acordo com o protocolo sugerido pelo pro-vedor (Invitrogen).

Para expressão da proteína, uma pré-cultura das células deBI12AI com pNT16 foi crescida durante noite a 37°C em 5 ml de meio de LBcontendo 100 pg/ml de ampicilina. 200 μΙ de cada pré-cultura serviram parainocular duas culturas (50 ml de meio de LB com 100 μg/ml de ampicilina), eas células foram crescidas até uma OD6oonm=0,6. A expressão da proteínaclonada foi depois induzida com 0,2% de L-arabinose e a cultura foi incuba-da por um adicional de 6 h a 27°C. Um controle negativo com repressão(produzido fazendo outra cultura de controle de 0,1% de glicose) foi tambémrealizado.

Depois as células foram empelotadas, colhidas e ressuspensasem dois ml de tampão de Iise (50 mM de fosfato de Potássio pH 7,8, 400 mMde NaCI, 100 mM de KCI, 20 mM de β-mercaptoetanol, 10% de Glicerol,0,5% de Triton X100, imidazol a 10 mM). A Iise é realizada por três ciclos decongelamento/descongelamento (-180°C/42°C) e seguido por 3 ciclos desonicação (1 minuto de tratamento/um minuto de refrigeração) em gelo como ajuste de potência da sonda inserida sendo usado a 40% do máximo (Vi-braCell72412, BIOBLOCK Scientific). As células Iisadas foram depois centri-fugadas (30 minutos 10.000 g), e o sobrenadante foi incubado com contas1,1 de Ni-Nta (produto de Qiagen 1004494) durante uma hora e depois a misturainteira foi transferida para uma coluna de cromatografia (Invitrogen #númerode cat). Esta coluna foi depois lavada duas vezes com 4 ml de tampão delavagem (50 mM de Tris HCI pH 7,5, 500 mM de NaCL, 20 mM de imidazol,20 mM de β-mercaptoetanol, 10% de Glicerol, 0,2 mM de MgCI2). A proteínamarcada com His foi eluída com cinco frações de 0,5 ml de tampão de elui-ção (50 mM de Tris HCI pH 7,5, 500 mM de NaCI, 0,2 mM de MgCI2, 20 mMde β-mercaptoetanol, 10% de Glicerol, 250 mM de imidazol).

Após agrupar as frações contendo a proteína, este fundo geralfoi dializado contra o tampão de atividade (50 mM de Tris HCI pH 7,5, 500mM de NaCL, 0,2 mM de MgCI2, 20 mM de β-mercaptoetanol, 10% de Glice-rol). A purificação da proteína foi verificada por uma análise em um gel a12% de SDS-PAGE (Figura 15). A indução de células recombinantes causoua acumulação de uma quantidade grande de proteína recombinante, com umpeso molecular estimado de 30 Kda (Figura 15A) que corresponde ao tama-nho prognosticado da proteína marcada com His CcCCoAOMTI. A proteínarecombinante marcada com His foi principalmente encontrada nas primeirastrês frações iludidas e a ausência de qualquer outra banda significativa nestafração eluída mostra que há pequena contaminação com proteína não-específica, e a análise de gel também demonstra a ausência de degradaçãode proteína recombinante (Figura 15B). Este experimento mostra que a cro-matografia de HisTag permitiu o isolamento de uma quantidade grande deproteína de CcCCoAOMTI marcada com His.

Quantificação de proteína foi executada usando o protocolo pa-drão de Bradford (estojo de Bradford Sigma #B6916).

O ensaio de CcCCoAOMTI foi executado por um protocolo rela-cionado àqueles usados por Inoue et al. 1998. O ensaio foi realizado em umvolume final de 200 pL de tampão de atividade (50 mM de Tris HCI pH 7,5,500 mM de NaCL1 0,2 mM de MgCI2, 20 mM de β-mercaptoetanol, 10% deGlicerol) contendo 40 pg de proteína, 150 μΜ de SAM e 200 μΜ de ácidocaféico. As reações foram realizadas a 30°C, e nos tempos indicados a rea-ção foi parada adicionando 9 volumes de tampão de parada (0,1% (v/v) deácido fórmico, 5% (v/v) de acetonitrila, pH 2,5). Estas amostras foram depoisclarificadas em filtros de 0,22 μΜ e 20 pL deste foram injetados na HPLC.

A análise de HPLC foi operada como segue: coluna (MacheryNagel Nucleosil 5 C18, 8 pm, 4 χ 250 mm); elução de gradiente, solvente A(0,1% (v/v) de ácido fórmico) e solvente B (5% (v/v) de acetonitrila): 0-15minutos 5%B-50%B, 15-17 minutos 50%B-70%B, 17-23 minutos 70%B, 23-25 minutos 70%B-100%B, 25-30 minutos 100%B, 30-32 minutos 100%B-5%B, 32-40 minutos 5%B, taxa de fluxo, 1 mL/min e detecção por espectro-fotômetro de UV a 324 nm (Waters 2487).

Ao ensaio da enzima de CcCCoAOMTI não foi realizado comCafeoil CoA, o substrato preferido da enzima, porque este substrato não estácomercialmente disponível. Do contrário, ácido caféico, um composto previa-mente usado para a proteína recombinante de Medicago saí/Vati, CCoAOMTfoi usado como o substrato. Ácido caféico tem uma especificidade inferior.(Inoue et al. 1998; Parvathi et al. 2001) neste ensaio, o produto esperado dereação é o ácido ferúlico. A comparação de espectros de análise de HPLCdas reações de controle e de teste é mostrada nas Figuras 18 A e B. Os resul-tados obtidos demonstram que um pico novo surge em 14,8 min após 6 horas,e este pico é maior em 24 horas. Este tempo de retenção é idêntico a um pa-drão de ácido ferúlico. Além disso, quando a amostra foi excitada com ácidoferúlico, o ácido ferúlico co-eluído recentemente adicionado com o pico pro-posto de ácido ferúlico (Figura 19), confirmando a proposta que este pico ge-rado por CcCCoAOMTI é ácido ferúlico. Um segundo pico pode ser identifi-cado no momento de retenção de 15,2 min, e porque este pico não está naamostra de controle (nenhuma enzima), poderia ser qualquer outro produtogerado por CcCCoAOMTI, ou um produto de degradação de ácido ferúlico.Em geral, os dados da Figura 18 demonstram que a proteína codificada porCcCCoAOMTI tem uma das atividades enzimáticas prognosticadas associa-das às proteínas de CcCCoAOMT como MsCCoAOMT e desse modo CcC-CoAOMTI codifica uma proteína de café cafeoil CoA O-metil transferase.

Exemplo 10

Sobreexpressão de proteínas de CaCCoAOMT-LI e de CcCCoAOMT-L2

A ORF (SEQ ID N9: 7) correspondendo à proteína de CaCCoA-OMT-L1 (SEQ ID N9: 15) já estava presente no vetor de entrada pENTR/D-TOPO (isto é, pNT8). A fim de sobreexpressar a proteína de CaCCoAOMT-L1 (SEQ ID N9: 15), esta ORF foi transferida para pDEST17 como descritoacima para CcCCoAOMTI (SEQ ID N9: 14), rendendo o plasmídeo pNT12.Este plasmídeo foi depois transformado em células de BL21-AI e a proteínafoi sobreexpressa e purificada como descrita para CcCCoAOMTI, excetoque a indução de expressão com arabinose foi realizada durante noite a20°C. Figura 16 mostra os resultados deste experimento de purificação desobreexpressão. Painel A (Figura 16) demonstra que uma indução boa deuma proteína com o tamanho esperado aproximado (aproximadamente 26kDa) ocorreu na indução das células transformadas. Os resultados de purifi-cação mostram que embora CaCCoAOMT-LI seja relativamente sobreex-pressado, a purificação na coluna de HisTag não foi muito eficiente (Figura16, Painel B). É acreditado tanto da proteína produzida era insolúvel e estaproteína teria sido perdida na etapa de centrifugação.

Para sobreexpressar a proteína de CcCCoAOMT-L2 (SEQ IDN9: 16), dois preparadores CCoAOMT-L2-FullUp (SEQ ID N9: 58) e CCoA-OMT-L2-FullLow (SEQ ID N9: 59) (Tabela 3) foram projetados para amplificara ORF que corresponde à CcCCoAOMT-L2 do plasmídeo pNT4. Estes pre-paradores geraram um fragmento de PCR que poderia ser clonado em pEN-TR/D-TOPO usando a mesma estratégia como descrita para CcCCoAOMTI.As condições da PCR usando DNA polimerase Pfu Turbo são também iguaisàs para CcCCoAOMTI, e gerou pNT10. A fim de sobreexpressar a proteínade CcCCoAOMT-L2, a ORF contida em pNT10 foi transferida para pDEST17como descrito acima para CcCCoAOMTI, rendendo o plasmídeo pNT17.Este plasmídeo foi depois transformado em células de BL21-AI e a proteínafoi sobreexpressa e purificada como descrito para CcCCoAOMTI exceto quea indução de expressão com arabinose foi realizada durante a noite a 20°C.Figura 17 mostra os resultados deste experimento de purificação de sobre-expressão. Painel A (Figura 16) demonstra que uma indução boa de umaproteína com o tamanho aproximado esperado (aproximadamente 28 kDa)ocorreu na indução das células transformadas. Os resultados de purificaçãomostram que embora CcCCoAOMT-L2 seja relativamente sobreexpressada,a purificação na coluna de HisTag não foi muito eficiente. É acreditado queum tanto da proteína de CcCCoAOMT-L2 produzida era insolúvel e dessemodo esta proteína teria sido perdida na etapa de centrifugação.

Exemplo 11

Sobreexpressão e purificação de proteínas de HCT e HQT

Para demonstrar que as proteínas codificadas através de pML1{CcHCT (SEQ ID Ns: 1)) e pML2 (CcHQT(SEQ ID N9: 3)) poderiam ser pro-duzidas em formas recombinantes, estes proteínas foram sobreexpressadasem E. coli. Isto foi realizado amplificando cada ORF por amplificação dePCR usando os preparadores observados na Tabela 7. O preparador dePCR de terminação 5' teve um sítio de BamHI logo antes do códon de iníciode ATG e o preparador de terminação de 3' teve um sítio de Xbal logo apóso códon de parada. As reações de PCR foram executadas com a PhusionPolimerase (FinnZymes) sob as condições especificadas pelo fabricante. Osprodutos de PCR específicos desse modo gerados foi purificado em géis deagarose e depois isolados dos géis usando o estojo de GeneCIean Turbo(Q-biogene) de acordo com o protocolo do fabricante. Os fragmentos purifi-cados foram depois digeridos com enzimas de restrição de BamHI e Xbal(New England Biolabs).O vetor de expressão (plasmídeo pGTPc103a) foi também dige-rido com BamHI e Xbal sob as mesmas condições. Os fragmentos purifica-dos com gel foram quantificados e depois ligados no vetor de pGTPc103adigerido usando T4 DNALigase (New Englands Biolabs), uma etapa que foiprojetada (por meio dos preparadores de PCR usados) para colocar o mar-cador de GST codificado pela estrutura interna de vetor com a seqüência deproteína de HCT/HQT sendo clonada. Células competentes de DH5a (Invi-trogen) foram depois transformadas com cada mistura de ligação de acordocom os protocolos do fabricante. Triagem das colônias para aquelas com asinserções apropriadas foi executada por PCR usando os mesmos prepara-dores empregados para clonar a ORF e com digestão enzimática. Plasm í-deos selecionados foram depois purificados e as inserções de HCT e HQTpresentes foram seqüenciadas (para assegurar nenhum erro durante a etapade PCR). O plasmídeo de pGTPc103a que contém a seqüência de CcHCTfoi nomeado pGTPc103a_HCT e o plasmídeo de pGTPc103a que contêm aseqüência de CcHQT foi nomeado pGTPc103a_HQT. Por fim, células com-petentes de expressão BI21(DE3) foram transformadas compGTPc103a_HCT ou pGTPcl 03a_HQT a fim de expressar a proteína.

Para sobreexpressar as proteínas, uma pré-cultura de cada cé-lula recombinante de BI21(DE3) contendo CcHCT ou CcHQT foram crescidadurante noite a 37°C entre 10 ml de meio de LB contendo 50 pg/ml de ca-namicina. Cada pré-cultura foi depois usada para inocular duas culturasmaiores (200 ml de meio de LB com 50 pg/ml de canamicina), e as célulasforam crescidas até que a OD6oo alcançasse 1. Expressão da proteína foidepois induzida adicionando 0,2 mM de IPTG e as culturas foram depoiscrescidas para um adicional de 3h a 37°C.

Após este tratamento de indução, as células foram empelotadas,e depois ressuspensas em 25 ml de tampão de Iise (20 mM de NaPO4 pH7,3, 150 mM de NaCI, 1% Triton X100, 2 mM de EDTA, 0,1% de β-mercaptoetanol, 1X mistura de inibidor de protease). Lise foi realizada atra-vés de sonicação (Vibracel 72,434) em gelo durante 3 ciclos de 10 segun-dos. As células Iisadas foram centrifugadas (30 minutos 10.000 g), e o so-brenadante foi aplicado a uma amostra de meios de GST-Sepharose 4B (A-mersham) durante duas horas. Esta mistura foi depois transferida para umacoluna de cromatografia pequena, e lavada 3 vezes com 5 ml de tampão delavagem (420 mM de NaPO4 pH 7,3, 150 mM de NaCI, 1X mistura de inibi- dor de protease). A proteína marcada com GST foi eluída em quatro fraçõesdistintas de 0,5 ml de tampão eluição (50 mM de Tris HCI pH 8, 10 mM deglutationa reduzida, 10% de glicerol, 1X mistura de inibidor de protease).A produção das proteínas recombinantes e purificações de cada fração fo-ram seguidas por análise em 5-18% de gel de gradiente de SDS-PAGE e porwestern blot usando um anticorpo específico contra o marcador de GST (Fi-guras 13 e 14).

Os resultados apresentados na Figura 13A mostram que HCTfoi sobreexpressado fracamente e que esta proteína poderia ser purificadaatravés de cromatografia de marcador de GST. A preparação da proteínapurificada (eluída mais de quatro frações) continha duas bandas na faixa depeso molecular mais alto (72,2 e 70 kDa). A proteína de 72,2 kDa tem o ta-manho mais próximo ao tamanho esperado para a fusão de GST-HCT. Aproteína de 70 kDa não é conhecida. O material de peso molecular baixo(aprox 28 kDa) corresponde sozinho ao marcador de GST. Os resultados dowestern blot apresentados na Figura 13B demonstram que a proteína de72,2 kDa reage com o anticorpo contra o marcador de GST como esperadopara a proteína de fusão GST-HCT. Similarmente, a banda de 28 kDa reagefortemente com o anticorpo contra GST, confirmando isto é a proteína deGST. Os resultados apresentados na Figura 14A mostram que HQT foi so-breexpressado fracamente e que esta proteína poderia ser purificada atravésde cromatografia de marcador de GST. A preparação de proteína purificada(eluída nas primeiras duas frações) continha duas bandas na faixa de pesomolecular mais alto (73,1 e 70 kDa). A proteína de 73,1 kDa aproximou-seao tamanho esperado para a fusão de GST-HQT. A proteína de 70 kDa nãoé conhecida. O material de peso molecular baixo (aprox 28 kDa) correspon-de sozinho ao marcador de GST. Os resultados do western blot apresenta-dos na Figura 14B demonstram que a proteína de 73,1 kDa reage com oanticorpo contra o marcador de GST como esperado para a proteína de fu-são de GST-HCT. Similarmente a banda a 28 kDa reage fortemente com oanticorpo contra GST1 confirmando isto é a proteína de GST.

Tabela 7. Lista de preparadores específicos usados para a sub-clonagem

<table>table see original document page 87</column></row><table>

Exemplo 12

Análise de expressão de gene de HQT. HCT. C3H. CCOAOMT-1, CCOA-OMT-L1. ANDCCOAOMT-L2 por RT-PCR quantitativa

Para medir a expressão precisamente de cada um destes ge-nes, os níveis de transcrições dos genes de HQT, HCT, C3H, CCoAOMT-1,CCoAOMT-L1 e CC0AOMT-L2 foram determinados para vários tecidos davariedade de arabica C. arabica T2308 e da variedade de robusta C. cane-phora pb 409 usando preparadores/sondas de TaqMan gene-específicos(Tabela 5). O cDNA diferente para estes experimentos foi preparado atravésdo Método 1 com RNA isolado de raízes, talos, folhas, flores, e dos tecidosdo grão e pericarpo isolados de 4 estágios diferentes de grãos secos de caféde arabica e de robusta em desenvolvimento como descrito no Exemplo 2,acima. Os resultados destes experimentos são apresentados na Figura 8.

GENES QUE CODIFICAM HCT E HQT. Sonda de TaqMan epreparadores para os genes de HQT e HCT foram projetados (vide Tabela 5)e estes foram depois usados para medir os níveis de transcrição para cadaum destes genes em vários tecidos de café de arabica e de robusta diferen-tes (vide Exemplo 2). O perfil de expressão de HQT (Figura 8) visto para ro-busta mostra que este gene é expresso em níveis relativamente altos (RQ0,71) no grão no estágio verde pequeno, e em níveis um pouco inferiores emtodos os outros tecidos examinados. É observado que a amostra de pericar-po verde pequena também tem um nível ligeiramente elevado de HQT comrelação aos estágios posteriores de desenvolvimento de pericarpo. Previa-mente foi demonstrado pelos inventores que esta amostra de grão verderobusta não tem nenhuma expressão de gene específica para endosperma(Pedido provisório N9 60/696.445). Esta última observação leva à sugestãoque o gene de HQT pode ser altamente expresso durante os estágios pre-maturos de grão e desenvolvimento de pericarpo, e que o nível de transcri-ção deste cai para níveis relativamente baixos em ambos os tecidos conco-mitantes com o começo de desenvolvimento de endosperma.

Os níveis de expressão de HQT nos outros tecidos de robustasugerem que este gene é em geral expressos em vários tecidos de café emníveis baixos constantes, sugerindo que ele pode ter algum tipo de funçãode "manutenção". Quando os níveis de HQT são examinados em arabica,níveis relativamente similares foram vistos para robusta nas raízes, talos, efolhas jovens e na maioria dos tecidos de grão e de pericarpo. Isto é consis-tente com a idéia que é um gene do tipo de manutenção potencialmente im-portante. Os baixos níveis de HQT no grão verde pequeno de arabica e a-mostras de pericarpo são consistentes com a idéia que HQT cai quando aexpressão de gene endosperma-específica é induzida porque estes grãosverdes pequenos de arabica expressam genes endosperma-específicos(Pedido provisório N- 60/696.445). Por fim, é observado que diferençasgrandes foram também detectadas para expressão de HQT nas flores dearabica e robusta. As diferenças são provavelmente devido às diferenças noestágio desenvolvente preciso destas duas amostras de flor como a expres-são de vários genes foi vista ser extremamente variável entre estas duasamostras de flor.O perfil de expressão de HCT visto para robusta indica que estegene é expressado em níveis relativamente altos no pericarpo nos estágiosverde grande (RQ 0,33), e amarelo com níveis inferiores vistos no pericarponos estágios verde pequeno (RQ 0,09) e vermelho. Níveis de transcrição sãorelativamente altos nas raízes e talos em robusta, enquanto níveis inferioressão vistos nas folhas e flores. Níveis muito baixos foram também detectadosno grão em todos estágios estudados. Um padrão um pouco diferente deexpressão é visto em arabica, sem detecção das transcrições de HCT nopericarpo, com exceção de um nível baixo visto no estágio verde pequeno.Além disso, nenhuma transcrição de HCT foi detectada nos tecidos de talode arabica. Em contraste, níveis ligeiramente mais altos de HCT foram de-1,1 tectados nas folhas e no grão no estágio vermelho em arabica com relação àrobusta. A detecção de expressão de HCT em um número limitado de amos-tras de tecido de arabica elimina a possibilidade que o conjunto de sonda de HCT Taqman, que foi projetado da seqüência de robusta, não é reconhecidonesta variedade de arabica. Os níveis de HCT foram similares nas amostrasde flor de arabica e robusta.

A expressão mais alta de HCT no grão de arabica versus o grãode robusta sugere que diferenças nos perfis de ácidos clorogênicos em ara-bica e robusta pudessem, em parte, ser devido a níveis diferentes de ex-pressão de HCT no grão de café maduro. Similarmente, dado o envolvimen-to potencial de ácidos clorogênicos em resistência de patógeno (Shadle etal. (2003); Niggeweg et al. (2004)), a expressão alta de HCT em raízes derobusta e talos poderia contribuir para resistência a patógehos significativa-mente elevada em geral associada aos cafés de robusta versus de arabica.É observado que há uma expressão relativamente baixa de HCT nas amos-tra de flor de robusta BP-409. Porém, considerando esta amostra de folha éde folhas em expansão jovens, é possível que a expressão de HCT na folhamadura seja significativamente mais alta que em folhas jovens, talvez devidoao uso alternativo de CGA para a síntese de Iignina e similares componentesestruturais durante a expansão da folha. Esta explanação para níveis detranscrição de HCT mais baixos que esperado em folhas jovens suportariatambém aquele argumento que a expressão de HCT mais alta está ligada àresistência mais alta a patógenos ou a doenças, visto que seria uma caracte-rística importante para folhas maduras.

GENES QUE CODIFICAM C3H. Preparadores específicos esondas de TaqMan foram projetados para o gene de C3H (vide Tabela 5).Este conjunto de sonda foi usado para medir os níveis de transcrição C3Hem vários tecidos de café de arabica e de robusta diferentes como observa-do no Exemplo 2. Os dados mostrados na Figura 8 indicam que transcriçõesde C3H podem ser detectadas em todos os tecidos de robusta testados. Umnível relativamente alto de transcrições de C3H é visto na amostra de grãode estágio verde pequena de robusta, e níveis relativamente altos de trans-crições de C3H são também vistos no pericarpo (picando nos estágios verdegrande e amarelo). Níveis inferiores de transcrições de C3H são vistos nasamostras de talo, folha e de flor de robusta. De forma interessante, nenhumatranscrição de C3H foi detectada nas amostras de raiz de robusta. Em arabi-ca, níveis de transcrição de C3H foram similares no grão para robusta, exce-to no estágio verde pequeno. É acreditado que a última observação acimaestá ligada ao último estágio desenvolvente da amostra de arabica comoobservado. De forma interessante, níveis de transcrição de C3H nas amos-tras de pericarpo de arabica são indetectáveis no estágio verde pequeno edepois sobem consistentemente até o estágio vermelho. Isto está em con-traste distinto com as amostras de robusta onde expressão de C3H foi maisalta antecipadamente em desenvolvimento e depois diminuída na maturidade.

GENE QUE CODIFICA CCOAOMT-1. Uma sonda de TaqManespecífica e dois preparadores foram projetados para o gene de CCoAOMTI(vide Tabela 5). Os dados de RT-PCR quantitativa para este gene estão a-presentados na Figura 8. Em grão de robusta, transcrições de CCoAOMT-1foram muito baixas no estágio verde pequeno (RQ 0,05), mas mais altas nosestágios de grão verde grande (RQ 0,31) e amarelo (RQ 0,76), depois caiupara um nível muito baixo no grão maduro (RQ 0,09). No pericarpo, os níveissão baixos no pericarpo verde pequeno (RQ 0,15), ligeiramente mais altonos estágios verde grande (RQ 0,56) e amarelo (RQ 0,65), e depois caemnovamente para um nível muito baixo no estágio vermelho (RQ 0,06). Emrobusta, os níveis de transcrição de CCoAOMT-1 foram observados ser rela-tivamente altos nas raízes (RQ 1,09) e talos (RQ 1,5), moderadamente altosnas flores (RQ 0,58) e muito baixos na folha (RQ 0,06). Em comparação àamostra de BP409 de robusta. Em T2308 de arabica, os níveis de CCoA-OMT-1 são relativamente altos no grão verde pequeno (RQ 0,56) e grande(RQ 1,21), e no grão vermelho (RQ 1,43). A queda inesperada nos níveis deCCoAOMT-1 no estágio de grão amarelo (RQ 0,16) foi inesperada e neces-sitará ser verificada em outras amostras de arabica. Os níveis de transcriçãode CCoAOMT-1 nas amostras de pericarpo de arabica verde pequeno, ver-des, amarelo grande são relativamente baixas.

GENE QUE CODIFICA CCOAOMT-L1. Uma sonda de TaqManespecífica e dois preparadores foram projetados para o gene de CCoAMT-L1 (vide Tabela 5). Em geral, os resultados de RT-PCR quantitativa obtidosindicam que o nível de transcrições para o gene de CCoAOMT-L1 ou estápróximo, ou abaixo, do nível de detecção em todos os tecidos de robustaexaminados. Um resultado relativamente similar foi obtido para todas as a-mostras de arabica, exceto a amostra de flor. Neste caso, transcrições deCCoAOMT-L1 foram muito claramente detectadas (RQ 0,14), ou seja, estegene tem um nível 7,8 vezes mais alto de transcrições que aquele detectadono grão verde pequeno de arabica (RQ 0,018). A presença destas transcri-ções na amostra de flor arabica sugere que este gene é especificamenteexpressado em uma ou mais partes da flor. Além disso, a ausência de trans-crições de CCoAOMT-L1 nas flores de robusta sugere que as flores de ara-bica e de robusta estejam em estágios diferentes de maturidade, e dessemodo a expressão de CCoAOMT-L1 poderia ser específico para o estágiodurante o desenvolvimento da flor. Suportando este último argumento, váriosoutros genes de café mostraram expressão extensamente diferente nasmesmas amostras de flor de arabica e robusta, indicando novamente estasamostras estão em estágios diferentes de maturidade.

GENE QUE CODIFICA CCOAOMT-L2. Uma sonda de TaqManespecífica e dois preparadores foram projetados para o gene de CCoAOMT-L2 (vide Tabela 5). Os resultados de RT-PCR quantitativa obtidos para estegene indicaram que, além da amostra de flor de robusta, expressão deCCoAOMT-L2 não foi detectada confiantemente em quaisquer das amostrasde tecido de robusta ou arabica usando as condições experimentais descri-tas aqui. É observado que experimentos de controle mostraram que a efici-ência de amplificação do conjunto de preparador/sonda de rpl39 e a eficiên-cia do conjunto de preparador/sonda de CCoAOMT-L2 são similares quandotestadas contra seus respectivos plasmídeos. Desse modo, não é provavel-mente que a ausência de expressão detectável para o gene de CCoAOMT-L2 em robusta ou arabica encontrados aqui seja devida a um problema es-pecífico com o conjunto de preparador/sonda de CCoAOMT-L2.

Exemplo 13

Atividade funcional de HCT de café recombinante

Atividade não foi detectada de HCT marcado GST recombinantee proteínas de HQT marcadas como GST produzidas em E. coli. Para de-terminar se o marcador de GST estava impedindo a atividade destas proteí-nas, os marcadores de GST foram removidos enzimaticamente de cada pro-teína. A proteína de HCT e HQT recombinante (sem marcadores) foi depoisreensaiada para atividade.

DIGESTÃO DE ACTEV PROTEASE: As proteínas de HCT-GSTrecombinante ou HQT-GST recombinante, produzidas e purificadas comodescritas no Exemplo 11, foram digeridos por AcTEV de acordo com as ins-truções do provedor (Invitrogen): 140 μΙ de enzima recombinante foram dige-ridos a 30°C durante duas horas com 7,5 μΙ de tampão de TEV (20 χ tam-pão, Invitrogen), 1,5 μΙ de 0,1 mM de DTT, e 2 μΙ de AcTEV protease (20unidades).

ENSAIO DE ENZIMA: MÉTODOS MODIFICADOS NIGGEWEGet al, 2004 e HOFFMANN et al, 2003 foram usados. Atividade da enzima foideterminada a 40°C usando a reação reversa (clivagem de 5-CQA para ca-feoil-CoA e ácido quínico). A mistura de reação (200 μΙ total) foi: 100 mM detampão de Na-pi pH 6,5, 1 mM de DTT, 5 mM de CGA (5-CQA - Sigma), 3,3mM de CoA1 e 30 μL de enzima de GST-HCT ou GST-HQT recombinantedigerida com AcTEV. A reação foi iniciada por adição do substrato CoA. Acada ponto de tempo; 30 μΙ da mistura de reação foram parados por adiçãode 170 μL de tampão de parada (0,1% de ácido fórmico, 5% de acetonitrila).

Este material foi depois filtrado usando um filtro de 0,2 μm, e depois carre-gado para a coluna de HPLC.

MÉTODO DE HPLC: Produtos de reação foram analisados porHPLC, usando uma coluna C18 de fase reversa de Waters (4 μιτι, 4,6 χ 250mm) e um gradiente de acetonitrila (8-50%): solvente A era 91% de milliQH2O, 8% de CH3CN, e 1% de ácido fórmico; solvente B era 49% de milliQH2O, 50% de CH3CN, e 1% de ácido fórmico, solventes foram pulverizadoscom 30% de hélio). O gradiente era como segue; a 0 min, 98% A - 2% B; a 5min, 92% A - 8% B; a 25 min, 50% A - 50% B; a 30 min, 30% A - 70% B; a35 min, 30% A - 70% B; depois de 37-45 minutos, 98% A - 2% B. Os corrí-postos eluídos a 325 nm foram detectados. Os compostos foram caracteri-zados por seus tempos de eluição e seus espectros de absorção de UV, esuas identidades foram confirmadas através de padrões quando disponíveis.

Resultados:

O tratamento de proteínas de HCT marcado com GST e de HQTmarcado com GST com proteína de AcTEV foi mostrado por eletroforese emgel de SDS PAGE gel e tingimento de coomassie para gerar um polipeptídeomenor com o peso molecular esperado das proteínas de comprimento totalde cada um das proteínas "precursoras" marcadas com GST. Esta observa-ção demonstra que a AvTEV protease de forma bem sucedida liberou oMarcador GST das proteínas de GST-HCT e de GST-HQT e desse modoproduziu os polipeptídeos de HCT e de HQT normais de comprimento total.

Figura 20 mostra a reação de controle para atividade deHCT/HQT (5-CQA clivado com cafeoil-CoA e ácido quínico). Aquela reaçãocontinha todos os reagentes, mas sem enzima adicionada. Os resultadosmostrados na Figura 20 demonstram que sob as condições empregadas,ácido clorogênico (5-CQA) é estável; o pico de CGA é apenas ligeiramentemenor em T=4 horas versus o tamanho de pico em T=O, e apenas um picomuito pequeno aparece a 12,1 minutos.

Em contraste, Figura 21 mostra que o pico de CGA na reaçãocom proteína de GST-HCT tratada com AvTEV foi significativamente reduzi-do (de aproximadamente 0,035 em T=O para aproximadamente 0,02 em T=4horas). A redução do pico de CGA é acompanhada pelo surgimento de vá-rios picos novos. Os picos novos estão respectivamente em cerca de 8 mi-nutos, 17,1 minutos e 18,3 minutos, além do desenvolvimento de uma sali-ência significativa no pico de CGA. Porque sob estas condições de eluição,ácido caféico elui muito próximo do pico de 5-CQA pico, a adição do polipep-tídeo de HCT de café recombinante causa a acumulação de ácido caféico.Embora o produto esperado desta reação tenha sido cafeoil-CoA, é prova-velmente que esta molécula seja instável no tampão usado e rapidamentedegradada, formando o ácido caféico observado. De acordo com este argu-mento, é provavelmente que um dos picos a 17,1 minutos e 18,3 minutossão de fato cafeoil-CoA.

REFERÊNCIAS:

Altschul S.F., Madden T.L., Schaffer A.A., Zhang J., Zhang Z.,Miller W., Lipman D.J. (1997) Gapped BLAST and PSI-BLAST: a new gene-ration of protein database search programs. Nucleic Acids Res. 25: 3389-3402.

Ben Amor M. e McCarthy J. (2003) Modulation of coffee flavourprecursor leveis in green coffee grains. Patente européia EPC/03394056.0.

Clifford M.N. (1985) Chlorogenic acids, em Coffee 1. Chemistry,Ed por Ciarke RJ e Macrae R. Elsevier Applied Science, Londres, páginas153-202.

Clifford M.N., Walker R (1987) Chlorogenic acids-confounders ofcoffee±serum cholesterol relationships. Food Chem 24: 77-80.

Clifford M.N. (1998) The nature of chlorogenic acids-are theyadvantageous compounds in coffee?, em Dix-septième Colloque ScientifiqueInternational sur Ie Café. ASIC, Paris, páginas 79-91.

Clifford M.N. (1999) Chlorogenic acids and other cinnamates-nature, occurence and dietary burden. J Sci FoodAgric 79: 362-372.Clifford Μ.Ν. (2000) Chlorogenic acids and other cinnamates -nature, occurrence, dietary burden, absorption and metabolism J Sci FoodAgric 80: 1033-1043.

Crouzillat D., Lerceteau E., Petiard V., Morera J., Rodriguez H.,Walker D., Philips W.R.R., Schnell J., Osei J. e Fritz P. (1996). Theobromaeaeao L.: a genetic Iinkage map and quantitative trait Ioei analysis. TheorAp-pIGenet. 93:205-214.

Ferrer JL1 Zubieta C, Dixon RA, Noel JP (2005) Crystal structu-res of alfalfa caffeoyl coenzyme A 3-O-methyltransferase. Plant Physiol 137:1009-1017.

Gang D., Wang J., Dudareva N., Hee Nam K1 Simon J., Lewin-sohn E., Piehersky E (2001) An Investigation of the Storage and Biosynthesisof Phenylpropenes in Sweet Basil Plantphysiol. 125: 539-555.

Graee S.C., Logan B.A. (2000) Energy dissipation and radicalscavenging by the plant phenylpropanoid pathway Phil. Trans. R. Soe. Lond.S. 355:1499-1510.

Hoffmann L., Maury S., Martz F., Geoffroy P., Legrand M..(2003) Purification, Cloning, and Properties of an Aeyltransferase ControllingShikimate and Quinate Ester Intermediates in Phenylpropanoid MetabolismJ. Bio. Chem. 278(1): 95-103.

Hoffmann L., Besseau S., Geoffroy P, Ritzenthaler C., Meyer D.Lapierre C, Pollet B. Legrand M (2004) Sileneing of Hydroxycinnamoyl-Coenzyme A Shikimate/Quinate Hydroxycinnamoyltransferase Affeets Phen-ylpropanoid Biosynthesis Plant Cell Λ 6: 1446-1465.

Hollman P.C.H. (2001) Evidenee for health benefits of plant phe-nols: local or systemic effects? J. Sei. FoodAgric. 81:842-852.

Inoue K, Sewalt VJ1 Murray GB, Ni W, Sturzer C, Dixon RA(1998) Developmental expression and substrate specificities of alfalfa caffeicacid 3-O-methyltransferase and caffeoyl coenzyme A 3-O-methyltransferasein relation to lignification. Plant Physiol 117: 761 -770.

Ky C.-L., Louarn J., Dussert S., Guyot B., Hamon S., Noirot M.(2001) Cafeine1 trigonelline, chlorogenic acids and sucrose diversityin wildCoffea arabica L. and C. canephora P. accessions Food Chemistry 75: 223-230.

Lee C. Y., Jaworski A. (1987) Phenolic compounds in white gra-pes grown in New York. Am. Enol. & Viticul. 38: 277-281.

Leloup V., Louvrier A., Liardon R. (1995) Degradation meca-nisms of chlorogenic acids during roasting. Compte-rendus du Seizième Col-Ioque de I1ASIC (Association Scientifique Internationale sur Ie Café) ASICKyoto páginas 192-198.

Maher E.A., Bate N.J., Ni W., Elkind Y., Dixon R.A., Lamb C.J.(1994) Increased disease susceptibility of transgenic tobacco plants withsuppressed leveis of preformed phenylpropanoid products. Proc. Nati Acad.Sei. USA 91:7802-7806.

Marraeeini P., Deshayes A., Pétiard V. e Rogers W.J. 1999. Mo-lecular cloning of the complete 11S seed storage protein gene of Coffea ara-bica and promoter analysis in the transgenic tobacco plants. Plant Physiol.Biochem. 37:273-282.

Maury1S., Geoffroy1P., Legrand1M. (1999) Tobacco O-methyltransferases involved in phenylpropanoid metabolism. The differentcaffeoyl-coenzyme Α/5-hydroxyferuloyl-coenzyme A 3/5-O-methyltransferaseand caffeic acid/5-hydroxyferulic acid 3/5-O-methyltransferase classes havedistinet substrate specificities and expression patterns. Plant Physiol. 121:215-224.

Mitchell H.J., Hall S.A., Stratford R., Hall J.L., Barber M.S.(1999). Differential induetion of cinnamyl alcohol dehydrogenase during de-fensive Iignification in wheat (Triticum aestivum L.): characterisation of themajor inducible form. Planta 208 : 31-37.

Montavon P., Duruz E., Rumo G., Pratz G. (2003a) Evolution ofGreen Coffee Protein Profiles with Maturation and Relationship to CoffeeCup Quality J. Agric. Food Chem. 51: 2328-2334

Montavon P., Mauron A.F. Duruz E. (2003b) Changes in GreenCoffee Protein Profiles during Roasting Food Chem. 51: 2335-2343.

Nair R., Xia Q., Kartha C., Kurylo E., Hirji R., Datla R., SelvarajG. (2002) Arabidopsis CYP98A3 Mediating Aromatic 3-Hydroxylation. Deve-Iopmental Regulation of the Gene, and Expression in Yeast Plant physiol.130:210-220.

Natella F., Nardini M., Giannetti I., Datillo C., Scaccini C.(2002)Coffee Drinking Influenees Plasma Antioxidant Capaeity in Humans J. Agric.Food Chem.50: 6211 -6216.

Niggeweg R., Miehael A., Martin C. (2004) Engineering plantswith increased leveis of the antioxydant chlorogenic acid Nature Biotech.22(6): 746-54.

Ohnishi M., Morishita H., Iwahasi H., Toda S., Shirataki Y., Kimu-ra M., Kido R. (1994) Inhibitory effects of chlorogenic acids on Iinoleic acidperoxidation and haemolysis. Phytochemistry 36 :579-584.

Olthof M.R., Hollman P.C.H., Katan M.B. (2001) Chlorogenic a-cid and caffeic acid are absorbed in humans. J. Nutr. 131 :66-71.

Parvathi K, Chen F1 Guo DJ, Blount JW, Dixon RA (2001) Subs-trate preferences of O-methyltransferases in alfalfa suggest new pathwaysfor 3-O-methylation of monolignols. Plant Journal 25:193-202.

Rice-Evans C.A., Miller M.J., Paganga G. (1996) Strueture-antioxidant activity relationships of flavonoids and phenolic acids. Free Rad.Biol. Med. 20 :933-956.

Rogers J., Michaux S., Bastin M., Bucheli P. (1999) Changes tothe content of sugars, sugar alcohols, myo-inositol, carboxylic acids and i-norganic anions in developing grains from different varieties of Robusta (Cof-fea canephora) and Arabica (C. arabica) coffees Plant Science. 149: 115-123.

Schoch G., Goepfert S., Morant M., Hehn A., Meyer D., UllmannP., Werek-Reichhart D. (2001) CYP98A3 from Arabidopsis thaliana Is a 3-Hydroxylase of Phenolic Esters, a Missing Link in the Phenylpropanoid Pa-thway . J. Bio. Chem. 266(39): 36566-36574.

Shadle G., Wesley V., Korth K., Chen F., Lamb C., Dixon R.(2003) Phenylpropanoid compounds and disease resistance in transgenictobacco with altered expression of l-phenylalanine ammonia-lyase Phyto-chemistry 64: 153-161.

Shibata H., Sakamoto Y., Oka M., Kono Υ. (1999) Natural antio-xidant, chlorogenic acid, protects against DNA breakage caused by monoc-hloramine. Biosci. Biotechnol. Biochem. 63:1295-1297.

Tamagnone T, Merida A., Stacey N., Plaskitt K., Parr A., ChangC.F., Lynn D., Dow M., Roberts K., Martin C. (1998) Inhibition of PhenolicAeid Metabolism Results in Preeoeious Cell Death and Altered Cell Morpho-Iogy in Leaves of Transgenie Tobacco Plants Plant Cell 10: 1801-1816.

Voilley, A., Sauvageot1 F., Durand, D. (1977). Influence sur l'a-mertume d'un café boisson de quelques paramètres d'extraction. Compte-Rendus du Huitième Colloque de 1'ASIC (Association Scientifique Internatio-nal sur Ie Café), ASIC páginas 192-198251-259.

Zhong R, Ill W1 Negrel J, Ye ZH (1998) Dual methylation path-ways in Iignin biosynthesis. PIantCeI11998 Dec;10(12):2033-46.LISTAGEM DE SEQÜÊNCIA

<110> Cornei! Research FoundationNestec s.a.LEPELLEY, MaudCHEMInade, GeraldmccartHY, James Gerardpetiard, vincentLlN1 ChenweiTanksley, Steven D.

<120> Polinucleotídeos que codificam enzimas da via de fenilpropanóide em café

<130> 48520-1004 WO (N07975/W0) (232313)

<140> PCT/US2006/039618

<141> 2006-10-10

<150> 60/724,673

<151> 2006-10-07

<160> 90

<170> Versão de Patente 3.3

<210> 1

<211> 1388

<212> DNA

<213> Coffea canephora

<400> 1

ccatgaaaat cgaggtgaag gaatcgacta tggtgagacc tgcccaagaa actcctggga 60ggaacttgtg gaactcgaac gtggacttgg tggtgccaaa tttccacacc cctagcgtct 120acttctatag gccgacggga tcatcgaatt tctttgatgc caaagtgcta aaggacgctt 180tgagccgagc ccttgtcccg ttctacccaa tggctggtag gttaaagaga gacgaagatg 240ggcggattga gattgagtgc aatggtgaag gcgtgctttt cgtggaggcc gagtctgatg 300gagtagttga tgatttcggt gactttgcac caactttaga gcttcgtaga ctcattcctg 360cagttgatta ttctcaagga atatcaagct acgctctcct agtgctgcag gtgacatatt 420tcaagtgtgg tggagtctct cttggtgttg gcatgcgaca tcatgcagct gatggatttt 480caggtcttca tttcatcaat tcatggtctg atatggcccg tggccttgat gtgaccctgc 540caccattcat agaccgcacc ctcctccgtg cccgcgatcc gccccagcct caattccagc 600acattgagta ccaacctcct ccagccttaa aagtttcccc gcaaactgca aaatctgact 660cagttcctga aactgcggtg tccatcttca agrtaaccag ggagcaaatc agtgccctga 720aagccaagtc caaggaagat ggaaacacca ttagctatag ctcctacgaa atgttggcag 780gccatgtatg gcgctgtgct tgcaaggcac gaggactcga agttgatcaa ggaacaaaat 840tgtacattgc tactgatgga cgggcaagac ttaggccttc gctcccacct ggctattttg 900gcaatgtcat cttcacggca accccgatag ctatagctgg tgaccttgaa ttcaagccag 960tctggtatgc tgccagtaaa atccacgatg cattggcgag gatggacaac gactacttaa 1020ggtcagctct tgattacttg gaattacagc ctgatttgaa ggccctggtt cgtggtgccc 1080atactttcaa gtgtccaaat ctggggatca caagctgggt aaggttaccc atccatgatg 1140ctgattttgg ctggggtcgg cccatattta tgggtcctgg tggcatcgct tatgaaggtt 1200taagctttat attgcctagt ccaaccaatg atggaagcat gtcagtagct atttcattgc 1260agggcgagca catgaaactc ttccagagtt tcttgtatga catttgaacg ggagcacatc 1320acatgaattt tcacgcttgt attaatagct ttcggttccg ggccagctat tcatgcggtg 1380gtggtttc 1388<210> 2 <211> 1388 <212> DNA <213> Coffea arabica <400> 2 ccatgaaaat cgaggtgaag gaatcgacta tggtgagacc tgcccacgaa actcctagga 60ggaacttgtg gaactcgaac gtggacttgg tggtgccaaa tttccacacc cctagcgtct 120acttctatag gccgacggga tcatcgaatt tctttgatgc caaagtgctg aaggacgctt 180tgagccgagc ccttgtcccg ttctacccaa tggctggtag gttaaagaga gacgaagatg 240ggcggattga gattgagtgc aatggtgaag gcgtgctttt cgtggaggcc gagtctgatg 300gagtagttga tgatttcggt gactttgcac caactttaga gcttcgtaga ctcattcctg 360cagttgatta ttctcaagga atatcaagct acgctctcct agtgctgcag gtgacatatt 420tcaagtgtgg tggagtctct cttggtgttg gcatgcaaca tcatgcagct gatggatttt 480caggtcttca tttcatcaat tcatggtctg atatggcccg tggccttgat gtgaccctgc 540caccattcat agaccgcacc ctcctccgtg cccgcgatcc gccccagccc caattccagc 600acattgagta ccaaccccct ccaaccttaa aagtttcccc gcaaactgca aaatctgact 660cagttcctga aactgcagtg tccatcttca agttaaccag ggagcaaatc agtgccctga 720aagccaagtc caaggaagat ggaaacacca ttagctatag ctcctacgaa atgttggcag 780gccatgtatg gcgctgtgct tgcaaggcac gaggactcga agttgatcaa ggaacaaaat 840tgtacattgc tactgatgga cgagcaagac ttaggccttc gctcccgcct ggctattttg 900gcaatgtcat cttcacggca accctgatag ctatagctgg tgaccttgaa ttcaagccag 960tctggtatgc tgcaagtaaa atccacgatg cattggcgag gatggacaac gactacttaa 1020ggtcagctct tgattacttg gaattacagc ctgatttgaa ggccctggtt cgtggtgccc 1080atactttcaa gtgtccaaat ctggggatca caagctgggt aaggttaccc atccatgatg 1140ctgattttgg ctggggtcgg cccatattta tgggtcctgg tggtatcgct tatgaaggtt 1200taagctttat attgcctagt ccaaccaatg atggaagcat gtcagtagct atttcattgc 1260agggcgagca catgaaactc ttccagagtt tcctgtatga catttgaatg ggagcacatc 1320acatgaattt tcacgcttgt attaatagct ttcggttccg ggccagctat tcatgcggtg 1380gtggtttc 1388<210> 3 <211> 1534 <212> DNA <213> Coffea canephora <400> 3 cttctccatc ccagctcgtt tctgacaaat ccctttcgtc aatcaacaaa actctttaca 60tattttctgc taaatctcag cttatttcat cttgtttgat cagcgtggga agcgagaaaa 120tgaagataac cgtgaaggaa acagcaatgg ttcgtccagc ccaaccaaca cccacaaaga 180ggctatggaa ctcgaatttg gatcttctgg tagcaagaat tcatatcttg accgtctact 240tctacaagcc taatggttct gctaatttct ttgatacccg tgtgctcaaa gaagcattga 300gcaatgttct tgtctctttc taccccatgg ctgggagatt agcaagagat gaagaaggaa 360ggattgagat cgactgtaac ggtgaaggtg tactctttgt tgaggctgaa tcagactcga 420gtgtcgatga ttttggtgat tttgcaccaa gtttggagct caggaggctc atcccgaccg 480tcgattgttc tggtgacatt tcttcttacc ccctcgttat tttccaggta actcgtttca 540agtgtggagc agcagctctt ggagctgggg tgcagcacaa tttatcagat ggcgtttcat 600ctctgcactt catcaataca tggtcagaca tagctcgtgg cctcaccatt gctgtccctc 660cgttcattga ccggacactt atccgtgcta gggaccctcc cgtgcctgta ttcgaacatg 720tcgaatatta tccgccccct caactaaaat cagattcaag aattcaagaa ctcaaaacag 780gccctagggc aagtaccaca gctgtactaa aaatcacacc tgaacaactt agccagctta 840aagctaaggc caacaatgag ggcagcactt atgagatctt agcagcacat atatggcgta 900ctgcatgcaa agcacgtggc ctcaccaatg atcaatccac caagctgtac gttgccactg 960atggccggtc taggctgatt cctcccctgc ctcctggcta tctaggtaat gtggtcttca 1020ctgcaactcc áattgctgaa tccagtaatc ttcaatcaga gcccttgacc aattctgcaa 1080aaagaatcca caacgccttg gcaagaatgg ataatgatta cttaagatca gccctggatt 1140atcttgaaat tcaacctgat ttgtctgctt tggttagagg gcctcggcat tttgctagtc 1200ctaatttgaa tatcaatagt tggacaaggc ttccgtttca tgatgcagac tttggctggg 1260gcagacctat tcatataggg ccggcaatca ttctttatga gggtacggta tatgtattgc 1320caagtccagg caaagacagg actttatcgt tagctgtgtg cttagatgcc gatcacatgc 1380cactcttcca aaggttcctg tacgatttct gagaaatttt gaaatatcaa caacaatcaa 1440taatcaagct tctggaagag aatggatgga attaccattt ttagatggta caaatcaagg 1500

cagcctcgtg acacttgtga ttggattggg actc 1534

<210> 4<211> 1533<212> DNA

<213> Coffea arabi ca<220>

<221> característica mista<222> (932)..(932)<223> η é a, c, g ou t

<400> 4

cttctccatc ccagccgttt ctgacaaatc cctttcgtca atcaacaaaa ctctttacat 60

attttctgct aaatctcagc ttatttcatc ttgtttgatc agcgtgggaa gcgagaaaat 120

gaagataacc gtgaaggaaa cagcaatggt tcgtccagcc caaccaacac ccacaaagag 180

gctatggaac tcgaatttgg atcttctggt agcasgaatt catatcttga ccatctactt 240

ttacaagcct aatggttctg ctaatttctt tgatacccgt gtgctcaaag aagcattgag 300

caatgttctt gtctctttct accccatggc tgggagatta gcaagagatg aagaaggaag 360

gattgagatc gactgtaacg gtgaaggtgt actctttgtt gaggctgaat cagactcgag 420

tgtcgatgat tttggtgatt ttgcaccaag tttggagctc aggaggctca tcccgaccgt 480

cgattgttct ggtgacattt cttcttaccc cctcgttatt ttccaggtaa ctcgtttcaa 540

gtgtggagca gcagctcttg gagctggggt gcagcacaat ttatcagatg gcgtttcatc 600

tctgcacttc atcaatacat ggtcagacat agctcgtggc ctcaccattg ctgtccctcc 660

gttcattgac cggacactta tccatgctag ggaccctccc gtgcctgtat tcgaacatgt 720

cgaatattat ccgccccctc aactaaaatc agattcaaga attcaagaac tcaaaacagg 780

ccccagggca agtaccacag ctgtactaaa aatcactcct gaacaactta gccagcttaa 840

agctaaggcc aacaatgagg gcagcactta tgagatctta gcagcacata tatggcgtac 900

cgcatgcaaa gcacgtggcc ccaccaatga tnaatccacc aagctgtacg ttgccaccga 960

tggccggtct aggctgattc ctcccctgcc tcctggctat ctaggtaatg tggtcttcac 1020

tgcaactcca attgctgaat ccagtgatct tcaatcagag cccttgacca attctgcaaa 1080

aagaatccac aatgccttgg caagaatgga taatgattac ttaagatcag ccctggatta 1140

tcttgaaatt caacctgatt tgtctgcttt ggttagaggg cctcggcatt ttgctagtcc 1200

taacttgaat atcaatagtt ggacagggct tccgtttcat gatgcagact ttggctgggg 1260

cagacctatt catatagggc cggcaatcat tctttatgag ggtacggtat atgtattgcc 1320

aggtccaggc aaagacagga ctttatcgtt agctgtgtgc ttagatgccg atcacatgcc 1380actcttccaa aagttcctgt acgatttctg agaaattttg aaatatcaac aacaatcaat 1440aatcaagctt ctggaagaga atggatagaa ttaccatttt tagacggtac aaatcaaggc 1500agcctcgtga cacttgtgat tggattggga CtC 1533<210> 5 <211> 1728 <212> DNA <213> Coffea canephora <400> 5 caaatctcaa accttcgtat taaccaatgg ctctgcttct gatcctcctc ccagttgcct 60tcatcttcct agcctacagc ctctatgaac gccttagatt caaactgcca cccgggccac 120ggccaaaacc ggtggtcgga aacatttacg acataaaacc ggtgaggttc aagtgctatg 180cggagtggtc aaaactctat ggtccaatat tttctgtcta cttcggttcc cagctgaata 240ctgttgtgaa cactgcagaa ctggccaaag aagttcttaa agacaatgat cagcaattgg 300cagataggta caggagtaga ccctctgcca gaatgagcag aaatggccaa gatttgatat 360gggctgatta tggtcctcat tatgtgaagg tcagaaaact gtgcaatctt gaactcttca 420ctccaaaaag actggaaggc cttagacctt taagagagga tgaagttaca gccatggttg 480attccatctt caaggactgc accaaacctg aaaacaaagg caagagtctg ttgatgcgca 540actacttggg atcagtagca ttcaacaaca ttacaaggct aacatttggg aagaggttca 600tgaattcaga gggtgtggtt gatgaacaag gccaagagtt taagggcatt gtatcaaatg 660ggataaggat tggtgcaaaa ctctccgtgg cagatcacat tccttggctt cgttggatgt 720ttgtaggcga aaatgaggac ctggataagc acaatgcgcg gagagacaaa ctgaccagaa 780tgatcatgga agagcacact cttgcaaggc aaaagagtgg caatactaag cagcattttg 840ttgatgcatt gctcactctt caaaagcaat atgaattgag cgatgacact gtcattggac 900tcctttggga catgattact gctggcatgg atacaaccac aatctcagta gaatgggcaa 960tggcagagct ggtgaagaat ccaagggtgc agcaaaaggc gcaagaggaa cttgaccgag 1020tcattggctc cgatagaatc atgactgaag ctgattttgc aaagctccca tacttacagt 1080gtgtagctaa ggaagctcta aggctgcacc ctccaactcc actaatgctt cctcatagag 1140ccaatgccaa tgtgaagatc ggtggttatg acatccctaa agggtctatc gtgcacgtta 1200acgtctgggc gattgctcgt gatcctgcag cctggaaaaa tccactggaa ttccgacctg 1260agagattcct ggaggaagat gttgacatca agggccacga ttatcggctc ctgccttttg 1320gtgctggaag gaggatctgc cctggtgcac aacttgcact caãtctggtc acttctatgc 1380tggggcattt gttgcaccac tttacttggt ctccaccacc tggggtcagg cctgaagaga 1440ttgacctgga agagagccct ggaacagtta cttatatgag aacccctttg caagctgttg 1500caacaccaag attgcctgca catttgtaca atcgtgtgcc agtagagctg taatgcttcc 1560

tttctcttgt tactaaattt tcagcttgca agagttgctt cacttccaac tctccatttg 1620

attgtgaaga acttgttgga ttctccgagg tatttgagaa aagctactat ttttctagga 1680

aaaataaaat aagggttttc taaaaaaaaa aaaaaaaaaa aaaaaaaa 1728

<210> 6

<211> 1144

<212> DNA

<213> Coffea canephora

<400> 6

gtctgtccaa agctccctca aactaaaaga gaaagaaaga aaaaaaaagc cccagaaatc 60taatctccaa acaacaatta tggcccagaa tggagaagga aaggatagcc aaaatctcag 120gcatcaagaa gtaggccaca aaagccttct gcaaagtgat gcactctacc agtacatcct 180ggaaaccagc gtgtatccaa gagagccaga gcccatgaaa gagctgagag aactgacagc 240aaagcatcca tggaatatta tgactacatc tgctgatgaa gggcagttct tgaacatgat 300tatcaagttg atcaatgcca agaaaaccat ggagattgga gtttacactg gttactcgct 360tctggctaca gctctcgctc ttccagaaga tgggaagata ttggccatgg atattaacag 420agaaaactac gaattgggtc tgcccgtgat cgaaagggct ggtgtgtccc ataaaattga 480cttcagagaa ggccctgctt tgccagtgct tgatgagttg attgaagatg acaagaacca 540tggaagtttt gatttcatct tcgtggatgc tgacaaggac aactatctca actaccacaa 600gaggataatc gagttggtca aggttggggg aatgattggg tacgacaaca ccctatggaa 660cggctccgtg gtggccccac cagatgctcc aatgaggaag tacgtgaggt actacaggga 720cttcgtcttg gagctcaaca aagccctggc cgctgatccc aggatcgaga tctgcatgct 780ccccgttggc gacggtatca ccctgtgccg ccgcgtcagc taattaattt ccctactaaa 840cccctgcgga aagttgggaa tcaaatgcaa atgaaaaata gcccaacacc tacttctttt 900gcttcctcct cttttttgtt tttgggaccc tttgtatttt actactgcta tttgtttatt 960ctgtgggaca cgctgttata tttgtaattt tctttgtact gagaataatt attactatat 1020gaatctccct gtttacggca actagcaagg actagttgct tttaaaaaaa aaaaaaaaaa 1080aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1140

aaaa 1144

<210> 7

<211> 713

<212> DNA

<213> Coffea arabica

<400> 7atggaaaaca agggattgtt gcagagtagg gaactctatc agtacctcct ggagactagt 60gtctatccac atgaactgca gcctctcaag gagctaaggg atgttactgc aagtcatccg 120tgggccacta tggcaactgc cccagatgct ggtcagttga ttgccatgct cttgaaacta 180ataagtgcca aaaagacaat agagattggt gtctttactg gatactccct actgcttact 240gcccttacaa taccagatga tggcaggatt gtagcaattg accagaacag agatacatat 300gagatagggc tgccaattat aagaaaagct gcagttgagc ataagatcga cttcattgag 360tccgaggctc ttccagttct tgataaactc cttgaagaaa atcttaacca tgaagccttt 420gactttgctt tcgttgatgc ggacaaatta aattatctga agtaccatga gaaactgttg 480aaattgttaa agcttggtgg aatagttgta tacgacaaca cactttgggg aggattggtg 540gccttgccgg aagaatctgt ggctgaggaa atgaaagcag gcaggcattt cacaattgag 600ttcaacaaat tgctagctgc tgatacccga gttcaaatat cccaggttcc tctgggtgat 660gggattacta tttgtaagcg tctccactaa atcttatgct ggagtactta Ctt 713

<210> 8

<211> 727

<212> DNA

<213> coffea canephora

<400> 8

atggccaagg aaggaggttc taaaatgaag acaattctcc agagtgaggc cctccagaag 60tacatcttga atactagcac atacccaaaa gagcatgaac aactgaagga gctaagagaa 120gagactgcca ggaaatatgg tgccagggct attataggtg tgccacctga tgaggggctc 180ttcctgtcta tgtttttgaa agtaatgaat gccaagaaga cactggagat tggtgttttt 240actggctatt ctcttcttac tactgctctt gcacttcctg atgatggcca gatagttgca 300atagaccctg atcaaggagc atttgaagtt ggtctgaaat tcatcaagaa agctggtgtg 360gagaacaaaa tcaaattcat caaatcagat ggcatttctg ctctaaatga tttgttgaac 420aatgaagcta gtgaagcaac attcgacttt gcatttgtgg atgcagacaa gccaagctac 480atccagtacc atgaacaact aataaagctg gtgaagattg gaggaattat cgcttacgat S40aatactctat acggtggata tgttgtcagt gaagaaattg aaatgcacga aggatccact 600gtcaacagaa aagccatcat acaattcaac aactatatag cctcggatcc gcgagttgag 660atctctcagg ttcctatagg agatggtgtt acattgtgta ggcgcatcat cgcttagctg 720acatgat 727

<210> 9

<211> 434

<212> PRT

<213> Coffea canephora<400> 9

Met Lys He Glu Val Lys Glu Ser Thr Met vai Arg Pro Ala Gln Glu1 5 10 15

Thr Pro Gly Arg Asn Leu Trp Asn Ser Asn vai Asp Leu vai vai Pro20 25 30

Asn Phe His Thr Pro ser Val Tyr Phe Tyr Arg Pro Thr Gly ser Ser35 40 45

Asn Phe Phe Asp Ala Lys vai Leu Lys Asp Ala Leu Ser Arg Ala Leu50 55 60

vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Lys Arg Asp Glu Asp Gly65 70 75 80

Arg Ile Glu lie Glu Cys Asn Gly Glu Gly vai Leu Phe Val Glu Ala85 90 95

Glu Ser Asp Gly vai Val Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110

Glu Leu Arg Arg Leu Ile Pro Ala Val Asp Tyr Ser Gln Gly lie Ser115 120 125

ser Tyr Ala Leu Leu Val Leu Gln vai Thr Tyr Phe Lys Cys Gly Gly130 135 140

vai Ser Leu Gly Val Gly Met Arg His His Ala Ala Asp Gly Phe Ser145 150 155 160

Gly Leu His Phe Ile Asn Ser Trp ser Asp Met Ala Arg Gly Leu Asp165 170 175

vai Thr Leu Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190

Pro Pro Gln Pro Gln Phe Gln His Ile Glu Tyr Gln Pro Pro Pro Ala195 200 205

Leu Lys Val Ser Pro Gln Thr Ala Lys Ser Asp ser vai Pro Glu Thr210 215 220

Ala Val ser Ile Phe Lys Leu Thr Arg Glu Gln Ile Ser Ala Leu Lys225 230 235 240

Ala Lys Ser Lys Glu Asp Gly Asn Thr Ile ser Tyr Ser Ser Tyr Glu245 250 255

Met Leu Ala Gly His Val Trp Arg Cys Ala Cys Lys Ala Arg Gly Leu260 265 270

Glu Val Asp Gln Gly Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg Ala275 280 285

Arg Leu Arg Pro ser Leu Pro Pro Gly Tyr Phe Gly Asn Val Ile Phe290 295 300

Thr Ala Thr Pro Ile Ala Ile Ala Gly Asp Leu Glu Phe Lys Pro Val305 310 315 320

Trp Tyr Ala Ala ser Lys Ile His Asp Ala Leu Ala Arg Met Asp Asn325 330 335

Asp Tyr Leu Arg Ser Ala Leu Asp Tyr Leu Glu Leu Gln Pro Asp Leu340 345 350

Lys Ala Leu Val Arg Gly Ala His Thr Phe Lys Cys Pro Asn Leu Gly355 360 365

Ile Thr Ser Trp Val Arg Leu Pro Ile His Asp Ala Asp Phe Gly Trp370 375 380

Gly Arg Pro Ile Phe Met Gly Pro Gly Gly Ile Ala Tyr Glu Gly Leu385 390 395 400

Ser Phe Ile Leu Pro Ser Pro Thr Asn Asp Gly Ser Met ser Val Ala405 410 415

Ile ser Leu Gln Gly Glu His Met Lys Leu Phe Gln ser Phe Leu Tyr420 425 430

Asp Ile

<210> 10<211> 434<212> PRT

<213> Coffea arabica<400> 10

Met Lys Ile Glu Val Lys Glu Ser Thr Met vai Arg Pro Ala His Glu1 5 10 15

Thr Pro Arg Arg Asn Leu Trp Asn Ser Asn Val Asp Leu vai vai ProAsn Phe His Thr Pro Ser Val Tyr Phe Tyr Arg Pro Thr Gly Ser Ser35 40 45

Asn Phe Phe Asp Ala Lys Val Leu Lys Asp Ala Leu Ser Arg Ala Leu50 55 60

vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Lys Arg Asp Glu Asp Gly65 70 75 80

Arg Ile Glu Ile Glu Cys Asn Gly Glu Gly Val Leu Phe Val Glu Ala85 90 95

Glu Ser Asp Gly vai vai Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110

Glu Leu Arg Arg Leu lie Pro Ala vai Asp Tyr ser Gln Gly Ile Ser115 120 125

Ser Tyr Ala Leu Leu vai Leu Gln vai Thr Tyr Phe Lys Cys Gly Gly130 135 140

vai Ser Leu Gly vai Gly Met Gln His His Ala Ala Asp Gly Phe ser145 150 155 160

Gly Leu His Phe Ile Asn Ser Trp ser Asp Met Ala Arg Gly Leu Asp165 170 175

vai Thr Leu Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190

Pro Pro Gln Pro Gln Phe Gln His Ile Glu Tyr Gln Pro Pro Pro Thr195 200 205

Leu Lys Val ser Pro Gln Thr Ala Lys Ser Asp Ser vai Pro Glu Thr210 215 220

Ala Val ser Ile Phe Lys Leu Thr Arg Glu Gln Ile ser Ala Leu Lys225 230 235 240

Ala Lys Ser Lys Glu Asp Gly Asn Thr Ile Ser Tyr Ser Ser Tyr Glu245 250 255

Met Leu Ala Gly His vai Trp Arg Cys Ala Cys Lys Ala Arg Gly Leu260 265 270Glu vai Asp Gln Gly Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg Ala275 280 285

Arg Leu Arg Pro Ser Leu Pro Pro Gly Tyr Phe Gly Asn Val Ile Phe290 295 300

Thr Ala Thr Leu Ile Ala Ile Ala Gly Asp Leu Glu Phe Lys Pro Val305 310 315 320

Trp Tyr Ala Ala Ser Lys Ile His Asp Ala Leu Ala Arg Met Asp Asn325 330 335

Asp Tyr Leu Arg ser Ala Leu Asp Tyr Leu Glu Leu Gln Pro Asp Leu340 345 350

Lys Ala Leu Val Arg Gly Ala His Thr Phe Lys Cys Pro Asn Leu Gly355 360 365

Ile Thr ser Trp Val Arg Leu Pro lie His Asp Ala Asp Phe Gly Trp370 375 380

Gly Arg Pro lie Phe Met Gly Pro Gly Gly Ile Ala Tyr Glu Gly Leu385 390 395 400

Ser Phe lie Leu Pro ser Pro Thr Asn Asp Gly Ser Met ser vai Ala405 410 415

Ile Ser Leu Gln Gly Glu His Met Lys Leu Phe Gln ser Phe Leu Tyr420 425 430

Asp Ile

<210> 11

<211> 430

<212> PRT

<213> coffea canephora

<400> 11

Met Lys Ile Thr vai Lys Glu Thr Ala Met vai Arg Pro Ala Gln Pro1 5 10 15

Thr Pro Thr Lys Arg Leu Trp Asn Ser Asn Leu Asp Leu Leu Val Ala20 25 30

Arg Ile His Ile Leu Thr Val Tyr Phe Tyr Lys Pro Asn Gly Ser Ala35 40 45

<210> 12

<211> 430

<212> PRT

<213> Coffea arabicalie Ala Glu Ser Ser Asn Leu Gln Ser Glu Pro Leu Thr Asn Ser Ala305 310 315 320

Lys Arg Ile His Asn Ala Leu Ala Arg Met Asp Asn Asp Tyr Leu Arg325 330 335

ser Ala Leu Asp Tyr Leu Glu Ile Gln pro Asp Leu Ser Ala Leu vai340 345 350

Arg Gly Pro Arg His Phe Ala Ser Pro Asn Leu Asn Ile Asn Ser Trp355 360 365

Thr Arg Leu Pro Phe His Asp Ala Asp Phe Gly Trp Gly Arg Pro Ile370 375 380

His Ile Gly Pro Ala Ile Ile Leu Tyr Glu Gly Thr vai Tyr Val Leu385 390 395 400

pro ser Pro Gly Lys Asp Arg Ttir Leu Ser Leu Ala vai cys Leu Asp405 410 415

Ala Asp His Met Pro Leu Phe Gln Arg Phe Leu Tyr Asp Phe420 425 430

<210> 12<211> 430<212> PRT<213> Coffea arabica<220><221> característica mista<222> (272)..(272)<223> Xaa é qualquer aminoácido que ocorre natural e preferivelmente, um Gln ou similar.

Um códon de parada correspondendo a esta locação foi encontrado na seqüência deácido nucléico, mas mostrado para ser um artefato de clonagem.

<400> 12

Met Lys Ile Thr vai Lys Glu Thr Ala Met Val Arg Pro Ala Gln Pro1 5 10 15

Thr pro Thr Lys Arg Leu Trp Asn ser Asn Leu Asp Leu Leu Val Ala20 25 30

Arg Ile His Ile Leu Thr Ile Tyr Phe Tyr Lys Pro Asn Gly ser Ala35 40 45

Asn Phe Phe Asp Thr Arg Val Leu Lys Glu Ala Leu Ser Asn vai Leu50 55 60vai Ser Phe Tyr Pro Met Ala Gly Arg.Leu Ala Arg Asp Glu Glu Gly65 70 75 80

Arg Xle Glu Ile Asp Cys Asn Gly Glu Gly Val Leu Phe vai Glu Ala85 90 95

Glu Ser Asp Ser Ser Val Asp Asp Phe Gly Asp Phe Ala Pro Ser Leu100 105 110

Glu Leu Arg Arg Leu lie Pro Thr vai Asp Cys Ser Gly Asp Ile ser115 120 125

ser Tyr Pro Leu vai Ile Phe Gln vai Thr Arg Phe Lys Cys Gly Ala130 135 140

Ala Ala Leu Gly Ala Gly vai Gln His Asn Leu Ser Asp Gly Val Ser145 150 155 160

Ser Leu His Phe Ile Asn Thr Trp Ser Asp Ile Ala Arg Gly Leu Thr165 170 175

Ile Ala vai Pro Pro Phe Ile Asp Arg Thr Leu Ile His Ala Arg Asp180 185 190

Pro Pro Val Pro Val Phe Glu His Val Glu Tyr Tyr Pro Pro Pro Gln195 200 205

Leu Lys ser Asp Ser Arg Ile Gln Glu Leu Lys Thr Gly Pro Arg Ala210 215 220

Ser Thr Thr Ala Val Leu Lys Ile Thr Pro Glu Gln Leu ser Gln Leu225 230 235 240

Lys Ala Lys Ala Asn Asn Glu Gly Ser Thr Tyr Glu Ile Leu Ala Ala245 250 255

His Ile Trp Arg Thr Ala Cys Lys Ala Arg Gly Pro Thr Asn Asp Xaa260 265 270

Ser Thr Lys Leu Tyr Val Ala Thr Asp Gly Arg Ser Arg Leu lie Pro275 280 285

Pro Leu Pro Pro Gly Tyr Leu Gly Asn Val Val Phe Thr Ala Thr Pro290 295 300

Ile Ala Glu Ser Ser Asp Leu Gln ser Glu Pro Leu Thr Asn ser Ala305 310 315 320

Lys Arg Ile His Asn Ala Leu Ala Arg Met Asp Asn Asp Tyr Leu Arg

ser Ala Leu Asp Tyr Leu Glu Ile Gln Pro Asp Leu ser Ala Leu vai340 345 350

Arg Gly Pro Arg His Phe Ala ser Pro Asn Leu Asn Ile Asn ser Trp355 360 365

Thr Gly Leu Pro Phe His Asp Ala Asp Phe Gly Trp Gly Arg Pro Ile370 375 380

His lie Gly Pro Ala lie Ile Leu Tyr Glu Gly Thr vai Tyr vai Leu385 390 395 400

Pro Gly Pro Gly Lys Asp Arg Thr Leu ser Leu Ala Val Cys Leu Asp405 410 415

Ala Asp His Met Pro Leu Phe Gln Lys Phe Leu Tyr Asp Phe420 425 430

<210> 13<211> 508<212> PRT

<213> Coffea canephora<400> 13

Met Ala Leu Leu Leu Ile Leu Leu Pro vai Ala Phe Ile Phe Leu Ala1 5 10 15

Tyr ser Leu Tyr Glu Arg Leu Arg Phe Lys Leu Pro Pro Gly Pro Arg20 25 30

Pro Lys Pro Val Val Gly Asn Ile Tyr Asp Ile Lys Pro Val Arg Phe35 40 45

Lys cys Tyr Ala Glu Trp Ser Lys Leu Tyr Gly Pro Ile Phe Ser Val50 55 60

Tvr Phe Gly Ser Gln Leu Asn Thr Val vai Asn Thr Ala Glu Leu Ala65 70 75 80

Lys Glu vai Leu Lys Asp Asn Asp Gln Gln Leu Ala Asp Arg Tyr Arg85 90 95

ser Arg Pro Ser Ala Arg Met ser Arg Asn Gly Gln Asp Leu Ile TrpAla Asp Tyr Gly Pro His Tyr vai Lys vai Arg Lys Leu Cys Asn Leu

115

120

125

Glu Leu Phe Thr Pro Lys Arg Leu Glu Gly Leu Arg Pro Leu Arg Glu

130

135

140

Asp Glu vai Thr Ala Met vai Asp ser Ile Phe Lys Asp Cys Thr Lys145 150 155 160

Pro Glu Asn Lys Gly Lys Ser Leu Leu Met Arg Asn Tyr Leu Gly Ser165 170 175

vai Ala Phe Asn Asn Ile Thr Arg Leu Thr Phe Gly Lys Arg Phe Met

180

185

190

Asn Ser Glu Gly Val vai Asp Glu Gln Gly Gln Glu Phe Lys Gly Ile

195

200

205

Val Ser Asn Gly Ile Arg Ile Gly Ala Lys Leu Ser Val Ala Asp His210 215 220

Ile Pro Trp Leu Arg Trp Met Phe vai Gly Glu Asn Glu Asp Leu Asp

225

230

235

240

Lys His Asn Ala Arg Arg Asp Lys Leu Thr Arg Met Ile Met Glu Glu

245

250

255

His Thr Leu Ala Arg Gln Lys Ser Gly Asn Thr Lys Gln His Phe vai260 265 270

Asp Ala Leu Leu Thr Leu Gln Lys GTn Tyr Glu Leu Ser Asp Asp Thr275 280 285

Val lie Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr Thr290 295 300

Thr Ile Ser vai Glu Trp Ala Met Ala Glu Leu vai Lys Asn Pro Arg

305

310

315

320

vai Gln Gln Lys Ala Gln Glu Glu Leu Asp Arg vai Ile Gly Ser Asp

325

330

335

Arg Ile Met Thr Glu Ala Asp Phe Ala Lys Leu Pro Tyr Leu Gln Cys340 345 350Val Ala Lys Glu Ala Leu Arg Leu His Pro Pro Thr Pro Leu Met Leu355 360 365

Pro His Arg Ala Asn Ala Asn vai Lys Ile Gly Gly Tyr Asp Ile Pro370 375 380

Lys Gly Ser Ile Val His Val Asn vai Trp Ala Ile Ala Arg Asp Pro385 390 395 400

Ala Ala Trp Lys Asn Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Glu405 410 415

Glu Asp vai Asp Ile Lys Gly His Asp Tyr Arg Leu Leu Pro Phe Gly420 425 430

Ala Gly Arg Arg Ile Cys Pro Gly Ala Gln Leu Ala Leu Asn Leu Val435 440 445

Thr ser Met Leu Gly His Leu Leu His His Phe Thr Trp ser Pro Pro450 455 460

Pro Gly vai Arg Pro Glu Glu Ile Asp Leu Glu Glu Ser Pro Gly Thr465 470 475 480

vai Thr Tyr Met Arg Thr Pro Leu Gln Ala Val Ala Thr Pro Arg Leu485 490 495

Pro Ala His Leu Tyr Asn Arg vai Pro Val Glu Leu500 505

<210> 14<211> 247<212> PRT

<213> coffea canephora<400> 14

Met Ala Gln Asn Gly Glu Gly Lys Asp Ser Gln Asn Leu Arg His Gln1 5 10 15

Glu Val Gly His Lys Ser Leu Leu Gln ser Asp Ala Leu Tyr Gln Tyr20 25 30

Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Glu Pro Met Lys Glu35 40 45

Leu Arg Glu Leu Thr Ala Lys His Pro Trp Asn Ile Met Thr Thr Ser50 55 60Ala Asp Glu Gly Gln Phe Leu Asn Met Ile Ile Lys Leu Ile Asn Ala65 70 75 80

Lys Lys Thr Met Glu Ile Gly vai Tyr Thr Gly Tyr Ser Leu Leu Ala85 90 95

Thr Ala Leu Ala Leu Pro Glu Asp Gly Lys Ile Leu Ala Met Asp Ile100 105 110

Asn Arg Glu Asn Tyr Glu Leu Gly Leu Pro Val Ile Glu Arg Ala Gly115 120 125

vai Ser His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu Pro vai Leu130 135 140

Asp Glu Leu Ile Glu Asp Asp Lys Asn His Gly ser Phe Asp Phe Ile145 150 155 160

Phe Val Asp Ala Asp Lys Asp Asn Tyr Leu Asn Tyr His Lys Arg Ile165 170 175

Ile Glu Leu vai Lys vai Gly Gly Met Ile Gly Tyr Asp Asn Thr Leu180 185 190

Trp Asn Gly ser vai vai Ala Pro Pro Asp Ala Pro Met Arg Lys Tyr195 200 205

Val Arg Tyr Tyr Arg Asp Phe vai Leu Glu Leu Asn Lys Ala Leu Ala210 215 220

Ala Asp Pro Arg Ile Glu Ile Cys Met Leu Pro vai Gly Asp Gly Ile225 230 235 240

Thr Leu Cys Arg Arg vai Ser245

<210> 15<211> 229<212> PRT

<213> Coffea arabica<400> 15

Met Glu Asn Lys Gly Leu Leu Gln Ser Arg Glu Leu Tyr Gln Tyr Leu1 5 10 15

Leu Glu Thr Ser vai Tyr Pro His Glu Leu Gln Pro Leu Lys Glu Leu20 25 30Ala Leu Gln Lys Tyr lie Leu Asn Thr ser Thr Tyr Pro Lys Glu His20 25 30

Glu Gln Leu Lys Glu Leu Arg Glu Glu Thr Ala Arg Lys Tyr Gly Ala35 40 45

Arg Ala Ile Ile Gly Val Pro Pro Asp Glu Gly Leu Phe Leu Ser Met50 55 60

Phe Leu Lys vai Met Asn Ala Lys Lys Thr Leu Glu Ile Gly Val Phe65 70 75 80

Thr Gly Tyr Ser Leu Leu Thr Thr Ala Leu Ala Leu Pro Asp Asp Gly85 90 95

Gln Ile Val Ala Ile Asp Pro Asp Gln Gly Ala Phe Glu Val Gly Leu100 105 110

Lys Phe Ile Lys Lys Ala Gly vai Glu Asn Lys Ile Lys Phe Ile Lys115 120 125

Ser Asp Gly Ile Ser Ala Leu Asn Asp Leu Leu Asn Asn Glu Ala Ser130 135 140

Glu Ala Thr Phe Asp Phe Ala Phe Val Asp Ala Asp Lys Pro Ser Tyr145 150 155 160

Ile Gln Tyr His Glu Gln Leu lie Lys Leu Val Lys lie Gly Gly Ile165 170 175

Ile Ala Tyr Asp Asn Thr Leu Tyr Gly Gly Tyr vai vai Ser Glu Glu180 185 190

Ile Glu Met His Glu Gly Ser Thr vai Asn Arg Lys Ala Ile Ile Gln195 200 205

Phe Asn Asn Tyr Ile Ala Ser Asp Pro Arg Val Glu Ile Ser Gln Val210 215 220

Pro Ile Gly Asp Gly vai Thr Leu Cys Arg Arg Ile Ile Ala225 230 235

<210> 17

<211> 209

<212> DNA

<213> Coffea canephora<220>

<221> característica mista

<222> (184).. (184)

<223> η é a , c, g ou t<220><221 > característica mista<222> (196)..(197)<223> η é a , c, g ou t

<400> 17

tacaactttc aaccatgaaa atcgaggtga aggaatcgac tatggtgaga cctgcccaag 60

aaactcctgg gaggaacttg tggaactcga acgtggactt ggtagtgcca aatttccaca 120

cccctagcgt ctacttctat aggccgacgg gatcatcgaa tttctttgat gccaaagtgc 180

taanggacgc tttganncga gcccttgtc 209

<210> 18<211> 1465<212> DNA

<213> Coffea canephora<400> 18

ggatcatcga atttctttga tgccaaagtg ctaaaggacg ctttgagccg agcccttgtc 60

ccgttctacc caatggctgg taggttaaag agagacgaag atgggcggat tgagattgag 120

tgcaatggtg aaggcgtgct tttcgtggag gccgagtctg atggagtagt tgatgatttc 180

ggtgactttg caccaacttt agagcttcgt agactcattc ctgcagttga ttattctcaa 240

ggaatatcaa gctacgctct cctagtgctg caggtgacat atttcaagtg tggtggagtc 300

tctcttggtg ttggcatgca acatcatgca gctgatggat tttcaggtct tcatttcatc 360

aattcatggt ctgatatggc ccgtggcctt gatgtgaccc tgccaccatt catagaccgc 420

accctcctcc gtgcccgcga tccgccccag cctcaattcc agcacattga gtaccaacct 480

cctccagcct taaaagtttc cccgcaaact gcaaaatctg actcagttcc tgaaactgcg 540

gtgtccatct tcaagttaac cagggagcaa atcagtgccc tgaaagccaa gtccaaggaa 600

gatggaaaca ccattagcta tagctcctac gaaatgttgg caggccatgt atggcgctgt 660

gcttgcaagg cacgaggact cgaagttgat caaggaacaa aattgtacat tgctactgat 720

ggacgggcaa gacttaggcc ttcgctccca cctggctatt ttggcaatgt catcttcacg 780

gcaaccccga tagctatagc tggtgacctt gaattcaagc cagtctggta tgctgcaagt 840

aaaatccacg atgcattggc gaggatggac aacgactact taaggtcagc tcttgattac 900

ttggaattac agcctgattt gaaggccctg gttcgtggtg cccatacttt caagtgtcca 960

aatctgggga tcacaagctg ggtcaggtta cccatccatg atgctgattt tggctggggt 1020

cggcccatat ttatgggtcc tggtggcatc gcttatgaag gtttaagctt tatattgcct 1080

agtccaacca atgatggaag catgtcagta gctatttcat tgcagggcga gcacatgaaa 1140ctcttccaga gtttcttgta tgacatttga acgggagcac atcacatgaa ttttcacgct 1200tgtattaata gctttcggtt ccgggccagc tattcatgcg gtggtggttt cttgagtaat 1260tgtttaagct tatgaagaac cactgttctg ttttgtacct atgtggacaa taattcttgt 1320ctaagttcct tgtgcatgta atgatggtga aaggataagg ttcatttcat tttattgttt 1380tgtcatttga gttctaaagt tgtaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440aaaaaaaaaa aaaaaaaaaa aaaaa 1465

<210> 19

<211> 685

<212> DNA

<213> Coffea arabica

<400> 19

tttcttaggc gcggtaggta agtcccccaa aacaaattat atagtccccc tacggtctcg 60cactctttaa catttttttc ccgttttgtt aggacgcaga tcagattcat ttcgattaaa 120gtccaafccca cttcgaacaa caccatacct acaacatcat tgtccttacc acttctccca 180ttagccagec tgccacctcc tcctcctcct CCCCCtCttC ctttttgaat ttcttatccc 240accacccaac attcttcttc cttctcaact cttcaggtac gtttaatgca aatttcacgt 300aatatttcac gttcgaaatc cattcttcat caccattaaa ctaatcaaag tatgtttatt 360gcaccatttt cttttatgtt ttttggggta cagttgttgt acgtgtcaag caaggatcat 420acaactttca accatgaaaa tcaaggtgaa ggaatcgact atggtgagac ctgcccaaga 480aactcctagg aggaacttgt ggaactcgaa cgtggacttg gtggtgccaa atttccacac 540ccctagcgtc tacttctata ggccgacggg atcatcgaat ttctttgatg ccaaagtgct 600gaaggacgct ctgagccgag cçcttgtccc gttctaccca atggctggta ggttaaagag 660

agacgaagat gggcggattg agatt 685

<210> 20

<211> 435

<212> PRT

<213> Nicotiana tabacum

<400> 20

Met Lys Ile Glu Val Lys Glu Ser Thr Met Val Lys Pro Ala Ala Glu1 5 10 15

Thr Pro Gln Gln Arg Leu Trp Asn Ser Asn Val Asp Leu Val Val Pro20 25 30

Asn Phe His Thr Pro Ser Val Tyr Phe Tyr Arg Pro Thr Gly Ser Pro35 40 45Asn Phe Phe Asp Gly Lys Val Leu Lys Glu Ala Leu Ser Lys Ala Leu50 55 60

vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Cys Arg Asp Glu Asp Gly65 70 75 80

Arg Ile Glu Ile Asp Cys Lys Gly Gln Gly vai Leu Phe vai Glu Ala85 90 95

Glu ser Asp Gly vai vai Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110

Glu Leu Arg Gln Leu lie Pro Ala Val Asp Tyr ser Gln Gly Ile Gln115 120 125

Ser Tyr Ala Leu Leu Val Leu Gln lie Thr His Phe Lys Cys Gly Gly130 135 140

vai Ser Leu Gly Val Gly Met Gln His His Ala Ala Asp Gly Ala Ser145 150 155 160

Gly Leu His Phe Ile Asn Thr Trp Ser Asp Met Ala Arg Gly Leu Asp165 170 175

Leu Thr Ile Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190

Pro Pro Gln Pro Gln Phe Pro His vai Glu Tyr Gln Pro Pro Pro Thr195 200 205

Leu Lys vai Thr Pro Glu Asn Thr Pro Ile ser Glu Ala Val Pro Glu210 215 220

Thr Ser Val Ser Ile Phe Lys Leu Thr Arg Asp Gln Ile Asn Thr Leu225 230 235 · 240

Lys Ala Lys Ser Lys Glu Asp Gly Asn Thr vai Asn Tyr Ser Ser Tyr245 250 255

Glu Met Leu Ala Gly His Val Trp Arg Ser Thr Cys Met Ala Arg Gly260 265 270

Leu Ala His Asp Gln Glu Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg275 280 285

Ser Arg Leu Arg Pro ser Leu Pro Pro G7y TVr Phe GTy Asn Va7 ITe290 295 300Phe Thr Thr Thr Pro lie Ala vai Ala Gly Asp Ile Gln ser Lys Pro305 310 315 320

Ile Trp Tyr Ala Ala ser Lys Leu His Asp Ala Leu Ala Arg Met Asp325 330 335

Asn Asp Tyr Leu Arg ser Ala Leu Asp Tyr Leu Glu Leu Gln. Pro Asp340 345 350

Leu Lys Ala Leu Val Arg Gly Ala His Thr Phe Lys Cys Pro Asn Leu355 360 365

Gly Ile Thr ser Trp ser Arg Leu Pro Ile His Asp Ala Asp Phe Gly370 375 380

Trp Gly Arg Pro Ile Phe Met Gly Pro Gly Gly Ile Ala Tyr Glu Gly385 390 395 400

Leu Ser Phe lie Leu Pro Ser Pro Thr Asn Asp Gly Ser Gln ser Val405 410 415

Ala Ile Ser Leu Gln Ala Glu His Met Lys Leu Phe Glu Lys Phe Leu420 425 430

Tyr Asp Phe435

<210> 21

<211> 433

<212> PRT

<213> Arabidopsis thaliana

<400> 21

Met Lys lie Asn Ile Arg Asp Ser Thr Met Val Arg Pro Ala Thr Glu1 5 10 15

Thr Pro Ile Thr Asn Leu Trp Asn Ser Asn vai Asp Leu vai Ile Pro20 25 30

Arg Phe His Thr Pro Ser vai Tyr Phe Tyr Arg Pro Thr Gly Ala ser35 40 45

Asn Phe Phe Asp Pro Gln vai Met Lys Glu Ala Leu Ser Lys Ala Leu50 55 60

vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Lys Arg Asp Asp Asp Gly65 70 75 80Arg Ile Glu Ile Asp Cys Asn Gly Ala Gly Val Leu Phe vai Val Ala85 90 95

Asp Thr Pro Ser Val Ile Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110

Asn Leu Arg Gln Leu Ile Pro Glu Val Asp His ser Ala Gly Ile His115 120 125

ser Phe Pro Leu Leu Val Leu Gln vai Thr Phe Phe Lys Cys Gly Gly130 135 140

Ala Ser Leu Gly vai Gly Met Gln His His Ala Ala Asp Gly Phe ser145 150 155 160

Gly Leu His Phe Ile Asn Thr Trp ser Asp Met Ala Arg Gly Leu Asp165 170 175

Leu Thr lie Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190

Pro Pro Gln Pro Ala Phe His His Val Glu Tyr Gln Pro Ala Pro Ser195 200 205

Met Lys lie Pro Leu Asp Pro ser Lys Ser Gly Pro Glu Asn Thr Thr210 215 220.

vai ser Ile Phe Lys Leu Thr Arg Asp Gln Leu vai Ala Leu Lys Ala225 230 235 240

Lys Ser Lys Glu Asp Gly Asn Thr Val ser Tyr Ser Ser Tyr Glu Met245 250 255

Leu Ala Gly His vai Trp Arg ser vai Gly Lys Ala Arg Gly Leu Pro260 265 270

Asn Asp Gln Glu Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg ser Arg275 280 285

Leu Arg Pro Gln Leu Pro Pro Gly Tyr Phe Gly Asn vai Ile Phe Thr290 295 300

Ala Thr Pro Leu Ala Val Ala Gly Asp Leu Leu Ser Lys Pro Thr Trp305 310 315 320

Tyr Ala Ala Gly Gln Ile His Asp Phe Leu vai Arg Met Asp Asp Asn325 330 335Tyr Leu Arg ser Ala Leu Asp Tyr Leu Glu Met Gln Pro Asp Leu Ser340 345 350

Ala Leu vai Arg Gly Ala His Thr Tyr Lys Cys Pro Asn Leu Gly Ile355 360 365

Thr Ser Trp vai Arg Leu Pro Ile Tyr Asp Ala Asp Phe Gly Trp Gly370 375 380

Arg Pro Ile Phe Met Gly Pro Gly Gly Ile Pro Tyr Glu Gly Leu ser385 390 395 400

Phe vai Leu Pro Ser Pro Thr Asn Asp Gly Ser Leu ser vai Ala Ile405 410 415

Ala Leu Gln Ser Glu His Met Lys Leu Phe Glu Lys Phe Leu Phe Glu420 425 430

Ile

<210> 22<211> 431<212> PRT

<213> Ipomoea batatas<400> 22

Met Ala Ser Glu Lys Phe Lys Ile ser Ile Lys Glu ser Thr Met Val1 5 10 15

Lys Pro Ala Lys Pro Thr Pro Ala Lys Arg Leu Trp Asn Ser Asn Leu20 25 30

Asp Leu lie vai Gly Arg Ile His Leu Leu Thr vai Tyr Phe Tyr Arg35 40 45

Pro Asn Gly Ser Pro Asn Phe Phe Asp ser Lys vai Met Lys Glu Ala50 55 60

Leu Ser Asn vai Leu Val Ser Phe Tyr Pro Met Ala Gly Arg Leu Ala65 70 75 80

Arg Asp Gly Glu Gly Arg Ile Glu Ile Asp Cys Asn Glu Glu Gly vai85 90 95

Leu Phe Val Glu Ala Glu Ser Asp Ala Cys vai Asp Asp Phe Gly Asp100 105 110Phe Thr Pro Ser Leu Glu Leu Arg Lys Phe He Pro Thr vai Asp Thr115 120 125

ser Gly Asp Ile Ser Ser Phe Pro Leu Ile lie Phe Gln Val Thr Arg130 135 140

Phe Lys cys Gly Gly vai Cys Leu Gly Thr Gly Val Phe His Thr Leu145 150 155 160

Ser Asp Gly vai Ser Ser Leu His Phe Ile Asn Thr Trp Ser Asp Met165 170 175

Ala Arg Gly Leu Ser Val Ala Ile Pro Pro Phe Ile Asp Arg Thr Leu180 185 190

Leu Arg Ala Arg Asp Pro Pro Thr Pro Ala Phe Glu His Ser Glu Tyr195 200 205

Asp Gln Pro Pro Lys Leu Lys Ser Val Pro Glu Ser Lys Arg Gly Ser210 215 220

ser Ala ser Thr Thr Met Leu Lys lie Thr Pro Glu Gln Leu Ala Leu225 230 235 240

Leu Lys Thr Lys Ser Lys His Glu Gly ser Thr Tyr Glu Ile Leu Ala245 250 255

Ala His Ile Trp Arg Cys Ala cys Lys Ala Arg Gly Leu Thr Asp Asp260 265 270

Gln Ala Thr Lys Leu Tyr vai Ala Thr Asp Gly Arg ser Arg Leu cys275 280 285

Pro Pro Leu Pro Pro Gly Tyr Leu Gly Asn vai Val Phe Thr Ala Thr290 295 300

Pro Met Ala Glu Ser Gly Glu Leu Gln ser Glu Pro Leu Thr Asn Ser305 310 315 320

Ala Lys Arg Ile His Ser Ala Leu Ser Arg Met Asp Asp Glu Tyr Leu325 330 335

Arg Ser Ala Leu Asp Phe Leu Glu Cys Gln Pro Asp Leu ser Lys Leu340 345 350

Ile Arg Gly Ser Asn Tyr Phe Ala ser Pro Asn Leu Asn Ile Asn Ser

355 60 365Trp Thr Arg Leu Pro Val His Glu Ser Asp Phe Gly Trp Gly Arg Pro370 375 380

Ile His Met Gly Pro Ala Cys Ile Leu Tyr Glu Gly Thr vai Tyr Ile385 390 395 400

Leu Pro Ser Pro Asn Lys Asp Arg Thr Leu ser Leu Ala Val Cys Leu405 410 415

Asp Ala Glu His Met Pro Leu Phe Lys Glu Phe Leu Tyr Asp Phe420 425 430

<210> 23<211> 436<212> PRT

<213> Lycopersicon esculentum<400> 23

Met Gly ser Glu Lys Met Met Lys Ile Asn Ile Lys Glu Ser Thr Leu1 5 10 15

vai Lys Pro ser Lys Pro Thr Pro Thr Lys Arg Leu Trp Ser Ser Asn20 25 30

Leu Asp Leu Ile vai Gly Arg Ile His Leu Leu Thr vai Tyr Phe Tyr35 40 45

Lys Pro Asn Gly Ser Ser Asn Phe Phe Asp ser Lys Ile Met Lys Glu50 55 60

Ala Leu Ser Asn vai Leu Val ser Phe Tyr Pro Met Ala Gly Arg Leu65 70 75 80

Ala Arg Asp Glu Gln Gly Arg Ile Glu Ile Asn Cys Asn Gly Glu Gly85 90 95

vai Leu Phe vai Glu Ala Glu ser Asp Ala Phe Val Asp Asp Phe Gly100 105 UO

Asp Phe Thr Pro ser Leu Glu Leu Arg Lys Leu Ile Pro Thr Val Asp115 120 125

Thr Ser Gly Asp Ile ser Thr Phe Pro Leu Ile Ile Phe Gln vai Thr130 135 140

Arg Phe Lys Cys Gly Gly Val Ser Leu Gly Gly Gly vai Phe His Thr145 150 155 160Leu ser Asp Gly Leu Ser Ser Ile His Phe ile Asn Thr Trp Ser Asp165 170 175

Ile Ala Arg Gly Leu Ser Val Ala Ile Pro Pro Phe Ile Asp Arg Thr180 185 190

Leu Leu Arg Ala Arg Asp Pro Pro Thr Ser ser Phe Glu His Val Glu195 200 205

Tyr His Pro Pro Pro Ser Leu lie Ser ser ser Lys Ser Leu Glu Ser210 215 220

Thr Ser Pro Lys Pro ser Thr Thr Thr Met Leu Lys Phe ser Ser Asp225 230 235 240

Gln Leu Gly Leu Leu Lys Ser Lys Ser Lys His Asp Gly Ser Thr Tyr245 250 255

Glu Ile Leu Ala Ala His Ile Trp Arg Cys Thr Cys Lys Ala Arg Ala

260

265

270

Leu ser Asp Asp Gln Leu Thr Lys Leu His Val Ala Thr Asp Gly Arg

275

280

285

Ser Arg Leu Cys Pro Pro Leu Pro Pro Gly Tyr Leu Gly Asn Val vai290 295 300

Phe Thr Gly Thr Pro Met Ala Lys Ser ser Glu Leu Leu Gln Glu Pro305 310 315 320

Leu Thr Asn Ser Ala Lys Arg lie His Ser Ala Leu ser Lys Met Asp325 330 335

Asp Asn Tyr Leu Arg Ser Ala Leu Asp Tyr Leu Glu Leu Leu Pro Asp340 345 350

Leu ser Ala Leu Ile Arg Gly Pro Thr Tyr Phe Ala Ser Pro Asn Leu355 360 365

Asn lie Asn ser Trp Thr Arg Leu Pro vai His Asp ser Asp Phe Gly370 375 380

Trp Gly Arg Pro Ile His Met Gly Pro Ala Cys Ile Leu Tyr Glu Gly385 390 395 400Leu Tyr Glu Phe435

<210> 24<211> 430<212> PRT

<213> Lycopersicon esculentum<400> 24

Met Gly Ser Glu Lys Met Met Lys Ile Asn Ile Lys Glu Ser Thr Leu1 5 10 15

vai Lys Pro Ser Lys Pro Thr Pro Thr Lys Arg Ile Trp Ser Ser Asn20 25 30

Leu Asp Leu Ile Val Gly Arg Ile His Leu Leu Thr Val Tyr Phe Tyr35 40 45

Lys Pro Asn Gly Ser Ser Asn Phe Phe Asp Asn Lys Val Ile Lys Glu50 55 60

Ala Leu Ser Asn vai Leu Val Ser Phe Tyr Pro Met Ala Gly Arg Leu65 70 75 80

Gly Arg Asp Glu Gln Gly Arg Ile Glu Val Asn Cys Asn Gly Glu Gly85 90 95

Val Leu Phe Val Glu Ala Glu Ser Asp Ser Cys Val Asp Asp Phe Gly100 105 110

Asp Phe Thr Pro Ser Leu Glu Leu Arg Lys Leu Ile Pro Ser Val Glu115 120 125

Thr Ser Gly Asp Ile Ser Thr Phe Pro Leu Val Ile Phe Gln Ile Thr130 135 140

Arg Phe Lys Cys Gly Gly Val Ala Leu Gly Gly Gly Val Phe His Thr145 150 155 160

Leu Ser Asp Gly Leu Ser Ser Ile His Phe Ile Asn Thr Trp Ser Asp165 170 175He Ala Arg Gly Leu Ser vai Ala Val Pro Pro Phe Ile Asp Arg Thr180 185 190

Leu Leu Arg Ala Arg Asp Pro Pro Thr Tyr Ser Phe Glu His vai Glu195 200 205

Tyr His Pro Pro Pro Thr Leu Asn Ser ser Lys Asn Arg Glu ser Ser210 215 220

Thr Thr Thr Met Leu Lys Phe Ser ser Glu Gln Leu Gly Leu Leu Lys225 230 235 240

Ser Lys ser Lys Asn Glu Gly Ser Thr Tyr Glu Ile Leu Ala Ala His245 250 255

Ile Trp Arg Cys Thr Cys Lys Ala Arg Gly Leu Pro Glu Asp Gln Leu260 265 270

Thr Lys Leu His vai Ala Thr Asp Gly Arg Ser Arg Leu Cys Pro Pro275 280 285

Leu Pro Pro Gly Tyr Leu Gly Asn Val vai Phe Thr Ala Thr Pro lie290 295 300

Ala Lys Ser Cys Glu Leu Gln ser Glu Pro Leu Thr Asn Ser Val Lys305 310 315 320

Arg Ile His Asn Glu Leu Ile Lys Met Asp Asp Asn Tyr Leu Arg Ser325 330 335

Ala Leu Asp Tyr Leu Glu Leu Gln Pro Asp Leu Ser Thr Leu Ile Arg340 345 350

Gly Pro Ala Tyr Phe Ala Ser Pro Asn Leu Asn Ile Asn Ser Trp Thr355 360 365

Arg Leu Pro Val His Glu Cys Asp Phe Gly Trp Gly Arg Pro Ile His370 375 380

Met Gly Pro Ala Cys Ile Leu Tyr Glu Gly Thr Ile Tyr Ile Ile Pro385 390 395 400

Ser Pro Asn Ser Lys Asp Arg Asn Leu Arg Leu Ala vai Cys Leu Asp405 410 415

Ala Gly His Met Ser Leu Phe Glu Lys Tyr Leu Tyr Glu Leu420 425 430<210> 25

<211> 5

<212> PRT

<213> Coffea canephora

<220>

<221> característica mista

<222> (1)..C5)

<223> Caixa HXXXD conservada encontrada em proteínas HQT e HCT.<220>

<221> característica mista

<222> (2)..C4)

<223> Cada X pode independentemente ser qualquer aminoácido.

<400> 25

His Xaa xaa xaa Asp

1 5

<210> 26

<211> 5

<212> PRT

<213> coffea canephora

<220>

<22l> característica mista

<222> CD - (5)

<223> Seqüência conservada ('caixa DFGWG") encontrada em proteínas HQT e HCT.

<400> 26

Asp Phe Gly Trp Gly

1 5

<210> 27

<211> 639

<212> DNA

<213> Coffea canephora

<400> 27

cctgcacttc tatttatcta gaccatttgt ccgtctacac acctttcttc tccatcccag 60ctcgtttctg acaaatccct ttcgtcaatc aacaaaactc tttacatatt ttctgctaaa 120tctcagctta tttcatcttg tttgatcagc gtgggaagcg agaaaatgaa gataaccgtg 180aaggaaacag caatggttcg tccagcccaa ccaacaccca caaagaggct atggaactcg 240aatttggatc ttctggtagc aagaattcat atcttgaccg tctacttcta caagcctaat 300ggttctgcta atttctttga tacccgtgtg ctcaaagaag cattgagcaa tgttcttgtc 360tctttctacc ccatggctgg gagattagca agagatgaag aaggaaggat tgagatcgac 420tgtaacggtg aaggtgtact ctttgttgag gctgaatcag actcgagtgt cgatgatttt 480ggtgattttg caccaagttt ggagctcagg aggctcatcc cgaccgtcga ttgttccggt 540

gacatttctt cttaccccct cgttattttc caggtaactc gtttcaagtg tggagcagca 600gctcttggag ctggggtgca gcacaattta tcagatggc 639

<210> 28

<211> 1056

<212> DNA

<213> coffea canephora<220>

<221 > característica mista<222> (1042).. (1042)

<223> η é a, c, g ou t

<400> 28 ctcgtttcaa gtgtggagca gcagctcttg gagctggggt gcagcacaat ttatcagatg 60gcgtttcatc tctgcacttc atcaatacat ggtcagacat agctcgtggc ctcaccattg 120ctgtccctcc gttcattgac cggacactta tccatgctag ggaccctccc gtgcctgtat 180tcgaacatgt cgaatattat ccgccccctc aactaaaatc agattcaaga attcaagaac 240tcaaaacagg ccctagggca agtaccacag ctgtactaaa aatcacacct gaacaactta 300gccagcttaa agctaaggcc aacaatgagg gcagcactta tgagatctta gcagcacata 360tatggcgtac tgcatgcaaa gcacgtggcc tcaccaatga tcaatccacc aagctgtacg 420ttgccactga tggccggtct aggctgattc ctcccctgcc tcctggctat ctaggtaatg 480tggtcttcac tgcaactcca attgctgaat ccagtgatct tcaatcagag cccttgacca 540attctgcaaa aagaatccac aatgccttag caagaatgga taatgattac ttaagatcag 600ccctggatta tcttgaaatt caacctgatt tgtctgcttt ggttagaggg cctcggcatt 660ttgctagtcc taatttgaat atcaatagtt ggacaaggct tccgtttcat gatgcagact 720ttggctgggg cagacctatt catatagggc cggcaatcat tctttatgag ggtacggtat 780atgtattgcc aagtccaggc aaagacagga ctttatcgtt agctgtgtgc ttagatgccg 840atcacatgcc actcttccaa aagttcctgt acgatttctg agaaattttg aaatatcaac 900aacaatcaag cttctggaag agaatggatg gaattaccat ttttagatgg tataaatcaa 960ggcagcctcg tgacacttgt gattggattg ggactctctt ttttgtattg gtgttttgct 1020tagtgatttt ctcattttct tnaaaaaaaa aaaaaa 1056<210> 29 <211> 617 <212> DNA <213> Coffea arabica <400> 29 ttgcctggag gaaagcagag aagcatccct ccacccaatt ttcacaagac acttttgtgg 60tcatctttca atagccactc ttcctcatca tattccacaa aggacaaagg ttatttcatc 120ttgtttgacc agcgtgggaa gcgagaaaat gaagataacc gtgaaggaaa cagcaatggt 180tcgtccagcc caaccaacgc ctacaaagag gctatggaac tcgaatttgg atcttttggt 240agcaagaatt catatcttga ccgtctactt ttacaagcct aatggttctg ctaatttctt 300tgatacccgt gtgctcaaag aagcattgag caatgttctt gtctctttct accccatggc 360tgggagatta gcaagagatg aagaaggaag gattgagatc gactgtaacg gcgaaggtgt 420actgtttgtc gaggctgaat cagactcaag tgtcgatgat tttggtgatt ttgcaccaag 480tttggagctc aggaggctca ttccgaccgt cgattgttct ggtgacattt cttcttaccc 540cctcgttatt ttccaggtaa ctcgtttcaa gtgtggagga gcagctcttg gagctggggt 600gcagcacaat ttatcag 617

<210> 30<211> 508<212> PRT<213> Arabidopsis thaliana<400> 30

Met Ser Trp Phe Leu Ile Ala Val Ala Thr Ile Ala Ala vai vai ser1 5 10 15

Tyr Lys Leu Ile Gln Arg Leu Arg Tyr Lys Phe Pro Pro Gly Pro Ser20 25 30

Pro Lys Pro Ile Val Gly Asn Leu Tyr Asp Ile Lys Pro Val Arg Phe35 40 45

Arg Cys Tyr Tyr Glu Trp Ala Gln Ser Tyr Gly pro Ile Ile Ser Val50 55 60

Trp Ile Gly Ser Ile Leu Asn Val Val Val Ser ser Ala Glu Leu Ala65 70 75 80

Lys Glu vai Leu Lys Glu His Asp Gln Lys Leu Ala Asp Arg His Arg85 90 95

Asn Arg ser Thr Glu Ala Phe ser Arg Asn Gly Gln Asp Leu Ile Trp100 105 110

Ala Asp Tyr Gly Pro His Tyr vai Lys Val Arg Lys Val Cys Thr Leu115 120 125

Glu Leu Phe Thr Pro Lys Arg Leu Glu ser Leu Arg Pro Ile Arg Glu130 135 140Asp Glu Val Thr Ala Met Val Glu ser Val Phe Arg Asp Cys Asn Leu145 150 155 160

Pro Glu Asn Arg Ala Lys Gly Leu Gln Leu Arg Lys Tyr Leu Gly Ala165 170 175

val Ala Phe Asn Asn Ile Thr Arg Leu Ala Phe Gly Lys Arg Phe Met180 185 190

Asn Ala Glu Gly vai Val Asp Glu Gln Gly Leu Glu Phe Lys Ala Ile195 200 205

Val Ser Asn Gly Leu Lys Leu Gly Ala Ser Leu Ser Ile Ala Glu His210 215 220

Ile Pro Trp Leu Arg Trp Met Phe Pro Ala Asp Glu Lys Ala Phe Ala225 230 235 240

Glu His Gly Ala Arg Arg Asp Arg Leu Thr Arg Ala Ile Met Glu Glu245 250 255

His Thr Leu Ala Arg Gln Lys Ser ser Gly Ala Lys Gln His Phe Val260 265 270

Asp Ala Leu Leu Thr Leu Lys Asp Gln Tyr Asp Leu ser Glu Asp Thr275 280 285

Ile Ile Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr Thr290 295 300

Ala Ile Thr Ala Glu Trp Ala Met Ala Glu Met Ile Lys Asn Pro Arg305 310 315 320

vai Gln Gln Lys vai Gln Glu Glu Phe Asp Arg vai vai Gly Leu Asp325 330 335

Arg Ile Leu Thr Glu Ala Asp Phe Ser Arg Leu Pro Tyr Leu Gln Cys340 345 350

Val Val Lys Glu ser Phe Arg Leu His Pro Pro Thr Pro Leu Met Leu355 360 365

Pro His Arg Ser Asn Ala Asp vai Lys Ile Gly Gly Tyr Asp Ile Pro370 375 380

Lys Gly Ser Asn Val His vai Asn Val Trp Ala vai Ala Arg Asp Pro385 390 395 400Ala Val Trp Lys Asn Pro Phe Glu Phe Arg Pro Glu Arg Phe Leu Glu405 410 415

Glu Asp vai Asp Met Lys Gly His Asp Phe Arg Leu Leu Pro Phe Gly 420 425 430

Ala Gly Arg Arg vai Cys Pro Gly Ala Gln Leu Gly Ile Asn Leu Val435 440 445

Thr Ser Met Met Ser His Leu Leu His His Phe Val Trp Thr Pro Pro450 455 460

Gln Gly Thr Lys Pro Glu Glu Ile Asp Met ser Glu Asn Pro Gly Leu465 470 475 480

vai Thr Tyr Met Arg Thr Pro vai Gln Ala Val Ala Thr Pro Arg Leu485 490 495

Pro ser Asp Leu Tyr Lys Arg vai Pro Tyr Asp Met 500 505

<210> 31

<211> 509

<212> PRT

<213> Ocimum basilicum

<400> 31

Met Ala Ala Leu Leu Leu Leu Leu Leu Leu Leu Pro Ala lie Phe Leu1 5 10 15

Leu His His Leu Tyr Tyr Arg Leu Arg Phe Arg Leu Pro Pro Gly Pro20 25 30

Arg Pro Leu Pro vai vai Gly Asn Leu Tyr Asp Val Lys Pro vai Arg35 40 45

Phe Arg Cys Phe Ala Asp Trp Ala Gln ser Tyr Gly Pro Ile Ile Ser50 55 60

Val Trp Phe Gly Ser Thr Leu Asn vai Ile Val Ser Asn Thr Glu Leu65 70 75 80

Ala Lys Glu Val Leu Lys Glu Lys Asp Gln Gln Leu Ala Asp Arg His85 90 95

Arg ser Arg Ser Ala Ala Lys Phe Ser Arg Asp Gly Gln Asp Leu Ile100 105 110Trp Ala Asp Tyr Gly Pro His Tyr vai Lys vai Arg Lys vai Cys Met115 120 125

Leu Glu Leu Phe Ser Pro Lys Arg Leu Glu Ala Leu Arg Pro Ile Arg130 135 140

Glu Asp Glu vai Thr Ala Met Val Glu Ser He Tyr His Asp Cys Thr145 150 155 160

Ala Pro Asp Asn Ala Gly Lys Ser Leu Leu vai Lys Lys Tyr Leu Gly165 170 175

Ala vai Ala Phe Asn Asn Ile Thr Arg Leu Ala Phe Gly Lys Arg Phe180 185 190

Val Asn ser Glu Gly Ile Ile Asp Lys Gln Gly Leu Glu Phe Lys Ala195 200 205

Ile vai Ser Asn Gly Leu Lys Leu Gly Ala Ser Leu Ala Met Ala Glu210 215 220

His Ile Pro Trp Leu Arg Trp Met Phe Pro Leu Asp Glu Asp Ala Phe225 230 235 240

Ala Lys His Gly Ala Arg Arg Asp Gln Leu Thr Arg Glu Ile Met Glu245 250 255

Glu His Thr Arg Ala Arg Glu Glu Ser Gly Gly Ala Lys Gln His Phe260 265 270

Phe Asp Ala Leu Leu Thr Leu Lys Asp Lys Tyr Asp Leu Ser Glu Asp275 280 285

Thr lie Ile Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr290 295 300

Thr Ala lie Ser Val Glu Trp Ala Met Ala Glu Leu Ile Lys Asn Pro305 310 315 320

Arg vai Gln Gln Lys Ala Gln Glu Glu Leu Asp Arg vai Ile Gly Tyr325 330 335

Glu Arg Val Met Thr Glu Leu Asp Phe Ser Asn Leu Pro Tyr Leu Gln340 345 350

Cys vai Ala Lys Glu Ala Leu Arg Leu His Pro Pro Thr Pro Leu Met

355

360

365Leu ργο His Arg ser Asn ser Asn vai Lys Ile Gly Gly Tyr Asp Ile370 375 380

Pro Lys Gly ser Asn vai His Val Asn vai Trp Ala Val Ala Arg Asp385 390 395 400

Pro Ala Val Trp Lys Asn Pro ser Glu Phe Arg Pro Glu Arg Phe Leu405 410 415

Glu Glu Asp Val Asp Met Lys Gly His Asp Phe Arg Leu Leu Pro Phe420 425 430

Gly Ala Gly Arg Arg vai Cys Pro Gly Ala Gln Leu Gly Ile Asn Leu435 440 445

Val Thr ser Met Ile Gly His Leu Leu His His Phe Asn Trp Ala Pro450 455 460

Pro Ser Gly vai Ser Thr Asp Glu Leu Asp Met Gly Glu Asn Pro Gly465 470 475 480

Leu Val Thr Tyr Met Arg Thr Pro Leu Glu Ala vai Pro Thr Pro Arg485 490 495

Leu Pro Ser Asp Leu Tyr Lys Arg Ile Ala Val Asp Leu500 505

<210> 32<211> 509<212> PRT

<213> Lycopersicon esculentum<400> 32

Met Ala Leu Phe Leu Ile lie Leu Thr ser Ile Ala Leu Ile Phe Leu1 5 10 15

Ala His Lys Leu Tyr His Arg Leu Arg Phe Lys Leu Pro Pro Gly Pro20 25 30

Arg Pro Leu Pro vai Val Gly Asn Leu Tyr Asp Ile Lys Pro vai Arg35 40 45

Phe Arg Cys Phe Ala Asp Trp Ala Gln Thr Tyr Gly Pro Ile Phe Ser50 55 60

vai Tyr Phe Gly ser Gln Leu Asn vai Val vai Thr Thr Ala Glu Leu65

70

75

80

Ala Lys Gln Val Leu Lys Glu Asn Asp Gln Asn Leu Ala Asp Arg Phe85 90 95

Arg Thr Arg Pro Ala Asn Asn Leu Ser Arg Asn Gly Met Asp Leu Ile100 105 110

Trp Ala Asp Tyr Gly Pro His Tyr vai Lys Val Arg Lys Leu Cys Asn115 120 125

Leu Glu Leu Phe Thr Pro Lys Arg Leu Glu Ser Leu Arg Pro Ile Arg130 135 140

Glu Asp Glu vai Thr Ala Met vai Glu ser Ile Phe Asn Asp Cys Thr145 150 155 160

Lys Pro Asp Asn Arg Gly Lys Ser Leu Leu Met Arg Glu Tyr Leu Gly165 170 175

Ser vai Ala Phe Asn Asn Ile Thr Arg Leu Thr Phe Gly Lys Arg Phe180 185 190

Met Asn Ala Ala Gly Glu lie Asp Glu Gln Gly Gln Glu Phe Lys Gly195 200 205

Ile vai ser Asn Gly Ile Lys Ile Gly Gly Lys Leu Pro Leu Ala Glu210 215 220

Tyr Val Pro Trp Leu Arg Trp Phe Phe Ser Met Glu Asn Glu Ala Leu225 230 235 240

Val Lys His ser Glu Arg Arg Asp Arg Leu Thr Arg lie lie Met Asp245 250 255

Glu His Thr Leu Ala Arg Lys Gln Thr Gly Asp Thr Lys Gln His Phe260 265 270

Val Asp Ala Leu Leu Thr Leu Gln Lys Gln Tyr Asp Leu Ser Asp Asp275 280 285

Thr Val Ile Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr290 295 300

Thr Thr lie Thr Val Glu Trp Ala Met Ala Glu Leu Val Arg Asn Pro305 310 315 320Arg vai Gln Gln Lys Ala Gln Glu Glu Leu Asp Arg Val Ile Gly ser325 330 335

Asp Arg lie Met ser Glu Thr Asp Phe Ser Arg Leu Pro Tyr Leu Gln340 345 350

Cys vai Ala Lys Glu Ala Leu Arg Leu His Pro Pro Thr Pro Leu Met355 360 365

Leu Pro His Lys Ala Ser Ala Gly Val Lys Ile Gly Gly Tyr Asp Ile370 375 380

Pro Lys Gly Ala Ile Val His Val Asn vai Trp Ala vai Ala Arg Asp385 390 395 400

Pro Ala vai Trp Lys Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu405 410 415

Glu Glu Asp vai Asp Met Lys Gly His Asp Tyr Arg Leu Leu Pro Phe420 425 430

Gly Ala Gly Arg Arg Val Cys Pro Gly Ala Gln Leu Ala Ile Asn Leu435 440 445

Val Thr Ser Met Leu Gly His Leu Leu His His Phe Thr Trp Ser Pro450 455 460

Pro Pro Gly vai Ser Pro Glu Asp Ile Asp Leu Thr Glu Asn Pro Gly465 470 475 480

Thr Val Thr Tyr Met Lys Asn Pro Ile Gln Ala Ile Pro Thr Pro Arg485 490 495

Leu Pro Ala His Leu Tyr Lys Arg vai Pro Met Asp Met500 505

<210> 33<211> 218<212> DNA<213> Coffea canephora<400> 33

agagaacggg aaaatttaaa ataaggctta ggttgcttgg gaacaatgga aaacaaggga 60ttgttgcaga gtagggaact ctatcagtac ctcctggaga ctagtgtcta tccacatgaa 120ctgcagcctc tcaaggagct aagggatgtt actgcaagtc atccgtgggc cactatggca 180accgccccag atgctggtca gttgattgcc atgctctt 218<210> 34 <211> 722 <212> DNA <213> Coffea canephora <400> 34 gtcatccgtg ggccactatg gcaactgccc cagatgctgg tcagttgatt gccatgctct 60tgaaactaat aagtgccaaa aagacaatag agattggtgt ctttactgga tactccctac 120tgcttactgc ccttacaata ccagatgatg gcaggattgt agcaattgac cagaacagag 180atacatatga gatagggctg ccaattataa gaaaagctgc agttgagcat aagatcgact 240tcattgagtc cgaggctctt ccagttcttg ataaactcct tgaagaaaat cttaaccatg 300aagcctttga ctttgctttc gttgatgcgg acaaattaaa ttatctgaag taccatgaga 360aactgttgaa attgttaaag cttggtggaa tagttgtata cgacaacaca ctttggggag 420gatcggtggc cttgccggaa gaatctgtgg ctgaggaaat gaaagcaggc aggcatttca 480caattgagtt caacaaattg ctagctgctg atacccgagt tcaaatatcc caggttcctc 540tgggtgatgg gattactatt tgtaagcgtc tccactaaat cttatgctgg agtacttact 600tggtagttgt aaattcttgt tctttatcaa catgcttgta agcatgaact tgtggacttg 660agattcttct aa tttgtgttta taatgtcagc cttcagtaca agatttaaaa aaaaaaaaaa 720 722

<210> 35

<211> 349

<212> DNA

<213> Coffea arabica

<220>

<221> característica mista

<222> (29).. (29)

<223> η é a, c, g ou t<220>

<221 > característica mista

<222> (31)..(31)

<223> η é a, c, g ou t

<400> 35 aaacttcgga ttaatatcct tatatgccna nagccccacc gtcttctggg ctgaataaag 60ctaagaggca tttctgcacg ttacaaaatc tcctgaattc atcttcagta tcatggccaa 120ggaaggaggt tctaaagtga agacaattct ccagagtgag gccctccaga agtacatctt 180gaatactagc acatacccaa gagagcatga acaactgaag gagctaagag aagagactgc 240caggaaatat ggtgccaggg ctattatagg tgtgccacct gatgaggggc tcttcctgtc 300tatgtttttg aaagtaatga atgccaagaa gacactggag attggtgtt 349<210> 36

<211> 934

<212> DNA

<213> Coffea arabica

<400> 36

gaggttctaa aatgaagaca attctccaga gtgaggccct ccagaagtac atcttgaata 60ctagcacata cccaagagag catgaacaac tgaaggagct aagagaagag actgccagga 120aatatggtgc cagggctatt ataggtgtgc cacctgatga ggggctcttc ctgtctatgt 180ttttgaaagt aatgaatgcc aagaagacac tggagattgg tgtttttact ggctattctc 240ttcttactac tgctcttgca cttcctgatg atggccagat agttgcaata gaccctgatc 300aaggagcatt tgaagttggt ctgaaattca tcaagaaagc tggtgtggag aacaaaatca 360aattcatcaa atcagatggc atttctgctc taaatgattt gttgaacaat gtgaatatgc 420agcatttgcc agaagctccc ttcagatttt tctggaaaaa gtgcactata aagtaaccac 480tagaagctag tgaagcaaca ttcgactttg catttgtgga tgcagacaag ccaagctaca 540tccagtacca tgaacaacta ataaagctgg tgaagattgg aggaattatc gcttacgata 600atactctata cggtggatat gttgtcagtg aagaaattga aatgcacgaa agatccactg 660tcaacagaaa agccatcata caattcaaca actatatagc ctcggatccg cgagttgaga 720tctctcaggt tcctatagga gatggtgtta cattgtgtag gcgcatcatc gcttagctga 780catgatattt tacatgaatt ttattaatag tgcaactgct acggtagcat agttggatgg 840tttgcttggt cataattcct tgatgctgtc ccaataacat caggcataag aaagatttct 900gctctgagca aaaaaaaaaa aaaaaaaaaa aaaa 934

<210> 37<211> 247<212> PRT

<213> Medicago sativa<400> 37

Met Ala Thr Asn Glu Asp Gln Lys Gln Thr Glu Ser Gly Arg His Gln1 5 10 15

Glu vai Gly His Lys Ser Leu Leu Gln ser Asp Ala Leu Tyr Gln Tyr20 25 30

Ile Leu Glu Thr ser Val Phe Pro Arg Glu His Glu Ala Met Lys Glu35 40 45

Leu Arg Glu Val Thr Ala Lys His Pro Trp Asn Ile Met Thr Thr Ser50 55 60

Ala Asp Glu Gly Gln Phe Leu Ser Met Leu Leu Lys Leu Ile Asn Ala65 70 75 80

Lys Asn Thr Met Glu lie Gly Val Tyr Thr Gly Tyr Ser Leu Leu Ala85 90 95

Thr Ala Leu Ala lie Pro Glu Asp Gly Lys Ile Leu Ala Met Asp Ile100 105 110

Asn Lys Glu Asn Tyr Glu Leu Gly Leu Pro vai Ile Lys Lys Ala Gly115 120 125

vai Asp His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu Pro vai Leu130 135 140

Asp Glu Met Ile Lys Asp Glu Lys Asn His Gly Ser Tyr Asp Phe Ile145 150 155 160

Phe Val Asp Ala Asp Lys Asp Asn Tyr Leu Asn Tyr His Lys Arg Leu165 170 175

Ile Asp Leu Val Lys vai Gly Gly vai Ile Gly Tyr Asp Asn Thr Leu180 185 190

Trp Asn Gly Ser vai vai Ala Pro Pro Asp Ala Pro Leu Arg Lys Tyr195 200 205

Val Arg Tyr Tyr Arg Asp Phe Val Leu Glu Leu Asn Lys Ala Leu Ala210 215 220

Val Asp Pro Arg lie Glu Ile Cys Met Leu Pro Val Gly Asp Gly Ile225 230 235 240

Thr rle Cys Arg Arg lie Lys245

<210> 38<2ll> 239<212> PRT

<213> Nicotiana tabacum<400> 38

Met Ala Thr Asn Gly Arg His Gln Glu Val Gly His Lys Ser Leu Leu1 5 10 15

Gln Ser Asp Ala Leu Tyr Gln Tyr lie Leu Glu Thr Ser vai Tyr Pro20 25 30

Arg Glu Pro Glu Pro Met Lys Glu Leu Arg Glu lie Thr Ala Lys His

35 40 45Pro Trp Asn Leu Met Thr Thr ser Ala Asp Glu Gly Gln Phe Leu Ser50 55 60

Met Leu Ile Lys Leu Ile Asn Ala Lys Asn Thr Met Glu lie Gly vai65 70 75 80

Phe Thr Gly Tyr Ser Leu Leu ATa Thr A7a Met Ala Leu Pro Asp Asp85 90 95

Gly Lys Ile Leu Ala Met Asp Ile Asn Arg Glu Asn Tyr Glu Ile Gly100 105 110

Leu Pro Val Ile Glu Lys Ala Gly Leu Ala His Lys lie Glu Phe Lys115 120 125

Glu Gly Pro Ala Leu Pro vai Leu Asp Gln Met Ile Glu Asp Gly Lys130 135 140

Tyr His Gly Ser Tyr Asp Phe lie Phe vai Asp Ala Asp Lys Asp Asn145 150 155 160

Tyr Leu Asn Tyr His Lys Arg Leu Ile Asp Leu Val Lys Ile Gly Gly165 170 175

Leu lie Gly Tyr Asp Asn Thr Leu Trp Asn Gly Ser vai vai Ala Pro180 185 190

Pro Asp Ala Pro Leu Arg Lys Tyr Val Arg Tyr Tyr Arg Asp Phe vai195 200 205

Leu Glu Leu Asn Lys Ala Leu Ala Ala Asp Ser Arg Ile Glu Ile Cys210 215 220

Gln Leu Pro vai Gly Asp Gly Ile Thr Leu Cys Arg Arg Ile Ser225 230 235

<210> 39

<211> 242

<212> PRT

<213> Vitis vinifera

<400> 39

Met Ala Thr Asn Gln Glu Ala Gly Arg His Gln Glu Val Gly His Lys1 5 10 15

Ser Leu Leu Gln ser Asp Ala Leu Tyr Gln Tyr Ile Leu Glu Thr ser20 25 30vai Tyr Pro Arg Glu Pro Glu Ser Met Lys Glu Leu Arg Glu Leu Thr35 40 45

Ala Gln His Pro Trp Asn lie Met Thr Thr Ser Ala Asp Glu Gly Gln50 55 60

Phe Leu Asn Met Leu Leu Lys Leu Ile Asn Ala Lys Asn Thr Met Glu65 70 75 80

Ile Gly Val Tyr Thr Gly Tyr Ser Leu Leu Ala Thr Ala Leu Ala Leu85 90 95

Pro Asp Asp Gly Lys Ile Leu Ala Met Asp Ile Asn Lys Glu Asn Tyr100 105 110

Glu Leu Gly Leu Pro Val Ile Gln Lys Ala Gly Val Ala His Lys Ile115 120 125

Asp Phe Lys Glu Gly Pro Ala Leu Pro Val Leu Asp Gln Met Ile Glu130 135 140

Asp Gly Lys Tyr His Gly Ser Phe Asp Phe Ile Phe Val Asp Ala Asp145 150 155 160

Lys Asp Asn Tyr Leu Asn Tyr His Lys Arg Leu Ile Asp Leu Val Lys165 170 175

vai Gly Gly Ile Ile Gly Tyr Asp Asn Thr Leu Trp Asn Gly Ser vai180 185 190

vai Ala Pro Pro Asp Ala Pro Leu Arg Lys Tyr vai Arg Tyr Tyr Arg195 200 205

Asp Phe vai Leu Glu Leu Asn Lys Ala Leu Ala Ala Asp Pro Arg Ile210 215 220

Glu Ile Cys Met Leu Pro vai Gly Asp Gly Ile Thr Leu Cys Arg Arg225 230 235 240

Leu Ser

<210> 40<211> 36<212> DNA<213> Seqüência artificial<220><223> Iniciador de AAP<220><221> Basemodificada<222> (24).. (25)

<223> cada η = inosine<220>

<221 > característica mista

<222> (24)..(25)

<223> η é a, c, g ou t<220>

<221 > Basemodificada

<222> (29)..(30)

<223> cada η = inosine<220>

<221 > característica mista

<222> (29).. (30)

<223> η é a, c, g ou t

<220>

<221 > Basemodificada

<222> (34).. (35)

<223> cada η = inosine<220>

<221 > característica mista

<222> (34).. (35)

<223> η é a, c, g ou t

<400> 40

ggccacgcgt cgactagtac gggnngggnn gggnng 36

<210> 41

<211> 20

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de AUAP

<400> 41

ggccacgcgt cgactagtac 20<210> 42

<211> 27

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador de 22m12-GSP1

<400> 42

caatgaacgg agggacagca atggtga 27

<210> 43

<211> 30

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador de 22m12-GSP2

<400> 43

ggccacgagc tatgtctgac catgtattga 30

<210> 44

<211> 29

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de 22w14m23-GSP1

<400> 44

ccatcagact cggcctccac gaaaagcac 29

<210> 45

<211> 32

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador de 22w14m23-GSP2

<400> 45

cactcaatct caatccgccc atcttcgtct ct 32

<210> 46

<211> 26<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde 122801-GSP1

<400> 46

ttgtaagggc agtaagcagt agggag

<210> 47

<211> 26

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde 122801-GSP2

<400> 47

aagagcatgg caatcaactg accagc

<210> 48

<211> 27

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de 119560-GSP1<400> 48

aacttcaaat gctccttgat cagggtc

<210> 49

<211> 27

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de 119560-GSP2

<400> 49

aacaccaatc tccagtgtct tcttggc

<210> 50

<211> 22

<212> DNA

<213> Seqüência artificial<220><223> Iniciador superior 1 de HCT-Fu11<400> 50

ccatgaaaat cgaggtgaag ga

<210> 51<211> 19<212> DNA<213> Seqüência artificial<220><223> Iniciador de CcHCT-RI<400> 51

gaaaccacca ccgcatgaa

<210> 52<211> 23<212> DNA<213> Seqüência artificial<220><223> Iniciador superior 2 de HQT-Fu11<400> 52

cttctccatc ccagctcgtt tct

<210> 53<211> 22<212> DNA<213> Seqüência artificial<220><223> Iniciador inferior 2 de HQT-Fu11<400> 53

gagtcccaat ccaatcacaa gt

<210> 54<211> 23<212> DNA<213> Seqüência artificial<220><223> CCoAOMT1-Fu11 superior<400> 54

caccatggcc agaatggaga agg

<210> 55

<211> 25

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador inferior de CCoAOMTI -Fu11

<400> 55

agtagggaaa ttaattagct gacgc

<210> 56

<211> 30

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador superior de CCoAOMT-Fu11

<400> 56

caccatggaa aacaagggat tgttgcagag

<210> 57

<211> 30

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador inferior de CCoAOMT-L1 -Fu11

<400> 57

aagtaagtac tccagcataa gatttagtgg

<210> 58

<211> 24

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador superior de CCoAOMT-L2-Fu11

<400> 58caccatggcc aaggaaggag gttc<210> 59

<211> 24

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador inferior de CCoAOMT-L2-Fu11

<400> 59

accatgtcag ctaagcgatg atgc

<210> 60

<211> 21

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador de rp139-F1

<400> 60

gaacaggccc atcccttatt g

<210> 61<211> 17<212> DNA<213> Seqüência artificial<220> <223> Iniciadorde rp139-R1<400> 61 cggcgcttgg cattgta<210> 62<211> 16<212> DNA<213> Seqüência artificial<220> <223> Iniciadorde rp139-MGB1<400> 62 atgcgcactg acaaca<210> 63<211> 27<212> DNA<213> Seqüência artificiai<220>

<223> Iniciador de CcC3H-F1

<400> 63

ctcttgttac taaattttca gcttgca

<210> 64

<211> 24

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcC3H-R1

<400> 64

ggagaatcca acaagttctt caca

<210> 65

<211> 18

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde CcC3H-MGB1

<400> 65

agttgcttca cttccaac

<210> 66

<211> 23

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcHCT-FI

<400> 66

gggagcacat cacatgaatt ttc

<210> 67

<211> 19

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcHCT-FI<400> 67

gaaaccacca ccgcatgaa

<210> 68

<211> 14

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcHCT-MGBI

<400> 68cggttccggg ccag

<210> 69

<211> 10

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcHQT-FI

<400> 69

ttgccaagtc caggcaaag

<210> 70

<211> 21

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcHQT-RI

<400> 70

catgtgatcg gcatctaagc a

<210> 71

<211> 20

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcHQT-MGBI

<400> 71

caggacttta tcgttagctg<210> 72<211> 19

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde CcCCoAOMT1-F1

<400> 72

tgcggaaagt tgggaatca

<210> 73

<211> 26

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcCCoAOMTI -R1

<400> 73

aagaggagga agcaaaagaa gtaggt

<210> 74

<211> 20

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcCCoAOMTI -MGB11

<400> 74

tgcaaatgaa aaatagccca

<210> 75

<211> 22

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador CcCCoAOMTI -L1 -F1

<400> 75

gctagctgct gatacccgag tt

<210> 76

<211> 27

<212> DNA<213> Seqüência artificial<220>

<223> Iniciador de CcCCoAOMTI -L1 -R1

<400> 76

gacgcttaca aatagtaatc ccatcac

<210> 77

<211> 17

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcCCoAOMTI -L1-MGB1

<400> 77

tatcccaggt tcctctg

<210> 78

<211> 24

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcCCoAOMT-L2-F1

<400> 78

gttacattgt gtaggcgcat catc

<210> 79

<211> 24

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de CcCCoAOMT-L2-R1

<400> 79

tgctaccgta gcagttgcac tatt

<210> 80

<211> 20

<212> DNA

<213> Seqüência artificial<220><223> Iniciador de CcCCoAOMT-L2-MGB1

<400> 79

<400> 80

tagctgacat gatattttac

<210> 81

<211> 22

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de AP1

<400> 81qgtaatacgac tcactatagg gc

<210> 82

<211> 19

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador de AP2

<400> 82

actatagggc acgcgtggt

<210> 83

<211> 29

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador de HCT-GSP1

<400> 83

ccatcagact cggcctccac gaaaagcac

<210> 84

<211> 32

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde HCT-GSP2<400> 84

cactcaatct caatccgccc atcttcgtct ct 32

<210> 85<211> 5<212> PRT

<213> Coffea canephora<220>

<221 > CaixaHHAAD

<222> (1)..(5)

<223> Seqüência conservada HHAAD, uma forma de caixa HXXXD encon-trada em proteínas HQT e HCT

<400> 85

His His Ala Ala Asp1 5

<210> 86

<211> 22

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciador inferior 1 de HQT-Fu11

<400> 86

ctggaggaaa gcagagaagc at 22

<210> 87

<211> 39

<212> DNA

<213> Seqüência artificial

<220>

<223> Iniciador de 178-HCT-S

<400> 87

ttaattaatt cgcggatcca tgaaaatcga ggtgaagga 39

<210> 88

<211> 44

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde 178-HCT-R<400> 88

tatatatact agtctagatc aaatgtcata caagaaactc tgga 44

<210> 89

<211> 39

<212> DNA

<213> Seqüência artificial<220>

<223> Iniciadorde 178-HQT-S

<400> 89

tttaaatttc gcggatccat gaagataacc gtgaaggaa 39

<210> 90

<211> 39

<212> DNA

<213> Seqüência artificial<220>

<223> iniciado 178-HQT-R

<400> 90

tatatatact agtctagatc agaaatcgta caggaacct 39

Claims

1. Molécula de ácido nucléico isolada de café (Coffea spp.), ca-racterizada pelo fato de que apresenta uma seqüência de codificação quecodifica uma enzima da via de fenilpropanóide selecionada de hidroxicina-moil-CoA chiquimato/quinato hidroxicinamoiltransferase, hidroxicinamoil-CoAquinato hidroxicinamoiltransferase, p-cumaroil 3' hidroxilase e cafeoil-CoA 3-O metitransferase.

2. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma hi-droxicinamoil-CoA chiquimato/quinato hidroxicinamoiltransferase.

3. Molécula de ácido nucléico de acordo com a reivindicação 2,caracterizada pelo fato de que a hidroxicinamoil-CoA chiquimato/quinato hi-droxicinamoiltransferase tem uma seqüência de aminoácido maior que86,9% idêntica à SEQ ID N9: 9 ou SEQ ID Ns: 10.

4. Molécula de ácido nucléico de acordo com a reivindicação 3,caracterizada pelo fato de que a hidroxicinamoil-CoA chiquimato/quinato hi-droxicinamoiltransferase tem uma seqüência de aminoácido que compreen-de SEQ ID N9: 9 ou SEQ ID N9: 10.

5. Molécula de ácido nucléico de acordo com a reivindicação 2,caracterizada pelo fato de que a seqüência de codificação é maior que78,5% idêntica à SEQ ID N9: 1 ou SEQ ID N9: 2.

6. Molécula de ácido nucléico de acordo com a reivindicação 5,caracterizada pelo fato de que a seqüência de codificação compreende SEQID N9: 1 ou SEQ ID N9: 2.

7. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma hi-droxicinamoil-CoA quinato hidroxicinamoiltransferase.

8. Molécula de ácido nucléico de acordo com a reivindicação 7,caracterizada pelo fato de que a hidroxicinamoil-CoA quinato hidroxicinamoil-transferase tem uma seqüência de aminoácido maior que 78,1% idêntica àSEQ ID N9: 11 ou SEQ ID N9: 12.

9. Molécula de ácido nucléico de acordo com a reivindicação 8,caracterizada pelo fato de que a hidroxicinamoil-CoA quinato hidroxicinamoil-transferase tem uma seqüência de aminoácido que compreende SEQ ID Ng:-11 ou SEQ ID N9: 12.

10. Molécula de ácido nucléico de acordo com a reivindicação 7,caracterizada pelo fato de que a seqüência de codificação é maior que-72,1% idêntica à SEQ ID Ne: 3 ou SEQ ID N9: 4.

11. Molécula de ácido nucléico de acordo com a reivindicação-10, caracterizada pelo fato de que a seqüência de codificação compreendeSEQ ID N9: 3 ou SEQ ID N9: 4.

12.- Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma p-cumaroil 3' hidroxilase.

13. Molécula de ácido nucléico de acordo com a reivindicação-12, caracterizada pelo fato de que a p-cumaroil 3' hidroxilase tem uma se-qüência de aminoácido maior que 82,9% idêntica à SEQ ID N9:13.

14. Molécula de ácido nucléico de acordo com a reivindicação-13, caracterizada pelo fato de que a p-cumaroil 3' hidroxilase tem uma se-qüência de aminoácido que compreende SEQ ID N9:13.

15. Molécula de ácido nucléico de acordo com a reivindicação-12, caracterizada pelo fato de que a seqüência de codificação é maior que-69,4% idêntica à SEQ ID N9: 5.

16. Molécula de ácido nucléico de acordo com a reivindicação-15, caracterizada pelo fato de que a seqüência de codificação compreendeSEQ ID N9: 5.

17. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma ca-feoil-CoA 3-0 metitransferase.

18. Molécula de ácido nucléico de acordo com a reivindicação-17, caracterizada pelo fato de que a cafeoil-CoA 3-0 metitransferase temuma seqüência de aminoácido maior que 86,3% idêntica à SEQ ID N9: 14,SEQ ID N9: 15 ou SEQ ID N9: 16.

19. Molécula de ácido nucléico de acordo com a reivindicação-18, caracterizada pelo fato de que a cafeoil-CoA 3-0 metitransferase temuma seqüência de aminoácido que compreende SEQ ID Ne: 14, SEQ ID NQ:-15 ou SEQ ID NQ: 16.

20. Molécula de ácido nucléico de acordo com a reivindicação-19, caracterizada pelo fato de que a seqüência de codificação compreendeSEQ ID Ne: 6, SEQ ID N9: 7 ou SEQ ID N2: 8.

21. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação é uma estruturade leitura aberta de um gene.

22. Molécula de mRNA, caracterizada pelo fato de que é produ-zida por transcrição do gene como definido na reivindicação 21.

23. Molécula de cDNA, caracterizada pelo fato de que é produzi-da por transcrição reversa da molécula de mRNA como definida na reivindi-cação 22.

24. Oligonucleotídeo entre 8 e 100 bases em comprimento, ca-racterizado pelo fato de que é complementar a um segmento da molécula deácido nucléico como definida na reivindicação 1.

25. Vetor, caracterizado pelo fato de que compreende a seqüên-cia de codificação da molécula de ácido nucléico como definida na reivindi-cação 1.

26. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que é um vetor de expressão selecionado do grupo de vetores queconsiste em vetores de plasmídeo, fagemídeo, cosmídeo, baculovírus, bac-mídeo, bacteriano, de levedura e virais.

27. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que a seqüência de codificação da molécula de ácido nucléico é ope-ravelmente ligada a um promotor constitutivo.

28. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que a seqüência de codificação da molécula de ácido nucléico é ope-ravelmente ligada a um promotor induzível.

29. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que a seqüência de codificação da molécula de ácido nucléico é ope-ravelmente ligada a um promotor tecido-específico.

30. Vetor de acordo com a reivindicação 29, caracterizado pelofato de que o promotor tecido-específico é um promotor semente-específico.

31. Vetor de acordo com a reivindicação 30, caracterizado pelofato de que o promotor semente-específico é um promotor específico parasemente de café.

32. Célula hospedeira, caracterizada pelo fato de que é trans-formada com o vetor como definido na reivindicação 25.

33. Célula hospedeira de acordo com a reivindicação 32, carac-terizada pelo fato de que é selecionada do grupo que consiste em células deplanta, células bacterianas, células fúngicas, células de inseto e células ma-míferas.

34. Célula hospedeira de acordo com a reivindicação 33, carac-terizada pelo fato de que é uma célula de planta selecionada do grupo deplantas que consiste em café, tabaco, Arabidopsis, milho, trigo, arroz, feijão-soja cevada, centeio, aveia, sorgo, alfafa, trevo, óleo de canola, cártamo,girassol, amendoim, cacau, tomate-de-árvore, batata, pimenta, berinjela, be-terraba açucareira, cenoura, pepino, alface, ervilha, áster, begônia, crisân-temo, delfínio, zínia, e gramas.

35. Planta fértil, caracterizada pelo fato de que é produzida dacélula de planta como definida na reivindicação 34.

36. Método de modular sabor ou aroma de feijões de café, carac-terizado pelo fato de que compreende modular a produção ou atividade deuma ou mais enzimas da via de fenilpropanóide dentro das sementes de café,em que as enzimas da via de fenilpropanóide são selecionadas de hidroxici-namoil-CoA chiquimato/qui-nato hidroxicinamoiltransferase, hidroxicinamoil-CoA quinato hidroxicinamoiltransferase, p-cumaroil 3' hidroxilase e cafeoil-CoA 3-0 metitransferase.

37. Método de acordo com a reivindicação 36, caracterizado pe-lo fato de que compreende aumentar a produção ou atividade da uma oumais enzimas da via de fenilpropanóide.

38. Método de acordo com a reivindicação 37, caracterizado pe-lo fato de que compreende aumentar a expressão de um ou mais genes en-dógenos da enzima da via de fenilpropanóide dentro das sementes de café.

39. Método de acordo com a reivindicação 37, caracterizado pe-lo fato de que compreende introduzir um transgene de codificação da enzimada via de fenilpropanóide na planta.

40. Método de acordo com a reivindicação 36, caracterizado pe-lo fato de que compreende aumentar a produção ou atividade da uma oumais enzimas da via de fenilpropanóide.

41. Método de acordo com a reivindicação 40, caracterizado pe-lo fato de que compreende introduzir uma molécula de ácido nucléico no ca-fé que inibe a expressão de um ou mais genes de codificação da enzima da-1,1 via de fenilpropanóide.