BRPI0913671B1

BRPI0913671B1 - Método para produzir alfa-santaleno

Info

Publication number: BRPI0913671B1
Application number: BRPI0913671-1A
Authority: BR
Inventors: Michel Schalk
Original assignee: Firmenich Sa
Priority date: 2008-03-06
Filing date: 2009-03-04
Publication date: 2023-08-22

Abstract

MÉTODO PARA PRODUZIR ALFA-SANTALENO. A presente invenção fornece um método para produzir (alfa)-santaleno, o dito método compreendendo colocar em contato pelo menos um polipeptídeo com farnesil pirofosfato (FPP). Em particular, o dito método pode ser executado in vitro ou in vivo para produzir (alfa)-santaleno, um composto muito útil nos campos da perfumaria e aromatizantes. A presente invenção também fornece uma sequência de aminoácidos de um polipeptídeo útil no método da invenção. Um ácido nucleico codificando o polipeptídeo da invenção e um vetor de expressão contendo o dito ácido nucleico também são parte da presente invenção. Um organismo hospedeiro não-humano ou uma célula transformada para ser usado no método de produzir (alfa)-santaleno também é um objeto da presente invenção.

Description

Campo da técnica

A presente invenção fornece um método de produzir a-santaleno, o dito método compreendendo colocar em contato pelo menos um polipeptídeo com farnesil pirofosfato (FPP). Em particular, o dito método pode ser realizado in vitro ou in vivo para produzir α-santaleno, um composto muito útil nos campos da perfumaria e aromatizantes. A presente invenção também fornece a sequência de aminoácidos de um polipeptídeo útil no método da invenção. Um ácido nucleico codificando o polipeptídeo da invenção e um vetor de expressão contendo o dito ácido nucleico também é parte da presente invenção. Um organismo hospedeiro não-humano ou uma célula transformada para ser usada no método de produzir a-santaleno também é um objeto da presente invenção;

Estado anterior da técnica

Os terpenos são encontrados na maioria dos organismos (microorganismos, animais e vegetais). Estes compostos são formados de cinco unidades de carbono chamadas de unidades de isopreno e são classificados pelo número destas unidades presentes em suas estruturas. Assim, monoterpenos, sesquiterpenos e diterpenos são terpenos contendo 10, 15 e 20 átomos de carbono, respectivamente. Os sesquiterpenos, por exemplo, são amplamente encontrados no reino vegetal. Muitas moléculas de sesquiterpeno são conhecidas por suas propriedades aromáticas e de fragrância e seus efeitos cosméticos, medicinais e antimicrobianos. Mais de 300 hidrocarbonetos de sesquiterpeno e 3000 sesquiterpenóides foram identificados e muitas novas estruturas são identificadas a cada ano. Extratos vegetais obtidos através de diferentes maneiras, tais como destilação a vapor ou extração de solvente, são usados como fonte de terpenos. As moléculas de terpeno são frequentemente usadas como tais, mas, em alguns casos, reações químicas são usadas para transformar os terpenos em outras moléculas de alto valor.

A produção biossintética de terpenos envolve enzimas chamadas de terpeno sintases. Há, virtualmente, uma infinidade de sesquiterpeno sintases presentes no reino vegetal, todas usando o mesmo substrato (farnesil pirofosfato, FPP), mas tendo diferentes perfis de produto. Genes e cDNAs codificando sesquiterpeno sintases foram clonados e as enzimas recombinantes correspondentes caracterizadas. A biossíntese dos terpenos nas plantas e outros organismos tem sido extensivamente estudada, e não é detalhada além aqui, mas referência é feita a Dewick, Nat. Prod. Rep., 2002, 19, 181-222, o qual revê o estado da arte das trajetórias biossintéticas do terpeno.

O a-santaleno é uma molécula de sesquiterpeno que ocorre naturalmente. O (+)-isômero pode ser usado como material de partida para a síntese química ou a biossíntese de (Z)-(+)-a-santalol, o qual é um importante constituinte do óleo de sândalo. O óleo de sândalo é um importante ingrediente de perfumaria obtido pela destilação do cerne das espécies de Santalum. O sândalo também é amplamente usado para incensos e medicina tradicional. O óleo contém 90% de álcoois de sesquiterpeno. (Z)-(+)-α-santalol e (Z)-(-)-β-santalol representam os principais constituintes (respectivamente, 45-47% e 20-30%) e são principalmente responsáveis pelo odor doce-amadeirado e balsâmico do óleo de sândalo. Outros constituintes, tais como epi-β-santalol e trans-a-bergamotol, também estão presentes e podem contribuir para a nota do sândalo.

Geralmente, o preço e disponibilidade dos extratos naturais da planta são dependentes da abundância, produção de óleo e origem geográfica das plantas. Além disso, a disponibilidade e qualidade dos extratos naturais são muito dependentes do clima e outras condições locais que levam à variabilidade de ano para ano, tornando o uso de tais ingredientes na perfumaria de alta qualidade muito difícil ou, mesmo, impossível em alguns anos. Devido à superexploração das fontes naturais, dificuldades de cultivo, crescimento lento das plantas de Santalum, as disponibilidades de matéria-prima de sândalo têm diminuído dramaticamente durante as últimas décadas. Portanto, seria uma vantagem fornecer uma fonte de (Z)-(+)-a-santalol, o qual é menos sujeito a flutuações na disponibilidade e qualidade. Uma síntese química dos constituintes de sesquiterpeno do sândalo até agora não está disponível. Uma trajetória bioquímica levando à síntese de (+)-a- santaleno, o qual poderia, então, ser usado para produzir (Z)-(+)-a-santalol, seria, portanto, de grande interesse. Dada a dificuldade de controlar a produção de sesquiterpeno nas espécies de Santalum, fontes vegetais alternativas foram observadas.

O sesquiterpeno do tipo santalano, e particularmente sesquiterpenos com o esqueleto do a-santalano, foram identificados em várias espécies vegetais. Relatou- se que a Clausena lansium, uma planta da família Rutaceae contém grandes quantidades de sesquiterpenos de santalano nas folhas. Zhao e colaboradores (Zhao et al, Z. Naturforsch, 2004, 59c, 153-156) analisaram as folhas de C. Lansium da China e detectaram a presença de a-santalol e β-santalol. A análise das folhas de C. Lansium de Cuba revelou a presença de (Z)-α-santalol, epi-β-santalol, (Z)-β- santalol e (E)-β-santalol (Pino et al., J. Essent. Oil Res., 2006, 18, 139-141). Surpreendentemente, a análise de diferentes partes da C. Lansium de origem tailandesa não mostrou a presença de sesquiterpenos com esqueletos de santalano (Chokeprasert et al, Journal of Food Composition and Analysis, 2007, 20(1), 52-56).

Uma sesquiterpeno sintase capaz de sintetizar pelo menos um sesquiterpeno bicíclico e/ou sesquiterpeno cíclico tendo um esqueleto de carbono do santalano, o ácido nucleico correspondente e um método para produzir tais compostos tendo um esqueleto de carbono do santalano são revelados na aplicação de patente internacional WO 2006/134523. (+)-epi-β-santaleno, (-)-β-santaleno, (+)-β- santaleno, (+)-α-santaleno e (-)-α-santaleno são citados como exemplos de compostos tendo um esqueleto de carbono do santaleno. Não obstante, a sesquiterpeno sintase fornecida nos exemplos não produz a-santaleno. Somente epi-β-santaleno é produzido. As propriedades deste composto são muito diferentes daquelas do a-santaleno. Em particular, o epi-β-santaleno não é de nenhum interesse na síntese de (Z)-(+)-a-santalol. Além disso, a sesquiterpeno sintase revelada na WO 2006/134523 compartilha somente 37% da identidade com a sequência da invenção.

As terpeno sintases que têm uma certa porcentagem de identidade da sequência com a sequência da a-santaleno sintase da presente invenção, também têm sido encontrada nos bancos de dados de sequências. Não obstante, a porcentagem de identidade entre as sesquiterpeno sintases conhecidas e o polipeptídeo da invenção é muito baixa. A sequência de proteínas mais próxima da (+)-a-santaleno sintase da invenção é uma (E)-β-farneseno sintase do Citrus junos (NCBI access No. AAK54279; Maruyama et al, Biol. Pharm. Buli., 2001, 24(10), 1171-1175) a qual compartilha 67 a 68% de identidade da sequência de aminoácidos com a a-santaleno sintase da invenção.

Além da diferença entre as próprias sequências, deve-se também salientar que a estrutura e as propriedades dos produtos sintetizados pela enzima acima mencionada são muito diferentes daquelas do a-santaleno. Em particular, o (E)-β- farneseno não é adequado como um material de partida para a síntese do (Z)-(+)-a- santalol, o qual é um ingrediente muito útil no campo da perfumaria.

Uma a-santaleno sintase é revelada na WO 2008/142318. Este documento não foi publicado na data de prioridade da presente aplicação. Ele descreve uma enzima capaz de catalisar a transformação do Z,Z-farnesil pirofosfato em a- santaleno. Portanto, a reação catalisada pela enzima da arte anterior é diferente daquela catalisada pela sintase da presente invenção, a qual inicia a partir do E,E- farnsesil pirofosfato. Além do mais, a a-santaleno sintase da invenção compartilha somente 23,8% de identidade da sequência com aquela descrita na WO 2008/142318.

Apesar de estudos extensivos da ciclização do terpeno, o isolamento e caracterização das terpeno sintases ainda é difícil, particularmente em plantas, devido a sua baixa abundância, seus padrões de expressão frequentemente transitórios e a complexidade de purificá-las a partir de misturas de resinas e compostos fenólicos nos tecidos onde elas são expressas.

Um objetivo da presente invenção é fornecer métodos para fabricar (+)-a- santaleno de uma maneira econômica, conforme indicado acima. Concordantemente, a presente invenção tem o objetivo de produzir (+)-a-santaleno embora tendo pouco desperdício, um processo mais eficiente em termos de energia e recursos, enquanto se reduz a dependência de combustíveis fósseis. É um objetivo adicional fornecer enzimas capazes de sintetizar a-santaleno, o qual é útil como ingrediente de perfumaria e/ou aromatizantes. Abreviações Usadas bp par de bases kb quilobase BSA albumina do soro bovino DMAPP dimetilalil difosfato DNA ácido desoxirribonucleico cDNA DNA complementar dT desoxitimina 5 dNTP desoxinucleotídeo trifosfato DTT ditiotreitol FPP farnesil pirofosfato GC cromatografia gasosa idi isopentenil difosfato isomerase 10 IPP isopentenil difosfato IPTG isopropil-D-tiogalacto-piranosídeo LB caldo de lisogenia MOPSO ácido 3-(N-morfolino)-2-hidroxipropanossulfônico MS espectrômetro de massa 15 mvaK1 mevalonato quinase mvaK2 mevalonato difosfato quinase NMR ressonância magnética nuclear PCR reação de cadeia polimerase RMCE Troca de cassete mediada por recombinase 20 3’-/5’-RACE amplificação rápida das extremidades de cDNA 3’ e 5’ RNA ácido ribonucleico mRNA ácido ribonucleico mensageiro

Descrição da invenção

A presente invenção fornece um método para produzir biossinteticamente o 25 a-santaleno, de uma maneira econômica, confiável e reproduzível.

Uma “sesquiterpeno sintase” ou um “polipeptídeo apresentando uma atividade sesquiterpeno sintase”, é pretendido aqui como um polipeptídeo capaz de catalisar a síntese de uma molécula de sesquiterpeno ou de uma mistura de moléculas de sesquiterpeno a partir do percursor de terpeno acíclico FPP.

Como uma “a-santaleno sintase” ou como um “polipeptídeo apresentando uma atividade a-santaleno sintase”, queremos dizer aqui, um polipeptídeo capaz de catalisar a síntese do a-santaleno, na forma de qualquer um de seus estereoisômeros ou uma mistura deles, partindo do FPP. O a-santaleno pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos.

Como uma “(+)a-santaleno sintase” ou como um “polipeptídeo apresentando uma atividade (+)a-santaleno sintase”, queremos dizer aqui, um polipeptídeo capaz de catalisar a síntese de (+)-α-santaleno a partir do FPP. O (+)-a-santaleno pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos. A (+)-a- santaleno sintase é um exemplo particular de a-santaleno sintase.

A capacidade de um polipeptídeo catalisar a sínstese de um sesquiterpeno em particular (por exemplo, (+)-a-santaleno) pode ser simplesmente confirmada realizando o ensaio de enzima conforme detalhado no Exemplo 4.

De acordo com uma materialização preferida da invenção, o FPP está na forma de (2E,6E)-FPP.

De acordo com a presente invenção, significa que os polipeptídeos também incluem polipeptídeos truncados contanto que mantenham sua atividade sesquiterpeno sintase conforme definida em qualquer das materializações acima e que compartilhem pelo menos a porcentagem definida de identidade com o fragmento correspondente da SEQ ID NO:1.

Conforme pretendido abaixo, “uma sequência de nucleotídeos obtida pela modificação da SEQ ID NO:2” abrange qualquer sequência que tenha sido obtida pela mudança da SEQ ID NO:2 usando qualquer método conhecido na arte, por exemplo introduzindo qualquer tipo de mutações tais como mutações por deleção, inserção ou substituição. Exemplos de tais métodos são citados na parte da descrição relativa às variantes de polipeptídeo e aos métodos para prepará-las.

A porcentagem de identidade entre duas sequências peptídicas ou nucleotídicas é uma função do número de aminoácidos ou resíduos de nucleotídeo que são idênticos nas duas sequências quando um alinhamento destas duas sequências é gerado. Resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma dada posição de alinhamento. A porcentagem de identidade da sequência, conforme usada neste, é calculada a partir do alinhamento ótimo, tomando o número de resíduos idênticos entre duas sequências, dividindo-o pelo número total de resíduos na sequência mais curta e multiplicando por 100. O alinhamento ótimo é o alinhamento no qual a porcentagem de identidade é a mais alta possível. Lacunas podem ser introduzidas em uma ou ambas as sequências, em uma ou mais posições de alinhamento, para obter o alinhamento ótimo. Estas lacunas são então levadas em conta como resíduos não- idênticos para o cálculo da porcentagem de identidade da sequência.

O alinhamento para o propósito de determinar a porcentagem de identidade da sequência de aminoácidos ou ácidos nucleicos pode ser alcançado de várias maneiras usando programas de computador e, por exemplo, programas de computador disponíveis na rede mundial. Preferivelmente, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) ajustado aos parâmetros predefinidos, disponível no National Center for Biotechnology Information (NCBI) no site http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, pode ser usado para obter o alinhamento ótimo das sequências peptídicas ou nucleotídicas e calcular a porcentagem de identidade da sequência.

Um objeto da presente invenção é, portanto, um método para produzir a- santaleno, compreendendo a) colocando o FPP em contato com pelo menos um polipeptídeo apresentando uma atividade de a-santaleno sintase e compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID NO:1; b) opcionalmente, isolando o a-santaleno produzido na etapa a).

De acordo com uma materialização preferida, o método é um método para produzir a-santaleno como um produto principal. De acordo com uma materialização até mais preferida, o a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% do produto produzido pelo método da invenção.

De acordo com uma materialização mais preferida, o método é um método para produzir (+)-a-santaleno e o polipeptídeo apresentando uma atividade a- santaleno sintase apresenta uma atividade (+)-a-santaleno sintase.

De acordo com uma materialização mais preferida, o método é um método para produzir (+)-a-santaleno como um produto principal. De acordo com uma materialização mais preferida, o (+)-a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos produtos produzidos pelo método da invenção.

O método pode ser executado in vitro bem como in vivo, conforme será explicado em detalhes mais adiante.

O polipeptídeo a entrar em contato com FPP in vitro pode ser obtido pela extração a partir de um organismo que o expresse, usando tecnologias padrão de extração de proteína ou enzima. Se o organismo hospedeiro for um organismo unicelular ou célula que libere o polipeptídeo da invenção no meio de cultura, o polipeptídeo pode simplesmente ser coletado a partir do meio de cultura, por exemplo, por centrifugação, opcionalmente seguida pelas etapas de lavagem e ressuspensão em soluções tampões adequadas. Se o organismo ou célula acumula o polipeptídeo dentro de suas células, o polipeptídeo pode ser obtido pela ruptura ou lise das células e extração adicional do polipeptídeo a partir do lisado celular.

O polipeptídeo apresentando uma atividade a-santaleno sintase, em uma forma isolada ou junto com outras proteínas, por exemplo, em um extrato de proteína cru obtido de células cultivadas ou microorganismos, pode então ser suspenso em uma solução tampão em um pH ótimo. Se adequado, sais BSA e outros tipos de cofatores enzimáticos podem ser adicionados de modo a otimizar a atividade enzimática. Condições apropriadas são descritas, em mais detalhes, nos Exemplos mais adiante.

O FPP precursor pode, então, ser adicionado à suspensão ou solução, a qual é, então, incubada a uma temperatura ótima, por exemplo, entre 15 e 40°C, preferivelmente entre 25 e 35°C, mais preferivelmente a 30°C. Após a incubação, o a-santaleno produzido pode ser isolado da solução incubada pelos procedimentos de isolamento padrão, tais como extração de solvente e destilação, opcionalmente após remoção dos polipeptídeos da solução.

De acordo com outra materialização preferida, o método de qualquer das materializações descritas acima é executado in vivo. Neste caso, a etapa a) compreende cultivar um organismo hospedeiro não-humano ou célula capaz de produzir FPP e transformado para expressar pelo menos um polipeptídeo compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID N0:1 e apresentando uma atividade α-santaleno sintase, sob condições úteis para a produção de a-santaleno.

De acordo com uma materialização mais preferida, o método ainda compreende, antes da etapa a), transformar um organismo não-humano ou célula capaz de produzir FPP com pelo menos um ácido nucleico codificando um polipeptídeo compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID NO:1 e apresentando uma atividade a-santaleno sintase, de modo que o dito organismo expresse o dito polipeptídeo.

Estas materializações da invenção são particularmente vantajosas, desde que seja possível realizar o método in vivo sem previamente isolar o polipeptídeo. A reação ocorre diretamente dentro do organismo ou célula transformada para expressar o dito polipeptídeo.

De acordo com uma materialização particular da invenção, o pelo menos um ácido nucleico codificando a a-santaleno sintase compreende uma sequência de nucleotídeos pelo menos 50%, preferivelmente pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, preferivelmente pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:2 ou o complemento disto. De acordo com uma materialização mais preferida, o dito ácido nucleico compreende a sequência de nucleotídeos SEQ ID NO:2 ou o complemento desta. Em uma materialização até mais preferida, o dito ácido nucleico consiste de SEQ ID NO:2 ou o complemento desta.

De acordo com uma materialização mais preferida, o pelo menos um ácido nucleico usado em qualquer uma das materializações acima compreende uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2. De acordo com uma materialização até mais preferida, o dito pelo menos um ácido nucleico consiste de uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.

De acordo com outra materialização, o pelo menos um ácido nucleico é isolado da Clausena lansium.

Significa que o organismo ou célula “expressa” um polipeptídeo, desde que o organismo ou célula seja transformado para ancorar um ácido nucleico dito polipeptídeo, este ácido nucleico seja transcrito para o mRNA e o polipeptídeo seja encontrado no organismo hospedeiro ou célula. O termo “expressa” abrange “heterologamente expressa” e “superexpressa”, a última referindo-se a níveis de mRNA, polipeptídeo e/ou atividade enzimática até e acima do que é medido em um organismo ou célula não-transformada. Uma descrição mais detalhada dos métodos adequados para transformar um organismo não-humano ou célula será descrito mais tarde na parte da especificação que é dedicada para tais organismos hospedeiros não-humanos transformados ou células como objetos específicos da presente invenção e nos exemplos.

Significa que um organismo em particular é “capaz de produzir FPP” quando ele produz FPP naturalmente ou quando ele não produz FPP naturalmente, mas é transformado para produzir FPP, antes da transformação com um ácido conforme descrito neste, ou junto com o dito ácido nucleico. Organismos ou células transformados para produzir uma quantidade mais alta de FPP do que naturalmente ocorre no organismo ou células também são abrangidos pelos “organismos ou células capazes de produzir FPP”. Os métodos para transformar organismos, por exemplo, microorganismos, de modo que eles produzam FPP já são conhecidos na arte. Tais métodos podem, por exemplo, ser encontrados na literatura, por exemplo, nas seguintes publicações Martin, V.J., Pitera, D.J., Withers, S.T., Newman, J.D., and Keasling, J.D. Nat Biotechnol., 2003, 21(7), 796-802 (transformation of E. coli); Wu, S., Schalk, M., Clark, A., Miles, R.B., Coates, R., and Chappell, J., Nat Biotechnol., 2006, 24(11), 1441-1447 (transformation of plants); Takahashi, S., Yeo, Y., Greenhagen, B. T., McMullin, T., Song, L., Maurina-Brunker, J., Rosson, R., Noel, J., Chappell, J, Biotechnology and Bioengineering, 2007, 97(1), 170-181 (transformation of yeast).

Para realizar a invenção in vivo, o organismo hospedeiro ou célula é cultivado sob condições úteis para a produção de a-santaleno. Concordantemente, se o hospedeiro for uma planta transgênica, condições de crescimento ótimas são fornecidas, tais como condições ótimas de luz, água e de nutrientes, por exemplo. Se o hospedeiro for um organismo unicelular, as condições úteis para a produção do a-santaleno podem compreender a adição de cofatores adequados ao meio de cultura do hospedeiro. Além disso, um meio de cultura pode ser selecionado de modo que maximize a síntese de a-santaleno. Condições ótimas de cultura são descritas de uma maneira mais detalhada nos Exemplos seguintes.

Organismos hospedeiros não-humanos adequados para executar o método da invenção in vivo, pode ser qualquer organismo multicelular não-humano ou organismos unicelulares. Em uma materialização preferida, o organismo hospedeiro não-humano usado para realizar a invenção in vivo é uma planta, um procariota, ou um fungo. Qualquer planta, procariota ou fungo pode ser usado. Particularmente, plantas úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma materialização mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (nabo), Medicago (alfafa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence à espécie do Nicotiana tabacum.

Em uma materialização mais preferida, o organismo hospedeiro não-humano usado para executar o método da invenção in vivo é um microorganismo. Qualquer microorganismo pode ser usado, mas, de acordo com uma materialização até mais preferida, o dito microorganismo é uma bactéria ou levedura. Mais preferivelmente, a dita bactéria é E. coli e a dita levedura é Saccharomyces cerevisiae.

Alguns destes organismos não produzem FPP naturalmente. Para ser adequado executar o método da invenção, estes organismos têm de ser transformados para produzir o dito precursor. Eles podem ser assim transformados antes da modificação com o ácido nucleico descrito de acordo com qualquer uma das materializações acima ou simultaneamente, conforme explicado acima.

Células eucarióticas superiores isoladas também podem ser usadas, em vez de organismos completos, como hospedeiros para executar o método da invenção in vivo. Células eucarióticas adequadas pode ser qualquer célula não-humana, mas são preferencialmente células vegetais ou fúngicas.

De acordo com uma materialização preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usado em qualquer das materializações acima descritas ou codificado pelo ácido nucleico usado em qualquer das materializações acima descritas compreende uma sequência de aminoácidos pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, preferivelmente pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:1. De acordo com uma materialização mais preferida, o dito polipeptídeo compreende a sequência de aminoácidos SEQ ID NO:1. Em uma materialização até mais preferida, o dito polipeptídeo consiste da SEQ ID NO:1.

De acordo com outra materialização preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usado em qualquer das materializações descritas acima ou codificadas pelo ácido nucleico usado em qualquer das materializações acima descritas compreende uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida pela engenharia genética. Em outros termos, o dito polipeptídeo compreende uma sequência de aminoácido codificada por uma sequência de nucleotídeos que foi obtida pela modificação da SEQ ID NO:2. De acordo com uma materialização mais preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usada em qualquer uma das materializações acima descritas ou codificadas pelo ácido nucleico usado em qualquer das materializações acima descritas consiste de uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida por engenharia genética, isto é, uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.

Conforme usado neste, o polipeptídeo é pretendido como um polipeptídeo ou fragmento de peptídeo que abrange as sequências de aminoácidos identificadas neste, bem como polipeptídeos truncados ou variantes de polipeptídieos, desde que mantenham sua atividade conforme definido acima, e que compartilhem pelo menos a porcentagem definida de identidade com o fragmento correspondente da SEQ ID

Exemplos de variantes de polipeptídeos são proteínas ocorrendo naturalmente que resultam de eventos de junção alternadas de mRNA ou formam clivagem proteolítica dos polipeptídeos descritos neste. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N- ou C- na expressão em diferentes tipos de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos da invenção. Os polipeptídeos codificados por um ácido nucleico obtidos pela mutação natural ou artificial de um ácido nucleico da invenção, conforme descrito daqui em adiante, também são englobados pela invenção.

As variantes de polipeptídeos resultantes de uma fusão de sequências adicionais nas extremidades terminais amina e carboxila também são abrangidas pelos polipeptídeos da invenção. Em particular, tal fusão pode ampliar a expressão dos polipeptídeos, ser útil na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências adicionais de peptídeos podem ser peptídeos sinais, por exemplo. Concordantemente, a presente invenção engloba variantes dos polipeptídeos da invenção, tais como aquelas obtidas pela fusão com outros oligo- ou polipeptídeos e/ou aquelas que estão ligadas a peptídeos sinais. Os polipeptídeos resultantes de uma fusão com outra proteína funcional, tal como outra proteína a partir da trajetória da biossíntese do terpeno, também podem ser vantajosamente usados nos métodos da invenção.

De acordo com outra materialização, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usado em qualquer das materializações acima descritas, ou codificado pelo ácido nucleico usado em qualquer das materializações acima descritas é isolado da Clausena lansium.

Uma importante ferramenta para executar o método da invenção é o próprio polipeptídeo. Um polipeptídeo apresentando uma atividade a-santaleno sintase e compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID NO:1 é, portanto, outro objeto da presente invenção.

De acordo com uma materialização preferida, o polipeptídeo é capaz de produzir a-santaleno como um produto principal. De acordo com uma materialização até mais preferida, ele é capaz de produzir uma mistura de sesquiterpenos onde a- santaleno representa pelo menos 60%, preferencialmente pelo menos 80%, preferencialmente pelo menos 90%, preferencialmente pelo menos 92% dos sesquiterpenos produzidos.

De acordo com uma materialização mais preferida, o polipeptídeo apresenta uma atividade (+)-a-santaleno sintase.

De acordo com uma materialização até mais preferida, o polipeptídeo é capaz de produzir (+)-a-santaleno como um produto principal. De acordo com uma materialização ainda mais preferida, ele é capaz de produzir uma mistura de sesquiterpenos onde (+)-a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos sesquiterpenos produzidos.

De acordo com uma materialização preferida, o polipeptídeo compreende uma sequência de aminoácidos pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, preferivelmente pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:1 De acordo com uma materialização mais preferida, o polipeptídeo compreende a sequência de aminoácido SEQ ID NO:1. De acordo com uma materialização até mais preferida, o polipeptídeo consiste da SEQ ID NO:1.

De acordo com outra materialização preferida, o pelo menos um polipeptídeo compreende uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida por engenharia genética. Em outros termos, o dito polipeptídeo compreende uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2. De acordo com uma materialização mais preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno consiste de uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida pela engenharia genética, isto é, uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.

De acordo com outra materialização, o polipeptídeo é isolado da Clausena lansium.

Conforme usado neste, o polipeptídeo é pretendido como um fragmento de polipeptídeo ou peptídeo que engloba as sequências de aminoácidos identificadas neste, assim como polipeptídeos truncados ou variantes de polipeptídeos, desde que eles mantenham suas atividades conforme definido acima e que compartilhem pelo menos a porcentagem definida de identidade com o fragmento correspondente daSEQIDNO:1.

Exemplos de variantes de polipeptídeos são proteínas que ocorrem naturalmente que resultam de eventos de junção de mRNA alternados ou formam divagem proteolítica dos polipeptídeos descritos nesta. As variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N- ou C- na expressão nos diferentes tipos de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos da invenção. Os polipeptídeos codificados por um ácido nucleico obtido pela mutação natural ou artificial de um ácido nucleico da invenção, conforme descrito daqui em diante, também estão englobados pela invenção.

As variantes de polipeptídeos resultantes de uma fusão de sequências adicionais de peptídeos nas extremidades terminais amina e carboxila também são abrangidas pelos polipeptídeos da invenção. Em particular, tal fusão pode ampliar a expressão dos polipeptídeos, ser útil na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências adicionais de peptídeos podem ser peptídeos sinais, por exemplo. Concordantemente, a presente invenção engloba variantes de polipeptídeos da invenção, tais como aquelas obtidas pela fusão com outros oligo- ou polipeptídeos e/ou aquelas que estão ligadas aos peptídeos sinais. Os polipeptídeos resultantes de uma fusão com outra proteína funcional, tal como outra proteína a partir da trajetória da biossíntese do terpeno, também são englobados pelos polipeptídeos da invenção.

Conforme mencionado acima, o ácido nucleico codificando o polipeptídeo da invenção é uma ferramenta útil para modificar organismos hospedeiros não- humanos ou células, pretendidos para serem usados quando o método for realizado in vivo.

Um ácido nucléíco codificando um polipeptídeo de acordo com qualquer uma das materializações é, portanto, também um objeto da presente invenção.

De acordo com uma materialização preferida, o ácido nucleico compreende uma sequência de nucleotídeos pelo menos 50%, preferivelmente pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:2 ou o complemento desta. De acordo com uma materialização mais preferida, o ácido nucleico compreende a sequência de nucleotídeos SEQ ID NO:2 ou o complemento desta. De acordo com uma materialização até mais preferida, o ácido nucleico consiste da SEQ ID NO:2 ou o complemento desta.

De acordo com outra materialização, o ácido nucleico é isolado da Clausena lansium.

O ácido nucleico da invenção pode ser definido como incluindo polímeros desoxirribonucleotídeos e ribonucleotídeos na forma de fita simples ou dupla (DNA e/ou RNA). Os termos “sequência de nucleotídeos” também deveriam ser entendidos como compreendendo uma molécula polinucleotídea ou uma molécula oligononucleotídea na forma de um fragmento separado ou como um componente de um ácido nucleico maior. Os ácidos nucleicos da invenção também podem englobar certas sequências de nucleotídeos isoladas, incluindo aquelas que são substancialmente livres de material endógeno contaminante. O ácido nucleico da invenção pode ser truncado, desde que ele codifique um polipeptídeo englobado pela presente invenção, conforme descrito acima.

De acordo com uma materialização mais preferida, o pelo menos um ácido nucleico de acordo com qualquer uma das materializações acima compreende uma sequência de nucleotídeos que foi obtida pela modificação da SEQ ID NO:2. Preferivelmente, o dito ácido nucleico consiste de uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.

Os ácidos nucleicos compreendendo uma sequência obtida pela mutação da SEQ ID NO:2 ou complemento desta estão englobados pela invenção, desde que as sequências que eles compreendem compartilhem pelo menos a porcentagem definida de identidade com os fragmentos correspondentes da SEQ ID NO:2 ou com o complemento desta e desde que eles codifiquem um polipeptídeo apresentando uma atividade a-santaleno sintase, conforme definido em qualquer das materializações acima. As mutações podem ser qualquer tipo de mutação destes ácidos nucleicos, tais como mutações pontuais, mutações por deleção, mutações por inserção e/ou mutações frameshift [que interferem no quadro de leitura], Uma variante de ácido nucleico pode ser preparada com o objetivo de adaptar sua sequência de nucleotídeos a um sistema de expressão específico. Por exemplo, sabe-se que sistemas de expressão bacteriana expressam mais eficientemente polipeptídeos se os aminoácidos forem codificados por um códon preferido. Devido à degeneração do código genético, onde mais de um códon pode codificar o mesmo aminoácido, sequências múltiplas de DNA podem codificar para o mesmo polipeptídeo, todas estas sequências de DNA sendo englobadas pela invenção.

Outra importante ferramenta para transformar organismos hospedeiros ou células adequada para executar o método da invenção in vivo é um vetor de expressão compreendendo um ácido nucleico de acordo com qualquer materialização da invenção. Tal vetor é, portanto, também um objeto da presente invenção.

Um “vetor de expressão” conforme usado neste inclui qualquer vetor recombinante linear ou circular, incluindo, mas não se limitando a vetores virais, bacteriófagos e plasmídeos. A pessoa habilitada é capaz de selecionar um vetor adequado de acordo com o sistema de expressão. Em uma materialização, o vetor de expressão inclui o ácido nucleico da invenção operacionalmente ligado com pelo menos uma sequência regulatória, a qual controla transcrição, translação, iniciação e término, tal como um promotor, operador ou amplificador transcricional, ou um local de ligação ribossômica de mRNA e, opcionalmente, incluindo pelo menos um marcador de seleção. As sequências de nucleotídeos estão “operacionalmente ligadas” quando a sequência regulatória se relaciona funcionalmente com o ácido nucleico da invenção.

Os vetores de expressão da presente invenção podem ser usados nos métodos para preparar um organismo hospedeiro geneticamente transformado e/ou célula, em organismos hospedeiros e/ou células ancorando os ácidos nucleicos da invenção e nos métodos para produzir ou fabricar polipeptídeos que apresentam uma atividade a-santaleno sintase, conforme revelado mais abaixo.

Organismos hospedeiros não-humanos recombinantes e células transformadas para ancorarem pelo menos um ácido nucleico da invenção de modo que ele expresse heterologamente ou superexpresse em pelo menos um polipeptídeo da invenção também são muito úteis para executar o método da invenção. Tais organismos hospedeiros não-humanos ou células são, portanto, outro objeto da presente invenção.

Um ácido nucleico de acordo com qualquer das materializações acima descritas pode ser usado para transformar os organismos hospedeiros não- humanos e células, e os polipeptídeos expressos podem ser qualquer dos polipeptídeos acima descritos.

Organismos hospedeiros não-humanos da invenção pode ser qualquer organismo não-humano multicelular ou unicelular. Em uma materialização preferida, o organismo hospedeiro não-humano é uma planta, um procariota ou um fungo. Qualquer planta, procariota ou fungo é adequado para ser transformado de acordo com a presente invenção. Plantas, particularmente úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma materialização mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (nabo), Medicago (alfafa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence a espécies de Nicotiana tabacum.

Em uma materialização mais preferida, o organismo hospedeiro não-humano é um microorganismo. Qualquer microorganismo é adequado para a presente invenção, mas, de acordo com uma materialização até mais preferida, o dito microorganismo é uma bactéria ou levedura. Mais preferivelmente, a dita bactéria é E. colie a dita levedura é Saccharomyces cerevisiae.

Células eucarióticas superiores isoladas também podem ser transformadas, em vez de organismos completos. Como células eucarióticas superiores, queremos dizer aqui qualquer célula eucariótica não-humana, exceto células de leveduras. As células eucarióticas superiores preferidas são células vegetais ou fúngicas.

O termo “transformado” refere-se ao fato de que o hospedeiro foi sujeitado a engenharia genética para compreender uma, duas ou mais cópias de cada um dos ácidos nucleicos necessários em qualquer uma das materializações acima descritas. Preferivelmente, o termo “transformado” se relaciona com os hospedeiros que heterologamente expressam os polipeptídeos codificados pelo ácido nucleico com os quais eles são transformados, bem como superexpressam os ditos polipeptídeos. Concordantemente, em uma materialização, a presente invenção fornece um organismo transformado, no qual os polipeptídeos são expressos em quantidade maior que no mesmo organismo não transformado assim.

Há vários métodos conhecidos na arte para a criação dos organismos hospedeiros transgênicos ou células tais como plantas, fungos, procariotas ou culturas de células eucarióticas superiores. Vetores apropriados de clonagem e expressão para uso com hospedeiros celulares bacterianos, fúngicos, de leveduras, vegetais e de mamíferos são descritos, por exemplo, em Pouwels et al., Cloning Vectors: A Laboratory Manual, 1985, Elsevier, New York and Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd edition, 1989, Cold Spring Harbor Laboratory Press. Vetores de clonagem e expressão para vegetais superiores e/ou células vegetais em particular estão disponíveis para a pessoa habilitada. Consultar para exemplo, Schardl et al. Gene 61:1-11, 1987.

Métodos para transformar organismos hospedeiros ou células para ancorar ácidos nucleicos transgênicos são familiares para a pessoa habilitada. Para a criação de plantas transgênicas, por exemplo, os métodos atuais incluem: eletroporação dos protoplastos da planta, transformação mediada por lipossomos, transformação mediada por Agrobacterium, transformação mediada por polietilenoglicol, bombardeamento de partículas, microinjeção de células de plantas e transformação usando vírus.

Em uma materialização, o DNA transformado é integrado em um cromossomo de um organismo hospedeiro não-humano e/ou célula de modo que resulte um sistema recombinante estável. Qualquer método de integração cromossômica conhecido na arte pode ser usado na prática da invenção, incluindo, mas não se limitando à troca de cassette mediada por recombinase (RMCE), inserção cromossômica virai específica do local, adenovirus e injeção pronuclear.

Com o objetivo de executar o método para produzir α-santaleno in vitro, conforme exposto neste acima, é muito vantajoso fornecer um método de fabricar pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase conforme descrito em qualquer materialização da invenção. Portanto, a invenção fornece um método para produzir pelo menos um polipeptídeo de acordo com qualquer materialização da invenção compreendendo a) cultivar um organismo hospedeiro não-humano ou célula transformada com o vetor de expressão da invenção, de modo que ancore um ácido nucleico de acordo com a invenção e expresse ou superexpresse um polipeptídeo da invenção; b) isolar o polipeptídeo de um organismo hospedeiro não-humano ou célula cultivada na etapa a).

De acordo com uma materialização preferida, o dito método ainda compreende, antes da etapa a), transformar um organismo não-humano hospedeiro ou célula com o vetor de expressão da invenção, de modo que ancore um ácido nucleico de acordo com a invenção e expresse ou superexpresse o polipeptídeo da invenção.

Um ácido nucleico de acordo com qualquer das materializações acima descritas pode ser usado.

A transformação e o cultivo do organismo hospedeiro não-humano ou célula podem ser realizados conforme descrito para o método de produzir α-santaleno in vivo. A etapa b) pode ser realizada usando qualquer técnica bem conhecida na arte para isolar um polipeptídeo particular de um organismo ou célula.

Uma “variante de polipeptídeo” conforme referido neste significa um polipeptídeo apresentando uma atividade a-santaleno sintase e sendo substancialmente homólogo ao polipeptídeo de acordo com qualquer das materializações acima, mas apresentando uma sequência de aminoácidos diferente daquele codificada por qualquer das sequências de ácidos nucleicos da invenção, devido a uma ou mais deleções, inserções ou substituições.

As variantes podem compreender sequências conservativamente substituídas, significando que um dado resíduo de aminoácido é substituído por um resíduo apresentando características fisioquímicas similares. Exemplos de substituições conservatives incluem a substituição de um resíduo alifático por outro, tal como lie, Vai, Leu ou Ala por outro, ou substituições de um resíduo polar por outro, tal como entre Lys e Arg; Glu e Asp; ou Gin e Asn. Consultar Zubay, Biochemistry, 1983, Addison-Wesley Pub. Co. Os efeitos de tais substituições podem ser calculados usando matrizes de pontuação de substituição tais como uma PAM-120, PAM-200, e PAM-250 conforme discutido no Altschul, J. Mol. Biol., 1991, 219, 555-565. Outras tais substituições conservatives, por exemplo, substituições de regiões inteiras, apresentado características de hidrofobicidade, são bem conhecidas.

Variantes de peptídios ocorrendo naturalmente também são englobadas pela invenção. Exemplos de tais variantes são proteínas que resultam de eventos de junção alternada do mRNA ou de divagem proteolítica dos polipeptídeos descrita neste. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N- ou C- na expressão em diferentes tipos de células hospedeiras devido à remoção proteolítica de um ou mais aminoácidos terminais de polipeptídeos codificados pelas sequências da invenção.

Variantes dos polipeptídeos da invenção podem ser usadas para alcançar, por exemplo, atividade enzimática desejada ampliada ou reduzida, regioquímica ou estereoquímica modificada, ou utilização de substrato ou distribuição de produto alteradas, afinidade aumentada para o substrato, especificidade melhorada para a produção de um ou mais compostos desejados, velocidade aumentada da reação enzimática, atividade ou estabilidade mais alta em um ambiente específico (pH, temperatura, solvente etc.), ou nível de expressão melhorado em um sistema de expressão desejado. Uma variante ou mutante dirigido pelo local pode ser fabricado por qualquer método conhecido na arte. As variantes e derivados de polipeptídeos nativos podem ser obtidos isolando variantes que ocorrem naturalmente, ou a sequência de nucleotídeos das variantes, de outras ou das mesmas linhagens ou espécies de plantas, ou artificialmente programando mutações de sequências de nucleotídeos codificando para os polipeptídeos da invenção. Alterações da sequência de aminoácidos nativa podem ser realizadas através de qualquer de diversos métodos convencionais.

Variantes de polipeptídeos resultantes de uma fusão de sequências adicionais de peptídeos nas extremidades terminais amina e carboxila dos polipeptídeos da invenção podem ser usadas para ampliar a expressão dos polipeptídeos, serem úteis na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências adicionais de peptídeos podem ser peptídeos sinal, por exemplo. Concordantemente, a presente invenção engloba variantes dos polipeptídeos da invenção, tais como aqueles obtidos pela fusão com oligo- ou polipeptídeos e/ou aqueles que estão ligados aos peptídeos sinal. O polipeptídeo de fusão abrangido pela invenção também compreende polipeptídeos de fusão resultantes de uma fusão de outras proteínas funcionais, tais como outras proteínas a partir da trajetória da biossíntese do terpeno.

Portanto, em uma materialização, a presente invenção fornece um método para preparar uma variante de polipeptídeo apresentando uma atividade a- santaleno sintase, conforme descrito em qualquer das materializações acima, e compreende as etapas de: (a) selecionar um ácido nucleico de acordo com qualquer das materializações expostas acima; (b) modificar o ácido nucleico selecionado para obter pelo menos um ácido nucleico mutante: (c) transformar células hospedeiras ou organismos unicelulares com a sequência de ácidos nucleicos mutantes para expressar um polipeptídeo codificado pela sequência de ácidos nucleicos mutantes; (d) selecionar o polipeptídeo quanto a pelo menos uma propriedade modificada; e, (e) opcionalmente, se o polipeptídeo não apresentar nenhuma variante desejada de atividade a-santaleno sintase, repetindo as etapas do processo (a) até (d) até um polipeptídeo com uma variante desejada de atividade a-santaleno sintase ser obtido; (f) opcionalmente, se um polipeptídeo apresentando uma variante desejada de atividade a-santaleno sintase foi identificado na etapa d), isolar o ácido nucleico mutante correspondente obtido na etapa (c)

De acordo com uma materialização preferida, a variante de polipeptídeo preparada é capaz de produzir a-santaleno como um produto principal. De acordo com uma materialização até mais preferida, ela é capaz de produzir uma mistura de sesquiterpenos onde o a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos sesquiterpenos produzidos.

De acordo com uma materialização mais preferida, a variante de polipeptídeo preparada apresenta uma atividade (+)-a-santaleno sintase.

De acordo com uma materialização até mais preferida, a variante de polipeptídeo preparada é capaz de produzir (+)-a-santaleno sintase como um produto principal. De acordo com uma materialização até mais preferida, ela é capaz de produzir uma mistura de sesquiterpenos onde o (+)-a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos sesquiterpenos produzidos.

Na etapa (b), um grande número de sequências de ácidos nucleicos mutantes pode ser criado, por exemplo, através de mutagênese randômica, mutagênese específica do local, ou embaralhamento de DNA. Os procedimentos detalhados de embaralhamento do gene são encontrados em Stemmer, DNA shuffling by random fragmentation and reassembly: in vitro recombination for molecular evolution. Proc Natl Acad Sci U S A., 1994, 91(22): 10747-1075. Brevemente, embaralhamento de DNA refere-se a um processo de recombinação randômica de sequências conhecidas in vitro, envolvendo pelo menos dois ácidos nucleicos selecionados para recombinação. Por exemplo, mutações podem ser introduzidas em loci particulares sintetizando oligonucleotídeos contendo uma sequência mutante, flanqueados por locais de restrição permitindo a ligação com fragmentos da sequência nativa. Em seguida à ligação, a sequência reconstruída resultante codifica um análogo apresentando a inserção, substituição ou deleção de aminoácidos desejada. Alternativamente, procedimentos de mutagênese específica do local dirigida por oligonucleotídeo podem ser empregados para fornecer um gene alterado onde códons predeterminados podem ser alterados por substituição, deleção ou inserção.

Concordantemente, o polipeptídeo compreendendo a SEQ ID NO:1 pode ser recombinado com outra sesquiterpeno sintase codificando ácidos nucleicos, por exemplo, isolados de um organismo outro que não seja Clausena lansium. Assim, os ácidos nucleicos mutantes podem ser obtidos e separados, os quais podem ser usados para transformar uma célula hospedeira de acordo com procedimentos padrão, por exemplo, tal como revelado nos exemplos presentes.

Na etapa (d), o polipeptídeo obtido na etapa (c) é selecionado quanto a pelo menos uma propriedade modificada, por exemplo, uma atividade enzimática modificada desejada. Exemplos de atividades enzimáticas desejadas, para as quais um polipeptídeo expresso pode ser selecionado, incluem atividade enzimática ampliada ou reduzida, conforme medido pelo valor KM ou Vmax, regioquímica ou estereoquímica modificada e utilização de substrato ou distribuição de produto alterada. A seleção da atividade enzimática pode ser realizada de acordo com procedimentos familiares à pessoa habilitada e aqueles revelados nos exemplos presentes.

A etapa (e) fornece a repetição das etapas de processo (a)-(d), as quais podem preferivelmente ser realizadas em paralelo. Concordantemente, criando um número significativo de ácidos nucleicos mutantes, muitas células hospedeiras podem ser transformadas com diferentes ácidos nucleicos mutantes ao mesmo tempo, permitindo a seleção subsequente de um número elevado de polipeptídeos. As chances de obter uma variante desejada de polipeptídeo podem assim ser aumentadas a critério da pessoa habilitada.

Todas as publicações mencionadas nesta aplicação estão incorporadas através de referência para revelar e descrever os métodos e/ou materiais em conexão com os quais as publicações são citadas.

Descrição dos desenhos

Figura 1: Sequências de aminoácidos deduzidas dos fragmentos de sesquiterpeno sintase obtidos do sequenciamento da biblioteca de C. lansium e alinhadas com a sequência de aminoácidos de sesquiterpeno sintase com o NCBI acess No. AAK54279.

Figura 2: Comparação dos perfis de produto obtidos a partir do E.E-FPP com as proteínas recombinantes Cont2-1, Cont2B_22, Cont2B_26 e Cont2B_29. As análises foram realizadas através de GC-MS e os cromatogramas iônicos totais são apresentados.

Figura 3: Identificação do a-santaleno pela comparação do espectro de massa a partir do pico no tempo de retenção de 12,63 minutos com o espectro de massa de um padrão autêntico de a-santaleno.

Materializações específicas da invenção ou Exemplos

A invenção será agora descrita em mais detalhes por meio dos Exemplos a seguir.

Exemplo 1 Material vegetal e construção de biblioteca de cDNA

Sementes de Clausena lansium (vampi) foram obtidas de fazendeiros localizados na província de Hainan na China e, particularmente, na cidade de FuShan (Município de ChengMai) e na cidade de Yongxing (Cidade de Haikou). As sementes foram germinadas e as plantas cultivadas em uma estufa.

Folhas jovens (1 a 2 cm de comprimento) foram coletadas e usadas para a construção de uma biblioteca de cDNA. O RNA total foi extraído das folhas usando o Reagente de RNA Vegetal Concerta da Invitrogen (Carlsbad, CA) e o mRNA foi purificado através de cromatografia de afinidade com oligodT-celulose usando o Kit de isolamento de mRNA FastTrack0 2.0 (Invitrogen, Carlsbad, CA) de acordo com as instruções do fabricante. Uma biblioteca de cDNA foi construída a partir deste mRNA e usando o Kit de Amplificação de cDNA Marathon□ (Clontech, Mountain View, CA).

Exemplo 2 Seqüenciamento massivamente paralelo da biblioteca de cDNA da folha de C. lansium

Usamos a tecnologia do sequenciamento paralelo massivo de pequenos fragmentos de DNA desenvolvida pela Illumina (San Diego, California) para obter informações da sequência de toda a biblioteca de cDNA feita a partir de folhas pequenas de vampi. Esta técnica de sequenciamento usa uma química de sequenciamento baseada em terminador reversível e os aparelhos Cluster Station e Genome Sequencer desenvolvidos por Solexa e Illumina (www.illumina.com).

A biblioteca de cDNA (1 üg) foi primeiramente carregada em um gel agarose e as faixas correspondentes a um tamanho entre 1,5 e 3 Kb foram extirpadas, diluídas e usadas para o sequenciamento. Este enriquecimento do tamanho evita a diluição da biblioteca por alguns cDNAs que codificam para proteínas envolvidas no metabolismo primário (tais como, por exemplo, a ribulose-1,5-bifosfato carboxilase) que estão frequentemente presentes em elevada proporção na biblioteca feita a partir de tecidos vegetais e, especialmente, tecidos verdes. Os cDNAs alvos, que codificam para sesquiterpeno sintases, tipicamente têm tamanho entre 1,8 e 2,5 Kb e são, portanto, incluídos na biblioteca de tamanho enriquecido.

A tecnologia e equipamentos da Ilumina foram preparados na Fastens SA (Genebra, Suíça) e a preparação da amostra de DNA e o sequenciamento foram realizados pela Fastens SA. A biblioteca de cDNA foi tratada usando-se o Genomic Sample Prep Kit (Illumina). Resumidamente, o DNA é fragmentado por nebulização, as extremidades são reparadas para gerar extremidades embotadas, adaptadores são ligados às extremidades dos fragmentos de DNA e os fragmentos de DNA modificados pelos adaptadores são amplificados por PCR. Após controlar a qualidade da biblioteca através de eletroforese em gel, a geração dos clusters de DNA na célula de fluxo e a reação de sequenciamento são realizadas nos equipamentos Cluster Station e Genome Sequencer. Usando esta tecnologia, 1,9 milhões de sequências curtas (reads) de pelo menos 35 bases foram obtidas.

O software Edena (Dr David Hernandez, Genomic Research Laboratory [Laboratório de Pesquisa Genômica], University of Geneva Hospitals, Genebra, Suíça, resultado não publicado) foi usado para re-montar sequências contíguas. As cinco últimas bases foram primeiramente removidas de cada read por causa de possíveis más incorporações devido à fidelidade mais baixa nos últimos ciclos do procedimento de sequenciamento. Diversos conjuntos de contigs (sequências contíguas) foram gerados. Para cada conjunto, os contigs de comprimento mínimo de 50 bases foram retidos. Primeiro, os parâmetros do software foram ajustados para permitir a montagem com sobreposição mínima de 25 bases e identidade estrita (100%) ou não-estrita (falta de combinação de 2 bases). Dois conjuntos de 3634 e 3756 contigs, respectivamente, foram assim gerados. Outro conjunto de 4540 contigs foi gerado permitindo a montagem com uma sobreposição mínima de 18 bases e não-estrita. As sequências dos contigs foram usadas para buscar homologia com as terpeno sintases em bancos de dados de proteínas disponíveis publicamente usando o algoritmo Blastx (Altschul et al, J. Mol. Biol. 215, 403-410, 1990; http://www.ncbi.nlm.nih.gov/blast/Blast.cgi). Dos três conjuntos de contigs, 14, 15 e 14 contigs foram selecionados. Através da análise das sequências obtidas da biblioteca de cDNA de Clausena lansium, uma forte homologia de sequência foi observada com sequências de espécies cítricas, uma observação consistente com a relação filogenética de Clausena lansium e das espécies de Citrus (ambas pertencentes à família Rutaceae). Assim, o software Eland (Illumina) foi usado para buscar as reads para identidade da sequência de DNA com as sesquiterpeno sintases a partir de cítricos (NCBI Accession No. CQ813507, CQ813505, CQ813508, CQ813506). Desta análise, 117 reads foram selecionadas.

Os contigs e reads selecionados foram, depois, processados usando o programa CAP (Huang, Genomics 14(1), 18-25, 1992) e novos contigs foram gerados. Após a confirmação da homologia da sequência com as sesquiterpeno sintases, 17 contigs de comprimento 30 a 436 bases foram retidos (ver SEQ ID NO:3 a 19). As sequências deduzidas foram alinhadas com uma sequência de sesquiterpeno sintase de cítrico (a beta-farneseno sintase de C. junos, NCBI access No. AAK54279) de modo a mapear sua posição relativa ao longo de uma sequência de comprimento total de sesquiterpeno sintase e avaliar o número de cDNAs de sesquiterpeno diferentes presente (Figura 1). Um conjunto de oligonucleotídeos específico foi desenhado a partir de 6 dos 19 contigs supostamente surgindo de cDNAs de sesquiterpeno sintases distintos.

Exemplo 3 Amplificação de cDNAs de comprimento total de sesquiterpeno sintases

Os primers específicos de sesquiterpeno sintases deduzidos a partir do sequenciamento massivamente paralelo (Exemplo 2) foram usados em combinação com os primers de adaptador de cDNA em amplificações PCR do tipo 375’RACE. As amplificações foram realizadas usando a biblioteca de cDNA de C. lansium, preparada conforme descrito acima no Exemplo 1, e o Advantage® 2 Polymerase Mix (Clontech) em seguida ao protocolo do Kit de Amplificação de cDNA Marathon□ (Clontech, Mountain View, CA). As condições térmicas de Ciclagem foram conforme segue: 1 min a 94°C, 32 ciclos de 1 min a 94°C e 3 min a 68°C, e 3 min a 68°C.

Usando o primer FS2_cont2_F1 (SEQ ID NQ:20), uma sequência de DNA de 1049 bp foi obtida. A análise das sequências de diversos clones obtidos a partir desta amplificação mostrou que duas variantes de sequência estavam presentes (Cont2_RACE_F1 (SEQ ID NO:23) e Cont2_RACE_F2 (SEQ ID NO:25)) com 96% são identidade da sequência. Cada uma das duas sequências correspondia à extremidade 3’de um cDNA de sesquiterpeno sintase e continha uma região de codificação de 735 bp. As duas sequências de aminoácidos deduzidas (SEQ ID NO:24 e 26) apresentavam 92% de identidade da sequência uma da outra. Com o primer FS2_cont2_R1 (SEQ ID NO:21), um fragmento de 1101 bp (Cont2_RACE_R, SEQ ID NO:27)) foi amplificado contendo o códon de partida e codificando para os 349 aminoácidos N-terminais do sesquiterpeno correspondentes ao contig2. O alinhamento das duas sequências a partir da 3’RACE (Cont2_RACE_F1 e Cont2_RACE_F2, SEQ ID NO:23 e 25) com a sequência a partir da 5’RACE (cont2_RACE_R, SEQ ID NO:27) apresentava uma sobreposição de 132 bases. Nesta região de sobreposição, uma vez que as sequências Cont2_RACE_F2 e Cont2_RACE_R (SEQ ID NO:25 e 27) eram aproximadamente idênticas (diferença de uma única base) enquanto que diferenças de 9 bases foram observadas entre as sequências Cont2_RACE_F1 e Cont2_RACE_R (SEQ ID NO:23 e 27). Assim, as sequências Cont2_RACE_F2 (SEQ ID NO:25) e Cont2_RACE_R (SEQ ID NO:27) foram usadas para reconstituir uma sequência de cDNA de comprimento total (Cont2_RACE_1, SEQ ID NO:28) codificando para uma proteína de 551 aminoácidos (SEQ ID NO:29).

Com o primer FS2_Cont10_F (SEQ ID NO:22) duas sequências de 1342 bp (Cont10_RACE_Fa e Cont10_RACE_Fb, SEQ ID NO: 30 e 31) foram obtidas apresentando diferenças significativas (67 bp, representando 95% de identidade da sequência de DNA) e sugerindo a presença de dois cDNAs de sesquiterpeno sintase intimamente relacionados. As duas sequências continham uma região de codificação de 1135 bp. É interessante que a sequência de Cont10_RACE_Fa (SEQ ID NO:30) era 99,9% idêntica à sequência de Cont2_RACE_F2 (SEQ ID NO:25, diferença de apenas 1 base no alinhamento de 1 Kb) e a sequência de Cont10_RACE_Fb (SEQ ID NO:31) era 99% idêntica à sequência de Cont2_RACE_F1 (SEQ ID NO:23, diferença de apenas 8 bases no alinhamento de 1 Kb), assim sugerindo que os fragmentos de DNA amplificados com os primers Cont2 e ContIO permitiram amplificações a partir de duas sequências relacionadas sem nenhuma discriminação real. Dois primers (Cont2_start (SEQ ID NO:32) e Cont2_stop (SEQ ID NO:33)), os quais são específicos das regiões dos códons de partida e de parada das sequências a partir da 5’RACE e da 3’RACE dos fragmentos cont2 e contIO, foram desenhados de modo a amplificar simultaneamente os dois ou mais cDNAs de comprimento total correspondentes. O primer Cont2_start (SEQ ID NO:32) foi estendido com a sequência CACC para permitira inserção direta no plasmídeo pET101/D-TQPO (Invitrogen). A amplificação foi primeiramente realizada usando o Advantage 2 Polymerase Mix (Clontech). Cada mistura PCR continha, em um volume total de 50 DL, 5 DL de Advantage 2 PCR Buffer, 200 üM de dNTPs, 200 nM de cada primer oligonucleotídeo, 5 üL de cDNA diluído 100 vezes e 1 üL de Advantage 2 Polymerase Mix. As condições térmicas de ciclagem eram conforme segue: 2 min a 95°C; 35 ciclos de 30 seg a 95°C, 30 seg a 60°C e 4 min a 72°C; e 10 min a 72°C. Uma segunda rodada de amplificação foi realizada usando 5 Dl do produto de PCR purificado a partir da primeira rodada de amplificação e usando a DNA polimerase Pfu (Promega), em um volume final de 50 □! contendo 5ül de tampão 10X de DNA polimerase Pfu, 200 üM de cada dNTP, 0,4 üM de cada primer forward e reverse, 2,9 unidades de DNA polimerase Pfu. As condições térmicas de ciclagem eram idênticas às condições usadas na primeira rodada. Os produtos de PCR purificados eram ligados no vetor pET1001/D-TOPO seguindo as instruções do fabricante (Invitrogen). Diversos clones foram selecionados e após o sequenciamento do inserto, algumas variações nas sequências foram observadas. Os seguintes clones foram selecionados: Cont2- 1 (SEQ ID NO:2), Cont2B_22 (SEQ ID NO:38), Cont2B_26 (SEQ ID NO:39) e Cont2B_29 (SEQ ID NO:40). As sequências das proteínas codificadas por estes clones são fornecidas na SEQ ID NO:1 e 41 a 43, respectivamente.

Exemplo 4 Expressão heteróloga e atividades enzimáticas das sesquiterpeno sintases recombinantes.

Os plasmídeos pET101 com Cont2_1 (SEQ ID NO:2), Cont2B_22 (SEQ ID NO:38), Cont2B_26 (SEQ ID NO:39) e Cont2B_29 (SEQ ID NO:40) preparados conforme descrito no Exemplo 3 foram transformados em células de E. Coli BI21(DE3). Colônias isoladas de células transformadas foram usadas para inocular 5 ml de meio LB. Após 5 a 6 horas de incubação a 37°C, a cultura foi transferida para uma incubadora a 20°C e deixada 1 hora para equilibar. A expressão da proteína foi, então, induzida através da adição de 1 mM de IPTG e a cultura foi incubada durante toda a noite a 20°C. No dia seguinte, as células foram coletadas por centrifugação, ressuspendidas em 0,1 volume de 50 mM de MOPSO pH 7, 10% de glicerol, 1 mM de DTT e lisadas por sonicação. O extrato foi clarificado por centrifugação (30 min a 20.000 g), e o sobrenadante contendo a proteína solúvel foi usado para experimentos posteriores.

O extrato de proteína cru foi usado para avaliar a atividade enzimática. O ensaio enzimático foi realizado em um tubo de vidro selado com Teflon usando 50 a 10Oμl de extrato de proteína em um volume final de 1 ml_ de 50 mM de MOPSO pH 7, 10% de glicerol suplementado com 1 mM de DTT, 20 mM de MgCI2 e 50 a 200 DM de difosfato de E,E-farnesila purificado (FPP) (preparado conforme descrito por Keller e Thompson, J. Chromatogr 645(1), 161-167, 1993). O tubo foi incubado 18 a 24 horas a 30°C e os produtos enzimáticos foram extraídos duas vezes com um volume de pentano. Após concentração sob fluxo de nitrogênio, o extrato foi analisado através de GC e a identidade dos produtos foi confirmada por GC-MS com base na concordância dos índices de retenção e espectros de massa de padrões autênticos. A análise de GC-MS foi realizada em um sistema de GC Hewlett-Packard 6890 Series equipado com detector de ionização de chama usando uma coluna capilar com diâmetro interno de 0,25 mm por 30 m SPB-1 (Supelco, Bellefonte, PA). O gás transportador era He a um fluxo constante de 1,5 mL/min. A temperatura inicial da estufa era 80°C seguida por um gradiente de 10°C/min até 280°C. Os espectros foram registrados a 70eV com uma voltagem multiplicadora de elétrons de 2200V.

O ensaio revelou a formação de (+)-a-santaleno como um produto principal (92,7% dos sesquiterpenos totais produzidos) e quantidades traços de cinco sesquiterpenos adicionais respondendo por 4,8 a 0,95% dos produtos enzimáticos. O (+)-a-santaleno foi identificado com análise de GC-MS através de coincidência do espectro de massa e do índice de retenção com valores publicados (Joulain, D., e Kõnig, W.A. The Atlas of Spectral Data of Sesquiterpene Hydrocarbons, EB Verlag, Hamburg, 1998). A identificação do (+)-α-santaleno foi ainda confirmada através de 1H NMR, 13C NMR e pela medição da rotação ótica. Para produzir quantidades suficientes para estas medições, o ensaio enzimático descrito acima foi escalonado até 1 L. Os produtos enzimáticos foram extraídos com volume igual de pentano, concentrados e a fração de hidrocarbonetos de sesquiterpeno (5,5 mg) purificada através de filtração em uma coluna curta de sílica. Os dados espectrais obtidos com Cont2_1 são fornecidos na Figura 2.

O espectro de NMR foi registrado em um espectrômetro Bruker-Avance-500. Os dados de NMR são os seguintes : 1H NMR (500,13 MHz, CDCI3): 0,82 (s, 2H), 0,83 (s, 3H), 0,99 (s, 3H), 1,00-1,08 (m, 2H), 1,08-1,26 (m, 2H), 1,57-1,63 (m, 6H), 1,68 (s, 3H), 5,12 (t x q, J= 7,2, 1,4 Hz, 1H) 13C NMR (125,76 MHz, CDCI3): 10,7 (q), 17,5 (q), 19,6 (d), 23,3 (t), 25,7 (q), 27,4 (s), 31,0 (t), 31,5 (t), 34,6 (t), 38,2 (d), 45,9 (s), 125,5 (d), 130,8 (s); O fato de que o estereoisômero (+)-a-santaleno fora produzido foi evidenciado medindo a rotação ótica (conforme medido em um polarímetro Perkin- r ,20 elmer241): MD = +12,0 (C = 0,3, CHCI3).

Exemplo 5 Produção in vivo de (+)-g-santaleno em E. coli

O uso da santaleno sintase de C. lansium para a produção in vivo de sesquiterpenos em células de E. coli foi avaliado co-exprimindo a sesquiterpeno sintase com uma FPP sintase e as enzimas de uma trajetória biossintética de quatro etapas que permite a conversão de mevalonato em FPP. Os genes da trajetória de mevalonato foram organizados em um único operon e codificados para uma mevalonato kinase (mvaK1), uma fosfomevalonato kinase (mvaK2), uma mevalonato difosfato decarboxilase (MvaD) e uma isopentenil difosfato isomerase (idi), todas as enzimas que convertem mevalonato exógeno em isopentenil difosfato (IPP) e dimetilalil difosfato (DMAPP), os dois substratos da FPP sintase. A co- expressão da trajetória parcial do mevalonato foi usada para aumentar a quantidade de FPP intracelular disponível para a sesquiterpeno sintase e, portanto, as quantidades de sesquiterpeno produzidas.

O gene de levedura FPP sintase (Accession number J05091) foi amplificado a partir de DNA genômico de S. cerevisiae usando os primers FPPy_Ncol (SEQ ID NO:34) e FPPy-Eco (SEQ ID NO:35). O DNA genômico foi isolado a partir de S. cerevisiae usando o Qiagen RNA/DNA Maxi Kit (Qiagen AG, Basel, Suiça). A PCR foi realizada com a DNA polimerase Pfu (Promega AG, Dubendorf, Suiça) em urn volume final de 50 μl contendo 0,4 μl de cada primer, 200 μM de dNTPs, 0,5 μl de DNA polimerase 5 μl de DNA genômico de S. cerevisiae. A condição de ciclagem da PCR foi conforme segue: 90 seg a 95°C; 28 ciclos de 45 seg a 95°C, 30 seg a 54°C e 4 min a 72°C; 10 min a 72°C. O DNA amplificado foi ligado como fragmento de Ndel-EcoRI no primeiro local de multiclonagem (MCS1) do plasmídeo pACYCDuet-1 (Novagen, Madison, Wl) fazendo o plasmídeo pACYCDuet-FPPs ancorar o gene de FPPs sob o controle de um promotor de T7.

Um operon contendo os genes que codificam para mvaK1, mvaK2, MvaD e idi foi amplificado a partir do DNA genômico de Streptococcus pneumoniae (ATCC BAA-334, LGC Standards, Molsheim, France) com os primers MVA-up1-start (SEQ ID NO:36) e MVA-up2-stop (SEQ ID NO:37). A PCR foi realizada usando a DNA polimerase PfuUltra™ II Fusion HS (Stratagene, Agilent Technologies Inc., Santa Clara, CA, USA). A composição da mescla da PCR foi de acordo com as instruções do fabricante. As condições térmicas da ciclagem foram 2 min a 95°C; 30 ciclos de 20 seg a 95°C, 20 seg a 58°C e 90 seg a 72°C; e 3 min a 72°C. O fragmento de 3,8 Kb foi purificado em gel agarose e ligado usando o In-Fusion™ Dry-Down PCR Cloning Kit (Clontech Laboratories) para o segundo MCS do pACYCDuet-FPPs plasmídeo digerido com Nde\ e Xho\ fornecendo o plasmídeo pACYCDuet-4506. As sequências dos dois insertos foram completamente sequenciadas para excluir qualquer mutação.

Células de E. coli BL21 Star™(DE3) (Invitrogen, Carlsbad, CA) foram transformadas com os plasmídeos pET101-cont2_1 (SEQ ID NO:2) preparados conforme descrito no Exemplo 3 e com o plasmídeo pACYCDuet-4506. As células transformadas foram selecionadas em placas de LB-agarose de carbenicilina (50 μg/ml) e cloranfenicol (34 μg/ml). Colônias isoladas foram usadas para inocular 5 ml_ de meio LB líquido suplementado com os mesmos antibióticos. A cultura foi incubada durante toda a noite a 37°C. No dia seguinte, 2 ml_ de meio TB suplementado com os mesmos antibióticos foram inoculados com 0,2 ml_ da cultura feita durante a noite. Após 6 horas de incubação a 37°C, a cultura foi resfriada até 28°C e 1 mM de IPTG, 2 mg/mL de mevalonato (preparado dissolvendo mevalonolactona (Sigma) em 0,5N de NaOH em uma concentração de 1 g/mL e incubando a solução por 30 min a 37°C) e 0,2 ml de decano foram adicionados a cada tubo. As culturas foram incubadas por 48 horas a 28°C. As culturas foram, depois, extraídas duas vezes com 2 volumes de acetato de etila, a fase orgânica foi concentrada para 500 μL e analisada através de GC-MS conforme descrito acima no Exemplo 4. Nestas condições, as células produziram (+)-cr-santaleno na cultura de 250 mg/L em 48 horas.

Este exemplo mostra que uma célula de E. coli transformada com uma a- santaleno sintase, conforme definido na presente invenção, é capaz de produzir a- santaleno. As outras enzimas com as quais a célula de E. coli é transformada não são essenciais para a produção de a-santaleno. Na verdade, o a-santaleno também é produzido quando uma célula de E. coli é transformada com a a-santaleno sintase somente, mas em menores quantidades. As outras enzimas com as quais a célula de E. coli é transformada são adicionadas com o único propósito de aumentar a quantidade de precursor disponível para a a-santaleno sintase.

Claims

1. MÉTODO PARA PRODUZIR α-SANTALENO ISOLADO, CARACTERIZADO por compreender: a) contatar pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio expresso de forma heteróloga possuindo uma atividade de α-santaleno sintase e compreendendo uma sequência de aminoácidos; b) recuperar o α-santaleno produzido no passo a).

2. MÉTODO PARA PRODUZIR α-SANTALENO ISOLADO, CARACTERIZADO por compreender: a) cultivar um organismo hospedeiro não humano ou célula capaz de produzir pirofosfato de farnesilo (FPP) e transformada para expressar pelo menos um polipeptídio compreendendo uma sequência de aminoácido e tendo uma atividade de α-santaleno sintase, sob condições conducentes à produção de α-santaleno, e contatar o pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio para produzir α-santaleno; e b) recuperar o α-santaleno produzido no passo a).

3. MÉTODO, de acordo com a reivindicação 2, CARACTERIZADO pelo método compreender ainda, antes do passo a), transformar um organismo hospedeiro ou célula não-humana capaz de produzir pirofosfato de farnesilo (FPP) com pelo menos um ácido nucleico codificando um polipeptídio compreendendo uma sequência de aminoácidos e tendo uma atividade de α-santaleno sintase, de modo a que o referido organismo expresse o referido polipeptídio.

4. MÉTODO PARA PRODUZIR α-SANTALENO ISOLADO, CARACTERIZADO por compreender: a) contatar pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio possuindo uma atividade de α-santaleno sintase e compreendendo uma sequência de aminoácidos compreendendo a cultura de um organismo hospedeiro não humano ou célula capaz de produzir FPP e transformado para expressar o dito pelo menos um polipeptídio, sob condições conducentes à produção de α-santaleno, e b) recuperar o α-santaleno produzido no passo a), em que o método compreende ainda, antes do passo a), transformar um organismo hospedeiro não humano ou célula capaz de produzir pirofosfato de farnesilo (FPP) com pelo menos um ácido nucleico codificando o referido pelo menos um polipeptídio, de modo que o referido organismo expressa o referido pelo menos um polipeptídio.

5. MÉTODO, de acordo com a reivindicação 2, CARACTERIZADO pelo organismo hospedeiro não humano ser uma planta, um procariota ou um fungo e em que a célula hospedeira não humana é uma planta ou uma célula fúngica.

6. MÉTODO PARA PRODUZIR A-SANTALENO ISOLADO OU UMA MISTURA DE SESQUITERPENOS, CARACTERIZADO por compreender: a) contatar o pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio expresso heterologamente possuindo uma atividade de α-santaleno sintase e compreendendo uma sequência de aminoácidos; e b) recuperar o α-santaleno produzido no passo a); em que α-santaleno ou (+)-α- santaleno é o produto principal ou em que α-santaleno ou (+)-α-santaleno representa pelo menos 60%, pelo menos 80%, ou pelo menos 90%, dos sesquiterpenos obtido.

7. MÉTODO, de acordo com a reivindicação 1, CARACTERIZADO por pelo menos um polipeptídio consistir em SEQ ID NO: 1.

8. MÉTODO, de acordo com a reivindicação 1, CARACTERIZADO pelo polipeptídio compreender a sequencia de aminoácidos SEQ ID NO: 1.

9. MICROORGANISMO TRANSGENICO PARA ABRIGAR PELO MENOS UM ÁCIDO NUCLEICO, CARACTERIZADO por expressar ou superexpressar heterologamente pelo menos um polipeptídio tendo uma atividade de α-santaleno sintase ou uma atividade de (+)-α-santaleno sintase e compreendendo uma sequência de aminoácidos.

10. MICROORGANISMO TRANSGENICO, de acordo com a reivindicação 9, CARACTERIZADO pelo organismo hospedeiro não humano ser uma planta, um procariota ou um fungo e em que a célula hospedeira não humana é uma planta ou uma célula fúngica.

11. MÉTODO PARA PRODUZIR PELO MENOS UM POLIPEPTÍDIO, CARACTERIZADO por compreender: a) cultivar um organismo hospedeiro não humano ou célula transformada com um vetor de expressão compreendendo um ácido nucleico codificando um polipeptídio possuindo uma atividade de α-santaleno sintase ou uma atividade de (+) - α- santaleno sintase e compreendendo uma sequência de aminoácidos, de modo que abriga o referido ido nucleico e expressa ou sobreexpressa o referido polipeptídio; e b) isolar o polipeptídio do organismo hospedeiro não humano ou célula cultivada no passo a).

12. MÉTODO, de acordo com a reivindicação 11, CARACTERIZADO por adicionalmente, antes do passo a), transformar um organismo hospedeiro não- humano ou célula com o vetor de expressão, de modo a albergar o ácido nucleico e expressar ou sobreexpressar o polipeptídio.

13. MÉTODO, de acordo com a reivindicação 4, CARACTERIZADO por pelo menos um ácido nucleico consistir na SEQ ID NO:2 ou no seu complemento.