PT1123386E

PT1123386E - Processo para o fabrico de ácidos carboxílicos quirais a partir de nitrilos, recorrendo a uma nitrilase ou a microorganismos que contêm um gene para a nitrilase

Info

Publication number: PT1123386E
Application number: PT99952558T
Authority: PT
Inventors: Bernhard Hauer; Thomas Friedrich; Marion Ress-Loeschke; Ralf Mattes; Dirk Engels
Original assignee: Basf Ag
Priority date: 1998-10-19
Filing date: 1999-10-13
Publication date: 2007-03-30
Also published as: CN1331743A; WO2000023577A1; EP1123386A1; CN100422319C; CZ20011382A3; HU228092B1; ID29136A; DE59914102D1; EE05008B1; NO20011912L; EP1123386B1; HUP0104802A3; IL142397A; CA2347521A1; US6869783B1; NO327857B1; JP2002527106A; NO20011912D0; ZA200104066B; IL142397A0

Description

1

DESCRIÇÃO "PROCESSO PARA O FABRICO DE ÁCIDOS CARBOXÍLICOS QUIRAIS A PARTIR DE NITRILOS, RECORRENDO A UMA NITRILASE OU A MICROORGANISMOS QUE CONTÊM UM GENE PARA A NITRILASE" A invenção é relativa a sequências de ácidos nucleicos que codificam um polipéptido com actividade de nitrilase, a constructos de ácidos nucleicos que contêm as sequências de ácidos nucleicos, e a vectores que contêm as sequências de ácidos nucleicos ou os constructos de ácidos nucleicos. A invenção é ainda relativa a sequências de aminoácidos que são codificadas pelas sequências de ácidos nucleicos, e a microorganismos que contêm as sequências de ácidos nucleicos, os constructos de ácidos nucleicos ou os vectores que contêm as sequências de ácidos nucleicos ou os constructos de ácidos nucleicos.

Além disso, a invenção é relativa a um processo para o fabrico de ácidos carboxílicos quirais a partir dos nitrilos racémicos.

Os ácidos carboxílicos quirais são compostos procurados para a química de síntese orgânica. São produtos de partida para uma série de substâncias activas farmacêuticas ou de substâncias activas para a protecção das plantas. Os ácidos carboxílicos quirais podem ser utilizados na dissociação clássica dos racematos por meio de sais diastereoméricos. Emprega-se assim o ácido R-(-)-mandélico ou S-(-)-mandélico, por exemplo, na dissociação de racematos de aminas racémicas. Além disso, o ácido R-(-)-mandélico é utilizado como produto intermediário na síntese de antibióticos semi-sintéticos e de uma série de produtos 2 agrícolas .

Conhece-se da literatura uma série de vias de síntese diferentes para os ácidos carboxílicos quirais. Obtém-se assim de forma técnica, por exemplo, aminoácidos opticamente activos por meio de processos de fermentação. Neste caso, constitui uma desvantagem ser necessário desenvolver um processo próprio para cada aminoácido. De modo a ser possível produzir uma gama a mais ampla possível de diversos compostos, emprega-se por isso processos químicos ou enzimáticos. A desvantagem nos processos químicos, é a de que o estereocentro tem normalmente de ser formado de forma complicada numa síntese não de larga aplicação e com várias etapas.

As sínteses enzimáticas de ácidos carboxílicos quirais podem ser observadas numa série de patentes ou de pedidos de patente. 0 WO 92/05275 descreve a síntese de ácidos alfa-hidroxi-alfa-alquilcarboxílicos ou alfa-alquilcarboxílicos enantioméricos na presença de materiais biológicos. No EP B 0 348 901, reivindica-se um processo para o fabrico de ácidos orgânicos alfa-substituídos opticamente activos com microorganismos dos géneros Alcaligenes, Pseudomonas, Rhodopseudomonas, Corynebacterium sp. estirpe KO-2-4, Acinetobacter, Bacillus, Mycobacterium, Rhodococcus e Candida. O fabrico de L-alfa-aminoácidos com microrganismos é reivindicado no EP B 0 332 379. O fabrico de ácidos alfa-hidroxicarboxílicos, em especial o fabrico de ácido mandélico ou de ácido láctico opticamente activo com diversos microorganismos, como os microorganismos dos géneros Alcaligenes, Aureobacterium, Pseudomonas, Rhodopseudomonas, Corynebacterium, 3

Acinetobacter, Caseobacter, Bacillus, Mycobacterium, 3 Rhodococcus

Brevibacterium

Nocardia

Variovorax

Arthrobacter e Candida, ou com enzimas, é descrito nos direitos de propriedade industrial ep a 0 348 901 ou no seu equivalente norte-americano US 5 283 193, EP A 0 449 648, EP B 0 473 328, EP B 0 527 553 ou no seu equivalente norte-americano US 5 296 373, EP A 0 610 048, EP A 0 610 049, EP A 0 666 320 ou WO 97/32030. A desvantagem destes processos é a de com frequência levarem apenas a produtos com uma reduzida pureza óptica e/ou de decorrerem apenas com baixos rendimentos espaço-tempo. Isto leva a processos não atractivos em termos económicos. Também a tentativa de aumentar a produtividade através da adição de substâncias como sulfureto, dissulfureto, ditionito, hipofosfito ou fosfito (ver o EP A 0 486 289) ou através da utilização de microorganismos que apresentam uma maior resistência em relação a alfa-hidroxinitrilos (ver o WO 97/32030) - leva a um aumento notório da produtividade.

Por conseguinte, a invenção teve por objectivo desenvolver um processo de vasta aplicação, barato e fácil para o fabrico de ácidos carboxilicos quirais opticamente activos, que não apresentasse as desvantagens acima mencionadas.

Este objectivo foi atingido pelo processo de acordo com a invenção para o fabrico de ácidos carboxilicos quirais com a fórmula geral I R' 2

COOH

4

caracterizado pelo facto de transformar-se nitrilos racémicos com a fórmula geral II

R"

R1 R na presença de uma sequência de aminoácidos codificada por uma sequência de ácidos nucleicos escolhida do grupo: a) uma sequência de ácidos nucleicos com a sequência representada na SEQ ID NO: 1, b) sequências de ácidos nucleicos, que derivam como resultado do código genético degenerado da sequência de ácidos nucleicos representada na SEQ ID NO: 1, c) homólogos da sequência de ácidos nucleicos representada na SEQ ID NO: 1, que codificam polipéptidos que apresentam pelo menos 98% de homologia em toda a área da sequência em relação à SEQ ID NO: 2, sem que haja redução na acção enzimática dos polipéptidos. ou de um microorganismo em crescimento, latente ou desintegrado, que contém uma sequência de ácidos nucleicos do grupo acima mencionado ou um constructo de ácidos nucleicos, que liga um ácido nucleico do grupo mencionado a um ou mais sinais de regulação; e de transformar-se pelo menos 25 mmoles de nitrilo/h por mg de proteina ou 25 mmoles de nitrilo/h por g de peso a seco, nos ácidos carboxilicos quirais, em que os substituintes e as variáveis nas fórmulas I e II têm o seguinte significado: 5 *um centro opticamente activo R1, R2 e R3, independentemente uns dos outros, hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Ci0, arilo substituído ou não substituído, hetarilo, OR4 ou NR4R5, sendo os radicais R1, R2 e R3 sempre diferentes, R4 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Ci0, Ci-Cio-alquilcarbonilo, C2_Cio -alcenilcarbonilo, arilo, arilcarbonilo, hetarilo ou hetarilcarbonilo, R5 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2_Cio, arilo ou hetarilo. R1, R2 e R3 designam, nos compostos com as fórmulas I e II e independentemente uns dos outros, hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Cio, arilo substituído ou não substituído, hetarilo, OR4 ou NR4R5, sendo os radicais R1, R2 e R3 sempre diferentes.

Como radicais alquilo, faz-se referência a cadeias de alquilo C1-C10 substituídas ou não substituídas, ramificadas ou não ramificadas, como, por exemplo, metilo, etilo, n-propilo, 1-metiletilo, n-butilo, 1-metilpropilo, 2-metilpropilo, 1,1-dimetiletilo, n—pentilo, 1-metilbutilo, 2- metilbutilo, 3-metilbutilo, 2,2-dimetilpropilo, 1-etilpropilo, n-hexilo, 1,1-dimetilpropilo, 1,2-dimetilpropilo, 1-metilpentilo, 2-metikpentilo, 3- metilpentilo, 4-metilpentilo, 1,1-dimetilbutilo, 6 1.2- dimetilbutilo, 1,3-dimetilbutilo, 2,2-dimetilbutilo, 2.3- dimetilbutilo, 3,3-dimetilbutilo, 1-etilbutilo, 2- etilbutilo, 1,1,2-trimetilpropilo, 1, 2,2-trimetilpropilo, 1- etil-l-metilpropilo, l-etil-2-metilpropilo, n-heptilo, n-octilo, n-nonilo ou n-decilo. É dada preferência a metilo, etilo, n-propilo, n-butilo, i-propilo ou i-butilo.

Como radicais alcenilo, faz-se referência a cadeias de alcenilo C2-C10 ramificadas ou não ramificadas, como, por exemplo, etenilo, propenilo, 1-butenilo, 2-butenilo, 3- butenilo, 2-metilpropenilo, 1-pentenilo, 2-pentenilo, 3-pentenilo, 4-pentenilo, 1-metil-l-butenilo, 2-metil-l-butenilo, 3-metil-l-butenilo, l-metil-2-butenilo, 2-metil- 2- butenilo, 3-metil-2-butenilo, l-metil-3-butenilo, 2-metil-3-butenilo, 3-metil-3-butenilo, 1,l-dimetil-2-propenilo, 1,2-dimetil-l-propenilo, 1,2-dimetil-2- propenilo, 1-etil-l-propenilo, l-etil-2-propenilo, 1-hexenilo, 2-hexenilo, 3-hexenilo, 4-hexenilo, 5-hexenilo, 1- metil-l-pentenilo, 2-metil-l-pentenilo, 3-metil-l- pentenilo, 4-metil-l-pentenilo, l-metil-2-pentenilo, 2- metil-2-pentenilo, 3-metil-2-pentenilo, 4-metil-2- pentenilo, l-metil-3-pentenilo, 2-metil-3-pentenilo, 3- metil-3-pentenilo, 4-metil-3-pentenilo, l-metil-4- pentenilo, 2-metil-4-pentenilo, 3-metil-4-pentenilo, 4- metil-4-pentenilo, 1,l-dimetil-2-butenilo, 1,l-dimetil-3-butenilo, 1,2-dimetil-l-butenilo, 1,2-dimetil-2-butenilo, 1.2- dimetil-3-butenilo, 1,3-dimetil-l-butenilo, 1,3-dimetil-2-butenilo, 1,3-dimetil-3-butenilo, 2,2-dimetil-3-butenilo, 2,3-dimetil-l-butenilo, 2,3-dimetil-2-butenilo, 2.3- dimetil-3-butenilo, 3,3-dimetil-l-butenilo, 3,3-dimetil-2-butenilo, 1-etil-l-butenilo, l-etil-2-butenilo, 1- etil-3-butenilo, 2-etil-l-butenilo, 2-etil-2-butenilo, 2- etil-3-butenilo, 1,1,2-trimetil-2-propenilo, 1-etil-l- 7 metil-2-propenilo, l-etil-2-metil-l-propenilo, l-etil-2- metil-2-propenilo, 1-heptenilo, 2-heptenilo, 3-heptenilo, 4-heptenilo, 5-heptenilo, β-heptenilo, 1-octenilo, 2-octenilo, 3-octenilo, 4-octenilo, 5-octenilo, 6-octenilo, 7-octenilo, nonenilo ou decenilo. É dada preferência a etenilo, propenilo, butenilo ou pentenilo.

Como radicais arilo, faz-se referência aos radicais arilo substituídos e não substituídos, que contêm 6 a 20 átomos de carbono no anel ou no sistema de anel. Neste caso, poderá tratar-se de anéis aromáticos condensados uns nos outros ou de anéis aromáticos ligados por ponte através de cadeias de alquilo, de alquilcarbonilo, de alcenilo ou de alcenilcarbonilo, carbonilo, oxigénio ou nitrogénio. Os radicais arilo podem eventualmente ainda estar ligados à estrutura de base através de uma cadeia de alquilo Ci-Cio, alcenilo C3-C8, alcinilo C3-C6 ou cicloalquilo C3-C8. É dada preferência a fenilo ou a naftilo.

Como radicais hetarilo, faz-se referência a sistemas de anel aromáticos, substituídos ou não substituídos, simples ou condensados, com um ou mais anéis de 3 a 7 elementos heteroaromáticos, que podem conter um ou mais heteroátomos, tais como N, O ou S e que podem, eventualmente, estar ligados à estrutura de base através duma cadeia de alquilo Ci-Cio, alcenilo C3-C8 ou cicloalquilo C3-C8. Os exemplos deste tipo de radicais hetarilo são pirazol, imidazol, oxazol, isooxazol, tiazol, triazol, piridina, quinolina, isoquinolina, acridina, pirimidina, piridazina, pirazina, fenazina, purina ou pteridina. Os radicais hetarilo podem estar ligados à estrutura de base através dos heteroátomos ou através de diversos átomos de carbono no anel ou no sistema de anel, ou através dos substituintes. É dada 8 preferência a piridina, imidazol, pirimidina, purina, pirazina ou quinolina.

Os substituintes dos radicais mencionados de R1, R2 ou R3 tratam-se, por exemplo, de um ou mais substituintes, tais como halogéneo como flúor, cloro ou bromo, tio, nitro, amina, hidroxi, alquilo, alcoxi, alcenilo, alceniloxi, alcenilo ou outros anéis ou sistemas de anel aromáticos ou outros saturados ou insaturados não aromáticos. É dada preferência aos radicais alquilo como alquilo Ci-C6 como metilo, etilo, propilo ou butilo, arilo como fenilo, halogéneo como cloro, flúor ou bromo, hidroxi ou amina. R4 designa nos radicais OR4 ou NR4R5 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-C10, Ci-Cio-alquilcarbonilo, C2-C10-alcenilcarbonilo, arilo, alquilcarbonilo, hetarilo ou hetarilcarbonilo.

Os radicais alquilo tratam-se de cadeias de alquilo C1-C10 ramificadas ou não ramificadas, substituídas ou não substituídas, como, por exemplo, metilo, etilo, n-propilo, 1- metiletilo, n-butilo, 1-metilpropilo, 2-metilpropilo, 1.1- dimetiletilo, n-pentilo, 1-metilbutilo, 2-metilbutilo, 3-metilbutilo, 2,2-dimetilpropilo, 1-etilpropilo, n-hexilo, 1.1- dimetilpropilo, 1,2-dimetilpropilo, 1-metilpentilo, 2- metilpentilo, 3-metilpentilo, 4-metilpentilo, 1,1- dimetilbutilo, 1,2-dimetilbutilo, 1,3-dimetilbutilo, 2,2-dimetilbutilo, 2,3-dimetilbutilo, 3,3-dimetilbutilo, 1-etilbutilo, 2-etilbutilo, 1,1,2-trimetilpropilo, 1,2,2-trimetilpropilo, 1-etil-l-metilpropilo, l-etil-2- metilpropilo, n-heptilo, n-octilo, n-nonilo ou n-decilo. É dada preferência a metilo, etilo, n-propilo, n-butilo, 9 1- propilo ou i-butilo.

Como radicais alcenilo, faz-se referência a cadeias de alcenilo C2-C10 ramificadas ou não ramificadas, tais como, por exemplo, etenilo, propenilo, 1-butenilo, 2-butenilo, 3-butenilo, 2-metilpropenilo, 1-pentenilo, 2-pentenilo, 3-pentenilo, 4-pentenilo, 1-metil-l-butenilo, 2-metil-l-butenilo, 3-metil-l-butenilo, l-metil-2-butenilo, 2-metil- 2- butenilo, 3-metil-2-butenilo, l-metil-3-butenilo, 2-metil-3-butenilo, 3-metil-3-butenilo, 1,l-dimetil-2-propenilo, 1,2-dimetil-l-propenilo, 1,2-dimetil-2- propenilo, 1-etil-l-propenilo, l-etil-2-propenilo, 1-hexenilo, 2-hexenilo, 3-hexenilo, 4-hexenilo, 5-hexenilo, 1- metil-l-pentenilo, 2-metil-l-pentenilo, 3-metil-l-pentenilo, 4-metil-l-pentenilo, l-metil-2-pentenilo, 2- metil-2-pentenilo, 3-metil-2-pentenilo, 4-metil-2-pentenilo, l-metil-3-pentenilo, 2-metil-3-pentenilo, 3- metil-3-pentenilo, 4-metil-3-pentenilo, l-metil-4-pentenilo, 2-metil-4-pentenilo, 3-metil-4-pentenilo, 4- metil-4-pentenilo, 1,l-dimetil-2-butenilo, 1,l-dimetil-3-butenilo, 1,2-dimetil-l-butenilo, 1,2-dimetil-2-butenilo, 1.2- dimetil-3-butenilo, 1,3-dimetil-l-butenilo, 1,3-dimetil-2-butenilo, 1,3-dimetil-3-butenilo, 2,2-dimetil-3-butenilo, 2,3-dimetil-l-butenilo, 2,3-dimetil-2-butenilo, 2.3- dimetil-3-butenilo, 3,3-dimetil-l-butenilo, 3,3-dimetil-2-butenilo, 1-etil-l-butenilo, l-etil-2-butenilo, 1- etil-3-butenilo, 2-etil-l-butenilo, 2-etil-2-butenilo, 2- etil-3-butenilo, 1,1,2-trimetil-2-propenilo, 1-etil-l-metil-2-propenilo, l-etil-2-metil-l-propenilo, l-etil-2-metil-2-propenilo, 1-heptenilo, 2-heptenilo, 3-heptenilo, 4-heptenilo, 5-heptenilo, 6-heptenilo, 1-octenilo, 2-octenilo, 3-octenilo, 4-octenilo, 5-octenilo, 6-octenilo, 7-octenilo, nonenilo ou decenilo. É dada preferência a 10 etenilo, propenilo, butenilo ou pentenilo.

Como radicais alquilcarbonilo, faz-se referência a cadeias de alquilcarbonilo C1-C10 ramificadas ou não ramificadas, substituídas ou não substituídas, tais como, por exemplo, metilcarbonilo, etilcarbonilo, n-propilcarbonilo, 1-metiletilcarbonilo, 1-metilpropilcarbonilo, 1.1- dimetiletilcarbonilo, 1-metilbutilcarbonilo, 3-metilbutilcarbonilo, 1-etilpropilcarbonilo, 1.1- dimetilpropilcarbonilo, 1-metilpentilcarbonilo, 3-metilpentilcarbonilo, 1.1- dimetilbutilcarbonilo, 1.3- dimetilbutilcarbonilo, 2.3- dimetilbutilcarbonilo, 1-etilbutilcarbonilo, trimetilpropilcarbonilo, n-butilcarbonilo, 2-metilpropilcarbonilo, n-pentilcarbonilo, 2-metilbutilcarbonilo, 2.2- dimetilpropilcarbonilo, n-hexilcarbonilo, 1.2- dimetilpropilcarbonilo, 2-metilpentilcarbonilo, 4-metilpentilcarbonilo, 1.2- dimetilbutilcarbonilo, 2.2- dimetilbutilcarbonilo, 3.3- dimetilbutilcarbonilo, 2-etilbutilcarbonilo, 1,1,2- 1,2, 2-trimetilpropilcarbonilo, 1-etil-l-metilpropilcarbonilo, l-etil-2-metilpropilcarbonilo, n-heptilcarbonilo, n-octilcarbonilo, n-nonilcarbonilo ou n-decilcarbonilo. É dada preferência a metilcarbonilo, etilcarbonilo, n-propilcarbonilo, n-butilcarbonilo, i-propilcarbonilo ou i-butilcarbonilo.

Como radicais alcenilcarbonilo, faz-se referência a cadeias de C2-Cio-alcenilcarbonilo ramificadas ou não ramificadas, como, por exemplo, etenilcarbonilo, propenilcarbonilo, 1- butenilcarbonilo, 2-butenilcarbonilo, 3-butenilcarbonilo, 2- metilpropenilcarbonilo, 1-pentenilcarbonilo, 2-pentenilcarbonilo, 3-pentenilcarbonilo, 4-pentenilcarbonilo, 1-metil-l-butenilcarbonilo, 2-metil-l- 11 butenilcarbonilo, 3-metil-l-butenilcarbonilo, l-metil-2-butenilcarbonilo, 2-metil-2-butenilcarbonilo, 3-metil-2-butenilcarbonilo, l-metil-3-butenilcarbonilo, 2-metil-3-butenilcarbonilo, 3-metil-3-butenilcarbonilo, 1,1-dimetil-2-propenilcarbonilo, 1,2-dimetil-l-propenilcarbonilo, 1,2-dimetil-2-propenilcarbonilo, 1-etil-l-propenilcarbonilo, 1- etil-2-propenilcarbonilo, 1-hexenilcarbonilo, 2- hexenilcarbonilo, 3-hexenilcarbonilo, 4-hexenilcarbonilo, 5-hexenilcarbonilo, 1-metil-l-pentenilcarbonilo, 2-metil-l-pentenilcarbonilo, 3-metil-l-pentenilcarbonilo, 4-metil-l-pentenilcarbonilo, l-metil-2-pentenilcarbonilo, 2-metil-2-pentenilcarbonilo, 3-metil-2-pentenilcarbonilo, 4-metil-2-pentenilcarbonilo, l-metil-3-pentenilcarbonilo, 2-metil-3-pentenilcarbonilo, 3-metil-3-pentenilcarbonilo, 4-metil-3-pentenilcarbonilo, l-metil-4-pentenilcarbonilo, 2-metil-4-pentenilcarbonilo, 3-metil-4-pentenilcarbonilo, 4-metil-4-pentenilcarbonilo, 1,l-dimetil-2-butenilcarbonilo, 1,1-dimetil-3-butenilcarbonilo, 1,2-dimetil-l-butenilcarbonilo, 1, 2-dimetil-2-butenilcarbonilo, 1, 2-dimetil-3- butenilcarbonilo, 1,3-dimetil-l-butenilcarbonilo, 1,3- dimetil-2-butenilcarbonilo, 1, 3-dimetil-3-butenilcarbonilo, 2.2- dimetil-3-butenilcarbonilo, 2,3-dimetil-l- butenilcarbonilo, 2,3-dimetil-2-butenilcarbonilo, 2,3- dimetil-3-butenilcarbonilo, 3, 3-dimetil-l-butenilcarbonilo, 3.3- dimetil-2-butenilcarbonilo, 1-etil-l-butenilcarbonilo, 1- etil-2-butenilcarbonilo, 1-etil-3-butenilcarbonilo, 2- etil-1-butenilcarbonilo, 2-etil-2-butenilcarbonilo, 2-etil-3-butenilcarbonilo, 1/1/2-trimetil-2- propenilcarbonilo, 1-etil-1-metil-2-propenilcarbonilo, 1- etil-2-metil-l-propenilcarbonilo, l-etil-2-metil-2- propenilcarbonilo, 1-heptenilcarbonilo, 2- heptenilcarbonilo, 3-heptenilcarbonilo, 4-heptenilcarbonilo, 5-heptenilcarbonilo, 12 6-heptenilcarbonilo, 1-octenilcarbonilo, 2-octenilcarbonilo, 3-octenilcarbonilo, 4-octenilcarbonilo, 5-octenilcarbonilo, 6-octenilcarbonilo, 7-octenilcarbonilo, nonenilcarbonilo ou decenilcarbonilo. É dada preferência a etenilcarbonilo, propenilcarbonilo, butenilcarbonilo ou pentenilcarbonilo.

Como radicais arilo, faz-se referência aos substituídos ou não substituídos que contêm 6 a 20 átomos de carbono no anel ou no sistema de anel. Neste caso, poderá tratar-se de anéis aromáticos condensados uns nos outros ou de anéis aromáticos ligados por ponte através de cadeias de alquilo, de alquilcarbonilo, de alcenilo ou de alcenilcarbonilo, carbonilo, oxigénio, ou nitrogénio. Os radicais arilo podem eventualmente estar ainda ligados à estrutura de base através de uma cadeia de alquilo Ci-Cio, alcenilo C3-C8, alcinilo C3-C6 ou cicloalquilo C3-C8. É dada preferência a fenilo ou a naftilo.

Como radicais arilcarbonilo, faz-se referência a radicais arilcarbonilo substituídos e não substituídos, que contêm 6 a 20 átomos de carbono no anel ou no sistema de anel. Neste caso, poderá tratar-se de anéis aromáticos condensados uns nos outros ou de anéis aromáticos ligados por ponte à estrutura de base, através de cadeias de alquilo, de alquilcarbonilo, de alcenilo ou de alcenilcarbonilo, carbonilo, oxigénio ou nitrogénio. É dada preferência a fenilcarbonilo ou a naftilcarbonilo.

Como sistemas hetarilo, faz-se referência a sistemas de anel aromáticos, substituídos ou não substituídos, simples ou condensados, com um ou mais anéis de 3 a 7 elementos heteroaromáticos, que podem conter um ou mais heteroátomos 13 como N, 0 ou S e podem, eventualmente, estar ligados à estrutura de base através de uma cadeia de alquilo C1-C10, alcenilo C3-C8 ou cicloalquilo C3-C8. Os exemplos deste tipo de radicais hetarilo são pirazol, imidazol, oxazol, isooxazol, tiazol, triazol, piridina, quinolina, isoquinolina, acridina, pirimidina, piridazina, pirazina, fenazina, purina ou pteridina. Os radicais hetarilo podem estar ligados à estrutura de base através dos heteroátomos ou através dos diversos átomos de carbono no anel ou no sistema de anel, ou através dos substituintes. Os radicais hetarilcarbonilo são radicais heteroaromáticos ligados por um radical carbonilo à estrutura de base. É dada preferência a piridina, imidazol, pirimidina, purina, pirazina ou quinolina.

Os substituintes dos radicais mencionados de R4 tratam-se, por exemplo, de um ou mais substituintes como halogéneo tal como flúor, cloro ou bromo, tio, nitro, amina, hidroxi, alquilo, alcoxi, alcenilo, alceniloxi, alcinilo ou outros anéis ou sistemas de anel aromáticos ou outros saturados ou insaturados não aromáticos. É dada preferência aos radicais alquilo como alquilo Ci-C6, tais como metilo, etilo, propilo ou butilo; halogéneo como cloro, flúor ou bromo; hidroxi ou amina.

Para o radical R4 é dada preferência a hidrogénio. R5 designa no radical NR4R5 hidrogénio, um radical alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-C10, arilo ou hetarilo, tendo os radicais alquilo, alcenilo, arilo ou hetarilo o significado acima dado. É dada preferência a hidrogénio ou a alquilo C1-C10 como metilo, etilo ou propilo. 14

Como substituintes dos radicais mencionados de R5, surgem, por exemplo, um ou mais substituintes como halogéneo como flúor, cloro ou bromo, tio, nitro, amina, hidroxi, alquilo, alcoxi, alcenilo, alceniloxi, alcinilo ou outros anéis ou sistemas de anel aromáticos ou outros saturados ou insaturados não aromáticos. É dada preferência a radicais alquilo como alquilo Ci-C6 como metilo, etilo, propilo ou butilo; arilo como fenilo; halogéneo como cloro, flúor ou bromo; hidroxi ou amina.

Além disso, dois substituintes adjacentes R4 ou R5 podem formar em conjunto outro anel substituído ou não substituído aromático, saturado ou semi-saturado, com 5 a 6 átomos no anel, que pode conter um ou mais heteroátomos como 0, N ou S.

Convém que um dos substituintes R1, R2 ou R3 signifique, nas fórmulas I e 1—1 f—1 arilo como fenilo. Além disso, um dos substituintes R1, R2 ou R3 significa de preferência nas fórmulas I e II hidroxi e um hidrogénio ou metilo.

Convém que o processo segundo a invenção seja realizado com um valor de pH de 4 a 11, de preferência de 4 a 9.

Além disso, utiliza-se com vantagem no processo 0,01 a 10% em peso de nitrilo ou 0,01 a 10% em peso de um aldeído ou de uma cetona correspondente, e 0,01 a 10% em peso de ácido cianídrico. Como vantagem, o processo é realizado com um excesso de ácido cianídrico. Em certas circunstâncias, isto leva a teores mais elevados dos que os indicados de ácido cianídrico. Consoante o nitrilo, é possível empregar diferentes quantidades de nitrilo na reacção. As menores quantidades de nitrilo são com vantagem empregues no caso 15 de nitrilos (ciano-hidrinas) (= quantidades entre 0,01 e 5% em peso) que estão em equilíbrio com os respectivos aldeídos e ácido cianídrico. Visto que o aldeído é normalmente tóxico para os microorganismos ou enzimas, os nitrilos que são muito voláteis são do mesmo modo empregues com vantagem em quantidades entre 0,01 e 5% em peso. No caso de quantidades mais elevadas de ciano-hidrina ou de nitrilo, a reacção é retardada. No caso de nitrilos que têm poucas ou praticamente nenhumas propriedades solventes, ou no caso de nitrilos que se dissolvem em quantidades apenas muito baixas em meio aquoso, constitui uma vantagem também poder empregar quantidades maiores do que as acima indicadas. Para aumentar a transformação e o rendimento, a reacção é com vantagem realizada mediante adição contínua do nitrilo racémico. É possível isolar o produto depois do fim da reacção ou então removê-lo em contínuo numa derivação.

Os aldeídos ou as cetonas correspondentes acima mencionados tratam-se de compostos que formam o nitrilo, depois da reacção entre o aldeído ou a cetona e o ácido cianídrico, eventualmente mediante catálise ácida. A reacção entre aldeído e ácido cianídrico leva a ciano-hidrinas, que têm a vantagem de encontrarem-se em equilíbrio com aldeído e ácido cianídrico. Através do ajuste do equilíbrio da ciano-hidrina, é possível, com uma enzima que transforma apenas um enantiómero do nitrilo, chegar-se apesar disso a 100% de rendimento na teoria, visto que o nitrilo racémico é fornecido suplementarmente em contínuo. No caso de todos os outros nitrilos, o nitrilo não transformado de forma enzimática (= enantiómero "errado" ou outro) é com vantagem racemizado por meio de uma reacção química e de novo introduzido no processo, de modo a ser possível atingir um 16 rendimento teórico de 100%; é rejeitado ou purificado, e é saponificado de forma química, indo obter-se o estereocentro. O processo segundo a invenção é com vantagem realizado a uma temperatura entre 0 e 80 °C, de preferência entre 10 e 60 °C, com especial preferência entre 15 e 50 °C .

Os nitrilos racémicos no processo segundo a invenção, tratam-se de nitrilos que consistem numa mistura de 50 : 50 dos dois enantiómeros ou de outra mistura opcional, com uma concentração de um dos dois enantiómeros na mistura.

Os ácidos carboxílicos quirais tratam-se, no processo segundo a invenção, daqueles que mostram uma concentração enantiomérica. Com preferência, atinge-se no processo níveis de pureza enantiomérica de pelo menos 90% ee, de preferência de pelo menos 95% ee, com especial preferência de pelo menos 98% ee, com total preferência de 99% ee no mínimo. O processo segundo a invenção permite a transformação de uma grande multiplicidade de nitrilos racémicos nos ácidos carboxílicos quirais. No processo é possível transformar pelo menos 25 mmoles de nitrilo/h x mg de proteína ou pelo menos 25 mmoles de nitrilo/h x g de peso a seco dos microorganismos, de preferência pelo menos 30 mmoles de nitrilo/h x mg de proteína ou pelo menos 30 mmoles de nitrilo/h x g de peso a seco, com especial preferência pelo menos 40 mmoles de nitrilo/h x mg de proteína ou pelo menos 40 mmoles de nitrilo/h x g de peso a seco, com total preferência pelo menos 50 mmoles de nitrilo/h x mg de proteína, ou pelo menos 50 mmoles de nitrilo/h x g de peso 17 a seco.

No processo segundo a invenção, é possível utilizar células de crescimento que contêm os ácidos nucleicos, os constructos de ácidos nucleicos ou os vectores segundo a invenção. Também é possível utilizar células latentes ou desintegradas. As células desintegradas tratam-se, por exemplo, de células que ficam permeáveis por meio dum tratamento com, por exemplo, solventes, ou células que foram abertas por meio dum tratamento enzimático, de um tratamento mecânico (por exemplo, French Press ou ultra-sons) ou de outro método. Os extractos brutos assim obtidos são com vantagem adequados ao processo de acordo com a invenção. Também é possível utilizar enzimas purificadas ou especificamente purificadas, que podem com vantagem ser utilizadas na reacção.

Os ácidos carboxílicos quirais, produzidos no processo segundo a invenção, podem ser com vantagem obtidos da solução de reacção aquosa, por meio de extracção ou de cristalização, ou então por meio de extracção e de cristalização. Neste intuito, a solução de reacção aquosa é acidulada com um ácido como um ácido mineral (por exemplo, HC1 ou H2SO4) ou um ácido orgânico, com vantagem para valores de pH inferiores a 2 e, em seguida, é extraída com um solvente orgânico. A extracção pode ser repetida várias vezes para aumentar 0 rendimento. Como solvente orgânico, é em princípio possível empregar todos os solventes que mostram com água um limite de fase, eventualmente após a adição de sais. Os solventes favoráveis são solventes como tolueno, benzeno, hexano, éter metilterc.-butílico ou éster acético. 18

Depois da concentração da fase orgânica, é normalmente possível obter os produtos com bons níveis de pureza química, ou seja, mais de 90% de pureza química. Depois da extracção, a fase orgânica pode ser concentrada com o produto, mas também apenas parcialmente concentrada, e o produto pode ser cristalizado. Para isso, convém arrefecer a solução para uma temperatura de 0 °C - 10 °C . A cristalização também pode ocorrer directamente a partir da solução orgânica. O produto cristalizado pode ser ainda deitado num solvente igual ou noutro para a recristalização e voltar a ser cristalizado. Através da posterior cristalização realizada pelo menos uma vez, é possível aumentar mais a pureza enantiomérica do produto consoante o ponto do eutéctico.

No entanto, os ácidos carboxílicos quirais também podem ser cristalizados directamente depois da acidulação com um ácido, para um valor de pH que convém ser inferior a 2, a partir da solução de reacção aquosa. Com vantagem, a solução aquosa é para isso concentrada mediante aquecimento e reduzida no seu volume em 10 - 90%, de preferência 20 -80%, com especial preferência em 30 - 70%. Em termos preferenciais, a cristalização é levada a cabo mediante arrefecimento. Prefere-se para a cristalização temperaturas entre 0 e 10 °C. Por motivos de custos, prefere-se a cristalização directa a partir da solução aquosa. Igualmente preferido é um processamento final dos ácidos carboxílicos quirais, por meio de uma extracção e, eventualmente, posterior cristalização. com

Nestes tipos preferidos de processamento final, é possível isolar o produto do processo segundo a invenção com rendimentos de 60 a 100%, de preferência de 80 a 100% 19 especial preferência de 90 a 100%, em relação ao nitrilo empregue na reacção. O produto isolado distingue-se por uma alta pureza quimica > 90%, de preferência > 95%, com especial preferência > 98%. Além disso, os produtos têm uma elevada pureza enantiomérica, que pode ser ainda mais aumentada pela cristalização.

Os produtos assim obtidos adequam-se como material de partida a sínteses orgânicas para o fabrico de fármacos ou de produtos agro-químicos, ou para a dissociação de racematos.

Outro objecto da invenção é uma sequência isolada de ácidos nucleicos, que codifica um polipéptido com actividade de nitrilase, escolhida do grupo: a) uma sequência de ácidos nucleicos com a sequência representada na SEQ ID NO: 1, b) sequências de ácidos nucleicos que derivam como resultado do código genético degenerado da sequência de ácidos nucleicos representada na SEQ ID NO: 1, c) homólogos da sequência de ácidos nucleicos representada na SEQ ID NO: 1, que codificam polipéptidos que apresentam pelo menos 98% de homologia em toda a área da sequência em relação à SEQ ID NO: 2, sem que haja redução na acção enzimática dos polipéptidos.

Os homólogos da sequência de ácidos nucleicos segundo a invenção com a sequência SEQ ID NO: 1 tratam-se, por exemplo, de variantes de alelos que apresentam pelo menos 98% de homologia em toda a área da sequência. Em áreas 20 parciais das sequências, é com vantagem que os niveis de homologia são mais elevados. A sequência de aminoácidos derivada da SEQ ID NO: 1 pode ser vista na SEQ ID NO: 2. As variantes de alelos abrangem sobretudo variantes funcionais, que podem ser obtidas por delecção, inserção ou substituição de nucleótidos da sequência representada na SEQ ID NO: 1, devendo a actividade enzimática das proteínas sintetizadas derivadas, para a introdução de um ou mais genes num organismo, ser contudo obtida sem ser essencialmente reduzida. A invenção é com isto também relativa a sequências de aminoácidos, que são codificadas pelo grupo acima representado de sequências de ácidos nucleicos. Com vantagem, a invenção é relativa a sequências de aminoácidos que são codificadas pela sequência SEQ ID NO: 1.

Além disso, os homólogos da SEQ ID NO: 1 tratam-se, por exemplo, de homólogos fúngicos ou bacterianos, sequências encurtadas, ADN de cadeia única ou arn da sequência de adn codificadora e não codificadora. Os homólogos da SEQ ID NO: 1 têm, a nível de ADN, uma homologia de pelo menos 60%, de preferência de pelo menos 70%, com especial preferência de pelo menos 80%, com total preferência de pelo menos 90% em toda a área de ADN indicada na SEQ ID NO: 1.

Além disso, os homólogos da SEQ ID NO: 1 são derivados, como, por exemplo, variantes de promotores. Os promotores, que se encontram antes nas sequências indicadas de nucleótidos, podem ser modificados por uma ou mais trocas de nucleótidos, por meio de inserção ou de inserções e/ou de delecção ou de delecções, sem contudo prejudicar a funcionalidade ou a eficácia dos promotores. Além disso, os promotores podem aumentar a sua eficácia por meio de 21 alteração da respectiva sequência, ou serem totalmente trocados por promotores mais eficazes também de organismos de outros tipos.

Os derivados tratam-se também de variantes cuja sequência de nucleótidos foi de tal forma modificada - na gama de -1 a -200 antes do codão inicial, ou de 0 a 1 000 pares de bases depois do codão de terminação- que a expressão genética e/ou a expressão proteica é alterada, de preferência aumentada.

Com vantagem, é possível isolar a SEQ ID NO: 1 ou os seus homólogos de bactérias, de preferência de bactérias gram-positivas, com especial preferência de bactérias do género Alcaligenes, com total preferência de bactérias do género e da espécie Alcaligenes faecalis, por intermédio dos métodos conhecidos do especialista. A SEQ ID NO: 1 ou os seus homólogos, ou partes destas sequências, pode ser isolada ou podem ser isolados com, por exemplo, processos de hibridização ou com a técnica PCR a partir de outros fungos ou bactérias. Estas sequências de ADN hibridizam com as sequências de acordo com a invenção sob condições padrão. Na hibridização, emprega-se com vantagem oligonucleótidos curtos das áreas conservadas, por exemplo do centro activo, que podem ser determinados através de comparações com outras nitrilases ou nitrilo hidratases de forma conhecida do especialista. No entanto, também é possível utilizar para a hibridização fragmentos mais compridos dos ácidos nucleicos segundo a invenção ou as sequências completas. Consoante o ácido nucleico utilizado - oligonucleótido, fragmento mais comprido ou sequência completa, ou consoante qual o tipo de ácido 22 nucleico ADN ou ARN que é empregue na hibridização - assim variam estas condições padrão. Por conseguinte, as temperaturas de fusão, por exemplo, para híbridos de ADN : ADN encontram-se cerca de 10 °C abaixo das dos híbridos de ADN : ARN com o mesmo comprimento.

As condições padrão são, por exemplo e em função do ácido nucleico, temperaturas entre 42 e 58 °C numa solução tampão aquosa, com uma concentração entre 0,1 e 5 x SSC (1 x SSC = 0,15 M NaCl, 15 mM citrato de sódio, pH de 7,2) ou ainda na presença de 50% de formamida, como, por exemplo, 42 °C em 5 x SSC, 50% de formamida. Em termos vantajosos, as condições de hibridização para hibridos de ADN : ADN são 0,1 x SSC e temperaturas entre cerca de 20 °C e 45 °C, de preferência entre cerca de 30 °C e 45 °C. Para os hibridos de ADN : ARN, as condições de hibridização são com vantagem 0,1 x SSC e temperaturas entre cerca de 30 o O CD 55 °C, de preferência entre cerca de 45 °C e 55 °C. Estas temperaturas indicadas para a hibridização são, por exemplo, valores de temperaturas de fusão calculados para um ácido nucleico com um comprimento de cerca de 100 nucleótidos e um teor de G + C de 50%, na ausência de formamida. As condições experimentais para a hibridização de ADN encontram-se descritas em compêndios relacionados de genética, como, por exemplo, Sambrook et al., "Molecular Cloning", Cold Spring Harbor Laboratory, 1989, e podem ser calculadas com as fórmulas conhecidas do especialista em função, por exemplo, do comprimento dos ácidos nucleicos, do tipo dos hibridos ou do teor de G + C. Outras informações acerca da hibridização podem ser tiradas pelo especialista dos seguintes compêndios; Ausubel et al. (eds), 1985, "Current Protocols in Molecular Biology", John Wiley & Sons, Nova Iorque; Hames and Higgins (eds), 1985, 23 "Nucleic Acids Hybridization: A Practical Approach", IRL Press at Oxford University Press, Oxford; Brown (ed), 1991, "Essential Molecular Biology: A Practical Approach", IRL Press at Oxford University Press, Oxford. 0 constructo de ácidos nucleicos de acordo com a invenção trata-se da sequência do gene da nitrilase SEQ ID NO: 1 e dos seus homólogos, que foram ligados com vantagem de forma funcional a um ou mais sinais de regulação, para aumentar a expressão genética. A titulo de exemplo, estas sequências reguladoras tratam-se de sequências a que se ligam indutores ou repressores, regulando assim a expressão do ácido nucleico. Além destas novas sequências de regulação, a regulação natural destas sequências ainda pode existir antes dos genes estruturais propriamente ditos, e pode eventualmente ter sido modificada de forma genética, pelo que a regulação natural foi desligada e a expressão dos genes foi aumentada. No entanto, o constructo de ácidos nucleicos também pode ser construído de forma simples, ou seja, não foram inseridos sinais de regulação adicionais antes da sequência SEQ ID NO: 1 ou os respectivos homólogos, e o promotor natural com a sua regulação não foi removido. Em vez disso, ocorre de tal forma a mutação da sequência de regulação natural, que não ocorre mais regulação e a expressão genética é aumentada. 0 constructo de ácidos nucleicos também pode ainda com vantagem conter uma ou mais das denominadas "enhancer sequences" ligadas de forma funcional ao promotor, que permitem uma maior expressão da sequência de ácidos nucleicos. Também na extremidade 3' das sequências de ADN, é possível inserir sequências favoráveis adicionais, como outros elementos ou terminadores reguladores. Os ácidos nucleicos de acordo com a invenção podem estar contidos numa ou mais cópias no 24 constructo. No constructo podem ainda estar contidos outros marcadores, como genes que complementam auxotropias ou niveis de resistência a antibióticos, eventualmente para a selecção no constructo.

As sequências de regulação favoráveis ao processo de acordo com a invenção estão, por exemplo, em promotores como os promotores cos, tac, trp, ter, trp-tet, lpp, lac, lpp-lac, laclq~, T7, T5, T3, gal, trc, ara, SP6, X-PR ou λ-PL, que podem ser com vantagem aplicadas em bactérias gram-positivas. Outras sequências de regulação favoráveis estão, por exemplo, nos promotores gram-positivos amy e SP02, nos promotores de leveduras ou fúngicos ADC1, MFa, AC, P-60, CYC1, GAPDH, TEF, rp28, ADH. Neste contexto, também são favoráveis os promotores da piruvato decarboxilase e da metanol oxidase de, por exemplo, Hansenula. Também é possível empregar promotores sintéticos na regulação. 0 constructo de ácidos nucleicos é inserido para a expressão num organismo hospedeiro, com vantagem num vector, como, por exemplo, um plasmídeo, um fago ou outro ADN, indo permitir uma expressão óptima dos genes no hospedeiro. Estes vectores representam outra concepção da invenção. Os plasmídeos apropriados estão, por exemplo, em E. coli pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHSl, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-Ill113-Bl, Xgtll ou pBdCl, em Streptomyces pIJlOl, pIJ364, pIJ702 ou pIJ361, em Bacillus pUBUO, pC194 ou pBD214, em Corynebacterium pSA77 ou pAJ667, em fungos pALSl, pIL2 ou pBBll6, em leveduras 2qcm, pAG-1, ΥΕρβ, YEpl3 ou pEMBLYe23 ou em plantas pLGV23, pGHlac*, pBINl9, pAK2004 ou pDH51. Os plasmídeos mencionados representam uma pequena escolha dos 25 plasmídeos possíveis. Outros plasmídeos são bem conhecidos do especialista e podem ser retirados do livro "Cloning Vectors" (Eds. Pouwels P. H. et al. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0 444 904018).

Em termos vantajosos, o constructo de ácidos nucleicos para a expressão dos outros genes presentes, contém ainda adicionalmente sequências reguladoras de terminação 3' e/ou 5' para aumentar a expressão, que são escolhidas para uma expressão óptima em função do organismo hospedeiro escolhido e do gene ou dos genes.

Estas sequências reguladoras deverão possibilitar a expressão dirigida dos genes e a expressão proteica. Consoante o organismo hospedeiro, isto poderá significar que o gene só é expresso ou superexpresso depois de indução, ou que é logo expresso ou superexpresso.

Neste caso, as sequências ou os factores reguladores podem preferencialmente influenciar de forma positiva a expressão genética dos genes introduzidos e, assim, aumentá-la. Deste modo, pode de forma vantajosa ocorrer um reforço dos elementos reguladores ao nível da transcrição, ao empregar-se sinais de transcrição fortes, como promotores e/ou "enhancers". A par disto, também é possível um reforço da translação, ao melhorar, por exemplo, a estabilidade do ARNm.

Noutra forma de concepção do vector, o constructo de ácidos nucleicos de acordo com a invenção ou o vector que contém o ácido nucleico de acordo com a invenção também pode ser com vantagem introduzido na forma dum ADN linear nos microorganismos, e ser integrado por recombinação 26 heteróloga ou homóloga no genoma do organismo hospedeiro. Este ADN linear pode consistir num vector linearizado como um plasmideo, ou apenas no constructo de ácidos nucleicos ou no ácido nucleico.

Para uma expressão óptima de genes heterólogos nos organismos, convém alterar as sequências de ácidos nucleicos em conformidade com o "codon usage" especifico utilizado no organismo. 0 "codon usage" pode ser facilmente determinado com base em análises computadorizadas de outros genes conhecidos do organismo em causa.

Os organismos hospedeiros em questão para o ácido nucleico em conformidade com a invenção ou o constructo de ácidos nucleicos, são em principio todos os organismos procariontes ou eucariontes. Em termos vantajosos, utiliza- se como organismos hospedeiros, microorganismos como bactérias, fungos ou leveduras. Como vantagem, utiliza-se bactérias gram-positivas ou gram-negativas, de preferência bactérias da familia Enterobacteriaceae ou Nocardiaceae, com especial preferência bactérias dos géneros Escherichia, Pseudomonas ou Rhodococcus. É dada total preferência ao género e à espécie Escherichia coli.

Neste caso, o organismo hospedeiro de acordo com a invenção contém, preferencialmente, pelo menos um agente proteico para dobrar os polipéptidos sintetizados por ele e, em particular, as sequências de ácidos nucleicos descritas nesta invenção com actividade de nitrilase e/ou o gene que codifica este agente, encontrando-se este agente numa quantidade superior à que corresponde à quantidade de base do microorganismo tido em consideração. Os genes que codificam este agente estão contidos no cromossoma ou em 27 elementos extracromossómicos como, por exemplo, plasmídeos. Exemplos

Exemplo 1: Purificação da nitrilase da Alcaligenes faecalis 1650 1. Produção das células

Fez-se a cultura de Alcaligenes faecalis 1650 nos 30 °C durante 8 horas no meio de cultura A sob agitação.

Meio de cultura A:

Extracto de levedura 5 g/1

Peptona 3,5 g/1 CH3CO2NH4 5 g/1 KH2PO4 5 g/1

MgSCg 0,2 g/1

FeS04 0,03 g/1

NaCl 1 g/1

Butironitrilo 1 g/1

Com 200 ml desta cultura prévia, inoculou-se um fermento de 10 1 com 8 1 do meio fresco A. O pH, a temperatura, a corrente de ar e a velocidade de agitação eram de 7,2; 30 °C, 300 1/h e 300 rpm. Passadas 22 horas, obteve-se 81 g de massa celular molhada. Isto corresponde a um peso celular a seco de 3,8 g/1 e a uma densidade óptica nos 600 nm de 8. 2. Determinação da actividade enzimática em relação ao mandelonitrilo

Obteve-se as células como descrito no exemplo 1, e lavou-se duas vezes em 10 mM tampão fosfato de Na/k, pH de 7,2. 40 mg do peso celular a seco foram ressuspensos em 20 ml de 10 28

mM tampão fosfato de Na/k, pH de 6,8; e a reacção foi iniciada pela adição de 8,3 mM mandelonitrilo. A reacção foi realizada mediante agitação nos 40 °C. A cinética da dissociação de racematos foi seguida por tiragem de amostras e posterior separação celular recorrendo a cromatografia liquida de alta resolução/HPLC (ODS

Hypersil). Neste caso, determinou-se mandelonitrilo, benzaldeido, amida do ácido mandélico e ácido mandélico. Os resultados estão representados na figura 1 [Transformação do mandelonitrilo (= nitrilo do ácido mandélico) no ácido mandélico, batch]. A velocidade de formação do ácido mandélico é de 41,3 U/g de peso celular a seco com uma transformação de 30%, estando 1 U definido como 1 ocmol do ácido mandélico que é formado por minuto nos 40 °C. 3. Determinação da selectividade enzimática em relação ao mandelonitrilo

Obteve-se as células como descrito no exemplo 1 e lavou-se duas vezes em 10 mM tampão fosfato de Na/k, pH de 7,2. 40 mg do peso celular a seco foram ressuspensos em 20 ml de 10 mM tampão de fosfato de Na/k, pH de 6,8, e a reacção foi iniciada pela adição de 8,3 mM mandelonitrilo. A reacção foi realizada mediante agitação nos 30 °C. A cinética foi seguida por tiragem de amostras e posterior separação celular recorrendo a HPLC (Nucleodex β-ΡΜ). Neste caso, determinou-se ácido S-(+)-mandélico e ácido (R)—(—)— mandélico. A pureza óptica do ácido R-(-)-mandélico formado (eeR_Ms) era de 98% com 50% de transformação. A selectividade da enzima (= E) era de 50% de transformação com 499. 4. Purificação

Em todos os tampões estavam presentes 10 mM DTT durante a 29 purificação - caso nada seja expresso em contrário.

Etapa 1: Desintegração celular

As células de duas fermentações de 10 1 cada uma foram pesadas como descrito no exemplo 1, foram separadas por centrifugação e foram lavadas duas vezes com 1 1 de 0,1 M tampão Tris/HCl, pH de 7,2. O rendimento era de cerca de 162 g de massa celular a húmido. Ressuspendeu-se cada 81 g de massa celular a húmido em 160 ml de 0,1 M tampão Tris/HCl, pH de 7,2; e desintegrou-se 4 vezes num Manton-Gaulin nos 750 bar. O homogenado foi depois centrifugado durante 30 min com 30 000 g e o pelete foi rejeitado. O residuo (140 ml) tinha uma actividade residual de 73% como representado na tabela 1.

Etapa 2: Cromatografia de permuta iónica O residuo foi diluído com tampão A (20 mM Tris/HCl, pH de 8,5) para 400 ml e de novo centrifugado com 23 000 g durante 20 min. 350 ml foram depois aplicados numa coluna de Q-Sepharose (5 cm de diâmetro, 22 cm de altura, 432 ml de volume, Q-Sepharose Fast Flow da Pharmacia) no tampão A. Com um fluxo de 20 ml/min, lavou-se primeiro com 10% do tampão B (como tampão A com 1 M NaCl) (volume total de aplicação e de lavagem correspondia a 1,5 1). No decorrer de 90 min, ocorreu um aumento linear da relação até aos 60% de B. De 91 a 120 min, lavou-se depois com 100% do tampão B. Reuniu-se 100 fracções de 40 ml. A nitrilase sofreu eluição entre as fracções 50 e 60. As fracções foram juntadas e foram concentradas por ultrafiltração através de uma membrana de 10 kDa (Amicon) para um volume de 10 ml.

Etapa 3: Cromatografia por filtro molecular O concentrado da cromatografia de permuta iónica (etapa 2) 30 foi mais purificado em duas porções até 5 ml cada uma, através de cromatografia por filtro molecular (Superdex 200 prep. grade, Pharmacia, área de separação de 10 até 600 kDa, 2,6 cm de diâmetro, 60 cm de altura, 325 ml de volume) . A detecção foi feita nos 280 nm. A coluna foi equilibrada em 20 mM tampão fosfato, pH de 7,4, 5 mM DTT e 150 mM NaCl; e foi operada com um fluxo de 1,5 ml/min. Reuniu-se 40 fracções. A actividade de nitrilo-saponificação encontrava-se nas fracções 3 a 5.

Etapa 4: Cromatografia de permuta iónica

As fracções juntadas da cromatografia por filtro molecular (etapa 3) foram mais purificadas através de cromatografia de permuta iónica, através duma coluna Mono Q (1 ml de volume de coluna, Mono Q HR515, Pharmacia). Como tampão A faz-se uso de 20 mM Tris/HCl, pH de 8,5, 5 mM DDT; como tampão B usa-se o mesmo tampão de A com 1 M NaCl. A velocidade de fluxo era de 1 ml/min. A fracção com valor, diluida para uma condutibilidade de cerca de 6 mS/cm da cromatografia por filtro molecular (cerca de 100 ml), foi directamente deitada na coluna Mono Q e a proteína foi assim adsorvida. A coluna foi lavada, depois da aplicação, com 5% do tampão B. A coluna foi eluída em 30 min com um gradiente de 5 a 40% de B, a que se seguiu 100% de B durante 10 minutos. A eluição da nitrilase ocorreu na fracção 17 e na 18 do gradiente.

As etapas 1 - 4 da purificação são reproduzidas na tabela I. 31

Tabela I: Esquema de purificação

Amostra Vol. [ml] Acti- vidade [U/l] Activi- dade total [mU] Rendi mento [%] Proteína [mg/ml] Proteína total [mg] Activi- dade esp. [U/g] Antes da desintegração 160 480 76800 100 Após desintegração 140 400 5600 72, 9 Q-Sepharose Aplicação 140 192 26880 35 12, 4 1736 15 FV 400 77 30800 40, 1 0,26 104 296 Superdex 200 Aplicação 9,5 >378 >3591 4,7 2,41 22,90 >157 FV 43 59 2537 3,3 0,21 9,03 281 Mono Q Aplicação 100 4,8 480 0,6 0,06 6, 33 76 FV 4 >77 308 0,4 0,19 0, 76 >405

As fracções com valor (= FV, tabela I) da cromatografia por filtro molecular (etapa 3) e da cromatografia de permuta iónica através de mono Q (etapa 4), foram separadas por SDS-PAGE como representado na figura 2.

Etapa 5: RP-HPLC (cromatografia liquida de alta resolução de fase reversa) A fracção com valor (fracção 17 e 18) da cromatografia por Mono Q (etapa 4) foi testada por cromatograf ia de fase reversa (RP) em termos de homogeneidade, e foi mais purificada para a preparação de uma separação de tripsina. Na separação empregou-se uma coluna (3 cm) de Abimed num equipamento Hewlett-Packard (HP 1090) . Como agente de controlo da fluidez, empregou-se tampão A: água com 0,1% de TFA, e tampão B: acetonitrilo com 0,1% de TFA. 0,1 ml de 32 volume de injecção, 0,5 ml/min de velocidade de fluxo. O gradiente de eluição tinha a seguinte evolução:

Minutos % do tampão A % do tampão B 0 80 20 2 80 20 22 30 70 22, 1 0 100 24 0 100 25 100 0 30 100 0 A nitrilase sofreu eluição nos 12 - 13 minutos. No SDS-PAGE isto correspondia a uma faixa de 37 kDa. Esta faixa foi sequenciada. Empregou-se o sequenciador "494 Procise Protein Sequenzer" da empresa Applied Biosystems. A sequência de terminação N assim obtida de 39 aminoácidos é seguidamente designada por SEQ ID NO: 3. A sequência está apresentada na lista anexa das sequências, sendo: Met Gin Thr Arg Lys Ile Vai Arg Ala Ala Ala Vai Gin Ala Ala Ser Pro Asn Tyr Asp Leu Ala Thr Gly Vai Asp Lys Thr Ile Glu Leu Ala Arg Gin Ala Arg Asp Glu Gly.

Produção de péptidos trípticos A amostra da cromatografia com Mono Q (etapa 4) foi previamente tratada como se segue: a proteína (cerca de 0,6 mg) foi precipitada através de 12,5% de TCA e o pelete foi lavado três vezes com 1 ml de éter/etanol (1 : 1) . O pelete foi dissolvido em 0,2 ml de 6 M guanidina HC1, 25 mM Tris/HCl, pH de 8,5. A esta solução, adicionou-se 2,6 ocl de uma solução de DTT 1 M para a redução das pontes de dissulfureto. A amostra foi agitada durante uma hora no escuro. Em seguida, a proteina foi transformada com 1,5 ocl de uma solução de 4-vinilpiridina (35%), durante 2 horas no 33 escuro. A reacção foi terminada por incubação durante 1 hora com 2,6 <xl de uma solução de DTT 1 Μ. A enzima vinilpirrilidada foi purificada por RP-HPLC como acima descrito. 0 tempo de retenção era então de 10 - 11 minutos. A fracção com valor, identificada pelo respectivo peso molecular, foi recolhida e concentrada para 0,02 ml. Para isso, adicionou-se 0,01 ml de acetonitrilo e 0,1 M Tris/HCl, pH de 8,5 ad 0,2 ml. Para a correcção do valor de pH, adicionou-se ainda cerca de 0,05 ml de 0,1 M NaOH. A amostra (0,3 mg de quantidade proteica estimada) foi misturada com 0,032 ml de uma solução de tripsina de 1 mg/ml em 0,1 M Tris/HCl, pH de 8,5, 5% de acetonitrilo, e foi incubada durante a noite nos 37 °C. A digestão foi parada com 0,01 ml de ácido acético e depois centrifugada. O resíduo foi separado por RP-HPLC para C18. (sistema de controlo da fluidez: tampão A: água, 0,1 de TFA, tampão B: acetonitrilo, 0,1% de TFA). Os péptidos (detecção nos 205 nm e 280 nm) foram reunidos e sequenciados. Empregou-se o sequenciador "494 Procise Protein Sequenzer" da empresa Applied Biosystems. A sequência peptídica interna de 21 aminoácidos é seguidamente designada por SEQ ID NO: 4, a sequência peptídica interna de 11 aminoácidos por SEQ ID NO: 5. As SEQ ID NO: 4 e 5 encontram-se apresentadas na lista anexa das sequências, sendo: SEQ ID NO : 4

Glu Glu Ala Pro Glu Gin Gly Vai Gin Ser Lys Ile Ala Ser Vai Ala Ile Ser His Pro Gin SEQ ID NO : 5

Glu Glu Ala Pro Glu Gin Gly Vai Gin Ser Lys 6. Actividade da nitrilase purificada em relação ao mandelonitrilo A actividade da nitrilase purificada em relação ao 34 mandelonitrilo foi estudada como descrito no exemplo 2. A actividade especifica da proteina purificada em relação ao mandelonitrilo era de 12 380 U/g de proteina.

Exemplo 2: Clonagem da nitrilase a partir de Alcaligenes faecalis 1650 A partir das sequências peptidicas representadas no exemplo 1 SEQ ID NO: 3 e 4, derivou-se e sintetizou-se sondas nucleotidicas. Da SEQ ID NO: 3, a sequência peptidica de terminação N, a sonda nucleotidica derivada era um 23mero, degenerado 64 vezes (na sequência da sonda nucleotidica, substitui-se A, C, G ou T por N; A ou G por R; C ou G por S). Através da grande percentagem de GC das estirpes descritas na literatura de Alcaligenes (Wada et al., 1992, "Nucl. Acids. Res.", 20, 2111 - 21118) foi previamente dada a escolha da terceira posição do codão no caso da glutamina e da isoleucina. A sonda nucleotidica, que é seguidamente denominada SEQ ID NO: 6, representa o 5'-primer para a seguinte PCR, em que S = C ou G e N = A, C, G ou T, sendo: SEQ ID NO : 6 5'-AT GCAGACNAGNAARATCGTSCG-3'

Da SEQ ID NO: 4, da sequência peptidica interna, derivou-se um 20mero como sonda nucleotidica e degenerou-se 256 vezes (na sequência das bases nucleotidicas, substitui-se A, C, G ou T por N; A ou G por R; C ou G por S) . Devido à grande percentagem de GC das estirpes de Alcaligenes, a escolha da terceira posição do codão foi previamente dada no caso da lisina. Esta sonda nucleotidica representa o 3'-primer para a posterior PCR e é seguidamente designada por SEQ ID NO: 7. Encontra-se apresentada na lista anexa das sequências, sendo: 35 SEQ ID NO : 7 5' -TNGCSACNGANGCRATCTTG-3'

Recorrendo a este par de primers, SEQ ID NO: 6 e 7, realizou-se a PCR em ADN cromossómico da Alcaligenes faecalis 1650. O isolamento de ADN cromossómico decorreu por lise celular com lisozima e tratamento com proteinase K pelo método clássico conhecido do especialista (Ausubel, F. M. et al. (1994) "Current protocols in molecular biology", John Wiley and Sons).

Mediante a utilização da Pwo-polimerase, a PCR tinha uma desnaturação durante 3 min nos 95 °C; 35 ciclos com uma desnaturação durante 1 min nos 95 °C, uma adição de primers durante 1 min e 30 s nos 58 °C, e uma polimerização durante 1 min e 30 s nos 72 °C; e uma polimerização de terminação durante 5 min nos 72 °C.

Sob estas condições, amplificou-se, a partir do ADN cromossómico da Alcaligenes faecalis 1650, um fragmento com um tamanho aproximado de 1 kb. Para a clonagem do produto da PCR, juntou-se a cada um dos primers já mencionados uma interface de restrição Xbal e dois nucleótidos adicionais (5'-AATCTAGA ou 5'-ATTCTAGA) e repetiu-se a reacção PCR sob as condições acima mencionadas. Amplificou-se de novo um fragmento com um tamanho de cerca de 1 kb, que foi ligado, depois da purificação e de digestão de Xbal, ao pUC18 digerido de forma análoga. Depois da transformação de E. coli JM109 e do isolamento do plasmideo resultante, verificou-se o ADN por sequenciamento e posterior Southern Blot genómico. Os métodos de biologia molecular e de microbiologia para o isolamento do gene completo da nitrilase (nit) decorreram de acordo com os métodos 36 clássicos conhecidos do especialista. A sequência completa da nitrilase está representada na SEQ ID NO: 1.

Exemplo 3: Homologia com outras proteínas, identificação da sequência homóloga A comparação com sequências do banco de dados de proteínas SWISSPROT mostrou que o gene da nitrilase desta invenção tem 11 a 96% de homologia em relação às nitrilases conhecidas, a nível de aminoácidos. A maior homologia de sequências foi encontrada para a nitrilase específica de arilacetonitrilo da Alcaligenes faecalis JM3 (Nagasawa et al., "Eur. J. Biochem." 1990, 194, 765 - 772). Os dois genes da nitrilase apresentam uma identidade de 93,2% a nível de nucleótidos numa área de 1071 bp. A sequência de aminoácidos derivada apresenta uma identidade de 96,1% numa área de 356 aminoácidos. A menor homologia de 11,4% numa área de 534 aminoácidos foi encontrada para a nitrilase de Rhodococcus erythropolis SK92 (EP A 0 719 862) .

Exemplo 4: Expressão heteróloga da nitrilase em E. coli

Para a clonagem no vector de expressão pJOE2702, amplificou-se o gene nit. Neste caso, escolheu-se como 5'-primer para a PCR, a SEQ ID NO: 3 acima referida, tendo-se juntado na extremidade do nit 5' uma interface Ndel que se sobrepõe ao início da translação. Este primer é seguidamente denominado SEQ ID NO: 8 e encontra-se apresentado na lista anexa de sequências. Como 3'-primer, escolheu-se um 24mero da área 3' do gene nit, tendo-se juntado a ele uma interface BamHI adjacente ao codão de terminação. É seguidamente denominado SEQ ID NO: 9 e encontra-se apresentado na lista de sequências que se 37 segue. 5'-TTAATCATATGCAGACAAGAAAAATCGTCCG-3' (= SEQ ID NO: 8) 5'-AAGGATCCTCAAGACGGCTCTTGCACTAGCAG-3' (= SEQ ID NO : 9)

Mediante a utilização da Pwo-polimerase, a PCR continha uma desnaturação de 3 min nos 94 °C; 25 ciclos com uma desnaturação de 1 min nos 93 °C, uma adição de primers de 1 min e 30 s nos 55 °C, e uma polimerização de 1 min e 30 s nos 72 °C ou uma polimerização de terminação durante 5 min nos 72 °C. O fragmento de PCR obtido foi purificado, foi digerido com Ndel/BamHI e integrado no vector digerido de forma análoga pJOE2702 (Volff et al., 1996, "Mol. Microbiol.", 21(5), 1037 - 1047). O plasmideo resultante foi designado por pDHE 19.2 e está representado na figura 3. Através da integração por meio das interfaces Ndel/BamHI, o gene nit está no plasmideo pDHEl9.2 sob controlo de transcrição do promotor rhap contido no pJOE2702, proveniente do operão L-ramnose rhaBAD regulado de forma positiva em E. coli (Egan & Schleif, 1994, "j. Mol. Biol.", 243, 821-829). A terminação da transcrição do gene nit e a iniciação da translação também ocorreram por meio de sequências de vectores. A par disto, o plasmideo contém ainda um gene que confere a resistência à ampicilina ApR. A expressão heteróloga da nitrilase foi mostrada na estirpe E. coli JM109 contendo o plasmideo pDHEl9.2. Neste intuito, fez-se a cultura da estirpe JM109 (pDHEl9.2) no meio de cultura TB nos 37 °C, com 100 ocg/ml de ampicilina (Tartof, Hobbs 1987) sob agitação. Com OD60o de 1,7, procedeu-se a superinoculação da cultura de 1 : 200 em meio de TB fresco, que continha 0,2% (w/v) de L-ramnose para indução da nitrilase, e fez-se a sua cultura nos 30 °C sob agitação. 38

Passadas 8 horas, as células foram colhidas, foram lavadas com 10 mM tampão fosfato de Na/k, pH de 7,2, foram ressuspensas no mesmo tampão em conformidade com OD60o de 10 e desintegradas por tratamento com ultra-sons.

Exemplo 5: Determinação da actividade da nitrilase da estirpe recombinante E. coli JM109 (pDHEl9.2) 1. Produção das células

Fez-se a cultura de E. coli JM109 (pDHEl9.2) nos 37 °C

durante 6 horas em meio de TB + 100 ocg/ml de ampicilina sob agitação. Com OD60o de 4, inoculou-se com 100 ml desta pré-cultura um fermento de 10 1 com 8 1 de meio de TB fresco + 100 pg/ml de ampicilina + 2 g/1 de L-ramnose. O pH, a temperatura, a corrente de ar e a velocidade de agitação eram de 7,2, 30 °C, 300 1/h e 400 - 650 rpm.

Passadas 16 horas, as células foram colhidas. Nesta altura, a densidade óptica era de 18 nos 600 nm, o que correspondia a um peso celular a seco de 7,8 g/1. 2. Determinação da actividade especifica em relação ao mandelonitrilo

As células foram obtidas como descrito no exemplo 1 e criadas em 10 mM tampão fosfato de Na/K, pH de 7,2. 2 mg de peso celular a seco foram ressuspensos em 1 ml de 10 mM tampão fosfato de Na/K, pH de 7,2; e a reacção foi iniciada pela adição de 8,3 mM mandelonitrilo. A reacção foi levada a cabo sob agitação nos 40 °C. A cinética foi seguida por meio da tiragem de amostras e posterior HPLC (ODS Hypersil) . Neste caso, determinou-se mandelonitrilo,

benzaldeido, amida do ácido mandélico e ácido mandélico. A 39 velocidade de formação do ácido mandélico é de 403 U/g de peso celular a seco, com uma transformação de 30%, sendo 1 U definido por 1 ocmol de ácido mandélico, sendo formado por minuto nos 40 °C.

Exemplo 6: Síntese do ácido R-mandélico por meio de saponificação de mandelonitrilo, recorrendo a E. coli JM109 (pDHEl9.2) em suspensão

Num volume de 1 1 de 10 mM tampão fosfato de Na/K, pH de 7,2, que continha a estirpe E. coli JM109 (pDHEl9.2) numa concentração de 2 g/1, doseou-se nos 40 °C sob agitação com um agitador de folha durante 10 horas, mandelonitrilo numa concentração de 1,3 g/1. A dosagem foi regulada por meio do consumo de nitrilo. A velocidade de formação do ácido R-mandélico foi seguida como descrito no exemplo 5. Os resultados encontram-se representados na figura 4.

Exemplo 7: Obtenção do ácido R-mandélico por meio de extracção da preparação de reacção da saponificação do mandelonitrilo, por meio de E. coli JM109 (pDHEl9.2) em suspensão A preparação de reacção aquosa obtida no exemplo 6 de ácido mandélico foi libertada das células por centrifugação, foi ajustada com um ácido para um pH de 2 e extraída três vezes com éter metilterc.-butílico (MTBE). Depois de separação por evaporação do solvente orgânico do extracto de ácido mandélico, redissolveu-se os cristais de ácido mandélico brancos assim obtidos e os mesmos foram analisados em termos de pureza química e óptica por meio de HPLC. A pureza química era de 99%, a pureza óptica do ácido R-mandélico era de 97,4% ee. 40

Exemplo 8: Obtenção do ácido R-mandélico por meio de cristalização de arrefecimento, a partir da preparação de reacção da saponificação de mandelonitrilo por meio de E. coli JM109 (pDHEl9.2) em suspensão A preparação de reacção aquosa obtida no exemplo 6 de ácido mandélico foi libertada das células por centrifugação, foi concentrada mediante aquecimento e agitação para 40% do volume de partida, e foi ajustada com um ácido para um pH de 2. Por meio de arrefecimento no banho gélido, o ácido mandélico foi cristalizado e os cristais de ácido mandélico brancos assim obtidos foram aspirados por meio de um filtro e foram secos. Os cristais foram redissolvidos e foram analisados em termos de pureza química e óptica por meio de HPLC. A pureza quimica era de 99,1%, a pureza óptica do ácido R-mandélico era de 99,8% ee.

Exemplo 9: Transformação de diversos nitrilos

Com a estirpe E. coli (ver o exemplo 6) ou com a estirpe de partida de Alcaligenes, transformou-se diversos nitrilos. As células de Alcaligenes foram cultivadas em 400 ml de meio de Alcaligenes (ver acima o meio A) nos 30 °C e com 160 rpm durante 16 horas (= h). A colheita das células foi feita por centrifugação (30 min, 4 °C e com 5 000 rpm) . Pipetizou-se cada 150 ocl de uma suspensão celular por onda numa placa de microtitulação. A placa foi em seguida centrifugada. O resíduo foi aspirado e os peletes celulares foram lavados duas vezes com Na2HP04 (1, 42 g/1 em Finnaqua, pH de 7,2). Em seguida, pipetizou-se a solução de substrato (150 ocl) e voltou-se a ressuspender as células. De 12 em 12 séries da placa de microtitulação, procedeu-se a mistura com um substrato. Como controlo, tomou-se uma série com 41 solução de substrato sem células (= valor em branco).

As placas de microtitulação foram deixadas nos 30 °C e com 200 rpm durante 2 horas na incubadora de agitação. Depois disso, as células foram separadas por centrifugação e determinou-se no resíduo a quantidade originada de iões NH4, recorrendo ao equipamento Biomek. A medição foi feita nos 620 nm contra uma curva de calibração, que tinha sido produzida com diversas soluções de NH4OH (ver a figura 5). Como substratos, utilizou-se mandelonitrilo (= 1), 2- fenilpropionitrilo (= 2), 2-fenilbutironitrilo (= 3), cianeto de benzilo (= 4), cianeto de 4-clorobenzilo (= 5), cianeto de 4-bromobenzilo (= 6), propionitrilo (= 7), 2- metilbutironitrilo (= 8, 2-cianobutano), geranonitrilo (= 9), valeronitrilo (= 10), 3-cianopiridina (= 11), 3-bifenil-2-hidroxibutironitrilo (= 12), cianeto de 4- fluorobenzilo (= 13, 4-fluorofenilacetonitrilo) e alfa-(3-heptil)-nitrotriacetonitrilo (= 14). Os substratos foram postos com 0,2 moles em metanol e foram diluídos a partir desta solução-mãe com Na2HP04 (1,42 g/1 em Finnaqua, pH de 7,2) para 10 mM. As suspensões celulares foram normalizadas para 2 g/1 de biomassa seca. A tabela II reproduz os valores médios de uma série de placa de microtitulação na transformação. 42

Tabela II Transformação de diversos nitrilos com a nitrilase 1650 N.° do substrato ccmol/1 Actividade % de transformação 1 2141,2 8,9 86,3 2 1001,1 4,1 70,2 3 24, 4 0,1 44, 3 4 2210,5 9,2 100 5 2136,3 8,9 100 6 1500,8 6,2 100 7 4,9 0,02 NA 8 - - NA 9 - - NA 10 113, 4 0,47 NA 11 - - NA 12 - - NA 13 2222,9 9,2 100 14 84, 8 0,35 44, 1 A figura 6 reproduz os resultados da transformação na forma de valores de actividade.

PROTOCOLO DAS SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) AUTO DO PEDIDO: (A) NOME: BASF Aktiengesellschaft (B) RUA: Carl-Bosch-Strasse 38 (C) LOCALIDADE: Ludwigshafen (D) ESTADO ALEMÃO: Rheinland-Pfalz (E) PAÍS: Republica Federal Alemanha (F) CÓDIGO DO POSTAL: D-67056

(ii) TÍTULO DO PEDIDO: PROCESSO PARA O FABRICO DE ÁCIDOS CARBOX í LICOS QUIRAIS A PARTIR DE NITRILOS, RECORRENDO A UMA NITRILASE OU A MICROORGANISMOS QUE CONTÊM UM GENE PARA A NITRILASE (iii) NÚMERO DAS SEQUÊNCIAS: 9 43 (iv) FORMA LEGÍVEL POR COMPUTADOR: (A) SUPORTE DE DADOS: disquete (B) PC: IBM PC compatible

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentin Release #1.0, versão #1.25 (EPA) (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 1:

(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 1 071 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: dupla (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: ADN (genómico) (iii) HIPOTÉTICO: não

(iii) ΑΝΤΙ-SENTIDO: NÃO (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650

(ix) CARACTERÍSTICAS

(A) NOME/CHAVE: CDS (B) POSIÇÃO: 1..1071 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: ATG cm AÇA AGA AAA ATC GTC CGG GCA GCC GCC GTA CAG GCC GCC TCT 48 Met Gin Thr Arg Lys lie Vai Arg Ala Ala Ala Vai Gin Ala Ala Ser 1 5 10 15 CCC AAC TAC GAT CTG GCA ACG GGT GTT GAT MA ACC ATT GAG CTG GCT 96 Pro Asn Tyr Asp Leu Ala Thr Gly Vai Asp Lys Thr lie Glu Leu Ala 20 25 30 CGT CAG GCC CGC GAT GAG GGC TGT GAC CTG ATC CTG TTT GGT GAA ACC 1.44 Arg Gin Ala Arg .Asp Giu Gly Cys Asp Leu Xle Vai Phe Gly Giu Thr 35 40 45 TGG CTG CCC QGA TAT CCC TTC CAC GTC TGG CTG GGC GCA COG GCC TGG 192 Trp Leu Pro Gly Tyr pro Phe His Vai Trp Leu G ry Ala Pro Aia Trp 50 55 60 TCG CTG AAA TAC AG? GCC CGC TAC TAT GCC MC TCG CTC TCG CTG GAC 240 Ser Leu Lys Tyr Ser Ala Arg Tyr Tyr Ala Asn Ser Leu Ser Leu Asp 65 70 75 80 44 AGT GCA GAG TTT CAA CGC ATT GCC CAG GCC GCA CGG ACC TTG GGT ATT 288 Sêr Ala Glu Phe Gin Arg Ile Ala Gin Ala Ala Arg Thr Leu Gly Ile 85 90 95 TTC ATC GCA CTG CGT TAT AGC GAG CGC AGC GGC GGC AGC CTT TAC CTG 336 Phe Ile Ala Leu Gly Tyr Ser Glu Arg Ser Gly Gly Ser Leu Tyr Leu 100 105 Π0 GGC CAA TGC CTG ATC GAC GAC AAG GGC GAG ATG CTG TGG TCG CGT CGC 384 Gly Gin Cys L€U Ile Asp Asp Lys Gly Glu Ket Leu Trp Ser Arg Arg 115 120 125 aaa ctc MA CCC ACG CAT GTA GAG CGC ACC GTA TTT GGT GAA (MT TAT 432 Lys Leu Lys Pro Thr Bis Vai Glu Arg Thr Vai Phe Gly Glu Gly Tyr 130 135 140 GCC CGT GAT CTG ATT GTG TCC GAC ACA GAA CTG GGA CGC GTC GGT GCT 480 Ala Arg Asp Leu ne Vai Ser Asp Thr Glu Leu Gly Arg Vai Gly Ma 145 150 155 160 CTA TGC TGC TGG GAG CAT TTG TCG CCC TTG AGC AAG TAC GCG CTG TAC 528 Leu Cys Cys Trp Glu His Leu Ser Pro Leu Ser Lys Tyr Ala Leu Tyr 165 170 175 S o o B CAT GAA GCC ATT CAC ATT GCT GCC TGG CCG TCG TTT TCG CTA 576 Ser Gin His Glu Ala Ile His lie Ala Ala Trp Pro Ser Phe Ser Leu ISO 185 190 TAC AGC GAA CAG GCC CAC GCC CTC AGT GCC AAG GTG AAC ATG GCT GCC 624 Tyr Ser GlW Gin Ala HÍS Ara Leu Ser Ala Lys val Asn Met Ala Ala 195 200 205 TCG CAA ATC tat TCG GTT GAA GGC CAG TGC TTT ACC ATC GCC GCC AGC 672 Ser Gin Ile Tyr Ser Vai Glu Gly Gin Cys Phe Thr Ile Ala Ala Ser 210 215 220 AGT GTG GTC ACC CAA GAG ACG CTA GAC ATG CTG GAA GTG GGT GAA CAC 720 Ser Val Val Thr Gin Glu Thr Leu Asp Mec Leu Glu Val Gly Glu His 225 230 235 240 AAC GCC CCC TTG CTG MA GTG GGC GGC GGC AGT TCC ATG ATT TTT GCG 768 Asn Ale Pro Leu Leu Lys Val Gly Gly Gly ser ser Met ile Phe Ala 245 250 255 CCG GAC GCA CGC ACA CTG GCT CCC TAC CTG CCT CAC GAT GCC GAG GGC 816 Pro Asp Gly Arg Thr Leu Ala Pro Tyr Leu Pro His Asp Ala Glu Gly 260 265 270 TTG ATC ATT GCC GAT CTG AAT ATG GAG GAG ATT GCC ttc GCC AAA GCG 864 Leu Ile Ile Ala Asp Leu Asn MSt Glu Glu Ile Ala Phe Ala Lys Ala 275 280 285 ATC AAT GAC CCC GTA GGC CAC TAT TCC ΑΑΆ CCC GAG GCC ACC CGT CTG 312 Ile Asn Asp Pro Val Gly His Tyr Ser Lys Pro Glu Ala Thr Arg Leu 290 235 300 45 GTG CTG GAC m GGG CAC CGA GAC CCC ATG ACT CGG GTG CAC TCC AAA 960 Vai Leu Asp Leu Gly Kis Arg Asp Pro Met Th r Arg Vai His Ser Lys 305 310 315 320 AGC GTG hCC AGG GAA GAG GCT CCC GAG CAA GGT GTG CM AGC AAG ATT 1008 Ser Vai Thr Arg Glu Glu Ala Pro Glu Gly Vai Gin Ser Lys Ile 325 330 335 GCC ?CA GTC GCT ATC AGC CAT CCA CAG GAC TCG GAC ACA CTG CTA GTG 1056 Ma ser Vai Ala Ile Ser His Pro Gin Asp Ser Asp Thr Leu Leu Vai 340 343 350 CAA GAG CCG TCT TGA 1071

Gin Glu Pro Ser 355 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 356 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 2:

Met Gin Thr Arg Lys ile Vai Arg Ala Ala Ala Vai Gin Ala Ala Ser 1 5 10 15 Pro Asn Tyr Asp Leu Ala Thr Gly Vai Asp Lys Thr Ile Glu Leu Ala 20 25 30 Arg Gin Ala Arg Asp Glu Gly Cys Asp Leu Ile Vai Phe Gly Glu Thr 35 40 . .45 Trp Leu Pro Gly Tyr Pro Phe His Vai Trp Leu Gly Ala Pro Ala Trp 50 55 60 Ser Leu Lys Tyr Ser Ala Arg Tyr Tyr Ala Asn Ser Leu Ser Leu Asp 65 70 75 80 Ser Ala Glu Phe Gin Arg Ile Ala Gin Ala Ala Arg Thr Leu Gly Ile 85 90 95 Phe Ile Ala Leu Gly Tyr Ser Glu Arg Ser Gly Gly Ser Leu Tyr Leu 200 105 11Q Gly Gin Cys Leu Ile Asp Asp Lys Gly Glu Met Leu Trp Ser Arg Arg 115 120 125 4 6

Lys Leu Lys Pro Thr His Vai Glu Arg Thr Vai Phe Gly Glu Gly Tyr 130 135 140 Ala Arg Asp Leu Ile Vai Ser Asp Thr Glu Leu Gly Arg Vai Gly Ala 145 150 155 160 Leu Cys Cys Trp Glu His Leu Ser Pro Leu Ser Lys Tyr Ala Leu Tyr 165 170 175 Ser Gin HiS GlU Ala ile His ile Ala Ala Trp Pro Ser Phe Ser Leu 180 185 190

Tyr $er Glu Gin Ala His Ala Leu Ser Ala Lys Vai Asn Met Ala Ala 195 200 205

Ser Gin Ile Tyr Ser Vai Glu Gly Gin Cys Phe Thr Ile Ala Ala Ser 210 215 220

Ser Vai Vai Thr Gin Glu Thr Leu Asp Met Leu Glu Vai Gly Glu His 225 230 235 240

Asn Ala Pro Leu Leu Lys Vai Gly Gly Gly Ser Ser Met lie Phe Ala 245 250 255

Pro Asp Gly Arg Thr Leu Ala Pro Tyr Leu Pro His Asp Ala Glu Gly 260 265 270

Leu Ile Ile Ala Asp Leu Asn Met Glu Glu He Ala Phe Ala Lys Ala 275 280 285

Ile Asn A$p Pro Vai Gly His Tyr Ser Lys Pro Glu Ala Thr Arg Leu 290 295 300

Vai Leu Asp Leu Gly His Arg Asp Pro Met Thr Arg Vai His Ser Lys 305 310 315 320

Ser Vai Thr Arg Glu Glu Ala Pro Glu Gin Gly Vai Gin Ser Lys Ile 325 330 335

Ala Ser Vai Ala lie Ser His Pro Gin Asp Ser Asp Thr Leu Leu Vai 340 345 350

Gin Glu Pro Ser 355 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 39 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 47

(ii) TIPO DA MOLÉCULA: péptido iii) HIPOTÉTICO: NAO iii) ANTI-SENTIDO: NÃO

(v) TIPO DO FRAGMENTO: Terminação N (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalís (B) ESTIRPE: 1650 (vii) ORIGEM INDIRECTA: (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 3:

Ket Gin Thr Arg Lys Ile Vai Aro Ala Ala Ala Vai Gin Ala Ala Ser 15 10 15

Pro Asn Tyr Asp Leu Ala Thr Glv vai Asp Lys Thr Ile Glu Leu Ala 20 25 30

Arg Gin Ala Arg Asp Glu Gly 35 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:péptido

(iii) HIPOTÉTICO: NÃO

(iii) ANTI-SENTIDO: NÃO (v) TIPO DO FRAGMENTO: interno (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalís (B) ESTIRPE: 1650 (vii) ORIGEM DIRECTA: (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 4: 48

Glu Glu Ala Pro GIu Gin Gly vai Gin Ser Lys Xle Ala Ser Vai Ma 15 10 15

Xle Ser His Pro Gin 20 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 11 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:péptido

(iii) HIPOTÉTICO: NÃO

(iii) ANTI-SENTIDO: NÃO (v) TIPO DO FRAGMENTO: interno (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650 (vii) ORIGEM DIRECTA: (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 5:

Glu GIu Ala Pro Glu Gin Gly Vai Gin Ser Gys 15 10 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)

(iii) HIPOTÉTICO: NÃO (iii) ANTI-SENTIDO: NÃO (vi) ORIGEM PRIMARIA: 49 (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650

(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 6: ATGCAGACNA GNAARATCGT SCG 23 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)

(iii) HIPOTÉTICO: NÃO

(iii) ANTI-SENTIDO: NÃO (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650

(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: TNGCSACNGA NGCRATCTTG 20 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)

(iii) HIPOTÉTICO: NÃO 50

(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 8: TTAATCATAT GCAGACAAGA AAAATCGTCC G 31 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 9:

(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)

(iii) HIPOTÉTICO: NÃO

(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 9: AAGGATCCTC AAGACGGCTC TTGCACTAGC AG 32

Lisboa, 23 de Fevereiro de 2007

Claims

1 REIVINDICAÇÕES 1. Sequência isolada de ácidos nucleicos, que codifica um polipéptido com actividade de nitrilase, escolhida do grupo: a) uma sequência de ácidos nucleicos com a sequência representada na SEQ ID NO: 1, b) sequências de ácidos nucleicos que derivam como resultado do código genético degenerado da sequência de ácidos nucleicos representada na SEQ ID NO: 1, c) homólogos da sequência de ácidos nucleicos representada na SEQ ID NO: 1, que codificam polipéptidos que apresentam pelo menos 98% de homologia em toda a área de sequência em relação à SEQ ID NO: 2, sem que haja redução da acção enzimática dos polipéptidos.

2. Sequência de aminoácidos codificada por uma sequência de ácidos nucleicos de acordo com a reivindicação 1.

3. Sequência de aminoácidos de acordo com a reivindicação 2, codificada pela sequência representada na SEQ ID NO: 1.

4. Constructo de ácidos nucleicos que contém uma sequência de ácidos nucleicos de acordo com a reivindicação 1, em que a sequência de ácidos nucleicos se encontra ligada a um ou mais sinais de regulação.

5. Vector que contém uma sequência de ácidos nucleicos de 2 acordo com a reivindicação 1 ou um constructo de ácidos nucleicos de acordo com a reivindicação 4.

6. Microorganismo que contém pelo menos uma sequência introduzida de ácidos nucleicos de acordo com a reivindicação 1, ou pelo menos um constructo introduzido de ácidos nucleicos de acordo com a reivindicação 4.

7. Microorganismo de acordo com a reivindicação 6, tratando-se o microorganismo de uma bactéria dos géneros Escherichia, Pseudomonas ou Alcaligenes.

8. Processo para o fabrico de ácidos carboxilicos quirais com a fórmula geral I R COO H caracterizado pelo facto de transformar-se os nitrilos racémicos com a fórmula geral II R2- |“CN {II) I «1 R na presença de uma sequência de aminoácidos de acordo com a reivindicação 2 ou 3, ou de um microorganismo em crescimento, latente ou desintegrado de acordo com a reivindicação 6 ou 7; e de transformar-se pelo menos 25 mmoles de nitrilo/h por mg de proteína ou 25 mmoles de nitrilo/h por g de peso a seco, nos ácidos carboxilicos quirais, em que os substituintes e as variáveis nas fórmulas I e II têm o seguinte significado: 3 *um centro opticamente activo R1, R2 e R3, independentemente uns dos outros, hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Cio, arilo substituído ou não substituído, hetarilo, OR4 ou NR4R5, sendo os radicais R1, R2 e R3 sempre diferentes, R4 hidrogénio, alquilo C1-C10 substituído ou não substituídos, ramificado ou não ramificado, alcenilo C2-Cio, Ci-Cio-alquilcarbonilo, C2-Cio-alcenilcarbonilo, arilo, arilcarbonilo, hetarilo ou hetarilcarbonilo, R5 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-C10, arilo ou hetarilo.

9. Processo de acordo com a reivindicação 8, caracterizado pelo facto de um dos substituintes R1, R2 ou R3 significar OR4

• 10. Processo de acordo com a reivindicação 8 ou 9, caracterizado pelo facto de um dos substituintes R1/ R2 ou R3 significar arilo.

11. Processo de acordo com as reivindicações 8 a 10, caracterizado pelo facto de 0 processo ser realizado em solução de reacção aquosa com um pH entre 4 e 11.

12. Processo de acordo com as reivindicações 8 a 11, caracterizado pelo facto de transformar-se no processo 0,01 a 10% em peso de nitrilo ou 0,01 a 10% em peso de 4 um aldeído ou de uma cetona correspondente, e 0,01 a 10% em peso de ácido cianídrico.

13. Processo de acordo com as reivindicações 8 a 12, caracterizado pelo facto de o processo ser realizado a uma temperatura entre 0 °C e 80 °C.

14. Processo de acordo com as reivindicações 8 a 13, caracterizado pelo facto de o ácido carboxílico quiral ser obtido por extracção ou por cristalização, ou então por extracção e cristalização, com rendimentos de 60 a 100% a partir da solução de reacção.

15. Processo de acordo com as reivindicações 8 a 14, caracterizado pelo facto de o ácido carboxílico quiral ter uma pureza óptica de pelo menos 90% ee. Lisboa, 23 de Fevereiro de 2007