PT1123386E - Processo para o fabrico de ácidos carboxílicos quirais a partir de nitrilos, recorrendo a uma nitrilase ou a microorganismos que contêm um gene para a nitrilase - Google Patents
Processo para o fabrico de ácidos carboxílicos quirais a partir de nitrilos, recorrendo a uma nitrilase ou a microorganismos que contêm um gene para a nitrilase Download PDFInfo
- Publication number
- PT1123386E PT1123386E PT99952558T PT99952558T PT1123386E PT 1123386 E PT1123386 E PT 1123386E PT 99952558 T PT99952558 T PT 99952558T PT 99952558 T PT99952558 T PT 99952558T PT 1123386 E PT1123386 E PT 1123386E
- Authority
- PT
- Portugal
- Prior art keywords
- nucleic acid
- seq
- acid sequence
- ala
- sequence
- Prior art date
Links
- 150000002825 nitriles Chemical class 0.000 title claims abstract description 44
- 108010033272 Nitrilase Proteins 0.000 title claims abstract description 33
- 150000001735 carboxylic acids Chemical class 0.000 title claims abstract description 19
- 244000005700 microbiome Species 0.000 title claims abstract description 19
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 16
- 108090000623 proteins and genes Proteins 0.000 title claims description 39
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 77
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 39
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 39
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 21
- 230000000694 effects Effects 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 14
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 13
- 229920001184 polypeptide Polymers 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 claims description 40
- 230000008569 process Effects 0.000 claims description 33
- 125000003118 aryl group Chemical group 0.000 claims description 28
- 150000001413 amino acids Chemical group 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 23
- 102000004169 proteins and genes Human genes 0.000 claims description 22
- 125000000217 alkyl group Chemical group 0.000 claims description 17
- LELOWRISYMNNSU-UHFFFAOYSA-N hydrogen cyanide Chemical compound N#C LELOWRISYMNNSU-UHFFFAOYSA-N 0.000 claims description 16
- 230000001105 regulatory effect Effects 0.000 claims description 15
- 125000003729 nucleotide group Chemical group 0.000 claims description 14
- 125000001424 substituent group Chemical group 0.000 claims description 14
- 239000002773 nucleotide Substances 0.000 claims description 13
- 238000002425 crystallisation Methods 0.000 claims description 12
- 230000008025 crystallization Effects 0.000 claims description 12
- 229910052739 hydrogen Inorganic materials 0.000 claims description 12
- 239000001257 hydrogen Substances 0.000 claims description 12
- 125000001072 heteroaryl group Chemical group 0.000 claims description 11
- 125000006374 C2-C10 alkenyl group Chemical group 0.000 claims description 10
- 241000588986 Alcaligenes Species 0.000 claims description 9
- 230000003287 optical effect Effects 0.000 claims description 9
- 241000894006 Bacteria Species 0.000 claims description 8
- 150000001299 aldehydes Chemical class 0.000 claims description 8
- 230000002255 enzymatic effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 241000589516 Pseudomonas Species 0.000 claims description 4
- 150000002576 ketones Chemical class 0.000 claims description 4
- 241000588722 Escherichia Species 0.000 claims description 2
- 125000005129 aryl carbonyl group Chemical group 0.000 claims description 2
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims 3
- 125000003275 alpha amino acid group Chemical group 0.000 abstract 1
- -1 quaternary ammonium nitrides Chemical class 0.000 description 172
- 210000004027 cell Anatomy 0.000 description 33
- NNICRUQPODTGRU-UHFFFAOYSA-N mandelonitrile Chemical compound N#CC(O)C1=CC=CC=C1 NNICRUQPODTGRU-UHFFFAOYSA-N 0.000 description 33
- 108020004414 DNA Proteins 0.000 description 19
- IWYDHOAUDWTVEP-UHFFFAOYSA-N R-2-phenyl-2-hydroxyacetic acid Natural products OC(=O)C(O)C1=CC=CC=C1 IWYDHOAUDWTVEP-UHFFFAOYSA-N 0.000 description 19
- 239000000872 buffer Substances 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 17
- 241000588813 Alcaligenes faecalis Species 0.000 description 15
- QBYIENPQHBMVBV-HFEGYEGKSA-N (2R)-2-hydroxy-2-phenylacetic acid Chemical compound O[C@@H](C(O)=O)c1ccccc1.O[C@@H](C(O)=O)c1ccccc1 QBYIENPQHBMVBV-HFEGYEGKSA-N 0.000 description 14
- 229940005347 alcaligenes faecalis Drugs 0.000 description 14
- 229960002510 mandelic acid Drugs 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 241000588724 Escherichia coli Species 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 230000009466 transformation Effects 0.000 description 13
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 12
- 125000003342 alkenyl group Chemical group 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- IWYDHOAUDWTVEP-SSDOTTSWSA-N (R)-mandelic acid Chemical compound OC(=O)[C@H](O)C1=CC=CC=C1 IWYDHOAUDWTVEP-SSDOTTSWSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 239000002253 acid Substances 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 9
- 239000008363 phosphate buffer Substances 0.000 description 9
- 150000003254 radicals Chemical class 0.000 description 9
- 239000011734 sodium Substances 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- KYQCOXFCLRTKLS-UHFFFAOYSA-N Pyrazine Chemical compound C1=CN=CC=N1 KYQCOXFCLRTKLS-UHFFFAOYSA-N 0.000 description 8
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 8
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 8
- 238000004587 chromatography analysis Methods 0.000 description 8
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 239000007983 Tris buffer Substances 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 125000004122 cyclic group Chemical group 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 238000003756 stirring Methods 0.000 description 7
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 7
- 125000004974 2-butenyl group Chemical group C(C=CC)* 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 6
- PCNDJXKNXGMECE-UHFFFAOYSA-N Phenazine Natural products C1=CC=CC2=NC3=CC=CC=C3N=C21 PCNDJXKNXGMECE-UHFFFAOYSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 125000004432 carbon atom Chemical group C* 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 229910052736 halogen Inorganic materials 0.000 description 6
- 150000002367 halogens Chemical class 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 150000002431 hydrogen Chemical class 0.000 description 6
- 101150034067 nit gene Proteins 0.000 description 6
- 229910052760 oxygen Inorganic materials 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 125000004448 alkyl carbonyl group Chemical group 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- 150000005840 aryl radicals Chemical class 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 125000005842 heteroatom Chemical group 0.000 description 5
- 238000004255 ion exchange chromatography Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 5
- 229920006395 saturated elastomer Polymers 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 4
- 125000004679 1-methylbutylcarbonyl group Chemical group CC(CCC)C(=O)* 0.000 description 4
- 125000006068 2,3-dimethyl-1-butenyl group Chemical group 0.000 description 4
- 125000004680 2-methylbutylcarbonyl group Chemical group CC(CC(=O)*)CC 0.000 description 4
- 125000004975 3-butenyl group Chemical group C(CC=C)* 0.000 description 4
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 4
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 4
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 4
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 125000003545 alkoxy group Chemical group 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- 150000001412 amines Chemical class 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- HUMNYLRZRPPJDN-UHFFFAOYSA-N benzaldehyde Chemical compound O=CC1=CC=CC=C1 HUMNYLRZRPPJDN-UHFFFAOYSA-N 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000010494 dissociation reaction Methods 0.000 description 4
- 230000005593 dissociations Effects 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- AWJUIBRHMBBTKR-UHFFFAOYSA-N isoquinoline Chemical compound C1=NC=CC2=CC=CC=C21 AWJUIBRHMBBTKR-UHFFFAOYSA-N 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 4
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 4
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 4
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 4
- 238000004007 reversed phase HPLC Methods 0.000 description 4
- 238000007127 saponification reaction Methods 0.000 description 4
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 125000006023 1-pentenyl group Chemical group 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 3
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 3
- 241000186216 Corynebacterium Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 3
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 3
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- 125000005090 alkenylcarbonyl group Chemical group 0.000 description 3
- 125000003302 alkenyloxy group Chemical group 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 3
- 229910052794 bromium Inorganic materials 0.000 description 3
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 3
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 3
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 3
- 239000000460 chlorine Substances 0.000 description 3
- 229910052801 chlorine Inorganic materials 0.000 description 3
- 125000001309 chloro group Chemical group Cl* 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000001816 cooling Methods 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 229910052731 fluorine Inorganic materials 0.000 description 3
- 239000011737 fluorine Substances 0.000 description 3
- 125000001153 fluoro group Chemical group F* 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 3
- 239000003960 organic solvent Substances 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- 125000003548 sec-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 125000006079 1,1,2-trimethyl-2-propenyl group Chemical group 0.000 description 2
- 125000006059 1,1-dimethyl-2-butenyl group Chemical group 0.000 description 2
- 125000006033 1,1-dimethyl-2-propenyl group Chemical group 0.000 description 2
- 125000006062 1,2-dimethyl-2-butenyl group Chemical group 0.000 description 2
- 125000006035 1,2-dimethyl-2-propenyl group Chemical group 0.000 description 2
- 125000006063 1,2-dimethyl-3-butenyl group Chemical group 0.000 description 2
- 125000005918 1,2-dimethylbutyl group Chemical group 0.000 description 2
- 125000004878 1,3-dimethylbutylcarbonyl group Chemical group CC(CC(C)C)C(=O)* 0.000 description 2
- 125000004973 1-butenyl group Chemical group C(=CCC)* 0.000 description 2
- 125000006080 1-ethyl-1-methyl-2-propenyl group Chemical group 0.000 description 2
- 125000006037 1-ethyl-2-propenyl group Chemical group 0.000 description 2
- 125000006039 1-hexenyl group Chemical group 0.000 description 2
- 125000006025 1-methyl-1-butenyl group Chemical group 0.000 description 2
- 125000006030 1-methyl-3-butenyl group Chemical group 0.000 description 2
- 125000006052 1-methyl-3-pentenyl group Chemical group 0.000 description 2
- 125000004879 2,2-dimethylbutylcarbonyl group Chemical group CC(CC(=O)*)(CC)C 0.000 description 2
- VEPOHXYIFQMVHW-XOZOLZJESA-N 2,3-dihydroxybutanedioic acid (2S,3S)-3,4-dimethyl-2-phenylmorpholine Chemical compound OC(C(O)C(O)=O)C(O)=O.C[C@H]1[C@@H](OCCN1C)c1ccccc1 VEPOHXYIFQMVHW-XOZOLZJESA-N 0.000 description 2
- 125000006070 2,3-dimethyl-3-butenyl group Chemical group 0.000 description 2
- JHQBLYITVCBGTO-UHFFFAOYSA-N 2-(4-fluorophenyl)acetonitrile Chemical compound FC1=CC=C(CC#N)C=C1 JHQBLYITVCBGTO-UHFFFAOYSA-N 0.000 description 2
- 125000006076 2-ethyl-1-butenyl group Chemical group 0.000 description 2
- 125000006078 2-ethyl-3-butenyl group Chemical group 0.000 description 2
- 125000006040 2-hexenyl group Chemical group 0.000 description 2
- 125000006026 2-methyl-1-butenyl group Chemical group 0.000 description 2
- 125000006031 2-methyl-3-butenyl group Chemical group 0.000 description 2
- 125000006053 2-methyl-3-pentenyl group Chemical group 0.000 description 2
- RCEJCSULJQNRQQ-UHFFFAOYSA-N 2-methylbutanenitrile Chemical compound CCC(C)C#N RCEJCSULJQNRQQ-UHFFFAOYSA-N 0.000 description 2
- 125000005916 2-methylpentyl group Chemical group 0.000 description 2
- 125000006041 3-hexenyl group Chemical group 0.000 description 2
- 125000006027 3-methyl-1-butenyl group Chemical group 0.000 description 2
- 125000006046 3-methyl-1-pentenyl group Chemical group 0.000 description 2
- 125000006032 3-methyl-3-butenyl group Chemical group 0.000 description 2
- 125000006057 3-methyl-4-pentenyl group Chemical group 0.000 description 2
- 125000003542 3-methylbutan-2-yl group Chemical group [H]C([H])([H])C([H])(*)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 125000005917 3-methylpentyl group Chemical group 0.000 description 2
- 125000006042 4-hexenyl group Chemical group 0.000 description 2
- 125000006047 4-methyl-1-pentenyl group Chemical group 0.000 description 2
- 125000006051 4-methyl-2-pentenyl group Chemical group 0.000 description 2
- 125000006058 4-methyl-4-pentenyl group Chemical group 0.000 description 2
- 125000006043 5-hexenyl group Chemical group 0.000 description 2
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 2
- 241000589291 Acinetobacter Species 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- 101100283604 Caenorhabditis elegans pigk-1 gene Proteins 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 2
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 241000192125 Firmicutes Species 0.000 description 2
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 2
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 2
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 2
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 2
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 241000186359 Mycobacterium Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- ZCQWOFVYLHDMMC-UHFFFAOYSA-N Oxazole Chemical compound C1=COC=N1 ZCQWOFVYLHDMMC-UHFFFAOYSA-N 0.000 description 2
- QEFHBVDWKFFKQI-PMVMPFDFSA-N Phe-His-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QEFHBVDWKFFKQI-PMVMPFDFSA-N 0.000 description 2
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- 108010019653 Pwo polymerase Proteins 0.000 description 2
- WTKZEGDFNFYCGP-UHFFFAOYSA-N Pyrazole Chemical compound C=1C=NNC=1 WTKZEGDFNFYCGP-UHFFFAOYSA-N 0.000 description 2
- 239000012614 Q-Sepharose Substances 0.000 description 2
- 241000190932 Rhodopseudomonas Species 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- FZWLAAWBMGSTSO-UHFFFAOYSA-N Thiazole Chemical compound C1=CSC=N1 FZWLAAWBMGSTSO-UHFFFAOYSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 2
- PNNNRSAQSRJVSB-BXKVDMCESA-N aldehydo-L-rhamnose Chemical compound C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O PNNNRSAQSRJVSB-BXKVDMCESA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 125000003493 decenyl group Chemical group [H]C([*])=C([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 125000004672 ethylcarbonyl group Chemical group [H]C([H])([H])C([H])([H])C(*)=O 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 125000004491 isohexyl group Chemical group C(CCC(C)C)* 0.000 description 2
- CTAPFRYPJLPFDF-UHFFFAOYSA-N isoxazole Chemical compound C=1C=NOC=1 CTAPFRYPJLPFDF-UHFFFAOYSA-N 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- MAGPZHKLEZXLNU-UHFFFAOYSA-N mandelamide Chemical compound NC(=O)C(O)C1=CC=CC=C1 MAGPZHKLEZXLNU-UHFFFAOYSA-N 0.000 description 2
- 125000004674 methylcarbonyl group Chemical group CC(=O)* 0.000 description 2
- 125000003136 n-heptyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 2
- 125000006252 n-propylcarbonyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C(*)=O 0.000 description 2
- 125000001624 naphthyl group Chemical group 0.000 description 2
- 125000005187 nonenyl group Chemical group C(=CCCCCCCC)* 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 239000012074 organic phase Substances 0.000 description 2
- QNGNSVIICDLXHT-UHFFFAOYSA-N para-ethylbenzaldehyde Natural products CCC1=CC=C(C=O)C=C1 QNGNSVIICDLXHT-UHFFFAOYSA-N 0.000 description 2
- 125000003538 pentan-3-yl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])[H] 0.000 description 2
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 125000001844 prenyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- CPNGPNLZQNNVQM-UHFFFAOYSA-N pteridine Chemical compound N1=CN=CC2=NC=CN=C21 CPNGPNLZQNNVQM-UHFFFAOYSA-N 0.000 description 2
- PBMFSQRYOILNGV-UHFFFAOYSA-N pyridazine Chemical compound C1=CC=NN=C1 PBMFSQRYOILNGV-UHFFFAOYSA-N 0.000 description 2
- QEVHRUUCFGRFIF-MDEJGZGSSA-N reserpine Chemical compound O([C@H]1[C@@H]([C@H]([C@H]2C[C@@H]3C4=C(C5=CC=C(OC)C=C5N4)CCN3C[C@H]2C1)C(=O)OC)OC)C(=O)C1=CC(OC)=C(OC)C(OC)=C1 QEVHRUUCFGRFIF-MDEJGZGSSA-N 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 125000001973 tert-pentyl group Chemical group [H]C([H])([H])C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 150000003852 triazoles Chemical class 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- HLCSDJLATUNSSI-JXMROGBWSA-N (2e)-3,7-dimethylocta-2,6-dienenitrile Chemical compound CC(C)=CCC\C(C)=C\C#N HLCSDJLATUNSSI-JXMROGBWSA-N 0.000 description 1
- 125000000008 (C1-C10) alkyl group Chemical group 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- IWYDHOAUDWTVEP-ZETCQYMHSA-N (S)-mandelic acid Chemical compound OC(=O)[C@@H](O)C1=CC=CC=C1 IWYDHOAUDWTVEP-ZETCQYMHSA-N 0.000 description 1
- 125000006060 1,1-dimethyl-3-butenyl group Chemical group 0.000 description 1
- 125000004866 1,1-dimethylethylcarbonyl group Chemical group CC(C)(C(=O)*)C 0.000 description 1
- 125000005919 1,2,2-trimethylpropyl group Chemical group 0.000 description 1
- 125000006061 1,2-dimethyl-1-butenyl group Chemical group 0.000 description 1
- 125000004886 1-ethyl-1-methylpropylcarbonyl group Chemical group C(C)C(CC)(C(=O)*)C 0.000 description 1
- 125000006036 1-ethyl-1-propenyl group Chemical group 0.000 description 1
- 125000004887 1-ethyl-2-methylpropylcarbonyl group Chemical group C(C)C(C(C)C)C(=O)* 0.000 description 1
- 125000006218 1-ethylbutyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000004882 1-ethylbutylcarbonyl group Chemical group C(C)C(CCC)C(=O)* 0.000 description 1
- 125000006028 1-methyl-2-butenyl group Chemical group 0.000 description 1
- 125000006048 1-methyl-2-pentenyl group Chemical group 0.000 description 1
- 125000004677 1-methylethylcarbonyl group Chemical group CC(C)C(=O)* 0.000 description 1
- 125000004678 1-methylpropylcarbonyl group Chemical group CC(CC)C(=O)* 0.000 description 1
- 125000006017 1-propenyl group Chemical group 0.000 description 1
- 125000004880 2,3-dimethylbutylcarbonyl group Chemical group CC(CC(=O)*)C(C)C 0.000 description 1
- 125000006176 2-ethylbutyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(C([H])([H])*)C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000006045 2-methyl-1-pentenyl group Chemical group 0.000 description 1
- 125000006029 2-methyl-2-butenyl group Chemical group 0.000 description 1
- 125000006049 2-methyl-2-pentenyl group Chemical group 0.000 description 1
- 125000006056 2-methyl-4-pentenyl group Chemical group 0.000 description 1
- 125000004493 2-methylbut-1-yl group Chemical group CC(C*)CC 0.000 description 1
- 125000006024 2-pentenyl group Chemical group 0.000 description 1
- IZPUPXNVRNBDSW-UHFFFAOYSA-N 2-phenylbutanenitrile Chemical compound CCC(C#N)C1=CC=CC=C1 IZPUPXNVRNBDSW-UHFFFAOYSA-N 0.000 description 1
- NVAOLENBKNECGF-UHFFFAOYSA-N 2-phenylpropanenitrile Chemical compound N#CC(C)C1=CC=CC=C1 NVAOLENBKNECGF-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000006050 3-methyl-2-pentenyl group Chemical group 0.000 description 1
- 125000006054 3-methyl-3-pentenyl group Chemical group 0.000 description 1
- GZPHSAQLYPIAIN-UHFFFAOYSA-N 3-pyridinecarbonitrile Chemical compound N#CC1=CC=CN=C1 GZPHSAQLYPIAIN-UHFFFAOYSA-N 0.000 description 1
- IVYMIRMKXZAHRV-UHFFFAOYSA-N 4-chlorophenylacetonitrile Chemical compound ClC1=CC=C(CC#N)C=C1 IVYMIRMKXZAHRV-UHFFFAOYSA-N 0.000 description 1
- KFDVPJUYSDEJTH-UHFFFAOYSA-N 4-ethenylpyridine Chemical compound C=CC1=CC=NC=C1 KFDVPJUYSDEJTH-UHFFFAOYSA-N 0.000 description 1
- 125000003119 4-methyl-3-pentenyl group Chemical group [H]\C(=C(/C([H])([H])[H])C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- 108010025188 Alcohol oxidase Proteins 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- LGGHQRZIJSYRHA-GUBZILKMSA-N Asp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N LGGHQRZIJSYRHA-GUBZILKMSA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 241000186249 Corynebacterium sp. Species 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 1
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 1
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- 229910003556 H2 SO4 Inorganic materials 0.000 description 1
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 1
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- IPFKIGNDTUOFAF-CYDGBPFRSA-N Ile-Val-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IPFKIGNDTUOFAF-CYDGBPFRSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- 150000007649 L alpha amino acids Chemical class 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 1
- CNTNPWWHFWAZGA-JYJNAYRXSA-N Met-Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CNTNPWWHFWAZGA-JYJNAYRXSA-N 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 241000187654 Nocardia Species 0.000 description 1
- 241001655308 Nocardiaceae Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- RFFFKMOABOFIDF-UHFFFAOYSA-N Pentanenitrile Chemical compound CCCCC#N RFFFKMOABOFIDF-UHFFFAOYSA-N 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 1
- 239000012564 Q sepharose fast flow resin Substances 0.000 description 1
- 241000187561 Rhodococcus erythropolis Species 0.000 description 1
- 101100434411 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADH1 gene Proteins 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- VISUNEBASWEMCU-SZMVWBNQSA-N Trp-Glu-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VISUNEBASWEMCU-SZMVWBNQSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- 241001478283 Variovorax Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000007171 acid catalysis Methods 0.000 description 1
- 101150102866 adc1 gene Proteins 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 238000011088 calibration curve Methods 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- GRWZHXKQBITJKP-UHFFFAOYSA-L dithionite(2-) Chemical compound [O-]S(=O)S([O-])=O GRWZHXKQBITJKP-UHFFFAOYSA-L 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000019439 ethyl acetate Nutrition 0.000 description 1
- 230000005496 eutectics Effects 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 125000001972 isopentyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 238000007040 multi-step synthesis reaction Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 125000005185 naphthylcarbonyl group Chemical group C1(=CC=CC2=CC=CC=C12)C(=O)* 0.000 description 1
- 125000001971 neopentyl group Chemical group [H]C([*])([H])C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 150000004767 nitrides Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000020477 pH reduction Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- SUSQOBVLVYHIEX-UHFFFAOYSA-N phenylacetonitrile Chemical compound N#CCC1=CC=CC=C1 SUSQOBVLVYHIEX-UHFFFAOYSA-N 0.000 description 1
- ACVYVLVWPXVTIT-UHFFFAOYSA-M phosphinate Chemical compound [O-][PH2]=O ACVYVLVWPXVTIT-UHFFFAOYSA-M 0.000 description 1
- OJMIONKXNSYLSR-UHFFFAOYSA-N phosphorous acid Chemical compound OP(O)O OJMIONKXNSYLSR-UHFFFAOYSA-N 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- FVSKHRXBFJPNKK-UHFFFAOYSA-N propionitrile Chemical compound CCC#N FVSKHRXBFJPNKK-UHFFFAOYSA-N 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000001953 recrystallisation Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P41/00—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
- C12P41/006—Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by reactions involving C-N bonds, e.g. nitriles, amides, hydantoins, carbamates, lactames, transamination reactions, or keto group formation from racemic mixtures
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Description
1
DESCRIÇÃO "PROCESSO PARA O FABRICO DE ÁCIDOS CARBOXÍLICOS QUIRAIS A PARTIR DE NITRILOS, RECORRENDO A UMA NITRILASE OU A MICROORGANISMOS QUE CONTÊM UM GENE PARA A NITRILASE" A invenção é relativa a sequências de ácidos nucleicos que codificam um polipéptido com actividade de nitrilase, a constructos de ácidos nucleicos que contêm as sequências de ácidos nucleicos, e a vectores que contêm as sequências de ácidos nucleicos ou os constructos de ácidos nucleicos. A invenção é ainda relativa a sequências de aminoácidos que são codificadas pelas sequências de ácidos nucleicos, e a microorganismos que contêm as sequências de ácidos nucleicos, os constructos de ácidos nucleicos ou os vectores que contêm as sequências de ácidos nucleicos ou os constructos de ácidos nucleicos.
Além disso, a invenção é relativa a um processo para o fabrico de ácidos carboxílicos quirais a partir dos nitrilos racémicos.
Os ácidos carboxílicos quirais são compostos procurados para a química de síntese orgânica. São produtos de partida para uma série de substâncias activas farmacêuticas ou de substâncias activas para a protecção das plantas. Os ácidos carboxílicos quirais podem ser utilizados na dissociação clássica dos racematos por meio de sais diastereoméricos. Emprega-se assim o ácido R-(-)-mandélico ou S-(-)-mandélico, por exemplo, na dissociação de racematos de aminas racémicas. Além disso, o ácido R-(-)-mandélico é utilizado como produto intermediário na síntese de antibióticos semi-sintéticos e de uma série de produtos 2 agrícolas .
Conhece-se da literatura uma série de vias de síntese diferentes para os ácidos carboxílicos quirais. Obtém-se assim de forma técnica, por exemplo, aminoácidos opticamente activos por meio de processos de fermentação. Neste caso, constitui uma desvantagem ser necessário desenvolver um processo próprio para cada aminoácido. De modo a ser possível produzir uma gama a mais ampla possível de diversos compostos, emprega-se por isso processos químicos ou enzimáticos. A desvantagem nos processos químicos, é a de que o estereocentro tem normalmente de ser formado de forma complicada numa síntese não de larga aplicação e com várias etapas.
As sínteses enzimáticas de ácidos carboxílicos quirais podem ser observadas numa série de patentes ou de pedidos de patente. 0 WO 92/05275 descreve a síntese de ácidos alfa-hidroxi-alfa-alquilcarboxílicos ou alfa-alquilcarboxílicos enantioméricos na presença de materiais biológicos. No EP B 0 348 901, reivindica-se um processo para o fabrico de ácidos orgânicos alfa-substituídos opticamente activos com microorganismos dos géneros Alcaligenes, Pseudomonas, Rhodopseudomonas, Corynebacterium sp. estirpe KO-2-4, Acinetobacter, Bacillus, Mycobacterium, Rhodococcus e Candida. O fabrico de L-alfa-aminoácidos com microrganismos é reivindicado no EP B 0 332 379. O fabrico de ácidos alfa-hidroxicarboxílicos, em especial o fabrico de ácido mandélico ou de ácido láctico opticamente activo com diversos microorganismos, como os microorganismos dos géneros Alcaligenes, Aureobacterium, Pseudomonas, Rhodopseudomonas, Corynebacterium, 3
Acinetobacter, Caseobacter, Bacillus, Mycobacterium, 3 Rhodococcus
Brevibacterium
Nocardia
Variovorax
Arthrobacter e Candida, ou com enzimas, é descrito nos direitos de propriedade industrial ep a 0 348 901 ou no seu equivalente norte-americano US 5 283 193, EP A 0 449 648, EP B 0 473 328, EP B 0 527 553 ou no seu equivalente norte-americano US 5 296 373, EP A 0 610 048, EP A 0 610 049, EP A 0 666 320 ou WO 97/32030. A desvantagem destes processos é a de com frequência levarem apenas a produtos com uma reduzida pureza óptica e/ou de decorrerem apenas com baixos rendimentos espaço-tempo. Isto leva a processos não atractivos em termos económicos. Também a tentativa de aumentar a produtividade através da adição de substâncias como sulfureto, dissulfureto, ditionito, hipofosfito ou fosfito (ver o EP A 0 486 289) ou através da utilização de microorganismos que apresentam uma maior resistência em relação a alfa-hidroxinitrilos (ver o WO 97/32030) - leva a um aumento notório da produtividade.
Por conseguinte, a invenção teve por objectivo desenvolver um processo de vasta aplicação, barato e fácil para o fabrico de ácidos carboxilicos quirais opticamente activos, que não apresentasse as desvantagens acima mencionadas.
Este objectivo foi atingido pelo processo de acordo com a invenção para o fabrico de ácidos carboxilicos quirais com a fórmula geral I R' 2
COOH
4
caracterizado pelo facto de transformar-se nitrilos racémicos com a fórmula geral II
R"
R1 R na presença de uma sequência de aminoácidos codificada por uma sequência de ácidos nucleicos escolhida do grupo: a) uma sequência de ácidos nucleicos com a sequência representada na SEQ ID NO: 1, b) sequências de ácidos nucleicos, que derivam como resultado do código genético degenerado da sequência de ácidos nucleicos representada na SEQ ID NO: 1, c) homólogos da sequência de ácidos nucleicos representada na SEQ ID NO: 1, que codificam polipéptidos que apresentam pelo menos 98% de homologia em toda a área da sequência em relação à SEQ ID NO: 2, sem que haja redução na acção enzimática dos polipéptidos. ou de um microorganismo em crescimento, latente ou desintegrado, que contém uma sequência de ácidos nucleicos do grupo acima mencionado ou um constructo de ácidos nucleicos, que liga um ácido nucleico do grupo mencionado a um ou mais sinais de regulação; e de transformar-se pelo menos 25 mmoles de nitrilo/h por mg de proteina ou 25 mmoles de nitrilo/h por g de peso a seco, nos ácidos carboxilicos quirais, em que os substituintes e as variáveis nas fórmulas I e II têm o seguinte significado: 5 *um centro opticamente activo R1, R2 e R3, independentemente uns dos outros, hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Ci0, arilo substituído ou não substituído, hetarilo, OR4 ou NR4R5, sendo os radicais R1, R2 e R3 sempre diferentes, R4 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Ci0, Ci-Cio-alquilcarbonilo, C2_Cio -alcenilcarbonilo, arilo, arilcarbonilo, hetarilo ou hetarilcarbonilo, R5 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2_Cio, arilo ou hetarilo. R1, R2 e R3 designam, nos compostos com as fórmulas I e II e independentemente uns dos outros, hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Cio, arilo substituído ou não substituído, hetarilo, OR4 ou NR4R5, sendo os radicais R1, R2 e R3 sempre diferentes.
Como radicais alquilo, faz-se referência a cadeias de alquilo C1-C10 substituídas ou não substituídas, ramificadas ou não ramificadas, como, por exemplo, metilo, etilo, n-propilo, 1-metiletilo, n-butilo, 1-metilpropilo, 2-metilpropilo, 1,1-dimetiletilo, n—pentilo, 1-metilbutilo, 2- metilbutilo, 3-metilbutilo, 2,2-dimetilpropilo, 1-etilpropilo, n-hexilo, 1,1-dimetilpropilo, 1,2-dimetilpropilo, 1-metilpentilo, 2-metikpentilo, 3- metilpentilo, 4-metilpentilo, 1,1-dimetilbutilo, 6 1.2- dimetilbutilo, 1,3-dimetilbutilo, 2,2-dimetilbutilo, 2.3- dimetilbutilo, 3,3-dimetilbutilo, 1-etilbutilo, 2- etilbutilo, 1,1,2-trimetilpropilo, 1, 2,2-trimetilpropilo, 1- etil-l-metilpropilo, l-etil-2-metilpropilo, n-heptilo, n-octilo, n-nonilo ou n-decilo. É dada preferência a metilo, etilo, n-propilo, n-butilo, i-propilo ou i-butilo.
Como radicais alcenilo, faz-se referência a cadeias de alcenilo C2-C10 ramificadas ou não ramificadas, como, por exemplo, etenilo, propenilo, 1-butenilo, 2-butenilo, 3- butenilo, 2-metilpropenilo, 1-pentenilo, 2-pentenilo, 3-pentenilo, 4-pentenilo, 1-metil-l-butenilo, 2-metil-l-butenilo, 3-metil-l-butenilo, l-metil-2-butenilo, 2-metil- 2- butenilo, 3-metil-2-butenilo, l-metil-3-butenilo, 2-metil-3-butenilo, 3-metil-3-butenilo, 1,l-dimetil-2-propenilo, 1,2-dimetil-l-propenilo, 1,2-dimetil-2- propenilo, 1-etil-l-propenilo, l-etil-2-propenilo, 1-hexenilo, 2-hexenilo, 3-hexenilo, 4-hexenilo, 5-hexenilo, 1- metil-l-pentenilo, 2-metil-l-pentenilo, 3-metil-l- pentenilo, 4-metil-l-pentenilo, l-metil-2-pentenilo, 2- metil-2-pentenilo, 3-metil-2-pentenilo, 4-metil-2- pentenilo, l-metil-3-pentenilo, 2-metil-3-pentenilo, 3- metil-3-pentenilo, 4-metil-3-pentenilo, l-metil-4- pentenilo, 2-metil-4-pentenilo, 3-metil-4-pentenilo, 4- metil-4-pentenilo, 1,l-dimetil-2-butenilo, 1,l-dimetil-3-butenilo, 1,2-dimetil-l-butenilo, 1,2-dimetil-2-butenilo, 1.2- dimetil-3-butenilo, 1,3-dimetil-l-butenilo, 1,3-dimetil-2-butenilo, 1,3-dimetil-3-butenilo, 2,2-dimetil-3-butenilo, 2,3-dimetil-l-butenilo, 2,3-dimetil-2-butenilo, 2.3- dimetil-3-butenilo, 3,3-dimetil-l-butenilo, 3,3-dimetil-2-butenilo, 1-etil-l-butenilo, l-etil-2-butenilo, 1- etil-3-butenilo, 2-etil-l-butenilo, 2-etil-2-butenilo, 2- etil-3-butenilo, 1,1,2-trimetil-2-propenilo, 1-etil-l- 7 metil-2-propenilo, l-etil-2-metil-l-propenilo, l-etil-2- metil-2-propenilo, 1-heptenilo, 2-heptenilo, 3-heptenilo, 4-heptenilo, 5-heptenilo, β-heptenilo, 1-octenilo, 2-octenilo, 3-octenilo, 4-octenilo, 5-octenilo, 6-octenilo, 7-octenilo, nonenilo ou decenilo. É dada preferência a etenilo, propenilo, butenilo ou pentenilo.
Como radicais arilo, faz-se referência aos radicais arilo substituídos e não substituídos, que contêm 6 a 20 átomos de carbono no anel ou no sistema de anel. Neste caso, poderá tratar-se de anéis aromáticos condensados uns nos outros ou de anéis aromáticos ligados por ponte através de cadeias de alquilo, de alquilcarbonilo, de alcenilo ou de alcenilcarbonilo, carbonilo, oxigénio ou nitrogénio. Os radicais arilo podem eventualmente ainda estar ligados à estrutura de base através de uma cadeia de alquilo Ci-Cio, alcenilo C3-C8, alcinilo C3-C6 ou cicloalquilo C3-C8. É dada preferência a fenilo ou a naftilo.
Como radicais hetarilo, faz-se referência a sistemas de anel aromáticos, substituídos ou não substituídos, simples ou condensados, com um ou mais anéis de 3 a 7 elementos heteroaromáticos, que podem conter um ou mais heteroátomos, tais como N, O ou S e que podem, eventualmente, estar ligados à estrutura de base através duma cadeia de alquilo Ci-Cio, alcenilo C3-C8 ou cicloalquilo C3-C8. Os exemplos deste tipo de radicais hetarilo são pirazol, imidazol, oxazol, isooxazol, tiazol, triazol, piridina, quinolina, isoquinolina, acridina, pirimidina, piridazina, pirazina, fenazina, purina ou pteridina. Os radicais hetarilo podem estar ligados à estrutura de base através dos heteroátomos ou através de diversos átomos de carbono no anel ou no sistema de anel, ou através dos substituintes. É dada 8 preferência a piridina, imidazol, pirimidina, purina, pirazina ou quinolina.
Os substituintes dos radicais mencionados de R1, R2 ou R3 tratam-se, por exemplo, de um ou mais substituintes, tais como halogéneo como flúor, cloro ou bromo, tio, nitro, amina, hidroxi, alquilo, alcoxi, alcenilo, alceniloxi, alcenilo ou outros anéis ou sistemas de anel aromáticos ou outros saturados ou insaturados não aromáticos. É dada preferência aos radicais alquilo como alquilo Ci-C6 como metilo, etilo, propilo ou butilo, arilo como fenilo, halogéneo como cloro, flúor ou bromo, hidroxi ou amina. R4 designa nos radicais OR4 ou NR4R5 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-C10, Ci-Cio-alquilcarbonilo, C2-C10-alcenilcarbonilo, arilo, alquilcarbonilo, hetarilo ou hetarilcarbonilo.
Os radicais alquilo tratam-se de cadeias de alquilo C1-C10 ramificadas ou não ramificadas, substituídas ou não substituídas, como, por exemplo, metilo, etilo, n-propilo, 1- metiletilo, n-butilo, 1-metilpropilo, 2-metilpropilo, 1.1- dimetiletilo, n-pentilo, 1-metilbutilo, 2-metilbutilo, 3-metilbutilo, 2,2-dimetilpropilo, 1-etilpropilo, n-hexilo, 1.1- dimetilpropilo, 1,2-dimetilpropilo, 1-metilpentilo, 2- metilpentilo, 3-metilpentilo, 4-metilpentilo, 1,1- dimetilbutilo, 1,2-dimetilbutilo, 1,3-dimetilbutilo, 2,2-dimetilbutilo, 2,3-dimetilbutilo, 3,3-dimetilbutilo, 1-etilbutilo, 2-etilbutilo, 1,1,2-trimetilpropilo, 1,2,2-trimetilpropilo, 1-etil-l-metilpropilo, l-etil-2- metilpropilo, n-heptilo, n-octilo, n-nonilo ou n-decilo. É dada preferência a metilo, etilo, n-propilo, n-butilo, 9 1- propilo ou i-butilo.
Como radicais alcenilo, faz-se referência a cadeias de alcenilo C2-C10 ramificadas ou não ramificadas, tais como, por exemplo, etenilo, propenilo, 1-butenilo, 2-butenilo, 3-butenilo, 2-metilpropenilo, 1-pentenilo, 2-pentenilo, 3-pentenilo, 4-pentenilo, 1-metil-l-butenilo, 2-metil-l-butenilo, 3-metil-l-butenilo, l-metil-2-butenilo, 2-metil- 2- butenilo, 3-metil-2-butenilo, l-metil-3-butenilo, 2-metil-3-butenilo, 3-metil-3-butenilo, 1,l-dimetil-2-propenilo, 1,2-dimetil-l-propenilo, 1,2-dimetil-2- propenilo, 1-etil-l-propenilo, l-etil-2-propenilo, 1-hexenilo, 2-hexenilo, 3-hexenilo, 4-hexenilo, 5-hexenilo, 1- metil-l-pentenilo, 2-metil-l-pentenilo, 3-metil-l-pentenilo, 4-metil-l-pentenilo, l-metil-2-pentenilo, 2- metil-2-pentenilo, 3-metil-2-pentenilo, 4-metil-2-pentenilo, l-metil-3-pentenilo, 2-metil-3-pentenilo, 3- metil-3-pentenilo, 4-metil-3-pentenilo, l-metil-4-pentenilo, 2-metil-4-pentenilo, 3-metil-4-pentenilo, 4- metil-4-pentenilo, 1,l-dimetil-2-butenilo, 1,l-dimetil-3-butenilo, 1,2-dimetil-l-butenilo, 1,2-dimetil-2-butenilo, 1.2- dimetil-3-butenilo, 1,3-dimetil-l-butenilo, 1,3-dimetil-2-butenilo, 1,3-dimetil-3-butenilo, 2,2-dimetil-3-butenilo, 2,3-dimetil-l-butenilo, 2,3-dimetil-2-butenilo, 2.3- dimetil-3-butenilo, 3,3-dimetil-l-butenilo, 3,3-dimetil-2-butenilo, 1-etil-l-butenilo, l-etil-2-butenilo, 1- etil-3-butenilo, 2-etil-l-butenilo, 2-etil-2-butenilo, 2- etil-3-butenilo, 1,1,2-trimetil-2-propenilo, 1-etil-l-metil-2-propenilo, l-etil-2-metil-l-propenilo, l-etil-2-metil-2-propenilo, 1-heptenilo, 2-heptenilo, 3-heptenilo, 4-heptenilo, 5-heptenilo, 6-heptenilo, 1-octenilo, 2-octenilo, 3-octenilo, 4-octenilo, 5-octenilo, 6-octenilo, 7-octenilo, nonenilo ou decenilo. É dada preferência a 10 etenilo, propenilo, butenilo ou pentenilo.
Como radicais alquilcarbonilo, faz-se referência a cadeias de alquilcarbonilo C1-C10 ramificadas ou não ramificadas, substituídas ou não substituídas, tais como, por exemplo, metilcarbonilo, etilcarbonilo, n-propilcarbonilo, 1-metiletilcarbonilo, 1-metilpropilcarbonilo, 1.1- dimetiletilcarbonilo, 1-metilbutilcarbonilo, 3-metilbutilcarbonilo, 1-etilpropilcarbonilo, 1.1- dimetilpropilcarbonilo, 1-metilpentilcarbonilo, 3-metilpentilcarbonilo, 1.1- dimetilbutilcarbonilo, 1.3- dimetilbutilcarbonilo, 2.3- dimetilbutilcarbonilo, 1-etilbutilcarbonilo, trimetilpropilcarbonilo, n-butilcarbonilo, 2-metilpropilcarbonilo, n-pentilcarbonilo, 2-metilbutilcarbonilo, 2.2- dimetilpropilcarbonilo, n-hexilcarbonilo, 1.2- dimetilpropilcarbonilo, 2-metilpentilcarbonilo, 4-metilpentilcarbonilo, 1.2- dimetilbutilcarbonilo, 2.2- dimetilbutilcarbonilo, 3.3- dimetilbutilcarbonilo, 2-etilbutilcarbonilo, 1,1,2- 1,2, 2-trimetilpropilcarbonilo, 1-etil-l-metilpropilcarbonilo, l-etil-2-metilpropilcarbonilo, n-heptilcarbonilo, n-octilcarbonilo, n-nonilcarbonilo ou n-decilcarbonilo. É dada preferência a metilcarbonilo, etilcarbonilo, n-propilcarbonilo, n-butilcarbonilo, i-propilcarbonilo ou i-butilcarbonilo.
Como radicais alcenilcarbonilo, faz-se referência a cadeias de C2-Cio-alcenilcarbonilo ramificadas ou não ramificadas, como, por exemplo, etenilcarbonilo, propenilcarbonilo, 1- butenilcarbonilo, 2-butenilcarbonilo, 3-butenilcarbonilo, 2- metilpropenilcarbonilo, 1-pentenilcarbonilo, 2-pentenilcarbonilo, 3-pentenilcarbonilo, 4-pentenilcarbonilo, 1-metil-l-butenilcarbonilo, 2-metil-l- 11 butenilcarbonilo, 3-metil-l-butenilcarbonilo, l-metil-2-butenilcarbonilo, 2-metil-2-butenilcarbonilo, 3-metil-2-butenilcarbonilo, l-metil-3-butenilcarbonilo, 2-metil-3-butenilcarbonilo, 3-metil-3-butenilcarbonilo, 1,1-dimetil-2-propenilcarbonilo, 1,2-dimetil-l-propenilcarbonilo, 1,2-dimetil-2-propenilcarbonilo, 1-etil-l-propenilcarbonilo, 1- etil-2-propenilcarbonilo, 1-hexenilcarbonilo, 2- hexenilcarbonilo, 3-hexenilcarbonilo, 4-hexenilcarbonilo, 5-hexenilcarbonilo, 1-metil-l-pentenilcarbonilo, 2-metil-l-pentenilcarbonilo, 3-metil-l-pentenilcarbonilo, 4-metil-l-pentenilcarbonilo, l-metil-2-pentenilcarbonilo, 2-metil-2-pentenilcarbonilo, 3-metil-2-pentenilcarbonilo, 4-metil-2-pentenilcarbonilo, l-metil-3-pentenilcarbonilo, 2-metil-3-pentenilcarbonilo, 3-metil-3-pentenilcarbonilo, 4-metil-3-pentenilcarbonilo, l-metil-4-pentenilcarbonilo, 2-metil-4-pentenilcarbonilo, 3-metil-4-pentenilcarbonilo, 4-metil-4-pentenilcarbonilo, 1,l-dimetil-2-butenilcarbonilo, 1,1-dimetil-3-butenilcarbonilo, 1,2-dimetil-l-butenilcarbonilo, 1, 2-dimetil-2-butenilcarbonilo, 1, 2-dimetil-3- butenilcarbonilo, 1,3-dimetil-l-butenilcarbonilo, 1,3- dimetil-2-butenilcarbonilo, 1, 3-dimetil-3-butenilcarbonilo, 2.2- dimetil-3-butenilcarbonilo, 2,3-dimetil-l- butenilcarbonilo, 2,3-dimetil-2-butenilcarbonilo, 2,3- dimetil-3-butenilcarbonilo, 3, 3-dimetil-l-butenilcarbonilo, 3.3- dimetil-2-butenilcarbonilo, 1-etil-l-butenilcarbonilo, 1- etil-2-butenilcarbonilo, 1-etil-3-butenilcarbonilo, 2- etil-1-butenilcarbonilo, 2-etil-2-butenilcarbonilo, 2-etil-3-butenilcarbonilo, 1/1/2-trimetil-2- propenilcarbonilo, 1-etil-1-metil-2-propenilcarbonilo, 1- etil-2-metil-l-propenilcarbonilo, l-etil-2-metil-2- propenilcarbonilo, 1-heptenilcarbonilo, 2- heptenilcarbonilo, 3-heptenilcarbonilo, 4-heptenilcarbonilo, 5-heptenilcarbonilo, 12 6-heptenilcarbonilo, 1-octenilcarbonilo, 2-octenilcarbonilo, 3-octenilcarbonilo, 4-octenilcarbonilo, 5-octenilcarbonilo, 6-octenilcarbonilo, 7-octenilcarbonilo, nonenilcarbonilo ou decenilcarbonilo. É dada preferência a etenilcarbonilo, propenilcarbonilo, butenilcarbonilo ou pentenilcarbonilo.
Como radicais arilo, faz-se referência aos substituídos ou não substituídos que contêm 6 a 20 átomos de carbono no anel ou no sistema de anel. Neste caso, poderá tratar-se de anéis aromáticos condensados uns nos outros ou de anéis aromáticos ligados por ponte através de cadeias de alquilo, de alquilcarbonilo, de alcenilo ou de alcenilcarbonilo, carbonilo, oxigénio, ou nitrogénio. Os radicais arilo podem eventualmente estar ainda ligados à estrutura de base através de uma cadeia de alquilo Ci-Cio, alcenilo C3-C8, alcinilo C3-C6 ou cicloalquilo C3-C8. É dada preferência a fenilo ou a naftilo.
Como radicais arilcarbonilo, faz-se referência a radicais arilcarbonilo substituídos e não substituídos, que contêm 6 a 20 átomos de carbono no anel ou no sistema de anel. Neste caso, poderá tratar-se de anéis aromáticos condensados uns nos outros ou de anéis aromáticos ligados por ponte à estrutura de base, através de cadeias de alquilo, de alquilcarbonilo, de alcenilo ou de alcenilcarbonilo, carbonilo, oxigénio ou nitrogénio. É dada preferência a fenilcarbonilo ou a naftilcarbonilo.
Como sistemas hetarilo, faz-se referência a sistemas de anel aromáticos, substituídos ou não substituídos, simples ou condensados, com um ou mais anéis de 3 a 7 elementos heteroaromáticos, que podem conter um ou mais heteroátomos 13 como N, 0 ou S e podem, eventualmente, estar ligados à estrutura de base através de uma cadeia de alquilo C1-C10, alcenilo C3-C8 ou cicloalquilo C3-C8. Os exemplos deste tipo de radicais hetarilo são pirazol, imidazol, oxazol, isooxazol, tiazol, triazol, piridina, quinolina, isoquinolina, acridina, pirimidina, piridazina, pirazina, fenazina, purina ou pteridina. Os radicais hetarilo podem estar ligados à estrutura de base através dos heteroátomos ou através dos diversos átomos de carbono no anel ou no sistema de anel, ou através dos substituintes. Os radicais hetarilcarbonilo são radicais heteroaromáticos ligados por um radical carbonilo à estrutura de base. É dada preferência a piridina, imidazol, pirimidina, purina, pirazina ou quinolina.
Os substituintes dos radicais mencionados de R4 tratam-se, por exemplo, de um ou mais substituintes como halogéneo tal como flúor, cloro ou bromo, tio, nitro, amina, hidroxi, alquilo, alcoxi, alcenilo, alceniloxi, alcinilo ou outros anéis ou sistemas de anel aromáticos ou outros saturados ou insaturados não aromáticos. É dada preferência aos radicais alquilo como alquilo Ci-C6, tais como metilo, etilo, propilo ou butilo; halogéneo como cloro, flúor ou bromo; hidroxi ou amina.
Para o radical R4 é dada preferência a hidrogénio. R5 designa no radical NR4R5 hidrogénio, um radical alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-C10, arilo ou hetarilo, tendo os radicais alquilo, alcenilo, arilo ou hetarilo o significado acima dado. É dada preferência a hidrogénio ou a alquilo C1-C10 como metilo, etilo ou propilo. 14
Como substituintes dos radicais mencionados de R5, surgem, por exemplo, um ou mais substituintes como halogéneo como flúor, cloro ou bromo, tio, nitro, amina, hidroxi, alquilo, alcoxi, alcenilo, alceniloxi, alcinilo ou outros anéis ou sistemas de anel aromáticos ou outros saturados ou insaturados não aromáticos. É dada preferência a radicais alquilo como alquilo Ci-C6 como metilo, etilo, propilo ou butilo; arilo como fenilo; halogéneo como cloro, flúor ou bromo; hidroxi ou amina.
Além disso, dois substituintes adjacentes R4 ou R5 podem formar em conjunto outro anel substituído ou não substituído aromático, saturado ou semi-saturado, com 5 a 6 átomos no anel, que pode conter um ou mais heteroátomos como 0, N ou S.
Convém que um dos substituintes R1, R2 ou R3 signifique, nas fórmulas I e 1—1 f—1 arilo como fenilo. Além disso, um dos substituintes R1, R2 ou R3 significa de preferência nas fórmulas I e II hidroxi e um hidrogénio ou metilo.
Convém que o processo segundo a invenção seja realizado com um valor de pH de 4 a 11, de preferência de 4 a 9.
Além disso, utiliza-se com vantagem no processo 0,01 a 10% em peso de nitrilo ou 0,01 a 10% em peso de um aldeído ou de uma cetona correspondente, e 0,01 a 10% em peso de ácido cianídrico. Como vantagem, o processo é realizado com um excesso de ácido cianídrico. Em certas circunstâncias, isto leva a teores mais elevados dos que os indicados de ácido cianídrico. Consoante o nitrilo, é possível empregar diferentes quantidades de nitrilo na reacção. As menores quantidades de nitrilo são com vantagem empregues no caso 15 de nitrilos (ciano-hidrinas) (= quantidades entre 0,01 e 5% em peso) que estão em equilíbrio com os respectivos aldeídos e ácido cianídrico. Visto que o aldeído é normalmente tóxico para os microorganismos ou enzimas, os nitrilos que são muito voláteis são do mesmo modo empregues com vantagem em quantidades entre 0,01 e 5% em peso. No caso de quantidades mais elevadas de ciano-hidrina ou de nitrilo, a reacção é retardada. No caso de nitrilos que têm poucas ou praticamente nenhumas propriedades solventes, ou no caso de nitrilos que se dissolvem em quantidades apenas muito baixas em meio aquoso, constitui uma vantagem também poder empregar quantidades maiores do que as acima indicadas. Para aumentar a transformação e o rendimento, a reacção é com vantagem realizada mediante adição contínua do nitrilo racémico. É possível isolar o produto depois do fim da reacção ou então removê-lo em contínuo numa derivação.
Os aldeídos ou as cetonas correspondentes acima mencionados tratam-se de compostos que formam o nitrilo, depois da reacção entre o aldeído ou a cetona e o ácido cianídrico, eventualmente mediante catálise ácida. A reacção entre aldeído e ácido cianídrico leva a ciano-hidrinas, que têm a vantagem de encontrarem-se em equilíbrio com aldeído e ácido cianídrico. Através do ajuste do equilíbrio da ciano-hidrina, é possível, com uma enzima que transforma apenas um enantiómero do nitrilo, chegar-se apesar disso a 100% de rendimento na teoria, visto que o nitrilo racémico é fornecido suplementarmente em contínuo. No caso de todos os outros nitrilos, o nitrilo não transformado de forma enzimática (= enantiómero "errado" ou outro) é com vantagem racemizado por meio de uma reacção química e de novo introduzido no processo, de modo a ser possível atingir um 16 rendimento teórico de 100%; é rejeitado ou purificado, e é saponificado de forma química, indo obter-se o estereocentro. O processo segundo a invenção é com vantagem realizado a uma temperatura entre 0 e 80 °C, de preferência entre 10 e 60 °C, com especial preferência entre 15 e 50 °C .
Os nitrilos racémicos no processo segundo a invenção, tratam-se de nitrilos que consistem numa mistura de 50 : 50 dos dois enantiómeros ou de outra mistura opcional, com uma concentração de um dos dois enantiómeros na mistura.
Os ácidos carboxílicos quirais tratam-se, no processo segundo a invenção, daqueles que mostram uma concentração enantiomérica. Com preferência, atinge-se no processo níveis de pureza enantiomérica de pelo menos 90% ee, de preferência de pelo menos 95% ee, com especial preferência de pelo menos 98% ee, com total preferência de 99% ee no mínimo. O processo segundo a invenção permite a transformação de uma grande multiplicidade de nitrilos racémicos nos ácidos carboxílicos quirais. No processo é possível transformar pelo menos 25 mmoles de nitrilo/h x mg de proteína ou pelo menos 25 mmoles de nitrilo/h x g de peso a seco dos microorganismos, de preferência pelo menos 30 mmoles de nitrilo/h x mg de proteína ou pelo menos 30 mmoles de nitrilo/h x g de peso a seco, com especial preferência pelo menos 40 mmoles de nitrilo/h x mg de proteína ou pelo menos 40 mmoles de nitrilo/h x g de peso a seco, com total preferência pelo menos 50 mmoles de nitrilo/h x mg de proteína, ou pelo menos 50 mmoles de nitrilo/h x g de peso 17 a seco.
No processo segundo a invenção, é possível utilizar células de crescimento que contêm os ácidos nucleicos, os constructos de ácidos nucleicos ou os vectores segundo a invenção. Também é possível utilizar células latentes ou desintegradas. As células desintegradas tratam-se, por exemplo, de células que ficam permeáveis por meio dum tratamento com, por exemplo, solventes, ou células que foram abertas por meio dum tratamento enzimático, de um tratamento mecânico (por exemplo, French Press ou ultra-sons) ou de outro método. Os extractos brutos assim obtidos são com vantagem adequados ao processo de acordo com a invenção. Também é possível utilizar enzimas purificadas ou especificamente purificadas, que podem com vantagem ser utilizadas na reacção.
Os ácidos carboxílicos quirais, produzidos no processo segundo a invenção, podem ser com vantagem obtidos da solução de reacção aquosa, por meio de extracção ou de cristalização, ou então por meio de extracção e de cristalização. Neste intuito, a solução de reacção aquosa é acidulada com um ácido como um ácido mineral (por exemplo, HC1 ou H2SO4) ou um ácido orgânico, com vantagem para valores de pH inferiores a 2 e, em seguida, é extraída com um solvente orgânico. A extracção pode ser repetida várias vezes para aumentar 0 rendimento. Como solvente orgânico, é em princípio possível empregar todos os solventes que mostram com água um limite de fase, eventualmente após a adição de sais. Os solventes favoráveis são solventes como tolueno, benzeno, hexano, éter metilterc.-butílico ou éster acético. 18
Depois da concentração da fase orgânica, é normalmente possível obter os produtos com bons níveis de pureza química, ou seja, mais de 90% de pureza química. Depois da extracção, a fase orgânica pode ser concentrada com o produto, mas também apenas parcialmente concentrada, e o produto pode ser cristalizado. Para isso, convém arrefecer a solução para uma temperatura de 0 °C - 10 °C . A cristalização também pode ocorrer directamente a partir da solução orgânica. O produto cristalizado pode ser ainda deitado num solvente igual ou noutro para a recristalização e voltar a ser cristalizado. Através da posterior cristalização realizada pelo menos uma vez, é possível aumentar mais a pureza enantiomérica do produto consoante o ponto do eutéctico.
No entanto, os ácidos carboxílicos quirais também podem ser cristalizados directamente depois da acidulação com um ácido, para um valor de pH que convém ser inferior a 2, a partir da solução de reacção aquosa. Com vantagem, a solução aquosa é para isso concentrada mediante aquecimento e reduzida no seu volume em 10 - 90%, de preferência 20 -80%, com especial preferência em 30 - 70%. Em termos preferenciais, a cristalização é levada a cabo mediante arrefecimento. Prefere-se para a cristalização temperaturas entre 0 e 10 °C. Por motivos de custos, prefere-se a cristalização directa a partir da solução aquosa. Igualmente preferido é um processamento final dos ácidos carboxílicos quirais, por meio de uma extracção e, eventualmente, posterior cristalização. com
Nestes tipos preferidos de processamento final, é possível isolar o produto do processo segundo a invenção com rendimentos de 60 a 100%, de preferência de 80 a 100% 19 especial preferência de 90 a 100%, em relação ao nitrilo empregue na reacção. O produto isolado distingue-se por uma alta pureza quimica > 90%, de preferência > 95%, com especial preferência > 98%. Além disso, os produtos têm uma elevada pureza enantiomérica, que pode ser ainda mais aumentada pela cristalização.
Os produtos assim obtidos adequam-se como material de partida a sínteses orgânicas para o fabrico de fármacos ou de produtos agro-químicos, ou para a dissociação de racematos.
Outro objecto da invenção é uma sequência isolada de ácidos nucleicos, que codifica um polipéptido com actividade de nitrilase, escolhida do grupo: a) uma sequência de ácidos nucleicos com a sequência representada na SEQ ID NO: 1, b) sequências de ácidos nucleicos que derivam como resultado do código genético degenerado da sequência de ácidos nucleicos representada na SEQ ID NO: 1, c) homólogos da sequência de ácidos nucleicos representada na SEQ ID NO: 1, que codificam polipéptidos que apresentam pelo menos 98% de homologia em toda a área da sequência em relação à SEQ ID NO: 2, sem que haja redução na acção enzimática dos polipéptidos.
Os homólogos da sequência de ácidos nucleicos segundo a invenção com a sequência SEQ ID NO: 1 tratam-se, por exemplo, de variantes de alelos que apresentam pelo menos 98% de homologia em toda a área da sequência. Em áreas 20 parciais das sequências, é com vantagem que os niveis de homologia são mais elevados. A sequência de aminoácidos derivada da SEQ ID NO: 1 pode ser vista na SEQ ID NO: 2. As variantes de alelos abrangem sobretudo variantes funcionais, que podem ser obtidas por delecção, inserção ou substituição de nucleótidos da sequência representada na SEQ ID NO: 1, devendo a actividade enzimática das proteínas sintetizadas derivadas, para a introdução de um ou mais genes num organismo, ser contudo obtida sem ser essencialmente reduzida. A invenção é com isto também relativa a sequências de aminoácidos, que são codificadas pelo grupo acima representado de sequências de ácidos nucleicos. Com vantagem, a invenção é relativa a sequências de aminoácidos que são codificadas pela sequência SEQ ID NO: 1.
Além disso, os homólogos da SEQ ID NO: 1 tratam-se, por exemplo, de homólogos fúngicos ou bacterianos, sequências encurtadas, ADN de cadeia única ou arn da sequência de adn codificadora e não codificadora. Os homólogos da SEQ ID NO: 1 têm, a nível de ADN, uma homologia de pelo menos 60%, de preferência de pelo menos 70%, com especial preferência de pelo menos 80%, com total preferência de pelo menos 90% em toda a área de ADN indicada na SEQ ID NO: 1.
Além disso, os homólogos da SEQ ID NO: 1 são derivados, como, por exemplo, variantes de promotores. Os promotores, que se encontram antes nas sequências indicadas de nucleótidos, podem ser modificados por uma ou mais trocas de nucleótidos, por meio de inserção ou de inserções e/ou de delecção ou de delecções, sem contudo prejudicar a funcionalidade ou a eficácia dos promotores. Além disso, os promotores podem aumentar a sua eficácia por meio de 21 alteração da respectiva sequência, ou serem totalmente trocados por promotores mais eficazes também de organismos de outros tipos.
Os derivados tratam-se também de variantes cuja sequência de nucleótidos foi de tal forma modificada - na gama de -1 a -200 antes do codão inicial, ou de 0 a 1 000 pares de bases depois do codão de terminação- que a expressão genética e/ou a expressão proteica é alterada, de preferência aumentada.
Com vantagem, é possível isolar a SEQ ID NO: 1 ou os seus homólogos de bactérias, de preferência de bactérias gram-positivas, com especial preferência de bactérias do género Alcaligenes, com total preferência de bactérias do género e da espécie Alcaligenes faecalis, por intermédio dos métodos conhecidos do especialista. A SEQ ID NO: 1 ou os seus homólogos, ou partes destas sequências, pode ser isolada ou podem ser isolados com, por exemplo, processos de hibridização ou com a técnica PCR a partir de outros fungos ou bactérias. Estas sequências de ADN hibridizam com as sequências de acordo com a invenção sob condições padrão. Na hibridização, emprega-se com vantagem oligonucleótidos curtos das áreas conservadas, por exemplo do centro activo, que podem ser determinados através de comparações com outras nitrilases ou nitrilo hidratases de forma conhecida do especialista. No entanto, também é possível utilizar para a hibridização fragmentos mais compridos dos ácidos nucleicos segundo a invenção ou as sequências completas. Consoante o ácido nucleico utilizado - oligonucleótido, fragmento mais comprido ou sequência completa, ou consoante qual o tipo de ácido 22 nucleico ADN ou ARN que é empregue na hibridização - assim variam estas condições padrão. Por conseguinte, as temperaturas de fusão, por exemplo, para híbridos de ADN : ADN encontram-se cerca de 10 °C abaixo das dos híbridos de ADN : ARN com o mesmo comprimento.
As condições padrão são, por exemplo e em função do ácido nucleico, temperaturas entre 42 e 58 °C numa solução tampão aquosa, com uma concentração entre 0,1 e 5 x SSC (1 x SSC = 0,15 M NaCl, 15 mM citrato de sódio, pH de 7,2) ou ainda na presença de 50% de formamida, como, por exemplo, 42 °C em 5 x SSC, 50% de formamida. Em termos vantajosos, as condições de hibridização para hibridos de ADN : ADN são 0,1 x SSC e temperaturas entre cerca de 20 °C e 45 °C, de preferência entre cerca de 30 °C e 45 °C. Para os hibridos de ADN : ARN, as condições de hibridização são com vantagem 0,1 x SSC e temperaturas entre cerca de 30 o O CD 55 °C, de preferência entre cerca de 45 °C e 55 °C. Estas temperaturas indicadas para a hibridização são, por exemplo, valores de temperaturas de fusão calculados para um ácido nucleico com um comprimento de cerca de 100 nucleótidos e um teor de G + C de 50%, na ausência de formamida. As condições experimentais para a hibridização de ADN encontram-se descritas em compêndios relacionados de genética, como, por exemplo, Sambrook et al., "Molecular Cloning", Cold Spring Harbor Laboratory, 1989, e podem ser calculadas com as fórmulas conhecidas do especialista em função, por exemplo, do comprimento dos ácidos nucleicos, do tipo dos hibridos ou do teor de G + C. Outras informações acerca da hibridização podem ser tiradas pelo especialista dos seguintes compêndios; Ausubel et al. (eds), 1985, "Current Protocols in Molecular Biology", John Wiley & Sons, Nova Iorque; Hames and Higgins (eds), 1985, 23 "Nucleic Acids Hybridization: A Practical Approach", IRL Press at Oxford University Press, Oxford; Brown (ed), 1991, "Essential Molecular Biology: A Practical Approach", IRL Press at Oxford University Press, Oxford. 0 constructo de ácidos nucleicos de acordo com a invenção trata-se da sequência do gene da nitrilase SEQ ID NO: 1 e dos seus homólogos, que foram ligados com vantagem de forma funcional a um ou mais sinais de regulação, para aumentar a expressão genética. A titulo de exemplo, estas sequências reguladoras tratam-se de sequências a que se ligam indutores ou repressores, regulando assim a expressão do ácido nucleico. Além destas novas sequências de regulação, a regulação natural destas sequências ainda pode existir antes dos genes estruturais propriamente ditos, e pode eventualmente ter sido modificada de forma genética, pelo que a regulação natural foi desligada e a expressão dos genes foi aumentada. No entanto, o constructo de ácidos nucleicos também pode ser construído de forma simples, ou seja, não foram inseridos sinais de regulação adicionais antes da sequência SEQ ID NO: 1 ou os respectivos homólogos, e o promotor natural com a sua regulação não foi removido. Em vez disso, ocorre de tal forma a mutação da sequência de regulação natural, que não ocorre mais regulação e a expressão genética é aumentada. 0 constructo de ácidos nucleicos também pode ainda com vantagem conter uma ou mais das denominadas "enhancer sequences" ligadas de forma funcional ao promotor, que permitem uma maior expressão da sequência de ácidos nucleicos. Também na extremidade 3' das sequências de ADN, é possível inserir sequências favoráveis adicionais, como outros elementos ou terminadores reguladores. Os ácidos nucleicos de acordo com a invenção podem estar contidos numa ou mais cópias no 24 constructo. No constructo podem ainda estar contidos outros marcadores, como genes que complementam auxotropias ou niveis de resistência a antibióticos, eventualmente para a selecção no constructo.
As sequências de regulação favoráveis ao processo de acordo com a invenção estão, por exemplo, em promotores como os promotores cos, tac, trp, ter, trp-tet, lpp, lac, lpp-lac, laclq~, T7, T5, T3, gal, trc, ara, SP6, X-PR ou λ-PL, que podem ser com vantagem aplicadas em bactérias gram-positivas. Outras sequências de regulação favoráveis estão, por exemplo, nos promotores gram-positivos amy e SP02, nos promotores de leveduras ou fúngicos ADC1, MFa, AC, P-60, CYC1, GAPDH, TEF, rp28, ADH. Neste contexto, também são favoráveis os promotores da piruvato decarboxilase e da metanol oxidase de, por exemplo, Hansenula. Também é possível empregar promotores sintéticos na regulação. 0 constructo de ácidos nucleicos é inserido para a expressão num organismo hospedeiro, com vantagem num vector, como, por exemplo, um plasmídeo, um fago ou outro ADN, indo permitir uma expressão óptima dos genes no hospedeiro. Estes vectores representam outra concepção da invenção. Os plasmídeos apropriados estão, por exemplo, em E. coli pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHSl, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-Ill113-Bl, Xgtll ou pBdCl, em Streptomyces pIJlOl, pIJ364, pIJ702 ou pIJ361, em Bacillus pUBUO, pC194 ou pBD214, em Corynebacterium pSA77 ou pAJ667, em fungos pALSl, pIL2 ou pBBll6, em leveduras 2qcm, pAG-1, ΥΕρβ, YEpl3 ou pEMBLYe23 ou em plantas pLGV23, pGHlac*, pBINl9, pAK2004 ou pDH51. Os plasmídeos mencionados representam uma pequena escolha dos 25 plasmídeos possíveis. Outros plasmídeos são bem conhecidos do especialista e podem ser retirados do livro "Cloning Vectors" (Eds. Pouwels P. H. et al. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0 444 904018).
Em termos vantajosos, o constructo de ácidos nucleicos para a expressão dos outros genes presentes, contém ainda adicionalmente sequências reguladoras de terminação 3' e/ou 5' para aumentar a expressão, que são escolhidas para uma expressão óptima em função do organismo hospedeiro escolhido e do gene ou dos genes.
Estas sequências reguladoras deverão possibilitar a expressão dirigida dos genes e a expressão proteica. Consoante o organismo hospedeiro, isto poderá significar que o gene só é expresso ou superexpresso depois de indução, ou que é logo expresso ou superexpresso.
Neste caso, as sequências ou os factores reguladores podem preferencialmente influenciar de forma positiva a expressão genética dos genes introduzidos e, assim, aumentá-la. Deste modo, pode de forma vantajosa ocorrer um reforço dos elementos reguladores ao nível da transcrição, ao empregar-se sinais de transcrição fortes, como promotores e/ou "enhancers". A par disto, também é possível um reforço da translação, ao melhorar, por exemplo, a estabilidade do ARNm.
Noutra forma de concepção do vector, o constructo de ácidos nucleicos de acordo com a invenção ou o vector que contém o ácido nucleico de acordo com a invenção também pode ser com vantagem introduzido na forma dum ADN linear nos microorganismos, e ser integrado por recombinação 26 heteróloga ou homóloga no genoma do organismo hospedeiro. Este ADN linear pode consistir num vector linearizado como um plasmideo, ou apenas no constructo de ácidos nucleicos ou no ácido nucleico.
Para uma expressão óptima de genes heterólogos nos organismos, convém alterar as sequências de ácidos nucleicos em conformidade com o "codon usage" especifico utilizado no organismo. 0 "codon usage" pode ser facilmente determinado com base em análises computadorizadas de outros genes conhecidos do organismo em causa.
Os organismos hospedeiros em questão para o ácido nucleico em conformidade com a invenção ou o constructo de ácidos nucleicos, são em principio todos os organismos procariontes ou eucariontes. Em termos vantajosos, utiliza- se como organismos hospedeiros, microorganismos como bactérias, fungos ou leveduras. Como vantagem, utiliza-se bactérias gram-positivas ou gram-negativas, de preferência bactérias da familia Enterobacteriaceae ou Nocardiaceae, com especial preferência bactérias dos géneros Escherichia, Pseudomonas ou Rhodococcus. É dada total preferência ao género e à espécie Escherichia coli.
Neste caso, o organismo hospedeiro de acordo com a invenção contém, preferencialmente, pelo menos um agente proteico para dobrar os polipéptidos sintetizados por ele e, em particular, as sequências de ácidos nucleicos descritas nesta invenção com actividade de nitrilase e/ou o gene que codifica este agente, encontrando-se este agente numa quantidade superior à que corresponde à quantidade de base do microorganismo tido em consideração. Os genes que codificam este agente estão contidos no cromossoma ou em 27 elementos extracromossómicos como, por exemplo, plasmídeos. Exemplos
Exemplo 1: Purificação da nitrilase da Alcaligenes faecalis 1650 1. Produção das células
Fez-se a cultura de Alcaligenes faecalis 1650 nos 30 °C durante 8 horas no meio de cultura A sob agitação.
Meio de cultura A:
Extracto de levedura 5 g/1
Peptona 3,5 g/1 CH3CO2NH4 5 g/1 KH2PO4 5 g/1
MgSCg 0,2 g/1
FeS04 0,03 g/1
NaCl 1 g/1
Butironitrilo 1 g/1
Com 200 ml desta cultura prévia, inoculou-se um fermento de 10 1 com 8 1 do meio fresco A. O pH, a temperatura, a corrente de ar e a velocidade de agitação eram de 7,2; 30 °C, 300 1/h e 300 rpm. Passadas 22 horas, obteve-se 81 g de massa celular molhada. Isto corresponde a um peso celular a seco de 3,8 g/1 e a uma densidade óptica nos 600 nm de 8. 2. Determinação da actividade enzimática em relação ao mandelonitrilo
Obteve-se as células como descrito no exemplo 1, e lavou-se duas vezes em 10 mM tampão fosfato de Na/k, pH de 7,2. 40 mg do peso celular a seco foram ressuspensos em 20 ml de 10 28
mM tampão fosfato de Na/k, pH de 6,8; e a reacção foi iniciada pela adição de 8,3 mM mandelonitrilo. A reacção foi realizada mediante agitação nos 40 °C. A cinética da dissociação de racematos foi seguida por tiragem de amostras e posterior separação celular recorrendo a cromatografia liquida de alta resolução/HPLC (ODS
Hypersil). Neste caso, determinou-se mandelonitrilo, benzaldeido, amida do ácido mandélico e ácido mandélico. Os resultados estão representados na figura 1 [Transformação do mandelonitrilo (= nitrilo do ácido mandélico) no ácido mandélico, batch]. A velocidade de formação do ácido mandélico é de 41,3 U/g de peso celular a seco com uma transformação de 30%, estando 1 U definido como 1 ocmol do ácido mandélico que é formado por minuto nos 40 °C. 3. Determinação da selectividade enzimática em relação ao mandelonitrilo
Obteve-se as células como descrito no exemplo 1 e lavou-se duas vezes em 10 mM tampão fosfato de Na/k, pH de 7,2. 40 mg do peso celular a seco foram ressuspensos em 20 ml de 10 mM tampão de fosfato de Na/k, pH de 6,8, e a reacção foi iniciada pela adição de 8,3 mM mandelonitrilo. A reacção foi realizada mediante agitação nos 30 °C. A cinética foi seguida por tiragem de amostras e posterior separação celular recorrendo a HPLC (Nucleodex β-ΡΜ). Neste caso, determinou-se ácido S-(+)-mandélico e ácido (R)—(—)— mandélico. A pureza óptica do ácido R-(-)-mandélico formado (eeR_Ms) era de 98% com 50% de transformação. A selectividade da enzima (= E) era de 50% de transformação com 499. 4. Purificação
Em todos os tampões estavam presentes 10 mM DTT durante a 29 purificação - caso nada seja expresso em contrário.
Etapa 1: Desintegração celular
As células de duas fermentações de 10 1 cada uma foram pesadas como descrito no exemplo 1, foram separadas por centrifugação e foram lavadas duas vezes com 1 1 de 0,1 M tampão Tris/HCl, pH de 7,2. O rendimento era de cerca de 162 g de massa celular a húmido. Ressuspendeu-se cada 81 g de massa celular a húmido em 160 ml de 0,1 M tampão Tris/HCl, pH de 7,2; e desintegrou-se 4 vezes num Manton-Gaulin nos 750 bar. O homogenado foi depois centrifugado durante 30 min com 30 000 g e o pelete foi rejeitado. O residuo (140 ml) tinha uma actividade residual de 73% como representado na tabela 1.
Etapa 2: Cromatografia de permuta iónica O residuo foi diluído com tampão A (20 mM Tris/HCl, pH de 8,5) para 400 ml e de novo centrifugado com 23 000 g durante 20 min. 350 ml foram depois aplicados numa coluna de Q-Sepharose (5 cm de diâmetro, 22 cm de altura, 432 ml de volume, Q-Sepharose Fast Flow da Pharmacia) no tampão A. Com um fluxo de 20 ml/min, lavou-se primeiro com 10% do tampão B (como tampão A com 1 M NaCl) (volume total de aplicação e de lavagem correspondia a 1,5 1). No decorrer de 90 min, ocorreu um aumento linear da relação até aos 60% de B. De 91 a 120 min, lavou-se depois com 100% do tampão B. Reuniu-se 100 fracções de 40 ml. A nitrilase sofreu eluição entre as fracções 50 e 60. As fracções foram juntadas e foram concentradas por ultrafiltração através de uma membrana de 10 kDa (Amicon) para um volume de 10 ml.
Etapa 3: Cromatografia por filtro molecular O concentrado da cromatografia de permuta iónica (etapa 2) 30 foi mais purificado em duas porções até 5 ml cada uma, através de cromatografia por filtro molecular (Superdex 200 prep. grade, Pharmacia, área de separação de 10 até 600 kDa, 2,6 cm de diâmetro, 60 cm de altura, 325 ml de volume) . A detecção foi feita nos 280 nm. A coluna foi equilibrada em 20 mM tampão fosfato, pH de 7,4, 5 mM DTT e 150 mM NaCl; e foi operada com um fluxo de 1,5 ml/min. Reuniu-se 40 fracções. A actividade de nitrilo-saponificação encontrava-se nas fracções 3 a 5.
Etapa 4: Cromatografia de permuta iónica
As fracções juntadas da cromatografia por filtro molecular (etapa 3) foram mais purificadas através de cromatografia de permuta iónica, através duma coluna Mono Q (1 ml de volume de coluna, Mono Q HR515, Pharmacia). Como tampão A faz-se uso de 20 mM Tris/HCl, pH de 8,5, 5 mM DDT; como tampão B usa-se o mesmo tampão de A com 1 M NaCl. A velocidade de fluxo era de 1 ml/min. A fracção com valor, diluida para uma condutibilidade de cerca de 6 mS/cm da cromatografia por filtro molecular (cerca de 100 ml), foi directamente deitada na coluna Mono Q e a proteína foi assim adsorvida. A coluna foi lavada, depois da aplicação, com 5% do tampão B. A coluna foi eluída em 30 min com um gradiente de 5 a 40% de B, a que se seguiu 100% de B durante 10 minutos. A eluição da nitrilase ocorreu na fracção 17 e na 18 do gradiente.
As etapas 1 - 4 da purificação são reproduzidas na tabela I. 31
Tabela I: Esquema de purificação
Amostra Vol. [ml] Acti- vidade [U/l] Activi- dade total [mU] Rendi mento [%] Proteína [mg/ml] Proteína total [mg] Activi- dade esp. [U/g] Antes da desintegração 160 480 76800 100 Após desintegração 140 400 5600 72, 9 Q-Sepharose Aplicação 140 192 26880 35 12, 4 1736 15 FV 400 77 30800 40, 1 0,26 104 296 Superdex 200 Aplicação 9,5 >378 >3591 4,7 2,41 22,90 >157 FV 43 59 2537 3,3 0,21 9,03 281 Mono Q Aplicação 100 4,8 480 0,6 0,06 6, 33 76 FV 4 >77 308 0,4 0,19 0, 76 >405
As fracções com valor (= FV, tabela I) da cromatografia por filtro molecular (etapa 3) e da cromatografia de permuta iónica através de mono Q (etapa 4), foram separadas por SDS-PAGE como representado na figura 2.
Etapa 5: RP-HPLC (cromatografia liquida de alta resolução de fase reversa) A fracção com valor (fracção 17 e 18) da cromatografia por Mono Q (etapa 4) foi testada por cromatograf ia de fase reversa (RP) em termos de homogeneidade, e foi mais purificada para a preparação de uma separação de tripsina. Na separação empregou-se uma coluna (3 cm) de Abimed num equipamento Hewlett-Packard (HP 1090) . Como agente de controlo da fluidez, empregou-se tampão A: água com 0,1% de TFA, e tampão B: acetonitrilo com 0,1% de TFA. 0,1 ml de 32 volume de injecção, 0,5 ml/min de velocidade de fluxo. O gradiente de eluição tinha a seguinte evolução:
Minutos % do tampão A % do tampão B 0 80 20 2 80 20 22 30 70 22, 1 0 100 24 0 100 25 100 0 30 100 0 A nitrilase sofreu eluição nos 12 - 13 minutos. No SDS-PAGE isto correspondia a uma faixa de 37 kDa. Esta faixa foi sequenciada. Empregou-se o sequenciador "494 Procise Protein Sequenzer" da empresa Applied Biosystems. A sequência de terminação N assim obtida de 39 aminoácidos é seguidamente designada por SEQ ID NO: 3. A sequência está apresentada na lista anexa das sequências, sendo: Met Gin Thr Arg Lys Ile Vai Arg Ala Ala Ala Vai Gin Ala Ala Ser Pro Asn Tyr Asp Leu Ala Thr Gly Vai Asp Lys Thr Ile Glu Leu Ala Arg Gin Ala Arg Asp Glu Gly.
Produção de péptidos trípticos A amostra da cromatografia com Mono Q (etapa 4) foi previamente tratada como se segue: a proteína (cerca de 0,6 mg) foi precipitada através de 12,5% de TCA e o pelete foi lavado três vezes com 1 ml de éter/etanol (1 : 1) . O pelete foi dissolvido em 0,2 ml de 6 M guanidina HC1, 25 mM Tris/HCl, pH de 8,5. A esta solução, adicionou-se 2,6 ocl de uma solução de DTT 1 M para a redução das pontes de dissulfureto. A amostra foi agitada durante uma hora no escuro. Em seguida, a proteina foi transformada com 1,5 ocl de uma solução de 4-vinilpiridina (35%), durante 2 horas no 33 escuro. A reacção foi terminada por incubação durante 1 hora com 2,6 <xl de uma solução de DTT 1 Μ. A enzima vinilpirrilidada foi purificada por RP-HPLC como acima descrito. 0 tempo de retenção era então de 10 - 11 minutos. A fracção com valor, identificada pelo respectivo peso molecular, foi recolhida e concentrada para 0,02 ml. Para isso, adicionou-se 0,01 ml de acetonitrilo e 0,1 M Tris/HCl, pH de 8,5 ad 0,2 ml. Para a correcção do valor de pH, adicionou-se ainda cerca de 0,05 ml de 0,1 M NaOH. A amostra (0,3 mg de quantidade proteica estimada) foi misturada com 0,032 ml de uma solução de tripsina de 1 mg/ml em 0,1 M Tris/HCl, pH de 8,5, 5% de acetonitrilo, e foi incubada durante a noite nos 37 °C. A digestão foi parada com 0,01 ml de ácido acético e depois centrifugada. O resíduo foi separado por RP-HPLC para C18. (sistema de controlo da fluidez: tampão A: água, 0,1 de TFA, tampão B: acetonitrilo, 0,1% de TFA). Os péptidos (detecção nos 205 nm e 280 nm) foram reunidos e sequenciados. Empregou-se o sequenciador "494 Procise Protein Sequenzer" da empresa Applied Biosystems. A sequência peptídica interna de 21 aminoácidos é seguidamente designada por SEQ ID NO: 4, a sequência peptídica interna de 11 aminoácidos por SEQ ID NO: 5. As SEQ ID NO: 4 e 5 encontram-se apresentadas na lista anexa das sequências, sendo: SEQ ID NO : 4
Glu Glu Ala Pro Glu Gin Gly Vai Gin Ser Lys Ile Ala Ser Vai Ala Ile Ser His Pro Gin SEQ ID NO : 5
Glu Glu Ala Pro Glu Gin Gly Vai Gin Ser Lys 6. Actividade da nitrilase purificada em relação ao mandelonitrilo A actividade da nitrilase purificada em relação ao 34 mandelonitrilo foi estudada como descrito no exemplo 2. A actividade especifica da proteina purificada em relação ao mandelonitrilo era de 12 380 U/g de proteina.
Exemplo 2: Clonagem da nitrilase a partir de Alcaligenes faecalis 1650 A partir das sequências peptidicas representadas no exemplo 1 SEQ ID NO: 3 e 4, derivou-se e sintetizou-se sondas nucleotidicas. Da SEQ ID NO: 3, a sequência peptidica de terminação N, a sonda nucleotidica derivada era um 23mero, degenerado 64 vezes (na sequência da sonda nucleotidica, substitui-se A, C, G ou T por N; A ou G por R; C ou G por S). Através da grande percentagem de GC das estirpes descritas na literatura de Alcaligenes (Wada et al., 1992, "Nucl. Acids. Res.", 20, 2111 - 21118) foi previamente dada a escolha da terceira posição do codão no caso da glutamina e da isoleucina. A sonda nucleotidica, que é seguidamente denominada SEQ ID NO: 6, representa o 5'-primer para a seguinte PCR, em que S = C ou G e N = A, C, G ou T, sendo: SEQ ID NO : 6 5'-AT GCAGACNAGNAARATCGTSCG-3'
Da SEQ ID NO: 4, da sequência peptidica interna, derivou-se um 20mero como sonda nucleotidica e degenerou-se 256 vezes (na sequência das bases nucleotidicas, substitui-se A, C, G ou T por N; A ou G por R; C ou G por S) . Devido à grande percentagem de GC das estirpes de Alcaligenes, a escolha da terceira posição do codão foi previamente dada no caso da lisina. Esta sonda nucleotidica representa o 3'-primer para a posterior PCR e é seguidamente designada por SEQ ID NO: 7. Encontra-se apresentada na lista anexa das sequências, sendo: 35 SEQ ID NO : 7 5' -TNGCSACNGANGCRATCTTG-3'
Recorrendo a este par de primers, SEQ ID NO: 6 e 7, realizou-se a PCR em ADN cromossómico da Alcaligenes faecalis 1650. O isolamento de ADN cromossómico decorreu por lise celular com lisozima e tratamento com proteinase K pelo método clássico conhecido do especialista (Ausubel, F. M. et al. (1994) "Current protocols in molecular biology", John Wiley and Sons).
Mediante a utilização da Pwo-polimerase, a PCR tinha uma desnaturação durante 3 min nos 95 °C; 35 ciclos com uma desnaturação durante 1 min nos 95 °C, uma adição de primers durante 1 min e 30 s nos 58 °C, e uma polimerização durante 1 min e 30 s nos 72 °C; e uma polimerização de terminação durante 5 min nos 72 °C.
Sob estas condições, amplificou-se, a partir do ADN cromossómico da Alcaligenes faecalis 1650, um fragmento com um tamanho aproximado de 1 kb. Para a clonagem do produto da PCR, juntou-se a cada um dos primers já mencionados uma interface de restrição Xbal e dois nucleótidos adicionais (5'-AATCTAGA ou 5'-ATTCTAGA) e repetiu-se a reacção PCR sob as condições acima mencionadas. Amplificou-se de novo um fragmento com um tamanho de cerca de 1 kb, que foi ligado, depois da purificação e de digestão de Xbal, ao pUC18 digerido de forma análoga. Depois da transformação de E. coli JM109 e do isolamento do plasmideo resultante, verificou-se o ADN por sequenciamento e posterior Southern Blot genómico. Os métodos de biologia molecular e de microbiologia para o isolamento do gene completo da nitrilase (nit) decorreram de acordo com os métodos 36 clássicos conhecidos do especialista. A sequência completa da nitrilase está representada na SEQ ID NO: 1.
Exemplo 3: Homologia com outras proteínas, identificação da sequência homóloga A comparação com sequências do banco de dados de proteínas SWISSPROT mostrou que o gene da nitrilase desta invenção tem 11 a 96% de homologia em relação às nitrilases conhecidas, a nível de aminoácidos. A maior homologia de sequências foi encontrada para a nitrilase específica de arilacetonitrilo da Alcaligenes faecalis JM3 (Nagasawa et al., "Eur. J. Biochem." 1990, 194, 765 - 772). Os dois genes da nitrilase apresentam uma identidade de 93,2% a nível de nucleótidos numa área de 1071 bp. A sequência de aminoácidos derivada apresenta uma identidade de 96,1% numa área de 356 aminoácidos. A menor homologia de 11,4% numa área de 534 aminoácidos foi encontrada para a nitrilase de Rhodococcus erythropolis SK92 (EP A 0 719 862) .
Exemplo 4: Expressão heteróloga da nitrilase em E. coli
Para a clonagem no vector de expressão pJOE2702, amplificou-se o gene nit. Neste caso, escolheu-se como 5'-primer para a PCR, a SEQ ID NO: 3 acima referida, tendo-se juntado na extremidade do nit 5' uma interface Ndel que se sobrepõe ao início da translação. Este primer é seguidamente denominado SEQ ID NO: 8 e encontra-se apresentado na lista anexa de sequências. Como 3'-primer, escolheu-se um 24mero da área 3' do gene nit, tendo-se juntado a ele uma interface BamHI adjacente ao codão de terminação. É seguidamente denominado SEQ ID NO: 9 e encontra-se apresentado na lista de sequências que se 37 segue. 5'-TTAATCATATGCAGACAAGAAAAATCGTCCG-3' (= SEQ ID NO: 8) 5'-AAGGATCCTCAAGACGGCTCTTGCACTAGCAG-3' (= SEQ ID NO : 9)
Mediante a utilização da Pwo-polimerase, a PCR continha uma desnaturação de 3 min nos 94 °C; 25 ciclos com uma desnaturação de 1 min nos 93 °C, uma adição de primers de 1 min e 30 s nos 55 °C, e uma polimerização de 1 min e 30 s nos 72 °C ou uma polimerização de terminação durante 5 min nos 72 °C. O fragmento de PCR obtido foi purificado, foi digerido com Ndel/BamHI e integrado no vector digerido de forma análoga pJOE2702 (Volff et al., 1996, "Mol. Microbiol.", 21(5), 1037 - 1047). O plasmideo resultante foi designado por pDHE 19.2 e está representado na figura 3. Através da integração por meio das interfaces Ndel/BamHI, o gene nit está no plasmideo pDHEl9.2 sob controlo de transcrição do promotor rhap contido no pJOE2702, proveniente do operão L-ramnose rhaBAD regulado de forma positiva em E. coli (Egan & Schleif, 1994, "j. Mol. Biol.", 243, 821-829). A terminação da transcrição do gene nit e a iniciação da translação também ocorreram por meio de sequências de vectores. A par disto, o plasmideo contém ainda um gene que confere a resistência à ampicilina ApR. A expressão heteróloga da nitrilase foi mostrada na estirpe E. coli JM109 contendo o plasmideo pDHEl9.2. Neste intuito, fez-se a cultura da estirpe JM109 (pDHEl9.2) no meio de cultura TB nos 37 °C, com 100 ocg/ml de ampicilina (Tartof, Hobbs 1987) sob agitação. Com OD60o de 1,7, procedeu-se a superinoculação da cultura de 1 : 200 em meio de TB fresco, que continha 0,2% (w/v) de L-ramnose para indução da nitrilase, e fez-se a sua cultura nos 30 °C sob agitação. 38
Passadas 8 horas, as células foram colhidas, foram lavadas com 10 mM tampão fosfato de Na/k, pH de 7,2, foram ressuspensas no mesmo tampão em conformidade com OD60o de 10 e desintegradas por tratamento com ultra-sons.
Exemplo 5: Determinação da actividade da nitrilase da estirpe recombinante E. coli JM109 (pDHEl9.2) 1. Produção das células
Fez-se a cultura de E. coli JM109 (pDHEl9.2) nos 37 °C
durante 6 horas em meio de TB + 100 ocg/ml de ampicilina sob agitação. Com OD60o de 4, inoculou-se com 100 ml desta pré-cultura um fermento de 10 1 com 8 1 de meio de TB fresco + 100 pg/ml de ampicilina + 2 g/1 de L-ramnose. O pH, a temperatura, a corrente de ar e a velocidade de agitação eram de 7,2, 30 °C, 300 1/h e 400 - 650 rpm.
Passadas 16 horas, as células foram colhidas. Nesta altura, a densidade óptica era de 18 nos 600 nm, o que correspondia a um peso celular a seco de 7,8 g/1. 2. Determinação da actividade especifica em relação ao mandelonitrilo
As células foram obtidas como descrito no exemplo 1 e criadas em 10 mM tampão fosfato de Na/K, pH de 7,2. 2 mg de peso celular a seco foram ressuspensos em 1 ml de 10 mM tampão fosfato de Na/K, pH de 7,2; e a reacção foi iniciada pela adição de 8,3 mM mandelonitrilo. A reacção foi levada a cabo sob agitação nos 40 °C. A cinética foi seguida por meio da tiragem de amostras e posterior HPLC (ODS Hypersil) . Neste caso, determinou-se mandelonitrilo,
benzaldeido, amida do ácido mandélico e ácido mandélico. A 39 velocidade de formação do ácido mandélico é de 403 U/g de peso celular a seco, com uma transformação de 30%, sendo 1 U definido por 1 ocmol de ácido mandélico, sendo formado por minuto nos 40 °C.
Exemplo 6: Síntese do ácido R-mandélico por meio de saponificação de mandelonitrilo, recorrendo a E. coli JM109 (pDHEl9.2) em suspensão
Num volume de 1 1 de 10 mM tampão fosfato de Na/K, pH de 7,2, que continha a estirpe E. coli JM109 (pDHEl9.2) numa concentração de 2 g/1, doseou-se nos 40 °C sob agitação com um agitador de folha durante 10 horas, mandelonitrilo numa concentração de 1,3 g/1. A dosagem foi regulada por meio do consumo de nitrilo. A velocidade de formação do ácido R-mandélico foi seguida como descrito no exemplo 5. Os resultados encontram-se representados na figura 4.
Exemplo 7: Obtenção do ácido R-mandélico por meio de extracção da preparação de reacção da saponificação do mandelonitrilo, por meio de E. coli JM109 (pDHEl9.2) em suspensão A preparação de reacção aquosa obtida no exemplo 6 de ácido mandélico foi libertada das células por centrifugação, foi ajustada com um ácido para um pH de 2 e extraída três vezes com éter metilterc.-butílico (MTBE). Depois de separação por evaporação do solvente orgânico do extracto de ácido mandélico, redissolveu-se os cristais de ácido mandélico brancos assim obtidos e os mesmos foram analisados em termos de pureza química e óptica por meio de HPLC. A pureza química era de 99%, a pureza óptica do ácido R-mandélico era de 97,4% ee. 40
Exemplo 8: Obtenção do ácido R-mandélico por meio de cristalização de arrefecimento, a partir da preparação de reacção da saponificação de mandelonitrilo por meio de E. coli JM109 (pDHEl9.2) em suspensão A preparação de reacção aquosa obtida no exemplo 6 de ácido mandélico foi libertada das células por centrifugação, foi concentrada mediante aquecimento e agitação para 40% do volume de partida, e foi ajustada com um ácido para um pH de 2. Por meio de arrefecimento no banho gélido, o ácido mandélico foi cristalizado e os cristais de ácido mandélico brancos assim obtidos foram aspirados por meio de um filtro e foram secos. Os cristais foram redissolvidos e foram analisados em termos de pureza química e óptica por meio de HPLC. A pureza quimica era de 99,1%, a pureza óptica do ácido R-mandélico era de 99,8% ee.
Exemplo 9: Transformação de diversos nitrilos
Com a estirpe E. coli (ver o exemplo 6) ou com a estirpe de partida de Alcaligenes, transformou-se diversos nitrilos. As células de Alcaligenes foram cultivadas em 400 ml de meio de Alcaligenes (ver acima o meio A) nos 30 °C e com 160 rpm durante 16 horas (= h). A colheita das células foi feita por centrifugação (30 min, 4 °C e com 5 000 rpm) . Pipetizou-se cada 150 ocl de uma suspensão celular por onda numa placa de microtitulação. A placa foi em seguida centrifugada. O resíduo foi aspirado e os peletes celulares foram lavados duas vezes com Na2HP04 (1, 42 g/1 em Finnaqua, pH de 7,2). Em seguida, pipetizou-se a solução de substrato (150 ocl) e voltou-se a ressuspender as células. De 12 em 12 séries da placa de microtitulação, procedeu-se a mistura com um substrato. Como controlo, tomou-se uma série com 41 solução de substrato sem células (= valor em branco).
As placas de microtitulação foram deixadas nos 30 °C e com 200 rpm durante 2 horas na incubadora de agitação. Depois disso, as células foram separadas por centrifugação e determinou-se no resíduo a quantidade originada de iões NH4, recorrendo ao equipamento Biomek. A medição foi feita nos 620 nm contra uma curva de calibração, que tinha sido produzida com diversas soluções de NH4OH (ver a figura 5). Como substratos, utilizou-se mandelonitrilo (= 1), 2- fenilpropionitrilo (= 2), 2-fenilbutironitrilo (= 3), cianeto de benzilo (= 4), cianeto de 4-clorobenzilo (= 5), cianeto de 4-bromobenzilo (= 6), propionitrilo (= 7), 2- metilbutironitrilo (= 8, 2-cianobutano), geranonitrilo (= 9), valeronitrilo (= 10), 3-cianopiridina (= 11), 3-bifenil-2-hidroxibutironitrilo (= 12), cianeto de 4- fluorobenzilo (= 13, 4-fluorofenilacetonitrilo) e alfa-(3-heptil)-nitrotriacetonitrilo (= 14). Os substratos foram postos com 0,2 moles em metanol e foram diluídos a partir desta solução-mãe com Na2HP04 (1,42 g/1 em Finnaqua, pH de 7,2) para 10 mM. As suspensões celulares foram normalizadas para 2 g/1 de biomassa seca. A tabela II reproduz os valores médios de uma série de placa de microtitulação na transformação. 42
Tabela II Transformação de diversos nitrilos com a nitrilase 1650 N.° do substrato ccmol/1 Actividade % de transformação 1 2141,2 8,9 86,3 2 1001,1 4,1 70,2 3 24, 4 0,1 44, 3 4 2210,5 9,2 100 5 2136,3 8,9 100 6 1500,8 6,2 100 7 4,9 0,02 NA 8 - - NA 9 - - NA 10 113, 4 0,47 NA 11 - - NA 12 - - NA 13 2222,9 9,2 100 14 84, 8 0,35 44, 1 A figura 6 reproduz os resultados da transformação na forma de valores de actividade.
PROTOCOLO DAS SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) AUTO DO PEDIDO: (A) NOME: BASF Aktiengesellschaft (B) RUA: Carl-Bosch-Strasse 38 (C) LOCALIDADE: Ludwigshafen (D) ESTADO ALEMÃO: Rheinland-Pfalz (E) PAÍS: Republica Federal Alemanha (F) CÓDIGO DO POSTAL: D-67056
(ii) TÍTULO DO PEDIDO: PROCESSO PARA O FABRICO DE ÁCIDOS CARBOX í LICOS QUIRAIS A PARTIR DE NITRILOS, RECORRENDO A UMA NITRILASE OU A MICROORGANISMOS QUE CONTÊM UM GENE PARA A NITRILASE (iii) NÚMERO DAS SEQUÊNCIAS: 9 43 (iv) FORMA LEGÍVEL POR COMPUTADOR: (A) SUPORTE DE DADOS: disquete (B) PC: IBM PC compatible
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentin Release #1.0, versão #1.25 (EPA) (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 1:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 1 071 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: dupla (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: ADN (genómico) (iii) HIPOTÉTICO: não
(iii) ΑΝΤΙ-SENTIDO: NÃO (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650
(ix) CARACTERÍSTICAS
(A) NOME/CHAVE: CDS (B) POSIÇÃO: 1..1071 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: ATG cm AÇA AGA AAA ATC GTC CGG GCA GCC GCC GTA CAG GCC GCC TCT 48 Met Gin Thr Arg Lys lie Vai Arg Ala Ala Ala Vai Gin Ala Ala Ser 1 5 10 15 CCC AAC TAC GAT CTG GCA ACG GGT GTT GAT MA ACC ATT GAG CTG GCT 96 Pro Asn Tyr Asp Leu Ala Thr Gly Vai Asp Lys Thr lie Glu Leu Ala 20 25 30 CGT CAG GCC CGC GAT GAG GGC TGT GAC CTG ATC CTG TTT GGT GAA ACC 1.44 Arg Gin Ala Arg .Asp Giu Gly Cys Asp Leu Xle Vai Phe Gly Giu Thr 35 40 45 TGG CTG CCC QGA TAT CCC TTC CAC GTC TGG CTG GGC GCA COG GCC TGG 192 Trp Leu Pro Gly Tyr pro Phe His Vai Trp Leu G ry Ala Pro Aia Trp 50 55 60 TCG CTG AAA TAC AG? GCC CGC TAC TAT GCC MC TCG CTC TCG CTG GAC 240 Ser Leu Lys Tyr Ser Ala Arg Tyr Tyr Ala Asn Ser Leu Ser Leu Asp 65 70 75 80 44 AGT GCA GAG TTT CAA CGC ATT GCC CAG GCC GCA CGG ACC TTG GGT ATT 288 Sêr Ala Glu Phe Gin Arg Ile Ala Gin Ala Ala Arg Thr Leu Gly Ile 85 90 95 TTC ATC GCA CTG CGT TAT AGC GAG CGC AGC GGC GGC AGC CTT TAC CTG 336 Phe Ile Ala Leu Gly Tyr Ser Glu Arg Ser Gly Gly Ser Leu Tyr Leu 100 105 Π0 GGC CAA TGC CTG ATC GAC GAC AAG GGC GAG ATG CTG TGG TCG CGT CGC 384 Gly Gin Cys L€U Ile Asp Asp Lys Gly Glu Ket Leu Trp Ser Arg Arg 115 120 125 aaa ctc MA CCC ACG CAT GTA GAG CGC ACC GTA TTT GGT GAA (MT TAT 432 Lys Leu Lys Pro Thr Bis Vai Glu Arg Thr Vai Phe Gly Glu Gly Tyr 130 135 140 GCC CGT GAT CTG ATT GTG TCC GAC ACA GAA CTG GGA CGC GTC GGT GCT 480 Ala Arg Asp Leu ne Vai Ser Asp Thr Glu Leu Gly Arg Vai Gly Ma 145 150 155 160 CTA TGC TGC TGG GAG CAT TTG TCG CCC TTG AGC AAG TAC GCG CTG TAC 528 Leu Cys Cys Trp Glu His Leu Ser Pro Leu Ser Lys Tyr Ala Leu Tyr 165 170 175 S o o B CAT GAA GCC ATT CAC ATT GCT GCC TGG CCG TCG TTT TCG CTA 576 Ser Gin His Glu Ala Ile His lie Ala Ala Trp Pro Ser Phe Ser Leu ISO 185 190 TAC AGC GAA CAG GCC CAC GCC CTC AGT GCC AAG GTG AAC ATG GCT GCC 624 Tyr Ser GlW Gin Ala HÍS Ara Leu Ser Ala Lys val Asn Met Ala Ala 195 200 205 TCG CAA ATC tat TCG GTT GAA GGC CAG TGC TTT ACC ATC GCC GCC AGC 672 Ser Gin Ile Tyr Ser Vai Glu Gly Gin Cys Phe Thr Ile Ala Ala Ser 210 215 220 AGT GTG GTC ACC CAA GAG ACG CTA GAC ATG CTG GAA GTG GGT GAA CAC 720 Ser Val Val Thr Gin Glu Thr Leu Asp Mec Leu Glu Val Gly Glu His 225 230 235 240 AAC GCC CCC TTG CTG MA GTG GGC GGC GGC AGT TCC ATG ATT TTT GCG 768 Asn Ale Pro Leu Leu Lys Val Gly Gly Gly ser ser Met ile Phe Ala 245 250 255 CCG GAC GCA CGC ACA CTG GCT CCC TAC CTG CCT CAC GAT GCC GAG GGC 816 Pro Asp Gly Arg Thr Leu Ala Pro Tyr Leu Pro His Asp Ala Glu Gly 260 265 270 TTG ATC ATT GCC GAT CTG AAT ATG GAG GAG ATT GCC ttc GCC AAA GCG 864 Leu Ile Ile Ala Asp Leu Asn MSt Glu Glu Ile Ala Phe Ala Lys Ala 275 280 285 ATC AAT GAC CCC GTA GGC CAC TAT TCC ΑΑΆ CCC GAG GCC ACC CGT CTG 312 Ile Asn Asp Pro Val Gly His Tyr Ser Lys Pro Glu Ala Thr Arg Leu 290 235 300 45 GTG CTG GAC m GGG CAC CGA GAC CCC ATG ACT CGG GTG CAC TCC AAA 960 Vai Leu Asp Leu Gly Kis Arg Asp Pro Met Th r Arg Vai His Ser Lys 305 310 315 320 AGC GTG hCC AGG GAA GAG GCT CCC GAG CAA GGT GTG CM AGC AAG ATT 1008 Ser Vai Thr Arg Glu Glu Ala Pro Glu Gly Vai Gin Ser Lys Ile 325 330 335 GCC ?CA GTC GCT ATC AGC CAT CCA CAG GAC TCG GAC ACA CTG CTA GTG 1056 Ma ser Vai Ala Ile Ser His Pro Gin Asp Ser Asp Thr Leu Leu Vai 340 343 350 CAA GAG CCG TCT TGA 1071
Gin Glu Pro Ser 355 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 356 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 2:
Met Gin Thr Arg Lys ile Vai Arg Ala Ala Ala Vai Gin Ala Ala Ser 1 5 10 15 Pro Asn Tyr Asp Leu Ala Thr Gly Vai Asp Lys Thr Ile Glu Leu Ala 20 25 30 Arg Gin Ala Arg Asp Glu Gly Cys Asp Leu Ile Vai Phe Gly Glu Thr 35 40 . .45 Trp Leu Pro Gly Tyr Pro Phe His Vai Trp Leu Gly Ala Pro Ala Trp 50 55 60 Ser Leu Lys Tyr Ser Ala Arg Tyr Tyr Ala Asn Ser Leu Ser Leu Asp 65 70 75 80 Ser Ala Glu Phe Gin Arg Ile Ala Gin Ala Ala Arg Thr Leu Gly Ile 85 90 95 Phe Ile Ala Leu Gly Tyr Ser Glu Arg Ser Gly Gly Ser Leu Tyr Leu 200 105 11Q Gly Gin Cys Leu Ile Asp Asp Lys Gly Glu Met Leu Trp Ser Arg Arg 115 120 125 4 6
Lys Leu Lys Pro Thr His Vai Glu Arg Thr Vai Phe Gly Glu Gly Tyr 130 135 140 Ala Arg Asp Leu Ile Vai Ser Asp Thr Glu Leu Gly Arg Vai Gly Ala 145 150 155 160 Leu Cys Cys Trp Glu His Leu Ser Pro Leu Ser Lys Tyr Ala Leu Tyr 165 170 175 Ser Gin HiS GlU Ala ile His ile Ala Ala Trp Pro Ser Phe Ser Leu 180 185 190
Tyr $er Glu Gin Ala His Ala Leu Ser Ala Lys Vai Asn Met Ala Ala 195 200 205
Ser Gin Ile Tyr Ser Vai Glu Gly Gin Cys Phe Thr Ile Ala Ala Ser 210 215 220
Ser Vai Vai Thr Gin Glu Thr Leu Asp Met Leu Glu Vai Gly Glu His 225 230 235 240
Asn Ala Pro Leu Leu Lys Vai Gly Gly Gly Ser Ser Met lie Phe Ala 245 250 255
Pro Asp Gly Arg Thr Leu Ala Pro Tyr Leu Pro His Asp Ala Glu Gly 260 265 270
Leu Ile Ile Ala Asp Leu Asn Met Glu Glu He Ala Phe Ala Lys Ala 275 280 285
Ile Asn A$p Pro Vai Gly His Tyr Ser Lys Pro Glu Ala Thr Arg Leu 290 295 300
Vai Leu Asp Leu Gly His Arg Asp Pro Met Thr Arg Vai His Ser Lys 305 310 315 320
Ser Vai Thr Arg Glu Glu Ala Pro Glu Gin Gly Vai Gin Ser Lys Ile 325 330 335
Ala Ser Vai Ala lie Ser His Pro Gin Asp Ser Asp Thr Leu Leu Vai 340 345 350
Gin Glu Pro Ser 355 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 39 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 47
(ii) TIPO DA MOLÉCULA: péptido iii) HIPOTÉTICO: NAO iii) ANTI-SENTIDO: NÃO
(v) TIPO DO FRAGMENTO: Terminação N (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalís (B) ESTIRPE: 1650 (vii) ORIGEM INDIRECTA: (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 3:
Ket Gin Thr Arg Lys Ile Vai Aro Ala Ala Ala Vai Gin Ala Ala Ser 15 10 15
Pro Asn Tyr Asp Leu Ala Thr Glv vai Asp Lys Thr Ile Glu Leu Ala 20 25 30
Arg Gin Ala Arg Asp Glu Gly 35 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:péptido
(iii) HIPOTÉTICO: NÃO
(iii) ANTI-SENTIDO: NÃO (v) TIPO DO FRAGMENTO: interno (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalís (B) ESTIRPE: 1650 (vii) ORIGEM DIRECTA: (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 4: 48
Glu Glu Ala Pro GIu Gin Gly vai Gin Ser Lys Xle Ala Ser Vai Ma 15 10 15
Xle Ser His Pro Gin 20 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 11 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:péptido
(iii) HIPOTÉTICO: NÃO
(iii) ANTI-SENTIDO: NÃO (v) TIPO DO FRAGMENTO: interno (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650 (vii) ORIGEM DIRECTA: (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 5:
Glu GIu Ala Pro Glu Gin Gly Vai Gin Ser Gys 15 10 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)
(iii) HIPOTÉTICO: NÃO (iii) ANTI-SENTIDO: NÃO (vi) ORIGEM PRIMARIA: 49 (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650
(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 6: ATGCAGACNA GNAARATCGT SCG 23 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)
(iii) HIPOTÉTICO: NÃO
(iii) ANTI-SENTIDO: NÃO (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650
(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: TNGCSACNGA NGCRATCTTG 20 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)
(iii) HIPOTÉTICO: NÃO 50
(iii) ANTI-SENTIDO: NÃO (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650
(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 8: TTAATCATAT GCAGACAAGA AAAATCGTCC G 31 (2) INFORMAÇÃO ACERCA DA SEQ ID NO: 9:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) FORMA DA CADEIA: única (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA:ADN (genómico)
(iii) HIPOTÉTICO: NÃO
(iii) ANTI-SENTIDO: NÃO (vi) ORIGEM PRIMÁRIA: (A) ORGANISMO: Alcaligenes faecalis (B) ESTIRPE: 1650
(vii) ORIGEM DIRECTA (B) CLONE: nitrilase (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 9: AAGGATCCTC AAGACGGCTC TTGCACTAGC AG 32
Lisboa, 23 de Fevereiro de 2007
Claims (15)
1 REIVINDICAÇÕES 1. Sequência isolada de ácidos nucleicos, que codifica um polipéptido com actividade de nitrilase, escolhida do grupo: a) uma sequência de ácidos nucleicos com a sequência representada na SEQ ID NO: 1, b) sequências de ácidos nucleicos que derivam como resultado do código genético degenerado da sequência de ácidos nucleicos representada na SEQ ID NO: 1, c) homólogos da sequência de ácidos nucleicos representada na SEQ ID NO: 1, que codificam polipéptidos que apresentam pelo menos 98% de homologia em toda a área de sequência em relação à SEQ ID NO: 2, sem que haja redução da acção enzimática dos polipéptidos.
2. Sequência de aminoácidos codificada por uma sequência de ácidos nucleicos de acordo com a reivindicação 1.
3. Sequência de aminoácidos de acordo com a reivindicação 2, codificada pela sequência representada na SEQ ID NO: 1.
4. Constructo de ácidos nucleicos que contém uma sequência de ácidos nucleicos de acordo com a reivindicação 1, em que a sequência de ácidos nucleicos se encontra ligada a um ou mais sinais de regulação.
5. Vector que contém uma sequência de ácidos nucleicos de 2 acordo com a reivindicação 1 ou um constructo de ácidos nucleicos de acordo com a reivindicação 4.
6. Microorganismo que contém pelo menos uma sequência introduzida de ácidos nucleicos de acordo com a reivindicação 1, ou pelo menos um constructo introduzido de ácidos nucleicos de acordo com a reivindicação 4.
7. Microorganismo de acordo com a reivindicação 6, tratando-se o microorganismo de uma bactéria dos géneros Escherichia, Pseudomonas ou Alcaligenes.
8. Processo para o fabrico de ácidos carboxilicos quirais com a fórmula geral I R COO H caracterizado pelo facto de transformar-se os nitrilos racémicos com a fórmula geral II R2- |“CN {II) I «1 R na presença de uma sequência de aminoácidos de acordo com a reivindicação 2 ou 3, ou de um microorganismo em crescimento, latente ou desintegrado de acordo com a reivindicação 6 ou 7; e de transformar-se pelo menos 25 mmoles de nitrilo/h por mg de proteína ou 25 mmoles de nitrilo/h por g de peso a seco, nos ácidos carboxilicos quirais, em que os substituintes e as variáveis nas fórmulas I e II têm o seguinte significado: 3 *um centro opticamente activo R1, R2 e R3, independentemente uns dos outros, hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-Cio, arilo substituído ou não substituído, hetarilo, OR4 ou NR4R5, sendo os radicais R1, R2 e R3 sempre diferentes, R4 hidrogénio, alquilo C1-C10 substituído ou não substituídos, ramificado ou não ramificado, alcenilo C2-Cio, Ci-Cio-alquilcarbonilo, C2-Cio-alcenilcarbonilo, arilo, arilcarbonilo, hetarilo ou hetarilcarbonilo, R5 hidrogénio, alquilo C1-C10 substituído ou não substituído, ramificado ou não ramificado, alcenilo C2-C10, arilo ou hetarilo.
9. Processo de acordo com a reivindicação 8, caracterizado pelo facto de um dos substituintes R1, R2 ou R3 significar OR4
• 10. Processo de acordo com a reivindicação 8 ou 9, caracterizado pelo facto de um dos substituintes R1/ R2 ou R3 significar arilo.
11. Processo de acordo com as reivindicações 8 a 10, caracterizado pelo facto de 0 processo ser realizado em solução de reacção aquosa com um pH entre 4 e 11.
12. Processo de acordo com as reivindicações 8 a 11, caracterizado pelo facto de transformar-se no processo 0,01 a 10% em peso de nitrilo ou 0,01 a 10% em peso de 4 um aldeído ou de uma cetona correspondente, e 0,01 a 10% em peso de ácido cianídrico.
13. Processo de acordo com as reivindicações 8 a 12, caracterizado pelo facto de o processo ser realizado a uma temperatura entre 0 °C e 80 °C.
14. Processo de acordo com as reivindicações 8 a 13, caracterizado pelo facto de o ácido carboxílico quiral ser obtido por extracção ou por cristalização, ou então por extracção e cristalização, com rendimentos de 60 a 100% a partir da solução de reacção.
15. Processo de acordo com as reivindicações 8 a 14, caracterizado pelo facto de o ácido carboxílico quiral ter uma pureza óptica de pelo menos 90% ee. Lisboa, 23 de Fevereiro de 2007
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19848129A DE19848129A1 (de) | 1998-10-19 | 1998-10-19 | Verfahren zur Herstellung chiraler Carbonsäuren aus Nitrilen mit Hilfe einer Nitrilase oder Mikroorganismen, die ein Gen für die Nitrilase enthalten |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PT1123386E true PT1123386E (pt) | 2007-03-30 |
Family
ID=7884933
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT99952558T PT1123386E (pt) | 1998-10-19 | 1999-10-13 | Processo para o fabrico de ácidos carboxílicos quirais a partir de nitrilos, recorrendo a uma nitrilase ou a microorganismos que contêm um gene para a nitrilase |
Country Status (21)
| Country | Link |
|---|---|
| US (1) | US6869783B1 (pt) |
| EP (1) | EP1123386B1 (pt) |
| JP (1) | JP4489298B2 (pt) |
| KR (1) | KR100715744B1 (pt) |
| CN (1) | CN100422319C (pt) |
| AT (1) | ATE349517T1 (pt) |
| AU (1) | AU765480B2 (pt) |
| BR (1) | BR9914629A (pt) |
| CA (1) | CA2347521C (pt) |
| CZ (1) | CZ302494B6 (pt) |
| DE (2) | DE19848129A1 (pt) |
| DK (1) | DK1123386T3 (pt) |
| EE (1) | EE05008B1 (pt) |
| ES (1) | ES2280125T3 (pt) |
| HU (1) | HU228092B1 (pt) |
| ID (1) | ID29136A (pt) |
| IL (2) | IL142397A0 (pt) |
| NO (1) | NO327857B1 (pt) |
| PT (1) | PT1123386E (pt) |
| WO (1) | WO2000023577A1 (pt) |
| ZA (1) | ZA200104066B (pt) |
Families Citing this family (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19848129A1 (de) * | 1998-10-19 | 2000-04-20 | Basf Ag | Verfahren zur Herstellung chiraler Carbonsäuren aus Nitrilen mit Hilfe einer Nitrilase oder Mikroorganismen, die ein Gen für die Nitrilase enthalten |
| US20040002147A1 (en) * | 1999-12-29 | 2004-01-01 | Desantis Grace | Nitrilases |
| DE10010149A1 (de) * | 2000-03-03 | 2001-09-06 | Basf Ag | Nitrilase aus Rhodococcus rhodochrous NCIMB 11216 |
| US6562603B2 (en) * | 2000-08-04 | 2003-05-13 | E. I. Du Pont De Nemours And Company | 3-hydroxycarboxylic acid production and use in branched polymers |
| US6455730B1 (en) | 2000-08-04 | 2002-09-24 | E. I. Du Pont De Nemours & Company | Preparation of dicarboxylic acid monoesters from cyanocarboxylic acid esters |
| US20020137153A1 (en) * | 2000-10-04 | 2002-09-26 | Ramer Sandra W. | Enantioselective production of amino carboxylic acids |
| FR2822460B1 (fr) * | 2001-03-26 | 2005-04-29 | Rhodia Chimie Sa | Procede de preparation enantioselectif d'acides carboxyliques optiquement actifs par hydrolyse enzymatique de nitriles |
| DK2327765T3 (en) | 2001-06-21 | 2015-07-13 | Basf Enzymes Llc | nitrilases |
| ITMI20011826A1 (it) * | 2001-08-30 | 2003-03-02 | Istituto Biochimico Italiano | Microorganismo dotato di attivita' nitrile-idratasica/amidasica enantioselettiva e regioselettiva |
| PT1570060E (pt) | 2002-12-02 | 2007-09-13 | Basf Ag | ''sistema de expressão indutível de l-ramnose'' |
| AU2003296731B2 (en) * | 2003-01-08 | 2009-07-09 | Basf Aktiengesellschaft | Methods for preserving and/or storing cells having a nitrilase or nitrile hydratase activity |
| CN100445375C (zh) * | 2003-02-27 | 2008-12-24 | 巴斯福股份公司 | 经修饰的腈水解酶及它们在产生羧酸的方法中的用途 |
| AT412092B (de) * | 2003-02-27 | 2004-09-27 | Dsm Fine Chem Austria Gmbh | Verfahren zur herstellung chiraler alpha-hydroxycarbonsäuren durch enzymatische hydrolyse von chiralen cyanhydrinen |
| CN102796769B (zh) * | 2004-12-22 | 2014-06-04 | 纳幕尔杜邦公司 | 乙醇酸的酶促生产 |
| US20100267100A1 (en) * | 2007-03-21 | 2010-10-21 | Ling Hua | Enzymatic synthesis of optically pure beta-hydroxy carboxylic acids and their derivatives |
| US20090004720A1 (en) * | 2007-06-26 | 2009-01-01 | Ling Hua | Smart Biocatalysts For Organic Synthesis |
| EP2338987A1 (en) | 2009-11-16 | 2011-06-29 | ZYRUS Beteiligungsgesellschaft mbH & Co. Patente I KG | Whole cell biocatalyst |
| JP2013162746A (ja) * | 2010-05-24 | 2013-08-22 | Mitsui Chemicals Inc | アミド化合物の製造方法 |
| EP2643467A1 (de) | 2010-11-24 | 2013-10-02 | Basf Se | Verfahren zur herstellung n-heterozyklischer optisch aktiver alkohole |
| KR101223666B1 (ko) * | 2011-01-26 | 2013-01-17 | 재단법인 경북해양바이오산업연구원 | 나이트릴레이즈 orn을 이용한 카르복실산의 제조방법 |
| KR101223664B1 (ko) * | 2011-01-26 | 2013-01-17 | 재단법인 경북해양바이오산업연구원 | 나이트릴레이즈 rmn1을 이용한 카르복실산의 제조방법 |
| KR101223663B1 (ko) * | 2011-01-26 | 2013-01-21 | 재단법인 경북해양바이오산업연구원 | 나이트릴레이즈 vmn1을 이용한 카르복실산의 제조방법 |
| KR101223665B1 (ko) * | 2011-01-26 | 2013-01-17 | 재단법인 경북해양바이오산업연구원 | 나이트릴레이즈 rmn2을 이용한 카르복실산의 제조방법 |
| CA3172001A1 (en) | 2020-05-15 | 2021-11-18 | Basf Se | Improved method for the production of isoprenoids |
| AU2022407155A1 (en) | 2021-12-10 | 2024-06-20 | Basf Se | Herbicidal activity of alkyl phosphinates |
| CN118401535A (zh) | 2021-12-10 | 2024-07-26 | 巴斯夫欧洲公司 | 草铵膦衍生物的酶促脱氨基甲酰化 |
| CN118369324A (zh) | 2021-12-10 | 2024-07-19 | 巴斯夫欧洲公司 | 使用基于乙内酰脲酶的工艺的草铵膦合成 |
| KR20250124113A (ko) | 2022-12-16 | 2025-08-19 | 바스프 에스이 | 신규한 에틸렌디아민-n,n'-디숙신산 (edds) 신타아제 |
| TW202512923A (zh) | 2023-06-13 | 2025-04-01 | 德商巴地斯顏料化工廠 | 使用基於醯胺酶之製程合成固殺草 |
| EP4556568A1 (en) | 2023-11-17 | 2025-05-21 | Basf Se | Biocatalytical methods for producing ethylenediamine-n,n'-disuccinic acid |
| WO2025104259A2 (en) | 2023-11-17 | 2025-05-22 | Basf Se | Crystalline forms of s,s-ethylenediamine-n,n'-disuccinic acid, respective methods and uses |
| WO2025104224A1 (en) | 2023-11-17 | 2025-05-22 | Basf Se | Edds synthase variants |
| WO2025219237A1 (en) | 2024-04-15 | 2025-10-23 | Basf Se | A process for the preparation of 2-oxo-4-(hydroxy(methyl)phosphinoyl)butyric acid |
| WO2025219238A1 (en) | 2024-04-15 | 2025-10-23 | Basf Se | Process for producing l-glufosinate from a diol or diol derivative |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE68926922T2 (de) | 1988-03-08 | 1996-12-19 | Japan Energy Corp., Tokio/Tokyo | Verfahren zur Herstellung von L-alpha-Aminosäuren |
| US5283193A (en) | 1988-06-27 | 1994-02-01 | Asahi Kasei Kogyo K.K. | Process for producing optically active α-substituted organic acid and microorganism and enzyme used therefor |
| DK314989A (da) * | 1988-06-27 | 1989-12-28 | Asahi Chemical Ind | Fremgangsmaade til fremstilling af optisk aktive alfa-substituerede organiske syrer, samt mikroorganismer og enzymer anvendelige ved fremgangsmaaden |
| JPH0219577A (ja) | 1988-07-04 | 1990-01-23 | Nippon Saafuakutanto Kogyo Kk | 反応染料用均染剤組成物 |
| DE69131217T2 (de) * | 1990-03-30 | 1999-09-23 | Mitsubishi Rayon Co., Ltd. | Verfahren zur Herstellung von R(-)Mandelsäure und deren Derivaten |
| JP2974737B2 (ja) | 1990-08-16 | 1999-11-10 | 三菱レイヨン株式会社 | 光学活性乳酸の製造法 |
| JP3154721B2 (ja) | 1990-09-20 | 2001-04-09 | イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー | エナンチオマー性2−アルカン酸類の製造方法 |
| JP2676568B2 (ja) | 1991-06-26 | 1997-11-17 | 日東化学工業株式会社 | R(−)−マンデル酸およびその誘導体の製造法 |
| JP3093056B2 (ja) * | 1992-11-17 | 2000-10-03 | 三菱レイヨン株式会社 | ニトリラーゼ活性を有するポリペプチドをコードする遺伝子dnaを含有する形質転換体による有機酸の製造法 |
| JP3218133B2 (ja) | 1993-02-03 | 2001-10-15 | 三菱レイヨン株式会社 | フェニル基を有する光学活性α−ヒドロキシカルボン酸の製造法 |
| JP2720140B2 (ja) | 1993-02-03 | 1998-02-25 | 日東化学工業株式会社 | フェニル基を有する光学活性α−ヒドロキシカルボン酸の製造法 |
| JP3354688B2 (ja) | 1994-01-28 | 2002-12-09 | 三菱レイヨン株式会社 | 微生物によるα−ヒドロキシ酸またはα−ヒドロキシアミドの製造法 |
| JP3154633B2 (ja) | 1994-12-28 | 2001-04-09 | 三菱レイヨン株式会社 | ニトリラーゼ遺伝子発現のための調節因子およびその遺伝子 |
| DE69737696T2 (de) | 1996-02-29 | 2008-01-10 | Nippon Soda Co. Ltd. | Prozess für die herstellung von alpha-hydroxysäuren mit hilfe eines mikroorganismus und eines neuen mikroorganismus. |
| DE19848129A1 (de) * | 1998-10-19 | 2000-04-20 | Basf Ag | Verfahren zur Herstellung chiraler Carbonsäuren aus Nitrilen mit Hilfe einer Nitrilase oder Mikroorganismen, die ein Gen für die Nitrilase enthalten |
-
1998
- 1998-10-19 DE DE19848129A patent/DE19848129A1/de not_active Withdrawn
-
1999
- 1999-10-13 AT AT99952558T patent/ATE349517T1/de active
- 1999-10-13 CA CA2347521A patent/CA2347521C/en not_active Expired - Lifetime
- 1999-10-13 PT PT99952558T patent/PT1123386E/pt unknown
- 1999-10-13 DK DK99952558T patent/DK1123386T3/da active
- 1999-10-13 US US09/806,876 patent/US6869783B1/en not_active Expired - Lifetime
- 1999-10-13 JP JP2000577288A patent/JP4489298B2/ja not_active Expired - Fee Related
- 1999-10-13 WO PCT/EP1999/007679 patent/WO2000023577A1/de not_active Ceased
- 1999-10-13 ID IDW20010881A patent/ID29136A/id unknown
- 1999-10-13 CZ CZ20011382A patent/CZ302494B6/cs not_active IP Right Cessation
- 1999-10-13 DE DE59914102T patent/DE59914102D1/de not_active Expired - Lifetime
- 1999-10-13 AU AU64708/99A patent/AU765480B2/en not_active Expired
- 1999-10-13 HU HU0104802A patent/HU228092B1/hu unknown
- 1999-10-13 EP EP99952558A patent/EP1123386B1/de not_active Expired - Lifetime
- 1999-10-13 IL IL14239799A patent/IL142397A0/xx active IP Right Grant
- 1999-10-13 CN CNB998147656A patent/CN100422319C/zh not_active Expired - Lifetime
- 1999-10-13 EE EEP200100232A patent/EE05008B1/xx unknown
- 1999-10-13 BR BR9914629-0A patent/BR9914629A/pt not_active Application Discontinuation
- 1999-10-13 ES ES99952558T patent/ES2280125T3/es not_active Expired - Lifetime
- 1999-10-13 KR KR1020017004906A patent/KR100715744B1/ko not_active Expired - Fee Related
-
2001
- 2001-04-03 IL IL142397A patent/IL142397A/en not_active IP Right Cessation
- 2001-04-18 NO NO20011912A patent/NO327857B1/no not_active IP Right Cessation
- 2001-05-18 ZA ZA200104066A patent/ZA200104066B/en unknown
Also Published As
| Publication number | Publication date |
|---|---|
| CN1331743A (zh) | 2002-01-16 |
| WO2000023577A1 (de) | 2000-04-27 |
| EP1123386A1 (de) | 2001-08-16 |
| CN100422319C (zh) | 2008-10-01 |
| CZ20011382A3 (cs) | 2002-03-13 |
| HU228092B1 (en) | 2012-10-29 |
| ID29136A (id) | 2001-08-02 |
| DE59914102D1 (de) | 2007-02-08 |
| EE05008B1 (et) | 2008-04-15 |
| NO20011912L (no) | 2001-04-18 |
| EP1123386B1 (de) | 2006-12-27 |
| HUP0104802A3 (en) | 2005-10-28 |
| IL142397A (en) | 2008-03-20 |
| CA2347521A1 (en) | 2000-04-27 |
| US6869783B1 (en) | 2005-03-22 |
| NO327857B1 (no) | 2009-10-05 |
| JP2002527106A (ja) | 2002-08-27 |
| NO20011912D0 (no) | 2001-04-18 |
| ZA200104066B (en) | 2002-07-01 |
| IL142397A0 (en) | 2002-03-10 |
| ATE349517T1 (de) | 2007-01-15 |
| AU6470899A (en) | 2000-05-08 |
| BR9914629A (pt) | 2001-06-26 |
| JP4489298B2 (ja) | 2010-06-23 |
| DE19848129A1 (de) | 2000-04-20 |
| AU765480B2 (en) | 2003-09-18 |
| CZ302494B6 (cs) | 2011-06-15 |
| KR20010085938A (ko) | 2001-09-07 |
| EE200100232A (et) | 2002-08-15 |
| CA2347521C (en) | 2010-02-23 |
| KR100715744B1 (ko) | 2007-05-08 |
| HUP0104802A2 (hu) | 2002-04-29 |
| ES2280125T3 (es) | 2007-09-01 |
| DK1123386T3 (da) | 2007-05-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| PT1123386E (pt) | Processo para o fabrico de ácidos carboxílicos quirais a partir de nitrilos, recorrendo a uma nitrilase ou a microorganismos que contêm um gene para a nitrilase | |
| AU782517B2 (en) | L-pantolactone-hydrolase and a method for producing D-pantolactone | |
| US7405064B2 (en) | Nucleic acid fragments encoding nitrile hydratase and amidase enzymes from Comamonas testosteroni 5-MGAM-4D and recombinant organisms expressing those enzymes useful for the production of amides and acids | |
| CN104357431A (zh) | 产生γ-氨基丁酸的方法 | |
| BR112020017362A2 (pt) | Método para produzir vanilina | |
| JP5101510B2 (ja) | 新規デヒドロゲナーゼ、その誘導体および光学活性アルカノールの製造方法 | |
| RU2283864C2 (ru) | Нитрилаза из rhodococcus rhodochrous ncimb 11216 | |
| Kubáč et al. | Biotransformation of nitriles to amides using soluble and immobilized nitrile hydratase from Rhodococcus erythropolis A4 | |
| MXPA01003893A (en) | Method for producing chiral carboxylic acids from nitriles with the assistance of a nitrilase or microorganisms which contain a gene for the nitrilase | |
| JP2009519724A (ja) | アリールアセトニトリラーゼを使用して5−ノルボルネン−2−カルボニトリルから5−ノルボルネン−2−カルボン酸を製造する方法 | |
| JPH04341185A (ja) | 新規ニトリラーゼ |