CA2260274A1 - Adn polymerase thermostable d'archaebacteries du genre pyrococcus sp. - Google Patents
Adn polymerase thermostable d'archaebacteries du genre pyrococcus sp. Download PDFInfo
- Publication number
- CA2260274A1 CA2260274A1 CA002260274A CA2260274A CA2260274A1 CA 2260274 A1 CA2260274 A1 CA 2260274A1 CA 002260274 A CA002260274 A CA 002260274A CA 2260274 A CA2260274 A CA 2260274A CA 2260274 A1 CA2260274 A1 CA 2260274A1
- Authority
- CA
- Canada
- Prior art keywords
- glu
- dna
- lys
- dna polymerase
- pyrococcus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
- 241001467519 Pyrococcus sp. Species 0.000 title claims abstract description 93
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 title claims abstract description 91
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 title claims abstract description 82
- 241001074903 Methanobacteria Species 0.000 title abstract 2
- 108020004414 DNA Proteins 0.000 claims description 61
- 238000000034 method Methods 0.000 claims description 33
- 230000003321 amplification Effects 0.000 claims description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 15
- 241000203069 Archaea Species 0.000 claims description 14
- 150000007523 nucleic acids Chemical group 0.000 claims description 12
- 239000002773 nucleotide Substances 0.000 claims description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 10
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 10
- 125000003729 nucleotide group Chemical group 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 108091026890 Coding region Proteins 0.000 claims description 5
- 230000002255 enzymatic effect Effects 0.000 claims description 2
- LWGJTAZLEJHCPA-UHFFFAOYSA-N n-(2-chloroethyl)-n-nitrosomorpholine-4-carboxamide Chemical compound ClCCN(N=O)C(=O)N1CCOCC1 LWGJTAZLEJHCPA-UHFFFAOYSA-N 0.000 claims 2
- 239000000284 extract Substances 0.000 claims 1
- 239000012634 fragment Substances 0.000 description 32
- 108090000623 proteins and genes Proteins 0.000 description 32
- 230000000694 effects Effects 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 22
- 108090000790 Enzymes Proteins 0.000 description 22
- 239000013615 primer Substances 0.000 description 20
- 239000000523 sample Substances 0.000 description 19
- 230000002779 inactivation Effects 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 102000004169 proteins and genes Human genes 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 102000039446 nucleic acids Human genes 0.000 description 12
- 241000588724 Escherichia coli Species 0.000 description 11
- 239000000872 buffer Substances 0.000 description 11
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 9
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 8
- 241000205156 Pyrococcus furiosus Species 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 238000004925 denaturation Methods 0.000 description 7
- 230000036425 denaturation Effects 0.000 description 7
- 230000029087 digestion Effects 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241000205160 Pyrococcus Species 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 241000205180 Thermococcus litoralis Species 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 241001148023 Pyrococcus abyssi Species 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 238000007900 DNA-DNA hybridization Methods 0.000 description 3
- 239000004606 Fillers/Extenders Substances 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 229920001213 Polysorbate 20 Polymers 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 3
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 3
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 3
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 3
- 229920000136 polysorbate Polymers 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- 108020004465 16S ribosomal RNA Proteins 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- RTDZQOFEGPWSJD-AVGNSLFASA-N Arg-Leu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O RTDZQOFEGPWSJD-AVGNSLFASA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 2
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 2
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 2
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 2
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 2
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 2
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 2
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000204969 Thermococcales Species 0.000 description 2
- 241000205188 Thermococcus Species 0.000 description 2
- 241001495444 Thermococcus sp. Species 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 244000309466 calf Species 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- -1 nucleotide triphosphates Chemical class 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- NKDFYOWSKOHCCO-YPVLXUMRSA-N 20-hydroxyecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)(O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 NKDFYOWSKOHCCO-YPVLXUMRSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- VVJTWSRNMJNDPN-IUCAKERBSA-N Arg-Met-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O VVJTWSRNMJNDPN-IUCAKERBSA-N 0.000 description 1
- BSGSDLYGGHGMND-IHRRRGAJSA-N Arg-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N BSGSDLYGGHGMND-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101000583080 Bunodosoma granuliferum Delta-actitoxin-Bgr2a Proteins 0.000 description 1
- 241001301450 Crocidium multicaule Species 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 208000034454 F12-related hereditary angioedema with normal C1Inh Diseases 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- JZOYFBPIEHCDFV-YUMQZZPRSA-N Gln-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 JZOYFBPIEHCDFV-YUMQZZPRSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- NKSGKPWXSWBRRX-ACZMJKKPSA-N Glu-Asn-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NKSGKPWXSWBRRX-ACZMJKKPSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- SAEBUDRWKUXLOM-ACZMJKKPSA-N Glu-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O SAEBUDRWKUXLOM-ACZMJKKPSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- IPFKIGNDTUOFAF-CYDGBPFRSA-N Ile-Val-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IPFKIGNDTUOFAF-CYDGBPFRSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- YODLGZSPTHGVQX-VJANTYMQSA-N Leu-Asp-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N YODLGZSPTHGVQX-VJANTYMQSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- CRNNMTHBMRFQNG-GUBZILKMSA-N Lys-Glu-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N CRNNMTHBMRFQNG-GUBZILKMSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- WKUXWMWQTOYTFI-SRVKXCTJSA-N Lys-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N WKUXWMWQTOYTFI-SRVKXCTJSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- BACYUWVYYTXETD-UHFFFAOYSA-N N-Lauroylsarcosine Chemical compound CCCCCCCCCCCC(=O)N(C)CC(O)=O BACYUWVYYTXETD-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- 239000012564 Q sepharose fast flow resin Substances 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- OSFZCEQJLWCIBG-BZSNNMDCSA-N Ser-Tyr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSFZCEQJLWCIBG-BZSNNMDCSA-N 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 101000865057 Thermococcus litoralis DNA polymerase Proteins 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- VUSAEKOXGNEYNE-PBCZWWQYSA-N Thr-His-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VUSAEKOXGNEYNE-PBCZWWQYSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- ULHASJWZGUEUNN-XIRDDKMYSA-N Trp-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O ULHASJWZGUEUNN-XIRDDKMYSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 239000007621 bhi medium Substances 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- GDPJWJXLKPPEKK-SJAYXVESSA-N dT4 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 GDPJWJXLKPPEKK-SJAYXVESSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 229910000397 disodium phosphate Inorganic materials 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 208000016861 hereditary angioedema type 3 Diseases 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 238000011392 neighbor-joining method Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000020477 pH reduction Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 239000012429 reaction media Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Developing Agents For Electrophotography (AREA)
Abstract
La présente invention concerne une ADN polymérase purifiée thermostable d'archaebactéries du genre Pyrococcus sp. ayant un poids moléculaire compris entre environ 89 000 et 90 000 daltons.
Description
WO98/01567 PCT~R97101259 ADN POLYMERASE THERMOSTABLE
D'ARCHAEBACTÉRIES DU GENRE PYROCOCCUS SP.
.
La présente invention concerne de nouvelles ADN polymérases thermostables provenant d'archaebactéries du genre Pyrococcus sp.
Les ADN polymérases sont des enzymes impliquées dans la réplication et la réparation de l'ADN.On connaît aujourdlhui de nombreuses ADN
polymérases isolés de micro-organismes tel que E. coli;
par e~emple l~ADN polymérase I de E. coli, le fragment de klenow de l'ADN polymérase I de E. coli, l'ADN
polymérase T4. Des ADN polymérases thermostables ont également identifiées et purifiées à partir d'organismes thermophiles, tels que Thermus aquaticus ~Chien, A. et al., J. bacteriol. 1976, 127:1~50-1557 ; Kaladin et al., Biokhymiyay 1980, 45:644-651), Thermus thermophilus, ou encore des espèces Bacillus (Demande de Brevet Européen No. 699 760), Thermococcus (Demande de Brevet Européen No. 455 430), Sulfobus et Pyrococcus (Demande de Brevet Européen No. 547 359). Parmi celles-ci, on peut citer plus particulièrement la Pfu de Pyroccocus Furiosus ~Réf. Biblio.), la Vent DNA polymerase de Thermococcus litoralis (Kong, H. M., R. B. Kucera, and W. E. Jack, 1993. J. Blol. Chem. 268(3):1965-1975), la 9~-NDNA
polymerase de Pyrococcus sp. 9~-N et la Deep-Vent DNA
polymerase de Pyrococcus sp. GB-D.
Le processus de réplication s'effectue selon un mécanisme bien connu consistant à fabriquer, à partir d'une matrice, de l'enzyme ADN polymérase et des quatre nucléotides triphosphates, un brin d'acide nucléique complémentaire de ladite matrice. Les enzymes ayant une activité ADN polymérase sont à présent largement utilisées in vl tro dans de nombreux procédés de biologie moléculaire, tels que le clonage, la détection, le CA 02260274 1999-0l-08
D'ARCHAEBACTÉRIES DU GENRE PYROCOCCUS SP.
.
La présente invention concerne de nouvelles ADN polymérases thermostables provenant d'archaebactéries du genre Pyrococcus sp.
Les ADN polymérases sont des enzymes impliquées dans la réplication et la réparation de l'ADN.On connaît aujourdlhui de nombreuses ADN
polymérases isolés de micro-organismes tel que E. coli;
par e~emple l~ADN polymérase I de E. coli, le fragment de klenow de l'ADN polymérase I de E. coli, l'ADN
polymérase T4. Des ADN polymérases thermostables ont également identifiées et purifiées à partir d'organismes thermophiles, tels que Thermus aquaticus ~Chien, A. et al., J. bacteriol. 1976, 127:1~50-1557 ; Kaladin et al., Biokhymiyay 1980, 45:644-651), Thermus thermophilus, ou encore des espèces Bacillus (Demande de Brevet Européen No. 699 760), Thermococcus (Demande de Brevet Européen No. 455 430), Sulfobus et Pyrococcus (Demande de Brevet Européen No. 547 359). Parmi celles-ci, on peut citer plus particulièrement la Pfu de Pyroccocus Furiosus ~Réf. Biblio.), la Vent DNA polymerase de Thermococcus litoralis (Kong, H. M., R. B. Kucera, and W. E. Jack, 1993. J. Blol. Chem. 268(3):1965-1975), la 9~-NDNA
polymerase de Pyrococcus sp. 9~-N et la Deep-Vent DNA
polymerase de Pyrococcus sp. GB-D.
Le processus de réplication s'effectue selon un mécanisme bien connu consistant à fabriquer, à partir d'une matrice, de l'enzyme ADN polymérase et des quatre nucléotides triphosphates, un brin d'acide nucléique complémentaire de ladite matrice. Les enzymes ayant une activité ADN polymérase sont à présent largement utilisées in vl tro dans de nombreux procédés de biologie moléculaire, tels que le clonage, la détection, le CA 02260274 1999-0l-08
2 PCT/FR97/01259 marquage et l'amplification de séquences d'acide nucléique.
L'amplification de séquences d'acide nucléique par la méthode dite réaction de polymérisation en chaîne (PCR), décrite dans les Brevets Européens No .
200 362 et 201 184, est basée sur la réalisation de cycles successifs d'extensions d'amorces, mettant en oeuvre une ADN polymérase et les quatre nucléotides triphosphates, suivies d'une dénaturation des acides nucléiques double brin ainsi obtenus et servant de matrices pour le cycle suivant. Les températures utilisées à l'étape de dénaturation n'étant pas compatibles avec la conservation des activités de nombreuses ADN polymérases, des travaux de recherche important sont consacrés aux enzymes thermostables décrites précédemment. Il est notamment essentiel ne pas limiter la préparation de ces enzymes aux seuls procédés de purification à partir du microorganisme, mais de chercher à augmenter les rendements de production en utilisant les méthodes du génie génétique. Selon ces méthodes bien connues de l'homme du métier (Maniatis, et al., Molecular Cloning: A laboratory M~n~Al, 1982), le gène codant pour 1' ADN polymérase est cloné dans un vecteur d'expression, lequel vecteur est inséré dans un hôte cellulaire capable d'exprimer l'enzyme, l'hôte cellulaire est cultivée dans des conditions adéquates et 1 'ADN polymérase est extraite et récupérée. Cette méthode a par exemple été décrite dans la demande de brevet PCT WO89/06691 pour produire l'ADN polymérase de Thermus aslua ti cus .
Le développement des technologies d' ADN
recombinant tant dans le domaine de la recherche que dans celui de la production industrielle nécessite de disposer de divers types d' ADN polymérase susceptibles d'améliorer quantitativement ou qualitativement des WO98/01567 PCT~R97/01259 techniques aussi diverses que le clonage, la détection, le marquage ou l~amplification de séquences d'acide - nucléique.
La présente invention vise précisément à
offir de nouvelles enzymes hyperthermostables obtenues des espèces Pyrococcus sp. qui catalysent la polymérisation de l'ADN. Ces enzymes proviennent d'isolats d'échantillons d'archaebactéries hyperthermophiles (Woese, C. R., O. Kandler, and M.
I0 Wheelis, l990. Proc. Natl. Acad. Sci. USA. 87:4576-4579) prélevés dans des sources hydrothermales profondes du bassin Nord-Fiji dans le Pacifique sud (Desbruyères, D., A.-M. Alayse-Danet, and S. Ohta. 1994.Geology. 116:227-242 ; Marteinsson, V. T., L. Watrin, D. Prieur, J. C.
Caprais, G. Raguenes, and G. Erauso. 1995.
International ~ournal of Systematic Bacteriology.
45(4):623-632). Tous ces isolats sont hyperthermostables avec des températures d'isolement de l'ordre de 80 à
100~C. Une ADN polymérase de l'invention a un poids moléculaire d'environ 89000 daltons et présente une hyperthermostabilité permettant sa mise en oeuvre dans des réactions conduites à des températures de 70 à 90~C.
Les travaux réalisés dans le cadre de l'invention ont permis d'identifier deux nouvelles ADN
polymérases thermostables d'archaebactéries du genre Pyrococcus sp. dont la relation phylogénétique a été
étudiée. Les gènes codant pour ces deux ADN polymérases ont été clonés et séquencés et leur comparaison a mis en évidence de fortes analogies de séquence et d'organisation.
L'invention a plus particulièrement pour objet une ADN polymérase purifiée thermostable d~archaebactéries du genre Pyrococcus sp. ayant un poids moléculaire compris entre environ 89 000 et 90 000 daltons.
Une première ADN polymérase purifiée thermostable selon l'invention provient de la souche d'archaebactéries du genre Pyrococcus sp. déposée à la Collection National de Culture de Micro-organismes (CNCM) à l'Institut Pasteur, le 3 Juillet 1996 sous le No I-1764. Cette ADN polymérase sera dénommée dans ce qui suit Pyrococcus sp. GE 23. Sa séquence de 771 acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO: 1. Un poids moléculaire de 89 409 daltons et un pI de 8,37 ont été déduits de cette séquence. L'invention concerne donc l'ADN
polymérase dePyrococcus sp. GE 23 dont la séquence en acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO:1 ou tout autre séquence constituant un dérivé enzymatiquement équivalent de celle-ci. On entend par dérivés enzymatiquement équivalents, les polypeptides et protéines constitués par ou comprenant la séquence en acides aminés représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:1 dès lors qu'ils présentent les propriétés de l'ADN polymérase de Pyrococcus sp. GE 23. A ce titre l'invention envisage plus particulièrement une ADN polymérase dont la séquence en acides aminés est un fragment de celle représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:1 ou encore un assemblage de tels fragments On entend aussi par dérivés enzymatiquement équivalents, les séquences en acides aminés ci-dessus modifiées par insertion et/ou délétion et/ou substitution d'un ou plusieurs aminoacides, pour autant que les propriétés de 1' ADN polymérase de Pyrococcus sp .
GE 23 qui en résultent ne soient pas significativement modifiées.
WO98/01567 PCT~R97/01259 Une seconde ADN polymérase purifiée thermostable selon l'invention provient de la souche d~archaebactéries du genre Pyrococcus sp. déposée à la CNCM le 20 Avril 1993 sous le No I-1302. Cette ADN
S polymérase sera dénommée dans ce qui suit Pyrococcus sp.
GE 5 (alias Pyrococcus abyssi). Sa séquence de 771 acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO:2. Un poids moléculaire de 89 443 daltons et un pI de 8,13 ont été
déduits de cette séquence.
L'invention concerne donc 1'ADN polymérase dePyrococcus sp. GE 5 dont la séquence en acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO:2 ou tout autre séquence constituant un dérivé enzymatiquement équivalent de celle-ci. On entend par dérivés enzymatiquement équivalents, les polypeptides et protéines constitués par ou comprenant la séquence en acides aminés représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:2 dès lors ~u'ils présentent les propriétés de l'ADN
polymérase de Pyrococcus sp. GE 5. A ce titre l~invention envisage plus particulièrement une ADN
polymérase dont la séquence en acides aminés est un fragment de celle représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:2 ou encore un assemblage de tels fragments On entend aussi par dérivés enzymatiquement équivalents, les séquences en acides aminés ci-dessus modifiées par insertion et/ou délétion et/ou substitution d'un ou plusieurs aminoacides, pour autant que les propriétés de l'ADN pol~mérase de Pyrococcus sp.
GE 5 qui en résultent ne soient pas significativement modifiées.
Les ADN polymérases Pyrococcus sp. GE 23 et de Pyrococcus sp. GE 5 se distinguent l'une de l'autre WO 98/01567 PCT~7/01259 par lO résidus d'acides aminés dont les positions sont indiqués dans le tableau I ci-dessous.
Tableau I
Positions Pyrococcus sp. GE 23 Pyrococcus sp. GE 5 263 Val Ala 277 A_a Thr 2 l A_a Val ~ Phe Ser :~ Gln His
L'amplification de séquences d'acide nucléique par la méthode dite réaction de polymérisation en chaîne (PCR), décrite dans les Brevets Européens No .
200 362 et 201 184, est basée sur la réalisation de cycles successifs d'extensions d'amorces, mettant en oeuvre une ADN polymérase et les quatre nucléotides triphosphates, suivies d'une dénaturation des acides nucléiques double brin ainsi obtenus et servant de matrices pour le cycle suivant. Les températures utilisées à l'étape de dénaturation n'étant pas compatibles avec la conservation des activités de nombreuses ADN polymérases, des travaux de recherche important sont consacrés aux enzymes thermostables décrites précédemment. Il est notamment essentiel ne pas limiter la préparation de ces enzymes aux seuls procédés de purification à partir du microorganisme, mais de chercher à augmenter les rendements de production en utilisant les méthodes du génie génétique. Selon ces méthodes bien connues de l'homme du métier (Maniatis, et al., Molecular Cloning: A laboratory M~n~Al, 1982), le gène codant pour 1' ADN polymérase est cloné dans un vecteur d'expression, lequel vecteur est inséré dans un hôte cellulaire capable d'exprimer l'enzyme, l'hôte cellulaire est cultivée dans des conditions adéquates et 1 'ADN polymérase est extraite et récupérée. Cette méthode a par exemple été décrite dans la demande de brevet PCT WO89/06691 pour produire l'ADN polymérase de Thermus aslua ti cus .
Le développement des technologies d' ADN
recombinant tant dans le domaine de la recherche que dans celui de la production industrielle nécessite de disposer de divers types d' ADN polymérase susceptibles d'améliorer quantitativement ou qualitativement des WO98/01567 PCT~R97/01259 techniques aussi diverses que le clonage, la détection, le marquage ou l~amplification de séquences d'acide - nucléique.
La présente invention vise précisément à
offir de nouvelles enzymes hyperthermostables obtenues des espèces Pyrococcus sp. qui catalysent la polymérisation de l'ADN. Ces enzymes proviennent d'isolats d'échantillons d'archaebactéries hyperthermophiles (Woese, C. R., O. Kandler, and M.
I0 Wheelis, l990. Proc. Natl. Acad. Sci. USA. 87:4576-4579) prélevés dans des sources hydrothermales profondes du bassin Nord-Fiji dans le Pacifique sud (Desbruyères, D., A.-M. Alayse-Danet, and S. Ohta. 1994.Geology. 116:227-242 ; Marteinsson, V. T., L. Watrin, D. Prieur, J. C.
Caprais, G. Raguenes, and G. Erauso. 1995.
International ~ournal of Systematic Bacteriology.
45(4):623-632). Tous ces isolats sont hyperthermostables avec des températures d'isolement de l'ordre de 80 à
100~C. Une ADN polymérase de l'invention a un poids moléculaire d'environ 89000 daltons et présente une hyperthermostabilité permettant sa mise en oeuvre dans des réactions conduites à des températures de 70 à 90~C.
Les travaux réalisés dans le cadre de l'invention ont permis d'identifier deux nouvelles ADN
polymérases thermostables d'archaebactéries du genre Pyrococcus sp. dont la relation phylogénétique a été
étudiée. Les gènes codant pour ces deux ADN polymérases ont été clonés et séquencés et leur comparaison a mis en évidence de fortes analogies de séquence et d'organisation.
L'invention a plus particulièrement pour objet une ADN polymérase purifiée thermostable d~archaebactéries du genre Pyrococcus sp. ayant un poids moléculaire compris entre environ 89 000 et 90 000 daltons.
Une première ADN polymérase purifiée thermostable selon l'invention provient de la souche d'archaebactéries du genre Pyrococcus sp. déposée à la Collection National de Culture de Micro-organismes (CNCM) à l'Institut Pasteur, le 3 Juillet 1996 sous le No I-1764. Cette ADN polymérase sera dénommée dans ce qui suit Pyrococcus sp. GE 23. Sa séquence de 771 acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO: 1. Un poids moléculaire de 89 409 daltons et un pI de 8,37 ont été déduits de cette séquence. L'invention concerne donc l'ADN
polymérase dePyrococcus sp. GE 23 dont la séquence en acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO:1 ou tout autre séquence constituant un dérivé enzymatiquement équivalent de celle-ci. On entend par dérivés enzymatiquement équivalents, les polypeptides et protéines constitués par ou comprenant la séquence en acides aminés représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:1 dès lors qu'ils présentent les propriétés de l'ADN polymérase de Pyrococcus sp. GE 23. A ce titre l'invention envisage plus particulièrement une ADN polymérase dont la séquence en acides aminés est un fragment de celle représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:1 ou encore un assemblage de tels fragments On entend aussi par dérivés enzymatiquement équivalents, les séquences en acides aminés ci-dessus modifiées par insertion et/ou délétion et/ou substitution d'un ou plusieurs aminoacides, pour autant que les propriétés de 1' ADN polymérase de Pyrococcus sp .
GE 23 qui en résultent ne soient pas significativement modifiées.
WO98/01567 PCT~R97/01259 Une seconde ADN polymérase purifiée thermostable selon l'invention provient de la souche d~archaebactéries du genre Pyrococcus sp. déposée à la CNCM le 20 Avril 1993 sous le No I-1302. Cette ADN
S polymérase sera dénommée dans ce qui suit Pyrococcus sp.
GE 5 (alias Pyrococcus abyssi). Sa séquence de 771 acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO:2. Un poids moléculaire de 89 443 daltons et un pI de 8,13 ont été
déduits de cette séquence.
L'invention concerne donc 1'ADN polymérase dePyrococcus sp. GE 5 dont la séquence en acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID NO:2 ou tout autre séquence constituant un dérivé enzymatiquement équivalent de celle-ci. On entend par dérivés enzymatiquement équivalents, les polypeptides et protéines constitués par ou comprenant la séquence en acides aminés représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:2 dès lors ~u'ils présentent les propriétés de l'ADN
polymérase de Pyrococcus sp. GE 5. A ce titre l~invention envisage plus particulièrement une ADN
polymérase dont la séquence en acides aminés est un fragment de celle représentée dans la liste de séquences en annexe sous le numéro SEQ ID NO:2 ou encore un assemblage de tels fragments On entend aussi par dérivés enzymatiquement équivalents, les séquences en acides aminés ci-dessus modifiées par insertion et/ou délétion et/ou substitution d'un ou plusieurs aminoacides, pour autant que les propriétés de l'ADN pol~mérase de Pyrococcus sp.
GE 5 qui en résultent ne soient pas significativement modifiées.
Les ADN polymérases Pyrococcus sp. GE 23 et de Pyrococcus sp. GE 5 se distinguent l'une de l'autre WO 98/01567 PCT~7/01259 par lO résidus d'acides aminés dont les positions sont indiqués dans le tableau I ci-dessous.
Tableau I
Positions Pyrococcus sp. GE 23 Pyrococcus sp. GE 5 263 Val Ala 277 A_a Thr 2 l A_a Val ~ Phe Ser :~ Gln His
3 r~ ~ Arg Thr ~ r- 1ys Asn 5 ~ Ser A~g 5. Pro H_s 55~ Asn G_u S L'invention concerne également une séquence d'ADN constituée par ou comprenant la séquence codant pour une ADN polymérase purifiée thermostable de l~invention.
Une première séquence d'ADN selon l'invention comprend ou est constituée par les nucléotides 1547 à 3862 de la SEQ ID NO:l codant pour les 771 acides aminés de l'ADN polymérase de Pyrococcus Sp. GE 23.
Une seconde séquence d'ADN selon l'invention lS comprend ou est constituée par les nucléotides 678 à
2994 de la SEQ ID NO:2 codant pour les 771 acides aminés de l'ADN polymérase de Pyrococcus sp . GE 5.
L'invention concerne autant l'ADN polymérase thermostable définie précédemment isolée et purifiée d'une souche de pyrococcus sp . ~ue l'ADN polymérase thermostable préparée par les méthodes du génie génétique. En conséquence, l'invention a aussi pour objet un vecteur comprenant une sé~uence d~ADN définie précédemment, ainsi qu'un procédé de production ou d'expression dans un hôte cellulaire des ADN polymérases thermostables de l'invention.
WO98101567 PCT~R97/01259 Un procédé de production d'une ADN
polymérase thermostable conforme à l'invention consiste:
- à transférer une molécule d'acide nucléique codant pour une ADN polymérase thermostable ou S un vecteur contenant ladite molécule dans un hôte cellulaire, - à cultiver l'hôte cellulaire obtenu à
l'étape précédente dans des conditions permettant la production de 1' ADN polymérase, - à isoler, par tous moyens appropriés ladite ADN polymérase.
L'hôte cellulaire mis en oeuvre dans les procédés précédents peut être choisi parmi les procaryotes ou les eucaryotes et notamment parmi les bactéries, les levures, les cellules de mammifères, de plantes ou d'insectes.
Le vecteur utilisé est choisi en fonction de l'hôte dans lequel il sera transféré, il peut s'agir de -tout vecteur comme un plasmide.
Les ADN polymérases thermostables de l'invention sont utiles notamment dans des procédés d'amplification enzymatique de séquences d'acides nucléiques. En conséquence, l'invention a pour objet, de tels procédés mettant en oeuvre une ADN polymérase thermostable décrite précédemment, ainsi que les kits d'amplification comprenant, outre les réactifs généralement utilisés, une quantité adéquate de cette ADN polymérase.
D ' autres avantages et caractéristiques de l~invention apparaîtront à la lecture des exemples qui suivent donnés à titre non limitatif et concernant le clonage, l'expression, la caractérisation et l'activité
des ADN polymérases thermostables de l'invention.
., . _ .. .. .
I - Matériels et méthodes.
1) Conditions de culture, ~lasmides et souches utilisées.
Les souches Pyrococcus furiosus (DSM 5262) et Thermococcus litoralis (DSM 5474) ont été obtenues auprès de la collection du Deutsche Sammlung von MikroorganiSmen (DSM) Braunschweig - Stocheim, Allemagne. Les souches Pyrococcus sp. G 23 et G 5 ont été isolées de cheminées de sources hydrothermales profondes découvertes lors de la campagne franco-japonaise STARMER effectuée en 1989 à 2000 mètres de profondeur dans le bassin Nord-Fiji.
Pyrococcus sp. G 5 a été cultivée anaerobiquement dans un fermenteur de 8 litres dans un milieu BHI (DIFCO) supplémenté avec du soufre à un pH de 6,5 et à 90~C, comme décrit dans la littérature (Erauso, G., A. L. Reysenbach, A. Godfroy, J.-R. Meunier, B.
Crump, F. Partensky, J. A. Baross, V. Marteinsson, G.
Barbier, N. R. Pace, and D. Prieur. 1993. Archives of Microbiology. 160:338-349).
Pyrococcus sp. G 23 a été cultivée à 85~C
dans un fermenteur identique dans un milieu 2216S
(DIFCO) à un pH de 6,5.
La souche E. coli SURE, XLl-Blue (Stratagene, La Jolla, Calif. USA) a été utilisée comme hôte pour les plasmides recombinants dérivés de pUC18 et pBluescript. Les souches E. coli NOVABLUE, BL21(DE3) et BL21(DE3)pLysS (Novagen, Madison, Wi. USA) ont été
utilisées cornrne hôte pour les plasmides recombinants dérivés. E. coli SURE, XLl-Blue, NOVABLUE, BL21(DE3) et BL21(DE3)pLysS ont été cultivées dans un milieu LB
(DIFCO) ou LB supplémenté avec des antibiotiques appropriés (DIFCO).
2) Isolement de 1'ADN, h~rbridation et ADN
recombinants.
L'ADN de haut poids moléculaire de Pyrococcus sp. G 23 et G 5 a été isolé par la méthode de Charbonnier modifiée (Charbonnier, F., G. Erauso, T.
Barbeyron, D. Prieur, and P. Forterre. 1992. ~ournal of Bacteriology. 174, 19 :6103-6109). Les cellules centrifugées ont été resuspendues dans un tampon TE-Na-lx, puis lysées à 40~C pendant 3 heures avec un mélange de N-lauryl sarcosine 1 %, sulfate de sodium de dodecyl 1% et 0,4 mg/ml de protéinase K. Après centrifugation à
5000 g pendant 10 minutes, l'ADN est extrait par PCI
~25-24-1), puis traité par la RNAase à 5 ~g/ml à 60~C
pendant une heure. Ces étapes sont suivies par une extraction additionnelle par PCI et une extraction au chloroforme. L'ADN est précipité avec de l'éthanol 100 %
et les pastilles sont séchées et suspendues dans du TE-lx. La concentration et la pureté de l'ADN ont été
estimées par spectrophotométrie à 230, 260 et 280 nm avec un appareil GeneQuantII (Pharmacia, Upsalla, SWeden). Pour la construction de la mini-librairie pUC18 (Sutherland, K. J., C. M. Henneke, P. Towner, and D. W.
Hough. 1990. European Journal of Biochemistry. 194:839-844) de Pyrococcus sp. G 23, l'ADN génomique a été
digéré par une série d'enzymes de restriction (BamHI, BgII, EcoRI, EcoRV, HindIII, PvuII, SalI, SacI, XbaI et XhoI) par simple ou double digestion. Puis les fragments d'ADN ont subi une migration sur gel d'agarose 0,8 %
dans du TBE-lx et ont été transférés sur une membrane de nylon Hybond-N+ (Amersham, UK) et hybridés avec des sondes d'ADN préparées par PCR avec des amorces spécifiques sélectionnées à partir des gènes d'ADN
polymérases de P. furiosus et T. litoralis, marqués au 32p par random-priming conformPm~nt aux recomm~ tions du fabriquant (Magaprime, Amersham, UK). Deux sondes de P. Furiosus ont été utilisées, pFu~ et PfuF, couvrant CA 02260274 1999-0l-08 respectivement les régions délimitées par les paires de base 8 à 2316 et 819 à 1915 de la section codante du gène de la polymérase Pfu, comme défini par Uemori et al. (Uemori, T., Y. Ishino, H. Toh, K. Asada, and I.
Kato. 1993. Nucleic Acids Research. 21(2):259-265). Deux sondes de T. litoralis, TliI et TliT, couvrant respectivement les régions délimitées par les paires de base 297 à 1768 et 4631 à 5378, comme défini par Hodges et al. (Hodges, R. A., F. B. Perler, C. J. Noren, and W.
E. Jack. 1992. Nucleic Acids Res. 20(23):6153-6157. Les fragments positifs, identifiés par hybridation ADN-ADN
(Southern, E. M. 1975. ~ournal of molecular biology.
98:503), ont été ensuite préparés par des digestions appropriées de 100 ~g d'ADN génomique, purifiés dans des sacs de dialyse à partir des gels d'agarose, et précipités à l'éthanol 100 %. Les fragments ont été
ligaturés dans pUC18, lequel avait été coupé par les enzymes de restriction appropriés pour une digestion simple et déphosphorylé. La transformation des souches hôtes a été réalisée par électroporation (Gene Pulser, Biorad). Le criblage des clones recombinants a été
effectué par hybridation de colonie selon les techniques décrites dans la littérature (Sambrook, J., E. F.
Fritsch, and T. Maniatis. 1989. Molecular Cloning: A
Laboratory M~n~7A 7, 2nd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor).La température des Southern blots et d'hybration de colonie était de 55~C dans un tampon standard sans formamide. L'ADN de plasmide a été
isolé par la méthode de Birnboim et Doly (Birnboim, H.
C., and J. Doly. 1979. Nucleic Acids Research. 7:1503), puis purifié par chromatographie échangeuse d'anions en phase solide (Quiagen, Chatsworth, Calif. USA~. Les fragments de restriction des plasmides dérivés de pUC
ont été purifiés sur gels d'agarose par la méthode de GeneClean (Bio 101, La Jolla, Calif.) pour un clanage ultérieur. Les réaction de polymérisation en chaîne CA 02260274 Ig99-ol-os W098/01567 11 PCTn~7tO1259 (PCR~ de longs fragments ont été effectuées conformément à la procédure dé~inie par Barnes (Barnes, W. M. 1994.
Proc. Natl.Acad. Sci. USA. 91:2216-2220) avec un mélange réactionnel Taq Extender (Stratagene, La Jolla, Calif.).
Les ADNr de 16S et 23S de Pyrococcus sp. GE 23 ont été
amplifiés par PCR avec un thermocyleur Stratagene 96-gradient en utilisant les conditions suivantes :
- amorce directe Aa (5'-TCCGGTTGATCCTGCCGGA-3'), - amorce indirecte 23Sa (5'-CTTTCGGTCGCCCCTACT-3'), - étape initiale 3 minutes à 94~C suivi de 30 cycles (94~C, 1 mn/49~C, lmn/72~C, 2mn) et, - élongation finale de 5 mn à 72~C.
Les produits de PCR ont été clonés dans le vecteur pBluescript pour séquencage.
Le gène de l'ADN polymérase de Pyrococcus sp. GE 5 a été isolé par PCR en utilisant les amorces mises au point pour exprimer le gène de l~ADN polymérase de Pyrococcus sp. GE 23 :
- GE23DIR (5'-TGGGGCATATGATAATCGATGCTGATTAC-3') - GE23REV (5'-GACATCGTCGACTCTAGAACTTAAGCCATGGTCCG-3').
3) Séauencaae des ADN.
Les séquences d'ADN ont été obtenues par la méthode de terminaison de chaîne didéoxy (Sanger, F., S.
Nicklen, and A. R. Coulson. 1977. Proc. Natl. Acad. Sci.
USA. 74:5467-5473) en utilisant un système d'analyse automatique d'ADN Applied Biosystems. Les deux brins des gènes codant l'ADN polymérase de Pyrococcus sp. G23 et G5 ont été séquencés alors que l'ADNr 16S de Pyrococcus sp. G23 a été séquencé sur un seul brin, en utilisant des amorces universelles localisées sur des vecteurs et des amorces internes.
L'analyse de séquence a été réalisée avec un logiciel DNASTAR (Madison, Wis., USA) et le programme de Genetics Computer Group (University of Wisconsin Biotechnology Center, Madison, Wis., USA) accessible en WO98/01567 PCT~R97/01259 ligne sur INFOBIOGEN. Les recherches informatisées de similitudes ont été réalisées avec le programme BLAST, les alignements multiples avec CLUSTAL V, et les arbres phylogénétiques ont été établis selon la méthode dite I'Neighbour-joining (Saitou, N., and M. Nei. 1987. Mol.
Biol. Evol. 4(4):406-425).
Une première séquence d'ADN selon l'invention comprend ou est constituée par les nucléotides 1547 à 3862 de la SEQ ID NO:l codant pour les 771 acides aminés de l'ADN polymérase de Pyrococcus Sp. GE 23.
Une seconde séquence d'ADN selon l'invention lS comprend ou est constituée par les nucléotides 678 à
2994 de la SEQ ID NO:2 codant pour les 771 acides aminés de l'ADN polymérase de Pyrococcus sp . GE 5.
L'invention concerne autant l'ADN polymérase thermostable définie précédemment isolée et purifiée d'une souche de pyrococcus sp . ~ue l'ADN polymérase thermostable préparée par les méthodes du génie génétique. En conséquence, l'invention a aussi pour objet un vecteur comprenant une sé~uence d~ADN définie précédemment, ainsi qu'un procédé de production ou d'expression dans un hôte cellulaire des ADN polymérases thermostables de l'invention.
WO98101567 PCT~R97/01259 Un procédé de production d'une ADN
polymérase thermostable conforme à l'invention consiste:
- à transférer une molécule d'acide nucléique codant pour une ADN polymérase thermostable ou S un vecteur contenant ladite molécule dans un hôte cellulaire, - à cultiver l'hôte cellulaire obtenu à
l'étape précédente dans des conditions permettant la production de 1' ADN polymérase, - à isoler, par tous moyens appropriés ladite ADN polymérase.
L'hôte cellulaire mis en oeuvre dans les procédés précédents peut être choisi parmi les procaryotes ou les eucaryotes et notamment parmi les bactéries, les levures, les cellules de mammifères, de plantes ou d'insectes.
Le vecteur utilisé est choisi en fonction de l'hôte dans lequel il sera transféré, il peut s'agir de -tout vecteur comme un plasmide.
Les ADN polymérases thermostables de l'invention sont utiles notamment dans des procédés d'amplification enzymatique de séquences d'acides nucléiques. En conséquence, l'invention a pour objet, de tels procédés mettant en oeuvre une ADN polymérase thermostable décrite précédemment, ainsi que les kits d'amplification comprenant, outre les réactifs généralement utilisés, une quantité adéquate de cette ADN polymérase.
D ' autres avantages et caractéristiques de l~invention apparaîtront à la lecture des exemples qui suivent donnés à titre non limitatif et concernant le clonage, l'expression, la caractérisation et l'activité
des ADN polymérases thermostables de l'invention.
., . _ .. .. .
I - Matériels et méthodes.
1) Conditions de culture, ~lasmides et souches utilisées.
Les souches Pyrococcus furiosus (DSM 5262) et Thermococcus litoralis (DSM 5474) ont été obtenues auprès de la collection du Deutsche Sammlung von MikroorganiSmen (DSM) Braunschweig - Stocheim, Allemagne. Les souches Pyrococcus sp. G 23 et G 5 ont été isolées de cheminées de sources hydrothermales profondes découvertes lors de la campagne franco-japonaise STARMER effectuée en 1989 à 2000 mètres de profondeur dans le bassin Nord-Fiji.
Pyrococcus sp. G 5 a été cultivée anaerobiquement dans un fermenteur de 8 litres dans un milieu BHI (DIFCO) supplémenté avec du soufre à un pH de 6,5 et à 90~C, comme décrit dans la littérature (Erauso, G., A. L. Reysenbach, A. Godfroy, J.-R. Meunier, B.
Crump, F. Partensky, J. A. Baross, V. Marteinsson, G.
Barbier, N. R. Pace, and D. Prieur. 1993. Archives of Microbiology. 160:338-349).
Pyrococcus sp. G 23 a été cultivée à 85~C
dans un fermenteur identique dans un milieu 2216S
(DIFCO) à un pH de 6,5.
La souche E. coli SURE, XLl-Blue (Stratagene, La Jolla, Calif. USA) a été utilisée comme hôte pour les plasmides recombinants dérivés de pUC18 et pBluescript. Les souches E. coli NOVABLUE, BL21(DE3) et BL21(DE3)pLysS (Novagen, Madison, Wi. USA) ont été
utilisées cornrne hôte pour les plasmides recombinants dérivés. E. coli SURE, XLl-Blue, NOVABLUE, BL21(DE3) et BL21(DE3)pLysS ont été cultivées dans un milieu LB
(DIFCO) ou LB supplémenté avec des antibiotiques appropriés (DIFCO).
2) Isolement de 1'ADN, h~rbridation et ADN
recombinants.
L'ADN de haut poids moléculaire de Pyrococcus sp. G 23 et G 5 a été isolé par la méthode de Charbonnier modifiée (Charbonnier, F., G. Erauso, T.
Barbeyron, D. Prieur, and P. Forterre. 1992. ~ournal of Bacteriology. 174, 19 :6103-6109). Les cellules centrifugées ont été resuspendues dans un tampon TE-Na-lx, puis lysées à 40~C pendant 3 heures avec un mélange de N-lauryl sarcosine 1 %, sulfate de sodium de dodecyl 1% et 0,4 mg/ml de protéinase K. Après centrifugation à
5000 g pendant 10 minutes, l'ADN est extrait par PCI
~25-24-1), puis traité par la RNAase à 5 ~g/ml à 60~C
pendant une heure. Ces étapes sont suivies par une extraction additionnelle par PCI et une extraction au chloroforme. L'ADN est précipité avec de l'éthanol 100 %
et les pastilles sont séchées et suspendues dans du TE-lx. La concentration et la pureté de l'ADN ont été
estimées par spectrophotométrie à 230, 260 et 280 nm avec un appareil GeneQuantII (Pharmacia, Upsalla, SWeden). Pour la construction de la mini-librairie pUC18 (Sutherland, K. J., C. M. Henneke, P. Towner, and D. W.
Hough. 1990. European Journal of Biochemistry. 194:839-844) de Pyrococcus sp. G 23, l'ADN génomique a été
digéré par une série d'enzymes de restriction (BamHI, BgII, EcoRI, EcoRV, HindIII, PvuII, SalI, SacI, XbaI et XhoI) par simple ou double digestion. Puis les fragments d'ADN ont subi une migration sur gel d'agarose 0,8 %
dans du TBE-lx et ont été transférés sur une membrane de nylon Hybond-N+ (Amersham, UK) et hybridés avec des sondes d'ADN préparées par PCR avec des amorces spécifiques sélectionnées à partir des gènes d'ADN
polymérases de P. furiosus et T. litoralis, marqués au 32p par random-priming conformPm~nt aux recomm~ tions du fabriquant (Magaprime, Amersham, UK). Deux sondes de P. Furiosus ont été utilisées, pFu~ et PfuF, couvrant CA 02260274 1999-0l-08 respectivement les régions délimitées par les paires de base 8 à 2316 et 819 à 1915 de la section codante du gène de la polymérase Pfu, comme défini par Uemori et al. (Uemori, T., Y. Ishino, H. Toh, K. Asada, and I.
Kato. 1993. Nucleic Acids Research. 21(2):259-265). Deux sondes de T. litoralis, TliI et TliT, couvrant respectivement les régions délimitées par les paires de base 297 à 1768 et 4631 à 5378, comme défini par Hodges et al. (Hodges, R. A., F. B. Perler, C. J. Noren, and W.
E. Jack. 1992. Nucleic Acids Res. 20(23):6153-6157. Les fragments positifs, identifiés par hybridation ADN-ADN
(Southern, E. M. 1975. ~ournal of molecular biology.
98:503), ont été ensuite préparés par des digestions appropriées de 100 ~g d'ADN génomique, purifiés dans des sacs de dialyse à partir des gels d'agarose, et précipités à l'éthanol 100 %. Les fragments ont été
ligaturés dans pUC18, lequel avait été coupé par les enzymes de restriction appropriés pour une digestion simple et déphosphorylé. La transformation des souches hôtes a été réalisée par électroporation (Gene Pulser, Biorad). Le criblage des clones recombinants a été
effectué par hybridation de colonie selon les techniques décrites dans la littérature (Sambrook, J., E. F.
Fritsch, and T. Maniatis. 1989. Molecular Cloning: A
Laboratory M~n~7A 7, 2nd ed. Cold Spring Harbor Laboratory Press, Cold Spring Harbor).La température des Southern blots et d'hybration de colonie était de 55~C dans un tampon standard sans formamide. L'ADN de plasmide a été
isolé par la méthode de Birnboim et Doly (Birnboim, H.
C., and J. Doly. 1979. Nucleic Acids Research. 7:1503), puis purifié par chromatographie échangeuse d'anions en phase solide (Quiagen, Chatsworth, Calif. USA~. Les fragments de restriction des plasmides dérivés de pUC
ont été purifiés sur gels d'agarose par la méthode de GeneClean (Bio 101, La Jolla, Calif.) pour un clanage ultérieur. Les réaction de polymérisation en chaîne CA 02260274 Ig99-ol-os W098/01567 11 PCTn~7tO1259 (PCR~ de longs fragments ont été effectuées conformément à la procédure dé~inie par Barnes (Barnes, W. M. 1994.
Proc. Natl.Acad. Sci. USA. 91:2216-2220) avec un mélange réactionnel Taq Extender (Stratagene, La Jolla, Calif.).
Les ADNr de 16S et 23S de Pyrococcus sp. GE 23 ont été
amplifiés par PCR avec un thermocyleur Stratagene 96-gradient en utilisant les conditions suivantes :
- amorce directe Aa (5'-TCCGGTTGATCCTGCCGGA-3'), - amorce indirecte 23Sa (5'-CTTTCGGTCGCCCCTACT-3'), - étape initiale 3 minutes à 94~C suivi de 30 cycles (94~C, 1 mn/49~C, lmn/72~C, 2mn) et, - élongation finale de 5 mn à 72~C.
Les produits de PCR ont été clonés dans le vecteur pBluescript pour séquencage.
Le gène de l'ADN polymérase de Pyrococcus sp. GE 5 a été isolé par PCR en utilisant les amorces mises au point pour exprimer le gène de l~ADN polymérase de Pyrococcus sp. GE 23 :
- GE23DIR (5'-TGGGGCATATGATAATCGATGCTGATTAC-3') - GE23REV (5'-GACATCGTCGACTCTAGAACTTAAGCCATGGTCCG-3').
3) Séauencaae des ADN.
Les séquences d'ADN ont été obtenues par la méthode de terminaison de chaîne didéoxy (Sanger, F., S.
Nicklen, and A. R. Coulson. 1977. Proc. Natl. Acad. Sci.
USA. 74:5467-5473) en utilisant un système d'analyse automatique d'ADN Applied Biosystems. Les deux brins des gènes codant l'ADN polymérase de Pyrococcus sp. G23 et G5 ont été séquencés alors que l'ADNr 16S de Pyrococcus sp. G23 a été séquencé sur un seul brin, en utilisant des amorces universelles localisées sur des vecteurs et des amorces internes.
L'analyse de séquence a été réalisée avec un logiciel DNASTAR (Madison, Wis., USA) et le programme de Genetics Computer Group (University of Wisconsin Biotechnology Center, Madison, Wis., USA) accessible en WO98/01567 PCT~R97/01259 ligne sur INFOBIOGEN. Les recherches informatisées de similitudes ont été réalisées avec le programme BLAST, les alignements multiples avec CLUSTAL V, et les arbres phylogénétiques ont été établis selon la méthode dite I'Neighbour-joining (Saitou, N., and M. Nei. 1987. Mol.
Biol. Evol. 4(4):406-425).
4) Construction des recombinants ex~rimant l'ADN ~olvmérase de PYrococcus s~. G 23 et G5.
Les ADN polymérases de Pyrococcus sp. G 23 et G 5 ont été exprimées dans E. coli en utilisant le système d'expression pET12, appartenant au système d'expression T7 (Studier, F. W., A. H. Rosenberg, F. J.
Dunn, and J. W. Dubendorff. 1990. Methods Enzymol.
185:60-89) acquis auprès de Novagen (Madison, Wi; USA).
La PCR a été utilisée pour préparer les fragments de Pyrococcus sp. G 23 et G 5 contenant les sites de restriction NdeI et SalI compatibles avec l'extréminté
des amorces GE23DIR et GE23REV. Le mélange de PCR
contenait l'ADN polymérase GOLDSTAR (Eurogentec, B), l'enzyme Taq extender Taq (Pfu de Stratagene), le tampon d'extension avec les ~uatres dNTP (chacun à 0,2 mM) et les amorces GE23DIR et GE23REV à 50 pmoles dans un volume final de 50 ~1. L'amplification a été effectuée sur 20 cycles : lmn à 90~C, lmn à 50~C et 3 mn à 72~C, en utilisant un thermocycleur Stratagene g6-gradient.
Les fragments de PCR digérés par NdeI et SalI ont été
ligaturés aux sites NdeI et SalI de pET12a digérés avec les mêmes enzymes, réétablissant ainsi le codon d'initiation. Les constructions obtenues ont été nommées respectivement pETPABl et pETGEl. Ces constructions ont été séquencées toutes les deux aux sites de jonction et entièrement pour pETPABl. Les tests d'expression ont été
réalisés conformément aux recommandations du fabriquant du système d'expression pET : sélection des clones dans WO98/01567 13 PCT~R97/012S9 E. coli Novablue, culture of E. coli BL21(DE3), induction (IPTG 0,2-lmM).
750 ~1 de cellules de cultures induites à
DO60o=l et non induites ont été centrifuées, S resuspendues dans un tampon de lyse B (Tris-HCl 10 mM pH
7,5 ; NaCl 10 mM ; MgCl2 2 mM ; Triton X-100 1% v/v).
L'ADN polymérase a été observée par SDS-PAGE après une dénaturation thermique partielle des protéine hôtes (71~C, 20 mn) et concentrée sur filtres Millipore (Ultrafree MC). L'activité a été testée par mesure de l'incorporation de 3H-dTTP (Amersham, UK) en utilisant de l'ADN de thymus de veau activé comme substrat (Sigma-Aldrich, F) dans le milieu de réaction C (Tris-HCl 50 mM
pH 8,8 ; DTT lmM ; MgC12 lOmM ; KCl 10 mM ; BSA 0,4 mg/ml, chaque dNTP à 0,4 mM).
I~ - Résultats.
1) Isolement du qène de 1'ADN ~ol~mérase de Pvrococcus s~. GE 23, Les ADN génomiques des souches Pyrococcus sp. GE 23 et GE 5, digérés par une série d'enzymes de restriction, ont été hybridés à l'ADN de P. furiosus et à des sondes de T. li toralis préparées par PCR. Comme montré aux figures 1 et 2, l~analyse en Southern blots a révélé un ~ragment positif HindIII-HindIII de 2,9 kb avec une sonde TliI marquée au 32p ~figure 2), alors que la sonde PfuF a révélé un fragment positif XbaI-XbaI de 8 kb tfigure 1) (exposition de 24 heures). Le fragment de 2,9 kb a été récupéré et purifié comme décrit précé~mm~nt dans Matériels et Méthodes et cloné dans le vesteur pUC18 digéré par HindIII. Environ 600 recom~binants (E. coli SURE) ont été criblés avec une sonde TliI radiomarquée et 6 d'entre-eux ont donné un signal positif d'hybridation. Des profils de restriction identiques ont été obtenus pour ces clones indiquant WO98/01567 14 PCT~R97/01259 qu'ils contiennent probablement le même insert. Le séquençcage ultérieur de l'un de ces clones (désigné
pGE23a) et la comparaison de séquence (FASTA) ont démontré qu'il correspond aux 1358 premières paires de base du gène de l'ADN polymérase appartenant à la famille B (Braithwaite, D. K., and J. Ito. 1993. Nucleic Acids Research.21(4) :787-802) et qu'il se termine au site HindIII. L'analyse de la séquence nucléotidique montre que le site XbaI est localisé en amont du codon d'initiation et qu'en conséquence le fragment positif XbaI-XbaI de 8 kb devrait contenir la partie 3' du gène.
Selon la même méthode, ce fragment de 8 kb a été cloné
dans le vecteur pUC18 et 3 clones recombinants positifs parmi 800 ont été identifiés par hybridation de colonie comme précédemment en utilisant une sonde homologue préparée à partir de la partie 5' du gène de l'ADN
polymérase de Pyrococcus sp. GE 23. Les cultures dans un milieu liquide (LB-ampicillin) de ces clones ont été
systématiquement lysées bien avant DO600=0,5. Une culture a été arrêtée à DO60o=oll et l'ADN plasmidique (désigné pGE23b) a été extrait. La PCR longue distance (avec le Taq Extender) a été effectuée sur cet ADN
plasmidique en utilisant une amorce directe localisée sur la partie 5' de la séquence obtenue précédemment et une amorce réverse localisée en aval sur le vecteur pUCl8, pour obtenir un produit d'amplification de 8 kb.
La partie 3' a été séquencée ultérieurement. Puis, une nouvelle PCR longue distance a été effectuée en utilisant la même amorce directe localisée sur la partie 5' du gène et une amorce réverse localisée sur la partie 3' disponible. Les produits d'amplification de lO
réactions de PCR séparées ont été rassemblés, purifiés par électrophorèse sur gel d'agarose et séqencés sur les deux brins en utilisant des amorces internes. Ces produits contiennent la partie 3' du gène de l'ADN
polymérase de Pyrococcus sp. G23.
WO98/01567 PCT~R97/01259 2) Position ~h~lo~énétiaue de P~rococcus s~.
G23 et GE5.
Pyrococcus sp. G23 et G5 apartiennent au meme groupe de PCR-RFLP d'ADNr 16S (Meunier, J. R. 1994.
Biodiversité et systématique des populations de microorganismes hermophiles isolés d'écosystémes ~ydrothermaux océaniques abyssaux. Thèse, Paris 7) indiquant qu'il pourrait s'agir de deux différentes souches de la même espèce. Toutefois, comme montré sur la figure 3, les profils RFLP différents des gènes de l'ADN polymérase de Pyrococcus sp. G23 et G5, obtenus avec les différentes sondes (Pfu~,PfuP, TliI) indiquent qu'au moins les gènes de 1'ADN polymérase présentent des différences significatives. Des hybridations ADN-ADN en slot blots (Marteinsson, V. T., L. Watrin, D. Prieur, J.
C. Caprais, G. Raguenes, and G. Erauso. 1995.
International Journal of Systematic Bacteriology.
45(4):623-632) ont conduits à des niveaux contradictoires de relation : 79 % entre GE 23 non marqué et GE 5 marqué, et 98 % entre GE 5 non marqué et GE 23 marqué. L'amplification des gènes des ADNr 16S-23S
a été effectuée comme décrit précédemment dans Matériels et Méthodes. La bande amplifiée de 1,9 kb a été purifiée et séquencée sur un brin. La séquence complète de l'ADNr 16S a été comparée avec sa contrepartie de Pyrococcus sp . GE 5 et d'autres espèces de Pyrococcus sp. et Thermococcus. Le niveau de similitude entre Pyrococcus sp. GE 23 et Pyrococcus sp. GE 5 est de 97,8 % et Pyrococcus sp. GE 23 a été regroupé avec Pyrococcus 5p.
GE 5 ( Pyrococcus abyssi) dans l'arbre phylogénétique des ADN polymérases de Thermococcales de la figure 4. De même la figure 5 représente la situation phylogénétique de Pyrococcus sp. GE23 et Pyrococcus sp. GE 5 (Pyrococcus abyssi) sur la base des séquences d'ADNr 16S. Dans ces deux figures, le dendongramme a été établi par la méthode "Neighbour-joining" et l'échelle représence la distance relative entre les séquences.
3) Identification du ~ène de l'ADN
S ~ol~mérase de Pyrococcus s~. GE 5.
Déduisant de la relation entre ces deux souches que l'isolement direct du gène de l'ADN
polymérase de Pyrococcus sp. GE 5 était possible par PCR, les deux amorces GE23DIR et GE23REV, préparées pour cloner le gène de l'ADN polymérase de Pyrococcus sp. GE
23 dans le vecteur pETl2, ont été utilisées dans une réaction de PCR contenant l'ADN génomique de Pyrococcus sp. GE 5. Les produits d'amplification de.5 réactions de PCR ont été rassemblés, purifiés et séquencés sur les deux brins. La séquence nucléotidique présente une forte homologie (97 %) avec le gène de l'ADN polymérase de Pyrococcus sp. GE 23. Afin d'obtenir la séquence du gène l'ADN polymérase de Pyrococcus sp. GE 5, différents essais de clonage ont été réalisés. Tout d'abord, un fragment HindIII-HindIII de 2,9 kb, identifié par hybridation ADN-ADN, comme montré à la figure 3, a été
cloné dans le vecteur pUCl8, transformé dans E. coli SURE et séquencé. Il se présente comme homologue au fragment HindIII-HindIII de 2,9 kb de Pyrococcus sp. GE
23 cloné précédemment et contenant la partie 5' du gène cible. Deuxièmement, un fragment positif XbaI-XbaI de 2,6 kb, contenant potentiellement la totalité de la portion codante, a été identifié par hybridation ADN-ADN
en utilisant le gène de l'ADN polymérase de Pyrococcus sp . GE 5 produit par PCR comme sonde radio-marquée. Ce fragment a été cloné dans les vecteurs pUCl8, pBluescript et pETl2 et transformé dans E. coli Novablue (.souche recA-). Trois clones recombinants.positifs parmi 600 ont été obtenus avec pETl2 et aucun avec pUC18 et pBluescript. Les profils de restriction des clones recombinants pETl2 démontrent que l'intégrité de la WO98/01567 17 ~ PCT~R97/01259 construction n'a pas été préservée. La figure 3 montre que la majeure partie de l'insert a été délétée dans le - procédé et seul subsiste le fragment 3' de 342 pb HindIII-XbaI. La sé~uence définitive du gène de l'ADN
polymérase de Pyrococcus sp. GE 5 est composée d'une partie 5' génomique HindIII-HindIII, d'une portion interne HindIII-HindIII de 611 pb issue de produits de PCR et de la partie 3' de 342 pb génomique.
4) Séauences nucléotidi~ue et ~olvoe~tdiaue des ADN ~olvmérase de Pvrococcus s~. GE 23 et GE 5.
a~ ADN ~olvmérase de Pvrococcus s~. GE 23.
Le fragment de Pyrococcus sp. GE 23 HindIII-HindIII de 2,9 Kb qui a été cloné ainsi qu'un fragment contigu dans le sens 3' de 1,6 Kb obtenu par PCR longue distance ont été séquencés sur les deux brins et assemblés. La séquence de 4447 pb obtenue a été étudiée pour déterminer les régions susceptibles d'être traduites. Deux cadres de lecture ouverts ont été mis en évidence. Le premier, dans le cadre 2, s'étendant de la paire de bases 1547 à la paire de bases 3862 correspond au gène de l'ADN polymérase codant pour une protéine de 771 acides aminés, dont le poids moléculaire déduit de la séquence est de 89 409 Daltons et le point isoélectrique théorique de 8,37. Ce poids moléculaire correspond au poids moléculaire apparent estimé par SDS-PAGE de l'ADN polymérase recombinante. Le second ORF a été localisé sur le cadre 4 entre les paires de bases 1439 et 627.
La séquence déduite a une longueur de 270 aminés et les recherches de similitude effectuées avec les programmes BLAST et FASTA n'ont révélé aucune homologie significative avec les séquences disponibles dans les bases de données Swiss-Prot et PIR.
. 18 b) ADN ~olvmérase de Pvrococcus s~. GE 5.
La séquence codante complète du gène de 1 'ADN polymérase de Pyrococcus sp. GE 5 produit par PCR
en utilisant les amorces préparées à partir du gène de Pyrococcus sp. GE 23 a été obtenue par séquençage des deux brins. Afin de confirmer la séquence de ce produit de PCR, le fragment de Pyrococcus sp. GE 5 HindIII-HindIII de 2,9 Kb qui a été cloné a également été
séquencé sur les deux brins, et les mêmes résultats ont été obtenus. La région 3' du gène a également été
séquencée à partir de l'insert HindIII-XbaI restant de 342 pb résultant de la délétion d'une partie du fragment XbaI-XbaI de 2,6 kb. Seule la région interne HindIII-HindIII de 611 pb de la séquence du gène obtenue à
partir des produits de PCR n'a pas été confirmée au niveau génomique. Un cadre de lecture ouvert entre les paires de bases 679 et 2994 a été identifié dont la traduction produit une séquence polypeptidique de 771 acides aminés, longueur identique à celle de l' ADN
polymérase de Fyrococcus sp. GE 23.
c) Com~araison des sé~uences des deux ~ol~mérases.
L'alignement des parties codantes des deux gènes montre leur forte parenté, puisqu'ils ne diffèrent que de 64 nucléotides disperses le long des séquences à
deux exceptions près. On observe tout d'abord 14 substitutions entre les paires de bases 1541 et 1603, faisant de cette région, la plus variable de la toute séquence, puis on constate un nombre limité de substitutions dans la région 3' entre les paires de bases 1890 et 2316. La plupart de ces substitutions sont sans conséquence au niveau des séquences polypetidiques, notamment les 23 premières substitutions sont sans effet sur la composition des protéines. La comparaison avec d'autres gènes d' ADN polymérases de Thermococcales W098/OlS67 PCT~R97/01259 disponibles dans les bases de données révèle que la région hautement variable entre les paires de bases 1541 - et 1603 de Pyrococcus sp. GE 23 et GE 5 semble etre une caractéristique de ces deux souches, la diversité étant bien distribuée sur les autres séquences de gènes codant pour des ADN polymérases. La comparaison au niveau des séquences polypeptidiques montre la forte similitude des deux ADN polymérases, 98 % d'homologie avec la méthode CLUSTAL V, et seulement 10 résidus différents. Les substitutions d'acides aminés sont donnés dans le tableau I et les alignements avec les ADN polymérases d'autres Thermococcales sont représents aux figures 6 et 7.
La figure 6 représente l'alignement de la lS séquence polypeptidique de 1' ADN polymérase de Pyrococcus sp. GE 23 avec celle des ADN polymérases de :
Deep Vent (intein-), Pyrococcus sp. KODl, Pyrococcus furiosus, Vent (Tli intein-), Pyrococcus sp. 9~.
La figure 7 représente l'alignement de la séquence polypeptidique de l'ADN polymérase de Pyrococcus sp. GE 5 avec celle des ADN polymérases de :
Pyrococcus sp. GB-D, Pyrococcus sp. KODl, Pyrococcus furiosus, Thermococcus litoralis, Pyrococcus sp. 9~.
Le tableau II ci-dessous indique les pourcentage de similarités entre les séquences polypeptidiques de : (1) Pyrococcus sp. GE 23, (2) Pyrococcus sp. GE 5, (3) Pyrococcus sp. GB-D, (4) Pyrococcus sp. KODl, (5) Pyrococcus furiosus, (6) Thermococcus litoralis, (7) Pyrococcus sp. 9~N.
,, .
Tableau II
(1)(2) (3) (4) (5) (6) (7) ***98,689,2 81,3 83,5 76,3 81,5 (1) *** 88,4 80,6 82,8 75,5 80,9 (2) *** 81,6 85,1 77,1 83,0 (3) *** 79,2 78,1 90,4 (4) *** 74,0 80,1 (5) *** 77,0 (6) *** (7) La plupart des substitutions d~acides aminés entre les ADN polymérases de Pyrococcus sp. GE 23 et GE
Les ADN polymérases de Pyrococcus sp. G 23 et G 5 ont été exprimées dans E. coli en utilisant le système d'expression pET12, appartenant au système d'expression T7 (Studier, F. W., A. H. Rosenberg, F. J.
Dunn, and J. W. Dubendorff. 1990. Methods Enzymol.
185:60-89) acquis auprès de Novagen (Madison, Wi; USA).
La PCR a été utilisée pour préparer les fragments de Pyrococcus sp. G 23 et G 5 contenant les sites de restriction NdeI et SalI compatibles avec l'extréminté
des amorces GE23DIR et GE23REV. Le mélange de PCR
contenait l'ADN polymérase GOLDSTAR (Eurogentec, B), l'enzyme Taq extender Taq (Pfu de Stratagene), le tampon d'extension avec les ~uatres dNTP (chacun à 0,2 mM) et les amorces GE23DIR et GE23REV à 50 pmoles dans un volume final de 50 ~1. L'amplification a été effectuée sur 20 cycles : lmn à 90~C, lmn à 50~C et 3 mn à 72~C, en utilisant un thermocycleur Stratagene g6-gradient.
Les fragments de PCR digérés par NdeI et SalI ont été
ligaturés aux sites NdeI et SalI de pET12a digérés avec les mêmes enzymes, réétablissant ainsi le codon d'initiation. Les constructions obtenues ont été nommées respectivement pETPABl et pETGEl. Ces constructions ont été séquencées toutes les deux aux sites de jonction et entièrement pour pETPABl. Les tests d'expression ont été
réalisés conformément aux recommandations du fabriquant du système d'expression pET : sélection des clones dans WO98/01567 13 PCT~R97/012S9 E. coli Novablue, culture of E. coli BL21(DE3), induction (IPTG 0,2-lmM).
750 ~1 de cellules de cultures induites à
DO60o=l et non induites ont été centrifuées, S resuspendues dans un tampon de lyse B (Tris-HCl 10 mM pH
7,5 ; NaCl 10 mM ; MgCl2 2 mM ; Triton X-100 1% v/v).
L'ADN polymérase a été observée par SDS-PAGE après une dénaturation thermique partielle des protéine hôtes (71~C, 20 mn) et concentrée sur filtres Millipore (Ultrafree MC). L'activité a été testée par mesure de l'incorporation de 3H-dTTP (Amersham, UK) en utilisant de l'ADN de thymus de veau activé comme substrat (Sigma-Aldrich, F) dans le milieu de réaction C (Tris-HCl 50 mM
pH 8,8 ; DTT lmM ; MgC12 lOmM ; KCl 10 mM ; BSA 0,4 mg/ml, chaque dNTP à 0,4 mM).
I~ - Résultats.
1) Isolement du qène de 1'ADN ~ol~mérase de Pvrococcus s~. GE 23, Les ADN génomiques des souches Pyrococcus sp. GE 23 et GE 5, digérés par une série d'enzymes de restriction, ont été hybridés à l'ADN de P. furiosus et à des sondes de T. li toralis préparées par PCR. Comme montré aux figures 1 et 2, l~analyse en Southern blots a révélé un ~ragment positif HindIII-HindIII de 2,9 kb avec une sonde TliI marquée au 32p ~figure 2), alors que la sonde PfuF a révélé un fragment positif XbaI-XbaI de 8 kb tfigure 1) (exposition de 24 heures). Le fragment de 2,9 kb a été récupéré et purifié comme décrit précé~mm~nt dans Matériels et Méthodes et cloné dans le vesteur pUC18 digéré par HindIII. Environ 600 recom~binants (E. coli SURE) ont été criblés avec une sonde TliI radiomarquée et 6 d'entre-eux ont donné un signal positif d'hybridation. Des profils de restriction identiques ont été obtenus pour ces clones indiquant WO98/01567 14 PCT~R97/01259 qu'ils contiennent probablement le même insert. Le séquençcage ultérieur de l'un de ces clones (désigné
pGE23a) et la comparaison de séquence (FASTA) ont démontré qu'il correspond aux 1358 premières paires de base du gène de l'ADN polymérase appartenant à la famille B (Braithwaite, D. K., and J. Ito. 1993. Nucleic Acids Research.21(4) :787-802) et qu'il se termine au site HindIII. L'analyse de la séquence nucléotidique montre que le site XbaI est localisé en amont du codon d'initiation et qu'en conséquence le fragment positif XbaI-XbaI de 8 kb devrait contenir la partie 3' du gène.
Selon la même méthode, ce fragment de 8 kb a été cloné
dans le vecteur pUC18 et 3 clones recombinants positifs parmi 800 ont été identifiés par hybridation de colonie comme précédemment en utilisant une sonde homologue préparée à partir de la partie 5' du gène de l'ADN
polymérase de Pyrococcus sp. GE 23. Les cultures dans un milieu liquide (LB-ampicillin) de ces clones ont été
systématiquement lysées bien avant DO600=0,5. Une culture a été arrêtée à DO60o=oll et l'ADN plasmidique (désigné pGE23b) a été extrait. La PCR longue distance (avec le Taq Extender) a été effectuée sur cet ADN
plasmidique en utilisant une amorce directe localisée sur la partie 5' de la séquence obtenue précédemment et une amorce réverse localisée en aval sur le vecteur pUCl8, pour obtenir un produit d'amplification de 8 kb.
La partie 3' a été séquencée ultérieurement. Puis, une nouvelle PCR longue distance a été effectuée en utilisant la même amorce directe localisée sur la partie 5' du gène et une amorce réverse localisée sur la partie 3' disponible. Les produits d'amplification de lO
réactions de PCR séparées ont été rassemblés, purifiés par électrophorèse sur gel d'agarose et séqencés sur les deux brins en utilisant des amorces internes. Ces produits contiennent la partie 3' du gène de l'ADN
polymérase de Pyrococcus sp. G23.
WO98/01567 PCT~R97/01259 2) Position ~h~lo~énétiaue de P~rococcus s~.
G23 et GE5.
Pyrococcus sp. G23 et G5 apartiennent au meme groupe de PCR-RFLP d'ADNr 16S (Meunier, J. R. 1994.
Biodiversité et systématique des populations de microorganismes hermophiles isolés d'écosystémes ~ydrothermaux océaniques abyssaux. Thèse, Paris 7) indiquant qu'il pourrait s'agir de deux différentes souches de la même espèce. Toutefois, comme montré sur la figure 3, les profils RFLP différents des gènes de l'ADN polymérase de Pyrococcus sp. G23 et G5, obtenus avec les différentes sondes (Pfu~,PfuP, TliI) indiquent qu'au moins les gènes de 1'ADN polymérase présentent des différences significatives. Des hybridations ADN-ADN en slot blots (Marteinsson, V. T., L. Watrin, D. Prieur, J.
C. Caprais, G. Raguenes, and G. Erauso. 1995.
International Journal of Systematic Bacteriology.
45(4):623-632) ont conduits à des niveaux contradictoires de relation : 79 % entre GE 23 non marqué et GE 5 marqué, et 98 % entre GE 5 non marqué et GE 23 marqué. L'amplification des gènes des ADNr 16S-23S
a été effectuée comme décrit précédemment dans Matériels et Méthodes. La bande amplifiée de 1,9 kb a été purifiée et séquencée sur un brin. La séquence complète de l'ADNr 16S a été comparée avec sa contrepartie de Pyrococcus sp . GE 5 et d'autres espèces de Pyrococcus sp. et Thermococcus. Le niveau de similitude entre Pyrococcus sp. GE 23 et Pyrococcus sp. GE 5 est de 97,8 % et Pyrococcus sp. GE 23 a été regroupé avec Pyrococcus 5p.
GE 5 ( Pyrococcus abyssi) dans l'arbre phylogénétique des ADN polymérases de Thermococcales de la figure 4. De même la figure 5 représente la situation phylogénétique de Pyrococcus sp. GE23 et Pyrococcus sp. GE 5 (Pyrococcus abyssi) sur la base des séquences d'ADNr 16S. Dans ces deux figures, le dendongramme a été établi par la méthode "Neighbour-joining" et l'échelle représence la distance relative entre les séquences.
3) Identification du ~ène de l'ADN
S ~ol~mérase de Pyrococcus s~. GE 5.
Déduisant de la relation entre ces deux souches que l'isolement direct du gène de l'ADN
polymérase de Pyrococcus sp. GE 5 était possible par PCR, les deux amorces GE23DIR et GE23REV, préparées pour cloner le gène de l'ADN polymérase de Pyrococcus sp. GE
23 dans le vecteur pETl2, ont été utilisées dans une réaction de PCR contenant l'ADN génomique de Pyrococcus sp. GE 5. Les produits d'amplification de.5 réactions de PCR ont été rassemblés, purifiés et séquencés sur les deux brins. La séquence nucléotidique présente une forte homologie (97 %) avec le gène de l'ADN polymérase de Pyrococcus sp. GE 23. Afin d'obtenir la séquence du gène l'ADN polymérase de Pyrococcus sp. GE 5, différents essais de clonage ont été réalisés. Tout d'abord, un fragment HindIII-HindIII de 2,9 kb, identifié par hybridation ADN-ADN, comme montré à la figure 3, a été
cloné dans le vecteur pUCl8, transformé dans E. coli SURE et séquencé. Il se présente comme homologue au fragment HindIII-HindIII de 2,9 kb de Pyrococcus sp. GE
23 cloné précédemment et contenant la partie 5' du gène cible. Deuxièmement, un fragment positif XbaI-XbaI de 2,6 kb, contenant potentiellement la totalité de la portion codante, a été identifié par hybridation ADN-ADN
en utilisant le gène de l'ADN polymérase de Pyrococcus sp . GE 5 produit par PCR comme sonde radio-marquée. Ce fragment a été cloné dans les vecteurs pUCl8, pBluescript et pETl2 et transformé dans E. coli Novablue (.souche recA-). Trois clones recombinants.positifs parmi 600 ont été obtenus avec pETl2 et aucun avec pUC18 et pBluescript. Les profils de restriction des clones recombinants pETl2 démontrent que l'intégrité de la WO98/01567 17 ~ PCT~R97/01259 construction n'a pas été préservée. La figure 3 montre que la majeure partie de l'insert a été délétée dans le - procédé et seul subsiste le fragment 3' de 342 pb HindIII-XbaI. La sé~uence définitive du gène de l'ADN
polymérase de Pyrococcus sp. GE 5 est composée d'une partie 5' génomique HindIII-HindIII, d'une portion interne HindIII-HindIII de 611 pb issue de produits de PCR et de la partie 3' de 342 pb génomique.
4) Séauences nucléotidi~ue et ~olvoe~tdiaue des ADN ~olvmérase de Pvrococcus s~. GE 23 et GE 5.
a~ ADN ~olvmérase de Pvrococcus s~. GE 23.
Le fragment de Pyrococcus sp. GE 23 HindIII-HindIII de 2,9 Kb qui a été cloné ainsi qu'un fragment contigu dans le sens 3' de 1,6 Kb obtenu par PCR longue distance ont été séquencés sur les deux brins et assemblés. La séquence de 4447 pb obtenue a été étudiée pour déterminer les régions susceptibles d'être traduites. Deux cadres de lecture ouverts ont été mis en évidence. Le premier, dans le cadre 2, s'étendant de la paire de bases 1547 à la paire de bases 3862 correspond au gène de l'ADN polymérase codant pour une protéine de 771 acides aminés, dont le poids moléculaire déduit de la séquence est de 89 409 Daltons et le point isoélectrique théorique de 8,37. Ce poids moléculaire correspond au poids moléculaire apparent estimé par SDS-PAGE de l'ADN polymérase recombinante. Le second ORF a été localisé sur le cadre 4 entre les paires de bases 1439 et 627.
La séquence déduite a une longueur de 270 aminés et les recherches de similitude effectuées avec les programmes BLAST et FASTA n'ont révélé aucune homologie significative avec les séquences disponibles dans les bases de données Swiss-Prot et PIR.
. 18 b) ADN ~olvmérase de Pvrococcus s~. GE 5.
La séquence codante complète du gène de 1 'ADN polymérase de Pyrococcus sp. GE 5 produit par PCR
en utilisant les amorces préparées à partir du gène de Pyrococcus sp. GE 23 a été obtenue par séquençage des deux brins. Afin de confirmer la séquence de ce produit de PCR, le fragment de Pyrococcus sp. GE 5 HindIII-HindIII de 2,9 Kb qui a été cloné a également été
séquencé sur les deux brins, et les mêmes résultats ont été obtenus. La région 3' du gène a également été
séquencée à partir de l'insert HindIII-XbaI restant de 342 pb résultant de la délétion d'une partie du fragment XbaI-XbaI de 2,6 kb. Seule la région interne HindIII-HindIII de 611 pb de la séquence du gène obtenue à
partir des produits de PCR n'a pas été confirmée au niveau génomique. Un cadre de lecture ouvert entre les paires de bases 679 et 2994 a été identifié dont la traduction produit une séquence polypeptidique de 771 acides aminés, longueur identique à celle de l' ADN
polymérase de Fyrococcus sp. GE 23.
c) Com~araison des sé~uences des deux ~ol~mérases.
L'alignement des parties codantes des deux gènes montre leur forte parenté, puisqu'ils ne diffèrent que de 64 nucléotides disperses le long des séquences à
deux exceptions près. On observe tout d'abord 14 substitutions entre les paires de bases 1541 et 1603, faisant de cette région, la plus variable de la toute séquence, puis on constate un nombre limité de substitutions dans la région 3' entre les paires de bases 1890 et 2316. La plupart de ces substitutions sont sans conséquence au niveau des séquences polypetidiques, notamment les 23 premières substitutions sont sans effet sur la composition des protéines. La comparaison avec d'autres gènes d' ADN polymérases de Thermococcales W098/OlS67 PCT~R97/01259 disponibles dans les bases de données révèle que la région hautement variable entre les paires de bases 1541 - et 1603 de Pyrococcus sp. GE 23 et GE 5 semble etre une caractéristique de ces deux souches, la diversité étant bien distribuée sur les autres séquences de gènes codant pour des ADN polymérases. La comparaison au niveau des séquences polypeptidiques montre la forte similitude des deux ADN polymérases, 98 % d'homologie avec la méthode CLUSTAL V, et seulement 10 résidus différents. Les substitutions d'acides aminés sont donnés dans le tableau I et les alignements avec les ADN polymérases d'autres Thermococcales sont représents aux figures 6 et 7.
La figure 6 représente l'alignement de la lS séquence polypeptidique de 1' ADN polymérase de Pyrococcus sp. GE 23 avec celle des ADN polymérases de :
Deep Vent (intein-), Pyrococcus sp. KODl, Pyrococcus furiosus, Vent (Tli intein-), Pyrococcus sp. 9~.
La figure 7 représente l'alignement de la séquence polypeptidique de l'ADN polymérase de Pyrococcus sp. GE 5 avec celle des ADN polymérases de :
Pyrococcus sp. GB-D, Pyrococcus sp. KODl, Pyrococcus furiosus, Thermococcus litoralis, Pyrococcus sp. 9~.
Le tableau II ci-dessous indique les pourcentage de similarités entre les séquences polypeptidiques de : (1) Pyrococcus sp. GE 23, (2) Pyrococcus sp. GE 5, (3) Pyrococcus sp. GB-D, (4) Pyrococcus sp. KODl, (5) Pyrococcus furiosus, (6) Thermococcus litoralis, (7) Pyrococcus sp. 9~N.
,, .
Tableau II
(1)(2) (3) (4) (5) (6) (7) ***98,689,2 81,3 83,5 76,3 81,5 (1) *** 88,4 80,6 82,8 75,5 80,9 (2) *** 81,6 85,1 77,1 83,0 (3) *** 79,2 78,1 90,4 (4) *** 74,0 80,1 (5) *** 77,0 (6) *** (7) La plupart des substitutions d~acides aminés entre les ADN polymérases de Pyrococcus sp. GE 23 et GE
5 sont non conservatives, mais aucune n~est localisée dans les motifs connus pour être impliqués dans l'action catalytique de l'enzyme, ni dans les domaines 3'- 5' exonucléase ou polymérase. Les deux gènes ne possèdent aucune séquence intronique (IVS ou intéines) contrairement aux gènes d'ADN polymérase de T .
li toralis, Thermococcus sp . KODl, Pyrococcus sp. GB-D, et présentent la même organisation que les gènes d'ADN
polymérase de P. furiosus et Pyrococcus sp. 9~N.
5) Ex~ression, caractérisation et activité
de l'ADN ~olvmérase de Pvrococcus s~. GE 5.
a) Clonacre et ex~ression.
Un insert de 2320 pb couvrant la séquence d'ADN de 2316 pb de SEQ ID NO:I codant pour l'ADN
polymérase de Pyrococcus sp. GE 5 a été cloné aux sites NdeI et BarnHI d'un vecteur pour transformer la souche F~. coli BL21(DE3) . Des mini-préparations d'ADN
plasmidien ont été réalisées sur une vingtaine de clones transformants et un seul a été sélectionné sur la base de la taille des fragments d~ADN libérés après digestion par les enzymes de restriction NdeI et Ban~I.
WO98/01567 PCT~R97/01259 Des essais d'expression ont ensuite été
réalisés à 37~C, en erlenmeyer, avec le clone sélectioné. L'expression est induite en phase exponentielle de croissance ~DO 600nm = 0,6 - 0,7) avec S les concerntations en IPTG de 0 ; O,5 ; 1 et 1, 5 mM.
Des échantillons sont prélevés à différents moments au cours de la culture et les protéines analysés par électrophorèse sur gel de polyacrylamide et coloration au bleu de Coomassie. La figure 8 représente les résultats des essais d'expression, dans lesquels :
- Le puits No. l correspond à la protéine Ladder de l0 kDA (Gibco BRL).
- Le puits No. 2 correspond à l'échantillon induit sans IPTG, temps 0 (phase exponentielle de croissance).
- Le puits No. 3 correspond à l'échantillon induit sans IPTG, 1 heure après l'induction.
- Le puits No. 4 correspond à l'échantillon induit sans IPTG, 4 heure après l'induction.
- Le puits No. 5 correspond à l'échantillon induit sans IPTG, 18 heure après l'induction.
- Le puits No. 6 correspond à la protéine Ladder de l0 kDA (Gibco PRL).
- Le puits No. 7 correspond à l'échantillon induit avec 1 mM d'IPTG, temps 0 (phase exponentielle de croissance).
- - Le puits No. 8 correspond à l'échantillon induit avec l mM d' IPTG, 1 heure après 1'induction.
- Le puits No. 9 correspond à l'échantillon induit avec 1 mM d'IPTG, 4 heure après 1'induction.
- Le puits No. l0 correspond à l'échantillon induit avec 1 mM d'IPTG, 18 heure après l'induction.
On observe que seules les cellules cultivées en l'absence d' IPTG expriment l'ADN polymérase et le taux est maximum après une nuit de culture. Le poids moléculaire de la protéine exprimée est estimé à 89 Kda.
WO98/01567 PCT~R97/01259 b) Fermentation et extraction des cellules.
La culture de la souche Pyrococus sp. GE 5 a été réalisée selon un protocole standard. On a ajouté le facteur de sélection du plasmide au milieu R12 choisi pour la préculture et la culture. Le transfert de la préculture vers le fermenteur a été effectué lorsque la densité optique à 600 nm de la préculture était d'environ 0,8. Le fermenteur NBS MICROS ~25 litres) a été employé pour cette production, avec un volume de culture de 24 litres. Les conditions de fermentation ont été les suivantes : température = 37~C ; agitation = 300 rpm ; aération = 30 l/m ; oxygène dissous = 15 %. Le pH
est régulé à 6,8 avec NaOH pendant la phase d'acidification. Lors de la phase de basification, le pH
est demeuré en libre évolution. Les bactéries ont été
récoltées près 16 à 17 heures de culture. La densité
optique finale était d'environ 10 unités et le pH final de 8. La culture a ensuite été concentrée par filtration sur fibres creuses (AMICON), jusqu'à obtenir un volume final de 2 litres. Ce concentré de bactéries a alors été
utilisé pour la purification des protéines. Après concentration cellulaire, les cellules sont broyées en continu au moyen d'un broyeur à billes et le broyat cellulaire est additionné de PMSF 1 mM.
c) Purification de l'ADN ~olvmérase de Pvrococcus s~. GE 5.
Après centrifugation du broyat cellulaire (15 minutes à 10000 g), le surnageant (fraction soluble) est récupéré et chauffé 15 minutes à 75~C. Le précipité
formé après dénaturation thermique est éliminé par centrifugation (15 minutes à 10000 g). Le surnageant est chargé sur une colonne d'échange d'anions :
- Matrice Q Sépharose Fast Flow dans une colonne XK 16/30 (Pharmacia).
- Système chromatographique : Bio Pilot (Pharmacia).
- - Tampon A : Tris-HCl 50 mM, pH 8 et tampon B : Tris-HCl 50 mM, pH 8 + NaCl 0,5 M.
- Débit : lO ml/mn ; gradient 0-50% B en 60 minutes.
- Fractions : lO ml/tube.
La figure 9 représente le profil d'élution de l'échantillon constitué de 450 ml de protéines solubles après dénaturation thermique à 75~C.
La figure lO représente l'analyse par SDS-PAGE (Phast System, Pharmacia), en présence de ~-mercaptoéthanol, de différentes fractions issues de la purification :
- Gels : Phast gel 8-15% (Phast System, Pharmacia).
- Lignes l et 8 : marqueur de poids moléculaire (lO Kda, Bio-Rad).
- Ligne 2 : Protéines totales.
- Ligne 3 : protéines solubles après broyage.
- Ligne 4 : protéines solubles après dénaturation thermique.
- Lignes 5, 6 et 7 : fractions l, 2 et 3 après chromatographie sur QFF de la figure 2.
Comme illustré par la figure lO, l'ADN
polymérase de Pyrococcus sp. GE 5 est soluble et thermostable. Elle est éluée vers 0,15 M NaCl lors de la chromatographie d'échange d'ions. Les fractions contenant l'ADN polymérase de Pyrococcus sp . GE 5 ont été rassemblées (fraction 2; 50 ml) et chromatographiées sur hydroxyapatite (type II, Biorad) :
- Matrice : hydroxyapatite type II dans une colonne lO/5 (Biorad).
- Système chromatographique : FPLC
~Pharmacia).
. . .
WO98/01567 PCT~R97/012S9 - Tampon A: Phosphate 50 mM pH 8; tampon B :
Phosphate 500 mM pH 8.
- Débit : 10 ml/min; gradient 0-100% B en 30 minutes.
La figure 11 représente le profil d'élution de l'échantillon constitué de 50 ml de la fraction 2 après chromatographie d'échange d'ions. Les différentes fractions ont été analysées par spectrométire W et par SDS-PAGE. ~a fraction non absorbée contient principalement des acides nucléiques tandis que les fractions 1 à 3 contiennent l'ADN polymérase de Pyrococcus sp. GE 5. Après chromatographie, 1 mM de mercaptoéthanol, 0,1 % Tween 20 et 50 % glycérol ont été
ajoutés avant conservation à -20~C.
d) Caractérisation des fractions ~urifiées.
Les 3 fractions obtenues après chromatographie sur hydroxyapatite ont été analysées par SDS-PAGE en présence de 2-mercaptoéthanol (figure 12) :
- - Gels : gel 15 % (Laemli; Babygel).
- Lignes 1 et 5: Mar~ueur de poids moléculaire (Bio-Rad, Broad Range).
- Ligne 2 : fraction 1 (5 ~1).
- Ligne 3 : fraction 2 (5 ~1).
- Ligne 4 : fraction 3 (5 ~1).
- Ligne 6 : fracti~n 1 (10 ~1).
- Ligne 7 : fraction 2 (10 ~1).
- Ligne 8 : fraction 3 (10 ~1).
Comme illustré par la figure 12 et à la figure 13, la fraction 1 contient de l'ADN polymérase de Pyrococcus sp. GE 5 homogène en SDS-PAGE, alors que les fractions 2 et 3 sont contaminées par 2 protéines de 35 Kda et 65 Kda.
WO98/01567 25 PCT~R97/01259 e) Activité des fractions ~urifiées.
L'activité d'ADN polymérase des différentes fractions a été testée dans une réaction d'amplification de type PCR. Un fragment de 1300 pb environ a été
S amplifié à partir d'un ADN cible et d'amorces spécifiques. Le tampon utilisé est composé de :
- Tris-HCl : 75 mM pH 9,0.
- (NH4)2SO4 : 20 mM.
- O,01 % (w/v) Tween 20.
- MgC12 : 1,5 mM.
Trente cinq cycles ont été réalisés, chacun comprenant une étape de dénaturation de 1 minute à 94~C, une étape d'appariement des oligonucléotides de 1 minute à la température appropriée et une étape d'élongation de lS 3 minutes à 72~C. La figure 13 rapporte les résultats obtenus avec un volume réactionel de 100 ~1 pour des quantités d'ADN polymérase de Pyrococcus sp . GE 5 de 2,5 ~g, 1 ~g, 0,1 ~g et 0,01 ~g :
- Puits No. 1 : 1 kb DNA ladder (Gibco BRL).
- Puits No. 2 : fraction 1 (2,5 ~g).
- Puits No. 3 : fraction 1 (1 ~g).
- Puits No. 4 : fraction 1 (0,1 ~g).
- Puits No. 5 : fraction 1 (0,01 ~g).
- Puits No. 6 : fraction 2 (2,5 ~g).
- Puits No. 7 : fraction 2 (1 ~g).
- Puits No. 8 : fraction 2 (0,1 ~g).
- Puits No. 9 : fraction 2 (0,01 ~g).
- Puits No. 10 : fraction 3 (2,5 ~g).
- Puits No. 11 : fraction 3 (1 ~g).
- Puits No. 12 : fraction 3 (0,1 ~g).
- Puits No. 13 : fraction 3 (0,01 ~g).
- Puits No. 14 : 1 kb DNA ladder (Gibco BRL).
- Puits No. 15 : Contrôle positif avec la Taq polymérase.
CA 02260274 l999-0l-08 WO 98/OlS67 PCT/FR97/01259
li toralis, Thermococcus sp . KODl, Pyrococcus sp. GB-D, et présentent la même organisation que les gènes d'ADN
polymérase de P. furiosus et Pyrococcus sp. 9~N.
5) Ex~ression, caractérisation et activité
de l'ADN ~olvmérase de Pvrococcus s~. GE 5.
a) Clonacre et ex~ression.
Un insert de 2320 pb couvrant la séquence d'ADN de 2316 pb de SEQ ID NO:I codant pour l'ADN
polymérase de Pyrococcus sp. GE 5 a été cloné aux sites NdeI et BarnHI d'un vecteur pour transformer la souche F~. coli BL21(DE3) . Des mini-préparations d'ADN
plasmidien ont été réalisées sur une vingtaine de clones transformants et un seul a été sélectionné sur la base de la taille des fragments d~ADN libérés après digestion par les enzymes de restriction NdeI et Ban~I.
WO98/01567 PCT~R97/01259 Des essais d'expression ont ensuite été
réalisés à 37~C, en erlenmeyer, avec le clone sélectioné. L'expression est induite en phase exponentielle de croissance ~DO 600nm = 0,6 - 0,7) avec S les concerntations en IPTG de 0 ; O,5 ; 1 et 1, 5 mM.
Des échantillons sont prélevés à différents moments au cours de la culture et les protéines analysés par électrophorèse sur gel de polyacrylamide et coloration au bleu de Coomassie. La figure 8 représente les résultats des essais d'expression, dans lesquels :
- Le puits No. l correspond à la protéine Ladder de l0 kDA (Gibco BRL).
- Le puits No. 2 correspond à l'échantillon induit sans IPTG, temps 0 (phase exponentielle de croissance).
- Le puits No. 3 correspond à l'échantillon induit sans IPTG, 1 heure après l'induction.
- Le puits No. 4 correspond à l'échantillon induit sans IPTG, 4 heure après l'induction.
- Le puits No. 5 correspond à l'échantillon induit sans IPTG, 18 heure après l'induction.
- Le puits No. 6 correspond à la protéine Ladder de l0 kDA (Gibco PRL).
- Le puits No. 7 correspond à l'échantillon induit avec 1 mM d'IPTG, temps 0 (phase exponentielle de croissance).
- - Le puits No. 8 correspond à l'échantillon induit avec l mM d' IPTG, 1 heure après 1'induction.
- Le puits No. 9 correspond à l'échantillon induit avec 1 mM d'IPTG, 4 heure après 1'induction.
- Le puits No. l0 correspond à l'échantillon induit avec 1 mM d'IPTG, 18 heure après l'induction.
On observe que seules les cellules cultivées en l'absence d' IPTG expriment l'ADN polymérase et le taux est maximum après une nuit de culture. Le poids moléculaire de la protéine exprimée est estimé à 89 Kda.
WO98/01567 PCT~R97/01259 b) Fermentation et extraction des cellules.
La culture de la souche Pyrococus sp. GE 5 a été réalisée selon un protocole standard. On a ajouté le facteur de sélection du plasmide au milieu R12 choisi pour la préculture et la culture. Le transfert de la préculture vers le fermenteur a été effectué lorsque la densité optique à 600 nm de la préculture était d'environ 0,8. Le fermenteur NBS MICROS ~25 litres) a été employé pour cette production, avec un volume de culture de 24 litres. Les conditions de fermentation ont été les suivantes : température = 37~C ; agitation = 300 rpm ; aération = 30 l/m ; oxygène dissous = 15 %. Le pH
est régulé à 6,8 avec NaOH pendant la phase d'acidification. Lors de la phase de basification, le pH
est demeuré en libre évolution. Les bactéries ont été
récoltées près 16 à 17 heures de culture. La densité
optique finale était d'environ 10 unités et le pH final de 8. La culture a ensuite été concentrée par filtration sur fibres creuses (AMICON), jusqu'à obtenir un volume final de 2 litres. Ce concentré de bactéries a alors été
utilisé pour la purification des protéines. Après concentration cellulaire, les cellules sont broyées en continu au moyen d'un broyeur à billes et le broyat cellulaire est additionné de PMSF 1 mM.
c) Purification de l'ADN ~olvmérase de Pvrococcus s~. GE 5.
Après centrifugation du broyat cellulaire (15 minutes à 10000 g), le surnageant (fraction soluble) est récupéré et chauffé 15 minutes à 75~C. Le précipité
formé après dénaturation thermique est éliminé par centrifugation (15 minutes à 10000 g). Le surnageant est chargé sur une colonne d'échange d'anions :
- Matrice Q Sépharose Fast Flow dans une colonne XK 16/30 (Pharmacia).
- Système chromatographique : Bio Pilot (Pharmacia).
- - Tampon A : Tris-HCl 50 mM, pH 8 et tampon B : Tris-HCl 50 mM, pH 8 + NaCl 0,5 M.
- Débit : lO ml/mn ; gradient 0-50% B en 60 minutes.
- Fractions : lO ml/tube.
La figure 9 représente le profil d'élution de l'échantillon constitué de 450 ml de protéines solubles après dénaturation thermique à 75~C.
La figure lO représente l'analyse par SDS-PAGE (Phast System, Pharmacia), en présence de ~-mercaptoéthanol, de différentes fractions issues de la purification :
- Gels : Phast gel 8-15% (Phast System, Pharmacia).
- Lignes l et 8 : marqueur de poids moléculaire (lO Kda, Bio-Rad).
- Ligne 2 : Protéines totales.
- Ligne 3 : protéines solubles après broyage.
- Ligne 4 : protéines solubles après dénaturation thermique.
- Lignes 5, 6 et 7 : fractions l, 2 et 3 après chromatographie sur QFF de la figure 2.
Comme illustré par la figure lO, l'ADN
polymérase de Pyrococcus sp. GE 5 est soluble et thermostable. Elle est éluée vers 0,15 M NaCl lors de la chromatographie d'échange d'ions. Les fractions contenant l'ADN polymérase de Pyrococcus sp . GE 5 ont été rassemblées (fraction 2; 50 ml) et chromatographiées sur hydroxyapatite (type II, Biorad) :
- Matrice : hydroxyapatite type II dans une colonne lO/5 (Biorad).
- Système chromatographique : FPLC
~Pharmacia).
. . .
WO98/01567 PCT~R97/012S9 - Tampon A: Phosphate 50 mM pH 8; tampon B :
Phosphate 500 mM pH 8.
- Débit : 10 ml/min; gradient 0-100% B en 30 minutes.
La figure 11 représente le profil d'élution de l'échantillon constitué de 50 ml de la fraction 2 après chromatographie d'échange d'ions. Les différentes fractions ont été analysées par spectrométire W et par SDS-PAGE. ~a fraction non absorbée contient principalement des acides nucléiques tandis que les fractions 1 à 3 contiennent l'ADN polymérase de Pyrococcus sp. GE 5. Après chromatographie, 1 mM de mercaptoéthanol, 0,1 % Tween 20 et 50 % glycérol ont été
ajoutés avant conservation à -20~C.
d) Caractérisation des fractions ~urifiées.
Les 3 fractions obtenues après chromatographie sur hydroxyapatite ont été analysées par SDS-PAGE en présence de 2-mercaptoéthanol (figure 12) :
- - Gels : gel 15 % (Laemli; Babygel).
- Lignes 1 et 5: Mar~ueur de poids moléculaire (Bio-Rad, Broad Range).
- Ligne 2 : fraction 1 (5 ~1).
- Ligne 3 : fraction 2 (5 ~1).
- Ligne 4 : fraction 3 (5 ~1).
- Ligne 6 : fracti~n 1 (10 ~1).
- Ligne 7 : fraction 2 (10 ~1).
- Ligne 8 : fraction 3 (10 ~1).
Comme illustré par la figure 12 et à la figure 13, la fraction 1 contient de l'ADN polymérase de Pyrococcus sp. GE 5 homogène en SDS-PAGE, alors que les fractions 2 et 3 sont contaminées par 2 protéines de 35 Kda et 65 Kda.
WO98/01567 25 PCT~R97/01259 e) Activité des fractions ~urifiées.
L'activité d'ADN polymérase des différentes fractions a été testée dans une réaction d'amplification de type PCR. Un fragment de 1300 pb environ a été
S amplifié à partir d'un ADN cible et d'amorces spécifiques. Le tampon utilisé est composé de :
- Tris-HCl : 75 mM pH 9,0.
- (NH4)2SO4 : 20 mM.
- O,01 % (w/v) Tween 20.
- MgC12 : 1,5 mM.
Trente cinq cycles ont été réalisés, chacun comprenant une étape de dénaturation de 1 minute à 94~C, une étape d'appariement des oligonucléotides de 1 minute à la température appropriée et une étape d'élongation de lS 3 minutes à 72~C. La figure 13 rapporte les résultats obtenus avec un volume réactionel de 100 ~1 pour des quantités d'ADN polymérase de Pyrococcus sp . GE 5 de 2,5 ~g, 1 ~g, 0,1 ~g et 0,01 ~g :
- Puits No. 1 : 1 kb DNA ladder (Gibco BRL).
- Puits No. 2 : fraction 1 (2,5 ~g).
- Puits No. 3 : fraction 1 (1 ~g).
- Puits No. 4 : fraction 1 (0,1 ~g).
- Puits No. 5 : fraction 1 (0,01 ~g).
- Puits No. 6 : fraction 2 (2,5 ~g).
- Puits No. 7 : fraction 2 (1 ~g).
- Puits No. 8 : fraction 2 (0,1 ~g).
- Puits No. 9 : fraction 2 (0,01 ~g).
- Puits No. 10 : fraction 3 (2,5 ~g).
- Puits No. 11 : fraction 3 (1 ~g).
- Puits No. 12 : fraction 3 (0,1 ~g).
- Puits No. 13 : fraction 3 (0,01 ~g).
- Puits No. 14 : 1 kb DNA ladder (Gibco BRL).
- Puits No. 15 : Contrôle positif avec la Taq polymérase.
CA 02260274 l999-0l-08 WO 98/OlS67 PCT/FR97/01259
6 ) Conditions d'o~timisation de la PCR ~our les ~ol~mérases de l'invention.
Afin de simplifier l'exposé des résultats S ci-après et des figures qui s'y rapportent, les ADN
polymérases thermostables de Pyrococcus abyssi (Pyrococcus sp. GE 5) et Pyrococcus sp. GE 23 seront désignées respectivement ci-après Pab et Ppr.
Des essais de PCR ont été effectués dans les conditions suivantes :
- 10 mM Tris HCl, pH 9,0 - 50 mM KCl - 3 mM MgS04 - 0,1 % Tween - O, 312 mM de chaque dNTP
- 50 picomoles de chaque oligonucléotide de formule :
5'TCACCTTAGGGTTGCCCATAA3' 5'TGGGCATAAAAGTCAGGGCAG3' - 1 U. de Pab (figure 14) ou de Ppr (figure 15) - Quantité croissante d'ADN génomique humain de ~-globine (de 0,5 ng à 3 ~g) ; volume réactionel : 50 Le programme de PCR suivant a été utilisé :
- 5 minutes à 93~C
- 37 fois (1 minute à 62~C; 2 minutes à
72~C; 1 minute à 91~C) - 1 minute à 62~C
- 10 minutes à 72~C.
Les figures 14 et 15 représentent les produits de PCR déposés sur gel d'agarose 2% en présence du marqueur pBR digéré par HaeIII.
Les amorces choisies permettent d'amplifier un fragment de 420 pb. Pab et Ppr permettent d'obtenir un produit de PCR de 420 pb quelque soit la quantité de
Afin de simplifier l'exposé des résultats S ci-après et des figures qui s'y rapportent, les ADN
polymérases thermostables de Pyrococcus abyssi (Pyrococcus sp. GE 5) et Pyrococcus sp. GE 23 seront désignées respectivement ci-après Pab et Ppr.
Des essais de PCR ont été effectués dans les conditions suivantes :
- 10 mM Tris HCl, pH 9,0 - 50 mM KCl - 3 mM MgS04 - 0,1 % Tween - O, 312 mM de chaque dNTP
- 50 picomoles de chaque oligonucléotide de formule :
5'TCACCTTAGGGTTGCCCATAA3' 5'TGGGCATAAAAGTCAGGGCAG3' - 1 U. de Pab (figure 14) ou de Ppr (figure 15) - Quantité croissante d'ADN génomique humain de ~-globine (de 0,5 ng à 3 ~g) ; volume réactionel : 50 Le programme de PCR suivant a été utilisé :
- 5 minutes à 93~C
- 37 fois (1 minute à 62~C; 2 minutes à
72~C; 1 minute à 91~C) - 1 minute à 62~C
- 10 minutes à 72~C.
Les figures 14 et 15 représentent les produits de PCR déposés sur gel d'agarose 2% en présence du marqueur pBR digéré par HaeIII.
Les amorces choisies permettent d'amplifier un fragment de 420 pb. Pab et Ppr permettent d'obtenir un produit de PCR de 420 pb quelque soit la quantité de
7 PCT~R97/01259 matrice comprise entre 0,5 ng et l ~g. Un produit de PCR
a également été obtenu dans ces mêmes conditions en présence de lO picogrammes de matrice d'ADN.
7) A~titude à l'am~lification de la Pab et de la P~r à hautes temPératures, Les tests d'activité des polymérases recombinantes de Pyrococcus abyssi ( Pab) et de Pyrococcus sp . GE23 (Ppr) réalisés avec la méthode d~incorporation de dNTP mar~ués ont démontré, dans les conditions de tampons retenues, une activité résiduelle jusqu'à 85~C. Au delà de cette température, une possible dégradation du substrat pourrait masquer l'activité des polymérases de l'invention. Il est cependant intéressant d'apprécier si cette aptitude peut être mise à profit pour de l'amplification de gène in vitro, sachant que certaines applications spécifiques pourraient en découler :
- PCR sur des matrices possédant des structures secondaires blocantes aux températures usuelles d'élongation de 72 à 74~C, - PCR inverse directe sur matrice circulaire double brin (chromosome).
Les principes de la PCR inverse ( iPCR) et de la méthode nouvelle élaborée avec la Pab, dénommée High-Temperature inverse PCR ( HT- i PCR ) s ont représentés dans les schémas de la figure 16. Un double brin d'ADN, de sé~uence partiellement connue représentée "en gras" dans la figure 16, est coupé par une enzyme de restriction RI, dilué et ligaturé pour former une molécule d'ADN
circulaire double brin.
Dans la PCR inverse conventionnelle (procédure indi~uée l, 2 et 3 dans la figure 16), les molécules circulaires sont linéarisées par RII et l'amplification s'effectue sur l~ADN linéarisé. En HT--- .. .. .. ... ..
CA 02260274 l999-0l-08 WO98/01567 PCT~R97/01259 iPCR, l'amplification est effectué sur les molécules circulaires (procédure indiquée 2' dans la figure 16).
a) Matériels et méthodes.
S La matrice d'ADN retenue pour ces travaux est un fragment circulaire d'ADN de 2,2 kb. Ce fragment est obtenu par digestion de l'ADN génomique de l'isolat Thermococcus sp . GE8 par l'enzyme Xho, purification sur gel d'agarose à 0,8% et élution de la bande 2 - 2,5 kb par la méthode de GeneClean, puis ligature des extrémités des fragments linéaires par la ligase T4.
Les amorces oligonucléotidiques sont choisies sur la partie de séquence connue de ce fragment circularisé de manière à copier depuis la région connue vers la région lS de séquence inconnue (figure 16).
Les cycles d'amplification ont été réalisés avec un thermocycleur à gradient de la société
Stratagene dans les conditions suivantes :
HT-iPCR avec un seul cYcle à 85~C :
94~C, 15s/1 cycle 94~C, 15s/56~C, 45s/85~C, 4mn/lcycle 94~C, 15s/56~C, 45s/82-78dC, 4mn/1 cycle 94~C, 15s/56~C, 45s/76-72~C, 4mn/lcycle 94~C, 15s/56~C, 45s/72~C, 4 mn/27 cycles HT-iPCR continue à 85~C :
94~C, 15s/1 cycle 94~C, 15s/56~C, 45s/85~C, 4mn/30 cycles stockage à 4~C
Les résultats sont visualisés sur gels d'agarose à 0,8%.
La figure 17 représente la comparaison des résultats de i-PCR et de HT-iPCR en utilisant la Taq et la Pab :
- ligne 1 : marqueur "Raoul" (société
Appligene-Oncor) - ligne 2 : HT-iPCR avec la Pab - ligne 3 : ~T-iPCR avec la Taq - ligne 4 : i-PCR avec la Taq.
La figure 18 représente la PCR à haute température (élongation à 85~C sur 30 cycles) :
- ligne 1 : marqueur "Raoul" (société
Appligene-Oncor) - ligne 2 : Pab - ligne 3 : Ppr - ligne 4 : témoin sans ADN
- ligne 5 : Vent.
b) Résultats.
Les résultats de la PCR inverse avec un seul cycle initial d'élongation à haute température (85~C) mettent en évidence un excellent comportement de la Pab, et une inaptitude de la Taq (Perkin-Elmer) à
effectuer ce type de réaction. Le témoin de PCR inverse après linéarisation de la matrice par la Taq fournit un signal de faible amplitude dans les conditions retenues (figure 17).
Les résultats obtenus avec 30 cycles d'amplification avec des températures d'élongation de 85~C mettent en évidence une excellente aptitude de la Pab à effectuer ce type de réaction (figurel8). La Ppr est également en mesure d'amplifier l'ADN cible dans ces conditions, mais la Vent polymérase en est incapable de même que la Pfu.
Les résultats rapportés ci-dessus permettent des applications remarquables des polymérases de l'invention.
D'une part, l'amplification de fragments d'ADN présentant des structures secondaires rendant difficile l'élongation à des températures de 72-74~C. Le fait de monter en température jusqu'à 85~C permet de résoudre ces structures secondaires qui peuvent se former sur du simple brin lors de l'étape d'hybridation des amorces.
D'autre part, sur le chromosome lorsqu'une faible partie de séquence d'un gène est connue. La méthode exposée ci-dessus s'applique d'une manière générale comme suit :
- digestion de l'ADN génomique par plusieurs enzymes de restriction, - ligature par un ligase, comme la ligase T4, des produits de digestion, - HT-iPCR à partir d'amorces de sens opposé
sur la partie de séquence connue en utilisant la Pab ou la Ppr, - éventuellement séquencage des produits d~amplification.
a également été obtenu dans ces mêmes conditions en présence de lO picogrammes de matrice d'ADN.
7) A~titude à l'am~lification de la Pab et de la P~r à hautes temPératures, Les tests d'activité des polymérases recombinantes de Pyrococcus abyssi ( Pab) et de Pyrococcus sp . GE23 (Ppr) réalisés avec la méthode d~incorporation de dNTP mar~ués ont démontré, dans les conditions de tampons retenues, une activité résiduelle jusqu'à 85~C. Au delà de cette température, une possible dégradation du substrat pourrait masquer l'activité des polymérases de l'invention. Il est cependant intéressant d'apprécier si cette aptitude peut être mise à profit pour de l'amplification de gène in vitro, sachant que certaines applications spécifiques pourraient en découler :
- PCR sur des matrices possédant des structures secondaires blocantes aux températures usuelles d'élongation de 72 à 74~C, - PCR inverse directe sur matrice circulaire double brin (chromosome).
Les principes de la PCR inverse ( iPCR) et de la méthode nouvelle élaborée avec la Pab, dénommée High-Temperature inverse PCR ( HT- i PCR ) s ont représentés dans les schémas de la figure 16. Un double brin d'ADN, de sé~uence partiellement connue représentée "en gras" dans la figure 16, est coupé par une enzyme de restriction RI, dilué et ligaturé pour former une molécule d'ADN
circulaire double brin.
Dans la PCR inverse conventionnelle (procédure indi~uée l, 2 et 3 dans la figure 16), les molécules circulaires sont linéarisées par RII et l'amplification s'effectue sur l~ADN linéarisé. En HT--- .. .. .. ... ..
CA 02260274 l999-0l-08 WO98/01567 PCT~R97/01259 iPCR, l'amplification est effectué sur les molécules circulaires (procédure indiquée 2' dans la figure 16).
a) Matériels et méthodes.
S La matrice d'ADN retenue pour ces travaux est un fragment circulaire d'ADN de 2,2 kb. Ce fragment est obtenu par digestion de l'ADN génomique de l'isolat Thermococcus sp . GE8 par l'enzyme Xho, purification sur gel d'agarose à 0,8% et élution de la bande 2 - 2,5 kb par la méthode de GeneClean, puis ligature des extrémités des fragments linéaires par la ligase T4.
Les amorces oligonucléotidiques sont choisies sur la partie de séquence connue de ce fragment circularisé de manière à copier depuis la région connue vers la région lS de séquence inconnue (figure 16).
Les cycles d'amplification ont été réalisés avec un thermocycleur à gradient de la société
Stratagene dans les conditions suivantes :
HT-iPCR avec un seul cYcle à 85~C :
94~C, 15s/1 cycle 94~C, 15s/56~C, 45s/85~C, 4mn/lcycle 94~C, 15s/56~C, 45s/82-78dC, 4mn/1 cycle 94~C, 15s/56~C, 45s/76-72~C, 4mn/lcycle 94~C, 15s/56~C, 45s/72~C, 4 mn/27 cycles HT-iPCR continue à 85~C :
94~C, 15s/1 cycle 94~C, 15s/56~C, 45s/85~C, 4mn/30 cycles stockage à 4~C
Les résultats sont visualisés sur gels d'agarose à 0,8%.
La figure 17 représente la comparaison des résultats de i-PCR et de HT-iPCR en utilisant la Taq et la Pab :
- ligne 1 : marqueur "Raoul" (société
Appligene-Oncor) - ligne 2 : HT-iPCR avec la Pab - ligne 3 : ~T-iPCR avec la Taq - ligne 4 : i-PCR avec la Taq.
La figure 18 représente la PCR à haute température (élongation à 85~C sur 30 cycles) :
- ligne 1 : marqueur "Raoul" (société
Appligene-Oncor) - ligne 2 : Pab - ligne 3 : Ppr - ligne 4 : témoin sans ADN
- ligne 5 : Vent.
b) Résultats.
Les résultats de la PCR inverse avec un seul cycle initial d'élongation à haute température (85~C) mettent en évidence un excellent comportement de la Pab, et une inaptitude de la Taq (Perkin-Elmer) à
effectuer ce type de réaction. Le témoin de PCR inverse après linéarisation de la matrice par la Taq fournit un signal de faible amplitude dans les conditions retenues (figure 17).
Les résultats obtenus avec 30 cycles d'amplification avec des températures d'élongation de 85~C mettent en évidence une excellente aptitude de la Pab à effectuer ce type de réaction (figurel8). La Ppr est également en mesure d'amplifier l'ADN cible dans ces conditions, mais la Vent polymérase en est incapable de même que la Pfu.
Les résultats rapportés ci-dessus permettent des applications remarquables des polymérases de l'invention.
D'une part, l'amplification de fragments d'ADN présentant des structures secondaires rendant difficile l'élongation à des températures de 72-74~C. Le fait de monter en température jusqu'à 85~C permet de résoudre ces structures secondaires qui peuvent se former sur du simple brin lors de l'étape d'hybridation des amorces.
D'autre part, sur le chromosome lorsqu'une faible partie de séquence d'un gène est connue. La méthode exposée ci-dessus s'applique d'une manière générale comme suit :
- digestion de l'ADN génomique par plusieurs enzymes de restriction, - ligature par un ligase, comme la ligase T4, des produits de digestion, - HT-iPCR à partir d'amorces de sens opposé
sur la partie de séquence connue en utilisant la Pab ou la Ppr, - éventuellement séquencage des produits d~amplification.
8) Étude de la thermostabilité des enz~mes recombinantes de l'invention.
a) Matériels et méthodes.
Pour réaliser les tests nécessaires à cette étude, les ADN polymérases Pab et Ppr sont diluées dans un tampon de conditionnement (20 mM Tris-HCl pH=8,0 ; 1 mM EDTA ; 1 mM dithiothréitol ; 50 % glycérol ; 0,5 %
Tween 20 ; 0,5 % Nonidet 40 ; 0,2 mg/ml BSA), de façon à
ajouter 0,01 U. de polymérase par test et à se placer dans les conditions non saturantes. Ainsi, 0,01 U. de Pab ou de Ppr sont incubés en 20 ~1 de tampon d'incubation (10 mM Tris HCl pP=9,0 ; 50 mM KCl ; 3 mM
MgSO4 ; 0,1 % Tween) à différents temps (de 0 à 36 heures), à 92~C, à 95~C ou à 100~C. Autant de tubes que de temps différents d'incubation ont été préparés à
partir d'un même mélange initial. Les différents tubes sont incubés dans un bain à sec (bloc PCR). A la fin de l'incubation, les tubes sont mis dans la glace et l'activité résiduelle de l'enzyme sera dosée à 72~C
comme décrit ci-après.
WO98/01567 31 PCT~R97/01259 Le test d'activité est effectué dans un volume final de lO0 ~l de tampon d'incubation (lO mM
Tris HCl pP=9,0 ; 50 mM KCl ; 3 mM MgSO4 ; 0,l % Tween) dans les conditions suivantes :
- 13 ~g d'ADM activé de thymus de veau - 500 ~M de chacun de 4 dNTP
- lO ~Ci de l'un des quatre dMTP mar~ué au ~2p utilisé comm etraceur (du dATP ou dNTP ont été
utilisés~
- les 20 ~l de la solution correspondant au test d'inactivation par la température.
Les essais sont incubés 30 minutes à 70~C.
lO ~l de chaque test sont prélevés après lO minutes, 20 minutes et 30 minutes d'incubation, puis sont déposés sur papier DE81 (Whatmann). Un compactage avant lavage est alors réaIisé à sec par la méthode de Cerenkov. Les papiers DE81 sont ensuite lavés trois fois 5 minutes dans une solution 0,S mM de Na2HP04 afin d'éliminer les dNTP non incorporés. Un passage à l'alcool permet un -séchage rapide des papiers qui sont remis à compter. Un témoin négatif (To) est réalisé sans ADN polymérase et un témoin positif est réalisé avec de l'ADN polymérase non traité à la température, correspondant au temps 0 heure. Une unité polymérase est la quantité d'enzyme nécessaire à l'incorporation de lO nmoles de nucléosides en produits acido-solubles en 30 minutes à 72~C dans les conditions d'essais. L'activité polymérase est calculé
en faisant la moyenne des coups totaux avant lavage en lO ~l de dépôt. Ceux-ci correspondent à 4 x 5 nanomoles de chaque dNTP, soit 20 nanomoles de dNTP totaux. A
chaque valeur après lavage (Ci), il faut retrancher la valeur du témoin négatif To (sans enzyme).
Soit, U/~l =
(Ci-To) x (30min/temps d'incubation) x (lOO,ul/10!11 dépot) x dilution polymérase (Ct pour 10 nanomoles) x ~Ll de polymerase ajouté
. . .
CA 02260274 1999-0l-08 WO98/01567 32 PCT~R97/01259 b) Résultats.
Les deux enzymes ont été étudiés à trois températures 92~C, 95~C et 100~C. Tous les travaux ont été réalisés en parallèle avec les mêmes substrats. Les résultats sont représentés sur les courbes des figures 19 à 22. Pour les figures 21 (tableau V ci-après) et 22 (tableau VI ci-après), les différentes polymérases étudiées sont ramenées à une même base au niveau activité initiale, pour en faciliter l'étude comparative. Une ~uatrième température de 105~C a également été étudiée pour la Pab mais n'est pas illustrée dans les figures.
Fi~ure 19 : activité Pab.
Le tableau III ci-dessous rapporte les lS résultats de l'inactivation de la Pab en fonction du temps à 100~C, 95~C et 92~C.
Tableau III
Temps Inactivation Inactivation Inactivation (heure) à 100~C à 95~C à 92~C
0 ~3,8 22,3 25 1 3,6 2 '1,3 25,8 27,1 3 9,7 4 _7,2 19,9 23,1 :4,1 6 5,9 17,1 22,8 7 2,6 ~ 1,2 14,9 21,8 10,5 :3,6 19,5 2 2,7 18 4 1,~ 14,05 6 8,6 I,~ 11,2 :8 7,5 _O,t 10,3 -0 9,4 9,9 ~2 9,7 7,5 24 6,2 8 7 7,1 ~ 4,3 5,3 6,5 CA 02260274 lggg-ol-os WO98/01567 PCT~R97/01259 Fi~ure 20 : activité Por.
Le tableau IV ci-dessous rapporte les résultats de l'inactivation de la Ppr en fonction du temps à 100~C, 95~C et 92~C.
s Tableau IV
Temps Inactivation Inactivation Inactivation (heure) à 100~C à 95~C à 9'~C
0 ~,5 7,66 7,~~
~,9 5,5 8, ~ 3,75 5,63 7, ~
: 1,9 5,23 ~,~6 ~ 1 4,8 4 5 5,3 5,25 0 5,~7 4,3 4,~4 3,75 0 4,34 -- 3,28 _2 3,92 _ 3,35 ~,. 4,11 ' 2,14 :6 2,63 7 1,94 ~ 2,8 _ . , ~
_ . _, , .
-- 1,06 ~".
3~ 3 , .
Fi~ure 21 : activité Pab et P~r a~rès inactivation à 100~C.
Le tableau V ci-dessous rapporte l'activité
de Pab et Ppr après inactivation à 100~C.
Tableau V
Temps Pab Ppr (heure) 0 2_, 8 23, 8 '' ,6 7,9 2 ' _ , 3 - 3 , 7 3 ~j 7 6, 9 4 ~ 3,7 _4, _ 6 - 5, 9 0 7 .;, 6 8 _ ,2 0 ~ U , 5 t~ 8,6 ~ 7 5 2''- ,2 -c, 1',1 _ 7 _6 4,3 Fi~ure 22: activité Pab, Pl~r et ~olYmérase de thermus acruaticus (Taa) a~rès inactivation à 92~C.
Le tableau VI ci-dessous rapporte l'activité
de Pab, Ppr et de la Taq après inactivation à 92~C.
s Tableau VI
Temps Pab Taq Ppr (heure) 0 25 -7,7 -5 ,5 27,1 2, _~,5 20,,, 23,1 19 _.,~
15,7 6,~
. 22,8 14,5 _~, 8 2:,8 12,3 i, _0 1'~,5 _ "
_ _8 _~ 5 .. 14,05 -~ 11,2 8, ~~ 10,3 8,~
' 0 9,9 ~2 7,5 4 2,3 5,~
,,~ 5, 6,5 0, 3,~
O, ,6 2,,' ''2 84 0,7 L'analyse des courbes des figures 19 à 22 10montrent que:
- Pab conserve 90% de son activité après un traitement de 5 heures à 92~C, 70% après 5 heures à 95~C
et 60% après 5 heures à 100~C. La Pab conserve 50% de son activité après un traitement de 90 minutes à 105~C.
- Ppr conserve 68% de son activité après 5 heures à 92~C, 65% après 5 heures à 95~C et 10% après 5 heures à 100~C.
CA 02260274 1999-0l-08 WO98/01567 36 ~ PCT~R97/01259 En comparaison Taq pol conserve 55% de son activité après 5 heures à 92~C, mais elle n'a qu'une demi-vie de 90 minutes à 95~C et de 5 minutes à 100~C.
D'après les courbes des figures 19 à 22 et les commentaires ci-dessus, l'enzyme Pab est plus thermostable que la Ppr et ce, malgré une différence seulement dix résidus entre leur séquence. L'enzyme Pab est la plus thermostable actuellement décrite avec une demi-vie à 95~C de 18 heures et de plus de 8 heures à
100~C. L'enzyme Ppr présente une thermostabilité
comparable à celle publiée par la Vent voire même meilleure avec 2 heures de demi-vie à 100~C.
WO98/01~7 PCT~R97/01259 LISTE DE SÉQUENCES
(l) INFORMATION GÉNÉRALES :
(i) DEPOSANT : APPLIGENE - ONCOR
(ii) TITRE DE L'INVENTION: ADN POLYMERASE
THERMOSTABLE D'ARCHAEBACTÉRIES DU GENRE
PYROCOCCUS SP.
(iii) NOMBRE DE SEQUENCES: 2 (2) INFORMATION POUR LA SEQ ID NO:l :
(i) CARACTRERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 4446 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRIN: double (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
~ix) CARACTERISTIQUES
(A) NOM/CLE: séquence codante de l'ADN
polymérase de Pyrococcus sp. GE 23 ~B) EMPLACEMENT:de 1547 à 3862 (ix) CARACTERISTIQUES
(A) NOM/CLE: codon stop (B) EMPLACEMENT:de 3860 à 3862 (xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO:l :
30 TACTGAGATG GGCTGGCTTT GA'l'iilG~lCC CAATAACGGC GAGGCTTCCC CACATAAGCA 180 CA 02260274 l999-0l-08 WO 98/01567 3 8 - PCT/FR97/012~9 TACGAGATAT CCCCAAGGCT GGTTTTTAAT CTAAAGCCTA TC~'l"l~llGA GTCGCTGTGC 1020 CCCCCATAAA ACACGCTTCT AGAACCTATT AGGGTTCCCC T~ llAGT AACACCGTAT 1200 GTCATTCCCA CAACGAACAC CTCGGCGGCG GTGGAGTGAT CG~lG~lGI~l~ ATGCGAAATG 1260 TTTAGTCCCG AAATTAAAGT GCGAGGCTTA TGCTTTTAAG GATGTATGGC GAAAGGTGAA lS00 Met Ile Ile Asp Ala Asp Tyr Ile Thr Glu Asp Gly Lys Pro Ile Ile Arg Ile Phe Lys Lys Glu Lys Gly Glu Phe Lys Val Glu Tyr Asp Arg Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile Asp Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Lys Ile Val Arg Ile Thr Glu 40 Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile Glu Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Ala Ile Arg Glu Lys Ile Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Thr Pro Met Glu Gly Asn Glu Glu Leu Thr Phe Leu Ala Val Asp Ile Glu Thr Leu Tyr His CA 02260274 l999-0l-08 Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile Ser Tyr Ala S GAC GAG GAA GGG GCC AAG GTG ATA ACT TGG AAG AGC ATA GAC TTA CCT 2083 Asp Glu Glu Gly Ala Lys Val Ile Thr Trp Lys Ser Ile Asp Leu Pro 0 Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys Arg Leu Val Lys Val Ile Arg Glu Lys Asp Pro Asp Val Ile Ile Thr Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Leu Lys Arg Ala Glu Lys Leu Gly Ile Lys Leu Pro Leu Gly Arg Asp Asn Ser Glu Pro Lys Met Gln Arg Met Gly Asp Ser Leu Ala Val Glu Ile Lys Gly Arg Ile His Phe Asp Leu Phe Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Ser Lys Glu Lys Val Tyr 280 285 ~ 290 Ala His Glu Ile Ala Glu Ala Trp Glu Thr Gly Lys Gly Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Val Thr Phe Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala Gln Leu Ala Arg Leu Val Gly Gln Pro Val Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Asp Glu Arg Glu Tyr Glu Arg Arg Leu Arg Glu Ser Tyr Glu Gly 375 380 38~
CA 02260274 l999-0l-08 W O 98/01567 PCT~R97/01259 Gly Tyr Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Gly Ile Val Ser Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His Asn Val 0 Ser Pro Asp Thr Leu Asn Arg Glu Asn Cys Lys Glu Tyr Asp Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe Ile Pro Ser Leu Leu Gly Asn Leu Leu Glu Glu Arg Gln Lys Ile Lys Lys Arg Met Lys Glu Ser Lys Asp Pro Val Glu Lys Lys Leu Leu Asp Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Tyr Tyr Gly Tyr Tyr Gly 30 Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala Trp Gly Arg Gln Tyr Ile Asp Leu Val Arg Arg Glu Leu Glu Ser Ser Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly Leu Tyr Ala Thr Ile Pro Gly Ala Lys Pro Asn Glu Ile Lys Glu Lys Ala Leu Lys Phe Val Glu Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu Glu Leu Glu Tyr 50 Glu Gly Phe Tyr Ala Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Leu Ile Asp Glu Glu Gly Lys Ile Val Thr Arg Gly Leu GIu Ile VaI
Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala Lys Val Leu CA 02260274 l999-0l-08 Glu Ala Ile Leu Lys His Gly Asn Val Asp Glu Ala Val Lys Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Ile Pro Pro Glu Lys ]0 Leu Val Ile Tyr Glu Gln Ile Thr Arg Pro Leu Ser Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala Lys Gly Val Lys Val Lys Pro Gly Met Val Ile Gly Tyr Ile Val Leu Arg Gly Asp Gly Pro Ile Ser Lys Arg Ala Ile Ala Ile Glu Glu Phe Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln Val Leu Pro 30 Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp Leu Lys Phe TAG CTACCCAGAT GTCACCGTAT CTCAACAGGT ATTCCTGGAG A~ AAA 3gl2 TTCCCCGTGC TTCTCAAGGG TAGTGAAAAG ~ C~l~C CAAACTCCGA TATCCGAGCC 4272 WO98/01567 42 PCTn~7/012S9 (2) INFORMATION POUR LA SEQ ID NO:2 :
(i) CARACTRERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 2995 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRIN: double ~D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(ix~ CARACTERISTIQUES
(A) NOM/CLE: séquence codante de l'ADN
polymérase de Pyrococcus sp. GE 5 (B) EMPLACEMENT:de 678 à 2994 (ix) CARACTERISTIQUES
(A) NOM/CLE: codon stop (B) EMPLACEMEMT:de 2992 à 2994 15 (xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO:2 :
40Met Ile Ile Asp Ala Asp Tyr Ile Thr Glu Asp Gly Lys Pro Ile Ile Arg Ile Phe Lys Lys Glu Lys Gly Glu Phe Lys Val Glu Tyr Asp Arg Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile Asp Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Lys Ile Val Arg Ile Thr Glu Val Glu Lys Val Gln Lys Lys Phe CA 02260274 l999-0l-08 WO 98/01567 PCTtFR97tO1259 Leu Gly Arg Pro Ile Glu Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Ala Ile Arg Glu Lys Ile Arg Glu His Pro Ala Val Val 0 Asp Ile Phe Glu Tyr Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Thr Pro Met Glu Gly Asn Glu Glu Leu Thr Phe Leu Ala Val Asp Ile Glu Thr Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile Ser Tyr Ala Asp Glu Glu Gly Ala Lys Val Ile Thr Trp Lys Ser Ile Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu 30 Arg Glu Met Ile Lys Arg Leu Val Lys Val Ile Arg Glu Lys Asp Pro Asp Val Ile Ile Thr Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Leu Lys Arg Ala Glu Lys Leu Gly I le Lys Leu Pro Leu Gly Arg Asp Asn Ser Glu Pro Lys Met Gln Arg Met Gly Asp Ser Leu Ala Val Glu Ile Lys Gly Arg Ile His Phe Asp Leu Phe Pro Ala Ile Arg Arg Thr 50 Ile Asn Leu Pro Thr Tyr Thr Leu Glu Thr Val Tyr Glu Val Ile Phe Gly Lys Ser Lys Glu Lys Val Tyr Ala His Glu Ile Ala Glu Ala Trp CA 02260274 l999-0l-08 W O 98/OlS67 PCT~R97/01259 Glu Thr Gly Lys Gly Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Val Thr Ser Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala 0 Gln Leu Ala Arg Leu Val Gly His Pro Val Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu Thr Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Asp Glu Arg Glu Tyr Glu Arg Arg Leu Arg Glu Ser Tyr Glu Gly Gly Tyr Val Asn Glu Pro Glu Lys Gly Leu Trp Glu Gly Ile Val Ser Leu Asp Phe Arg Ser Leu Tyr Pro 30 Ser Ile Ile Ile Thr His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Asn Cys Lys Glu Tyr Asp Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe Ile Pro Ser Leu Leu Gly Asn Leu Leu Glu Glu Arg Gln Lys Ile Lys Lys Arg Me~ Lys Glu Ser Lys Asp Pro Val Glu Lys Lys Leu Leu Asp Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala 50 Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala Trp Gly Arg Gln Tyr Ile Asp Leu Val Arg Arg Glu Leu Glu Ser Arg Gly Phe Lys Val Leu Tyr Ile CA 02260274 l999-0l-08 Asp Thr Asp Gly Leu Tyr Ala Thr Ile Pro Gly Ala Lys His Glu Glu Ile Lys Glu Lys Ala Leu Lys Phe Val Glu Tyr Ile Asn Ser Lys Leu 1O Pro Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Ala Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Leu Ile Asp Glu Glu Gly Lys Ile Val Thr Arg Gly Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala Lys Val Leu Glu Ala Ile Leu Lys His Gly Asn Val Asp Glu Ala Val Lys Ile Val Lys Glu Val Thr Glu Lys Leu Ser 30 Lys Tyr Glu Ile Pro Pro Glu Lys Leu Val Ile Tyr Glu Gln Ile Thr Arg Pro Leu Ser Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala Lys Gly Val Lys Val Lys Pro Gly Met Val Ile Gly Tyr Ile Val Leu Arg Gly Asp Gly Pro Ile Ser Lys Arg Ala Ile Ala Ile Glu Glu Phe Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr S0 Tyr Ile Glu Asn Gln Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp Leu Lys Phe 765 770 771 .
a) Matériels et méthodes.
Pour réaliser les tests nécessaires à cette étude, les ADN polymérases Pab et Ppr sont diluées dans un tampon de conditionnement (20 mM Tris-HCl pH=8,0 ; 1 mM EDTA ; 1 mM dithiothréitol ; 50 % glycérol ; 0,5 %
Tween 20 ; 0,5 % Nonidet 40 ; 0,2 mg/ml BSA), de façon à
ajouter 0,01 U. de polymérase par test et à se placer dans les conditions non saturantes. Ainsi, 0,01 U. de Pab ou de Ppr sont incubés en 20 ~1 de tampon d'incubation (10 mM Tris HCl pP=9,0 ; 50 mM KCl ; 3 mM
MgSO4 ; 0,1 % Tween) à différents temps (de 0 à 36 heures), à 92~C, à 95~C ou à 100~C. Autant de tubes que de temps différents d'incubation ont été préparés à
partir d'un même mélange initial. Les différents tubes sont incubés dans un bain à sec (bloc PCR). A la fin de l'incubation, les tubes sont mis dans la glace et l'activité résiduelle de l'enzyme sera dosée à 72~C
comme décrit ci-après.
WO98/01567 31 PCT~R97/01259 Le test d'activité est effectué dans un volume final de lO0 ~l de tampon d'incubation (lO mM
Tris HCl pP=9,0 ; 50 mM KCl ; 3 mM MgSO4 ; 0,l % Tween) dans les conditions suivantes :
- 13 ~g d'ADM activé de thymus de veau - 500 ~M de chacun de 4 dNTP
- lO ~Ci de l'un des quatre dMTP mar~ué au ~2p utilisé comm etraceur (du dATP ou dNTP ont été
utilisés~
- les 20 ~l de la solution correspondant au test d'inactivation par la température.
Les essais sont incubés 30 minutes à 70~C.
lO ~l de chaque test sont prélevés après lO minutes, 20 minutes et 30 minutes d'incubation, puis sont déposés sur papier DE81 (Whatmann). Un compactage avant lavage est alors réaIisé à sec par la méthode de Cerenkov. Les papiers DE81 sont ensuite lavés trois fois 5 minutes dans une solution 0,S mM de Na2HP04 afin d'éliminer les dNTP non incorporés. Un passage à l'alcool permet un -séchage rapide des papiers qui sont remis à compter. Un témoin négatif (To) est réalisé sans ADN polymérase et un témoin positif est réalisé avec de l'ADN polymérase non traité à la température, correspondant au temps 0 heure. Une unité polymérase est la quantité d'enzyme nécessaire à l'incorporation de lO nmoles de nucléosides en produits acido-solubles en 30 minutes à 72~C dans les conditions d'essais. L'activité polymérase est calculé
en faisant la moyenne des coups totaux avant lavage en lO ~l de dépôt. Ceux-ci correspondent à 4 x 5 nanomoles de chaque dNTP, soit 20 nanomoles de dNTP totaux. A
chaque valeur après lavage (Ci), il faut retrancher la valeur du témoin négatif To (sans enzyme).
Soit, U/~l =
(Ci-To) x (30min/temps d'incubation) x (lOO,ul/10!11 dépot) x dilution polymérase (Ct pour 10 nanomoles) x ~Ll de polymerase ajouté
. . .
CA 02260274 1999-0l-08 WO98/01567 32 PCT~R97/01259 b) Résultats.
Les deux enzymes ont été étudiés à trois températures 92~C, 95~C et 100~C. Tous les travaux ont été réalisés en parallèle avec les mêmes substrats. Les résultats sont représentés sur les courbes des figures 19 à 22. Pour les figures 21 (tableau V ci-après) et 22 (tableau VI ci-après), les différentes polymérases étudiées sont ramenées à une même base au niveau activité initiale, pour en faciliter l'étude comparative. Une ~uatrième température de 105~C a également été étudiée pour la Pab mais n'est pas illustrée dans les figures.
Fi~ure 19 : activité Pab.
Le tableau III ci-dessous rapporte les lS résultats de l'inactivation de la Pab en fonction du temps à 100~C, 95~C et 92~C.
Tableau III
Temps Inactivation Inactivation Inactivation (heure) à 100~C à 95~C à 92~C
0 ~3,8 22,3 25 1 3,6 2 '1,3 25,8 27,1 3 9,7 4 _7,2 19,9 23,1 :4,1 6 5,9 17,1 22,8 7 2,6 ~ 1,2 14,9 21,8 10,5 :3,6 19,5 2 2,7 18 4 1,~ 14,05 6 8,6 I,~ 11,2 :8 7,5 _O,t 10,3 -0 9,4 9,9 ~2 9,7 7,5 24 6,2 8 7 7,1 ~ 4,3 5,3 6,5 CA 02260274 lggg-ol-os WO98/01567 PCT~R97/01259 Fi~ure 20 : activité Por.
Le tableau IV ci-dessous rapporte les résultats de l'inactivation de la Ppr en fonction du temps à 100~C, 95~C et 92~C.
s Tableau IV
Temps Inactivation Inactivation Inactivation (heure) à 100~C à 95~C à 9'~C
0 ~,5 7,66 7,~~
~,9 5,5 8, ~ 3,75 5,63 7, ~
: 1,9 5,23 ~,~6 ~ 1 4,8 4 5 5,3 5,25 0 5,~7 4,3 4,~4 3,75 0 4,34 -- 3,28 _2 3,92 _ 3,35 ~,. 4,11 ' 2,14 :6 2,63 7 1,94 ~ 2,8 _ . , ~
_ . _, , .
-- 1,06 ~".
3~ 3 , .
Fi~ure 21 : activité Pab et P~r a~rès inactivation à 100~C.
Le tableau V ci-dessous rapporte l'activité
de Pab et Ppr après inactivation à 100~C.
Tableau V
Temps Pab Ppr (heure) 0 2_, 8 23, 8 '' ,6 7,9 2 ' _ , 3 - 3 , 7 3 ~j 7 6, 9 4 ~ 3,7 _4, _ 6 - 5, 9 0 7 .;, 6 8 _ ,2 0 ~ U , 5 t~ 8,6 ~ 7 5 2''- ,2 -c, 1',1 _ 7 _6 4,3 Fi~ure 22: activité Pab, Pl~r et ~olYmérase de thermus acruaticus (Taa) a~rès inactivation à 92~C.
Le tableau VI ci-dessous rapporte l'activité
de Pab, Ppr et de la Taq après inactivation à 92~C.
s Tableau VI
Temps Pab Taq Ppr (heure) 0 25 -7,7 -5 ,5 27,1 2, _~,5 20,,, 23,1 19 _.,~
15,7 6,~
. 22,8 14,5 _~, 8 2:,8 12,3 i, _0 1'~,5 _ "
_ _8 _~ 5 .. 14,05 -~ 11,2 8, ~~ 10,3 8,~
' 0 9,9 ~2 7,5 4 2,3 5,~
,,~ 5, 6,5 0, 3,~
O, ,6 2,,' ''2 84 0,7 L'analyse des courbes des figures 19 à 22 10montrent que:
- Pab conserve 90% de son activité après un traitement de 5 heures à 92~C, 70% après 5 heures à 95~C
et 60% après 5 heures à 100~C. La Pab conserve 50% de son activité après un traitement de 90 minutes à 105~C.
- Ppr conserve 68% de son activité après 5 heures à 92~C, 65% après 5 heures à 95~C et 10% après 5 heures à 100~C.
CA 02260274 1999-0l-08 WO98/01567 36 ~ PCT~R97/01259 En comparaison Taq pol conserve 55% de son activité après 5 heures à 92~C, mais elle n'a qu'une demi-vie de 90 minutes à 95~C et de 5 minutes à 100~C.
D'après les courbes des figures 19 à 22 et les commentaires ci-dessus, l'enzyme Pab est plus thermostable que la Ppr et ce, malgré une différence seulement dix résidus entre leur séquence. L'enzyme Pab est la plus thermostable actuellement décrite avec une demi-vie à 95~C de 18 heures et de plus de 8 heures à
100~C. L'enzyme Ppr présente une thermostabilité
comparable à celle publiée par la Vent voire même meilleure avec 2 heures de demi-vie à 100~C.
WO98/01~7 PCT~R97/01259 LISTE DE SÉQUENCES
(l) INFORMATION GÉNÉRALES :
(i) DEPOSANT : APPLIGENE - ONCOR
(ii) TITRE DE L'INVENTION: ADN POLYMERASE
THERMOSTABLE D'ARCHAEBACTÉRIES DU GENRE
PYROCOCCUS SP.
(iii) NOMBRE DE SEQUENCES: 2 (2) INFORMATION POUR LA SEQ ID NO:l :
(i) CARACTRERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 4446 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRIN: double (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
~ix) CARACTERISTIQUES
(A) NOM/CLE: séquence codante de l'ADN
polymérase de Pyrococcus sp. GE 23 ~B) EMPLACEMENT:de 1547 à 3862 (ix) CARACTERISTIQUES
(A) NOM/CLE: codon stop (B) EMPLACEMENT:de 3860 à 3862 (xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO:l :
30 TACTGAGATG GGCTGGCTTT GA'l'iilG~lCC CAATAACGGC GAGGCTTCCC CACATAAGCA 180 CA 02260274 l999-0l-08 WO 98/01567 3 8 - PCT/FR97/012~9 TACGAGATAT CCCCAAGGCT GGTTTTTAAT CTAAAGCCTA TC~'l"l~llGA GTCGCTGTGC 1020 CCCCCATAAA ACACGCTTCT AGAACCTATT AGGGTTCCCC T~ llAGT AACACCGTAT 1200 GTCATTCCCA CAACGAACAC CTCGGCGGCG GTGGAGTGAT CG~lG~lGI~l~ ATGCGAAATG 1260 TTTAGTCCCG AAATTAAAGT GCGAGGCTTA TGCTTTTAAG GATGTATGGC GAAAGGTGAA lS00 Met Ile Ile Asp Ala Asp Tyr Ile Thr Glu Asp Gly Lys Pro Ile Ile Arg Ile Phe Lys Lys Glu Lys Gly Glu Phe Lys Val Glu Tyr Asp Arg Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile Asp Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Lys Ile Val Arg Ile Thr Glu 40 Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile Glu Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Ala Ile Arg Glu Lys Ile Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Thr Pro Met Glu Gly Asn Glu Glu Leu Thr Phe Leu Ala Val Asp Ile Glu Thr Leu Tyr His CA 02260274 l999-0l-08 Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile Ser Tyr Ala S GAC GAG GAA GGG GCC AAG GTG ATA ACT TGG AAG AGC ATA GAC TTA CCT 2083 Asp Glu Glu Gly Ala Lys Val Ile Thr Trp Lys Ser Ile Asp Leu Pro 0 Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys Arg Leu Val Lys Val Ile Arg Glu Lys Asp Pro Asp Val Ile Ile Thr Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Leu Lys Arg Ala Glu Lys Leu Gly Ile Lys Leu Pro Leu Gly Arg Asp Asn Ser Glu Pro Lys Met Gln Arg Met Gly Asp Ser Leu Ala Val Glu Ile Lys Gly Arg Ile His Phe Asp Leu Phe Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Ser Lys Glu Lys Val Tyr 280 285 ~ 290 Ala His Glu Ile Ala Glu Ala Trp Glu Thr Gly Lys Gly Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Val Thr Phe Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala Gln Leu Ala Arg Leu Val Gly Gln Pro Val Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Asp Glu Arg Glu Tyr Glu Arg Arg Leu Arg Glu Ser Tyr Glu Gly 375 380 38~
CA 02260274 l999-0l-08 W O 98/01567 PCT~R97/01259 Gly Tyr Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Gly Ile Val Ser Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His Asn Val 0 Ser Pro Asp Thr Leu Asn Arg Glu Asn Cys Lys Glu Tyr Asp Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe Ile Pro Ser Leu Leu Gly Asn Leu Leu Glu Glu Arg Gln Lys Ile Lys Lys Arg Met Lys Glu Ser Lys Asp Pro Val Glu Lys Lys Leu Leu Asp Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Tyr Tyr Gly Tyr Tyr Gly 30 Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala Trp Gly Arg Gln Tyr Ile Asp Leu Val Arg Arg Glu Leu Glu Ser Ser Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly Leu Tyr Ala Thr Ile Pro Gly Ala Lys Pro Asn Glu Ile Lys Glu Lys Ala Leu Lys Phe Val Glu Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu Glu Leu Glu Tyr 50 Glu Gly Phe Tyr Ala Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Leu Ile Asp Glu Glu Gly Lys Ile Val Thr Arg Gly Leu GIu Ile VaI
Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala Lys Val Leu CA 02260274 l999-0l-08 Glu Ala Ile Leu Lys His Gly Asn Val Asp Glu Ala Val Lys Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Ile Pro Pro Glu Lys ]0 Leu Val Ile Tyr Glu Gln Ile Thr Arg Pro Leu Ser Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala Lys Gly Val Lys Val Lys Pro Gly Met Val Ile Gly Tyr Ile Val Leu Arg Gly Asp Gly Pro Ile Ser Lys Arg Ala Ile Ala Ile Glu Glu Phe Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln Val Leu Pro 30 Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp Leu Lys Phe TAG CTACCCAGAT GTCACCGTAT CTCAACAGGT ATTCCTGGAG A~ AAA 3gl2 TTCCCCGTGC TTCTCAAGGG TAGTGAAAAG ~ C~l~C CAAACTCCGA TATCCGAGCC 4272 WO98/01567 42 PCTn~7/012S9 (2) INFORMATION POUR LA SEQ ID NO:2 :
(i) CARACTRERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 2995 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRIN: double ~D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(ix~ CARACTERISTIQUES
(A) NOM/CLE: séquence codante de l'ADN
polymérase de Pyrococcus sp. GE 5 (B) EMPLACEMENT:de 678 à 2994 (ix) CARACTERISTIQUES
(A) NOM/CLE: codon stop (B) EMPLACEMEMT:de 2992 à 2994 15 (xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO:2 :
40Met Ile Ile Asp Ala Asp Tyr Ile Thr Glu Asp Gly Lys Pro Ile Ile Arg Ile Phe Lys Lys Glu Lys Gly Glu Phe Lys Val Glu Tyr Asp Arg Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile Asp Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Lys Ile Val Arg Ile Thr Glu Val Glu Lys Val Gln Lys Lys Phe CA 02260274 l999-0l-08 WO 98/01567 PCTtFR97tO1259 Leu Gly Arg Pro Ile Glu Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Ala Ile Arg Glu Lys Ile Arg Glu His Pro Ala Val Val 0 Asp Ile Phe Glu Tyr Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Thr Pro Met Glu Gly Asn Glu Glu Leu Thr Phe Leu Ala Val Asp Ile Glu Thr Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile Ser Tyr Ala Asp Glu Glu Gly Ala Lys Val Ile Thr Trp Lys Ser Ile Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu 30 Arg Glu Met Ile Lys Arg Leu Val Lys Val Ile Arg Glu Lys Asp Pro Asp Val Ile Ile Thr Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Leu Lys Arg Ala Glu Lys Leu Gly I le Lys Leu Pro Leu Gly Arg Asp Asn Ser Glu Pro Lys Met Gln Arg Met Gly Asp Ser Leu Ala Val Glu Ile Lys Gly Arg Ile His Phe Asp Leu Phe Pro Ala Ile Arg Arg Thr 50 Ile Asn Leu Pro Thr Tyr Thr Leu Glu Thr Val Tyr Glu Val Ile Phe Gly Lys Ser Lys Glu Lys Val Tyr Ala His Glu Ile Ala Glu Ala Trp CA 02260274 l999-0l-08 W O 98/OlS67 PCT~R97/01259 Glu Thr Gly Lys Gly Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Val Thr Ser Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala 0 Gln Leu Ala Arg Leu Val Gly His Pro Val Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu Thr Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Asp Glu Arg Glu Tyr Glu Arg Arg Leu Arg Glu Ser Tyr Glu Gly Gly Tyr Val Asn Glu Pro Glu Lys Gly Leu Trp Glu Gly Ile Val Ser Leu Asp Phe Arg Ser Leu Tyr Pro 30 Ser Ile Ile Ile Thr His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Asn Cys Lys Glu Tyr Asp Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe Ile Pro Ser Leu Leu Gly Asn Leu Leu Glu Glu Arg Gln Lys Ile Lys Lys Arg Me~ Lys Glu Ser Lys Asp Pro Val Glu Lys Lys Leu Leu Asp Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala 50 Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala Trp Gly Arg Gln Tyr Ile Asp Leu Val Arg Arg Glu Leu Glu Ser Arg Gly Phe Lys Val Leu Tyr Ile CA 02260274 l999-0l-08 Asp Thr Asp Gly Leu Tyr Ala Thr Ile Pro Gly Ala Lys His Glu Glu Ile Lys Glu Lys Ala Leu Lys Phe Val Glu Tyr Ile Asn Ser Lys Leu 1O Pro Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Ala Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Leu Ile Asp Glu Glu Gly Lys Ile Val Thr Arg Gly Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala Lys Val Leu Glu Ala Ile Leu Lys His Gly Asn Val Asp Glu Ala Val Lys Ile Val Lys Glu Val Thr Glu Lys Leu Ser 30 Lys Tyr Glu Ile Pro Pro Glu Lys Leu Val Ile Tyr Glu Gln Ile Thr Arg Pro Leu Ser Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala Lys Gly Val Lys Val Lys Pro Gly Met Val Ile Gly Tyr Ile Val Leu Arg Gly Asp Gly Pro Ile Ser Lys Arg Ala Ile Ala Ile Glu Glu Phe Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr S0 Tyr Ile Glu Asn Gln Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp Leu Lys Phe 765 770 771 .
Claims (14)
1) ADN polymérase purifiée thermostable d'archaebactéries du genre Pyrococcus sp. ayant un poids moléculaire compris entre environ 89 000 et 90 000 daltons.
2) ADN polymérase selon la revendication 1 de la souche d'archaebactéries du genre Pyrococcus sp.
GE 5 déposée à la CNCM sous le No. I-1302
GE 5 déposée à la CNCM sous le No. I-1302
3) ADN polymérase selon la revendication 2 ayant un poids moléculaire d'environ 89 443 daltons et un pI d'environ 8,13.
4) ADN polymérase selon la revendication 1 purifiée de la souche d'archaebactéries du genre Pyrococcus sp. GE 23 déposée à la CNCM sous le No.
I-1764.
I-1764.
5) ADN polymérase selon la revendication 4 ayant un poids moléculaire d'environ 89 409 daltons et un pI d'environ 8,37.
6) Une ADN polymérase purifiée thermostable dont la séquence en acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID
NO:1.
NO:1.
7) Une ADN polymérase purfiée thermostable dont la séquence en acides aminés est représentée dans la liste de séquence en annexe sous le numéro SEQ ID
NO:2.
NO:2.
8) Une séquence d'ADN constituée par ou comprenant la séquence codant pour l'ADN polymérase purifiée thermostable de l'une quelconque des revendications 1 à 7.
9) Une séquence d' ADN selon la revendication 8 comprenant ou constituée par les nucléotides 1547 à
3862 de la SEQ ID NO:1.
3862 de la SEQ ID NO:1.
10) Une séquence d'ADN selon la revendication 8 comprenant ou constituée par les nucléotides 678 à 2994 de la SEQ ID NO:2.
11) Un vecteur contenant la séquence d'ADN
de l'une quelconque des revendications 8 à 10.
de l'une quelconque des revendications 8 à 10.
12) Un hote transformé par un vecteur selon la revendication 11.
13) Procédé de préparation d'une ADN
polymérase d'archaebactéries du genre Pyrococcus sp.
caractérisé en ce que l'on cultive l'hôte selon la revendication 12 dans des conditions permettant l'expression de ladite ADN polymérase et en ce que l'on extrait et récupére celle-ci par tout moyen approprié.
polymérase d'archaebactéries du genre Pyrococcus sp.
caractérisé en ce que l'on cultive l'hôte selon la revendication 12 dans des conditions permettant l'expression de ladite ADN polymérase et en ce que l'on extrait et récupére celle-ci par tout moyen approprié.
14) Procédé d'amplification enzymatique d'une séquence d'acide nucléique caractérisé en ce que l'on met en oeuvre une ADN polymérase thermostable selon l'une quelconque des revendications 1 à 7.
ADN POLYMERASE THERMOSTABLE
D ' ARCHAEBACTÉRIES DU GENRE PYROCOCCUS SP.
La présente invention concerne une ADN
polymérase purifiée thermostable d'archaebactéries du genre Pyrococcus sp. ayant un poids moléculaire compris entre environ 89 000 et 90 000 daltons.
ADN POLYMERASE THERMOSTABLE
D ' ARCHAEBACTÉRIES DU GENRE PYROCOCCUS SP.
La présente invention concerne une ADN
polymérase purifiée thermostable d'archaebactéries du genre Pyrococcus sp. ayant un poids moléculaire compris entre environ 89 000 et 90 000 daltons.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR9608631A FR2750999B1 (fr) | 1996-07-10 | 1996-07-10 | Adn polymerase thermostable d'archaebacteries du genre pyrococcus sp |
| FR96/08631 | 1996-07-10 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CA2260274A1 true CA2260274A1 (fr) | 1998-01-15 |
Family
ID=9493915
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CA002260274A Abandoned CA2260274A1 (fr) | 1996-07-10 | 1997-07-10 | Adn polymerase thermostable d'archaebacteries du genre pyrococcus sp. |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US6673585B1 (fr) |
| EP (1) | EP0920516A2 (fr) |
| CA (1) | CA2260274A1 (fr) |
| FR (1) | FR2750999B1 (fr) |
| WO (1) | WO1998001567A2 (fr) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2792651B1 (fr) * | 1999-04-21 | 2005-03-18 | Centre Nat Rech Scient | Sequence genomique et polypeptides de pyrococcus abyssi, leurs fragments et leurs utilisations |
| US20060228726A1 (en) * | 2005-01-06 | 2006-10-12 | Martin Patrick K | Polypeptides having nucleic acid binding activity and compositions and methods for nucleic acid amplification |
| US20070059713A1 (en) * | 2005-09-09 | 2007-03-15 | Lee Jun E | SSB-DNA polymerase fusion proteins |
| WO2011149419A1 (fr) | 2010-05-26 | 2011-12-01 | Intervacc Ab | Vaccin contre des infections streptococciques basé sur des protéines de recombinaison |
| US20110312537A1 (en) * | 2010-06-17 | 2011-12-22 | Geneasys Pty Ltd | Loc device for amplifying and detecting target nucleic acid sequences using electrochemiluminescent resonant energy transfer, linear probes with covalently attached primers |
| EP3580352A1 (fr) * | 2017-02-13 | 2019-12-18 | Qiagen Sciences, LLC | Enzyme polymérase de pyrococcus abyssi |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5756334A (en) * | 1990-04-26 | 1998-05-26 | New England Biolabs, Inc. | Thermostable DNA polymerase from 9°N-7 and methods for producing the same |
| WO1992009689A1 (fr) * | 1990-12-03 | 1992-06-11 | Stratagene | Adn polymerase i thermostable purifiee de $i(pyrococcus furiosus) |
| DE69232435T2 (de) * | 1991-12-18 | 2002-07-18 | New England Biolabs, Inc. | Rekombinante thermostabile DNA-Polymerase von Archaebakterie |
| DE547359T1 (de) * | 1991-12-18 | 1993-11-25 | New England Biolabs Inc | Gereinigte thermostabile DNS-Polymerase aus Pyrococcus-Arten. |
| US5491086A (en) * | 1993-05-14 | 1996-02-13 | Hoffmann-La Roche Inc. | Purified thermostable nucleic acid polymerase and DNA coding sequences from pyrodictium species |
| JP3112148B2 (ja) * | 1995-05-31 | 2000-11-27 | 東洋紡績株式会社 | 核酸の増幅方法およびその試薬 |
-
1996
- 1996-07-10 FR FR9608631A patent/FR2750999B1/fr not_active Expired - Fee Related
-
1997
- 1997-07-10 EP EP97932882A patent/EP0920516A2/fr not_active Withdrawn
- 1997-07-10 CA CA002260274A patent/CA2260274A1/fr not_active Abandoned
- 1997-07-10 US US09/214,916 patent/US6673585B1/en not_active Expired - Fee Related
- 1997-07-10 WO PCT/FR1997/001259 patent/WO1998001567A2/fr not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| US6673585B1 (en) | 2004-01-06 |
| WO1998001567A2 (fr) | 1998-01-15 |
| WO1998001567A3 (fr) | 1998-04-09 |
| FR2750999B1 (fr) | 1998-11-20 |
| FR2750999A1 (fr) | 1998-01-16 |
| EP0920516A2 (fr) | 1999-06-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5882904A (en) | Thermococcus barossii DNA polymerase mutants | |
| Dos Santos et al. | Molecular analysis of the trimethylamine N-oxide (TMAO) reductase respiratory system from a Shewanella species | |
| JP3761197B2 (ja) | 新規dnaポリメラーゼ | |
| Metzger et al. | Genetics of galactose metabolism of Erwinia amylovora and its influence on polysaccharide synthesis and virulence of the fire blight pathogen | |
| FR2655660A1 (fr) | Nouveaux polypeptides, sequences d'adn permettant leur expression, procede de preparation et leur utilisation. | |
| JP3453397B2 (ja) | Pyrococcus種から得られる精製耐熱性DNAポリメラーゼ | |
| CA2260274A1 (fr) | Adn polymerase thermostable d'archaebacteries du genre pyrococcus sp. | |
| KR102254956B1 (ko) | 백색 구피색 양파를 판별할 수 있는 분자 마커 및 그 용도 | |
| Ehara et al. | Distribution of cognates of group II introns detected in mitochondrial cox1 genes of a diatom and a haptophyte | |
| WO1998049274A1 (fr) | Adn polymerase thermostable et inteines de l'espece thermococcus fumicolans | |
| JP2931939B2 (ja) | Lactobacillus delbrueckii 種染色体への遺伝子組込み方法及び遺伝子組込み体 | |
| CN109337918A (zh) | 一种烟草蛋白激酶基因NtCIPK1及其克隆方法与应用 | |
| CN109468334A (zh) | 一种烟草蛋白激酶基因NtCIPK25-1及其克隆方法与应用 | |
| FR2724183A1 (fr) | Vecteurs de criblage et/ou d'expression fonctionnels chez les mycobacteries - utilisation pour l'identification et l'expression de polypeptides exportes | |
| JPH07298879A (ja) | 超好熱始原菌由来のdnaポリメラーゼ遺伝子およびその用途 | |
| FR2685334A1 (fr) | Polypeptides contenant des sequences caracteristiques de pyrrolidone carboxylyl peptidases, polynucleotides contenant une sequence codant pour de tels polypeptides, et leur utilisation. | |
| US6723543B1 (en) | Mutant kanamycin nucleotidyltransferases from S. aureus | |
| FR2723104A1 (fr) | Nouvelle topoisomerase iv, sequences nucleotiques correspondantes et leurs utilisations | |
| WO2007099737A1 (fr) | ADN polymerase mutante | |
| JP4217922B2 (ja) | サーモコッカス・ペプトノフィラス由来の熱安定性dnaポリメラーゼ、該酵素をコードする遺伝子およびその用途 | |
| JP2978001B2 (ja) | ポルi型dnaポリメラーゼ遺伝子のクローニング方法 | |
| FR2871811A1 (fr) | Endofucanase recombinante | |
| FR2739859A1 (fr) | Polypeptide precurseur d'adn gyrase contenant une inteine | |
| FR2686604A1 (fr) | Polypeptides contenant des sequences caracteristiques de pyrrolidone carboxylyl peptidases, polynucleotides contenant une sequence codant pour de tels polypeptides, et leur utilisation. | |
| KR102043363B1 (ko) | 마크로포미나 파세올리나로부터의 펙틴 분해 효소 및 이의 용도 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EEER | Examination request | ||
| FZDE | Discontinued |