PL241698B1 - Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy - Google Patents
Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy Download PDFInfo
- Publication number
- PL241698B1 PL241698B1 PL436784A PL43678421A PL241698B1 PL 241698 B1 PL241698 B1 PL 241698B1 PL 436784 A PL436784 A PL 436784A PL 43678421 A PL43678421 A PL 43678421A PL 241698 B1 PL241698 B1 PL 241698B1
- Authority
- PL
- Poland
- Prior art keywords
- lys
- glu
- leu
- gly
- val
- Prior art date
Links
- 239000013612 plasmid Substances 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000002360 preparation method Methods 0.000 title description 2
- 238000010367 cloning Methods 0.000 claims abstract description 16
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 10
- 238000006243 chemical reaction Methods 0.000 claims description 45
- 108090000623 proteins and genes Proteins 0.000 claims description 43
- 108020004414 DNA Proteins 0.000 claims description 38
- 102000004169 proteins and genes Human genes 0.000 claims description 32
- 239000002773 nucleotide Substances 0.000 claims description 24
- 125000003729 nucleotide group Chemical group 0.000 claims description 24
- 239000000047 product Substances 0.000 claims description 22
- 239000000203 mixture Substances 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- 241000588724 Escherichia coli Species 0.000 claims description 10
- 108010019653 Pwo polymerase Proteins 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 8
- 230000029087 digestion Effects 0.000 claims description 8
- 238000011534 incubation Methods 0.000 claims description 8
- 102000037865 fusion proteins Human genes 0.000 claims description 7
- 108020001507 fusion proteins Proteins 0.000 claims description 7
- 229930027917 kanamycin Natural products 0.000 claims description 7
- 229960000318 kanamycin Drugs 0.000 claims description 7
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 claims description 7
- 229930182823 kanamycin A Natural products 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 6
- 230000035939 shock Effects 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 5
- 230000006698 induction Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 4
- 239000011543 agarose gel Substances 0.000 claims description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 4
- 108020004635 Complementary DNA Proteins 0.000 claims description 3
- 101710096438 DNA-binding protein Proteins 0.000 claims description 3
- 238000001261 affinity purification Methods 0.000 claims description 3
- 238000010804 cDNA synthesis Methods 0.000 claims description 3
- 229960005091 chloramphenicol Drugs 0.000 claims description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 claims description 3
- 239000002299 complementary DNA Substances 0.000 claims description 3
- 238000001962 electrophoresis Methods 0.000 claims description 3
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 claims description 3
- 229960005542 ethidium bromide Drugs 0.000 claims description 3
- 239000000706 filtrate Substances 0.000 claims description 3
- 239000000499 gel Substances 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 229910052751 metal Inorganic materials 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 239000008188 pellet Substances 0.000 claims description 3
- 229920002401 polyacrylamide Polymers 0.000 claims description 3
- 230000003716 rejuvenation Effects 0.000 claims description 3
- 239000008223 sterile water Substances 0.000 claims description 3
- 239000006228 supernatant Substances 0.000 claims description 3
- 230000014616 translation Effects 0.000 claims description 3
- 235000013351 cheese Nutrition 0.000 description 40
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 18
- 101710176276 SSB protein Proteins 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 12
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 11
- 229910001425 magnesium ion Inorganic materials 0.000 description 11
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 10
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 10
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 150000001413 amino acids Chemical group 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 108010054155 lysyllysine Proteins 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 108060002716 Exonuclease Proteins 0.000 description 4
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 3
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 3
- 230000004543 DNA replication Effects 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 3
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 3
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 3
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 3
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 241000323142 Nanoarchaeum equitans Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 229940024606 amino acid Drugs 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000003813 thumb Anatomy 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 2
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108010092526 GKPV peptide Proteins 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 2
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- RLAOTFTXBFQJDV-KKUMJFAQSA-N His-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CN=CN1 RLAOTFTXBFQJDV-KKUMJFAQSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 2
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 2
- LCPYQJIKPJDLLB-UWVGGRQHSA-N Leu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C LCPYQJIKPJDLLB-UWVGGRQHSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 2
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 2
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 2
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 2
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 2
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 2
- 241000205156 Pyrococcus furiosus Species 0.000 description 2
- 241000205192 Pyrococcus woesei Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 2
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 2
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 2
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 2
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- XCTHZFGSVQBHBW-IUCAKERBSA-N Val-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C XCTHZFGSVQBHBW-IUCAKERBSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 2
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 210000003811 finger Anatomy 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010091798 leucylleucine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010036320 valylleucine Proteins 0.000 description 2
- GMNUWKNKBVVQBM-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-methylbutanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(O)=O GMNUWKNKBVVQBM-UHFFFAOYSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 108020004634 Archaeal DNA Proteins 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- 108010010777 Arg-Gly-Asp-Gly Proteins 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 1
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- SNAKIVFVLVUCKB-UHFFFAOYSA-N Asn-Glu-Ala-Lys Natural products NCCCCC(C(O)=O)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(N)CC(N)=O SNAKIVFVLVUCKB-UHFFFAOYSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 1
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 101100289888 Caenorhabditis elegans lys-5 gene Proteins 0.000 description 1
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 101710116602 DNA-Binding protein G5P Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 1
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 1
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 1
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- 241000323143 Ignicoccus hospitalis Species 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- IXEFKXAGHRQFAF-HVTMNAMFSA-N Ile-Glu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IXEFKXAGHRQFAF-HVTMNAMFSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- MSASLZGZQAXVFP-PEDHHIEDSA-N Ile-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N MSASLZGZQAXVFP-PEDHHIEDSA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 1
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 1
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YRWCPXOFBKTCFY-NUTKFTJISA-N Lys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N YRWCPXOFBKTCFY-NUTKFTJISA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- MDSUKZSLOATHMH-UHFFFAOYSA-N N-L-leucyl-L-valine Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(O)=O MDSUKZSLOATHMH-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101710162453 Replication factor A Proteins 0.000 description 1
- 101710176758 Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 1
- 101150010882 S gene Proteins 0.000 description 1
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfisoxazole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- 241000204666 Thermotoga maritima Species 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- VUSAEKOXGNEYNE-PBCZWWQYSA-N Thr-His-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VUSAEKOXGNEYNE-PBCZWWQYSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 1
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 1
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 1
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 1
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 1
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 241000617156 archaeon Species 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 210000001037 metacarpus Anatomy 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07007—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
Przedmiotem wynalazku jest polimeraza Pwo-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.
Description
Opis wynalazku
Przedmiotem wynalazku jest polimeraza Pwo-NeqSSB oraz sposób jej klonowania. Ponadto przedmiotem wynalazku jest wyizolowany plazmid rekombinantowy, startery oraz zastosowanie polimerazy do powielania specyficznych sekwencji wirusa SARS CoV-2.
Organizmy termofilne oraz hipertermofilne stanowią potencjalne źródło enzymów pożądanych w różnych gałęziach przemysłu, dzięki swojej wysokiej stabilności w wysokich temperaturach. Przykładem białek o szerokim zastosowaniu są termostabilne polimerazy DNA, których optymalna aktywność osiągana jest w temperaturze powyżej 70°C, a wiele z nich zachowuje swoją aktywność nawet powyżej 100°C. Budowa termostabilnych polimeraz DNA różni się od ich odpowiedników pochodzenia mezofilnego. Struktura ich jest sztywniejsza i bardziej upakowana. Stabilność α-helis jest zapewniona m.in. przez zmniejszoną zawartość takich reszt aminokwasowych jak izoleucyna czy walina, które w znacznym stopniu przyczyniają się do występowania przestrzennych naprężeń. W enzymach tych zaobserwowano znaczne zwiększenie oddziaływań, takich jak: oddziaływani a jonowe, van der Waalsa czy hydrofobowe, które również mają istotny wpływ na wzrost termostabilności białek. W technikach biologii molekularnej czy inżynierii genetycznej najczęściej korzysta się z termostabilnych polimeraz DNA pochodzenia bakteryjnego: Thermus aquaticus, Thermus thermophilus, Thermotoga maritima, Bacillus stearothermophilus lub z archeonów tj.: Thermococcus litoralis, Pyrococcus furiosus, Pyrococcus woesei. Główne zastosowanie tych polimeraz DNA to amplifikacja fragmentów DNA z udziałem techniki PCR oraz sekwencjonowanie DNA.
Jedną z najlepiej znanych polimeraz DNA, pochodzących z Euryarcheota i wykorzystywanych w biologii oraz diagnostyce molekularnej jest polimeraza DNA Pwo z Pyrococcus woesei. Jej struktura przypomina pierścień, na który składają się domena 3’^5’ egzonukleazy oraz domena polimeryzacyjna zbudowana z subdomeny śródręcza, palców i kciuka (rysunek 1).
Aktywność polimeryzacyjna oraz korektorska polimeraz DNA archeonów jest związana z pętlą w domenie odpowiedzialnej za aktywność egzonukleolityczną. Jest to element silnie zakonserwowany i występujący wyłącznie u tej grupy mikroorganizmów. Reszty aminokwasowe budujące pętlę oddziałują z dodatnio naładowaną krawędzią subdomeny kciuka i umożliwiają wiązanie końca 3’ ssDNA do centrum aktywnego enzymu. Polimeraza DNA Pwo charakteryzuje się wysoką procesywnością i wiernością replikacji DNA, co związane jest z obecnością domeny korektorskiej 3’^5’ egzonukleazy. Jej termostabilność znacznie przewyższa bakteryjną polimerazę DNA Taq, gdyż czas jej półtrwania wynosi prawie 3 h w 100°C. Ponadto wykazuje większą procesywność i rzadziej popełnia błędy w trakcie syntezy.
Białko NeqSSB należy do rodziny białek SSB (ang. Single-Stranded DNA Binding protein). Białka SSB wykazują różnorodność sekwencji aminokwasowych oraz struktury. Mimo to wszystkie posiadają charakterystyczną, silnie zakonserwowaną, ok. 100 - aminokwasową domenę oligonukleotydową OB (ang. Oligonucleotide/Oligosaccharide Binding Fold Domain). Występuje ona powszechnie u białek posiadających zdolności wiązania ssDNA, determinuje, więc tą podstawową i wspólną dla wszystkich białek SSB cechę - niespecyficzne wiązanie jednoniciowej nici DNA, a także, odkryte znacznie później, wiązanie RNA. Białka SSB odgrywają zasadniczą rolę w procesach ściśle związanych z ssDNA. Odgrywają istotną rolę w replikacji, rekombinacji i naprawie DNA. Odpowiadają za interakcje z jednoni ci owym DNA, zapobiegają tworzeniu struktur drugorzędowych i chronią przed degradacyjnym działaniem nukleaz.
Odkrycie białek SSB datuje się na połowę lat 60-tych XX wieku. Pierwsze wykryte białka to białko SSB faga T4 oraz E. coli. Odkryto wtedy ich silne właściwości związane z oddziaływaniem z ssDNA oraz elucję białka w złożu ssDNA-celuloza w obecności wysokiego stężenia soli - 2 M NaCl. Zwrócono również uwagę na bardzo wysoką selektywność tego białka do jednoni ci owego DNA. Potwierdzeniem fundamentalnej roli białek SSB w procesach związanych z ssDNA jest fakt, iż występują one u wszystkich organizmów żywych, a także u wirusów.
Wiązanie się białka SSB z ssDNA polega na upakowaniu aromatycznych reszt aminokwasowych między zasady w łańcuchu oligonukleotydowym. Ponadto dodatnio naładowane reszt aminokwasowych oddziałują ze szkieletem fosforanowym w cząsteczce ssDNA.
Mimo przynależności białka NeqSSB do rodziny białek SSB odbiega ono swoimi cechami od klasycznych białek SSB, stąd określane jest jako białko NeqSS B-podobne. Białko to pochodzi z hipertermofilnego archeona Nanoarchaeum equitans, który pasożytuje w craenarchaeonie Ignicoccus hospitalis. Optymalne warunki wzrostu tego mikroorganizmu wymagają ściśle beztleno
PL 241 698 B1 wych warunków i temperatury 90°C. Co ciekawe Nanoarchaeum equitans posiada najmniejszy znany genom składający się z 490,885 par zasad. W przeciwieństwie do większości znanych organizmów o obniżonych genomach, posiada pełny zestaw enzymów biorących udział w replikacji, naprawie i rekombinacji DNA, w tym białko SSB.
Białko NeqSSB podobnie jak inne białka z tej rodziny posiada naturalną zdolność wiązania DNA. Składa się z 243 reszt aminokwasowych, a w swojej strukturze ma jedną domenę OB (rys 1). Wykazuje biologiczną aktywność jako monomer, podobnie do niektórych wirusowych białek SSB. Badania wskazują na jego nietypowe dla innych białek SSB zdolności wiązania wszystkich form DNA (ssDNA, dsDNA) oraz mRNA bez strukturalnych preferencji. Ponadto białko charakteryzuje się wysoką termostabilnością. Czas półtrwania przy zachowaniu aktywności biologicznej wynosi 5 min w 100°C, natomiast temperatura topnienia to 100,2°C.
Celem wynalazku jest stworzenie nowej polimerazy Pwo-NeqSSB, która będzie miała zastosowanie do powielania specyficznych sekwencji wirusa SARS CoV-2.
Przedmiotem wynalazku jest polimeraza Pwo-NeqSSB o SEQ. ID 1.
Przedmiotem wynalazku jest również sposób klonowania polimerazy Pwo-NeqSSB o SEQ.ID 1, którą otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:
- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Pwo z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;
- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążącego DNA z dodatkowymi nukleotydarni charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydarni komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Pwo na N-końcu;
- matrycę do reakcji PCR stanowi wyizolowane genomowe DNA,
- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.
Sposób, gdzie produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:
- Trawienie plazmidu pET30EKLIC
- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i Ndel (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,
- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,
- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;
- Reakcja składania genów,
- reakcja Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,
- po reakcji mieszanina dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,
- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr./min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.
Sposób, gdzie w celu uzyskania białka fuzyjnego Pwo-Neq SSB, komórki E. coli BL RIL poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-Pwo-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5 h, po czym wiruje się (10 min, 5000 obr./min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.
PL 241 698 B1
Przedmiotem wynalazku jest również wyizolowany plazmid rekombinantowy, który obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę Pwo- NeqSSB od 5076 do 8168 z plazmidu pET30EKLIC o SEQ. ID. 5.
Wyizolowany plazmid pET30-Pwo-NeqSSB o sekwencji SEQ.ID.5.
Przedmiotem wynalazku są również startery do klonowania polimerazy Pwo-NeqSSB o sekwencjach SEQ.ID. 6.-9.
Przedmiotem wynalazku jest polimeraza Pwo-NeqSSB o SEQ. ID 1 do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.
Opis rysunków (figur) i sekwencji:
Rys. 1 - przedstawia strukturę czwartorzędową polimerazy DNA Pwo, która składa się z domeny egzonukleazy (kolor niebieski), domeny N-końcowej (kolor fioletowy) oraz trzech subdomen: śródręcza (kolor pomarańczowy), palców (kolor zielony), kciuka (kolor czerwony).
Rys. 2 - schematyczne przedstawienie podstawowych domen występujących w białku NeqSSB Rys. 3 - przedstawia schemat klonowania metodą Gibsona.
Rys. 4 - przedstawia rozdział elektroforetyczny produktów po reakcji PCR.
A - rozdział produktów po pierwszej reakcji PCR pozwalający na otrzymanie produktu o wielkości 762 pz.
B - rozdział produktów po drugiej reakcji PCR pozwalający na otrzymanie produktu o wielkości 2372 pz. M - marker DNA HyperLadder II, 1-4 oczekiwany produkt PCR.
Rys. 5 - przedstawia rozdział elektroforetyczny plazmidu pD454-SR po reakcji trawienia. M - marker DNA SM0311 (ThermoScientific), 1 - pET30EKLIC nietrawiony,
- pET30EKLIC po reakcji trawienia
Rys. 6 - przedstawia rozdział elektroforetyczny przedstawiający wyniki oczyszczania polimerazy DNA Pwo-Neq na kolumnie ze złożem His-Trap
M - Białkowy marker wielkości (14,4-116 kDa) o wielkości białek wzorcowych: 116; 66,2; 45; 35; 25; 18,4; 14,4 kDa;
- Lizat komórkowy E. coli BL RIL/pET30-Pwo-NeqSSB po sonikacji i denaturacji białek gospodarza
- Frakcja po płukaniu buforem B (200 ml)
- Frakcja po elucji buforem C (15 ml)
- Frakcja po drugiej elucji buforem C (15 ml)
Rys. 7 - przedstawia rozdział elektroforetyczny produktów po reakcji PCR z dodatkiem różnego stężenia jonów magnezu. 1-0,5 ul Mg2+ 50 mM, 2-0,75 ul Mg2+ 50 mM, 3-1 ul Mg2+‘ 50 mM, 4-1,25 ul Mg2+ 50 mM, 5-1,5 ul Mg2+ 50 mM, 6-1,75 ul Mg2+ 50 mM, 7-2 ul Mg2+ 50 mM, 8-2,25 ul Mg2+ 50 mM, 9-2,5 ul Mg2+ 50 mM, K- - bez magnezu.
Rys. 8 - przedstawia wykres zależności fluorescencji barwnika SybrGreen w czasie prowadzenia reakcji RT qPCR z zastosowaniem polimerazy Pwo-Neq w reakcji identyfikacji wirusa SARS-CoV-2 na matrycy wyizolowanego RNA wirusowego.
Rys. 9 - przedstawia wykres zależności fluorescencji barwnika SybrGreen w czasie prowadzenia reakcji RT qPCR z zastosowaniem polimerazy Pwo-Neq w reakcji identyfikacji wirusa SARS-CoV-2 bezpośrednio z wymazu.
Rys. 10 -przedstawia wykres zależności fluorescencji barwnika SybrGreen w czasie prowadzenia reakcji RT qPCR z zastosowaniem polimerazy Pwo-Neq w reakcji identyfikacji wirusa SARS-CoV-2 bezpośrednio ze śliny w buforze rozbijającym.
SEQ. ID 1 - przedstawia sekwencję aminokwasową konstruktu polimerazy fuzyjnej PwoNeqSSB, gdzie: Główny rdzeń polimerazy stanowi polimeraza Pwo, która na swoim C-końcu, za pomocą sześcioaminokwasowego łącznika (GSGGVD), połączona zostanie z białkiem NeqSSB (wyizolowanym z Nanoarchaeum equitans). Obecność łącznika zapewnia białku fuzyjnemu pewną elastyczność i stosunkowo swobodne ułożenie się w stosunku do polimerazy, co ma na celu zapobieganie ewentualnej zawadzie sterycznej.
SEQ.ID.2 - przedstawia sekwencję aminokwasową polimerazy Pwo
SEQ.ID.3 - przedstawia sewkencję aminokwasową łącznika/linkera
SEQ.ID.4 - przedstawia sekwencję aminokwasową białka NeqSSB.
PL 241 698 B1
SEQ.ID.5 - przedstawia sekwencję plazmidu z genem kodującym białko Pwo-NeqSSB SEQ.ID.6-9 - przedstawiają sekwencje starterów
Wynalazek ilustrują następujące przykłady wykonania, niestanowiące jego ograniczenia Przykład 1
I. Gen kodujący polimerazę, wektor ekspresyjny, system ekspresyjny
a) Gen kodujący polimerazę Pwo-NeqSSB
Sekwencję aminokwasową polimerazy Pwo-NeqSSB wydłużono o sekwencję domeny histydynowej niezbędnej do efektywnego oczyszczania polimerazy metodą metalopowinowactwa. Domena 6xHis przyłączona została na C-końcu polimerazy. Sekwencja nukleotydowa polimerazy została przedstawiona na SEQ ID 1.
b) Wektor ekspresyjny
Przy wyborze wektora do ekspresji enzymu kierowano się możliwością:
- selekcji antybiotykowej klonów
- przeprowadzenia klonowania i jego namnożenia w komórkach bakteryjnych - obecność promotora umożliwiającego łatwy sposób kontroli i indukcji ekspresji Wybrano wektor pET30EKLIC niosący gen oporności na kanamycynę, bakteryjne Ori replikacji oraz sekwencję promotora laktozowego T7 pozwalającą na indukcję ekspresji za pomocą IPTG. Wektor posiada miejsca rozpoznania dla enzymów restrykcyjnych BamHI i Ndel, które tną DNA plazmidowe w dwóch miejscach dając dwa niekomplementarne lepkie końce niezbędne na etapie klonowania c) System ekspresyjny
Do ekspresji termostabilnej polimerazy fuzyjnej Pwo-NeqSSB wybrano system prokariotyczny - E. coli, który jest najczęściej stosowanym układem do nadprodukcji białek zarówno na skalę laboratoryjną jak i przemysłową. Wytypowano szczepy IP-Free dostępne przez firmę Promega: Escherichia coli BL21(DE3)pLysS.
d) Zaprojektowanie starterów SEQ.ID 6
Polimeraz typu Phusion składa się z dwóch białek, które kodowane są przez dwa niezależne geny. Wymusza to zastosowanie metody klonowania, która umożliwi wklonowanie kilku fragmentów DNA jednocześnie. Zdecydowano skorzystać z metody Gibsona, która w jednej reakcji umożliwia wygenerowanie lepkich końców (egzonukleaza 5’^-3’), wydłużanie końców DNA (polimeraz DNA) oraz kowalencyjne połączenie dwóch końców DNA (ligaza DNA) kilku fragmentów jednocześnie. Zastosowano zestaw OverLap firmy A&A Biotechnology. Schemat klonowania przedstawia rysunek 3.
Przykład 2
II. Klonowanie polimerazy Pwo-Neq SSB
a) Amplifikacja produktów przeznaczonych do klonowania
Otrzymanie DNA insertu przeznaczonego do klonowania polegało na przeprowadzeniu dwóch niezależnych reakcji PCR. Pierwsza z reakcji amplifikacji pozwoliła na otrzymanie produktu o sekwencji nukleotydowej odpowiadającej sekwencji polimerazy DNA z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu. Drugi produkt zawierał sekwencję nukleotydową białka wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Pwo na N-końcu. Matrycę do reakcji PCR stanowiło wyizolowane genomowe DNA. Otrzymane produkty w dwóch powyższych reakcjach rozdzielono w żelu agarozowym z bromkiem etydyny i poddano izolacji z żelu z wykorzystaniem zestawu Gel-Out Concentrator (A&A Biotechnology). Wynik otrzymanych produktów po reakcji PCR przedstawia rysunek 4.
Produkty tych dwóch reakcji PCR posłużyły, jako inserty w reakcji Gibsona z wykorzystaniem zestawu OverLap Assembly mix (A&A Biotechnology).
b) Trawienie plazmidu pET30EKLIC
W celu zlinearyzowania plazmidu pET30EKLIC poddano go trawieniu enzymem BamHI i Ndel (NEB), który tnie w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA. Reakcja trawienia DNA wektora prowadzona była przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu zalecanych przez producenta.
PL 241 698 Β1
Potrawiony plazmid poddano rozdziałowi elektroforetycznemu i wyizolowano zestawem Gel-Out Concentrator (A&A Biotechnology). Wynik trawienia przedstawia rysunek 5.
c) Reakcja składania genów
Reakcja Gibsona z wykorzystaniem zestawu OverLap Assembly mix prowadzona była w termocyklerze w 50°C przez 60 min. Skład mieszaniny znajduje się poniżej :
| Składnik | Ilość [ml] | |
| Bufor ‘ 5'-OvcrLap | .. Assembly | (A&A A - ~ - * |
| Biotechnology) | i u | |
| Nukleotydy [10 mM] | 2 | |
| Enzymy OvcrLap | Assembly | . (A&A 2 “ ' |
| Biotechnology) ~ ; | ||
| Woda jałowa | 3 ~~ | |
| ί Insert, I'[ 150ng/ml] | \ 3:.' - A ’ | |
| Insert II [150ng/ml] | 3 - ....... | |
| [ Wektor [150ng/ml] | 3 | |
| Objętość końcowa | 20 |
Po reakcji mieszanina dodawana była do świeżo przygotowanych komórek kompetentnych E. coli TOP 10.
d) Transformacja komórek kompetentnych
Mieszaninę po reakcji Gibsona dodano do 100 ml komórek kompetentnych E. coli TOP 10. Otrzymaną mieszaninę inkubowano w lodzie przez 40 min. Po tym czasie inkubacji przeprowadzono szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w term obłoku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie. Po szoku termicznym komórki poddano 60 min inkubacji w 37°C z dodatkiem 600 ml LB. Po tym czasie komórki żwirowano (10 min, 1800 obr./min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny. Płytki inkubowano przez ok. 16 h w 37°C.
Przykład 3
III. Ekspresja i oczyszczanie polimerazy Pwo-Neq SSB
W celu uzyskania białka fuzyjnego Pwo-NeqSSB, komórki E. coli BL RIL poddano transformacji z użyciem DNA plazmidu rekombinantowego pET30-Pwo-NeqSSB i przeprowadzono produkcję pożądanych białek fuzyjnych. Hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzono przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodano IPTG do końcowego stężenia 0,1 mM. Po indukcji hodowle prowadzono jeszcze przez 5 h, po czym żwirowano (10 min, 5000 obr./min) i poddano oczyszczaniu metodą metalopowinowactwa. Rezultaty produkcji białek analizowano za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących (SDS-PAGE) (rysunek 5). Masa molekularna białka obliczona przy pomocy programu komputerowego Expasy wynosiła 118,2 kDa:
Ilość aminokwasów: 1023
Masa molekularna: 118219.00
Teoretyczna wartość pl: 8.46
Wyniki rozdziałów elektroforetycznych przedstawiających stopień oczyszczenia i stężenie białek po każdym etapie oczyszczania przedstawia rysunek 6.
PL 241 698 B1
Przykład 4
IV. Aktywność i zastosowanie polimerazy Pwo-Neq SSB
1) Zastosowanie polimerazy w klasycznej reakcji PCR z detekcja w żelu agarozowym - target fragment plazmidowego DNA pUC19 o wielkości 1200 pz w różnym stężeniu jonów magnezu, Rys. 7.
2) Zastosowanie polimerazy w reakcji real-time PCR - identyfikacja genu S z wykorzystaniem różnych matryc RNA: totalnego RNA wirusa SARS-CoV-2, bezpośrednio z wymazu zainfekowanego wirusem oraz śliny z wirusem SARS- CoV-2.(Rys. 8-10).
Literatura:
[1] Vieille C, Burdette DS, Zeikus JG. Thermozymes. Biotechnol Annu Rev. 1996;2:1-83.
[2] Hamilton SC, Farchaus JW, Davis MC. DNA polymerases as engines for biotechnology. Biotechniques. 2001;31(2):370-6, 378-80, 382-3.
[3] Kim SW, Kim DU, Kim JK, Kang LW, Cho HS. Crystal structure of Pfu, the high fidelity DNA polymerase from Pyrococcus furiosus. Int J Biol Macromol. 2008;42(4):356-61.
[4] Takagi M, Nishioka M, Kakihara H, Kitabayashi M, Inoue H, Kawakami B, Oka M, Imanaka T. Characterization of DNA polymerase from Pyrococcus sp. strain KOD1 and its application to PCR. Appl Environ Microbiol. 1997;63(11):4504-10.
[5] Olszewski M, Balsewicz J, Nowak M, Maciejewska N, Cyranka-Czaja A, Zalewska-Piątek B, et al. Characterization of a Single-Stranded DNA-Binding-Like Protein from Nanoarchaeum equitans - Nucleic Acid Binding Protein with Broad Substrate Specificity. PLoS One. 2015; 10:e0126563.
[6] DNA Modifying enzymes.; Avaliable from:
https:/www.neb.com/~/media/Catalog/All-Products/0AA961B29E444AFBEDD5C4A904C76E6/Datacards or Manusals/ManualE2611 .pdf
PL 241 698 Β1
IBiMM _seq_P.436784
SEQUENCE LISTING <110> Instytut Biotechnologii i Medycyny Molekularnej <120> Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy.
< 150> PLP.436784 <151> 2021-01-27 < 160> 9 < 170> BiSSAP 1.3.6 < 210> 1 < 211> 1023 < 212> PRT < 213> Artificial Sequence
| <220> <223> fusior | i 2 f | iroteins |
| <400> 1 Met Ile Leu | Asp | Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile |
| 1 Arg Leu Phe | Lys | 5 10 15 Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg |
| Thr Phe Arg | 20 Pro | 25 30 Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile |
| 35 Glu Glu Val | Lys | 40 45 Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg |
| 50 Ile Val Asp | Val | 55 60 Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile |
| 65 Thr Val Trp | Lys | 70 75 80 Leu Tyr Leu Glu His Pro Gin Asp Val Pro Thr Ile |
| Arg Glu Lys | Val | 85 90 95 Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr |
| Asp Ile Pro | 100 Phe | 105 110 Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro |
| 115 Met Glu Gly | Glu | 120 125 Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr |
| 130 Leu Tyr His | Glu | 135 140 Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile |
| 145 Ser Tyr Ala | Asp | 150 155 160 Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile |
| Asp Leu Pro | Tyr | 165 170 175 Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys |
| Arg Phe Leu | 180 Arg | 185 190 Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr |
| 195 Tyr Asn Gly | Asp | 200 205 Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu |
| 210 | 215 220 |
PL 241 698 Β1
IBiMM _seq_P.436784
Lys Leu Gly Ile 225
Met Gin Arg Ile
His Phe Asp Leu 26Θ
Tyr Thr Leu Glu 275
Lys Val Tyr Ala 290
Leu Glu Arg Val 3Θ5
Glu Leu Gly Lys
Val Gly Gin Pro 340
Val Glu Trp Phe 355
Pro Asn Lys Pro 370
Tyr Thr Gly Gly 385
Ile Val Tyr Leu
His Asn Val Ser 420
Asp Ile Ala Pro 435
Phe Ile Pro Ser 450
Lys Thr Lys Met 465
Asp Tyr Arg Gin
Tyr Tyr Gly Tyr 500
Ser Val Thr Ala 515
Leu Glu Glu Lys
S30
Leu Tyr Ala Thr 545
Ala Leu Glu Phe
Glu Leu Glu Tyr
580
Lys Arg Tyr Ala 595
Leu Glu Ile Val
610
Ala Arg Val Leu 625
Lys Leu Thr Ile Gly 230
Gly Asp Met Thr Ala 245
Tyr His Val Ile Thr
265
Ala Val Tyr Glu Ala 280
Asp Glu Ile Ala Lys 295
Ala Lys Tyr Ser Met 310
Glu Phe Leu Pro Met 325
Leu Trp Asp Val Ser 345
Leu Leu Arg Lys Ala 360
Ser Glu Glu Glu Tyr 375
Phe Val Lys Glu Pro 390
Asp Phe Arg Ala Leu 405
Pro Asp Thr Leu Asn
425
Gin Val Gly His Lys 440
Leu Leu Gly His Leu 455
Lys Glu Thr Gin Asp 470
Lys Ala Ile Lys Leu 485
Ala Lys Ala Arg Trp
505
Trp Gly Arg Lys Tyr 520
Phe Gly Phe Lys Val 535
Ile Pro Gly Gly Glu 550
Val Lys Tyr Ile Asn 565
Glu Gly Phe Tyr Lys
585
Val Ile Asp Glu Glu 600
Arg Arg Asp Trp Ser 615
Glu Thr Ile Leu Lys
630
Arg Asp Gly Ser Glu 235
Val Glu Val Lys Gly 250
Arg Thr Ile Asn Leu
270
Ile Phe Gly Lys Pro 285
Ala Trp Glu Ser Gly 300
Glu Asp Ala Lys Ala 315
Glu Ile Gin Leu Ser 330
Arg Ser Ser Thr Gly 350
Tyr Glu Arg Asn Glu 365
Gin Arg Arg Leu Arg 380
Glu Lys Gly Leu Trp 395
Tyr Pro Ser Ile Ile 410
Leu Glu Gly Cys Lys
430
Phe Cys Lys Asp Ile 445
Leu Glu Glu Arg Gin 46Θ
Pro Ile Glu Lys Ile 475
Leu Ala Asn Ser Phe 490
Tyr Cys Lys Glu Cys
510
Ile Glu Leu Val Trp 525
Leu Tyr Ile Asp Thr 540
Ser Glu Glu Ile Lys 555
Ser Lys Leu Pro Gly 570
Arg Gly Phe Phe Val
590
Gly Lys Val Ile Thr 605
Glu Ile Ala Lys Glu 620
His Gly Asp Val Glu 635
Pro Lys 240
Arg Ile 255 Pro Thr
Lys Glu
Glu Asn
Thr Tyr 320
Arg Leu 335 Asn Leu
Val Ala
Glu Ser
Glu Asn 400 Ile Thr 415 Asn Tyr
Pro Gly
Lys Ile
Leu Leu 480 Tyr Gly 495 Ala Glu
Lys Glu
Asp Gly
Lys Lys 560
Leu Leu 575 Thr Lys
Arg Gly
Thr Gin
Glu Ala 640
PL 241 698 Β1
IBiMM _seq_P.436784
| Val | Arg | Ile Val | Lys 645 | Glu | Val | Ile Gin Lys 650 | Leu Ala Asn Tyr | Glu 655 | He | ||||||
| Pro | Pro | Glu | Lys 660 | Leu | Ala | Ile | Tyr | Glu 665 | Gin | Ile | Thr | Arg | Pro 670 | Leu | His |
| Glu | Tyr | Lys 675 | Ala | Ile | Gly | Pro | His 680 | Val | Ala | Val | Ala | Lys 685 | Lys | Leu | Ala |
| Ala | Lys 690 | Gly | Val | Lys | Ile | Lys 695 | Pro | Gly | Met | Val | Ile 70Θ | Gly | Tyr | Ile | val |
| Leu 705 | Arg | Gly | Asp | Gly | Pro 710 | Ile | Ser | Asn | Arg | Ala 715 | Ile | Leu | Ala | Glu | Glu 720 |
| Tyr | Asp | Pro | Lys | Lys 725 | His | Lys | Tyr | Asp | Ala 730 | Glu | Tyr | Tyr | Ile | Glu 735 | Asn |
| Gin | Val | Leu | Pro 740 | Ala | Val | Leu | Arg | Ile 745 | Leu | Glu | Gly | Phe | Gly 750 | Tyr | Arg |
| Lys | Glu | Asp 755 | Leu | Arg | Tyr | Gin | Lys 760 | Thr | Arg | Gin | Val | Gly 765 | Leu | Thr | Ser |
| Trp | Leu 770 | Asn | Ile | Lys | Lys | Ser 775 | Gly | Ser | Gly | Gly | Val 780 | Asp | Asp | Glu | Glu |
| Glu 785 | Leu | Ile | Gin | Leu | Ile 790 | Ile | Glu | Lys | Thr | Gly 795 | Lys | Ser | Arg | Glu | Glu 800 |
| Ile | Glu | Lys | Met | Val 805 | Glu | Glu | Lys | Ile | Lys 810 | Ala | Phe | Asn | Asn | Leu 815 | Ile |
| Ser | Arg | Arg | Gly 820 | Ala | Leu | Leu | Leu | Val 825 | Ala | Lys | Lys | Leu | Gly 830 | Val | Leu |
| Tyr | Lys | Asn 835 | Thr | Pro | Lys | Glu | Lys 840 | Lys | Ile | Gly | Glu | Leu 845 | Glu | Ser | Trp |
| Glu | Tyr 850 | Val | Lys | Val | Lys | Gly 855 | Lys | Ile | Leu | Lys | Ser 860 | Phe | Gly | Leu | Ile |
| Ser 865 | Tyr | Ser | Lys | Gly | Lys 870 | Phe | Gin | Pro | Ile | Ile 875 | Leu | Gly | Asp | Glu | Thr 880 |
| Gly | Thr | Ile | Lys | Ala 885 | Ile | Ile | Trp | Asn | Thr 890 | Asp | Lys | Glu | Leu | Pro 895 | Glu |
| Asn | Thr | Val | Ile 900 | Glu | Ala | Ile | Gly | Lys 905 | Thr | Lys | Ile | Asn | Lys 910 | Lys | Thr |
| Gly | Asn | Leu 915 | Glu | Leu | His | Ile | Asp 920 | Ser | Tyr | Lys | Ile | Leu 925 | Glu | Ser | Asp |
| Leu | Glu 930 | Ile | Lys | Pro | Gin | Lys 935 | Gin | Glu | Phe | Val | Gly 940 | Ile | Cys | Ile | Val |
| Lys 945 | Tyr | Pro | Lys | Lys | Gin 950 | Thr | Gin | Lys | Gly | Thr | Ile | Val | Ser | Lys | Ala 960 |
| Ile | Leu | Thr | Ser | Leu 965 | Asp | Arg | Glu | Leu | Pro 970 | Val | Val | Tyr | Phe | Asn 975 | Asp |
| Phe | Asp | Trp | Glu 980 | Ile | Gly | His | Ile | Tyr 985 | Lys | Val | Tyr | Gly | Lys 990 | Leu | Lys |
| Lys | Asn | Ile 995 | Lys | Thr | Gly | Lys | He 1000 | Glu | Phe | Phe | Ala | Asp 1005 | Lys | Val | Glu |
| Glu | Ala 1010 | Thr | Leu | Lys | Asp | Leu 1015 | Lys | Ala | Phe | Lys | Gly 1020 | Glu | Ala | Asp |
<210> 2 <211> 775 <212> PRT
PL 241 698 Β1 <213> Pyrococcus furiosus
IBiMM _seq_P.436784 <400> 2
Met Ile Leu Asp Val Asp Tyr Ile 15
Arg Leu Phe Lys Lys Glu Asn Gly 20
Thr Phe Arg Pro Tyr Ile Tyr Ala
3540
Glu Glu Val Lys Lys Ile Thr Gly 5055
Ile Val Asp Val Glu Lys Val Glu 6570
Thr Val Trp Lys Leu Tyr Leu Glu 85
Arg Glu Lys Val Arg Glu His Pro 100
Asp Ile Pro Phe Ala Lys Arg Tyr
115120
Met Glu Gly Glu Glu Glu Leu Lys 130135
Leu Tyr His Glu Gly Glu Glu Phe
14515Θ
Ser Tyr Ala Asp Glu Asn Glu Ala 165
Asp Leu Pro Tyr Val Glu Val Val 180
Arg Phe Leu Arg Ile Ile Arg Glu
195200
Tyr Asn Gly Asp Ser Phe Asp Phe 210215
Lys Leu Gly Ile Lys Leu Thr Ile 225230
Met Gin Arg Ile Gly Asp Met Thr 245
His Phe Asp Leu Tyr His Val Ile 26Θ
Tyr Thr Leu Glu Ala Val Tyr Glu
275280
Lys Val Tyr Ala Asp Glu Ile Ala 290295
Leu Glu Arg Val Ala Lys Tyr Ser
305310
Glu Leu Gly Lys Glu Phe Leu Pro 325
Val Gly Gin Pro Leu Trp Asp Val 340
Val Glu Trp Phe Leu Leu Arg Lys
355360
Pro Asn Lys Pro Ser Glu Glu Glu
370375
Thr Glu Glu Gly Lys Pro Val Ile 1015
Lys Phe Lys Ile Glu His Asp Arg 2530
Leu Leu Arg Asp Asp Ser Lys Ile 45
Glu Arg His Gly Lys Ile Val Arg 60
Lys Lys Phe Leu Gly Lys Pro Ile 7580
His Pro Gin Asp Val Pro Thr Ile 9095
Ala Val Val Asp Ile Phe Glu Tyr 105110
Leu Ile Asp Lys Gly Leu Ile Pro 125
Ile Leu Ala Phe Asp Ile Glu Thr 140
Gly Lys Gly Pro ile Ile Met Ile 155160
Lys Val Ile Thr Trp Lys Asn Ile 170175
Ser Ser Glu Arg Glu Met Ile Lys 185190
Lys Asp Pro Asp Ile Ile Val Thr 205
Pro Tyr Leu Ala Lys Arg Ala Glu 220
Gly Arg Asp Gly Ser Glu Pro Lys 235240
Ala Val Glu Val Lys Gly Arg Ile 250255
Thr Arg Thr Ile Asn Leu Pro Thr 26527Θ
Ala Ile Phe Gly Lys Pro Lys Glu 285
Lys Ala Trp Glu Ser Gly Glu Asn 300
Met Glu Asp Ala Lys Ala Thr Tyr 315320
Met Glu Ile Gin Leu Ser Arg Leu 330335
Ser Arg Ser Ser Thr Gly Asn Leu 345350
Ala Tyr Glu Arg Asn Glu Val Ala 365
Tyr Gin Arg Arg Leu Arg Glu Ser 380
PL 241 698 Β1
IBiMM _seq_P.436784
| Tyr Thr | Gly | Gly | Phe Val Lys | Glu Pro Glu | Lys | Gly | Leu | Trp | Glu | Asn |
| 385 Ile Val | Tyr | Leu | 390 Asp Phe Arg | Ala Leu Tyr | 395 Pro | Ser | Ile | Ile | Ile | 400 Thr |
| His Asn | Val | Ser | 405 Pro Asp Thr | 410 Leu Asn Leu | Glu | Gly | Cys | Lys | 415 Asn | Tyr |
| Asp Ile | Ala | 420 Pro | Gin Val Gly | 425 His Lys Phe | Cys | Lys | Asp | 430 Ile | Pro | Gly |
| Phe Ile | 435 Pro | Ser | Leu Leu Gly | 440 His Leu Leu | Glu | Glu | 445 Arg | Gin | Lys | Ile |
| 450 Lys Thr | Lys | Met | 455 Lys Glu Thr | Gin Asp Pro | Ile | 460 Glu | Lys | Ile | Leu | Leu |
| 465 Asp Tyr | Arg | Gin | 470 Lys Ala Ile | Lys Leu Leu | 475 Ala | Asn | Ser | Phe | Tyr | 480 Gly |
| Tyr Tyr | Gly | Tyr | 485 Ala Lys Ala | 490 Arg Trp Tyr | Cys | Lys | Glu | Cys | 495 Ala | Glu |
| Ser Val | Thr | 500 Ala | Trp Gly Arg | 505 Lys Tyr Ile | Glu | Leu | Val | 510 Trp | Lys | Glu |
| Leu Glu | 515 Glu | Lys | Phe Gly Phe | 520 Lys Val Leu | Tyr | Ile | 525 Asp | Thr | Asp | Gly |
| 530 Leu Tyr | Ala | Thr | 535 Ile Pro Gly | Gly Glu Ser | Glu | 540 Glu | Ile | Lys | Lys | Lys |
| 545 Ala Leu | Glu | Phe | 550 Val Lys Tyr | Ile Asn Ser | 555 Lys | Leu | Pro | Gly | Leu | 560 Leu |
| Glu Leu | Glu | Tyr | 565 Glu Gly Phe | 570 Tyr Lys Arg | Gly | Phe | Phe | Val | 575 Thr | Lys |
| Lys Arg | Tyr | 580 Ala | Val Ile Asp | 585 Glu Glu Gly | Lys | Val | Ile | 590 Thr | Arg | Gly |
| Leu Glu | 595 Ile | val | Arg Arg Asp | 600 Trp Ser Glu | Ile | Ala | 605 Lys | Glu | Thr | Gin |
| 610 Ala Arg | Val | Leu | 615 Glu Thr Ile | Leu Lys His | Gly | 620 Asp | Val | Glu | Glu | Ala |
| 625 Val Arg | Ile | Val | 630 Lys Glu Val | Ile Gin Lys | 635 Leu | Ala | Asn | Tyr | Glu | 640 Ile |
| Pro Pro | Glu | Lys | 645 Leu Ala Ile | 650 Tyr Glu Gin | Ile | Thr | Arg | Pro | 655 Leu | His |
| Glu Tyr | Lys | 660 Ala | Ile Gly Pro | 665 His Val Ala | Val | Ala | Lys | 670 Lys | Leu | Ala |
| Ala Lys | 675 Gly | Val | Lys Ile Lys | 680 Pro Gly Met | Val | Ile | 685 Gly | Tyr | Ile | Val |
| 690 Leu Arg | Gly | Asp | 695 Gly Pro Ile | Ser Asn Arg | Ala | 70Θ Ile | Leu | Ala | Glu | Glu |
| 705 Tyr Asp | Pro | Lys | 710 Lys His Lys | Tyr Asp Ala | 715 Glu | Tyr | Tyr | Ile | Glu | 720 Asn |
| Gin Val | Leu | Pro | 725 Ala Val Leu | 730 Arg Ile Leu | Glu | Gly | Phe | Gly | 735 Tyr | Arg |
| Lys Glu | Asp | 740 Leu | Arg Tyr Gin | 745 Lys Thr Arg | Gin | Val | Gly | 750 Leu | Thr | Ser |
| Trp Leu 770 | 755 Asn | Ile | Lys Lys Ser 775 | 760 | 765 |
<210> 3
PL 241 698 Β1
IBiMM _seq_P.436784 <211> 6 <212> PRT <213> Artificial Sequence <220>
<223> Linker <400> 3
Gly Ser Gly Gly Val Asp 1 5 <210> 4 <211> 242 <212> PRT <213> Bacteria <prokaryote>
<400> 4
Asp Glu Glu 1
Arg Glu Glu
Asn Leu Ile
Gly Val Leu 50
Glu Ser Trp 65
Gly Leu ile
Asp Glu Thr
Leu Pro Glu
115
Lys Lys Thr 130
Glu Ser Asp 145
Cys Ile Val
Ser Lys Ala
Phe Asn Asp 195
Lys Leu Lys 21Θ
Lys Val Glu 225 Ala Asp
| Glu Leu ile | Gin | Leu | Ile | Ile 10 | |
| 5 | |||||
| Ile 20 | Glu Lys | Met | Val | Glu 25 | Glu |
| Ser | Arg Arg | Gly | Ala 40 | Leu | Leu |
| Tyr | Lys Asn | Thr 55 | Pro | Lys | Glu |
| Glu | Tyr Val 70 | Lys | Val | Lys | Gly |
| Ser | Tyr Ser 85 | Lys | Gly | Lys | Phe 90 |
| Gly 100 | Thr Ile | Lys | Ala | Ile 105 | Ile |
| Asn | Thr Val | Ile | Glu 120 | Ala | Ile |
| Gly | Asn Leu | Glu 135 | Leu | His | Ile |
| Leu | Glu Ile 150 | Lys | Pro | Gin | Lys |
| Lys | Tyr Pro 165 | Lys | Lys | Gin | Thr 170 |
| Ile 180 | Leu Thr | Ser | Leu | ASp 185 | Arg |
| Phe | Asp Trp | Glu | Ile 200 | Gly | His |
| Lys | Asn Ile | Lys 215 | Thr | Gly | Lys |
| Glu | Ala Thr 230 | Leu | Lys | Asp | Leu |
| Glu | Lys | Thr | Gly | Lys 15 | Ser |
| Lys | Ile | Lys | Ala 30 | Phe | Asn |
| Leu | Val | Ala 45 | Lys | Lys | Leu |
| Lys | Lys 60 | Ile | Gly | Glu | Leu |
| Lys 75 | Ile | Leu | Lys | Ser | Phe 80 |
| Gin | Pro | Ile | Ile | Leu 95 | Gly |
| Trp | Asn | Thr | Asp 110 | Lys | Glu |
| Gly | Lys | Thr 125 | Lys | Ile | Asn |
| Asp | Ser 140 | Tyr | Lys | Ile | Leu |
| Gin 155 | Glu | Phe | Val | Gly | Ile 160 |
| Gin | Lys | Gly | Thr | Ile 175 | Val |
| Glu | Leu | Pro | Val 190 | Val | Tyr |
| Ile | Tyr | Lys 205 | Val | Tyr | Gly |
| Ile | Glu 220 | Phe | Phe | Ala | Asp |
| Lys 235 | Ala | Phe | Lys | Gly | Glu 240 |
PL 241 698 Β1
IBiMM _seq_P.436784 <210> 5 <211> 8371 < 212> DNA < 213> Artificial Sequence <220>
< 223> Recombinant plasmide pET30 EKLIC < 400> 5 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg60 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc120 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg180 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc240 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt300 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc360 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta420 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt480 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta540 tccgctcatg aattaattct tagaaaaact catcgagcat caaatgaaac tgcaatttat600 tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat gaaggagaaa660 actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg attccgactc720 gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta tcaagtgaga780 aatcaccatg agtgacgact gaatccggtg agaatggcaa aagtttatgc atttctttcc840 agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca tcaaccaaac900 cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac960 aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca tcaacaatat1020 tttcacctga atcaggatat tcttctaata cctggaatgc tgttttcccg gggatcgcag1080 tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc ggaagaggca1140 taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg gcaacgctac1200 ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat cgatagattg1260
PL 241 698 Β1
IBiMM _seq_P.436784 tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa tcagcatcca 1320 tgttggaatt taatcgcggc ctagagcaag acgtttcccg ttgaatatgg ctcataacac 1380 cccttgtatt actgtttatg taagcagaca gttttattgt tcatgaccaa aatcccttaa 1440 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 1500 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 1560 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 1620 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 1680 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 1740 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 1800 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 1860 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 1920 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 1980 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2040 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2100 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 2160 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 2220 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 2280 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatatggtgc actctcagta 2340 caatctgctc tgatgccgca tagttaagcc agtatacact ccgctatcgc tacgtgactg 2400 ggtcatggct gcgccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct 2460 gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag 2520 gttttcaccg tcatcaccga aacgcgcgag gcagctgcgg taaagctcat cagcgtggtc 2580 gtgaagcgat tcacagatgt ctgcctgttc atccgcgtcc agctcgttga gtttctccag 2640 aagcgttaat gtctggcttc tgataaagcg ggccatgtta agggcggttt tttcctgttt 2700 ggtcactgat gcctccgtgt aagggggatt tctgttcatg ggggtaatga taccgatgaa 2760 acgagagagg atgctcacga tacgggttac tgatgatgaa catgcccggt tactggaacg 2820
PL 241 698 Β1
IBiMM _seq_P.436784
| ttgtgagggt | aaacaactgg | cggtatggat | gcggcgggac | cagagaaaaa | tcactcaggg | 2880 |
| tcaatgccag | cgcttcgtta | atacagatgt | aggtgttcca | cagggtagcc | agcagcatcc | 2940 |
| tgcgatgcag | atccggaaca | taatggtgca | gggcgctgac | ttccgcgttt | ccagacttta | 3000 |
| cgaaacacgg | aaaccgaaga | ccattcatgt | tgttgctcag | gtcgcagacg | ttttgcagca | 3060 |
| gcagtcgctt | cacgttcgct | cgcgtatcgg | tgattcattc | tgctaaccag | taaggcaacc | 3120 |
| ccgccagcct | agccgggtcc | tcaacgacag | gagcacgatc | atgcgcaccc | gtggggccgc | 3180 |
| catgccggcg | ataatggcct | gcttctcgcc | gaaacgtttg | gtggcgggac | cagtgacgaa | 3240 |
| ggcttgagcg | agggcgtgca | agattccgaa | taccgcaagc | gacaggccga | tcatcgtcgc | 3300 |
| gctccagcga | aagcggtcct | cgccgaaaat | gacccagagc | gctgccggca | cctgtcctac | 3360 |
| gagttgcatg | ataaagaaga | cagtcataag | tgcggcgacg | atagtcatgc | cccgcgccca | 3420 |
| ccggaaggag | ctgactgggt | tgaaggctct | caagggcatc | ggtcgagatc | ccggtgccta | 3480 |
| atgagtgagc | taacttacat | taattgcgtt | gcgctcactg | cccgctttcc | agtcgggaaa | 3540 |
| cctgtcgtgc | cagctgcatt | aatgaatcgg | ccaacgcgcg | gggagaggcg | gtttgcgtat | 3600 |
| tgggcgccag | ggtggttttt | cttttcacca | gtgagacggg | caacagctga | ttgcccttca | 3660 |
| ccgcctggcc | ctgagagagt | tgcagcaagc | ggtccacgct | ggtttgcccc | agcaggcgaa | 3720 |
| aatcctgttt | gatggtggtt | aacggcggga | tataacatga | gctgtcttcg | gtatcgtcgt | 3780 |
| atcccactac | cgagatgtcc | gcaccaacgc | gcagcccgga | ctcggtaatg | gcgcgcattg | 3840 |
| cgcccagcgc | catctgatcg | ttggcaacca | gcatcgcagt | gggaacgatg | ccctcattca | 3900 |
| gcatttgcat | ggtttgttga | aaaccggaca | tggcactcca | gtcgccttcc | cgttccgcta | 3960 |
| tcggctgaat | ttgattgcga | gtgagatatt | tatgccagcc | agccagacgc | agacgcgccg | 4020 |
| agacagaact | taatgggccc | gctaacagcg | cgatttgctg | gtgacccaat | gcgaccagat | 4080 |
| gctccacgcc | cagtcgcgta | ccgtcttcat | gggagaaaat | aatactgttg | atgggtgtct | 4140 |
| ggtcagagac | atcaagaaat | aacgccggaa | cattagtgca | ggcagcttcc | acagcaatgg | 4200 |
| catcctggtc | atccagcgga | tagttaatga | tcagcccact | gacgcgttgc | gcgagaagat | 4260 |
| tgtgcaccgc | cgctttacag | gcttcgacgc | cgcttcgttc | taccatcgac | accaccacgc | 4320 |
| tggcacccag | ttgatcggcg | cgagatttaa | tcgccgcgac | aatttgcgac | ggcgcgtgca | 4380 |
PL 241 698 Β1
IBiMM _seq_P.436784 gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 4440 ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 4500 tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 4560 catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 4620 cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtccggga 4680 tctcgacgct ctcccttatg cgactcctgc attaggaagc agcccagtag taggttgagg 4740 ccgttgagca ccgccgccgc aaggaatggt gcatgcaagg agatggcgcc caacagtccc 4800 ccggccacgg ggcctgccac catacccacg ccgaaacaag cgctcatgag cccgaagtgg 4860 cgagcccgat cttccccatc ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg 4920 gcgccggtga tgccggccac gatgcgtccg gcgtagagga tcgagatcga tctcgatccc 4980 gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 5040 ataattttgt ttaactttaa gaaggagata tacatatgat tttagatgtg gattacataa 5100 ctgaagaagg aaaacctgtt attaggctat tcaaaaaaga gaacggaaaa tttaagatag 5160 agcatgatag aacttttaga ccatacattt acgctcttct cagggatgat tcaaagattg 5220 aagaagttaa gaaaataacg ggggaaaggc atggaaagat tgtgagaatt gttgatgtag 5280 agaaggttga gaaaaagttt ctcggcaagc ctattaccgt gtggaaactt tatttggaac 5340 atccccaaga tgttcccact attagagaaa aagttagaga acatccagca gttgtggaca 54Θ0 tcttcgaata cgatattcca tttgcaaaga gatacctcat cgacaaaggc ctaataccaa 5460 tggaggggga agaagagcta aagattcttg ccttcgatat agaaaccctc tatcacgaag 5520 gagaagagtt tggaaaaggc ccaattataa tgattagtta tgcagatgaa aatgaagcaa 5580 aggtgattac ttggaaaaac atagatcttc catacgttga ggttgtatca agcgagagag 5640 agatgataaa gagatttctc aggattatca gggagaagga tcctgacatt atagttactt 5700 ataatggaga ctcattcgac ttcccatatt tagcgaaaag ggcagaaaaa cttgggatta 5760 aattaaccat tggaagagat ggaagcgagc ccaagatgca gagaataggc gatatgacgg 5820 ctgtagaagt caagggaaga atacatttcg acttgtatca tgtaataaca aggacaataa 5880 atctcccaac atacacacta gaggctgtat atgaagcaat ttttggaaag ccaaaggaga 5940
PL 241 698 Β1
IBiMM _seq_P.436784 aggtatacgc cgacgagata gcaaaagcct gggaaagtgg agagaacctt gagagagttg 6000 ccaaatactc gatggaagat gcaaaggcaa cttatgaact cgggaaagaa ttccttccaa 6060 tggaaattca gctttcaaga ttagttggac aacctttatg ggatgtttca aggtcaagca 6120 cagggaacct tgtagagtgg ttcttactta ggaaagccta cgaaagaaac gaagtagctc 6180 caaacaagcc aagtgaagag gagtatcaaa gaaggctcag ggagagctac acaggtggat 6240 tcgttaaaga gccagaaaag gggttgtggg aaaacatagt atacctagat tttagagccc 6300 tatatccctc gattataatt acccacaatg tttctcccga tactctaaat cttgagggat 6360 gcaagaacta tgatatcgct cctcaagtag gccacaagtt ctgcaaggac atccctggtt 6420 ttataccaag tctcttggga catttgttag aggaaagaca aaagattaag acaaaaatga 6480 aggaaactca agatcctata gaaaaaatac tccttgacta tagacaaaaa gcgataaaac 6540 tcttagcaaa ttctttctac ggatattatg gctatgcaaa agcaagatgg tactgtaagg 6600 agtgtgctga gagcgttact gcctggggaa gaaagtacat cgagttagta tggaaggagc 6660 tcgaagaaaa gtttggattt aaagtcctct acattgacac tgatggtctc tatgcaacta 6720 tcccaggagg agaaagtgag gaaataaaga aaaaggctct agaatttgta aaatacataa 6780 attcaaagct ccctggactg ctagagcttg aatatgaagg gttttataag aggggattct 6840 tcgttacgaa gaagaggtat gcagtaatag atgaagaagg aaaagtcatt actcgtggtt 6900 tagagatagt taggagagat tggagtgaaa ttgcaaaaga aactcaagct agagttttgg 6960 agacaatact aaaacacgga gatgttgaag aagctgtgag aatagtaaaa gaagtaatac 7020 aaaagcttgc caattatgaa attccaccag agaagctcgc aatatatgag cagataacaa 7080 gaccattaca tgagtataag gcgataggtc ctcacgtagc tgttgcaaag aaactagctg 7140 ctaaaggagt taaaataaag ccaggaatgg taattggata catagtactt agaggcgatg 7200 gtccaattag caatagggca attctagctg aggaatacga tcccaaaaag cacaagtatg 7260 acgcagaata ttacattgag aaccaggttc ttccagcggt acttaggata ttggagggat 7320 ttggatacag aaaggaagac ctcagatacc aaaagacaag acaagtcggc ctaacttcct 7380 ggcttaacat taaaaaatcc ggaagcggag gggtcgacga tgaagaggaa ctaatacaac 7440 taataataga aaaaactggc aaatctcgag aggaaataga aaaaatggtg gaagaaaaaa 7500
PL 241 698 Β1
IBiMM _seq_P.436784
| ttaaagcttt | taacaattta | atatctcgta | ggggggcttt | actattagta | gcaaaaaaac | 7560 |
| ttggtgtttt | gtataaaaac | actccgaaag | agaaaaaaat | tggcgaatta | gaaagctggg | 7620 |
| aatatgtaaa | agtaaagggc | aaaattctca | aatcttttgg | attaattagt | tattcgaaag | 7680 |
| ggaaattcca | acctattatt | ttaggagacg | aaaccggtac | tattaaagct | attatttgga | 7740 |
| ataccgataa | agaattacct | gaaaacactg | taatagaagc | tattgggaaa | accaaaatta | 7800 |
| ataagaaaac | tggcaattta | gaattacata | tagacagtta | taaaatttta | gaaagcgatt | 7860 |
| tagagataaa | accccaaaag | caagaatttg | ttgggatttg | catagttaaa | tatccaaaaa | 7920 |
| aacaaaccca | aaaaggcaca | atagtatcga | aagcaatttt | aactagctta | gatagggaat | 7980 |
| tgcctgtagt | atatttcaac | gattttgatt | gggaaatagg | ccatatatat | aaagtatatg | 8040 |
| gaaagcttaa | gaaaaacata | aaaactggta | aaatagaatt | tttcgctgac | aaagttgagg | 8100 |
| aagcaacatt | aaaagatcta | aaagctttta | aaggagaggc | cgattgacac | caccaccacc | 8160 |
| accactaggg | atccgaattc | gagctccgtc | gacaagcttg | cggccgcact | cgagcaccac | 8220 |
| caccaccacc | actgagatcc | ggctgctaac | aaagcccgaa | aggaagctga | gttggctgct | 8280 |
| gccaccgctg | agcaataact | agcataaccc | cttggggcct | ctaaacgggt | cttgaggggt | 8340 |
| tttttgctga | aaggaggaac | tatatccgga | t | 8371 |
<210> 6 <211> 57 <212> DNA <213> Artificial Sequence <220>
<223> donic primer <400> 6 aactttaaga aggagatata catatgattt tagatgtgga ttacataact gaagaag 57 <21B> 7 <211> 49 < 212> DNA < 213> Artificial Sequence <220>
< 223> donic primer
PL 241 698 Β1
IBiMM _seq_P.436784 <400> 7 tcgtcgaccc ctccgcttcc ggatttttta atgttaagcc aggaagtta 49 <210> 8 <211> 51 < 212> DNA < 213> Artificial Sequence <220>
< 223> donic primer <400> 8 ccggaagcgg aggggtcgac gatgaagagg aactaataca actaataata g 51 <210> 9 <211> 78 < 212> DNA < 213> Artificial Sequence <220>
< 223> donic primer < 400> 9 gcaagcttgt cgacggagct cgaattcgga tccttagtgg tggtggtggt ggtgtcaatc 60 ggcctctcct ttaaaagc 78
Claims (8)
- Zastrzeżenia patentowe1. Polimeraza Pwo-NeqSSB o SEQ. ID 1.
- 2. Sposób klonowania polimerazy Pwo-NeqSSB o SEQ.ID 1, znamienny tym, że otrzymuje się DNA insertu przeznaczonego do klonowania, które polega na przeprowadzeniu dwóch niezależnych reakcji PCR:- w pierwszej reakcji amplifikacji otrzymuje się produkt o sekwencji nukleotydowej odpowiadającej sekwencji genu kodującego polimerazę DNA Pwo z dodatkową sekwencją łącznika oraz komplementarną do 11 początkowych nukleotydów białka NeqSSB na C-końcu;- drugi produkt zawiera sekwencję nukleotydową genu kodującego białko NeqSSB wiążącego DNA z dodatkowymi nukleotydami charakterystycznymi dla łącznika oraz 11 dodatkowymi nukleotydami komplementarnymi do końcowej sekwencji nukleotydowej polimerazy Pwo na N-końcu;- matrycę do reakcji PCR stanowi wyizolowane genom owe DNA,- otrzymane produkty w dwóch powyższych reakcjach rozdziela się w żelu agarozowym z bromkiem etydyny i poddaje się izolacji z żelu.
- 3. Sposób według zastrz.2, znamienny tym, że produkty dwóch reakcji PCR służą, jako inserty w reakcji Gibsona, gdzie:- Trawienie plazmidu pET30EKLICPL 241 698 B1- w celu zlinearyzowania plazmidu pET30EKLIC poddaje się go trawieniu enzymem BamHI i Ndel (NEB), które tną w dwóch miejscach zostawiając niekomplementarne do siebie końce DNA,- reakcję trawienia DNA wektora prowadzi się przez 2 h w temperaturze 37°C z dodatkiem odpowiedniego buforu,- potrawiony plazmid poddaje się rozdziałowi elektroforetycznemu i izoluje się;- Reakcja składania genów- reakcja Gibsona prowadzi się w termocyklerze w 50°C przez 60 min, gdzie mieszanina zawiera bufor, nukleotydy, enzymy, wodę jałową, insert I, Insert II, wektor,- po reakcji mieszanina dodaje się do świeżo przygotowanych komórek kompetentnych E. coli TOP10,- otrzymaną mieszaninę inkubuje się w lodzie przez 40 min, po tym czasie inkubacji przeprowadza się szok termiczny polegający na umieszczeniu mieszaniny komórek na 60 s w termobloku o temperaturze 42°C, a następnie 2 min inkubacji w lodzie, po szoku termicznym komórki poddaje się 60 min inkubacji w 37°C z dodatkiem 600 ml LB, po tym czasie komórki wiruje się (10 min, 1800 obr./min), odrzucono 500 ml przesączu, osad zawieszono w pozostałej ilości supernatantu i wysiano na płytki z podłożem LA z dodatkiem kanamycyny, płytki inkubowano przez ok. 16 h w 37°C.
- 4. Sposób według zastrz. 3, znamienny tym, że w celu uzyskania białka fuzyjnego Pwo-NeqSSB, komórki E. coli BL RIL poddaje się transformacji z użyciem DNA plazmidu rekombinantowego pET30-Pwo-NeqSSB i przeprowadza się produkcję pożądanych białek fuzyjnych, hodowle z dodatkiem kanamycyny i chloramfenikolu prowadzi się przez 16 h w 37°C, odmłodzono i po osiągnięciu przez hodowle OD600 = 0,5 dodaje się IPTG do końcowego stężenia 0,1 mM; po indukcji hodowle prowadzi się jeszcze przez 5h, po czym wiruje się (10 min, 5000 obr./min) i poddaje się oczyszczaniu metodą metalopowinowactwa; rezultaty produkcji białek analizuje się za pomocą białkowej elektroforezy poliakrylamidowej w warunkach denaturujących.
- 5. Wyizolowany plazmid rekombinantowy, znamienny tym, że obejmuje fragment nukleotydowej sekwencji białka kodujące polimerazę Pwo-NeqSSB od 5076 do 8168 z plazmidu pET30EKLIC o SEQ.ID.5.
- 6. Wyizolowany plazmid pET30-Pwo-NeqSSB o sekwencji SEQ.ID.5.
- 7. Startery do klonowania polimerazy Pwo-NeqSSB o sekwencjach SEQ.ID.6-9.
- 8. Polimeraza Pwo-NeqSSB o SEQ.ID do zastosowania do powielania specyficznych sekwencji wirusa SARS CoV-2.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PL436784A PL241698B1 (pl) | 2021-01-27 | 2021-01-27 | Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy |
| EP22153626.1A EP4036237A1 (en) | 2021-01-27 | 2022-01-27 | Pwo-neqssb polymerase, method of its preparation, recombinant plasmid, primers and the use of polymerase |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PL436784A PL241698B1 (pl) | 2021-01-27 | 2021-01-27 | Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| PL436784A1 PL436784A1 (pl) | 2022-08-01 |
| PL241698B1 true PL241698B1 (pl) | 2022-11-21 |
Family
ID=80445772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PL436784A PL241698B1 (pl) | 2021-01-27 | 2021-01-27 | Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy |
Country Status (2)
| Country | Link |
|---|---|
| EP (1) | EP4036237A1 (pl) |
| PL (1) | PL241698B1 (pl) |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6627424B1 (en) * | 2000-05-26 | 2003-09-30 | Mj Bioworks, Inc. | Nucleic acid modifying enzymes |
| PL426093A1 (pl) * | 2018-06-27 | 2020-01-02 | Instytut Biotechnologii I Medycyny Molekularnej | Fuzyjna polimeraza kwasu jednołańcuchowego DNA Bst, cząsteczka kwasu nukleinowego kodująca fuzyjną polimerazę DNA NeqSSB-Bst, sposób jej otrzymywania oraz zastosowanie |
| CN111549177A (zh) * | 2020-04-27 | 2020-08-18 | 广州再生医学与健康广东省实验室 | 用于检测SARS-CoV-2的gRNA及试剂盒 |
| PL241065B1 (pl) * | 2020-06-26 | 2022-08-01 | Geneme Spolka Z Ograniczona Odpowiedzialnoscia | Zastosowanie fuzyjnej polimerazy DNA Bst-Nec do izotermalnego powielania specyficznych sekwencji wirusa SARS CoV-2 |
-
2021
- 2021-01-27 PL PL436784A patent/PL241698B1/pl unknown
-
2022
- 2022-01-27 EP EP22153626.1A patent/EP4036237A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| PL436784A1 (pl) | 2022-08-01 |
| EP4036237A1 (en) | 2022-08-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111454978B (zh) | 用于特异性吸附重金属铅的表面展示工程菌及构建方法和应用 | |
| CN111139194B (zh) | 重组酵母、构建方法和其在制备酪醇及衍生物中的应用 | |
| CN111850007B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36864及应用 | |
| CN114774452B (zh) | 一种用于吸附溶液汞离子的工程大肠杆菌构建方法及应用 | |
| CN113322243B (zh) | 蛋白质ugt236及其编码基因与应用 | |
| CN111848758B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白突变体及应用 | |
| CN113337491B (zh) | 一种提高角蛋白酶耐高温稳定性的结构域及其应用 | |
| CN114591985B (zh) | 一种突变果胶裂解酶及应用 | |
| PL243940B1 (pl) | Polimeraza Taq-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy | |
| CN113151214B (zh) | 一种具有脂肪酶活性的蛋白PnlipA及其基因和应用 | |
| CN112481282B (zh) | 一种特异性识别黄原胶侧链的碳水化合物结合模块cbm6b蛋白质及应用 | |
| PL241698B1 (pl) | Polimeraza Pwo-NeqSSB, sposób jej otrzymywania, plazmid rekombinantowy, startery oraz zastosowanie polimerazy | |
| CN111848757B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36862及应用 | |
| CN111850005B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36863及应用 | |
| CN115216485A (zh) | 耐阿米卡星的重组质粒pET28a(+)-rmtB及其应用 | |
| CN113767169A (zh) | 用于制备羟基化烃的基于氨基酸被丙氨酸取代的修饰的单加氧酶 | |
| CN113755460B (zh) | 一种用于制备二氢槲皮素的黄酮还原酶 | |
| KR20060098528A (ko) | 대장균 발현 시스템을 이용한 인간 단백질 타이로신 탈인산화 효소의 발현 및 정제방법 | |
| CN111850006B (zh) | 一种适用于低钙离子浓度的纤维小体对接蛋白组合突变体36865及应用 | |
| CN115058405B (zh) | 一种基于Tyr285改造提高酯酶DcaE4活性的方法及应用 | |
| CN113122561B (zh) | 膜蛋白SohB的表达载体及其表达纯化方法 | |
| CN113122558B (zh) | 膜蛋白AmpG的表达载体及其表达纯化方法 | |
| CN111848759B (zh) | 一种活性提高的纤维小体对接蛋白突变体36741及应用 | |
| PL220977B1 (pl) | Startery oligonukleotydowe do reakcji amplifikacji DNA kodującego białko syntazy trehalozy Deinococcus geothermalis DSMZ 11300, sekwencja DNA wraz z miejscami rozpoznania dla enzymów restrykcyjnych NdeI i XhoI, wektor ekspresyjny i sposób jego otrzymywania, rekombinantowy szczep Escherichia coli BL21 (DE3) pLysS i jego sposób otrzymywania oraz sposób wytwarzania białka rekombinantowego z metką oligohistydynową syntazy trehalozy (ST) Deinococcus geothermalis DSMZ 1130 | |
| CN113122562A (zh) | 膜蛋白YddG的表达载体及其表达纯化方法 |