PT1012286E - Variante alélica stat3 humana - Google Patents
Variante alélica stat3 humana Download PDFInfo
- Publication number
- PT1012286E PT1012286E PT98951396T PT98951396T PT1012286E PT 1012286 E PT1012286 E PT 1012286E PT 98951396 T PT98951396 T PT 98951396T PT 98951396 T PT98951396 T PT 98951396T PT 1012286 E PT1012286 E PT 1012286E
- Authority
- PT
- Portugal
- Prior art keywords
- leu
- glu
- lys
- gin
- ser
- Prior art date
Links
- 241000282414 Homo sapiens Species 0.000 title description 29
- 101100311214 Xenopus laevis stat3.1 gene Proteins 0.000 title 1
- 101000826373 Homo sapiens Signal transducer and activator of transcription 3 Proteins 0.000 claims abstract description 23
- 102000051841 human STAT3 Human genes 0.000 claims abstract description 21
- 208000023275 Autoimmune disease Diseases 0.000 claims abstract description 5
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 5
- 108090000623 proteins and genes Proteins 0.000 claims description 54
- 102000004169 proteins and genes Human genes 0.000 claims description 43
- 125000003729 nucleotide group Chemical group 0.000 claims description 34
- 239000002773 nucleotide Substances 0.000 claims description 32
- 108020004414 DNA Proteins 0.000 claims description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 239000013604 expression vector Substances 0.000 claims description 12
- 102000053602 DNA Human genes 0.000 claims description 10
- 150000003839 salts Chemical class 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 108020004511 Recombinant DNA Proteins 0.000 claims description 4
- 239000000523 sample Substances 0.000 claims description 4
- 108060003951 Immunoglobulin Proteins 0.000 claims description 2
- 208000037979 autoimmune inflammatory disease Diseases 0.000 claims description 2
- 239000003937 drug carrier Substances 0.000 claims description 2
- 108020001507 fusion proteins Proteins 0.000 claims description 2
- 102000037865 fusion proteins Human genes 0.000 claims description 2
- 239000001963 growth medium Substances 0.000 claims description 2
- 102000018358 immunoglobulin Human genes 0.000 claims description 2
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 2
- 238000012258 culturing Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 claims 1
- 239000002299 complementary DNA Substances 0.000 abstract description 45
- 230000001363 autoimmune Effects 0.000 abstract description 3
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 208000027866 inflammatory disease Diseases 0.000 abstract description 3
- 238000002560 therapeutic procedure Methods 0.000 abstract description 3
- 239000013615 primer Substances 0.000 description 59
- 235000018102 proteins Nutrition 0.000 description 34
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 32
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 28
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 24
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 24
- 150000001413 amino acids Chemical group 0.000 description 21
- 150000007523 nucleic acids Chemical group 0.000 description 20
- 102000039446 nucleic acids Human genes 0.000 description 19
- 108020004707 nucleic acids Proteins 0.000 description 19
- 239000012634 fragment Substances 0.000 description 18
- 102000004495 STAT3 Transcription Factor Human genes 0.000 description 16
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 16
- 238000000034 method Methods 0.000 description 16
- 235000001014 amino acid Nutrition 0.000 description 15
- 239000013598 vector Substances 0.000 description 10
- 102100034343 Integrase Human genes 0.000 description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 9
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 9
- 102000014400 SH2 domains Human genes 0.000 description 9
- 108050003452 SH2 domains Proteins 0.000 description 9
- 230000003321 amplification Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- 210000004185 liver Anatomy 0.000 description 8
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 5
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 5
- 108010005233 alanylglutamic acid Proteins 0.000 description 5
- 230000003169 placental effect Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000003757 reverse transcription PCR Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 4
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 4
- 241001529936 Murinae Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 3
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 3
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 3
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 3
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 3
- HONVOXINDBETTI-KKUMJFAQSA-N Lys-Tyr-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CC=C(O)C=C1 HONVOXINDBETTI-KKUMJFAQSA-N 0.000 description 3
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 108010006785 Taq Polymerase Proteins 0.000 description 3
- 102000000887 Transcription factor STAT Human genes 0.000 description 3
- 108050007918 Transcription factor STAT Proteins 0.000 description 3
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- -1 for example Chemical class 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 210000000813 small intestine Anatomy 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 2
- HKTRDWYCAUTRRL-YUMQZZPRSA-N Glu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-YUMQZZPRSA-N 0.000 description 2
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 2
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 102000004889 Interleukin-6 Human genes 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- 102000042838 JAK family Human genes 0.000 description 2
- 108091082332 JAK family Proteins 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 2
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 2
- 101100366881 Mus musculus Stat3 gene Proteins 0.000 description 2
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 101100205189 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-5 gene Proteins 0.000 description 2
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 2
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- 102000000395 SH3 domains Human genes 0.000 description 2
- 108050008861 SH3 domains Proteins 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 2
- GRQCSEWEPIHLBI-JQWIXIFHSA-N Trp-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-JQWIXIFHSA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 210000002826 placenta Anatomy 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 1
- WUBBRNOQWQTFEX-UHFFFAOYSA-N 4-aminosalicylic acid Chemical compound NC1=CC=C(C(O)=O)C(O)=C1 WUBBRNOQWQTFEX-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 1
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- RGGVDKVXLBOLNS-JQWIXIFHSA-N Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)N)C(O)=O)=CNC2=C1 RGGVDKVXLBOLNS-JQWIXIFHSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 1
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- DYDKXJWQCIVTMR-WDSKDSINSA-N Asp-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O DYDKXJWQCIVTMR-WDSKDSINSA-N 0.000 description 1
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 1
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000701822 Bovine papillomavirus Species 0.000 description 1
- 101100275473 Caenorhabditis elegans ctc-3 gene Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 1
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 1
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- 108010030204 H-asparaginyl-arginyl-valyl-tyrosyl-isoleucyl-histyl-prolyl-phenylalanyl-histyl-leucyl-valyl-isoleucyl-serine Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 1
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- 101000804764 Homo sapiens Lymphotactin Proteins 0.000 description 1
- 101100366880 Homo sapiens STAT3 gene Proteins 0.000 description 1
- 101000585484 Homo sapiens Signal transducer and activator of transcription 1-alpha/beta Proteins 0.000 description 1
- WKXVAXOSIPTXEC-HAFWLYHUSA-N Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O WKXVAXOSIPTXEC-HAFWLYHUSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- JSZMKEYEVLDPDO-ACZMJKKPSA-N Ile-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O JSZMKEYEVLDPDO-ACZMJKKPSA-N 0.000 description 1
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 1
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 1
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- BCXBIONYYJCSDF-CIUDSAMLSA-N Ile-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BCXBIONYYJCSDF-CIUDSAMLSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102000010781 Interleukin-6 Receptors Human genes 0.000 description 1
- 108010038501 Interleukin-6 Receptors Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- LSPYFSHXDAYVDI-SRVKXCTJSA-N Leu-Ala-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C LSPYFSHXDAYVDI-SRVKXCTJSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 1
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical group CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 102100035304 Lymphotactin Human genes 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 1
- IBAQFPQHRJAVAV-ULAWRXDQSA-N Miglitol Chemical compound OCCN1C[C@H](O)[C@@H](O)[C@H](O)[C@H]1CO IBAQFPQHRJAVAV-ULAWRXDQSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100096914 Mus musculus Stat1 gene Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101710165986 Negative regulator of transcription Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 1
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 102000001712 STAT5 Transcription Factor Human genes 0.000 description 1
- 108010029477 STAT5 Transcription Factor Proteins 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- IXEGQBJZDIRRIV-QEJZJMRPSA-N Trp-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IXEGQBJZDIRRIV-QEJZJMRPSA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 1
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 1
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 150000008431 aliphatic amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 125000003435 aroyl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 159000000007 calcium salts Chemical class 0.000 description 1
- 125000001589 carboacyl group Chemical group 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- RDYMFSUJUZBWLH-UHFFFAOYSA-N endosulfan Chemical compound C12COS(=O)OCC2C2(Cl)C(Cl)=C(Cl)C1(Cl)C2(Cl)Cl RDYMFSUJUZBWLH-UHFFFAOYSA-N 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000004700 fetal blood Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 229940084937 glyset Drugs 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 102000051839 human STAT1 Human genes 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/06—Immunosuppressants, e.g. drugs for graft rejection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Toxicology (AREA)
- Engineering & Computer Science (AREA)
- Gastroenterology & Hepatology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Pain & Pain Management (AREA)
- Rheumatology (AREA)
- Transplantation (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
- Pyridine Compounds (AREA)
- Pyrane Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
Description
1
DESCRIÇÃO "VARIANTE ALÉLICA DA STAT3 HUMANA"
ÁREA DA INVENÇÃO A presente invenção relaciona-se com uma variante alélica da STAT3 humana, com a sequência de ADNc que a codifica, com a sua utilização em terapêutica e/ou no diagnóstico de doenças autoimunes e/ou inflamatórias, bem como com as composições farmacêuticas que a contêm.
ANTECEDENTES DA INVENÇÃO
As proteínas Transdutoras de Sinal e Activadoras de Transcrição (STAT) são uma nova classe de factores de transcrição intracelulares que desempenham uma função essencial na resposta celular de citocinas (Stahl et al., 1994; Gouilleux et al., 1995; Azam et al., 1995; Tian et al., 1994; May et al., 1996; e Iwatsuki et al., 1997). A maior parte destas proteínas foram bem caracterizadas por sequenciação, e a sua estrutura bem como o mecanismo das suas acções foram largamente analisados e estão bem documentados (Wegenka et al., 1993; Akira et al., 1994; Wegenka et al., 1994; Quelle et al., 1995 e Silva et al., 1996) .
Estas proteínas contêm domínios SH2 e SH3 bem como um sítio de fosforilação na sua região carboxilo terminal (Kapetein et al., 1996; e Herman et al., 1996). Após activação do receptor de citocina através da ligação do 2 ligando, a parte intracelular do receptor torna-se fosforilada por uma cinase associada da família JAK.
As proteínas STAT ligam-se em seguida ao receptor fosforilado, através do seu domínio SH2 e são, por sua vez, fosforiladas pelas JAKs (Stahl et al., 1995). Em seguida as proteínas STAT fosforiladas dimerizam e deslocam-se para o núcleo, onde elas são capazes de reconhecer elementos reactivos de ADN específicos (Seidel et al., 1995; e Harroch et al., 1994). A STAT3 foi identificada como um mediador importante do sinal comunicado pela família IL-6 de citocinas, bem como pelo EGF e por um conjunto de outras interleucinas e factores de crescimento.
Foi demonstrado que a STAT3 desempenha uma função central na regulação positiva de proteínas hepáticas de fase aguda (Wegenka et al., 1993; e Zhang et al., 1996) na paragem do crescimento de células monocíticas (Yamanaka et al., 1996; e Minami et al., 1996) e na sobrevivência de células de mieloma (Harroch et al., 1994). J. Biol. Chem. , May 31, 1996, 271 (22), pág. 13221-7, Caldehoven E. e tal., "STAT3p, a splice variant of transcription factor STAT3, is a dominant negative regulator of transcription" descreve a proteína STAT3P· É ainda descrita uma molécula de ADN que codifica a referida STAT3P e um vector de expressão numa célula hospedeira para a produção recombinante da proteína. A EP 0 676 469 descreve o factor de resposta de fase aguda humano (APRF) o qual transmite o sinal de transcrição 3 do receptor de IL-6 para o gene induzido pela IL-6. É ainda descrita uma molécula de ADN que codifica a proteína, um vector de expressão que contém a referida molécula de ADN, uma célula hospedeira compreendendo o referido vector de expressão e um processo recombinante para preparar a referida proteína.
DESCRIÇÃO DA INVENÇÃO
No decurso das experiências na análise das interacções da STAT3, nós amplificamos por RT-PCR um fragmento de ADNc de células HepG2 correspondente ao domínio SH2 da STAT3 humana. Nós constatamos por sequenciação de ADN que o domínio SH2 que nós isolamos apresenta uma divergência de 13 resíduos em relação à sequência correspondente do gene da STAT3 humana originalmente publicada (Akira et al., 1994) .
Para determinar a natureza desta variante de sequência, nós concebemos três pares de iniciadores com extremidades 3' que correspondem a posições nucleótidas na variância entre as duas sequências de ADNc humano.
Após estas investigações tornou-se evidente que a nova variante corresponde pelo menos ao alelo mais frequente da STAT3 humana.
Por conseguinte, o objecto principal desta invenção é a variante alélica supramencionada da proteína STAT3 humana compreendendo a sequência de aminoácidos da SEQ ID NO: 2, ou um sal funcionalmente equivalente, ou um derivado funcionalmente equivalente, ou uma fracção activa, ou uma proteína de fusão. 4 A definição "sal" como aqui utilizada refere-se a sais dos grupos carboxilo e a sais das funções amino do composto que podem ser obtidos através de métodos conhecidos. Os sais de grupos carboxilo incluem sais inorgânicos como, por exemplo, sais de sódio, potássio, cálcio e sais com bases orgânicas como os preparados com uma amina tal como trietanolamina, arginina ou lisina. Os sais dos grupos amino incluem, por exemplo sais com ácidos inorgânicos como ácido clorídrico e com ácidos orgânicos como ácido acético. A definição "derivado" como aqui utilizada refere-se a derivados que podem ser preparados a partir dos grupos funcionais presentes nas cadeias laterais das unidades aminoácido ou nos grupos N- ou C-terminais segundo métodos conhecidos e que estão incluídos na invenção quando eles são farmaceuticamente aceitáveis i.e. quando eles não destroem a actividade da proteína ou não conferem toxicidade às composições farmacêuticas que os contêm. Estes derivados incluem, por exemplo, amidas alifáticas ou ésteres dos grupos carboxilo e derivados N-acilo dos grupos amino livres ou derivados O-acilo dos grupos hidroxilo livres e são preparados com grupos acilo como, por exemplo, grupos alcanoílo ou aroílo.
Como "fracção activa" da proteína, a presente invenção refere-se a qualquer fragmento ou precursor da cadeia polipeptídica do próprio composto, sozinho ou em combinação com moléculas relacionadas ou resíduos ligados àquele, por exemplo resíduos de açúcares ou fosfatos, ou agregados da molécula polipeptídica quando tais fragmentos ou precursores apresentam a mesma actividade da proteína da invenção, como medicamento. 5 A definição “proteína de fusão" como aqui utilizada refere-se a polipéptidos que compreendem o polipéptido da invenção acima especificado fundido com uma outra proteína e possuindo um maior tempo de semivida em fluidos orgânicos. Ele pode, por exemplo, estar fundido com uma outra proteína tal como, por exemplo, uma imunoglobulina.
Um outro objecto da invenção é a molécula de ADN compreendendo a sequência de ADN que codifica a variante alélica da invenção, incluindo as sequências de nucleótidos essencialmente iguais. “Sequências de nucleótidos essencialmente iguais" inclui todas as outras sequências de ácido nucleico que, em virtude da degeneração do código genético, também codificam as referidas sequências de aminoácidos. Em particular, a presente invenção refere-se à sequência de nucleótidos que compreende a SEQ ID NO: 1. A presente invenção refere-se também às moléculas de ADN recombinante que hibridizam com a sequência de ADN que codifica a variante alélica da hSTAT3 supramencionada e cuja sequência de nucleótidos apresenta pelo menos 13 diferenças no domínio SH2 (relativamente à sequência da STAT3 humana em Akira et al., 1994), como se mostra na Figura 1. 0 gene pode conter, ou não, os intrões naturais e pode ser obtido, por exemplo, por extracção de células apropriadas e purificação com métodos conhecidos.
Além disso, a presente invenção também inclui moléculas de ADN recombinante que hibridizam em condições rigorosas com uma sonda possuindo uma sequência de nucleótidos seleccionada entre SEQ ID NO: 16 e SEQ ID NO: 17. 6 0 termo "condições rigorosas" refere-se às condições de hibridização e lavagem subsequente que os técnicos médios na matéria referem convencionalmente como "rigorosas". Ver Ausubel et al., Current Protocols in Molecular Biologic supra. Interscience. N.Y. pare. 6.3 e 6.4 (1987, 1992), e Sambrook et al, 1989. Sem restrição, os exemplos de condições rigorosas incluem condições de lavagem 12-20 °C abaixo do Tm calculado do híbrido em estudo, por exemplo 2 x SSC e 0,5% de SDS durante 5 minutos, 2 x SSC e 0,1% de SDS durante 15 minutos; 0,1 x SSC e 0,5% de SDS a 37 °C durante 30-60 minutos e depois 0,1 x SSC e 0,5% de SDS a 68 °C durante 30-60 minutos. Os técnicos médios na matéria compreendem que condições rigorosas dependem também do comprimento das sequências de ADN, sondas de oligonucleótidos (tais como 10-40 bases) ou sondas mistas de oligonucleótidos. Se forem utilizadas sondas mistas é preferível utilizar cloreto de tetrametilamónio (TMAC) em vez de SSC. Ver Ausubel. supra. A invenção também inclui vectores de expressão que compreendem os ADNs anteriores, células hospedeiras transformadas com esses vectores e um processo de preparação dessa variante alélica da hSTAT3, os seus fragmentos ou proteínas de fusão activos, através da cultura em meio de cultura apropriado das referidas células transformadas. A sequência de ADN que codifica a proteína da invenção pode ser inserida e ligada a um plasmídeo adequado. Uma vez preparado, o vector de expressão é introduzido numa célula hospedeira adequada, a qual expressa em seguida o(s) vector(es) para produzir a proteína desejada. 7 A expressão de qualquer uma das proteínas recombinantes da invenção como aqui mencionada pode ser efectuada em células eucariotas (por exemplo células de leveduras, insecto ou mamífero) ou células procariotas, utilizando os vectores de expressão apropriados. Pode utilizar-se qualquer método conhecido na matéria.
Por exemplo, as moléculas de ADN que codificam as proteínas obtidas por qualquer um dos métodos anteriores são inseridas em vectores de expressão adequadamente construídos por técnicas bem conhecidas na matéria (ver Sambrook et al, 1989) . Liga-se ADNc de cadeia dupla a vectores de plasmídeo por terminação homopolimérica ou por ligação por restrição envolvendo a utilização de grupos de ligação de ADN sintético ou técnicas de ligação de extremidade plana: são utilizadas ADN-ligases para ligar as moléculas de ADN, evitando-se a junção indesejada por tratamento com fosfatase alcalina.
Para se conseguir expressar a proteína desejada, um vector de expressão deveria também compreender sequências específicas de nucleótidos que contêm informação reguladora de transcrição e tradução ligadas ao ADN que codifica a proteína desejada de modo a permitir a expressão do gene e a produção da proteína. Em primeiro lugar para o gene ser transcrito, ele tem de ser precedido por um promotor que possa ser reconhecido pela ARN-polimerase, ao qual se liga a polimerase e inicia, desse modo, o processo de transcrição. Existe uma variedade desses promotores em uso, os quais funcionam com eficácias diferentes (promotores fortes e fracos). 8
Para hospedeiros eucariotas pode utilizar-se várias sequências reguladoras da transcrição e tradução, dependendo da natureza do hospedeiro. Elas podem ser provenientes de fontes virais, tais como adenovirus, vírus do papiloma bovino, vírus Símio ou semelhantes, em que os sinais reguladores estão associados com um gene específico o qual tem um nível elevado de expressão. São exemplos o promotor TK do vírus da Herpes, o promotor precoce SV40, o promotor do gene gal4 da levedura, etc. Podem ser seleccionados sinais reguladores do início da transcrição que permitam a repressão e activação, de modo a que se possa modular a expressão dos genes. A molécula de ADN que compreende a sequência de nucleótidos que codifica a proteína da invenção é inserida em vector(es), possuindo os sinais reguladores da transcrição e tradução ligados operacionalmente, que é capaz de integrar as sequências de genes desejadas na células hospedeira.
As células que foram transformadas de modo estável pelo ADN introduzido podem ser seleccionadas introduzindo também um ou mais marcadores que permitem a selecção de células hospedeiras que contêm o vector de expressão. 0 marcador também pode proporcionar fototrofia a um hospedeiro auxotrópico, resistência a biocidas, por exemplo antibióticos, ou metais pesados tais como cobre, ou semelhantes. 0 gene marcador seleccionável pode estar ligado directamente às sequências de ADN a serem expressadas ou introduzido na mesma célula por co-transfecção. Também podem ser necessário elementos adicionais para a síntese óptima de proteínas da invenção. 9
Os factores importantes na selecção de um plasmídeo ou vector virai particular incluem: a facilidade com que as células receptoras que contêm o vector podem ser reconhecidas e seleccionadas das células receptoras que não contêm o vector; o número de cópias do vector que são desejadas num hospedeiro particular; e se é desejável ser-se capaz de "transferir" o vector entre células hospedeiras de espécies diferentes.
Uma vez preparados o(s) vector (es) ou sequência de ADN que contém a(s) construção(ões) para expressão da(s) construção(ões) de ADB eles podem ser introduzidos numa célula hospedeira apropriada por qualquer um de uma variedade de meios adequados: Transformação, transfecção, conjugação, fusão de protoplasto, electroporação, precipitação com fosfato de cálcio, microinjecção directa, etc.
As células hospedeiras podem ser procariotas ou eucariotas. São preferidas células eucariotas, por exemplo células de mamíferos, tais como células de humano, macaco, ratinho e células de Ovário de Hamster Chinês (CHO), porque elas proporcionam modificações pós-tradução nas moléculas de proteína, incluindo enrolamento correcto ou glicosilação em sítios correctos. De igual modo, as células de levedura podem efectuar modificações pós-tradução do péptido incluindo glicosilação. Existe um conjunto de estratégias de ADN recombinante que utilizam sequência promotoras fortes e um número elevado de cópias de plasmídeo que podem ser utilizadas para a produção das proteínas desejadas em levedura. A levedura reconhece sequências líder em produtos de genes de mamíferos clonados e segrega péptidos portadores de sequências líder (i.e., pré-péptidos). 10
Após a introdução do(s) vector(es), as células hospedeiras são multiplicadas num meio selectivo, o qual selecciona o crescimento de células possuindo o vector. A expressão da(s) sequência(s) do gene clonado leva à produção das proteínas desejadas. A purificação das proteínas recombinantes é realizada por qualquer um dos métodos conhecidos para este fim, i.e. qualquer procedimento convencional envolvendo extracção, precipitação, cromatografia, electroforese ou semelhantes. Um outro procedimento de purificação que pode ser preferencialmente utilizado para purificar a proteína da invenção é a cromatografia de afinidade utilizando anticorpos monoclonais que se ligam à proteína alvo e que são produzidos e imobilizados numa matriz de gel contida dentro de uma coluna. Passa-se preparações impuras que contêm a proteína recombinante através da coluna. A proteína ligar-se-á à coluna através do anticorpo especifico ao passo que as impurezas passá-la-ão sem serem retidas. Depois de lavar, a proteína é eluída do gel por uma alteração no pH ou na força iónica.
Como já foi mencionado, a proteína da invenção é útil na terapêutica e/ou diagnóstico de doenças autoimunes e/ou inflamatórias. Por conseguinte, num outro aspecto, a presente invenção proporciona a utilização da proteína da invenção no fabrico de um medicamento para o tratamento de doenças autoimunes e/ou doenças inflamatórias. O medicamento é preferencialmente apresentado na forma de uma composição farmacêutica compreendendo a proteína da invenção em conjunto com um ou mais veículos e/ou excipientes farmaceuticamente aceitáveis. Estas composições 11 farmacêuticas constituem ainda um outro aspecto da presente invenção. A invenção será agora descrita através dos Exemplos seguintes, os quais não deverão ser interpretados como restringindo a presente invenção seja de que forma for. Os Exemplos referir-se-ão às Figuras especificadas a seguir.
DESCRIÇÃO DAS FIGURAS
Figura 1: Mostra uma comparação da sequência de ADNc do domínio SH2 da STAT3 humana depositada no EMBL-GB com os correspondentes fragmentos de HepG2 humana e de ADNc do fígado de ratinho. A sequência de nucleótidos com 424 bp apresentada e a sua numeração são da sequência de ADNc do domínio SH2 da STAT3 humana depositada nos bancos de dados EMBL-GB (Akira et al., 1994). Os nucleótidos na variante identificada nos ADNc da HepG2 humana (este pedido de patente) e do fígado de ratinho (Akira et al., 1994) são descritos acima da sequência total, a negrito e sublinhados. Também na sequência total é indicada a negrito e sublinhado a alteração de nucleótidos que resultam numa variação a nível dos aminoácidos, estando uma Leucina codificada na sequência depositada substituída por uma Valina na nova sequência deste pedido de patente. Os iniciadores USO; LSO; US1; LSI; LS2; US3; LS3; US4 e LS4, utilizados nas reacções de RT-PCR são indicados por pontas de seta por cima das sequências.
Figura 2. Descreve a sequência total de nucleótidos da STAT3 humana isolada de células HepG2, em particular a região de codificação. 12 A. A estratégia de sequenciação. B. A sequência completa de nucleótidos. Os nucleótidos em desacordo com a sequência conhecida publicada são mostrados a negrito e sublinhado. Os residuos de aminoácido modificados relativamente à sequência publicada são apresentados por baixo da sequência de nucleótidos.
Figura 3. Mostra a análise da expressão dos ADNc da hSTAT3 originalmente publicada e da nova variante hSTAT3. 0 ARN foi extraído com o reagente de Trizol, submetido a transcrição reversa com oligo(dT) e a reacção de PCR analítica foi realizada com a Taq polimerase em tubos capilares, como se descreve nos Exemplos. A. Produtos de PCR amplificados com o par de iniciadores US1/LS1 específicos para a sequência de hSTAT3 original publicada. B. Produtos de PCR amplificados com o par de iniciadores US3/LS3 específico para a nova variante da sequência hSTAT3 apresentada neste pedido de patente. Pistas: M) Marcadores de tamanho molecular. 1) ARN de fígado. 2) ARN do baço. 3) ARN do útero. 4) ARN do pulmão. 5) ARN da pele. 6) ARN dos glóbulos vermelhos do cordão umbilical. 7) ARN de fibroblastos dérmicos. 8) ARN do coração sem transcriptase inversa. 9) ARN do coração. 10) ARN de fígado fetal sem transcriptase inversa. 11) ARN de fígado fetal. 12) ARN do intestino delgado sem transcriptase inversa. 13) ARN do intestino delgado. 14) ARN placentário sem transcriptase inversa. 15) ARN placentário.
Figura 4. Mostra a amplificação da cadeia molde de ADN artificial com iniciadores US1/LS1. A cadeia molde de ADN artificial constituída pelo fragmento da sequência variante 13 de hSTAT3 flanqueado na sua extremidade 5' pela sequência iniciadora US1 e na sua extremidade 3' pela sequência iniciadora LSI, foi criada por PCR preparativa, utilizando os iniciadores US4/LS4, do ADNc da HepG2 (onde poderia ser apenas amplificada a sequência variante, não mostrado), como se descreve na secção de Materiais e métodos. A cadeia molde artificial foi fraccionada em gel de 2% de agarose e a banda relevante de 285 bp foi purificada com o estojo de extracção de ADN de gel de agarose (Boeringer Mannheim, Mannheim, Alemanha). Esta cadeia molde foi depois adicionada a várias concentrações a 1 μΐ do ADNc relevante (proveniente de aproximadamente 100 ng do ARN correspondente). Pistas: M) Marcadores de tamanho molecular. 1) Sem adição. 2) 0,3 fg de cadeia molde artificial fortificada. 3) 3 f g de cadeia molde artificial fortificada 4) 30 fg de cadeia molde artificial fortificada . 5) 300 fg de cadeia molde artificial fortificada.
Figura 5. Mostra a análise por PCR do fragmento da sequência genómica da hSTAT3 original e da nova variante da hSTAT3. Utilizou-se 40 ng do ADN genómico humano nas reacções de PCR analítico realizadas em tubos capilares, como se descreve na secção de Materiais e métodos. Pistas: M) Marcadores de tamanho molecular. 1, 4) ADN genómico amplificado com o par de iniciadores US1/LS1, específico para a sequência da hSTAT3 original, publicada. 2) ADN genómico amplificado com o par de iniciadores US1/LS2, específico para a sequência da hSTAT3 original, publicada. 3) ADN genómico amplificado com o par de iniciadores US3/LS3 específico para a nova sequência da hSTAT3 variante. 5, 6, 7, 8) ADN genómico amplificado com o par de iniciadores US1/LS1 e fortificado com 0,3, 3, 30 e 300 fg 14 respectivamente, da cadeia molde de ADN artificial amplificada com US4/LS4.
EXEMPLOS
MATERIAIS E MÉTODOS
Materiais A linha celular de hepatoma humano HepG2 foi da ATCC (Rockville, Md., USA). Os ARN totais humanos de coração, figado, figado fetal, intestino delgado, placenta e o ADN genómico humano foram obtidos de Clontech (Paio Alto, Calif., USA). Outros ARN utilizados neste pedido de patente foram preparados no nosso laboratório. A Pfu polimerase foi da Stratagene (La Jolla, Calif., USA) ; A ADN Taq polimerase foi da Advanced Biotechnology, Leatherhead, UK. 0 estojo de sequenciação da ADN foi da Perkin Elmer (Applied Biosystems Division, Foster City, Calif., USA); a transcriptase inversa SuperScript II (200 U/μΙ) e o Reagente Trizol para extracção do ARN foram da Gibco (Grand Island, N.Y., USA).
Iniciadores de oligonucleótidos
Todos os iniciadores utilizados neste pedido de patente foram concebidos no nosso laboratório utilizando o suporte lógico OLIGO (National Biosciences, Plymouth, Minn., USA), para optimizar a especificidade da amplificação por PCR de sequências de cadeias molde de nucleótidos que diferem apenas em um ou nalguns nucleótidos. 15
Todos os iniciadores foram sintetizados no nosso laboratório, com um Sintetizador de ADN/ARN 392 da Perkin Elmer (Applied Biosystems Division, Foster City, Calif., USA). Utilizou-se um primeiro par de iniciadores, USO/LSO, para isolamento das 424 bp contendo o ADNc do domínio SH2 total da STAT3 humana.
As sequências de nucleótidos de todos os iniciadores utilizados são mostradas abaixo.
Iniciador uso 5 ' AAC ACC ATG CCC TGG CTA GAG AAT ATC ATC GAC CTT SEQ ID NO: : 7 CTG AAA AAG TA 3 ' Iniciador LSO 5 ' ATA TAT GGA TCC TGG CCC AGC GCT ACC TCG GTC AGC SEQ ID NO: 8 TTC 3 ' Iniciador STAU 5 ' TCC CCC CAA GCT TCA CAC GCG CAG CCC CGG CTT CT 3' SEQ ID NO: 9 Iniciador STAL 5 ' GTT CAT CAC TTT TGT GTT TGT GCC CAG AAT 3' SEQ ID NO: 10 Iniciador STBU 5 ' GAC AAA GAC TCT GGG GAC GTT GCA GCT CTC 3' SEQ ID NO: 11 Iniciador STBL 5 ' TCA GTC CTC GAG TAT CTT TCT GCA GCT TCC GTT CT 3' SEQ ID NO: 12 Iniciador UST 5 ' TGA AGG GTA CAT CAT GGG TTT C 3 ' SEQ ID NO: 13 Iniciador LSI 5' TCA GGA TAG AGA TAG ACA ACT GGA GAG AA 3' SEQ ID NO: 14 Iniciador LS2 5' CCT CCT TCT TTG CTG CTT TCA CTG AAG 3' SEQ ID NO: 15 Iniciador US3 5' CGA AGG GTA CAT CAT GGG CTT T 3' SEQ ID NO: 16 Iniciador LS3 5' CCT CCT TCT TTC CTG CTT TCA CTG AAT CTT 3' SEQ ID NO: 17 Iniciador US4 5' TGA AGG GTA CAT CAT GGG TTT CAT GAG TAA GGA 3' SEQ ID NO: 18 Iniciador LS4 5' TCA GGA TAG AGA TAG ACA ACT CGA GAG AAC AGG ATA SEQ ID NO: 19 T 3' A posição dos iniciadores USO/LSO na sequência da hSTAT3 é mostrada na Figura 1.
Outros iniciadores para isolar o ADNc da STAT3 humana total foram: Iniciador STAU, Iniciador STAL, Iniciador STBU e Iniciador STBL.
Dois pares iniciadores adicionais, designados US1/LS1 e US1/LS2, que amplificam produtos de 285 e 111 bp respectivamente, eram específicos de modo único para a sequência de ADNc da STAT3 humana original, publicada 16 (Akira et al., 1994), mas não para a sequência variante da hSTAT3 que nós apresentamos neste pedido de patente. Pelo menos um nucleótido em desacordo entre as sequências da STAT3 publicada e variante estava posicionado na extremidade 3' de cada iniciador. 0 par de iniciadores US3/LS3 era específico de modo único para a sequência de hSTAT3 variante descrita neste pedido de patente. Este par de iniciadores US3/LS3 não amplificou um fragmento de 111 bp especificamente na sequência da variante da hSTAT3, correspondente à sequência amplificada pelos iniciadores US1/LS2 na sequência de ADNc da hSTAT3 original, publicada.
Utilizou-se um par de iniciadores de validação, US4/LS4, para criar uma cadeia molde de hSTAT3 artificial de 285 bp correspondente ao produto esperado dos iniciadores US1/LS1.
ARN e RT-PCR
Preparou-se ARN total de células HepG2 humanas pelo método de Birnboim (Birnboim, 1988). Para outros tecido e células, extraiu-se o ARN com o reagente de Trizol disponível de Gibco, Grand Island, N.Y., USA, seguindo as instruções do fabricante.
Utilizou-se Oligo(dT) para preparar a transcrição inversa de 5 μg de ARN total com 200 U de transcriptase inversa (RT) SuperScript II em 50 μΐ de mistura reaccional. A reacção com a RT foi realizada a 37 °C durante 1 h e 30 min. Realizou-se em seguida PCR preparativa utilizando os produtos da RT como cadeias moldes de ADNc. As reacções de 17 PCR continham 10 μΐ de ADNc, 50 pmoles de cada iniciador (ver abaixo), 2,5 unidades de Stratagene Pfu polimerase, 0,2 mM de cada um dos quatro desoxinucleótidos trifosfatos, 10 μΐ de tampão Pfu, num volume reaccional de 100 μΐ, coberta com 50 μΐ de óleo mineral. A amplificação foi geralmente realizada durante 30 ciclos com um perfil de temperatura de 45 segundos a 94 °C (desnaturação), 45 segundos a 50 até 60 °C (emparelhamento) e 5 minutos a 72 °C (extensão) . Os produtos de PCR foram purificados por centrifugação através de filtros Microcon 100 (Amicon) e depois submetidos a electroforese em geles de 1,5% de agarose em tampão de Tris/borato/EDTA. Os PCRs analíticos foram realizados em tubos capilares, com a mesma concentração de reagentes descrita acima num volume dez vezes menor, excepto para a Pfu polimerase a qual foi substituída por 0,5 U de Taq polimerase. O perfil de temperatura foi de 94 °C para a desnaturação, 55 °C para o emparelhamento e 72 °C para a extensão.
Seguenciação de ADN
Os produtos de PCR da STAT3 foram sequenciados como representado na Figura 2. As sequências de ADN foram realizadas com o método do didesoxi, utilizando um estojo de sequenciação de ADN (Perkin Elmer, Applied Biosystems Division, Foster City, Calif., USA) num sequenciador automático ABI modelo 373A, seguindo as instruções do fabricante. As sequências de nucleótidos de todos os fragmentos de ADNc foram determinadas por sequenciação de ambas as cadeias de ADN. A sequência de nucleótidos e a 18 sequência deduzida de aminoácidos foram comparadas com as existentes no GenBank e no banco de dados Swiss-Prot.
Resultados e Discussão
Isolamento e sequenciação de um fragmento de ADNc que codifica a STAT3 humana
Para isolar o domínio SH2 da STAT3 humana, nós amplificamos por RT-PCR, um fragmento de ADNc com 424 pares de bases correspondentes às posições de nucleótidos entre 1909 e 2332 da sequência de ADNc da STAT3 placentária humana publicada (Akira et al., 1994), utilizando ARN total de células HepG2.
Este fragmento de PCR foi depois inserido num vector de expressão, e determinou-se a sequência de nucleótidos. Os resultados (Figura 1) mostraram que 13 resíduos de nucleótidos diferiram da sequência original de ADNc placentário humano. A grande maioria dos 13 resíduos modificados estava localizada na posição do terceiro códão, não provocando qualquer alteração na sequência de aminoácidos correspondente.
Apenas um resíduo de nucleótido mutado provocou a substituição de uma leucina na posição 667 na proteína STAT3 humana por uma valina (Figura 1). Nós amplificamos em seguida a partir de células HepG2 mais dois fragmentos de ADNc correspondentes à região de codificação total do ADNc da STAT3 humana. A sequenciação destes fragmentos (Figura 2) demonstrou que na globalidade 43 nucleótidos estavam em desacordo com a sequência publicada, correspondendo a um total de 6 alterações de aminoácidos (Akira et al., 1994). 19
Sabe-se que as sequências consenso da STAT3 humana e murídea, publicadas diferem em 172 nucleótidos, ao passo que a sequência da STAT3 humana nova que nós apresentamos difere em 193 residuos relativamente à sequência de ratinho (Raz et al., 1994; Akira et al., 1994; Zhong et al., 1994).
Assim, ao nível do nucleótido, a sequência da STAT3 humana nova corresponde a uma distância evolucionária ligeiramente aumentada em relação à sequência murídea. Uma região entre os nucleótidos 1680 e 1940 da sequência humana original mostrou uma conservação elevada de nucleótidos entre o homem e o ratinho. Esta conservação perde-se quando é considerada a nova sequência humana apresentada neste pedido de patente.
Pelo contrário, ao nível dos aminoácidos a nova sequência humana está mais próxima da sequência murídea. Todas as seis alterações na sequência de aminoácidos da STAT3 humana nova fornecem os correspondentes resíduos de ratinho (e ratazana) originais, pelo que existe apenas um resíduo a diferir entre a sequência humana e a sequência de consenso de 770 aminoácidos da STAT3 de ratinho: um ácido glutâmico na posição 760 da sequência humana está substituído por um ácido aspártico na sequência do ratinho. Por conseguinte, a sequência da STAT3 codificada corresponde agora a uma das mais conservadas entre determinantes genéticos conhecidos. Como uma referência, as proteínas STAT1 e STAT5 de ratinho e humana diferem em 67 e 29 resíduos de aminoácido, respectivamente.
Sabe-se que a STAT3, como outros membros da família STAT, ligam várias proteínas diferentes para efectuar as suas funções múltiplas (Darnell, 1997). O domínio SH2 da 20 STAT3 interactua com a parte intracelular das moléculas receptoras de transdução do sinal; a região C-terminal é importante para activação e dimerização (Sasse et al., 1997) e a região central é importante para ligação ao ADN (Horvath et al., 1995).
Entre as seis alterações de aminoácidos descritas no presente pedido de patente, uma cai dentro da região N-terminal, na posição 288. A segunda alteração de aminoácido cai na posição 460, no domínio de ligação de ADN. Duas alterações adicionais caem dentro do domínio SH3, nas posições 548 e 561 respectivamente.
Finalmente, mais duas alterações de aminoácidos caem dentro do domínio SH2 na posição 667 e na região C-terminal, na posição 730 respectivamente (ver Figura 2).
Caracterização da nova variante da sequência da STAT3
Para determinar a natureza da nova variante da sequência aqui apresentada, nós concebemos três pares de iniciadores com extremidades 3' correspondentes às posições de nucleótidos que diferem entre as duas sequências de ADNc humana. Nós determinamos que os primeiro e segundo pares de iniciadores (US1/LS1 e US1/LS2) foram exclusivamente específicos para a sequência de nucleótidos do ADNc da hSTAT3 original, publicada, ao passo que o terceiro par de iniciadores (US3/LS3) foi exclusivamente específico para a nova variante da sequência de nucleótidos da STAT3 humana. Nós utilizamos os dois pares iniciadores US1/LS1 e US3/LS3 (específicos para as sequências original e a nova variante, respectivamente) para amplificar os ARNs de 11 21 tecidos humanos diferentes em 22 reacções de RT-PCR separadas. Cada fonte de ARN que nós examinamos foi proveniente de grupos de 1 até 17 indivíduos, com um total de 31 indivíduos analisados.
Uma vez que a sequência de ADNc da hSTAT3 original era proveniente da placenta humana, este tecido foi incluído entre as 11 fontes de ARN testadas. Como se mostra na Figura 3, apenas o par de iniciadores específicos para a nova variante da sequência foram capazes de amplificar todos os 11 RN A testados, originando o produto de amplificação esperado, ao passo que não foi possível obter qualquer banda significativa em qualquer ARN testado com os iniciadores correspondentes à sequência da hSTAT3 original, publicada. Uma vez que os iniciadores da US1/LS1 não originaram qualquer produto de amplificação significativo, nós quisemos verificar se este insucesso era devido a um defeito nos iniciadores, quer na sua capacidade intrínseca para emparelhar com a cadeia molde apropriada quer na sua capacidade para preparar a reacção de amplificação.
Por outras palavras, nós quisemos validar o par de iniciadores US1/LS1. Assim foram concebidos iniciadores de validação US4/LS4 que se assemelhavam exactamente aos iniciadores US1/LS1, mas em que cada um dos iniciadores tinha uma extensão 3' igual à sequência variante da hSTAT3 determinada neste trabalho. A amplificação resultaria então numa cadeia molde híbrida artificial constituída pelo fragmento da sequência variante da hSTAT3, com as suas extremidades 5' e 3' idênticas aos iniciadores US1 e LSI respectivamente. Esta cadeia molde artificial deveria permitir uma amplificação 22 eficaz com os iniciadores US1/LS1, até mesmo na ausência da correspondente cadeia molde de ADN natural (i.e., o fragmento de ADNc da hSTAT3 original, publicada com 285 bp) .
Esta cadeia molde artificial foi obtida por PCR com iniciadores US4/LS4 e fortificada a concentrações diferentes no ADNc placentário humano e noutros ADNc humanos. Os iniciadores US1/LS1 foram depois utilizados para amplificar estes ADNc fortificados, tendo-se obtido prontamente um produto de PCR do tamanho esperado (Figura 4) . Por conseguinte, este resultado excluiu o fracasso do par de iniciadores US1/LS1 na reacção de amplificação. Nós utilizamos então os pares de iniciadores US1/LS1, US1/LS2 e US3/LS3 para amplificar o ADN genómico humano. 0 produto de amplificação esperado foi novamente obtido apenas com o par iniciador especifico para a nova sequência variante que nós determinamos (Figura 5). Nós demonstramos que as sequências da proteína STAT3 do ratinho e humana revista estão extremamente conservadas, diferindo as duas espécies ao longo dos 770 resíduos de aminoácidos de comprimento total em apenas um resíduo. Nós não conseguimos detectar a sequência de nucleótidos da hSTAT3 originariamente descrita por Akira et al. (Akira et al., 1994) em qualquer uma das fontes de ADN genómico ou ADNc que nós testamos. Por conseguinte, a sequência de nucleótidos original publicada e a nova sequência variante não são genes ou variantes de junção diferentes presentes em simultâneo no mesmo genoma, uma vez que se detectou apenas uma sequência (a identificada neste pedido de 23 patente) em cada fonte de ácido nucleico humano testada. As duas variantes da sequência da hSTAT3 poderiam ser alelos diferentes.
No entanto neste caso, a nova sequência variante é provavelmente predominante, uma vez que estava representada em todas as amostras de ácido nucleico testadas, provenientes de um total de 31 indivíduos. A sequência da hSTAT3 original, publicada não estava representada de todo nestes indivíduos. 24
Referências 1. Akira, S., et al., (1994) Cell 77, 63-71; 2. Azam, M., et al., (1995) EMBO Journal 14, 1402-1411; 3. Birnboim, H. C. (1988) Nucleic Acids Research 16, 1487- 14 9 7; 4. Darnell J. E. (1997) Science 277, 1630-1635; 5. Gouilleux, F., et al., (1995) EMBO Journal 14, 2005- 2013; 6. Gram, H., et al., (1992) Proceedings of the National
Academy of Sciences of the United States of America 89, 3576-3580; 7. Harroch, S., et al., (1994) Journal of Biological
Chemistry 269, 26191-26195; 8. Hemmann, U., et al., (1996) Journal of Biological
Chemistry 271, 12999-13007; 9. Horvath C. M. et al., (1995) Genes & Development 9, 984- 99 4; 10. Iwatsuki, K., et al., (1997) J. Biol. Chem. 272, 8149- 8152; 11. Kapetein, A., et al., (1996) Journal of Biological Chemistry 271, 5961-5964; 12. May, P., et al., (1996) FEBS. Lett. 394, 221-226; 13. Minami, M., et al., (1996) Proceedings of the National
Academy of Sciences of the United States of America 93, 3963-3966; 14. Quelle, F. W., et al., (1995) Molecular & Cellular
Biology 15, 3336-3343; 15. Raz, R., et al., (1994) Journal of Biological Chemistry 269, 24391-24395; 16. Sasse J. et al., (1997) Mol. Cell Biol. 17, 4677-4686; 25 17. Seidel, Η. M., et al., (1995) Proceedings of the
National Academy of Sciences of the United States of America 92, 3041-3045; 18. Shi, W., et al. , (1996) International Immunology 8, 1205-1211; 19. Silva, C. M., et al. , (1996) Molecular Endocrinology 10, 508-518; 20. Stahl, N., et al., (1994) Science 263, 92-95; 21. Stahl, N., et al., (1995) Science 267, 1349-1353; 22. Tian, S. S., et al., (1994) Blood 84, 1760-1764; 23. Wegenka, U. M., et al., (1993) Mol. Cell Biol. 13, 276- 288; 24. Wegenka, U. M., et al. , (1994) Molecular & Cellular Biology 14, 3186-3196; 25. Yamanaka, Y., et al. , (1996) EMBO Journal 15, 1557- 1565; 26. Zhang, D., et al. , (1996) Journal of Biological Chemistry 271, 9503-9509; 27. Zhong, Z., et al., (1994) Science 264, 95-98. 1
LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL:
(i) REQUERENTE (A) NOME: APPLIED RESEARCH SYSTEMS ARS HOLDING N.V.
(B) RUA: 14 JOHN B. GORSIRAWEG
(C) CIDADE: CURACAO
(E) PAÍS: ANTILHAS HOLANDESAS
(F) CÓDIGO POSTAL: NENHUM (G) TELEFONE: 599-9-639300 (H) TELEFAX: 599-9-614129
(I) TELEX: NENHUM
(ii) TÍTULO DA INVENÇÃO: VARIANTE ALÉLICA DA STAT3 HUMANA (iii) NÚMERO DE SEQUÊNCIAS: 19 (iv) FORMA LEGÍVEL POR COMPUTADOR: (A) TIPO DE MEIO: Disquete
(B) COMPUTADOR: IBM compatível com PC
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, Versão #1.30 (2) INFORMAÇÃO PARA SEQ ID NO: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2344 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MEN SAGEIRA: NÃO 2 (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..2310 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: ATS GCC CM i W laf MT CAG cm CAG CAG CTT GAC ACA CGG TAC CTG GAG 48 .Met 1 Ala Gin Trp &sn 5 Gin L*u Gin Gin Leu 10 Asp Thr Axg Tyr Leu 15 Glu CAG CTC €AT CAG CTC TAC AGT GAC ASC TTC CCA ATO GAS CTG CGG CAG 96 0-1Ϊ5. teu :His 61 π teu Tyr Ser Asp Ser Phé J?ro Net Glu Leu Arg Gin 20 2:5 30 TXT CTG GCC ccr TGS ATT GAG AG? CAA GAT TGG CCA TAT GCG GCC AGC 144 PtlS: Leu Ala Pr o Trp lie Glu Ser Gin Asp Trp Ala Tyr Ala Ala Ser 35 40 45
MA. 6AA TGA CAT GCC ACT TTG GTG TTT CAT MT CTC CTG GGA GAG ATT 152 lys Glu. Ser His Ala Thr Leu Vai Pb* His Ãsn Leu Leu 61 y GiU íie 50 55 60 GAC CAG CAG TAX AGC CGC TTC CTG CM CAG TCG AAT GTT CTC TAT CAG 240 fep Gin Gin Tyr Ser Arg The Leu Gin Slu Ser Aan Vai Leu Tyr Gin 65 70 7 5 80 CAC MT CTA OSA ÀGA ATC AAG CAG TTT CAG AGC ASG 7ΆΤ CTT SAS 268 His ÀSO Leu Arg Arg Ile Lys Gin The Leu Gin Ser Arg Tyr Leu Glu 85 SO 55 MS CCA ATG MG ATT GCC CGG ATT GTG CCC CGG TSC CTG TGG GM GM 336 Lys Ara Metfc Glu XI e Ale A zg Ua Vai Ala Arg Cyá Lau Trp Glu Glu 100 .1.05 110 CGC CTT CTA CAG ACT GCA CCC ACT GCS GCC CAG CAA GGG GGC CAG 384 Ser Arg Leu Leu Gin Thr Ara Ala Thr Alá Ais Gin Gin Sly Sly Gi ri 115 120 125 GCC AAC CAC CCC ACA GCA GCC GTG GTG ACG GAG AAC CAG CAG ATG CTG 432 Ala Asn Ki.s Pro Thr Ala Ala. Vai Vai Thr Slu Lys Gin Gin Met Leu 130 135 i’4Ô GAG CAG CAC CTT CAG SAT 6TC CGG AAG AáA GTG CAG GAT CTA MA CAG 480 Glu Gin Hís. Leu Gin Asp Vai Arg & Àrg Vã.1 Glu Asp Leu Glu 61¾ 145 ISO 15*5 160 AM ATS AAA GTG GTA GAG AAT CTC CAG Γ! W ou·’, i GAC TTT GAT TTC AAC TAT 528 Lys Me t Lys Vai Vai Glu Ajsíi Leu Gin Asp Asp Phs Asp Phe Asri Tyr 165 170 175 AM ACC CTC AAG Mf CAA gga GAC ATS CAA GAf CTG MT GGA AAC AAC 576 Lys Thr Leu Lys Ser Gin Siy Asp Mefc Gin Asp Leu Asn Sly As Si Aso ISO MS ISO 3 CAG TCA STG ACC AGS CAG AAS ATS CAG CAG CTG GAA CAG ATG CTC ACT 624 Gin Ser Va.l Thr Arg Glu Lys «et Gin Gin teu Glíi Sln «et teu Thr 195 200· 205 GCG CTG gac CAG ATC CGC AOA AGC Aí, Xv GTG AST GAG CTG GCG EíGG CTT 672 .Ala Leu Asp Gin Met Ara Arg Set lie Vai Ser Glu Leu Alâ Gly LéU 2X0 215 22Ô TTG TCA GCG ATC GAG TAC GTG CAG AaA ACT CTC ACG GAC CAG GAG CTG 720 Leu Ser Ai a Hat Glu Tyr Vai Gin Lys Thr teu The Asp Glu Giu Leu 225 230 235 240 SCT íãAC TOO MG AGO CGG CAA CAG ATT GOC leeyVN· ATT «GA G^GC CCS CCC ?M Ala Asp Tfp Lys heq Arg Gin Gin lie Ala. Cys U« Giy Gly £r© Pr o MÍ 256 255 MC ATC TOC cm «AT cm cm GAA AAC TGG ATA ACG TCA TTA GCA. GM S16 Asm Ile Cys teu Asp Aeg Leu 01 u Asn Trp lie The Ser Léu Ma Glu 260 .265 270 TC? CAA CAG ACC CGT CAA ATT MG .AAA CTG GAG QAC TTG CAG 864 Ser Gin Leu. Gin Th£ Arg Gin Gin ile Lys Lys teu biiii Glu Leu Gin 275 280 285 CM AAA STT TCC TAC AAA QCQ. GAC ATT GTA CAG GAC CGG CCG ATG 912 Gin Lys Vai ser Lys Gly Asp Pro ile Vai Gin Hiâ Arg Prs Met 290 .205 309 CTG GAG ÀGÀ ATC CTC «AG CTG TTT AC.A AAC TTA ATG AAA ACT CCC 960 Leu GlU Gi.lu Arg Ile Vai Glís teu 0he Arg Asa teu «et Lys Ser Ale 305 310 315 320 TTT STG GTG GA-G CGG CAG CCC TGC ATO CCC ATG CAT CCT GAC CGG CCC 1008 Phe Vai Vai Giu Arg Gin Trs Cys «et Prô «et His Pre Asp Arg Fre 325 33Q 335 CTC «TC ATC MG ACC GGC GTC CAG TTC ACT ACT AAA GTC AGC TTG CTG ΐΰ Sê Leu Vai Us Lys Thr Gly Vai Gin Phe The The Lys Vai Aeg Leu teu 340 345 350 GTC MA TTC CCT GAG TTG AAT TAT CAS CTT AAA ATT AAA GTG TGC ATT 004 Vâ.i Lyâ 8he PtO Giu Leu Asn Tvr Gin teu Lys lie Lys Vai cy.s 11« 355 360 365 SAC AAA GAC TCT GG-G GAC GTT GCA j"'r?sn bG X CTC ASA GGA. TCC CGG AM TTT 032 Asp Lya Asp Sêc Gly Asp Vai Alâ. Aiã Leu Arg 51 y ser Arg tys The 370 37 S 3S0 AAC ATT cm GGC Ã.CA AAC ACA AAA GTG ATS AÂC ATG Ghh cm TCC MC 1200 Asn lie Leu Çiy Thr Asn ThE tya Vai «et Asn «et «Xu Glu Ser Asn 38,5 390 39.5 400 AAC CGC A®C CTC TCT GCA GAA TTC AAA CAC TTG ACC. CTG AG® CAL·? CAG 1248 Aati Gly Set Leu Set Ala Glu Phs Lys :hís Leu Thr teu Axg Giu Gin 4 05 410 415 4 4 ASA. TGT GSG AAT GGG GCC CGA GCC ÃAT *SíJl GAT GCT TCC CTG ATT GTG Arg Cys Gly Asn Gly ôiy Arg Ala Asn Cys Asp Ala Ser Leu He Vai 420 425 430 ACT OAG GA6 CTG CAC CTG ATG ACC TTT GAG ACC GAG GTG TAT CA.C CAA The Glu Glu Leu Bis Leu lie Thr Phe GlU Thr Glu vai Tyr sis Gin 435 440 44 5 GGC CTC AAS ATT GAC CTA GAG ACC CAC TCC TTC CCA 6TT GTG GTG ATC Gly Leu tya Ile Asp Leu -Glu Thff His Sér Leu Pr® Val Vàl Vai Ile 450 455 460 TCC AAC ATC TGT CAG Λ-ΙΛ* CCà AAT GCC i ί'ίΚιΡ *»W>* rrr·?* ATC CTG TGS TAC Ser Asn Xis Cys Gin Met Pffô Asn Ala Trp Ala set: Ile Leu Ttp Tyr 465 470 475 ^ § 0 ÂAC ATS CTG ACC .AAC AAT ccc AAG AAT C»TA AAC TTT ACC ccc A.SA Met Leu Th ff Asn Asn Pr® Lys Asn Vai Mn Phe Phe Th ff Lys Pro 48$ 4 90 40$ CCA ATT GGA ACC TGG GAT CAA, STS GCC CTC CTG ÂOC TGG CAG ►íMtí,·**. Pr o Ile Gly TL ff Tffp Asp Gin. Vâ.X AI â Gili Vsl Leu Ser Trp Gin Phe $00 505 5IG TCC TCC ACC ACC AAS CGA GOA GTG ACC ATC GAG CAG CTG ACT ACA /VÍWJe· νΠϊ Ser Ser The Thr Lys Arg Gly Leu Set Ile G.lu Gin Leu Thr Thr Leu 515 $2.0 525 GCA GAG AAA CTC TTG GGA CCT GGT GTG AAT TAT TCA TGT CAG ATC Ala Glu Lys Leu Leu Gly Pr o Gly Vai Asíí Tyr ser Gly Cys Qln He 530 535 540 ACA TGS GCT AAA TTT TGC AAA GAA AAC ATG GCT GCC AÃG GGÇ TTC TCÇ Thr Ttp Ala Lys Phe CVS Lys Glu Asn Met Ala Gly Lys Gly Ph® Ser 545 550 555 $60 TTC TGG GTC TGG CTA GÀC AAT ATC ATC 6AC CTT GTG AAA AAG TAC ATC Phe Trp Vai Trp L®u Asp Asn Ile Ile Aso Leu Val Lys Lys Tyr He 565 570 $75 CTG GCC CTT TGG AAC GAA GGG TAC ATC Ài U G^C TTT ATC AGT ààG GAG Leu Ala Leu Ttp Asn Glu siy Tyr ile Ket Gly He He Ser Lys Glu $80 $85 $3Õ CGO QAG CGS GCC ATC TTG AGC ACT AAG í».o,rçV VVi CCA 6GC ACC TTC CTG cm Arg Glu Arg Ala He Leis Ser Thr Lys Pro Pro Gly Thr Fhe Leu LeU 595 600 605 AGA TTC AGT GAA AGC .ACC AAA GAA CLà CGC GTC ACT TTC ACT TGG GTG Arg Pha Ser Glu Ser Ser Lys Glu Gly Vai Thr Fhe Thff Trp Val 610 615 620 SAG AAG > CAC ATC ACC CGT < AAG .ACC CAG ATC CAC TCC GTG GAA CCA. TAC Glu Lys As;p 11a Ser 61 y : Lys 1 Thr Gin He ser Vai GlU PffO Tyr 625 630 535 64 0 ACA AAC CAC CAG CTC , AAC AAC . ATG TCA TTT GCT GAA ATC ATC ATG GGC Thx Lys 1 Gin Gin Leu , As n j Asn ! Met Ser Phe Ma Glu He 11® Met Gly 645 650 SSS TAT AAG ATC ATG 6AT GCT ACC . AAT ATC CTC GTC rct CCA. CTG GTC TAT Tyr Lys 11¾ Mst Asp Ais Thff . Asn He Leu Vàl Ser Pr® Leu Val Tyr 660 665 670 1296 1344 13¾ 1440 148¾ 1536 1584 1632 1660 1728 1776 1824 1872 1920 1968 2016 5 CSC TAT CCT GAC ATT CCC AAtS CAG GAC GCA TTC CCA AAG TAT TCT CCC 2064 Leu Tyr Pr© As;p 11« Fí© Lys Glu 01« Ala Phe Gly Lys Tyr Cys Arf 675 680 605 CCA GAÇ ACC CM GAG CAT CCT OAA CCT GAC CCA CCT ASC CCT CCC CCA 2112 Pr© 0.1« Ser Gin. Glu His Pr o Glu. Ala Aap eiy Ser Ala Ala Ρ.ΐ* SS8 685 700 ΙΆ1-.- CTG AÀS ACC AAG TTT ATC TGT GTG ACA l-V y-A ACC ACC TCC AGC AAT 2i m Tyr Leis Lys Thr iy* Lhe Ile cys Vai Tkr Pr o Thr The Cys Ser Asn 705 710 715 ?20 ACC ATT SAC CTG CCS ATG TCC CCC CCC ACT TTA mr TCA TTC ATS CAG 22Ô8 lhe U« Asp Leu i S$E £j?9 Açg The Leu Asp Se.s Leu Met Gin 725 730 73 5 TTT GGA AA.T AAT CGT GAA GST GCT GAA CCC· TCA GCA CCA CftG TTT 2256 !?'h* Gly Asm· ft&fi 01 y ciu Çly Al.à Fr© Set Alá Giy Giy Gin The 74 0 745 750 GAG TCC CTC ACC rrr gac ATC GAC TTG ACC 7 CG GAC TCC GCT ACC TCC 2304 Ciu Leu The í»he Mp Môt Glu Leu Thr Ser Ciu Cys Alá Thr Ser 7S5 760 765 CCC ATS TGAGCASCTS ASAACGSftAS CTGCASAAAG ATAC 2344
Pr© Mst 770 (2) INFORMAÇÃO PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 770 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 2: 6
Met Ma Gin Τερ ASR Gin. Leu Gin Gin Leu Asp Thr Arg tyi Leu Glu 1 5 10 15 Gin Leu His Gin pau Tyr Ser Asp Ser Phe p£P Hat 01 u Lais Arg 61n 20 25 30 Pfce Leu Ala Pro Τερ lie Glu S®c Gin Asp Trp Ala Tyr Ala AI a &«r 35 40 46 Lys Olu Ser1 His Alâ Thr Leu Vai Ptse h r a Asn Leu Leu Giy Glu Xle 50 55 69 Asp Gin Gin Tyc Sei Arg Phe Leu Gin Glu Ser As :'i VaL Leu Tyr Gin 65 70 75 80 Hia Aso Leu Arg Arg ,à 1 £ Lys Gin £‘he Leu Gin Ser Arg Tyt Leu Glu SS 90 95 Ly.s Pío Ket Glu 11 e Ala Arg Zle Vai Aj.a Ãrg Cys Leu Trp Olu Glu 109 105 110 Ser Arg Leu Leu Sin Thr Ala Ala The Ala Ala Gin Gin G1 f oiy Gin 116 120 12:5 Ma Asfi His ?;o Thr Ma Alâ Vai Vai TM Glu Lys sin Gin Η«ε Leu 130 135 140 GlU Gin His Leu Sin Asp Vai Arg Lys Ar <? Vai Gin Asp Leu Glu Glu 145 150 155 IGO Lys Mst Lys Vai Vai Glu Asn Leu Gin Asp Asp Phe Asp Phe Asn Tyr 165 170 175 Lys Thr Leu Lys Ser Gin Giy Asp Met Gin Asp Leu Asn 0iy Asn As a ISO xes ISO Gin Ser Vai Thr Acg Gin Lys mt 01 n Gin Leu Glu Gin Hat Leu Thr 195 200 205 Ala Leu Asp Gin Mst Arg Arg Ser 11 e Vai Ser Glu Leu Ala 01 y Leu 210 215 220 Leu Ser Alâ Hat Glvi Tyr vai 51 n Lys TM Leu Thr Asp Glu Glu Leu .225 230 235 .240 Ai S AS p Trp Lys Arg Acg Gin Gin Xle Ala oys lie Giy Giy Pro pro 245 250 255 Asn lia Cys Lsu Asp Arg Leu Glu Asn Trp lie. Thr Ser Leu Ala Glu 260 265 210 Ser Gin Leu Gin Thr Ar g Gin Gin lie Lys ry s Leu Glu Glu LSUi em
275 280 2SS 7
Gin Lys Vai Ser Tyr Lys Gly Asp Peo Ile Val Gin His Arg Pr* Met zm 295 300 teu 51« 51« Arg 11a Vai Glu Leu Êhe Arg Asn Leu Het Lys Ser Ala 305 310 315 320 Phe Vai vax Glu &zq Gin Pro Cys Het Pro Hefc His Pro Asp Arg Pro 325 330 358 Leu Vai Ile tys Thr Gly Vai Gin Xhir Thr Lys Val Arg Leu Leu 340 345 350 Val tys ?h« !? ΧΓφ GlU teu Asn Tyr Gl:n Leu Lys lie Lys Val cys Ile 355 360 u 65 ASJ>- Lys A.sp Set Gly As;p Vai Ala Alá LèU Atg Gly ser Arg Lys Phe 310 375 380 As n ík Leu Gly Thr Asa Thr Cys Vai Ns.t Asn Met Glu Glu Ser Asn 39$ 390· 395 400 Asn Gly .Ser Leu Ser Ala Glu The tys His teu Thr teu Arg Glu Gin 405 410 41:5 Asf Cys Gly Asa Gly eiy Arg Ala Asn Cys Asp A1'U Ser Leu Ile Val 420 425 430 Th r Gltt Glu teu Bi» teu Ile Thr fhe 61« Thr G iU Val Tyr His Gin 435 440 44S Gly tm Lys 11* Aap Leu Glu. The His Ser teu Pec Vai Val Val Ile 450 455 460 ser Aâ ri n« cy* Gin Hat Frõ A» ri Ai.â Ττρ Ala Ser Ile Lé« Trp Tyr 465 470 475 480 Asn Met Leu Thr Asn Asa Fro Lys Asn Val Asn Fhe Phe Thr tys Pres 485 490 495 Peo Ué 615Γ The Tcp Asp Gin Vai Ala Glu vai teu Ser Trp Gin Phe 500 5Ô5 510 Ser Ser fh£ Thr m* Arg Gly Leu set Ile Glu Gin teu Thr Thr Leu 515 520 528 Ala 01« Lys teu Leu Gly Pre Gly Val Asn Tyr Ser Gly Cys Gin Ile 530 535 540 The Trp Ala Lys The Cys Lys Glu Asn M«t Ala Gly Lys Gly Phs» Ser 545 550 555 560 Phe Trp Vai Trp Leu Asp Asn Ile Ile Asp teu Val Lys Lys Tyr Ile SS$ 570 575 teu Alã Le« Trp As ri Glu Gly Tyr Ile Het Gly Pha lie Ser Lys Glu 580 SS$ 590 8
Arç Glu Arg Ala Xle Leu Ser The Lys Pró Pr o Gly Thr Phe Leu Leu S 9 5 600
Arg Phe: Ser Glu Ser Ser Lys slu Gly Gly Vai Thr Fhs Tlir Txp Vai 610 615 S2Q
Glu Lys Asp Xle Ser Gly Lys Thr Gin lie Gin Ser Vai Glu Pm Tyr 625 630 635 640
Thr Lys Gin Gin Leu Asm As* Met Ser Phe Ala Glu Xle lie Met Gly 645 650
Tyr Lys Xle Kefc Asp Ala Thr Asn lie Leu Vai Ser Pro Leu Vai Tyr 660 66S 670
Leu Tyr Pro Aap Xle P*o Lys Glu Glu Ala phe Gly Lys Tyx cys Arg 675 660 m 5
Pro Glu Ser Gin Glu His Pro Glu Ala Asp Pr» Gly Ser Ala Ala Pru 690 695 700
Tyr Leu Lys Thr Lys Phe 11« Cys Vai Thr Pm Thr Thr Cys Ser Asn 705 710 715 729
Thr lie Asp Leu Pre Hat Ser Pm Arg Thr Leu Asp Ser Leu ffefc Gin 72S 73G 735
Phe Gly Asn Asn Gly Glu Gly Ala Glu Fra Ser Ala Gly Gly Gin Phe 740 145 750
Glu ser Leu Thr Phe Asp Hat Glu Leu Thr Ser Glu Cys Ala Thr Ser 755 76Ô 765
Pro Sfet 770 (2) INFORMAÇÃO PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 423 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MEN SAGEIRA: NÃO (v) TIPO DE FRAGMENTO: interno 9 (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOACALIZAÇÃO: 1..423 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: misc_feature (B) LOCALIZAÇÃO: 1..423 (D) OUTRA INFORMAÇÃO:/nota= "domínio SH2 da sequência da hSTAT3 publicada (Akira et al. ) " (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 3: TGG cm ©AC AA? ATC ATC ©AC CTT ©T© TAT ATC TTG GCC crr 43 Τφ Leu Asp Asíí He Ile Asp Lati Vai Lys Lys Ty.r Ile Leu Ala Leu 5 10 15 tgg aat SAA GGG TAC ATC AT© GGT TTC ATC ACC AAG GA© CGG GAG CG© 96 Trp Asn Glu Gly Tyt Ile Mefc Gly Phe lie Ser Lys Glu Arg Glu Arg 20 25 3© 6CC ktc TTG AGC ACT AAS CCC CCA GGG ACC TTC CTG CTG CGC TTC AGT 144 Ais. Ile Leu Ser Thr Lys Pro Pro Gly Thr Phe Leu Leu Arg Phe SèE 3S 40 45 AGC AGC ΑΑΆ SAA GGA GGC STC ACT TTC ACT TG© GTG ©AG AAG GAC 192 Gl u Ser Ser Lys Glu Gly Gly Vai Thr Phe Thr Trp Vai Glu Lys Asp 50 55 eo ATC AGC GGT AAG ACC CAG ATC CAG TCC 3TÔ GAA CCA TAC ACA AAG CAG 240 11¾ Ser ΛΊ 11* Lys Thr Gin Ile Gin Ser Vai Glu Tyr Thr Lys ©lo *65 70 75 8(5 CM CTG AAC AAC AT© TCA TTT GCT GAA ATC ATC AT© GGC TAT M© ATC 268 GXíl L«W Asn A$n Met Ser The Ma Glu Ile Ile Kefe Gly Tyr Lys lie ®5 M §5 AT© GAT GCT ACC AAT ATC CT© TTG TCT CCA CTT ©TC TAT CTC TAT CCT 336 Met Asp Ala Thr Asn 11® L&u Lati Ser Pro Leu Vai Tyr Leu Tyr Pro 100 105 120 SAC ATT ccc A© ©Á© GAG GCA TTC G©© A© TAT TQT CG© CCA GAG AGC 384 Asp Ile Pr© Lys Glu Glu Ma The ©ly Lys Tyr Cys Arg Pre Glu Ser ias 130 135 CAG GA\a: CAT CCT ©AA GCT GAC CCA GCT AGC GCT ©ce CCA 423 Glrs G>ly His F ro Glu Ale Asp Pro Gly Ser Ala Ala Pro 140 145 150 10 (2) INFORMAÇÃO PARA SEQ ID NO: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 141 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 4:
Trp Leu Asp Asn Ile Ile Asp Leu. Vai Lys Lys Tyr Ile Leu Ala Leu 1 5 10 15 Trp Asn Giu Giy Tyr He Mefc. 51 y Phe I le Ser Lys Giu Arg Glu Arg 20 25 30 Alâ. íle Leu Ser Thff Lys Fr© Pre 51 y The FhÈ Leu Leu Arg PAe Ser 35 40 45 Glu Ser Ser Lys Giu Gly Gly Vai Thr Pha Tíu Trp Vai Glu Lys Asp 50 55 60 lk Sér Gly Lys TLr Gin Ile Gin Ser Vai G.l« Pro Tyr Thr Lys Gin 65 70 15 80 Glm Leu Asn Asn Ket Ser Pb.e AI Si Giu Ile Ile Mel. Sly Tyr Lys Ile 85 90 Hat Assp Ala Thr Asei Ile Leu Leu Ser Pro Leu Vai Tyr Leu Tyr Pro 100 103 110 Asp Ile Pro Lys Giu Giu Ale Phe Giy Lys Tyr Cys Arg Pro Giu Ser 115 120 125 Gin Giu Mis Pro Giu Aiâ. Aap Pe<5 Gly Ser Ala Ala Pro 130 135 140 (2) INFORMAÇÃO PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 423 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 11 (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO (v) TIPO DE FRAGMENTO: interno (ix) CARACTERÍSTICA:
(C) NOME/CHAVE: CDS (D) LOACALIZAÇÃO: 1..423 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: misc_feature (B) LOCALIZAÇÃO: 1..423 (D) OUTRA INFORMAÇÃO:/nota= "domínio SH2 da STAT3 murídea" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 5: τββ cm gac aat ATC ATC GAC C7T GTG AAA AAG TAT AT w TTG GCÇ CTT 46 Tcp Leu Asp Asn Ile Ile Asp Leu Vâl Lys Lys Tyr He Leu Ala Leu 5 10 15 TGG AAT GAA GGG TAC ATC ATG GGT TTC ATC AGC AAC GAG CGG GAG CGG 96 Trp Asn G1Gl y Tyr Ile Met Gly Phe lie Ser Lys Glu Arg GrU Arg 20 25 30 GCC AtC CTA AGC ACA AAG ccc CCC GGC ACC TTC CTA CTG CGC TTC AGC 144 Ma lie Leu Ser The Lys PffO Pró Gly Thr The Leu Leu Arg Phe ser 35 40 45 SAG AGC AGC AAA. SAA GGA GGG GTC ACT TTC ACT T>SG GTG GAA AAG GAC 192 Glu Ser Set Lys. Glu Gly Gly Vai Thr Phe Thr Trp Vai Giu Lys Asp $0 55 60 ATC ACT mc AAG ACC CAG ATC CAG TCT GTA GAG CCA TAC ACC AAG CAS 240 IÍ€ Sfiff Gly Lys Tb ff Gin 1)8 Gin Set Vai Glu Píõ Tyr Thr Lys Gin 65 76 75 60 CAS CTS AAG AÃC ATG TCA ttt ccT GAA ATC ATC ATO GGC TAT AAG ATC 268 Gin Leu Asm Asít Met Ser Phe Ala Glu lie lie Met Gly Tyr Lys llfe 05 90 55 ATS GAT GCG ACC AAC ATC CTG GTG TCT CCA err GTC TAC CTC TAC ccc 336 Met Asp Ala Thr Asn lia Leu Vai Ser Pre» Leu Vai Tyr Leu Tyr Pro 100 105 HÚ 12
ATT ccc AAG GAG SAG GCA TTT Àsp Xis iro U5 Lys Giu Slu Ala Phe 120 CAG SAG CAC cec GAA QCC GAC cch Gin GJlU; 130 His Aiu Asp 135 ?ÍO
(2) INFORMAÇÃO PARA SEQ ID 423 ÂA'3 TAC * va « mg CCC GAG AGC Cíl y Ly.â Tyr Cyâ Arg 12$ Pr o Q\\ã Ser GGY ACC TCT pÍ..Ç OCA Gly Ser ser Ma 140 3?£í> NO: 6 : (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 141 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 6:
Trp Lsu A$p Aso. Ilê 11« Asp LsU Vãi Lys Lys Tyr Ils Leu Ais Leu 1 5. 10 15 Trp Mft Siu Gi y 20 Tyr 11« Kêt Gly The 25 11« Ser Lys Glu Arg 30 Glu Ârg Ala Ile Leu Ser Th£ Lys Pro PÉS Gly Thr Phe Le u Leu Arg eh® Ser 35 40 45 Glu Ser Ser Lys Glu Gly Gly Vai Thr Pha Thr Trp Vai Glu Lys Asp S-Ô SS 60 Ile Ser Gly Lys Thr Gin Ile Gin Ser Vai Glu Pro Tyr Thr Lys Gin ê5 70 15 00 Gifi Leu Asn Aso Mèt Ssr Ala Ile Ile Mefc Sly Tyr Lya lia 90 95 Asp Ala Thr Asa lia Lau Vàl $« x. PrsJ Laa Vai Tyr Lau Tyr fra 100 105 110 Mp Ha P:t'0 Lya Glu Gin Ala Phe Sly Lys Tyr Cys Mg ftíQ Glu Ser 115 120 125 Gin Glu His Pr o Glu Ala Asp Pro Gly Ser sar Ala P.ta 130 135 140 2) INFORMAÇÃO PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 47 pares de bases 13 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: AAC&OCATGG CCTGSCmGA CÍAfAlCATC SÃCCTTQTSÃ AAAAGTA 4? (2) INFORMAÇÃO PARA SEQ ID NO: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 39 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 8: ATATATGGAT CCTGGSGCAG CSCTACÇTGG GTCAGCTTC $$ (2) INFORMAÇÃO PARA SEQ ID NO: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 9 TCGCCGSÃAfi CfTCAÇAÇGC GCA6CCCCGG CTTCT (2) INFORMAÇÃO PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1 CTTCRTCACT TTTGTGTTTG TGCCCAGAAT (2) INFORMAÇÃO PARA SEQ ID NO: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11 6&ÇAAA3AC? CJNSSSS&eSf S^çASCTCTC (2) INFORMAÇÃO PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MENSAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 12 TCASTCGTCG AGTATCTTTC TQCAGCTTCC STTCT (2) INFORMAÇÃO PARA SEQ ID NO: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO (iv) ANTI-MEN SAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 13 mmQGGTAC MTCATGGSTT TC (2) INFORMAÇÃO PARA SEQ ID NO: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MEN SAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 14 TCACSATÂGÂ CAfÃGACAAC TGGAGACAA (2) INFORMAÇÃO PARA SEQ ID NO: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO 17
(iv) ANTI-ΜΕΝ SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15: CCfCCfTCff TGCTSCTTfC AtTÚh&G 27 (2) INFORMAÇÃO PARA SEQ ID NO: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MEN SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 16: CGAAGGSTAC ATCATSGGCT TT 22 (2) INFORMAÇÃO PARA SEQ ID NO: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MEN SAGEIRA: NÃO
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 17 CCTCCTTCTT TGCfíSCffTC ACTGAATCTT (2) INFORMAÇÃO PARA SEQ ID NO: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO
(iv) ANTI-MEN SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 18 TSfcASGSTAC ATCATeSGrr TCATCAGTM GGft (2) INFORMAÇÃO PARA SEQ ID NO: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 37 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc
(iii) HIPOTÉTICA: NÃO (iv) ANTI-MEN SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 19 19 19 37
TCAGGATAGA OATAGACAAG TGGAGACMC AGSATAT
Lisboa, 10 de Novembro de 2006
Claims (8)
- REIVINDICAÇÕES Variante alélica da proteína STAT3 humana que compreende a sequência de aminoácidos da SEQ ID NO: 2. Proteína constituída pela sequência de aminoácidos da SEQ ID NO: 2. Proteína de acordo com a reivindicação 1 ou 2 na forma de um sal, derivado ou uma proteína de fusão. Proteína de acordo com a reivindicação 1 ou 2 fundida com imunoglobulina. Molécula de ADN que compreende uma sequência de ADN para a proteína da reivindicação 1 ou 2. Molécula de ADN recombinante que hibridiza em condições rigorosas, isto é 2 x SSC e 0,5% de SDS durante 5 minutos, 2 x SSC e 0,1% de SDS durante 15 minutos; 0,1 x SSC e 0,5% de SDS a 37°C durante 30-60 minutos e depois 0,1 x SSC e 0,5% de SDS a 68°C durante 30-60 minutos, com uma sonda possuindo uma sequência de nucleótidos seleccionada entre a SEQ ID NO:16 e SEQ ID NO:17. Utilização de uma sonda possuindo uma sequência de nucleótidos seleccionada entre SEQ ID NO:16 e 17 para a detecção de uma molécula de ADN possuindo a sequência de nucleótidos da SEQ ID NO:l. 2
- 8. Molécula de ADN de acordo com a reivindicação 5 que compreende a sequência de nucleótidos da SEQ ID N0:1.
- 9. Vector de expressão o qual compreende a molécula de ADN de qualquer uma das reivindicações 5 até 6 ou 8.
- 10. Célula hospedeira compreendendo o vector de expressão da reivindicação 9.
- 11. Processo recombinante para preparar a proteina de qualquer uma das reivindicações 1 até 4, compreendendo cultivar num meio de cultura adequado as células da reivindicação 10.
- 12. Proteina de qualquer uma das reivindicações 1 até 4 para ser utilizada como medicamento.
- 13. Utilização de uma proteína de acordo com qualquer uma das reivindicações 1 até 4 no fabrico de um medicamento para o tratamento de doenças autoimunes e/ou doenças inflamatórias.
- 14. Composição farmacêutica compreendendo a proteína definida em qualquer uma das reivindicações 1 até 4 com um ou mais veículos e/ou excipientes farmaceuticamente aceitáveis. Lisboa, 10 de Novembro de 2006
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP97116061A EP0906953A1 (en) | 1997-09-16 | 1997-09-16 | Allelic variant of human stat3 |
| EP98102774A EP0905234A3 (en) | 1997-09-16 | 1998-02-18 | Allelic variant of human STAT3 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PT1012286E true PT1012286E (pt) | 2006-12-29 |
Family
ID=26145781
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT98951396T PT1012286E (pt) | 1997-09-16 | 1998-09-15 | Variante alélica stat3 humana |
Country Status (10)
| Country | Link |
|---|---|
| US (2) | US6369198B1 (pt) |
| EP (2) | EP0905234A3 (pt) |
| JP (1) | JP2001516578A (pt) |
| AT (1) | ATE343633T1 (pt) |
| AU (1) | AU9743698A (pt) |
| DE (1) | DE69836278T2 (pt) |
| DK (1) | DK1012286T3 (pt) |
| ES (1) | ES2272010T3 (pt) |
| PT (1) | PT1012286E (pt) |
| WO (1) | WO1999014322A2 (pt) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6391572B1 (en) | 1999-08-31 | 2002-05-21 | The Rockefeller University | Methods for identifying modulators of transcriptional activator protein interactions |
| US7094140B2 (en) * | 2003-06-03 | 2006-08-22 | Onfloor Technologies, L.L.C. | Abrasive sanding surface |
| US20060148715A1 (en) * | 2004-12-20 | 2006-07-06 | Baylor College Of Medicine | Structural requirements for STAT3 binding and recruitment to phosphotyrosine ligands |
| JP5495249B2 (ja) * | 2009-02-23 | 2014-05-21 | 富士通株式会社 | 新規化合物、リン酸化阻害剤、インスリン抵抗性改善剤、及び糖尿病の予防乃至治療剤、並びに、スクリーニング方法 |
| US20130177979A1 (en) * | 2010-06-22 | 2013-07-11 | University Of Central Florida Research Foundation, Inc. | Methods and compositions for cell permeable stat3 inhibitor |
| EP2723892A2 (en) * | 2011-06-27 | 2014-04-30 | Galderma Research & Development | New th-17 differentiation markers for rosacea and uses thereof |
| AU2019321449A1 (en) * | 2018-08-15 | 2021-04-01 | The Regents Of The University Of California | IL-10 inhibition for vaccines and immunotherapy |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09506243A (ja) * | 1993-09-24 | 1997-06-24 | ザ ロックフェラー ユニヴァーシティ | レセプター認識因子、蛋白配列およびその使用方法 |
| EP0676469A3 (en) * | 1994-04-04 | 1998-03-25 | Tadamitsu Kishimoto | Transcription Factor APRF |
| US5716622A (en) * | 1995-01-06 | 1998-02-10 | The Rockefeller University | Functionally active regions of signal transducer and activators of transcription |
-
1998
- 1998-02-18 EP EP98102774A patent/EP0905234A3/en not_active Withdrawn
- 1998-09-15 AT AT98951396T patent/ATE343633T1/de not_active IP Right Cessation
- 1998-09-15 AU AU97436/98A patent/AU9743698A/en not_active Abandoned
- 1998-09-15 DK DK98951396T patent/DK1012286T3/da active
- 1998-09-15 DE DE69836278T patent/DE69836278T2/de not_active Expired - Fee Related
- 1998-09-15 JP JP2000511862A patent/JP2001516578A/ja active Pending
- 1998-09-15 WO PCT/EP1998/005844 patent/WO1999014322A2/en not_active Ceased
- 1998-09-15 ES ES98951396T patent/ES2272010T3/es not_active Expired - Lifetime
- 1998-09-15 PT PT98951396T patent/PT1012286E/pt unknown
- 1998-09-15 EP EP98951396A patent/EP1012286B1/en not_active Expired - Lifetime
-
2000
- 2000-03-16 US US09/526,542 patent/US6369198B1/en not_active Expired - Fee Related
-
2002
- 2002-04-08 US US10/117,087 patent/US6660848B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2001516578A (ja) | 2001-10-02 |
| EP1012286A2 (en) | 2000-06-28 |
| EP0905234A2 (en) | 1999-03-31 |
| EP0905234A3 (en) | 1999-06-23 |
| US20030166854A1 (en) | 2003-09-04 |
| WO1999014322A2 (en) | 1999-03-25 |
| EP1012286B1 (en) | 2006-10-25 |
| ES2272010T3 (es) | 2007-04-16 |
| DE69836278T2 (de) | 2007-09-13 |
| DK1012286T3 (da) | 2007-02-12 |
| AU9743698A (en) | 1999-04-05 |
| WO1999014322A3 (en) | 1999-08-05 |
| ATE343633T1 (de) | 2006-11-15 |
| US6660848B2 (en) | 2003-12-09 |
| US6369198B1 (en) | 2002-04-09 |
| DE69836278D1 (de) | 2006-12-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW302369B (pt) | ||
| CZ48296A3 (en) | Protocadherine proteins and their application | |
| CA2398255A1 (en) | Bcl-2-like polynucleotides, polypeptides, and antibodies | |
| EP1165586A1 (en) | TCL-1b GENE AND PROTEIN AND RELATED METHODS AND COMPOSITIONS | |
| CA2394753A1 (en) | Human protein tyrosine phosphatase polynucleotides, polypeptides, and antibodies | |
| PT1012286E (pt) | Variante alélica stat3 humana | |
| CA2398227A1 (en) | 17 human secreted proteins | |
| CA2400638A1 (en) | 7 human ovarian and ovarian cancer associated proteins | |
| WO2001042484A1 (en) | Il-6 like polynucleotide | |
| EP0333201B1 (en) | Human heat shock factor | |
| US20020156258A1 (en) | Transcription factor of MHC class II genes, substances capable of inhibiting this new transcription factor and medical uses of these substances | |
| CA2391594A1 (en) | Trefoil domain-containing polynucleotides, polypeptides, and antibodies | |
| US20030054446A1 (en) | Novel retina-specific human proteins C7orf9, C12orf7, MPP4 and F379 | |
| CA2418676A1 (en) | 21 human secreted proteins | |
| US6403299B1 (en) | DEAH-box proteins | |
| CA2420392A1 (en) | 17 human secreted proteins | |
| CA2395054A1 (en) | Human polynucleotides, polypeptides, and antibodies | |
| CA2423559A1 (en) | 22 human secreted proteins | |
| US20040242468A1 (en) | Gene involved in mineral deposition and uses thereof | |
| CA2420192A1 (en) | 21 human secreted proteins | |
| Shen | Structural and molecular genetic studies of the MHC novel gene RP | |
| CA2420902A1 (en) | 18 human secreted proteins | |
| EP0906953A1 (en) | Allelic variant of human stat3 | |
| WO2004074302A2 (en) | Autosomal recessive polycystic kidney disease nucleic acids and peptides | |
| CA2420705A1 (en) | 17 human secreted proteins |