PT1996238T - Vetores adenovíricos quiméricos e arncd como agonista de tlr3 - Google Patents
Vetores adenovíricos quiméricos e arncd como agonista de tlr3 Download PDFInfo
- Publication number
- PT1996238T PT1996238T PT77521094T PT07752109T PT1996238T PT 1996238 T PT1996238 T PT 1996238T PT 77521094 T PT77521094 T PT 77521094T PT 07752109 T PT07752109 T PT 07752109T PT 1996238 T PT1996238 T PT 1996238T
- Authority
- PT
- Portugal
- Prior art keywords
- nucleic acid
- tlr
- vector
- agonist
- promoter
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims description 126
- 239000000556 agonist Substances 0.000 title claims description 87
- 108091032973 (ribonucleotides)n+m Proteins 0.000 title description 14
- 102000040650 (ribonucleotides)n+m Human genes 0.000 title description 10
- 150000007523 nucleic acids Chemical class 0.000 claims description 123
- 102000039446 nucleic acids Human genes 0.000 claims description 95
- 108020004707 nucleic acids Proteins 0.000 claims description 95
- 239000000427 antigen Substances 0.000 claims description 84
- 108091007433 antigens Proteins 0.000 claims description 84
- 102000036639 antigens Human genes 0.000 claims description 84
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 72
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 68
- 229920001184 polypeptide Polymers 0.000 claims description 67
- 239000000203 mixture Substances 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 42
- 210000004027 cell Anatomy 0.000 claims description 39
- 230000028993 immune response Effects 0.000 claims description 39
- 230000002163 immunogen Effects 0.000 claims description 29
- 239000013604 expression vector Substances 0.000 claims description 20
- 230000014509 gene expression Effects 0.000 claims description 18
- 210000004443 dendritic cell Anatomy 0.000 claims description 17
- 102000002689 Toll-like receptor Human genes 0.000 claims description 16
- 108020000411 Toll-like receptor Proteins 0.000 claims description 16
- 206010022000 influenza Diseases 0.000 claims description 16
- 239000004055 small Interfering RNA Substances 0.000 claims description 16
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 14
- 241000282414 Homo sapiens Species 0.000 claims description 10
- 238000011282 treatment Methods 0.000 claims description 9
- 241000700584 Simplexvirus Species 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 4
- 241000701806 Human papillomavirus Species 0.000 claims description 3
- 101800001690 Transmembrane protein gp41 Proteins 0.000 claims description 3
- 210000002490 intestinal epithelial cell Anatomy 0.000 claims description 3
- 230000037361 pathway Effects 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 description 39
- 150000001413 amino acids Chemical class 0.000 description 38
- 239000002671 adjuvant Substances 0.000 description 35
- 235000001014 amino acid Nutrition 0.000 description 31
- 229940024606 amino acid Drugs 0.000 description 31
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 241000700605 Viruses Species 0.000 description 29
- 239000002773 nucleotide Substances 0.000 description 29
- 102000004169 proteins and genes Human genes 0.000 description 29
- 241001465754 Metazoa Species 0.000 description 28
- 235000018102 proteins Nutrition 0.000 description 28
- 101710154606 Hemagglutinin Proteins 0.000 description 26
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 26
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 26
- 101710176177 Protein A56 Proteins 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 25
- 239000000185 hemagglutinin Substances 0.000 description 25
- 238000012217 deletion Methods 0.000 description 19
- 230000037430 deletion Effects 0.000 description 19
- 101100113692 Caenorhabditis elegans clk-2 gene Proteins 0.000 description 18
- 241000701022 Cytomegalovirus Species 0.000 description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 18
- 241000701161 unidentified adenovirus Species 0.000 description 17
- 238000002965 ELISA Methods 0.000 description 16
- 241000725303 Human immunodeficiency virus Species 0.000 description 16
- 206010028980 Neoplasm Diseases 0.000 description 16
- 210000001744 T-lymphocyte Anatomy 0.000 description 16
- 108091036414 Polyinosinic:polycytidylic acid Proteins 0.000 description 15
- 230000005875 antibody response Effects 0.000 description 15
- 102000009016 Cholera Toxin Human genes 0.000 description 14
- 108010049048 Cholera Toxin Proteins 0.000 description 14
- 201000011510 cancer Diseases 0.000 description 14
- 238000009396 hybridization Methods 0.000 description 14
- 150000001875 compounds Chemical class 0.000 description 13
- 230000003612 virological effect Effects 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- 201000010099 disease Diseases 0.000 description 12
- 239000003446 ligand Substances 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 230000004913 activation Effects 0.000 description 11
- 238000009472 formulation Methods 0.000 description 11
- 239000008194 pharmaceutical composition Substances 0.000 description 11
- 229960005486 vaccine Drugs 0.000 description 11
- 102000004127 Cytokines Human genes 0.000 description 9
- 108090000695 Cytokines Proteins 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000003018 immunoassay Methods 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 9
- 108091033319 polynucleotide Proteins 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- -1 IgM Proteins 0.000 description 8
- 238000007792 addition Methods 0.000 description 8
- 231100000655 enterotoxin Toxicity 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 238000002560 therapeutic procedure Methods 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 238000009739 binding Methods 0.000 description 7
- 208000035143 Bacterial infection Diseases 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 208000036142 Viral infection Diseases 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 208000022362 bacterial infectious disease Diseases 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 102000005962 receptors Human genes 0.000 description 6
- 108020003175 receptors Proteins 0.000 description 6
- 239000013605 shuttle vector Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000009385 viral infection Effects 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 5
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 5
- 108010002350 Interleukin-2 Proteins 0.000 description 5
- 102000000588 Interleukin-2 Human genes 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 230000006052 T cell proliferation Effects 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 239000000147 enterotoxin Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000028996 humoral immune response Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000004005 microsphere Substances 0.000 description 5
- 238000003305 oral gavage Methods 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 102000007469 Actins Human genes 0.000 description 4
- 108010085238 Actins Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 4
- 241001135569 Human adenovirus 5 Species 0.000 description 4
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 229940123384 Toll-like receptor (TLR) agonist Drugs 0.000 description 4
- 210000000612 antigen-presenting cell Anatomy 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000036039 immunity Effects 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 238000007918 intramuscular administration Methods 0.000 description 4
- 230000021633 leukocyte mediated immunity Effects 0.000 description 4
- 125000005647 linker group Chemical group 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000013268 sustained release Methods 0.000 description 4
- 239000012730 sustained-release form Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 239000003970 toll like receptor agonist Substances 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 3
- 101710146739 Enterotoxin Proteins 0.000 description 3
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 3
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- 108010065805 Interleukin-12 Proteins 0.000 description 3
- 102000013462 Interleukin-12 Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 102000018697 Membrane Proteins Human genes 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- 102000011931 Nucleoproteins Human genes 0.000 description 3
- 108010061100 Nucleoproteins Proteins 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- 241000283984 Rodentia Species 0.000 description 3
- 108091008874 T cell receptors Proteins 0.000 description 3
- 230000005867 T cell response Effects 0.000 description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 3
- 229940124613 TLR 7/8 agonist Drugs 0.000 description 3
- 108010067390 Viral Proteins Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000033289 adaptive immune response Effects 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000000259 anti-tumor effect Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 208000037765 diseases and disorders Diseases 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 150000004676 glycans Chemical class 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 229920000831 ionic polymer Polymers 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 150000007524 organic acids Chemical class 0.000 description 3
- 235000005985 organic acids Nutrition 0.000 description 3
- 229920001282 polysaccharide Polymers 0.000 description 3
- 239000005017 polysaccharide Substances 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 230000000770 proinflammatory effect Effects 0.000 description 3
- 230000000069 prophylactic effect Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 210000000813 small intestine Anatomy 0.000 description 3
- 231100000617 superantigen Toxicity 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 2
- IQFYYKKMVGJFEH-OFKYTIFKSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(tritiooxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound C1[C@H](O)[C@@H](CO[3H])O[C@H]1N1C(=O)NC(=O)C(C)=C1 IQFYYKKMVGJFEH-OFKYTIFKSA-N 0.000 description 2
- 102100025230 2-amino-3-ketobutyrate coenzyme A ligase, mitochondrial Human genes 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- HQWQVBJUIIJTRE-LKRNKTNVSA-N 4-amino-n-(5,6-dimethoxypyrimidin-4-yl)benzenesulfonamide;(s)-[2,8-bis(trifluoromethyl)quinolin-4-yl]-[(2r)-piperidin-2-yl]methanol;5-(4-chlorophenyl)-6-ethylpyrimidine-2,4-diamine;hydron;chloride Chemical compound Cl.CCC1=NC(N)=NC(N)=C1C1=CC=C(Cl)C=C1.COC1=NC=NC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1OC.C([C@@H]1[C@@H](O)C=2C3=CC=CC(=C3N=C(C=2)C(F)(F)F)C(F)(F)F)CCCN1 HQWQVBJUIIJTRE-LKRNKTNVSA-N 0.000 description 2
- 208000030507 AIDS Diseases 0.000 description 2
- 108010042708 Acetylmuramyl-Alanyl-Isoglutamine Proteins 0.000 description 2
- 108010087522 Aeromonas hydrophilia lipase-acyltransferase Proteins 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000700199 Cavia porcellus Species 0.000 description 2
- 108010039939 Cell Wall Skeleton Proteins 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 241001227713 Chiron Species 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 241000759568 Corixa Species 0.000 description 2
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 102100027723 Endogenous retrovirus group K member 6 Rec protein Human genes 0.000 description 2
- 241000709661 Enterovirus Species 0.000 description 2
- 101710091045 Envelope protein Proteins 0.000 description 2
- 229920003134 Eudragit® polymer Polymers 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241000590002 Helicobacter pylori Species 0.000 description 2
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102100026720 Interferon beta Human genes 0.000 description 2
- 108090000467 Interferon-beta Proteins 0.000 description 2
- 108010074328 Interferon-gamma Proteins 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- 102000004889 Interleukin-6 Human genes 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 108010074338 Lymphokines Proteins 0.000 description 2
- 102000008072 Lymphokines Human genes 0.000 description 2
- 229930195725 Mannitol Natural products 0.000 description 2
- VVQNEPGJFQJSBK-UHFFFAOYSA-N Methyl methacrylate Chemical compound COC(=O)C(C)=C VVQNEPGJFQJSBK-UHFFFAOYSA-N 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 101100151229 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) msp-4 gene Proteins 0.000 description 2
- 101100255228 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) msp-5 gene Proteins 0.000 description 2
- 108700001237 Nucleic Acid-Based Vaccines Proteins 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 241000282577 Pan troglodytes Species 0.000 description 2
- 101710188315 Protein X Proteins 0.000 description 2
- 241000282806 Rhinoceros Species 0.000 description 2
- 241000710960 Sindbis virus Species 0.000 description 2
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 210000004520 cell wall skeleton Anatomy 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 230000001461 cytolytic effect Effects 0.000 description 2
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- ZUOUZKKEUPVFJK-UHFFFAOYSA-N diphenyl Chemical group C1=CC=CC=C1C1=CC=CC=C1 ZUOUZKKEUPVFJK-UHFFFAOYSA-N 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 229940037467 helicobacter pylori Drugs 0.000 description 2
- 229960002751 imiquimod Drugs 0.000 description 2
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 2
- 238000009169 immunotherapy Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 235000010355 mannitol Nutrition 0.000 description 2
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 2
- BSOQXXWZTUDTEL-ZUYCGGNHSA-N muramyl dipeptide Chemical compound OC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@@H](O)[C@@H]1NC(C)=O BSOQXXWZTUDTEL-ZUYCGGNHSA-N 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 229940023143 protein vaccine Drugs 0.000 description 2
- 229940044601 receptor agonist Drugs 0.000 description 2
- 239000000018 receptor agonist Substances 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 229950010550 resiquimod Drugs 0.000 description 2
- BXNMTOQRYBFHNZ-UHFFFAOYSA-N resiquimod Chemical compound C1=CC=CC2=C(N(C(COCC)=N3)CC(C)(C)O)C3=C(N)N=C21 BXNMTOQRYBFHNZ-UHFFFAOYSA-N 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 210000004988 splenocyte Anatomy 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JEOQACOXAOEPLX-WCCKRBBISA-N (2s)-2-amino-5-(diaminomethylideneamino)pentanoic acid;1,3-thiazolidine-4-carboxylic acid Chemical compound OC(=O)C1CSCN1.OC(=O)[C@@H](N)CCCN=C(N)N JEOQACOXAOEPLX-WCCKRBBISA-N 0.000 description 1
- UGXDVELKRYZPDM-XLXQKPBQSA-N (4r)-4-[[(2s,3r)-2-[[(2r)-2-[(2r,3r,4r,5r)-2-acetamido-4,5,6-trihydroxy-1-oxohexan-3-yl]oxypropanoyl]amino]-3-hydroxybutanoyl]amino]-5-amino-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](C(N)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](C)O[C@@H]([C@H](O)[C@H](O)CO)[C@@H](NC(C)=O)C=O UGXDVELKRYZPDM-XLXQKPBQSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- FBFJOZZTIXSPPR-UHFFFAOYSA-N 1-(4-aminobutyl)-2-(ethoxymethyl)imidazo[4,5-c]quinolin-4-amine Chemical compound C1=CC=CC2=C(N(C(COCC)=N3)CCCCN)C3=C(N)N=C21 FBFJOZZTIXSPPR-UHFFFAOYSA-N 0.000 description 1
- GVEDOIATHPCYGS-UHFFFAOYSA-N 1-methyl-3-(3-methylphenyl)benzene Chemical compound CC1=CC=CC(C=2C=C(C)C=CC=2)=C1 GVEDOIATHPCYGS-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- KYENMFWIKMBWJG-UHFFFAOYSA-N 2-(2,5-diphenyl-1h-tetrazol-1-ium-3-yl)-4,5-dimethyl-1,3-thiazole;chloride Chemical compound [Cl-].S1C(C)=C(C)N=C1N1N(C=2C=CC=CC=2)[NH2+]C(C=2C=CC=CC=2)=N1 KYENMFWIKMBWJG-UHFFFAOYSA-N 0.000 description 1
- KRQUFUKTQHISJB-YYADALCUSA-N 2-[(E)-N-[2-(4-chlorophenoxy)propoxy]-C-propylcarbonimidoyl]-3-hydroxy-5-(thian-3-yl)cyclohex-2-en-1-one Chemical compound CCC\C(=N/OCC(C)OC1=CC=C(Cl)C=C1)C1=C(O)CC(CC1=O)C1CCCSC1 KRQUFUKTQHISJB-YYADALCUSA-N 0.000 description 1
- 101710166488 6 kDa early secretory antigenic target Proteins 0.000 description 1
- 102100024321 Alkaline phosphatase, placental type Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102100022524 Alpha-1-antichymotrypsin Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 102100023635 Alpha-fetoprotein Human genes 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 101001023095 Anemonia sulcata Delta-actitoxin-Avd1a Proteins 0.000 description 1
- 101000641989 Araneus ventricosus Kunitz-type U1-aranetoxin-Av1a Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 241000608319 Bebaru virus Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000588832 Bordetella pertussis Species 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- COXVTLYNGOIATD-HVMBLDELSA-N CC1=C(C=CC(=C1)C1=CC(C)=C(C=C1)\N=N\C1=C(O)C2=C(N)C(=CC(=C2C=C1)S(O)(=O)=O)S(O)(=O)=O)\N=N\C1=CC=C2C(=CC(=C(N)C2=C1O)S(O)(=O)=O)S(O)(=O)=O Chemical compound CC1=C(C=CC(=C1)C1=CC(C)=C(C=C1)\N=N\C1=C(O)C2=C(N)C(=CC(=C2C=C1)S(O)(=O)=O)S(O)(=O)=O)\N=N\C1=CC=C2C(=CC(=C(N)C2=C1O)S(O)(=O)=O)S(O)(=O)=O COXVTLYNGOIATD-HVMBLDELSA-N 0.000 description 1
- 241000232908 Cabassous Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 101001028691 Carybdea rastonii Toxin CrTX-A Proteins 0.000 description 1
- 101000685083 Centruroides infamatus Beta-toxin Cii1 Proteins 0.000 description 1
- 101000685085 Centruroides noxius Toxin Cn1 Proteins 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 101001028688 Chironex fleckeri Toxin CfTX-1 Proteins 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000606153 Chlamydia trachomatis Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 241000222290 Cladosporium Species 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 101000644407 Cyriopagopus schmidti U6-theraphotoxin-Hs1a Proteins 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- YVGGHNCTFXOJCH-UHFFFAOYSA-N DDT Chemical compound C1=CC(Cl)=CC=C1C(C(Cl)(Cl)Cl)C1=CC=C(Cl)C=C1 YVGGHNCTFXOJCH-UHFFFAOYSA-N 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101150029707 ERBB2 gene Proteins 0.000 description 1
- 241000710945 Eastern equine encephalitis virus Species 0.000 description 1
- 206010014611 Encephalitis venezuelan equine Diseases 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 206010066919 Epidemic polyarthritis Diseases 0.000 description 1
- 208000000832 Equine Encephalomyelitis Diseases 0.000 description 1
- 101000867232 Escherichia coli Heat-stable enterotoxin II Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 108010040721 Flagellin Proteins 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 241000224467 Giardia intestinalis Species 0.000 description 1
- 101100024440 Globodera rostochiensis MSP-3 gene Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 101150039660 HA gene Proteins 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 101000608720 Helianthus annuus 10 kDa late embryogenesis abundant protein Proteins 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000733040 Homo sapiens 40S ribosomal protein S19 Proteins 0.000 description 1
- 101000678026 Homo sapiens Alpha-1-antichymotrypsin Proteins 0.000 description 1
- 101000869690 Homo sapiens Protein S100-A8 Proteins 0.000 description 1
- 101000669402 Homo sapiens Toll-like receptor 7 Proteins 0.000 description 1
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 101710123134 Ice-binding protein Proteins 0.000 description 1
- 101710082837 Ice-structuring protein Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 208000002979 Influenza in Birds Diseases 0.000 description 1
- 108010032038 Interferon Regulatory Factor-3 Proteins 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 102100029843 Interferon regulatory factor 3 Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 102000000704 Interleukin-7 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- PIWKPBJCKXDKJR-UHFFFAOYSA-N Isoflurane Chemical compound FC(F)OC(Cl)C(F)(F)F PIWKPBJCKXDKJR-UHFFFAOYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000589242 Legionella pneumophila Species 0.000 description 1
- 241001137872 Leishmania sp. Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- HACHPVCYFLSKSB-UMJDSZQGSA-N ManNAz-DBCO-Pam3CSK4 Chemical compound CCCCCCCCCCCCCCCC(N[C@H](CSCC(COC(CCCCCCCCCCCCCCC)=O)OC(CCCCCCCCCCCCCCC)=O)C(N[C@H](CO)C(N[C@H](CCCCN)C(N[C@H](CCCCN)C(N[C@H](CCCCN)C(N[C@H](CCCCN)C(NCCC(N(C1)C2=CC=CC=C2C2N(C(N[C@H]([C@H](C3)O)[C@H]([C@@H]([C@@H](CO)O)O)O[C@@]3(C(O)=O)O)=O)N=NC2C2=C1C=CC=C2)=O)=O)=O)=O)=O)=O)=O)=O HACHPVCYFLSKSB-UMJDSZQGSA-N 0.000 description 1
- 101710199771 Matrix protein 1 Proteins 0.000 description 1
- 241000608292 Mayaro virus Species 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 241000868135 Mucambo virus Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101001076414 Mus musculus Interleukin-6 Proteins 0.000 description 1
- 241000186362 Mycobacterium leprae Species 0.000 description 1
- 101000944608 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) Chaperonin GroEL 2 Proteins 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- GCPNJNQMYQJMQR-UHFFFAOYSA-N N(=NC1=C(C2=CC=CC=C2C(=C1)N)S(=O)(=O)O)C1=C(C2=CC=CC=C2C(=C1)N)S(=O)(=O)O Chemical compound N(=NC1=C(C2=CC=CC=C2C(=C1)N)S(=O)(=O)O)C1=C(C2=CC=CC=C2C(=C1)N)S(=O)(=O)O GCPNJNQMYQJMQR-UHFFFAOYSA-N 0.000 description 1
- PKFBJSDMCRJYDC-GEZSXCAASA-N N-acetyl-s-geranylgeranyl-l-cysteine Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CSC[C@@H](C(O)=O)NC(C)=O PKFBJSDMCRJYDC-GEZSXCAASA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- HCUVEUVIUAJXRB-UHFFFAOYSA-N OC1=C(C=C(CNC(CCCC=2SC=CC=2)=O)C=C1)OC Chemical compound OC1=C(C=C(CNC(CCCC=2SC=CC=2)=O)C=C1)OC HCUVEUVIUAJXRB-UHFFFAOYSA-N 0.000 description 1
- 208000010195 Onychomycosis Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 101000679608 Phaeosphaeria nodorum (strain SN15 / ATCC MYA-4574 / FGSC 10173) Cysteine rich necrotrophic effector Tox1 Proteins 0.000 description 1
- 241000868134 Pixuna virus Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102000010752 Plasminogen Inactivators Human genes 0.000 description 1
- 108010077971 Plasminogen Inactivators Proteins 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 101000895911 Plasmodium falciparum (isolate Camp / Malaysia) Erythrocyte-binding antigen 175 Proteins 0.000 description 1
- 241001442539 Plasmodium sp. Species 0.000 description 1
- 241000223810 Plasmodium vivax Species 0.000 description 1
- 241000233872 Pneumocystis carinii Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102100029812 Protein S100-A12 Human genes 0.000 description 1
- 101710110949 Protein S100-A12 Proteins 0.000 description 1
- 102100032442 Protein S100-A8 Human genes 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000606726 Rickettsia typhi Species 0.000 description 1
- 241000710942 Ross River virus Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 241000242678 Schistosoma Species 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- 206010040070 Septic Shock Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000607764 Shigella dysenteriae Species 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000191963 Staphylococcus epidermidis Species 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000194049 Streptococcus equinus Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108700042075 T-Cell Receptor Genes Proteins 0.000 description 1
- 241000906446 Theraps Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 208000002474 Tinea Diseases 0.000 description 1
- 241000130764 Tinea Species 0.000 description 1
- 201000010618 Tinea cruris Diseases 0.000 description 1
- 108010060825 Toll-Like Receptor 7 Proteins 0.000 description 1
- 102000008236 Toll-Like Receptor 7 Human genes 0.000 description 1
- 102100039390 Toll-like receptor 7 Human genes 0.000 description 1
- 206010044248 Toxic shock syndrome Diseases 0.000 description 1
- 231100000650 Toxic shock syndrome Toxicity 0.000 description 1
- 241000589884 Treponema pallidum Species 0.000 description 1
- 241000220979 Trichomonas sp. Species 0.000 description 1
- 241000223093 Trypanosoma sp. Species 0.000 description 1
- 101710107540 Type-2 ice-structuring protein Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000005466 Western Equine Encephalomyelitis Diseases 0.000 description 1
- 201000005806 Western equine encephalitis Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000240 adjuvant effect Effects 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 239000008135 aqueous vehicle Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 229940091771 aspergillus fumigatus Drugs 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 206010064097 avian influenza Diseases 0.000 description 1
- 229940065181 bacillus anthracis Drugs 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 235000010290 biphenyl Nutrition 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- UHBYWPGGCSDKFX-UHFFFAOYSA-N carboxyglutamic acid Chemical compound OC(=O)C(N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- SQQXRXKYTKFFSM-UHFFFAOYSA-N chembl1992147 Chemical compound OC1=C(OC)C(OC)=CC=C1C1=C(C)C(C(O)=O)=NC(C=2N=C3C4=NC(C)(C)N=C4C(OC)=C(O)C3=CC=2)=C1N SQQXRXKYTKFFSM-UHFFFAOYSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229940044683 chemotherapy drug Drugs 0.000 description 1
- 229940038705 chlamydia trachomatis Drugs 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- IQFVPQOLBLOTPF-HKXUKFGYSA-L congo red Chemical compound [Na+].[Na+].C1=CC=CC2=C(N)C(/N=N/C3=CC=C(C=C3)C3=CC=C(C=C3)/N=N/C3=C(C4=CC=CC=C4C(=C3)S([O-])(=O)=O)N)=CC(S([O-])(=O)=O)=C21 IQFVPQOLBLOTPF-HKXUKFGYSA-L 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 230000009025 developmental regulation Effects 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 101150079015 esxB gene Proteins 0.000 description 1
- 229960003699 evans blue Drugs 0.000 description 1
- 231100000776 exotoxin Toxicity 0.000 description 1
- 239000002095 exotoxin Substances 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 108700014844 flt3 ligand Proteins 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000003304 gavage Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 238000011239 genetic vaccination Methods 0.000 description 1
- 229940085435 giardia lamblia Drugs 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 108060003552 hemocyanin Proteins 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 229940124669 imidazoquinoline Drugs 0.000 description 1
- 230000008073 immune recognition Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 239000002955 immunomodulating agent Substances 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 208000037797 influenza A Diseases 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 150000007529 inorganic bases Chemical class 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 230000011542 interferon-beta production Effects 0.000 description 1
- 229940117681 interleukin-12 Drugs 0.000 description 1
- 229940100994 interleukin-7 Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 229960002725 isoflurane Drugs 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 229940115932 legionella pneumophila Drugs 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 229940124590 live attenuated vaccine Drugs 0.000 description 1
- 229940023012 live-attenuated vaccine Drugs 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 101150014428 mpt64 gene Proteins 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 230000016379 mucosal immune response Effects 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000007826 nucleic acid assay Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000036281 parasite infection Effects 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 108010031345 placental alkaline phosphatase Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000002797 plasminogen activator inhibitor Substances 0.000 description 1
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 1
- 229920002627 poly(phosphazenes) Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 101150089906 resA gene Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 229940007046 shigella dysenteriae Drugs 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 238000011287 therapeutic dose Methods 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 201000004647 tinea pedis Diseases 0.000 description 1
- 201000005882 tinea unguium Diseases 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229940044616 toll-like receptor 7 agonist Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- LZMSXDHGHZKXJD-VJANTYMQSA-N trypanothione disulfide Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@H]1CSSC[C@H](NC(=O)CC[C@H](N)C(O)=O)C(=O)NCC(=O)NCCCNCCCCNC(=O)CNC1=O LZMSXDHGHZKXJD-VJANTYMQSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 210000001215 vagina Anatomy 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000006648 viral gene expression Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 150000003751 zinc Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/39—Medicinal preparations containing antigens or antibodies characterised by the immunostimulating additives, e.g. chemical adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/145—Orthomyxoviridae, e.g. influenza virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/21—Retroviridae, e.g. equine infectious anemia virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/10—Antimycotics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/18—Antivirals for RNA viruses for HIV
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
- A61P31/22—Antivirals for DNA viruses for herpes viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/02—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
- C12N15/8613—Chimaeric vector systems comprising heterologous sequences for production of another viral vector
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/54—Medicinal preparations containing antigens or antibodies characterised by the route of administration
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/54—Medicinal preparations containing antigens or antibodies characterised by the route of administration
- A61K2039/541—Mucosal route
- A61K2039/543—Mucosal route intranasal
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55561—CpG containing adjuvants; Oligonucleotide containing adjuvants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16111—Human Immunodeficiency Virus, HIV concerning HIV env
- C12N2740/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16211—Human Immunodeficiency Virus, HIV concerning HIV gagpol
- C12N2740/16234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Communicable Diseases (AREA)
- Biochemistry (AREA)
- Mycology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Oncology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Pulmonology (AREA)
- Hematology (AREA)
- AIDS & HIV (AREA)
- Tropical Medicine & Parasitology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Description
DESCRIÇÃO "Vetores adenovíricos quiméricos e ARNcd como agonista de TLR3"
ANTECEDENTES DA INVENÇÃO
As vacinas são um importante meio de prevenir e/ou tratar várias doenças e distúrbios (e.g., infeção virica, infeção bacteriana e cancro). As vacinas baseadas em ácidos nucleicos apresentam várias vantagens relativamente a vacinas de proteína ou a vacinas vivas atenuadas. A introdução de um ácido nucleico que expressa um antigénio numa célula alvo permite o desenvolvimento rápido de uma vacina que gera uma resposta imunitária contra um antigénio de interesse. Para vacinas de proteína, é necessário desenvolver um método eficaz e eficiente para purificação de proteínas de cada vez que se cria uma nova vacina. Para vacinas vivas, é necessário identificar um método de atenuação que não pare completamente o crescimento do agente patogénico, mas que prove ser completamente seguro em humanos. 0 desenvolvimento de metodologias de purificação de proteínas e de atenuação são processos extremamente morosos. Contrariamente, a maioria das vacinas baseadas em ácido nucleico pode ser fabricada muito rapidamente usando sempre as mesmas técnicas de fabrico com apenas uma pequena alteração no ácido nucleico que codifica para o antigénio de interesse. 0 adenovirus incompetente para replicação constitui um sistema de vacina baseado em ácido nucleico que é produzido com títulos elevados de forma rápida, previsível e barata [Polo, J. M. e Dubensky, T. W., Jr., Drug Discov Today, 7(13), 719-727 (2002)]. Contudo, a eficácia da resposta específica do antigénio após administração de vetores adenovíricos conhecidos na área técnica é baixa. O documento US6511845, descreve a imunização por administração intranasal de um vetor adenovírico que expressa um antigénio, seguida de uma ou mais administrações de reforço pelas vias intranasal ou intramuscular do referido adenovirus recombinante. O documento W02005014038 descreve um efeito adjuvante de ARNcd sobre a imunidade mucosa induzida contra um antigénio de subunidade ou contra um antigénio inativado de um agente patogénico. Assim, há uma necessidade na área técnica de novos vetores adenovíricos que possam ser usados para desencadear de forma eficiente uma resposta imunitária contra um antigénio de interesse. A presente invenção satisfaz essas e outras necessidades.
SUMÁRIO DA INVENÇÃO A invenção no seu sentido mais abrangente é tal como definida nas reivindicações independentes.
Uma concretização da invenção proporciona um vetor de expressão adenovirico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista do recetor de tipo toll, (TLR)-3, em que o agonista de TLR-3 é ARNcd (ou "dsRNA" em inglês) heterólogo e em que o ácido nucleico que codifica para o agonista de TLR-3 compreende uma sequência selecionada do grupo que consiste em: SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 e 12; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico. Em algumas concretizações, o polipéptido heterólogo é selecionado entre um polipéptido do invólucro de HIV (e.g., gp41, gpl20 ou gpl60) e polipéptido HA de influenza. Em algumas concretizações, o primeiro e o segundo promotores são o mesmo. Em algumas concretizações, o primeiro e o segundo promotores são diferentes. Em algumas concretizações, os promotores são selecionados entre o promotor de beta-actina e o promotor de CMV. A invenção também proporciona composições imunogénicas compreendendo o vetor de expressão.
Uma concretização adicional da invenção proporciona um vetor de expressão adenovirico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de recetor de tipo toll 3 (TLR-3), em que o agonista de TLR-3 é ARNcd heterólogo; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico para utilização num método de tratamento que desencadeia uma resposta imunitária, o referido método compreendendo a administração de uma quantidade imunogenicamente eficaz do vetor a um indivíduo mamífero tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e por via mucosa tal como vaginal. 0 indivíduo mamífero é, e.g., um roedor tal como um ratinho, um rato ou um porquinho-da-índia ou um primata tal como um chimpanzé, um macaco rhésus ou um ser humano. Em algumas concretizações, o polipéptido heterólogo é expresso numa célula selecionada entre uma célula dendrítica, uma célula de micropregas (célula M) e uma célula epitelial intestinal.
Uma concretização adicional da invenção proporciona uma composição imunogénica, a referida composição compreendendo: (a) um vetor de expressão adenovírico guimérico compreendendo um promotor ligado operacionalmente a um ácido nucleico gue codifica para um polipéptido heterólogo imunogénico; (b) um agonista de TLR-3, em que o agonista de TLR-3 é ARNcd heterólogo; e (c) um transportador farmaceuticamente aceitável; para utilização num método de tratamento gue desencadeia uma resposta imunitária, o referido método compreendendo a administração de uma guantidade imunogenicamente eficaz da composição a um indivíduo mamífero tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e por via mucosa tal como vaginal. 0 indivíduo mamífero é, e.g., um roedor tal como um ratinho, um rato ou um porquinho-da-índia ou um primata tal como um chimpanzé, um macaco rhésus ou um ser humano. A divulgação também proporciona um ácido nucleico isolado compreendendo a sequência apresentada em SEQ ID NO: 1, 2, 6, 7, 13, 14, 15, 16 ou 17.
DESCRIÇÃO SUCINTA DOS DESENHOS A figura 1 ilustra dados que demonstram que um vetor adenovírico quimérico da invenção (i.e., DS1) em combinação com um agonista de TLR-3 é mais eficaz do que um vetor adenovírico padrão (i.e., rAd5) na indução de uma resposta imunitária específica do antigénio após entrega oral do vetor. A figura IA ilustra dados que representam o título de anticorpo contra proteína do invólucro de HIV (i.e., gpl20) 3 semanas após a entrega oral dos vetores adenovíricos. A figura 1B ilustra dados que representam o título de anticorpo contra proteína do invólucro de HIV (i.e., gpl20) 6 semanas após entrega oral dos vetores adenovíricos. A figura 2 ilustra dados que demonstram que um vetor adenovírico quimérico da invenção (i.e., DSlb ou DSlc) em combinação com um agonista de TLR-3 é mais eficaz na indução de uma resposta imunitária específica do antigénio do que um vetor adenovírico padrão (i.e., rAd5). A figura 2A ilustra dados que representam o título de IgG anti-GFP 3 semanas após administração oral dos vetores. A figura 2B ilustra dados que representam a resposta de células T CD8+ a GFP 10 semanas após administração do vetor às 0, 4 e 8 semanas. A figura 2C ilustra dados que representam o título do anticorpo anti-HA 3 semanas após administração oral dos vetores. A figura 3 ilustra dados que demonstram que os vetores adenovíricos quiméricos da invenção são melhores a desencadear respostas imunitárias quando administrados por vias não parentéricas. A figura 3A ilustra dados que representam o título do anticorpo anti-gpl20 3 semanas após administração intramuscular de DS1. A figura 3B ilustra dados que representam o título do anticorpo anti-HA três semanas após administração intranasal de DSlc. A figura 4 ilustra dados que demonstram que os agonistas de ligando de TLR-3 expressos podem induzir ativação de células apresentadoras de antigénio. A figura 4A ilustra dados que apresentam a ativação de células dendríticas pelo ARNcd agonista de TLR-3 lucl expresso. A figura 4B ilustra dados que apresentam a ativação de células dendríticas pelos ARNcd agonistas de TLR-3 lucl e ml expressos. A figura 5 é uma ilustração gráfica dos vetores adenovíricos quiméricos da invenção, i.e., vetores adenovíricos quiméricos compreendendo ácidos nucleicos que codificam para ARNcd agonistas de TLR-3 expressos. A figura 6 ilustra dados que demonstram que os vetores adenoviricos quiméricos da invenção são eficazes na indução de uma resposta imunitária especifica do antigénio após entrega oral. A figura 6 ilustra dados que apresentam o titulo de anticorpo anti-gpl20 3 semanas após administração oral de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl. A figura 7 ilustra dados que demonstram que os agonistas de TLR-7/8 têm uma baixa eficácia na indução de uma resposta imunitária especifica do antigénio. A figura 8 ilustra dados que demonstram que os vetores adenoviricos quiméricos da invenção são eficazes na indução de uma resposta imunitária especifica do antigénio após entrega oral. A figura 8A ilustra dados que apresentam o titulo de anticorpo anti-HA 4 semanas após administração oral de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl. A figura 8B ilustra dados que apresentam o titulo de anticorpo anti-HA 4 semanas ou 7 semanas após administração de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl. A figura 8C ilustra dados que apresentam o titulo de anticorpo anti-HA 3 semanas após administração oral ou intranasal de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl.
DESCRIÇÃO SUCINTA DAS SEQUÊNCIAS SEQ ID N0:1 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS1. SEQ ID NO:2 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS2. SEQ ID NO: 3 apresenta uma sequência de nucleótidos que codifica para um agonista de TLR-3. SEQ ID NO: 4 apresenta uma sequência de nucleótidos que codifica para um agonista de TLR-3. SEQ ID NO :5 apresenta uma sequência de nucleótidos que codifica para um agonista de TLR-3. SEQ ID NO:6 apresenta uma sequência de nucleótidos para um vetor adenovirico quimérico compreendendo um ácido nucleico que codifica para o HA de influenza e um ácido nucleico que codifica para um agonista de TLR-3 (luc), em que o HA de influenza e o agonista de TLR-3 estão na mesma orientação. SEQ ID NO: 7 apresenta uma sequência de nucleótidos para um vetor adenovirico quimérico compreendendo um ácido nucleico que codifica para o HA de influenza e um ácido nucleico que codifica para um agonista de TLR-3 (luc), em que o HA de influenza e o agonista de TLR-3 estão em orientações opostas. SEQ ID NO: 8 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3. As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 9 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3 (gl). As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 10 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3 (luc). As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 11 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3 (ml). As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 12 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3. As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 13 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DSlc. A sequência compreende um nucleótido que codifica para HA(PR8/34). SEQ ID NO: 14 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS2beta-luc. 0 vetor compreende uma sequência que codifica para o agonista de TLR-3 luc sob o controlo do promotor de beta-actina. 0 vetor também compreende locais de clonagem aberta para inserção de sequência(s) de ácido nucleico que codifica(m) para um antigénio de interesse. SEQ ID NO: 15 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS2C-luc. 0 vetor compreende uma sequência que codifica para o agonista de TLR-3 luc sob o controlo do promotor de CMV. 0 vetor também compreende locais de clonagem aberta para inserção de sequência (s) de ácido nucleico que codifica(m) para um antigénio de interesse. SEQ ID NO: 16 apresenta a sequência de nucleótidos para o vetor pShuttle compreendendo uma sequência de ácido nucleico que codifica para o agonista de TLR-3 luc sob o controlo do promotor de CMV e uma sequência de ácido nucleico que codifica para HA (gripe aviária) sob o controlo de um promotor de CMV independente. SEQ ID NO: 17 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico ND1.1 214. 0 ácido nucleico que codifica para o antigénio heterólogo está com texto em negrito e está flanqueado por um local de reconhecimento para Cia I na extremidade 5' e um local de reconhecimento para Not I na extremidade 3'. A sequência de ácido nucleico que codifica para os agonistas de TLR-3 está em itálico, com a sequência ligante em negrito.
DESCRIÇÃO DETALHADA DA INVENÇÃO A invenção no seu âmbito mais abrangente é tal como definida nas reivindicações independentes. I. Introdução A presente invenção proporciona novos vetores adenoviricos quiméricos que podem ser administrados de forma não parentérica para desencadear uma resposta imunitária contra um antigénio de interesse. Os vetores adenoviricos quiméricos da invenção compreendem um ácido nucleico que codifica para um polipéptido heterólogo e um ácido nucleico que codifica para um agonista de TLR-3. Os vetores adenoviricos quiméricos desencadeiam respostas imunitárias fortes e eficazes, especificas para o polipéptido heterólogo, nomeadamente quando administrados através de uma via não parentérica (e.g., oralmente, intranasalmente ou pela mucosa). A invenção baseia-se na verificação surpreendente de que a administração de ARNcd agonistas de TLR-3 são adjuvantes eficazes quando administrados conjuntamente com vetores viricos. De facto, a utilização de ARNcd como um adjuvante para vetores viricos seria contraintuitiva considerando que a principal utilidade proposta dos miméticos de ARNcd poli I:C foi como agente antivirico [Nemes, et al. , Proc Soc Exp Biol Med. (1969) 132:776; Schafer, et al, Nature. (1970) 226:449;
Fenje, et al, Nature (1970) 226:171.]. II. Definições
As expressões "quimérico" ou "recombinante" tal como aqui utilizadas com referência a, e.g., um ácido nucleico, uma proteína ou um vetor, indicam que o ácido nucleico, a proteína ou o vetor, foram modificados pela introdução de um ácido nucleico ou uma proteína heterólogos ou pela alteração de um ácido nucleico ou uma proteína nativos. Assim, por exemplo, os vetores quiméricos e recombinantes incluem sequências de ácido nucleico que não se encontram na forma nativa (não quimérica ou não recombinante) do vetor. Um vetor de expressão adenovírico quimérico refere-se a um vetor de expressão adenovírico compreendendo uma sequência de ácido nucleico que codifica para um polipéptido heterólogo.
Um "vetor de expressão" é uma construção de ácido nucleico, gerada de forma recombinante ou sintética, com uma série de elementos de ácido nucleico especificados que permitem a transcrição de um ácido nucleico especifico numa célula hospedeira. 0 vetor de expressão pode ser parte de um plasmideo, virus ou fragmento de ácido nucleico. Tipicamente, o vetor de expressão inclui um ácido nucleico para ser transcrito, ligado operacionalmente a um promotor.
As expressões "promotor" e "sequência de controlo da expressão" são aqui usadas para referir uma matriz de sequências de controlo de ácido nucleico que dirigem a transcrição direta de um ácido nucleico. Tal como aqui usado, um promotor inclui sequências de ácido nucleico necessárias perto do local de iniciação da transcrição, tal como, no caso de um promotor do tipo de polimerase II, um elemento TATA. Um promotor também inclui opcionalmente elementos facilitadores ou repressores distais, que podem localizar-se a distâncias tão elevadas como de vários milhares de pares de bases a partir do local de iniciação da transcrição. Os promotores incluem promotores constitutivos e promotores indutiveis. Um promotor "constitutivo" é um promotor que é ativo na maioria das condições ambientais e de desenvolvimento. Um promotor "indutivel" é um promotor que é ativo sob regulação ambiental ou de desenvolvimento. A expressão "ligado operacionalmente" refere-se a uma ligação funcional entre uma sequência de controlo da expressão de ácido nucleico (tal como um promotor ou uma matriz de locais de ligação de fatores de transcrição) e uma segunda sequência de ácido nucleico, em que a sequência de controlo da expressão dirige a transcrição do ácido nucleico correspondente à segunda sequência.
As expressões "agonista de TLR" ou "agonista de recetor de tipo Toll" tal como aqui utilizadas, referem-se a um composto que se liga e que estimula um recetor do tipo Toll incluindo, e.g., TLR-2, TLR-3, TLR-6, TLR-7 ou TLR-8. Os agonistas de TLR estão revistos em MacKichan, IAVI Report. 9:1-5 (2005) e Abreu et ai., J Immunol, 174(8), 4453-4460 (2005). Os agonistas induzem transdução de sinal após ligação ao seu recetor.
As expressões "agonista de TLR-3" ou "agonista de recetor do tipo Toll 3" tal como aqui utilizadas, referem-se a um composto que se liga a, e estimula, TLR-3. Identificaram-se agonistas de TLR-3 incluindo ARN em cadeia dupla, ARNcd obtido de vírus, vários análogos de ARN em cadeia dupla sintetizados quimicamente incluindo ácido poli-inosina-policitidílico (poli I:C) - ácido poliadenílico-poliuridílico (poli A:U) e poli I:poli C e anticorpos (ou anticorpos de ligação cruzada) contra TLR-3 que originam produção de IFN-beta [Matsumoto, M, et al, Biochem Biophys Res Commun 24:1364 (2002), de Bouteiller, et al, J Biol Chem 18:38133-45 (2005)]. Os agonistas de TLR-3 também incluem ARNcd expresso (e.g., ARNcd codificados por um ácido nucleico compreendendo uma sequência apresentada em SEQ ID NO: 3, 7, 8, 9, 10, 11 ou 12).
As expressões "agonista de TLR-7/8" ou "agonista de recetor de tipo Toll 7/8" tal como aqui usadas, referem-se a um composto que se liga a, e estimula, o recetor TLR-7 ou o recetor TLR-8; estes recetores reconhecem vários ligandos comuns. Identificaram-se vários agonistas de TLR-7/8 tal como ARN em cadeia simples virico, imiquimod, loxorribina, ácido poliuridilico ou resiquimod. A expressão "heterólogo" quando usada em referência a partes de um ácido nucleico indica que o ácido nucleico compreende duas ou mais subsequências que não se encontram na natureza na mesma relação entre si. Por exemplo, o ácido nucleico é tipicamente produzido de forma recombinante, apresentando duas ou mais sequências de genes não relacionados arranjadas de modo a produzir um novo ácido nucleico funcional, e.g., um promotor de uma fonte e uma região de codificação de outra fonte. De igual modo, uma proteína heteróloga indica que essa proteína compreende duas ou mais subsequências que não se encontram na natureza na mesma relação entre si (e.g., uma proteína de fusão).
As expressões "ácido nucleico" e "polinucleótido" usam-se aqui indiferentemente para referir desoxirribonucleótidos ou ribonucleótidos e seus polímeros nas formas em cadeia simples ou em cadeia dupla. A expressão abrange ácidos nucleicos contendo análogos de nucleótido conhecidos ou resíduos ou ligações de esqueleto modificados, que são sintéticos, de ocorrência natural ou que não são de ocorrência natural, que têm propriedades de ligação semelhantes às do ácido nucleico de referência e que são metabolizados de uma forma semelhante à dos nucleótidos de referência. Os exemplos de tais análogos incluem, fosforotioatos, fosforamidatos, metilfosfonatos, metilfosfonatos quirais, 2-0-metilribonucleótidos, ácidos nucleicos peptídicos (PNA), não se lhes limitando.
Salvo indicação em contrário, uma sequência de ácido nucleico especifica também abrange as suas variantes modificadas conservativamente (e.g., substituições de codão degeneradas) e sequências complementares, assim como a sequência explicitamente indicada. Especificamente, podem obter-se substituições de codão degeneradas pela geração de sequências nas quais a terceira posição de um ou mais (ou de todos) os codões selecionados é substituída por bases mistas e/ou por resíduos de desoxinosina (Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)). A expressão ácido nucleico é usada indiferentemente de gene, ADNc, ARNm, oligonucleótido e polinucleótido.
Antigénio - refere-se a uma proteína ou parte de uma cadeia polipeptídica que pode ser reconhecida por recetores de células T e/ou anticorpos. Tipicamente, os antigénios são derivados de proteínas bacterianas, víricas ou fúngicas.
Uma "dose ou quantidade imunogenicamente eficaz" das composições da presente invenção é uma quantidade que desencadeia ou modula uma resposta imunitária específica ao polipéptido heterólogo. As respostas imunitárias incluem respostas imunitárias humorais e respostas imunitárias mediadas por células. Pode usar-se uma composição imunogénica de forma terapêutica ou profilática para tratar ou prevenir uma doença em qualquer estágio.
As "respostas imunitárias humorais" são mediadas por componentes do sangue, i.e., plasma ou soro, isentos de células; a transferência do soro ou plasma de um indivíduo para outro leva a transferência de imunidade.
As "respostas imunitárias mediadas por células" são mediadas por linfócitos específicos de antigénios; a transferência dos linfócitos específicos de antigénios de um indivíduo para outro leva a transferência de imunidade
Uma "dose terapêutica" ou "quantidade terapeuticamente eficaz" ou "quantidade eficaz" de um vetor adenovirico quimérico ou de uma composição compreendendo um vetor adenovirico quimérico é uma quantidade do vetor ou da composição compreendendo o vetor que evita, alivia, atenua ou reduz a gravidade dos sintomas de doenças e distúrbios associados com a fonte do polipéptido heterólogo (e.g., um vírus, bactéria, um parasita ou um cancro).
Anticorpo - refere-se a um polipéptido codificado por um gene de imunoglobulina ou seus fragmentos que ligam especificamente e reconhecem um antigénio. Os genes de imunoglobulina reconhecidos incluem os genes da região constante capa, lambda, alfa, gama, delta, épsilon e mi, assim como a grande variedade de genes de região variável de imunoglobulina. As cadeias leves classificam-se como capa ou lambda. As cadeias pesadas classificam-se como gama, mi, alfa, delta ou épsilon, que por sua vez definem as classes de imunoglobulinas, IgG, IgM, IgA, IgD e IgE, respetivamente. Células T - refere-se a uma classe específica de linfócitos que expressam um recetor específico (recetor de células T) codificado por uma família de genes. Os genes do recetor de células T reconhecidos incluem loci alfa, beta, delta e gama e os recetores de células T reconhecem tipicamente (mas não universalmente) uma combinação de MHC com um péptido curto.
Resposta imunitária adaptativa - refere-se a reconhecimento de antigénios por células T e/ou por anticorpos.
Células apresentadoras de antigénios (APC, do inglês "Antigen Presenting Cell")) - tal como aqui usado, refere-se a células que são capazes de apresentar péptidos imunogénicos ou seus fragmentos a células T para ativar ou intensificar uma resposta imunitária. As APC incluem células dendríticas, macrófagos, células B, monócitos e outras células que podem ser manipuladas para serem APC eficazes. Tais células podem, embora não necessariamente, ser modificadas geneticamente para melhorar a capacidade para apresentar o antigénio, para melhorar ativação e/ou a manutenção da resposta de células T, para ter efeitos antitumorais por si só e/ou para serem imunologicamente compatíveis com o recebedor (i.e., haplotipo de HLA emparelhado) . Podem isolar-se as APC de qualquer um de entre vários fluidos biológicos e órgãos incluindo medula óssea, sangue periférico, tecidos tumorais e peritumorais e podem ser células autólogas, alogénicas, singénicas ou xenogénicas. As APC utilizam tipicamente um recetor do locus de histocompatabilidade major (MHC) para apresentar polipéptidos curtos a células T.
Adjuvante - é um intensificador da resposta imunitária não especifico. Os adjuvantes adequados incluem, por exemplo, toxina da cólera, monofosforil-lipido A (MPL), adjuvante completo de Freund, adjuvante incompleto de Freund, Quil A e AI (OH) . Os adjuvantes podem também ser as substâncias que provocam ativação de APC e apresentação melhorada de células T através de moléculas de sinalização secundárias tais como recetores de tipo Toll. Os exemplos de recetores de tipo Toll incluem os recetores que reconhecem ARN em cadeia dupla, flagelos bacterianos, LPS, ADN em CpG e lipopéptido bacteriano (revisto recentemente em [Abreu et al., J Immunol, 174(8), 4453-4460 (2005)]) .
As expressões "polipéptido", "péptido" e "proteína" são aqui utilizadas indiferentemente para referir um polímero de resíduos de aminoácido. As expressões aplicam-se a polímeros de aminoácidos nos quais um ou mais resíduos de aminoácido são miméticos químicos artificiais de um aminoácido de ocorrência natural correspondente, assim como a polímeros de aminoácidos de ocorrência natural e polímeros de aminoácidos que não são de ocorrência natural. A expressão "aminoácido" refere-se a aminoácidos de ocorrência natural e sintéticos, assim como análogos de aminoácidos e miméticos de aminoácidos que funcionam de forma semelhante aos aminoácidos de ocorrência natural. Os aminoácidos de ocorrência natural são os codificados pelo código genético, assim como os aminoácidos que são modificados posteriormente, e.g., hidroxiprolina, y-carboxiglutamato e 0-fosfosserina. Os análogos de aminoácidos referem-se a compostos que têm a mesma estrutura química básica que um aminoácido de ocorrência natural, i.e., um carbono y que está ligado a um hidrogénio, um grupo carboxilo, um grupo amino e um grupo R, e.g., homosserina, norleucina, sulfóxido de metionina, metionina-metilsulfónio. Tais análogos têm grupos R modificados (e.g., norleucina) ou esqueletos peptídicos modificados, mas mantêm a mesma estrutura química básica do aminoácido de ocorrência natural. Os miméticos de aminoácidos referem-se a compostos químicos que têm uma estrutura que é diferente da estrutura química geral de um aminoácido, mas que funcionam de forma semelhante a um aminoácido de ocorrência natural.
Os aminoácidos podem ser aqui referidos quer pelos seus símbolos de três letras de conhecimento comum, quer pelos símbolos de uma letra recomendados pela comissão de nomenclatura bioquímica da IUPAC-IUB. De igual modo, os nucleótidos, podem ser referidos pelos seus códigos de letra única habitualmente aceites. "Variantes modificadas conservativamente" aplica-se tanto a sequências de aminoácidos como a sequências de ácido nucleico. Relativamente a sequências de ácido nucleico específicas, as variantes, modificadas conservativamente referem-se a ácidos nucleicos que codificam para sequências de aminoácidos idênticas ou essencialmente idênticas ou, quando o ácido nucleico não codifica para uma sequência de aminoácidos, a sequências essencialmente idênticas. Devido ao código genético ser degenerado, um grande número de ácidos nucleicos funcionalmente idênticos codifica para uma determinada proteína. Por exemplo, os codões GCA, GCC, GCG e GCU codificam todos para o aminoácido alanina. Assim, em cada posição na qual uma alanina é especificada por um codão, o codão pode ser alterado para qualquer dos codões correspondentes descritos sem alterar o polipéptido codificado. Tais variações de ácidos nucleicos são "variações silenciosas" que são uma espécie de variações modificadas conservativamente. Cada sequência de ácidos nucleicos aqui, que codifica para um polipéptido, também descreve todas as variações silenciosas possíveis do ácido nucleico. 0 perito reconhecerá que cada codão num ácido nucleico (exceto AUG, que é habitualmente o único codão para metionina e TGG, que é habitualmente o único codão para triptofano), pode ser modificado para proporcionar uma molécula funcionalmente idêntica. Assim, cada variação silenciosa de um ácido nucleico que codifica para um polipéptido está implícita em cada sequência descrita.
Relativamente às sequências de aminoácidos, o perito reconhecerá que as substituições, deleções ou adições individuais a uma sequência de ácido nucleico, péptido, polipéptido ou proteína que altere, adicione ou elimine um único aminoácido ou uma pequena percentagem de aminoácidos na sequência codificada, é uma "variante modificada conservativamente" em que a alteração resulta na substituição de um aminoácido por um aminoácido quimicamente semelhante. São bem conhecidas na área técnica as tabelas de substituições conservativas que proporcionam aminoácidos funcionalmente semelhantes. Tais variantes modificadas conservativamente são adicionais a variantes polimórficas, homólogos interespécies e alelos da invenção, não os excluindo.
Os seguintes oito grupos contêm, cada um, aminoácidos que constituem substituições conservatives entre si: 1) Alanina (A), Glicina (G); 2) Ácido aspártico (D), Ácido glutâmico (E); 3) Asparagina (N), Glutamina (Q); 4) Arginina I, Lisina (K); 5) Isoleucina (I), Leucina (L), Metionina (M), Valina (V); 6) Fenilalanina (F), Tirosina (Y), Triptofano (W); 7) Serina (S), Treonina (T); e 8) Cisteína (C), Metionina (M) (consultar, e.g., Creighton, Proteins (1984)). A frase "híbrida seletivamente (ou especificamente) com" refere-se à ligação, formação de cadeia dupla ou hibridação de uma molécula apenas com uma sequência de nucleótidos específica sob condições de hibridação rigorosas quando essa sequência está presente numa mistura complexa (e.g., ADN ou ARN celular total ou de biblioteca) A frase "condições de hibridação rigorosas" refere-se a condições sob as quais uma sonda hibridará com a sua subsequência alvo, tipicamente numa mistura complexa de ácidos nucleicos, mas não com outras sequências. As condições rigorosas são dependentes da sequência e serão diferentes em circunstâncias diferentes. As sequências mais longas hibridarão especificamente a temperaturas mais elevadas. Encontra-se um guia extenso para a hibridação de ácidos nucleicos em Tijssen, Techniques in Biochemistry and Molecular Biology-~Hybridization with Nucleic Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays" (1993). Geralmente, selecionam-se condições rigorosas como sendo de cerca de 5-10°C abaixo do ponto de fusão térmico I para a sequência especifica a uma força iónica definida Ph. A Tm é a temperatura (a uma força iónica, Ph e concentração nucleica definidas) à qual 50% das sondas complementares ao alvo hibridam com a sequência alvo no equilíbrio (dado que as sequências alvo estão presentes em excesso, a Tm, 50% das sondas estão ocupadas no equilíbrio). As condições rigorosas serão aquelas nas quais a concentração de sal é inferior a cerca de 1,0 M em ião sódio, tipicamente cerca de 0,01 a 1,0 M de concentração de ião sódio (ou outros sais), a Ph entre 7,0 e 8,3 e a temperatura é pelo menos cerca de 30°C para sondas curtas (e.g., 10 a 50 nucleótidos) e pelo menos cerca de 60°C para sondas longas (e.g., maiores que 50 nucleótidos). Também se podem obter condições rigorosas com a adição de agentes de desestabilização tais como formamida. Para hibridação seletiva ou específica, um sinal positivo é de pelo menos duas vezes a linha de base, opcionalmente é de 10 vezes a hibridação da linha de base. Os exemplos de condições de hibridação rigorosas podem ser os seguintes: formamida a 50%, SSC 5x e SDS a 1%, incubação a 42°C ou SSC 5x, SDS a 1%, incubação a 65 °C, com lavagem com SSC 0,2x e SDS a 0,1% a 65°C.
Os ácidos nucleicos que não hibridam entre si em condições rigorosas são ainda substancialmente idênticos se os polipéptidos que codificam forem substancialmente idênticos. Tal ocorre, por exemplo, quando é criada uma cópia de um ácido nucleico usando a degenerescência de codões máxima permitida pelo código genético. Em tais casos, os ácidos nucleicos hibridam tipicamente em condições de hibridação moderadamente rigorosas. Os exemplos de "condições de hibridação moderadamente rigorosas" incluem uma hibridação num tampão com formamida a 40%, NaCl 1 M, SDS a 1% a 37°C e uma lavagem com SSC IX a 45°C. Uma hibridação positiva é de pelo menos duas vezes a linha de base. Os peritos na especialidade reconhecerão facilmente que se podem utilizar condições alternativas de hibridação e lavagem para proporcionar condições de rigor semelhante. "Anticorpo" refere-se a um polipéptido compreendendo uma região de esqueleto proveniente de um gene de imunoglobulina ou seus fragmentos, que ligam especificamente e reconhecem um antigénio. Os genes de imunoglobulina reconhecidos incluem os genes de região constante capa, lambda, alfa, gama, delta, épsilon e mi, assim como a grande variedade de genes de região variável de imunoglobulina. As cadeias leves classificam-se como capa ou lambda. As cadeias pesadas classificam-se como gama, mi, alfa, delta ou épsilon, que por sua vez definem as classes de imunoglobulina, IgG, IgM, IgA, IgD e IgE, respetivamente.
Um exemplo de unidade estrutural de imunoglobulina (anticorpo) compreende um tetrâmero. Cada tetrâmero é composto por dois pares idênticos de cadeias polipeptídicas, contendo cada par uma cadeia "leve" (cerca de 25 kDa) e uma cadeia "pesada" (cerca de 50-70 kDa) . O terminal N de cada cadeia define uma região variável de cerca de 100 a 110 ou mais aminoácidos principalmente responsáveis pelo reconhecimento do antigénio. As expressões cadeia leve variável (Vl) e cadeia pesada variável (Vh) referem-se a essas cadeias leves e pesadas, respetivamente.
As frases "liga-se especificamente (ou seletivamente)" a um anticorpo ou "especificamente (ou seletivamente) imunorreativo com", em referência a uma proteína ou péptido, referem-se a uma reação de ligação que é determinante da presença da proteína numa população heterogénea de proteínas e outros produtos biológicos. Assim, em condições de imunoensaio designadas, os anticorpos especificados ligam uma proteína específica em quantidade de pelo menos duas vezes a linha de base e não ligam substancialmente em quantidade significativa outras proteínas presentes na amostra. A ligação específica a um anticorpo em tais condições pode necessitar de um anticorpo que é selecionado com base na sua especificidade para uma proteína específica. Por exemplo, podem selecionar-se anticorpos policlonais desenvolvidos contra proteínas de fusão para obter apenas os anticorpos policlonais que são especificamente imunorreativos com a proteína de fusão e não com componentes individuais das proteínas de fusão. Esta seleção pode obter-se retirando anticorpos que apresentem reação cruzada com antigénios individuais. Podem usar-se vários formatos de imunoensaio para selecionar anticorpos que são especificamente imunorreativos com uma proteína específica. Por exemplo, os imunoensaios de ELISA em fase sólida são usados de forma rotineira para selecionar anticorpos que são especificamente imunorreativos com uma proteína (consultar, e.g., Harlow & Lane, Antibodies, A Laboratory Manual (1988), para uma descrição dos formatos e condições de imunoensaios que podem ser usados para determinar imunorreatividade específica). Tipicamente uma reação específica ou seletiva será de pelo menos duas vezes o sinal de linha de base ou ruído e mais tipicamente mais de 10 a 100 vezes a linha de base.
Os polinucleótidos podem compreender uma sequência nativa (i.e., uma sequência endógena que codifica para um polipéptido individual ou ARNcd ou uma sua parte) ou podem compreender uma variante de tal sequência. As variantes de polinucleótidos podem conter uma ou mais substituições, adições, deleções e/ou inserções de modo a que a atividade biológica do polipéptido codificado não diminua, relativamente a um polipéptido compreendendo antigénios nativos. As variantes de polinucleótidos podem conter uma ou mais substituições, adições, deleções e/ou inserções de modo a que a atividade agonista de TLR-3 dos ARNcd codificados não seja diminuída relativamente a um ARNcd que não contém as substituições, adições, deleções e/ou inserções. As variantes apresentam preferentemente pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% relativamente a uma sequência polinucleotídica que codifica para um polipéptido nativo ou uma sua parte ou a uma sequência polinucleotídica que codifica para um ARNcd com atividade de agonista de TLR-3.
As expressões "idêntica" ou percentagem de "identidade", no contexto de duas ou mais sequências de ácido nucleico (e.g., um ARNcd que é um agonista de TLR-3) ou polipeptídicas, refere-se a duas ou mais sequências ou subsequências que são a mesma ou que têm uma percentagem especificada de resíduos de aminoácido ou de nucleótidos que são os mesmos (i.e., 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade ao longo de uma região especificada), quando comparados e alinhados para correspondência máxima ao longo de uma janela de comparação ou região designada tal como medida usando um dos seguintes algoritmos de comparação de sequências ou por alinhamento manual e inspeção visual. Diz-se então que tais sequências são "substancialmente idênticas". Esta definição também se refere a uma sequência de ensaio. Opcionalmente, a identidade existe ao longo de uma região que tem pelo menos cerca de 10 a cerca de 100, cerca de 20 a cerca de 75, cerca de 30 a cerca de 50 aminoácidos ou nucleótidos de comprimento.
Para comparação de sequências, tipicamente uma sequência funciona como uma sequência de referência, contra a qual se comparam as sequências de ensaio. Quando se usa um algoritmo de comparação de sequências, introduzem-se num computador as sequências de ensaio e de referência, designam-se as coordenadas de subsequência, caso necessário e designam-se os parâmetros do programa do algoritmo de sequências. Podem usar-se os parâmetros por omissão do programa ou podem designar-se parâmetros alternativos. O algoritmo de comparação de sequências calcula então a percentagem de identidades de sequência para as sequências de ensaio relativamente à sequência de referência, com base nos parâmetros do programa.
Uma "janela de comparação", tal como aqui usada, inclui referência a um segmento de qualquer uma de entre várias posições contíguas desde cerca de 10 a cerca de 500, cerca de 25 a cerca de 200, 50 a cerca de 150, na qual uma sequência pode ser comparada com uma sequência de referência do mesmo número de posições contíguas, após as duas sequências serem alinhadas de forma ótima. Os métodos de alinhamento de sequências para comparação são bem conhecidos na área técnica. O alinhamento ótimo de sequências para comparação pode efetuar-se, e.g., pelo algoritmo de homologia local de Smith e Waterman, Adv. Appl. Math. 2:482 (1981), algoritmo de alinhamento por homologia de Needleman e Wunsch, J. Mol. Biol. 48:443 (1970), pelo método de busca de semelhança de Pearson e Lipman, Proc. Nat'l. Acad. Sei. USA 85:2444 (1988), pelas implementações computorizadas destes algoritmos (GAP, BESTFIT, FASTA e TFASTA do pacote de utilitários da Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, WI) ou por alinhamento manual e inspeção visual (consultar, e.g., Current Protocols in Molecular Biology (Ausubel et al., ed. 1995 suplemento)).
Um exemplo de um algoritmo útil é PILEUP. 0 PILEUP cria um alinhamento de sequências múltiplo a partir de um grupo de sequências relacionadas usando alinhamentos emparelhados progressivos para evidenciar a relação e a percentagem de identidade de sequência. Também faz a representação gráfica de uma árvore ou dendograma que evidencia as relações entre membros do conjunto que foram usadas para criar o alinhamento. 0 PILEUP usa uma simplificação do método de alinhamento progressivo de Feng e Doolittle, J. Mol. Evol. 35:351-360 (1987). O método usado é semelhante ao método descrito por Higgins e Sharp, CABIOS 5:151-153 (1989). O programa pode alinhar até 300 sequências, cada uma com um comprimento máximo de 5000 nucleótidos ou aminoácidos. O procedimento de alinhamento múltiplo inicia-se com o alinhamento emparelhado das duas sequências mais semelhantes, produzindo um conjunto de duas sequências alinhadas. Alinha-se então este conjunto com a próxima sequência ou conjunto de sequências alinhadas que forem mais fortemente relacionadas. Alinham-se então dois conjuntos de sequências pela simples extensão do alinhamento emparelhado de duas sequências individuais. Obtém-se o alinhamento final através de uma série de alinhamentos emparelhados progressivos. O programa corre designando sequências especificas e as suas coordenadas de aminoácidos ou nucleótidos para as regiões da comparação de sequências e designando os parâmetros do programa. Usando PILEUP, compara-se uma sequência de referência com outras sequências de ensaio para determinar a relação de percentagem de identidade de sequência usando os parâmetros seguintes: peso da falha por omissão (3,00), peso do comprimento da falha por omissão (0,10) e falhas de terminação ponderadas. Pode obter-se PILEUP a partir do pacote utilitário de análise de sequências GCG, e.g., versão 7.0 (Devereaux et al., Nuc. Acids Res. 12:387-395 (1984) .
Outro exemplo de algoritmo que é adequado para determinar percentagem de identidade de sequência e de semelhança de sequência são os algoritmos BLAST e BLAST 2.0, que se descrevem em Altschul et al., Nuc. Acids Res. 25:3389-3402 (1977) e Altschul et al., J. Mol. Biol. 215:403-410 (1990), respetivamente. O utilitário para efetuar análises de BLAST está disponível ao público através de National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/). Este algoritmo envolve primeiramente identificar os pares de sequências com pontuações elevadas (HSP) pela identificação de palavras curtas de comprimento W na sequência em teste, que correspondem ou que satisfazem um limiar de pontuação T com valor positivo quando alinhadas com uma palavra do mesmo comprimento numa sequência de base de dados. Refere-se T como o limiar de pontuação de palavra da vizinhança (Altschul et al., anteriormente). Estes acertos iniciais de palavras vizinhas funcionam como sementes para iniciar buscas para encontrar HSP mais longas que as contenham. Vão-se estendendo os acertos de palavras em ambos os sentidos ao longo de cada sequência desde que tal conduza a um aumento da pontuação acumulada do alinhamento. Calculam-se as pontuações acumuladas usando, para sequências de nucleótidos, os parâmetros M (pontuação de prémio para um par de resíduos correspondentes; sempre >0) e N (pontuação de penalização para resíduos não correspondentes; sempre < 0) . Para sequências de aminoácidos, usa-se uma matriz de pontuação para calcular a pontuação acumulada. Para-se a extensão dos acertos de palavra em cada sentido quando a pontuação acumulada do alinhamento desce de uma quantidade X a contar do seu valor máximo atingido; a pontuação acumulada desce para zero ou abaixo de zero devido à acumulação de um ou mais alinhamentos de resíduos com pontuação negativa ou quando se atinge o final de qualquer uma das sequências. Os parâmetros W, T e X do algoritmo BLAST determinam a sensibilidade e velocidade do alinhamento. O programa BLASTN (para sequências de nucleótidos) usa como valores por omissão um comprimento de palavra (W) de 11, uma expetativa (E) de 10, M=5, N=-4 e uma comparação de ambas as cadeias. Para sequências de aminoácidos, o programa BLASTP usa como valores por omissão um comprimento de palavra de 3 e expetativa (E) de 10 e a matriz de pontuação BLOSUM62 (consultar Henikoff e Henikoff, Proc. Natl. Acad. Sei. USA 89:10915 (1989)) alinhamentos (B) de 50, expetativa (E) de 10, M=5, N=-4 e uma comparação de ambas as cadeias. O algoritmo BLAST também efetua uma análise estatística da semelhança entre duas sequências (consultar, e.g., Karlin e Altschul, Proc. Nat'l. Acad. Sei. USA 90:5873-5787 (1993)). Uma medida de semelhança proporcionada pelo algoritmo BLAST é a probabilidade da soma mínima (P(N)), que proporciona uma indicação da probabilidade pela qual uma semelhança entre duas sequências de nucleótidos ou de aminoácidos ocorreria aleatoriamente. Por exemplo, considera-se que um ácido nucleico é semelhante a uma sequência de referência se a probabilidade da soma mínima numa comparação entre o ácido nucleico de ensaio e o ácido nucleico de referência, for inferior a cerca de 0,2, com maior preferência inferior a cerca de 0,01 e com a maior preferência inferior a cerca de 0,001. III. Composições da presente invenção A invenção proporciona composições compreendendo vetores adenovíricos quiméricos. Em algumas concretizações, os vetores adenovíricos quiméricos da invenção compreendem um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo e um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de TLR3. O primeiro e o segundo promotores podem ser o mesmo ou podem ser diferentes. Em algumas concretizações, o primeiro e o segundo promotores são selecionados independentemente de: o promotor de beta-actina e o promotor de CMV.
Em alguns aspetos da invenção, o vetor adenovírico quimérico compreende o genoma adenovírico (sem os genes El e E3) e um ácido nucleico que codifica para um gene que ativa IRF-3 e outras moléculas de sinalização a jusante de TLR-3. Pode administrar-se o vetor quimérico a uma célula que expressa o gene EI de Ad de modo a que o adenovirus recombinante (rAd) seja produzido pela célula. Este rAd pode ser recolhido e é capaz de um único ciclo de infeção que entregará a composição transgénica a outra célula num mamífero de modo a desencadear respostas imunitárias contra o polipéptido heterólogo. A. Vetores adenovíricos adequados
Em algumas concretizações, o vetor adenovírico é adenovirus 5, incluindo, por exemplo, Ad5 com deleções das regiões E1/E3 e Ad5 com uma deleção da região E4. Outros vetores adenovíricos adequados incluem as estirpes 2, as estirpes 4 e 7 ensaiadas oralmente, os adenovirus entéricos 40 e 41 e outras estirpes (e.g. Ad34) que são suficientes para entregar um antigénio e desencadear uma resposta imunitária adaptativa contra o
antigénio do transgene [Lubeck et al., Proc Natl Acad Sci U S A, , 86(17), 6763-6767 (1989); Shen et al., J Virol, 75(9), 4297-4307 (2001); Bailey et al., Virology, 202(2), 695-706 (1994)]. Em algumas concretizações, o vetor adenovirico é um vetor adenovírico vivo incompetente para replicação (tal como rAd5 com deleção de El e E3), um vetor adenovírico vivo e atenuado (tal como os vírus de deleção E1B55K) ou um vetor adenovírico vivo com replicação de tipo selvagem.
As sequências de controlo de transcrição e de tradução em vetores de expressão para serem usados para transformar células de vertebrado in vivo, podem ser proporcionadas por fontes víricas. Por exemplo, os promotores e facilitadores habitualmente utilizados são derivados, e.g., de beta-actina, de adenovirus, de vírus símio (SV40) e de citomegalovírus humano (CMV) . São adequados, por exemplo, vetores que permitem a expressão de proteínas sob a direção do promotor de CMV, promotor precoce de SV40, promotor tardio de SV40, promotor de metalotioneína, promotor do vírus do tumor mamário murino, promotor do vírus do sarcoma de Rous, promotor de transdutor ou outros promotores que se mostrar serem eficazes para expressão em células de mamífero. Podem usar-se adicionalmente um promotor de genoma vírico e sequências de controlo e/ou de sinalização, desde que tais sequências de controlo sejam compatíveis com a célula hospedeira escolhida. B. Polipéptidos heterólogos
Os ácidos nucleicos que codificam para polipéptidos heterólogos adequados podem ser derivados a partir de antigénios tais como, por exemplo, antigénios víricos, antigénios bacterianos, antigénios de cancro, antigénios fúngicos ou antigénios de parasitas.
Os antigénios víricos podem ser derivados de, por exemplo, vírus da imunodeficiência humana (e.g., gag (p55 e pl60), pol, env (gpl20 e gp41) tal como apresentado em Shiver et al. Nature 415(6869):331 (2002); as sequências genómicas de HIV tal como apresentadas nos números de acesso Genbank EF363127; EF363126; EF363125; EF363124; EF363123; EF363122; EF192592; e EF192591; as sequências de gag de HIV tal como apresentadas nos números de acesso Genbank EF396891; EF396890; EF396889; EF396888; EF396887; EF396886; EF396885; EF396884; EF396883; EF396882; EF396881; EF396880; EF396879; EF396878; EF396877; EF396876; EF39687; EF396874; EF396873; e EF396872; as sequências de pol de HIV tal como apresentadas nos números de acesso Genbank EF396810; EF396809; EF396808; EF396807; EF396806; EF396805; EF396804; EF396803; EF396802; EF396801; EF396800; EF396799; EF396798; EF396797; EF396796; EF396795; EF396794; EF396793; EF396792; e EF396791; e as sequências de env de HIV tal como apresentadas nos números de acesso Genbank 9: EF367234; EF367233; EF367232; EF367231; EF367230; EF367229; EF367228; EF367227; EF367226; EF367225; EF367224; e EF367223, papilomavírus humano (e.g., proteina de cápside LI tal como descrito em, e.g., Donnelly et al. J Infect Dis. 173:314 (1996) e as sequências tal como apresentadas nos números de acesso Genbank EF362755; EF362754; NC_001694; NC_001693; NC_001691; NC_0 016 90; NC_005134; NC_001458; NC_001457; NC_001354; NC_001352; NC_001526; e X94164), virus de Epstein Barr, virus de herpes simplex, virus de herpes humana, rinovirus, virus de Cocksackie, enterovirus, hepatite A, B, C e E (e.g., antigénio de superfície de hepatite B tal como descrito em e.g., Lubeck et al, PNAS USA 86:6763 (1989) e as sequências tal como apresentadas nos números de acesso GenBank AB236481; AB236471; AB206501; AB206489; AB206487; AB221788; AB221777; AB221773; AR 933 671;AR 93367 0; AB236514; AB236513; AB236512; AB236511; AB236510; AB236509; AB236508; AB236507); NS5 de hepatite C (consultar, e.g., números de acesso Genbank X59609; DQ911563; S71627; S70787; S70786; S70341; S62220; S70790; S70789; S70788; e AB204642)), vírus da papeira, vírus da rubéola, vírus do sarampo, poliovirus, vírus da varíola, vírus da raiva e vírus de varicela-zóster. Os antigénios de influenza incluem, e.g., hemaglutinina (HA), proteína 1 de matriz (Ml) e nucleoproteína (NP) (consultar, e.g., Donnelly, et al, Vaccine 15:865 (1997) e as sequências de HA de influenza tal como apresentadas nos números de acesso Genbank AB294219; AB294217; AB294215; AB294213; EF102944; EF102943; EF102942; EF102941; EF102940; EF102939; EF102938; EF102937; EF102936; EF102935; EF102934; EF102933; DQ643982; DQ464354; CY019432; CY019424; CY019416; CY019408; CY019400; CY019392; CY019384; CY019376; CY019368; CY019360; CY019352; EF124794; EF110519; EF110518; EF165066; EF165065; EF165064; e EF165063; as sequências de Ml de influenza tal como apresentadas nos números de acesso Genbank AB292791; CY019980; CY019972; CY019964; CY019956; CY019948; CY019940; CY019628; CY019652; CY019644; CY019932; CY019924; CY019916; CY019908; CY019900; CY019892; CY019884; CY019876; CY019868; CY019860; e as sequências de NP de influenza tal como apresentadas nos números de acesso Genbank AB292790; CY019461; CY019974; CY019966; CY019958; CY019950; CY019942; CY019630; CY019654; CY019646; CY019934; CY019926; CY019918 CY019910; CY019902; CY019894; CY019886; CY019878; CY019870; e CY019862.
Os antigénios víricos adequados também incluem, e.g., proteínas víricas não estruturais. A expressão "proteína vírica não estrutural" tal como aqui usada, refere-se a proteínas codificadas pelo ácido nucleico vírico que não codifica para polipéptidos estruturais, tal como aquelas que constituem a cápside ou a proteína que rodeia o vírus. As proteínas não estruturais incluem as proteínas que promovem a replicação do ácido nucleico vírico e a expressão génica vírica tais como, por exemplo, as proteínas não estruturais 1, 2, 3 e 4 (NS1, NS2, NS3 e NS4, respetivamente) da encefalite equina venezuelana (VEE), EEE ou vírus de Semliki Forest [Dubensky et al., J Virol, 70(1), 508-519 (1996); Petrakova et al J Virol 2005 79(12): 7597-608; patentes U.S. 5 185 440; 5 739 026; 6 566 093; e 5 814 482. Vários exemplos representativos de alfavírus adequados incluem Aura (ATCC VR-368), vírus Bebaru (ATCC VR-600, ATCC VR-1240), Cabassou (números de acesso Genbank AF398387, ATCC VR-922), vírus da chicungunha (ATCC VR-64, ATCC VR-1241), vírus da encefalomielite equina oriental (números de acesso Genbank AY705241, AY7 05240, ATCC VR-65, ATCC VR-1242), Fort Morgan (ATCC VR-924), Getah (ATCC VR-369, ATCC VR-1243), Kyzylagach (ATCC VR-927), Mayaro (ATCC VR-66), vírus Mayaro (ATCC VR-1277), Middleburg (ATCC VR-370), vírus Mucambo (ATCC VR-580, ATCC VR- 1244) , Ndumu (ATCC VR-371), vírus Pixuna (ATCC VR-372, ATCC VR- 1245) , vírus de Ross River (ATCC VR-373, ATCC VR-1246), Semliki Forest (números de acesso Genbank AJ251359, ATCC VR-67, ATCC VR-1247), vírus Sindbis (números de acesso Genbank J02363, ATCC VR-68, ATCC VR-1248), Tonate (ATCC VR-925), Triniti (ATCC VR-469) , Una (ATCC VR-374), encefalomielite equina venezuelana (ATCC VR-69), vírus da encefalomielite equina venezuelana (números de acesso Genbank AY986475, AY973944, NC 001449, ATCC VR-923, ATCC VR-1250 ATCC VR-1249, ATCC VR-532), encefalomielite equina ocidental (ATCC VR-70, ATCC VR-1251, ATCC VR-622, ATCC VR-1252), Whataroa (ATCC VR-926) e Y-62-33 (ATCC VR-375).
Os antigénios bacterianos podem ser derivados de, por exemplo, Staphylococcus aureus, Staphylococcus epidermis, Helicobacter pylori, Streptococcus bovis, Streptococcus pyogenes, Streptococcus pneumoniae, Listeria monocytogenes, Mycobacterium tuberculosis, Mycobacterium leprae, Corynebacterium diphtheriae, Borrelia burgdorferi, Bacillus anthracis, Bacillus cereus, Clostridium botulinum, Clostridium difficile, Salmonella typhi, Vibrio chloerae, Haemophilus influenzae, Bordetella pertussis, Yersinia pestis, Neisseria gonorrhoeae, Treponema pallidum, Mycoplasm sp., Neisseria ransducer sp., Legionella pneumophila, Rickettsia typhi, Chlamydia trachomatis e Shigella dysenteriae, Vibrio cholera (e.g., subunidade B da toxina da cólera tal como apresentada nos números de acesso Genbank U25679; A09803; EF158842; X76391; AF390572; pilus corregulado pela toxina de cólera (TCP) tal como descrito em Wu et al., Infection and Immunity Vol. 69(12):7695 (2001) e tal como apresentado nos números de acesso Genbank NC_002505 e AE004169); Helicobacter pylorii (VacA tal como apresentado nos números de acesso Genbank AY848858; AF 042 7 37; AF042736; AF042735; AF042734; NC_000921; CagA tal como apresentado nos números de acesso Genbank AF043490; AF043489; AF043488; AF043487; NAP tal como apresentado nos números de acesso Genbank AF284121; AF284120; AF284119; AF284118; AF284117; AF284116; AB045143; AB045142; AF227081; AF227080; AF227079; AF227078; AF227077; AF227076; AF227075; AF227074; Hsp ou catalase tal como apresentado no número de acesso Genbank NC_000921; urease tal como apresentado nos números de acesso Genbank AM417610; AM417609; AM417608; AM417607; AM417606; AM417605; AM417604; AM417603; AM417602; AM417601; e AM417600; antigénios de E. coli tal como apresentado nos números de acesso Genbank NC_000913; U00096; NC_002655; BA000007; AE014075; incluindo os antigénios das fímbrias de E. coli tal como apresentado nos números de acesso Genbank AB214865; AB214864; AB214863; AB214862; enterotoxina lábil ao calor de E. coli tal como apresentado nos números de acesso Genbank X83966; V00275; X83966; J01646; V00275; M35581; M17873; M17874; K01995; M61015; M17894; M17101; K00433.
Os antigénios de parasita podem ser derivados de, por exemplo, Giardia lamblia, Leishmania sp., Trypanosoma sp., Trichomonas sp., Plasmodium sp. {e.g., antigénios da proteína de superfície de P. falciparum tal como sequências de pfs25 tal como apresentadas nos números de acesso Genbank XM_001347551; X07802; AF193769; AF179423; AF154117; e AF030628, sequências de pfs28 tal como apresentadas no número de acesso Genbank L25843, sequências pfs45 tal como apresentadas nos números de acesso Genbank EF158081; EF158079; EF158078; EF158076; EF158075; e EF158085, sequências de pfs84, pfs 48/45 tal como apresentadas nos números de acesso Genbank AF356146; AF356145; AF356144; AF 3 5 614 3; AF356142; AF356141; AF356140; AF356139; AF356138; AF 35 6137; AF356136; AF356135; AF356134; AF356133; AF356132; AF356131; AF356130; AF356129; AF356128; AF356127, sequências de pfs 230 tal como apresentadas nos números de acesso Genbank NC_00 0 910; XM_001349564; AE001393; L22219; L08135; e AF269242, antigénios de P. vivax tal como sequências de Pvs25 tal como apresentadas nos números de acesso Genbank DQ641509; DQ641508; DQ641507; AY639972; AY639971; AY639970; AY639969; AY639968; AY639967; AY639966; e AY639965; e sequências de Pvs28 tal como apresentadas nos números de acesso Genbank AB033364; AB033363; AB 0333 62; AB033361; AB033360; AB033359; AB033358; AB033357; AB 0 3335 6; B033355; AB033354; AB033353; AB033352; AB033351; AB0 3335 0; AB033349; AB033348; AB033347; AB033346; e AB033345), Schistosoma sp., Mycobacterium tuberculosis (e.g., sequências de Ag85 tal como apresentadas nos números de acesso Genbank AX253506; AX253504; AX253502; e AX211309; e sequências de MPT64, ESAT-6, CFP10 , R8307, MTB-32, MTB-39, CSP, LSA-1, LSA-3, EXP1, SSP-2, SALSA, STARP, GLURP, MSP-1, MSP-2, MSP-3, MSP-4, MSP-5, MSP-8, MSP-9, AMA-1, proteína integral de membrana do Tipo I, RESA, EBA-175 e DBA tal como apresentadas nos números de acesso Genbank BX842572; BX842573; BX842574; BX842575; BX842576; BX842577; BX842578; BX842579; BX842580; BX842581; BX842582; BX842583; BX842584, e NC_000962 e sequências de HSP65 tal como apresentadas nos números de acesso Genbank AY299175; AY299174; AY2 99144; AF547886; e AF547885) .
Os antigénios de cancro incluem antigénios expressos, por exemplo, em cancro do cólon, cancro de estômago, cancro pancreático, cancro de pulmão, cancro do ovário, cancro da próstata, cancro da mama, cancro da pele (e.g., melanoma), leucemia, linfoma ou mieloma, os exemplos de antigénios de cancro incluem, por exemplo, HPV LI, HPV L2, HPV El, HPV E2, fosfatase alcalina de placenta, AFP, BRCA1, Her2/neu, CA 15-3, CA 19-9, CA-125, CEA, Hcg, ativador de plasminogénio do tipo urocinase (Upa), inibidor do ativador de plasminogénio.
Os antigénios fúngicos podem ser derivados de, por exemplo, Tinea pedis, Tinea corporus, Tinea cruris, Tinea unguium, Cladosporium carionii, Coccidioides immitis, Candida sp., Aspergillus fumigatus e Pneumocystis carinii.
Os ácidos nucleicos gue codificam para polipéptidos imunogénicos são produzidos tipicamente por métodos de ADN recombinante (consultar, e.g., Ausubel, et al. ed. (2001) Current Protocols in Molecular Biology). Por exemplo, as seguências de ADN gue codificam para o polipéptido imunogénico podem ser montadas a partir de fragmentos de ADNc e ligantes de oligonucleótidos curtos ou de uma série de oligonucleótidos ou amplificadas a partir de ADNc usando iniciadores apropriados para proporcionar um gene sintético que é capaz de ser inserido num vetor de expressão recombinante (i.e., um vetor de plasmídeo ou um vetor virico) e expresso numa unidade de transcrição recombinante. Após produção do ácido nucleico que codifica para um polipéptido imunogénico, este pode ser inserido num vetor de expressão recombinante que é adequado para expressão in vivo ou ex-vivo.
Os vetores de expressão recombinantes contêm uma sequência de ADN que codifica para um polipéptido imunogénico ligado operacionalmente a elementos de regulação de transcrição ou tradução adequados derivados de genes de mamífero ou viricos. Tais elementos de regulação incluem um promotor de transcrição, uma sequência de operador opcional para controlar a transcrição, uma sequência que codifica para locais de ligação ribossómicos para ARNm adequados e sequências que controlam a terminação de transcrição e tradução. Pode incorporar-se adicionalmente uma origem de replicação e um marcador selecionável para facilitar o reconhecimento de produtos de transformação. Os genes utilizados nos vetores de expressão recombinantes podem ser divididos entre mais que um vírus de modo a que os produtos génicos estejam em dois vetores diferentes e usam-se os vetores para cotransdução para proporcionar todos os produtos génicos em trans. Pode haver razões para dividir os produtos génicos tal como limitações de tamanho para inserções ou toxicidade dos produtos génicos combinados relativamente às linhas celulares produtoras de vírus. C. Agonistas de TLR-3
Na presente invenção, utiliza-se um agonista de TLR-3 que é um ARNcd heterólogo para estimular reconhecimento imunitário de um antigénio de interesse. Os agonistas de TLR-3 incluem, por exemplo, ARN em gancho de cabelo curto (ARNgc, ou "shRNA" do inglês "short hairpin RNA"), ARN derivado de virus, segmentos curtos de ARN que podem formar cadeias duplas ou ARN em gancho de cabelo curto e ARN de interferência pequeno (ARNip, ou "siRNA" do inglês "short interfering RNA"). Numa concretização da invenção, o agonista de TLR-3 é ARNcd derivado por via virica, tal como por exemplo um ARNcd derivado de um vírus Sindbis ou intermediários de ARNcd vírico [Alexopoulou et ai, Nature 413:732-8 (2001)]. Em algumas concretizações, os agonistas de TLR-3 são um ARN em gancho de cabelo curto. As sequências de ARN em gancho de cabelo curto compreendem tipicamente duas sequências complementares ligadas por uma sequência ligante. A sequência ligante específica não é um aspeto crítico da invenção. Pode usar-se qualquer sequência ligante apropriada desde que não interfira com a ligação das duas sequências complementares para formar um ARNcd.
Em algumas concretizações, o ARN em gancho de cabelo curto compreende uma sequência apresentada em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 ou 12, uma sequência com identidade substancial com uma sequência apresentada em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11, ou 12 ou uma variante de uma sequência apresentada em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 ou 12. Em determinadas concretizações, o ARNcd que é um agonista de TLR-3 não codifica para um polipéptido específico, mas produz uma citocina pró-inflamatória (e.g. IL-6, IL-8, TNF-alfa, IFN-alfa, IFN-beta) quando posto em contacto com uma célula respondedora (e.g., uma célula dendrítica, uma célula mononuclear de sangue periférico ou um macrófago) in vitro ou in vivo. Em alguns casos, administram-se o ácido nucleico que codifica para o agonista de TLR-3 (ARNcd não expressos) e o vetor adenovírico quimérico compreendendo um ácido nucleico que codifica para um antigénio heterólogo na mesma formulação. Em algumas concretizações, o ácido nucleico que codifica para o agonista de TLR-3 e o ácido nucleico que codifica para o antigénio heterólogo estão sob o controlo de promotores diferentes.
Estão disponíveis comercialmente vários análogos de ARN em cadeia dupla sintetizados quimicamente. Estes incluem ácido poli-inosina-policitidílico (poli I:C), ácido poliadenílico: poliuridílico (poli A:U) e poli I:poli C. Os anticorpos (ou a ligação cruzada de anticorpos) para TLR-3 podem também levar à produção de IFN-beta ou de citocina pró-inflamatória [Matsumoto et al, Biochem. Biophys. Res. Commun. 24:1364 (2002), de Bouteiller et al, J Biol. Chem. 18:38133-45 (2005)]. Podem também obter-se segmentos de ARNip de qualquer sequência disponíveis comercialmente, através de fontes tais como Invitrogen. IV. Composições farmacêuticas
As composições farmacêuticas compreendendo os vetores aqui descritos podem também conter outros compostos que podem ser biologicamente ativos ou inativos. Os polipéptidos podem ser, embora não necessariamente, conjugados com outras macromoléculas tal como descrito, por exemplo, nas patentes U.S. 4372945 e 4474757. As composições farmacêuticas podem ser geralmente usadas com objetivos profiláticos e terapêuticos. As composições farmacêuticas podem ser compostas por métodos para proteger contra degradação no estômago tal que o vetor adenovírico quimérico administrado possa atingir os locais pretendidos. Para o ambiente oral, estão disponíveis vários destes, incluindo os sistemas de libertação Eudragit e TimeClock assim como outros métodos especificamente concebidos para adenovirus [Lubeck et al., Proc Natl Acad Sei USA, 86(17), 6763-6767 (1989); Chourasia e Jain, J Pharm Pharm Sei, 6(1), 33-66 (2003)] . Existem também vários métodos já descritos para a microencapsulação de ADN e fármacos para entrega oral (consultar, e.g., publicação de patente U.S. 2004043952). Em algumas concretizações, utilizar-se-á o sistema Eudragit para entregar o vetor adenovírico quimérico ao intestino delgado inferior. Contudo, a entrega em outros locais do intestino delgado deve também funcionar.
Tal como mencionado anteriormente, os vetores adenovíricos quiméricos da invenção podem ser entregues usando quaisquer sistemas de entrega conhecidos dos peritos na especialidade. São bem conhecidas na área técnica várias técnicas de entrega de genes, tais como as descritas por Rolland (1998) Crit. Rev.
Therap. Drug Carrier Systems 15:143-198 e referências aí citadas .
Será evidente que as composições imunogénicas podem conter sais farmaceuticamente aceitáveis dos polinucleótidos que codificam para os polipéptidos heterólogos (e.g., polipéptidos imunogénicos). Tais sais podem preparar-se a partir de bases não tóxicas e farmaceuticamente aceitáveis, incluindo bases orgânicas (e.g., sais de aminas primárias, secundárias e terciárias e aminoácidos básicos) e bases inorgânicas (e.g., sais de sódio, potássio, lítio, amónio, cálcio e magnésio). Alguns exemplos específicos de sais incluem solução salina tamponada com fosfato e solução salina injetável.
Pode utilizar-se nas composições farmacêuticas da presente invenção qualquer transportador adequado conhecido dos peritos na especialidade. Os transportadores adequados incluem, por exemplo, água, solução salina, álcool, uma gordura, uma cera, um tampão, um transportador sólido, tal como manitol, lactose, amido, estearato de magnésio, sacarina sódica, talco, celulose, glucose, sacarose e carbonato de magnésio ou microesferas biodegradáveis (e.g., polilactatopoliglicolato). Estão divulgadas microesferas biodegradáveis adequadas, por exemplo, nas patentes U.S. 4897268; 5075109; 5928647; 5811128; 5820883. O polipéptido imunogénico e/ou o vírus transportador podem ser encapsulados no interior da microesfera biodegradável ou associados a superfície da microesfera.
Tais composições podem também compreender tampões (e.g., solução salina tamponada neutra ou solução salina tamponada de fosfato), hidratos de carbono (e.g., glucose, manose, sacarose ou dextranos), manitol, proteínas, polipéptidos ou aminoácidos tais como glicina, antioxidantes, bacteriostáticos, agentes quelantes tais como EDTA ou glutationa, adjuvantes (e.g., hidróxido de alumínio), solutos que tornam a formulação isotónica, hipotónica ou ligeiramente hipertónica relativamente ao sangue de um recebedor, agentes de suspensão, agentes espessantes e/ou conservantes. Alternativamente, podem formular-se as composições da presente invenção como um liofilizado. Os compostos podem também encapsular-se no interior de lipossomas utilizando tecnologia bem conhecida.
Em algumas divulgações, as composições compreendem adicionalmente um adjuvante. Os adjuvantes adequados incluem, por exemplo, os compostos lipidicos e não lipídicos, toxina da cólera (CT), subunidade B de CT, CTK63 derivado de CT, enterotoxina lábil ao calor (LT) de E. coli, LTK63 derivado de LT, AI (OH)3 e ácidos orgânicos poli-iónicos tal como descrito em e.g., WO 04/020592, Anderson e Crowle, Infect. Immun. 31(1):413-418 (1981), Roterman et al, J. Physiol. Pharmacol, 44(3):213-32 (1993), Arora e Crowle, J. Reticuloendothel. 24(3):271-86 (1978) e Crowle e May, Infect. Immun. 38(3):932-7 (1982)). Os ácidos orgânicos poli-iónicos adequados incluem por exemplo, 6, 6' -[3, 3' -demitil[1,r-bifenil]-4,4'-di-iljbis(azo)bis[ácido 4-amino-5-hidroxi-l,3-naftalenodissulfónico] (azul de Evans) e 3,3'-[1,1'-bifenil]-4,4'-di-ilbis(azo)bis[ácido 4-amino-l-naftalenossulfónico] (vermelho do Congo). Os peritos na especialidade considerarão que os ácidos orgânicos poli-iónicos podem ser usados para qualquer método de vacinação genética em conjunção com qualquer tipo de administração.
Outros adjuvantes adequados incluem imunomoduladores tópicos tais como membros da família da imidazoquinolina, tal como, por exemplo, imiquimod e resiquimod (consultar, e.g., Hengge et al, Lancet Infect. Dis. 1(3):189-98 (2001). Podem também usar-se agonistas de TLR-3 expressos {e.g., ARNcd) e agonistas de TLR-7 (e.g., ARNss).
Estão disponíveis comercialmente adjuvantes adequados adicionais tais como, por exemplo, adjuvantes baseados em alúmen adicionais (e.g., Alhydrogel, Rehydragel, fosfato de alumínio, Algammulin); adjuvantes baseados em óleo (adjuvante incompleto de Freund e adjuvante completo (Difco Laboratories, Detroit, Mich.), Specol, RIBI, TiterMax, Montanide ISA50 ou Seppic MONTANIDE ISA 720); adjuvantes baseados em copolímero em bloco não iónico, citocinas (e.g., GM-CSF ou ligando Flat3); adjuvante 65 de Merck (Merck and Company, Inc., Rahway, N. J.); AS-2 (SmithKline Beecham, Philadelphia, Pa.); sais de cálcio, ferro ou zinco; uma suspensão insolúvel de tirosina acilada; açúcares acilados; polissacáridos derivatizados catiónica ou anionicamente; polifosfazenos; microesferas biodegradáveis; monofosforil-lípido A e Quil A. São também adjuvantes adequados as citocinas, tais como GM-CSF ou interleucina-2, interleucina-7 ou interleucina-12. Podem também usar-se na invenção hemocianinas (e.g., hemocianina de lapa gigante) e hemeritrinas. Os polissacáridos são também adjuvantes adequados tais como, por exemplo, quitina, quitosano e quitina desacetilada. Outros adjuvantes adequados incluem dipéptido de muramilo (MDP, N-acetilmuramil-L-alanil-D-isoglutamina) peptidoglicanos bacterianos e seus derivados (e.g., treonil-MDP e MTPPE). Podem também usar-se como adjuvantes BCG e BCG do esqueleto da parede celular (CWS), com ou sem tre-halosedimicolato. Pode também usar-se tre-halosedimicolato de per se (consultar, e.g., patente U.S. 4579945). As endotoxinas destoxifiçadas são também úteis como adjuvantes sozinhas ou em combinação com outros adjuvantes (consultar, e.g., patentes U.S. 4866034; 4435386; 4505899; 4436727; 4436728; 4505900; e 4520019. As saponinas QS21, QS17, QS7 são também úteis como adjuvantes (consultar, e.g., patente U.S. 5057540; EP 0362279; WO 96/33739; e WO 96/11711). Outros adjuvantes adequados incluem Montanide ISA 720 (Seppic, França), SAF (Chiron, Calif., Estados Unidos), ISCOMS (CSL), MF-59 (Chiron), a série SBAS de adjuvantes (e.g., SBAS-2, SBAS-4 ou SBAS-6 ou suas variantes, disponíveis de SmithKline Beecham, Rixensart, Bélgica) , Detox (Corixa, Hamilton, Mont.) , e RC-529 (Corixa, Hamilton, Mont) .
Estão também contemplados superantigénios para utilização como adjuvantes na presente divulgação. Os superantigénios incluem exoproteínas de estafilococos, tais como as enterotoxinas oí, β, γ e Δ de S. aureus e S. epidermidis e as exotoxinas α, β, γ e Δ de E. coli. As enterotoxinas de estafilococos comuns são conhecidas como enterotoxina A de estafilococos (SEA) e enterotoxina B de estafilococos (SEB), tendo sido descritas enterotoxinas até E (SEE) (Rott et al., 1992). São também úteis como superantigénios a enterotoxina de Streptococcus pyogenes B (SEB), de Clostridium perfringens (Bowness et al., 1992), proteína associada à membrana citoplasmática (CAP) de S. pyogenes (Sato et al, 1994) e toxina 1 de síndrome de choque tóxico (TSST 1) de S. aureus (Schwab et al., 1993).
Nas composições farmacêuticas aqui proporcionadas, a composição de adjuvante pode ser concebida para induzir, e.g., uma resposta imunitária predominantemente do tipo Thl ou Th2. Os níveis elevados de citocinas do tipo Thl (e.g., IFN-gama, TNF-alfa, IL-2 e IL-12) tendem a favorecer a indução de respostas imunitárias mediadas por células a um antigénio administrado. Contrariamente, os niveis elevados de citocinas do tipo Th2 (e.g., IL-4, IL-5, IL-6 e IL-10) tendem a favorecer a indução de respostas imunitárias humorais. Após administração oral de uma composição compreendendo um polipéptido imunogénico tal como aqui proporcionado, será tipicamente desencadeada uma resposta imunitária que inclui respostas do tipo Thl e Th2.
As composições aqui descritas podem ser administradas como parte de uma formulação de libertação prolongada (i.e., uma formulação tal como uma cápsula ou esponja que efetua uma libertação lenta do composto após administração). Tais formulações podem ser geralmente preparadas usando tecnologia bem conhecida (consultar, e.g., Coombes et al. (1996) Vaccine 14:1429-1438). As formulações de libertação prolongada podem conter um polipéptido, polinucleótido ou anticorpo disperso numa matriz transportadora e/ou contido num reservatório rodeado por uma membrana de controlo da velocidade.
Os transportadores para utilização em tais formulações são biocompativeis e podem também ser biodegradáveis; preferentemente a formulação proporciona um nível relativamente constante de libertação do componente ativo. Tais transportadores incluem micropartícuias de poli(lactida-co-glicolida), bem como poliacrilato, látex, amido, celulose e dextrano. Outros transportadores de libertação prolongada incluem biovetores supramoleculares, que compreendem um núcleo hidrofílico não líquido (e.g., um polissacárido ou oligossacárido reticulado) e, opcionalmente, uma camada externa compreendendo um composto anfifílico (consultar, e.g., WO 94/20078; WO 94/23701; e WO 96/06638). A quantidade de composto ativo contida no interior de uma formulação de libertação prolongada depende do local de implante, da velocidade e duração prevista de libertação e da natureza da condição a ser tratada ou prevenida.
As composições farmacêuticas podem ser apresentadas em recipientes de dose unitária ou multidose, tais como ampolas ou frasquinhos selados. Tais recipientes são preferentemente selados hermeticamente para conservar a esterilidade da formulação até à sua utilização. Em geral, as formulações podem ser armazenadas como suspensões, soluções ou emulsões em veículos oleosos ou aquosos. Alternativamente, pode armazenar-se uma composição farmacêutica numa condição liofilizada que requer apenas a adição de um transportador líquido estéril, imediatamente antes da utilização. V. Utilizações terapêuticas da invenção
Um aspeto da presente invenção envolve as composições imunogénicas para utilização num método de tratamento que desencadeia uma resposta imunitária específica do antigénio num indivíduo ou doente com uma doença tal como, por exemplo, uma infeção vírica, uma infeção bacteriana, uma infeção por parasita, uma infeção fúngica ou cancro. Tal como aqui se utilizam, um "indivíduo" ou um "doente" referem-se a qualquer animal de sangue quente tal como, por exemplo, um roedor, um felino, um canino ou um primata, preferentemente um ser humano. Podem usar-se as composições imunogénicas para tratar qualquer estágio da doença, i.e., nos estágios précancro, cancro ou metastáticos, ou para prevenir a doença. Por exemplo, as composições aqui descritas podem ser usadas para tratar uma doença vírica tal como HIV ou hepatite ou para prevenção ou tratamento de cancro. Em tais métodos, as composições farmacêuticas são tipicamente administradas a um doente. 0 doente pode ou não sofrer de uma doença ou distúrbio (e.g., uma infeção vírica, uma infeção bacteriana ou cancro). Assim, as composições farmacêuticas anteriores podem ser usadas para evitar o desenvolvimento de uma doença ou distúrbio (e.g., uma infeção vírica, uma infeção bacteriana ou cancro) ou para tratar um doente que sofre da doença ou distúrbio (e.g., uma infeção vírica, uma infeção bacteriana ou cancro). A doença ou distúrbio podem ser diagnosticados usando critérios aceites geralmente na área técnica. Por exemplo, a infeção vírica pode ser diagnosticada por medição de título de vírus numa amostra de um doente, a infeção bacteriana pode ser diagnosticada por deteção de bactérias numa amostra do doente e o cancro pode ser diagnosticado por deteção da presença de um tumor maligno. As composições farmacêuticas podem ser administradas quer antes, quer após remoção cirúrgica de tumores primários e/ou tratamento tal como administração de radioterapia ou fármacos quimioterapêuticos convencionais. A imunoterapia é tipicamente imunoterapia ativa, na qual o tratamento se baseia na estimulação in vivo do sistema imunitário endógeno do hospedeiro para reagir contra, e.g., tumores ou células infetadas por bactérias ou virus, com a administração de agentes de modificação de resposta imunitária (composições compreendendo ácidos nucleicos que codificam para polipéptidos imunogénicos tal como aqui proporcionados). A frequência de administração das composições profiláticas ou terapêuticas aqui descritas, bem como a dosagem, variarão de indivíduo para indivíduo e podem ser facilmente estabelecidas usando técnicas padrão. Frequentemente podem ser administradas entre 1 e 10 doses ao longo de um período de 52 semanas. Tipicamente administram-se 3 doses, a intervalos de 1 mês, mais tipicamente, administram-se 2-3 doses de 2 em 2 ou de 3 em 3 meses. Para determinadas terapias é possível que os intervalos sejam mais provavelmente de um ano. Posteriormente, podem administrar-se vacinas de reforço periodicamente. Podem ser adequados protocolos alternativos para determinados doentes e doenças e distúrbios específicos. Uma dose adequada é uma quantidade de um composto que, quando administrado tal como descrito anteriormente, é capaz de promover uma resposta imunitária, e.g., uma resposta antitumor, antivírica ou antibacteriana, e é pelo menos 10-50% superior ao nível de base (i.e., não tratado). Tal resposta pode ser monitorizada por medição dos anticorpos antitumor num doente ou por geração dependente de vacina de células T citolíticas capazes de matar, e.g., as células de tumor do doente, as células do doente infetadas com vírus ou as células do doente infetadas com bactérias in vitro. Tais vacinas também deveriam ser capazes de causar uma resposta imunitária que leva a um resultado clínico melhorado (e.g., remissões mais frequentes, sobrevivência sem doença completa ou parcial ou mais prolongada) em doentes vacinados comparativamente a doentes não vacinados. Tipicamente, a quantidade de título vírico será entre Ι,ΟχΙΟ4 pfu/animal e Ι,ΟχΙΟ15 pfu/animal. Os tamanhos de dose adequados variarão com o tamanho do doente, mas tipicamente serão na gama de cerca de 0,01 ml a cerca de 10 ml, mais tipicamente de cerca de 0,025 a cerca de 7,5 ml, o mais tipicamente de cerca de 0,05 a cerca de 5 ml. Os peritos na especialidade considerarão que o tamanho da dose pode ser ajustado com base no doente específico ou na doença ou distúrbio específicos a serem tratados. Para administraçao oral, o vetor adenovírico quimérico pode ser convenientemente formulado como uma pílula.
Em geral, um regime de dosagem e tratamento adequado proporciona o(s) composto (s) ativo (s) numa quantidade suficiente para proporcionar benefício terapêutico e/ou profilático. Tal resposta pode ser monitorizada estabelecendo um resultado clínico melhorado {e.g., remissões, completas ou parciais, mais frequentes ou sobrevivência sem doença mais prolongada) em doentes tratados comparativamente a doentes não tratados. Tais respostas imunitárias podem ser geralmente avaliadas usando ensaios padrão de proliferação, citotoxicidade ou citocina descritos anteriormente, que podem ser efetuados usando amostras obtidas de um doente antes e após tratamento.
Por exemplo, pode usar-se deteção de imunocomplexos formados entre polipéptidos imunogénicos e anticorpos num fluido corporal que são específicos para polipéptidos imunogénicos, para monitorizar a eficácia da terapia, que envolve um polipéptido imunogénico específico, para uma doença ou distúrbio com o qual está associado o polipéptido imunogénico. Podem analisar-se amostras de fluido corporal obtidas de um indivíduo antes e após o início da terapia para os imunocomplexos, pelas metodologias descritas anteriormente. Sucintamente, compara-se o número de imunocomplexos detetados em ambas as amostras. Uma alteração substancial do número de imunocomplexos na segunda amostra (após início da terapia) relativamente à primeira amostra (pré-terapia) reflete uma terapia com sucesso. A. Administração das composições da presente invenção
De acordo com a composição para utilização em métodos da presente invenção, administra-se uma composição compreendendo o vetor adenovírico quimérico por via oral, intranasal ou mucosa, por exemplo, a vagina, pulmões, glândulas salivares, cavidades nasais, intestino delgado, cólon, reto, amígdalas ou placas de Peyer. A composição pode ser administrada sozinha ou com um adjuvante, tal como descrito anteriormente. Em algumas divulgações, os adjuvantes são codificados por uma sequência de ácido nucleico (e.g., um ácido nucleico que codifica para IL-2, GM-CSF, IL-12, de flagelina bacteriana). Em algumas divulgações, o adjuvante é administrado ao mesmo tempo da composição. Em algumas divulgações, o adjuvante é administrado após a composição, e.g., 6, 12, 18, 24, 36, 48, 60 ou 72 horas após administração da composição. B. Deteção de uma resposta imunitária contra antigénios de interesse
Pode detetar-se uma resposta imunitária contra o polipéptido heterólogo usando quaisquer meios conhecidos na área técnica incluindo, por exemplo, detetar ativação especifica de células T CD4+ ou CD8+ ou por deteção da presença de anticorpos que se ligam especificamente ao polipéptido. A ativação especifica de células T CD4+ ou CD8+ associadas a uma resposta imunitária mucosa, humoral ou mediada por célula pode ser detetada de várias formas. Os métodos para detetar ativação especifica de células T incluem a deteção da proliferação de células T, a produção de citocinas (e.g., linfocinas) ou a geração de atividade citolitica (i.e., geração de células T citotóxicas específicas para o polipéptido imunogénico), não se lhes limitando. Para células T CD4+, um método preferido para detetar a ativação específica de células T é a deteção da proliferação de células T. Para células T CD8+, um método preferido para detetar a ativação especifica de células T é a deteção da geração de atividade citolitica usando ensaios de libertação de 51Cr (consultar, e.g., Brossart e Bevan, Blood 90(4): 1594-1599 (1997) e Lenz et ai., J. Exp. Med. 192 (8) :1135-1142 (2000)) .
Pode conseguir-se a deteção da proliferação de células T por uma variedade de técnicas conhecidas. Por exemplo, pode detetar-se proliferação de células T por medição da taxa de síntese de ADN. As células T que foram estimuladas para proliferar apresentam uma taxa de síntese de ADN aumentada. Um modo típico para medir a taxa de síntese de ADN é, por exemplo, por marcação com impulsos de culturas de células T com timidina tritiada, um precursor de nucleósido que é incorporado em ADN sintetizado recentemente. Pode determinar-se a timidina tritiada incorporada usando um espetrofotómetro de cintilação de líquidos. Outras formas de detetar a proliferação de células T incluem medição do aumento de produção de interleucina-2 (IL-2), fluxo de Ca2+ ou absorção de corante, tal como 3-(4,5-dimetiltiazol-2-il)-2,5-difeniltetrazólio. Alternativamente, pode medir-se a síntese de linfocinas (e.g., interferão-gama) ou pode quantificar-se o número relativo de células T que podem ser sensíveis ao polipéptido imunogénico.
As respostas imunitárias de anticorpo (ou seja, respostas imunitárias humorais ou respostas de células B), incluindo as respostas de anticorpo nas mucosas, podem ser detetadas usando imunoensaios conhecidos na área técnica [Tucker et al., Mol Therapy, 8, 392-399 (2003); Tucker et al., Vaccine, 22, 2500-2504 (2004)]. Os imunoensaios adequados incluem a técnica de imunoensaio em sanduíche com anticorpo monoclonal duplo de David et al. (patente U.S. 4376110); ensaios em sanduíche de anticorpo monoclonal-policlonal (Wide et al., em Kirkham e Hunter, ed., Radioimmunoassay Methods, E. e S. Livingstone, Edinburgh (1970)); o método de "transferência western" de Gordon et al. (patente U.S. 4452901); imunoprecipitação de ligando marcado (Brown et al. (1980) J. Biol. Chem. 255:4980-4983); ensaios de imunoadsorção enzimática (ELISA) tal como descritos, por exemplo, por Raines et al. (1982) J. Biol. Chem. 257:5154-5160; técnicas imunocitoquímicas, incluindo a utilização de fluorocromos (Brooks et al. (1980) Clin. Exp. Immunol. 39:477); e neutralização de atividade (Bowen-Pope et al. (1984) Proc. Natl. Acad. Sei. USA 81:2396-2400). Adicionalmente aos imunoensaios descritos anteriormente, estão disponíveis vários outros imunoensaios, incluindo os descritos em patentes U.S. 3817827; 3850752; 3901654; 3935074; 3984533; 3996345; 4034074; e 4098876.
EXEMPLOS
Os exemplos seguintes destinam-se a ilustrar, mas não a limitar, a presente invenção.
Exemplo 1: Construção de um vetor adenovírico quimérico (DS1)
Para demonstrar que os agonistas de TLR-3 podem melhorar as respostas imunitárias adaptativas a antigénios de interesse expressos, construíram-se vários vetores adenovíricos quiméricos diferentes que compreendem sequências de ácido nucleico que codificam para vários antigénios de interesse diferentes. Neste exemplo, colocou-se o ácido nucleico que codifica para gpl20 (de NIH AIDS Reagent and Reference Reagent
Program) sob controlo de um promotor de CMV com um pequeno intrão imediatamente a montante do codão de iniciação no vetor de vaivém (pShuttle, Qbiogene). Colocou-se uma cauda poli A de bGH a jusante do ácido nucleico que codifica para gpl20. A sequência de vetor apresenta-se em SEQ ID NO: 1. Efetuou-se recombinação homóloga com o vetor pAd (Qbiogene) para gerar um vetor capaz de produzir Ad recombinante (com deleção de E1/E3) que continha o ácido nucleico que codifica para gpl20. Gerou-se DS1 por transfeção da nova construção de expressão pAd-CMV-gpl20 para células 293. Mediram-se os titulos por métodos padrão.
Exemplo 2: DS1 (vetor com agonista de TLR-3) é superior a rAd5 padrão na indução de resposta imunitária específica do antigénio
Para determinar se a adição do agonista de TLR-3 poderia melhorar as respostas imunitárias adaptativas, administrou-se lOxlO7 PFU de rAd-CMV-gpl20 com poli I:C (DS1) ou rAd-CMV-gpl20 sozinho (rAd5) a 5 ug/ml, a animais por gavagem oral nas semanas 0 e 3. Ambos os vetores expressam gpl20 de HIV sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra gpl20 no plasma, 3 e 6 semanas após a administração inicial por ELISA de IgG anti-gpl20 tal como descrito em Tucker, et al., Mol Ther 8:392 (2004)). Tal como apresentado na figura 1, DS1 teve um desempenho significativamente melhor do que rAd5, desencadeando respostas de anticorpo à proteína gpl20 tanto às 3, como às 6 semanas após administração oral inicial. Em particular, o título médio de anticorpo contra gpl20 foi 100 vezes melhor no grupo de DS1 do que no grupo de rAd5 na semana 6. Também parece que o grupo de DS1 foi reforçado por readministração na semana 4, dado que o título médio aumentou mais de 20 vezes entre as semanas 3 e 6, enquanto o grupo de rAd5 apresentou apenas um ligeiro aumento do título médio de anticorpo. Os resultados demonstram que a adição de um agonista de TLR-3 pode melhorar muito as respostas de anticorpo mediadas por Ad5 a antigénios de interesse, após administração oral de um vetor adenovírico quimérico compreendendo um ácido nucleico que codifica para o antigénio de interesse. Como um controlo positivo para o ensaio, mediu-se também soros de um animal injetado subcutaneamente com gpl20 com adjuvante completo de Freund na ELISA de anti-gpl20 na semana 3. Como controlo negativo e de linha de base para ELISA usaram-se animais não tratados e animais a que se administrou apenas o análogo de ARNcd (ARNcd), respetivamente. Cada grupo continha 6 animais.
Exemplo 3: Construção de um segundo vetor adenovírico quimérico (DSlb) e um terceiro vetor adenovírico quimérico (DSlc)
Inseriu-se um ácido nucleico que codifica proteína verde fluorescente (GFP) em pShuttle-CMV (Qbiogene) usando digestões com enzimas de restrição padrão. Combinou-se o plasmídeo pShuttleCMV-GFP por recombinação homóloga com o vetor pAd (Qbiogene), tal como descrito anteriormente, de modo a gerar um vetor capaz de produzir Ad recombinante (deleção de E1/E3) compreendendo uma sequência de ácido nucleico que codifica para GFP. Clonou-se um ácido nucleico que codifica para hemaglutinina (HA) de influenza A/PR/8/34 e colocou-se no vetor pShuttle-CMV (Qbiogene) (SEQ ID NO: 13). Combinou-se o plasmídeo pShuttleCMV-HA (PR/8) por recombinação homóloga com o vetor pAd (Qbiogene), tal como descrito anteriormente, de modo a gerar um vetor capaz de produzir Ad recombinante (deleção de E1/E3) compreendendo uma sequência de ácido nucleico que codifica para HA. Gerou-se Ad recombinante por transfeção das novas construções de expressão pAd-CMV-GFP e pAd-CMV-HA para células 293. Mediram-se os títulos por métodos padrão.
Exemplo 4: DSlb (Ad-CMV-GFP com agonista de TLR-3) e DSlc (Ad-CMV-HA com agonista de TLR-3) são superiores a rAd5 padrão para induzir uma resposta imunitária específica do antigénio.
Administrou-se Ι,ΟχΙΟ7 PFU de Ad-CMV-GFP com poli I:C (DSlb) ou Ad-CMV-GFP (rAd5) a 5 ug/ml a animais por gavagem oral na semana 0. Ambos os vírus expressam GFP sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra GFP no plasma 3 semanas após a administração inicial de vírus por ELISA de IgG anti-GFP. Tal como apresentado na figura 2, o grupo de DSlb teve um desempenho significativamente melhor do que rAd5 a desencadear respostas de anticorpo à proteína GFP, às 3 semanas após administração oral inicial.
As respostas de células T CD8+ a GFP foram medidas por coloração com tetrâmero de esplenócitos. Vacinaram-se os animais nas semanas 0, 4, 8 e recolheram-se baços na semana 10. Coraram-se os esplenócitos com CD8-FITC e o tetrâmero que reconhece o epítopo imunodominante para GFP em ratinhos Balb/c. Os resultados mostram que a administração oral do vetor DSlb foi estatisticamente melhor do que rAd sozinho, na indução de células CD8 positivas para tetrâmero (figura 2b) .
Administrou-se Ι,ΟχΙΟ7 PFU de Ad-CMV-HA com poli I:C (DSlc) ou Ad-CMV-HA (rAd5) a 5 ug/ml, a animais por gavagem oral na semana 0. Ambos os vírus expressam HA sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra HA no plasma 3 semanas após a administração inicial de vírus por ELISA de IgG anti-PR8/34. O procedimento para medir as respostas de anticorpo é semelhante ao descrito anteriormente, com a exceção de se terem revestido as placas de ELISA com lisado de A/PR8/34 completo a 5 ug/ml (Advanced Biotechnology Incorporated, Gaithersburg, MD) . Tal como apresentado na figura 2C, o grupo de DSlc teve um desempenho significativamente melhor (aproximadamente 100 vezes melhor) do que rAd5 a desencadear respostas de anticorpo a influenza, às 3 semanas após administração oral inicial. Os resultados destes estudos também demonstram que a abordagem de usar o agonista de TLR-3 conjuntamente com um vetor adenovírico recombinante quimérico pode ser aplicada geralmente a múltiplos antigénios heterólogos diferentes, com um titulo de anticorpo melhorado 100 vezes.
Exemplo 5: As vias não parentéricas de entrega são melhores do que as vias parentéricas
Ensaiou-se entrega intramuscular por injeção direta de Ι,ΟχΙΟ7 pfu de pAd-CMV-gpl20 (DS10 +/- poli I:C a 5 ug/ml nos quadricípites dos animais. Mediram-se os títulos de IgG de soro de plasma contra GFP tal como descrito anteriormente. Cada grupo continha 6 animais. Tal como apresentado na figura 3A, verificaram-se títulos de anticorpo contra gpl20 significativos 3 semanas após administração, no grupo com agonista de TLR-3 (i.m. rAd+PI). (figura 3a).
Ensaiou-se administração intranasal por administração de 20 ul de 1, lxl06 pfu de DSlc +/-5 ug/ml de poli I:C na cavidade nasal de ratinhos. Os ratinhos foram anestesiados ligeiramente com isoflurano antes de administração do vírus formulado em solução salina estéril. Os resultados mostram que rAd-CMV-HA com poli I:C (DSlc) apresentaram títulos de anticorpo ligeiramente maiores comparativamente a animais a que se administrou rAd-CMV-HA padrão. Os resultados foram representados graficamente como animais individuais para os grupos de DSlc (N=6) e de rAd (N=5) . Usaram-se animais não tratados (N=4) como controlos negativos.
Exemplo 6: Construção de um agonista de TLR3 expresso.
Sintetizou-se um segmento de ADN curto de 45 pb por ordenação de oligonucleótidos de ADN que quando hibridados entre si formaram um segmento de 45 pb concebido para formar um ARN em cadeia dupla em gancho de cabelo (GAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTC) (SEQ ID NO:10). Este segmento curto (denominado lucl) foi clonado no plasmideo pSK contendo o promotor de beta-actina humana e uma cauda poli A de BGH. Este plasmideo é denominado pSk-lucl.
Exemplo 7: 0 pSK-lucl funciona em culturas de células dendríticas como poli I:C, os efeitos de poli I:C e rAd são aditivos.
Para determinar se o agonista de TLR-3 expresso do exemplo 6 anterior poderia funcionar como um indutor de citocinas pró-inflamatórias e maturação de células dendríticas, tal como o ligando de TLR-3, poli I:C, ensaiou-se um ARNcd de agonista de TLR-3 expresso em culturas de células dendríticas. Cultivou-se medula óssea de fémures de ratinhos Balb/c com ligando flt-3 (200 ng/ml) , soro a 5%, em meio DMEM, de modo a preparar culturas de células dendríticas primárias. Cinco dias após se estabeleceram culturas primárias de medula óssea, transfetaram-se células 293 com pSk-lucl, pSK-beta2 (um segmento longo de beta galactosidase que forma um gancho de cabelo de 200 pb) ou pcDNA3 (vetor de expressão vazio). No dia 6, trataram-se as células transfetadas por irradiação UV (20 segundos a 40 kJ/cm2) para causar apoptose e administraram-se estas células às células dendríticas. Administraram-se células transfetadas com poli I:C (1 ug/ml), rAd (1 pfu/célula), rAd + poli I:C, pSK-lucl, células transfetadas com pSK-beta2 ou células transfetadas com pcDNA3 às células dendríticas e cultivaram-se durante a noite. Tal como apresentado na figura 4A, as células transfetadas com pSK-lucl podem melhorar significativamente a ativação de células dendríticas, tal como medido por ELISA de IL-6 de ratinho. Os resultados desta experiência também mostram que a combinação conjunta de rAd com ligando de TLR3 (poli I:C) pode melhorar grandemente a atividade de células dendriticas.
Ensaiaram-se também ligandos adicionais. 0 agonista de TLR-3 apresentado em SEQ ID NO: 11 (ml) também forma um ARNcd em gancho de cabelo com aproximadamente o mesmo tamanho que lucl. Estes foram preparados por sobreposição de oligonucleótidos e sua hibridação conjunta, antes de clonagem para o vetor pSK sob controlo do promotor de beta-actina humana. Os vetores foram transfetados para células 293 e administrados a células dendriticas primárias, tal como descrito anteriormente. Tal como apresentado na figura 4B, estes ligandos adicionais podem ativar as células dendriticas de forma semelhante ao ligando lucl (figura 4B).
Exemplo 8. Construção de um quarto vetor adenovírico quimérico (DS2) e vetores de clonagem rápida (DS2beta-luc e DS2C-luc).
Colocou-se um ácido nucleico que codifica para gpl20 (de NIH AIDS Research and Reference Reagent Program)) sob controlo de um promotor de CMV, com um pequeno intrão imediatamente a montante do codão de iniciação no vetor de vaivém (pShuttleCMV, Qbiogene) . Colocou-se uma cauda de poli A de bGH a jusante do ácido nucleico que codifica para gpl20. Inseriu-se ARNcd de agonista de TLR-3, luc 1, sob controlo do promotor de beta-actina humana e poli A (descrito no exemplo 5 anteriormente) no vetor gpl20 pShuttle de modo que tanto o ácido nucleico que codifica para gpl20, como o ácido nucleico que codifica para o agonista de TLR-3 estivessem contidos num único vetor sob o controlo de dois promotores independentes. A orientação da expressão do ácido nucleico que codifica para o antigénio de interesse e a expressão do agonista de TLR-3 encontra-se ilustrada na figura 5.
Construiram-se também dois vetores de vaivém genéricos denominados DS2beta-luc (SEQ ID NO: 14) e DS2C-luc (SEQ ID NO: 15) de modo que se pudesse inserir um ácido nucleico que codifica para qualquer antigénio de interesse sob controlo do promotor de CMV e usa-se o promotor de beta-actina humana ou o promotor de CMV para dirigir a expressão de um ARNcd de agonista de TLR-3. Em particular, o vetor DS2C-luc tem um local único de Kpn 1 de modo que se pode facilmente clonar para ai um ácido nucleico que codifica para um antigénio de interesse. 0 objetivo destes vetores é preparar um vetor de construção subsequente muito mais facilmente, porque se poderia inserir um ácido nucleico que codifica para qualquer antigénio de interesse no local de clonagem, para fabricar rapidamente um vetor capaz de desencadear respostas de anticorpo e de células T contra o antigénio de interesse. A recombinação homóloga de DS2 com o vetor pAd (Qbiogene) foi efetuada tal como anteriormente, de modo a gerar um vetor capaz de produzir Ad recombinante (deleção de E1/E3) que continha um ácido nucleico que codifica para GFP e um ácido nucleico que codifica para o ARNcd de agonista de TLR-3, luc 1. Gerou-se Ad recombinante por transfeção da nova construção de expressão pAd-beta-actina-lucl-CMV-gpl20 para células 293. Mediram-se os títulos por métodos padrão.
Exemplo 9: Indução de uma resposta imunitária específica do antigénio após entrega oral de DS2.
Administrou-se Ι,ΟχΙΟ7 PFU de pAd-CMV-gpl20 com o agonista de TLR-3, lucl (DS2) ou pAd-CMV-gpl2 0 (rAd5) a animais por gavagem oral na semana. Ambos os vírus expressam gpl20 sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra gpl20 no plasma, 3 semanas após administração do vírus por ELISA de IgG anti-gpl20. 0 protocolo de ELISA foi descrito anteriormente (Tucker, et al, Mol Therapy 8:392 (2004)). Os resultados demonstram que DS2 pode induzir uma melhoria de aproximadamente 2 log no título de anticorpo contra gpl20, o antigénio heterólogo usado na experiência. O vetor DS2 compreende uma sequência de ácido nucleico que codifica para expressar gpl20 e uma sequência de ácido nucleico que expressa um ARNcd agonista de TLR-3. Como um controlo positivo para o ensaio, mediram-se também soros de dois animais injetados subcutaneamente com 10 microgramas de proteína gpl20 com adjuvante completo de Freund em ELISA de anti-gpl20. Usaram-se como controlos negativos para ELISA, animais não tratados. Cada grupo continha 6 animais. Os resultados encontram-se ilustrados na figura 6.
Exemplo 10: Indução de uma resposta imunitária específica do antigénio após entrega oral de DS3.
Administrou-se Ι,ΟχΙΟ7 PFU de pAd-CMV-HA de influenza (de A/PR/8/34) com o ligando de ácido poliuridico TLR7/8 (DS3) ou pAd-CMV-HA (rAd5) a animais, por gavagem oral na semana 0. Ambos os virus expressam HA de influenza sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra HA no plasma, 3 semanas após administração do vírus por ELISA de IgG anti-HA de influenza. Cada grupo continha 6 animais. Os resultados estão ilustrados na figura 7.
Exemplo 11: Construção de um quinto, sexto e sétimo vetores adenovíricos quiméricos (DS2b, DS2b-for e ND1.1 214).
Sintetizou-se o gene de HA de influenza (A/Indo/5/2005) por CelTek (Nashville, TN) e colocou-se no vetor pShuttleCMV (Qbiogene) que tem um promotor de CMV com um pequeno intrão imediatamente a montante do codão de iniciação no vetor de vaivém. Colocaram-se o ADN de lucl com promotor de beta-actina humana e poli A (descrito no exemplo 5) no vetor a jusante do antigénio, na orientação apresentada na figura 5 para DS2b. A sequência de lucl é (GAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCA TATCGTTTC) (SEQ ID NO:10) e o vetor pShuttle completo apresenta-se em SEQ ID NO: 6. Descreve-se uma orientação alternativa de lucl com promotor num vetor de vaivém como SEQ ID NO: 7 e denomina-se DS2b-for. Também construímos outro vetor pShuttle (denominado DS2bC-HA) (SEQ ID NO: 16) que compreende dois promotores de CMV independentes que dirigem a expressão do agonista de TLR-3, lucl e HA de influenza descritos anteriormente. Efetuou-se recombinação homóloga com o vetor pAd (Qbiogene) tal como anteriormente de modo a gerar vetores capazes de produzir Ad recombinante (com deleção de E1/E3) que continham o ácido nucleico que codifica para HA e para o agonista de TLR-3, lucl, sob promotores independentes. Gerou-se Ad recombinante por transfeção das novas construções de pAd para células 293. Mediram-se os títulos por métodos padrão. O vetor pAd completo contendo DS2C-luc foi denominado ND1.1 214 e depositado no depositório de patentes de ATCC a 22 de fevereiro de 2007 (Manassus, VA). A sequência de ácido nucleico deste vetor adenovírico quimérico apresenta-se em SEQ ID NO: 17. 0 ácido nucleico que codifica para o antigénio heterólogo está em texto a negrito e está flanqueado por um local de reconhecimento de Cia I na extremidade 5' e um local de reconhecimento de Not 1 na extremidade 3'. A sequência de ácido nucleico que codifica para os agonistas de TLR-3 está em itálico, com a sequência ligante a negrito. Uma sequência de ácido nucleico que codifica para qualquer antigénio de interesse e uma sequência de ácido nucleico que codifica para qualquer agonista de TLR-3 expresso adequado podem ser inseridas no vetor adenovirico quimérico.
Exemplo 12: Indução de uma resposta imunitária específica do antigénio após entrega oral de DS2b.
Administrou-se Ι,ΟχΙΟ7 PFU de pAd-CMV-HA com os agonistas de TLR-3, lucl, na orientação inversa (DS2b) ou na orientação direta (DS2b-for) ou pAd-CMV-HA (rAd5) a animais, por gavagem oral na semana 0. Estes vírus expressam o antigénio de HA de influenza sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra HA no plasma 3 semanas após administração de vírus por ELISA de IgG anti-HA. Os resultados demonstram que o vetor DS2b desencadeia respostas de anticorpo contra proteína HA superiores às do vetor rAd padrão (rAd5). O vetor DS2b contém rAd5 que expressa HA, bem como expressa um agonista de recetor do tipo "toll" 3 (TLR3) , um ARN em cadeia dupla em gancho de cabelo, demonstrando que a utilização do ligando de ARNcd codificado pode melhorar as respostas imunitárias adaptativas a antigénios de interesse. Tal como apresentado na figura 8A e na figura 6, o ARNcd expresso pode melhorar as respostas imunitárias adaptativas a múltiplos antigénios heterólogos diferentes. Usaram-se animais não tratados como controlo negativo para ELISA. Cada grupo continha 6 animais.
Analisaram-se os vetores na orientação oposta (DS2for) para respostas de anticorpo após administração oral ou intramuscular de Ι,ΟχΙΟ7 pfu de vírus por animal, às 0 e 5 semanas. As respostas de anticorpo contra HA foram medidas às 4 e 7 semanas após administração inicial. Tal como apresentado na figura 8B, o vetor com orientação oposta também pode induzir respostas de anticorpo substanciais a antigénios heterólogos. Os vetores DSlb e DSlbfor induziram respostas semelhantes a HA ao ponto temporal de 4 semanas. Significativamente, o efeito de reforço da resposta de anticorpo foi demonstrado com o vetor DSlbfor e mostrou que se podem usar múltiplas doses para aumentar as respostas de anticorpo ao antigénio heterólogo.
Demonstrou-se também outro exemplo do potencial da abordagem de vetor adenovírico quimérico. Administrou-se o vetor ND1.1 214 a animais por administração oral (Ι,ΟχΙΟ7 pfu) ou intranasal (3xl06 pfu) e mediram-se as respostas de anticorpo ao antigénio heterólogo na semana 3. Tal como apresentado na figura 8C, mediram-se respostas de anticorpo substanciais contra HA após administração oral, bem superiores aos valores típicos para uma única administração oral de vetor rAd. LISTAGEM DE SEQUÊNCIAS INFORMAL SEQ ID NO:1 (DS1) taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataattttgtgttactcatagcgcgtaatactggtaccgcggccgcctcgagtctag
agatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCC
AGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTG GGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcataatatgtacattt atattggctcatgtccaacattaccgccatgttgacattgattattgactagttattaatag taatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttac ggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacgg taaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgt caatgacggtaaatggcccgcctggcattat-gcccagtacatgaccttatgggactttccta cttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtac atcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgt caatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccg ccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgt ttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagaca ccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgaggccctgggcagg ttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcatgtggagacag agaagactcttgggtttctgataggcactgactctctctgcctattggtctattttcccacc
cttaggctgctggtctgagcctagGAGATCTCTCGAGGTCGACGGTATAGCTTCTAGAGATC
CCTCGACCTCGAGATCCATTGTGCTCTAAAGGAGATACCCGGCCAGACACCCTCACCTGCGG
TGCCCAGCTGCCCAGGCTGAGGCAAGAGAAGGCCAGAAACCATGCCCATGGGGTCTCTGCAA
CCGCTGGCCACCTTGTACCTGCTGGGGATGCTGGTCGCTTCCGTGCTAGCTGTGGAGAAGCT
GTGGGTGACTGTATACTATGGGGTGCCTGTGTGGAAGGAGGCCACCACCACCCTGTTCTGTG
CCTCTGATGCCAAGGCCTATGACACTGAGGTCCACAATGTCTGGGCCACCCATGCCTGTGTG
CCCACTGACCCCAACCCTCAGGAGGTGGTGCTGGAGAATGTGACTGAGCACTTCAACATGTG
GAAGAACAACATGGTGGAGCAGATGCAGGAGGACATCATCAGCCTGTGGGACCAGAGCCTGA
AGCCCTGTGTGAAGCTGACCCCCCTGTGTGTGACCCTGAACTGCAAGGATGTGAATGCCACC
AACACCACCAATGACTCTGAGGGCACTATGGAGAGGGGTGAGATCAAGAACTGCAGCTTCAA
CATCACCACCAGCATCAGGGATGAGGTGCAGAAGGAGTATGCCCTGTTCTACAAGCTGGATG
TGGTGCCCATTGACAACAACAACACCAGCTACAGGCTGATCAGCTGTGACACCTCTGTGATC
ACCCAGGCCTGCCCCAAGATCAGCTTTGAGCCCATCCCCATCCACTACTGTGCCCCTGCTGG
CTTTGCCATCCTGAAGTGCAATGACAAGACCTTCAATGGCAAAGGCCCTTGCAAGAATGTGA
GCACTGTGCAGTGCACTCATGGCATCAGGCCTGTGGTGAGCACCCAGCTGCTGCTGAATGGC
AGCCTGGCTGAGGAGGAGGTGGTGATCAGGTCTGACAACTTCACCAACAATGCCAAGACCAT
CATTGTGCAGC
TGAAGGAGTCTGTGGAGATCAACTGCACCAGGCCCAACAACAACACCAGGAAGAGCATTCAC
ATTGGCCCTGGCAGGGCCTTCTACACCACTGGGGAGATCATTGGGGACATCAGGCAGG
CCCACTGCAACATCAGCAGGGCCAAGTGGAATGACACCCTGAAGCAGATTGTGATCAAGCTG
AGGGAGCAGTTTGAGAACAAGACCATTGTGTTCAATCACAGCTCTGGTGGTGATCCTGAGAT
TGTGATGCACAGCTTCAACTGTGGTGGTGAGTTCTTCTACTGCAACAGCACCCAGCTGTTCA
ACAGCACCTGGAACAACAACACTGAGGGCAGCAACAACACTGAGGGCAACACCATCACCCTG CCTTGCAGGATCAAGCAGATCATCAACATGTGGCAGGAGGTGGGCAAGGCCATGTATGCTCC TCCCATCAGGGGCCAGATCAGGTGCAGCAGCAACATCACTGGCCTGCTGCTGACCAGGGATG GTGGCATCAATGAGAATGGCACTGAGATTTTCAGGCCTGGTGGTGGGGACATGAGGGACAAC TGGAGGTCTGAGCTGTACAAGTACAAGGTGGTGAAGATTGAGCCCCTTGGTGTGGCTCCCAC CAAGGCTAAGCGCAGGGTGGTGCAGAGGGAGAAGcgcgctgtgggctgaggatccCGAGGGT GAGTGCTCCTGCCTGGACGCATCCCGGCTATGCAGCCCCAGTCCAGGGCAGCAAGGCAGGCC CCGTCTGCCTCTTCACCCGGAGCCTCTGCCCGCCCCACTCATGCTCAGGGAGAGGGTCTTCT GGCTTTTTCCCAGGCTCTGGGCAGGCACAGGCTAGGTGCCCCTAACCCAGGCCCTGCACACA AAGGGGCAGGTGCTGGGCTCAGACCTGCCAAGAGCCATATCCGGGAGGACCCTGCCCCTGAC CTAAGCCCACCCCAAAGGCCAAACTCTCCACTCCCTCAGCTCGGACACCTTCTCTCCTCCCA GATTCCAGTAACTCCCAATCTTCTCTCTGCAGAGCCCAAATCTTGTGACAAAACTCACACAT GCCCACCGTGCCCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAAGGCGGGACAGGTGC CCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACACGTCCACCTCCATCT CTTCCTCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAG GACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGA AGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAA AGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCAC CAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCC CATCGAGAAAACCATCTCCAAAGCCAAAGGTGGGACCCGTGGGGTGCGAGGGCCACATGGAC AGAGGCCGGCTCGGCCCACCCTCTGCCCTGAGAGTGACCGCTGTACCAACCTCTGTCCTACA GGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAA CCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGG AGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGC TCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTT CTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGT CTCCGGGTAAATGAGTGCGACGGCCGCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAA GGCGGGACAGGTGCCCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACAC GTCCACCTCCATCTCTTCCTCAGGTCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGC CTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGT TGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATG GAGCAAGGGGCCCAAGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAG CATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAAC TCATCAATGTATCTTATCATGTCTGgatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag'cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcijctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID :2 (Sequência do vetor DS2) taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC
CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc a-tgfcggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc
tattttcccacccttaggctgctggtctgagcctagGAGATCTCTCGAGGTCGACGGTAirCG
ATGGGIACAGCTTCTAGAGATCCCTCGACCTCGAGATCCATTGTGCTCTAAAGGAGATACCC
GGCCAGACACCCTCACCTGCGGTGCCCAGCTGCCCAGGCTGAGGCAAGAGAAGGCCAGAAAC
CATGCCCATGGGGTCTCTGCAACCGCTGGCCACCTTGTACCTGCTGGGGATGCTGGTCGCTT
CCGTGCTAGCTGTGGAGAAGCTGTGGGTGACTGTATACTATGGGGTGCCTGTGTGGAAGGAG
GCCACCACCACCCTGTTCTGTGCCTCTGATGCCAAGGCCTATGACACTGAGGTCCACAATGT
CTGGGCCACCCATGCCTGTGTGCCCACTGACCCCAACCCTCAGGAGGTGGTGCTGGAGAATG
TGACTGAGCACTTCAACATGTGGAAGAACAACATGGTGGAGCAGATGCAGGAGGACATCATC
AGCCTGTGGGACCAGAGCCTGAAGCCCTGTGTGAAGCTGACCCCCCTGTGTGTGACCCTGAA
CTGCAAGGATGTGAATGCCACCAACACCACCAATGACTCTGAGGGCACTATGGAGAGGGGTG
AGATCAAGAACTGCAGCTTCAACATCACCACCAGCATCAGGGATGAGGTGCAGAAGGAGTAT
GCCCTGTTCTACAAGCTGGATGTGGTGCCCATTGACAACAACAACACCAGCTACAGGCTGAT
CAGCTGTGACACCTCTGTGATCACCCAGGCCTGCCCCAAGATCAGCTTTGAGCCCATCCCCA
TCCACTACTGTGCCCCTGCTGGCTTTGCCATCCTGAAGTGCAATGACAAGACCTTCAATGGC
AAAGGCCCTTGCAAGAATGTGAGCACTGTGCAGTGCACTCATGGCATCAGGCCTGTGGTGAG
CACCCAGCTGCTGCTGAATGGCAGCCTGGCTGAGGAGGAGGTGGTGATCAGGTCTGACAACT
TCACCAACAATGCCAAGACCATCATTGTGCAGC
TGAAGGAGTCTGTGGAGATCAACTGCACCAGGCCCAACAACAACACCAGGAAGAGCATTCAC
ATTGGCCCTGGCAGGGCCTTCTACACCACTGGGGAGATCATTGGGGACATCAGGCAGG
CCCACTGCAACATCAGCAGGGCCAAGTGGAATGACACCCTGAAGCAGATTGTGATCAAGCTG
AGGGAGCAGTTTGAGAACAAGACCATTGTGTTCAATCACAGCTCTGGTGGTGATCCTGAGAT
TGTGATGCACAGCTTCAACTGTGGTGGTGAGTTCTTCTACTGCAACAGCACCCAGCTGTTCA
ACAGCACCTGGAACAACAACACTGAGGGCAGCAACAACACTGAGGGCAACACCATCACCCTG
CCTTGCAGGATCAAGCAGATCATCAACATGTGGCAGGAGGTGGGCAAGGCCATGTATGCTCC
TCCCATCAGGGGCCAGATCAGGTGCAGCAGCAACATCACTGGCCTGCTGCTGACCAGGGATG
GTGGCATCAATGAGAATGGCACTGAGATTTTCAGGCCTGGTGGTGGGGACATGAGGGACAAC
TGGAGGTCTGAGCTGTACAAGTACAAGGTGGTGAAGATTGAGCCCCTTGGTGTGGCTCCCAC
CAAGGCTAAGCGCAGGGTGGTGCAGAGGGAGAAGcgcgctgtgggctgaggatccCGAGGGT
GAGTGCTCCTGCCTGGACGCATCCCGGCTATGCAGCCCCAGTCCAGGGCAGCAAGGCAGGCC
CCGTCTGCCTCTTCACCCGGAGCCTCTGCCCGCCCCACTCATGCTCAGGGAGAGGGTCTTCT
GGCTTTTTCCCAGGCTCTGGGCAGGCACAGGCTAGGTGCCCCTAACCCAGGCCCTGCACACA
AAGGGGCAGGTGCTGGGCTCAGACCTGCCAAGAGCCATATCCGGGAGGACCCTGCCCCTGAC
CTAAGCCCACCCCAAAGGCCAAACTCTCCACTCCCTCAGCTCGGACACCTTCTCTCCTCCCA
GATTCCAGTAACTCCCAATCTTCTCTCTGCAGAGCCCAAATCTTGTGACAAAACTCACACAT
GCCCACCGTGCCCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAAGGCGGGACAGGTGC
CCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACACGTCCACCTCCATCT cttcctcagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaag GACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGA AGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAA AGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCAC CAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCC CATCGAGAAAACCATCTCCAAAGCCAAAGGTGGGACCCGTGGGGTGCGAGGGCCACATGGAC AGAGGCCGGCTCGGCCCACCCTCTGCCCTGAGAGTGACCGCTGTACCAACCTCTGTCCTACA GGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAA CCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGG AGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGC TCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTT CTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGT CTCCGGGTAAATGAGTGCGACGGCCGCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAA GGCGGGACAGGTGCCCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACAC GTCCACCTCCATCTCTTCCTCAGGTCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGC CTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGT TGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATG GAGCAAGGGGCCCAAGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAG CATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAAC TCATCAATGTATCTTATCATGTCTGgatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat
CGGCGGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGfCTCGCTGATCAGCCTCGACTG
TGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCTATGGCTTCTGAGGCGGAAAGAACCAACCACCGCGG TGGCGGCCGCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCT AGAGAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTCCTGCAGGAATT CGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGGGTTTTATAG GGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACGCTGATTGGC CCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCCCTCTCCCCT CCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGGAGAGTTTTG GCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATTCGATATCAagct agctTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgaaac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggàctggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct eaccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID No :3 GAAACGATATGGGCTGAATACTTAAGTATTCAGCCCATATCGTTTC.
Seq id no :4
CGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCGCCCTTAGATATC
GTCGACGCCCAGCACCCCAAGGCGGCCAACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATC
TCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACT
GTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTG
CCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTATAAAACCCAGCGGCGCGACGCGCCACC
ACCGCCGAGACATCGATGATATCTA
AAGGGCGAATTCCTGCAGCCCGGGGGATCCACTAGTCTAGATGCATGCTCGAGCGGCCGCCA
GTGTGATGGATATCTGCAGAATTCGCCCTTCAGCTGCGGATCCATTCGCCATTCAGGCTGCG
CAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGG
GATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAA
ACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGTACCGGGCCCCCCCT
CGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCCCGGGGGATCCACTAGTT
TCTAGAAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCG
CCACCGCGGTGGAGCT
Atcgaattcaagcttgtcgactc gaagatc
CT AG ACTAGTGGAT CCCCCGGGCTGCAGGAATT
CGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGGGTTTTATAG GGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACGCTGATTGGC CCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCCCTCTCCCCT CCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGGAGAGTTTTG GCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATT C GATATCAAGC TTAT CGATAC CGTCGACCTC GAGGGGGGGC CCG SEQ NO :5
CGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATC
GAATTCGCCCTTAGATATCGTCGACGCCCAGCACCCCAAGGCGGCCA
ACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAA
AAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCG
CGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGG
CGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACATCGATGATATCTA
AAGGGCGAATTCCTGCAGCCCGGGGGATCCACTAGTCTAGATGCATGCTCGAGCGGCCGCCA
GTGTGATGGATATCTGCAGAATTCGCCCTT
CAGCTGCGGATCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGC
GATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGT GCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACG·
TTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAAT
TGGGTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATC
GAATTCCTGCAGCCCGGGGGATCCACTAGTT
TCTAGAAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCG
CCACCGCGGTGGAGCTA
Tcgaattcaagcttgtcgactc gaagatcgtaca caggaagtgacaattttcgcgcggttttaggcggatgttg tagtaaatttgggcgtaaccgagtaagatttggccattttcgcgggaaaactgaataaga ggaagtgaaatctgaãtaattttgtgttactcatagcgcgtaatactggtac
CGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATC
GAATTCGCCCTTAGATATCGTCGACGCCCAGCACCCCAAGGCGGCCA
ACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAA
AAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCG
CGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGG
.CGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACATCGATGATATCTA
AAGGGCGAATTCCTGCAGCCCGGGGGATCCACTAGTCTAGAACTAGTGGATCCCCCGGGCTG
CAGGAATTC
GATATCAAGCTTATCGATACCGTCGACCTCGAGGGGGGGCCCGGTACCCA
ATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAA
CGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGC
ACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATC
GCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGATCCGCAGCTG
AAGGGCGAATTCTGCAGATATCCATCACACTGGCGGCCGCTCGAGCATGCA
TCTAGAAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCG
CCACCGCGGTGGAGCTA SEQ ID:6 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata. atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacg-tafctagtcatcgatattaeeatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gocctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagaotcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcatagGAGArciCTCGAGGTCGACGGTArcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCICT 51 AGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAG 101 AGCAGGTCGA TAC TAT CAT G GAGAAAAACG TAACAGTTAC TCATGCCCAA 151 GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT 201 GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CXGCTCGGGA 251 ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG 301 gagaaggcta accctaccaa xgacctctgc tatcctgggt catttaacga 351 TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA 401 TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC 451 GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT 501 GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT 551 ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG .TATCCATCAC 601 CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA 651 CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG 701 CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG 751 ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT 801 CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA 851 TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA 901 CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT 951 GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG 1001 CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT 1051 GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT 1101 GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT 1151 ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC 1201 AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG 1251 GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA 1301 TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA 1351 CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 14 01 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGG 1451 GGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAA 1501 AGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCG 1551 GCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACAT 1601 ATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT 1651 ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCA 1701 GTGCCGTATT TGTATATGAg c
GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCC
TT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAA
CCACCGCGGTGGCGGCCGCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATAT
TTTATTTCTAGAGAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTCCT
GCAGGAATTCGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGG
GTTTTATAGGGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACG
CTGATTGGCCCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCC
CTCTCCCCTCCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGG
AGAGTTTTGGCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATTCGA
TATCA AGCTAGCT Tgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg egcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctCc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgpcgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg. 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaa'cc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cc.cccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5,581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID :7 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgafcCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agt-tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagat-cgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagaetcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcctagGAGArcrCTCGAGGTCGACGGTArcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCT
51 AGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAG 101 AGCAGGTCGA TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA 151 GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT 201 GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA 251 ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG 301 GAGAAGGCTA ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA 351 TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA 401 TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC 451 GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT 501 GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT 551 ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC 601 CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA 651 CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG 701 CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG 751 ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT 801 CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA 851 TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA 901 CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT 951 GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG 1001 CAACCGGTCT AAGAAATAGC ÇCGCAGAGAG AATCGCGGAG GAAGAAACGT 1051 GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT 1101 GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT 1151 ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC 1201 AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG 1251 GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA 1301 TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA 1351 CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 1401 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGG 1451 GGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAA 1501 AGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCG 1551 GCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACAT 1601 ATCAAATCCT GTCCATCTAT TCCACCGTGG CCTCTTCGCT GGCCCTCGCT 1651 ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCA 1701 GTGCCGTATT TGTATATGAg c
GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCrCGCTGATCAGCCTCGACTGTGCC
TT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCAA
TGATATCGAATTCGCCCTTAGATATCGTCGACGCCCAGCACCCCAAGGCGGCCAACGCCAAA
ACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGG GAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCC&
ATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTAT
AAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACATCGATGATATCTAAAGGGCGAATT
CCTGCAGgaaacgatatgggctgaatacggatccgtattcagcccatatcgtttcTCTAGAA
ATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCGCCACCGC
GGTGG agctTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct oaatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc act.tccgt.tt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t
SEQ ID :8 GATGGTGCTTCAAGCTAGTACttaaGTACTAGCTTGAAGCACCATC SEQ ID: 9 GATGGTGCTTCAAGCTAGTACggatCCGTACTAGCTTGAAGCACCATC SEQ ID: 10 GAAACGATATGGGCTGAATACggatccGTATTCAGCCCATATCGTTTC SEQ ID: 11 CCTAATAATTAT CAAAATGTggatccACATTTTGATAATTATTAGG SEQ ID: 12 CCTAATAATTAT CAAAATGTaattACATTTTGATAATTATTAGG SEQ ID: 13 (DSlc) 1 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg 61 agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag 121 tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt 181 ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg 241 tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga 301 ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca 361 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 421 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 481 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 541 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac 601 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt 661 cctacttggc agtacatcta cgtattagte atcgctatta ccatggtgat gcggttttgg 721 cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 781 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 841 aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 901 agcagagctg gtttagtgaa ccgtcagatc cgctagagat ctGGTACCGAGCTCGGATCCGCCACCATGGAGGCAAACCTACTGGTCCTGTTATGTGCACTT GCAGCTGCAGATGCAGACACAATATGTATAGGCTACCATGCGAACAATTCAACCGACACTGG TGACACAGTAcfccgagaaga atgtgacagt gacacaetct gttaacctgc 181 tcgaagacag ccacaacgga aaactatgta gattaaaagg aatagcccca ctacaattgg 241 ggaaatgtaa catcgccgga tggctcttgg gaaacccaga atgcgaccca ctgcttccag 301 tgagatcatg gtcctacatt gtagaaacac caaactctga gaatggaata tgttatccag 361 gagatttcat cgactatgag gagctgaggg agcaattgag ctcagtgtca tcattcgaaa 421 gattcgaaat atttcccaaa gaaagctcat ggcccaacca caacacaacc aaaggagtaa 481 cggcagcatg ctcccatgcg gggaaaagca gtttttacag aaatttgcta tggctgacgg 541 agaaggaggg ctcataccca aagctgaaaa attcttatgt gaacaagaaa gggaaagaag 601 tccttgtact gtggggtatt catcacccgt ctaacagtaa ggatcaacag aatatctatc 661 agaatgaaaa tgcttatgtc tctgtagtga cttcaaatta taacaggaga tttaccccgg 721 aaatagcaga aagacccaaa gtaagagatc aagctgggag gatgaactat tactggacct 781 tgctaaaacc cggagacaca ataatatttg aggcaaatgg aaatctaata gcaccaaggt 841 atgctttcgc actgagtaga ggctttgggt ccggcatcat cacctcaaac gcatcaatgc 901 atgagtgtaa cacgaagtgt caaacacccc tgggagctat aaacagcagt ctccctttcc 961 agaatataca cccagtcaca ataggagagt gcccaaaata cgtcaggagt gccaaattga . 1021 ggatggttac aggactaagg aacattccgt ccattcaatc cagaggtcta tttggagcca 1081 ttgccggttt tattgaaggg ggatggactg gaatgataga tggatggtac ggttatcatc 1141 atcagaatga acagggatca ggctatgcag cggatcaaaa aagcacacaa aatgccatta 1201 acgggattac aaacaaggtg aactctgtta tcgagaaaat gaacattcaa ttcacagctg 1261 tgggtaaaga attcaacaaa ttagaaaaaa ggatggaaaa tttaaataaa aaagttgatg 1321 atggatttct ggacatttgg acatataatg cagaattgtt agttctactg gaaaatgaaa 1381 ggactctgga tttccatgac tcaaatgtga agaatctgta tgagaaagta aaaagccaat 1441 taaagaataa tgccaaagaa atcggaaatg gatgttttga gttctaccac aagtgtgaca 1501 atgaatgcat ggaaagtgta agaaatggga cttatgatta tcccaaatat tcagaagagt 1561 caaagttgaa cagggaaaag gtagatggag tgaaattgga atcaatgggg atctatcaga 1621 ttctggcgat ctactcaact gtcgccagtt cactggtgct tttggtctcc ctgggggcaa 1681 tcagtttctg gatgtgttct aatggatctt tgcagtgcag aatatgcatc tgagattaga
1741 atttcagaga tatgaggaaa aacacccttg tttctact CCCAAGCTTTAATGCGGTAGTTTATCACAGTTAAATTGCTAA CGCAGTCAGGCACCGTGTATGAAATCTAACAATGCGCTCATCGTCATCCTCGGCACCGTCAC CCTGGATGCTGTAGGCATAGGCTTGGTTATGCCGGTACTGCCGGGCCTCTTGCGGGATGG GCGGCCGCtcgagcct aagcttctag ataagatatc cgatccaccg gatctagata actgatcata 1021 atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 1081 ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 1141 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 1201 cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt 1261 taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgtatc tgttttgcag 1321 cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtgagc tcatatttga 1381 caacgcgcat gcccccatgg gccggggtgc gtcagaatgt gatgggctcc agcattgatg 1441 gtcgccccgt cctgcccgca aactctacta ccttgaccta cgagaccgtg tctggaacgc 1501 cgttggagac tgcagcctcc gccgccgctt cagccgctgc agccaccgcc cgcgggattg 1561 tgactgactt tgctttcctg agcccgcttg caagcagtgc agcttcccgt tcatccgccc 1621 gcgatgacaa gttgacggct cttttggcac aattggattc tttgacccgg gaacttaatg 1681 tcgtttctca gcagctgttg gatctgcgcc agcaggtttc tgccctgaag gcttcctccc 1741 ctcccaatgc ggtttaaaac ataaataaaa aaccagactc tgtttggatt tggatcaagc 1801 aagtgtcttg ctgtctttat ttaggggttt tgcgcgcgcg gtaggcccgg gaccagcggt 1861 ctcggtcgtt gagggtcctg tgtatttttt ccaggacgtg gtaaaggtga ctctggatgt 1921 tcagatacat gggcataagc ccgtctctgg ggtggaggta gcaccactgc agagcttcat 1981 gctgcggggt ggtgttgtag atgatccagt cgtagcagga gcgctgggcg tggtgcctaa 2041 aaatgtcttt cagtagcaag ctgattgcca ggggcaggcc cttggtgtaa gtgtttacaa 2101 agcggttaag ctgggatggg tgcatacgtg gggatatgag atgcatcttg gactgtattt 2161 ttaggttggc tatgttccca gccatatccc tccggggatt catgttgtgc agaaccacca 2221 gcacagtgta tccggtgcac ttgggaaatt tgtcatgtag cttagaagga aatgcgtgga 2281 agaacttgga gacgcccttg tgacctccaa gattttccat gcattcgtcc ataatgatgg 2341 caatgggccc acgggcggcg gcctgggcga agatatttct gggatcacta acgtcatagt 2401 tgtgttccag gatgagatcg tcataggcca tttttacaaa gcgcgggcgg agggtgccag 2461 actgcggtat aatggttcca tccggcccag gggcgtagtt accctcacag atttgcattt 2521 cccacgcttt gagttcagat ggggggatca tgtctacctg cgqqgcqat.q aagaaaacgg 2581 tttccggggt aggggagatc agctgggaag aaagcaggtt cctgagcagc tgcgacttac 2641 cgcagccggt gggcccgtaa atcacaccta ttaccgggtg caactggtag ttaagagagc 2701 tgcagctgcc gtcatccctg agcagggggg ccacttcgtt aagcatgtcc ctgactcgca 2761 tgttttccct gaccaaatcc gccagaaggc gctcgccgcc cagcgatagc agttcttgca 2821 aggaagcaaa gtttttcaac ggtttgagac cgtccgccgt aggcatgctt ttgagcgttt 2881 gaccaagcag ttccaggcgg tcccacagct cggtcacctg ctctacggca tctcgatcca 2941 gcatatctcc tcgtttcgcg ggttggggcg gctttcgctg tacggcagta gtcggtgctc 3001 gtccagacgg gccagggtca tgtctttcca cgggcgcagg gtcctcgtca gcgtagtctg 3061 ggtcacggtg aaggggtgcg ctccgggctg cgcgctggcc agggtgcgct tgaggctggt 3121 cctgctggtg ctgaagcgct gccggtcttc gccctgcgcg tcggccaggt agcatttgac 3181 catggtgtca tagtccagcc cctccgcggc gtggcccttg gcgcgcagct tgcccttgga 3241 ggaggcgccg cacgaggggc agtgcagact tttgagggcg tagagcttgg gcgcgagaaa 3301 taccgattcc ggggagtagg catccgcgcc gcaggccccg cagacggtct cgcattccac 3361 gagccaggtg agctctggcc gttcggggtc aaaaaccagg tttcccccat gctttttgat 3421 gcgtttctta cctctggttt ccatgagccg gtgtccacgc tcggtgacga aaaggctgtc 3481 cgtgtccccg tatacagact tgagagggag tttaaacgaa ttcaatagct tgttgcatgg 3541 gcggcgatat aaaatgcaag gtgctgctca aaaaatcagg caaagcctcg cgcaaaaaag 3601 aaagcacatc gtagtcatgc tcatgcagat aaaggcaggt aagctccgga accaccacag 3661 aaaaagacac catttttctc tcaaacatgt ctgcgggttt ctgcataaac acaaaataaa 3721 ataacaaaaa aacatttaaa cattagaagc ctgtcttaca acaggaaaaa caacccttat 3781 aagcataaga cggactacgg ccatgccggc gtgaccgtaa aaaaactggt caccgtgatt 3841 aaaaagcacc accgacagct cctcggtcat gtccggagtc ataatgtaag actcggtaaa 3901 cacatcaggt tgattcatcg gtcagtgcta aaaagcgacc gaaatagccc gggggaatac 3961 atacccgcag gcgtagagac aacattacag cccccatagg aggtataaca aaattaatag 4021 gagagaaaaa cacataaaca cctgaaaaac cctcctgcct aggcaaaata gcaccctccc 4081 g.ctccagaac aacatacagc gcttcacagc ggcagcctaa cagtcagcct taccagtaaa 4141 aaagaaaacc tattaaaaaa acaccactcg acacggcacc agctcaatca gtcacagtgt 4201 aaaaaagggc caagtgcaga gcgagtatat ataggactaa aaaatgacgt aacggttaaa 4261 gtccacaaaa aacacccaga aaaccgcacg cgaacctacg cccagaaacg aaagccaaaa 4321 aacccacaac ttcctcaaat cgtcacttcc gttttcccac gttacgtaac ttcccatttt 4381 aagaaaacta caattcccaa cacatacaag ttactccgcc ctaaaaccta cgtcacccgc 4441 cccgttccca cgccccgcgc cacgtcacaa actccacccc ctcattatca tattggcttc 4501 aatccaaaat aaggtatatt attgatgatg ttaattaaca tgcatggatc catatgcggt 4561 gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct 4621 cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 4681 aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 4741 aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 4801 tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 4861 caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 4921 cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 4981 ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 5041 gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 5101 agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 5161 gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 5221 acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 5281 gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 5341 gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 5401 cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 5461 caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 5521 gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 5581 cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 5641 cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 5701 caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 5761 gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 5821 gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcagcc atgagattat 5881 caaaaaggat cttcacctag atccttttca cgtagaaagc cagtccgcag aaacggtgct 5941 gaccccggat gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga 6001 gaaagcaggt agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga 6061 cagcaagcga accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca 6121 aagtaaactg gatggctttc tcgccgccaa ggatctgatg gcgcagggga tcaagctctg 6181 atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 6241 ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 6301 gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 6361 ccgacctgtc cggtgccctg aatgaactgc aagacgaggc agcgcggcta tcgtggctgg 6421 ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 6481 ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 6541 agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 6601 gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 6661 gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 6721 tcgccaggct caaggcgagc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 6781 cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 6841 ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 6901 agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 6961 cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgaattttg ttaaaatttt 7021 tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaacatccc ttataaatca 7081 aaagaataga ccgcgatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 7141 aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 7201 cgtgaaccat cacccaaatc aagttttttg cggtcgaggt gccgtaaagc tctaaatcgg 7261 aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 7321 aaggaaggga agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg 7381 ctgcgcgtaa ccaccacacc cgcgcgctta atgcgccgct acagggcgcg tccattcgcc 7441 attcaggatc gaattaattc ttaat SEQ ID :14 DS2beta-luc taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC
CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc
tattttcccacccttaggctgctggtctgagcctagGAGATCrCTCGAGGTCGACGGTATCG
ATGGGTACCGGCGGCCGCCCTATTCTATAGTGTCACCTAAATGCTA(3AGCrCGCTGATCAGC
CTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCTATGGCTTCTGAGGCGGAAAGAACCAACCACCGCGG
TGGCGGCCGCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCT
AGAGAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTCCTGCAGGAATT
CGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGGGTTTTATAG GGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACGCTGATTGGC CCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCCCTCTCCCCT CCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGGAGAGTTTTG GCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATTCGATATCAagct agctTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggt’ttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcgg£ cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agáagcctgt cttacaacag gaaaaacaac ccttataage 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct . 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID: 15 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC
CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacg-tattagfcaatcgctattaacatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggaotttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcGtattggtc tattttcccacccttaggctgctggtctgagcctagGAGATCTCTCGAGGTCGACGGTATCG!
ATG GGTACCG GCGGCCGCC CT AT T C T AT AGT GTCAC C TAAAT GC T AGAGCTCG C Ϊ GAT CAGC
CTCGACTGTGCCTT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT
CTATGGCTTCTGAGGCGGAAAGAACCA
AAGCTTAGGCTCGAGCGGCC
GCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCTAGAGAAAC gatatgggctgaatacggatccgtattcagcccatatcgtttcccagatctctagcggatCt
GACGGTTCACTAAACCAGCTCTGCT
TATATAGACCTCCCACCGTACACGCCTACCGCCCATTTGCGTCAATGGGGCGGAGTTGTT
ACGACATTTTGGAAAGTCCCGTTGATTTTGGTGCCAAAACAAACTCCCATTGACGTCAAT
GGGGTGGAGACTTGGAAATCCCCGTGAGTCAAACCGCTATCCACGCCCATTGATGTACTG
CCAAAACCGCATCACCATGGTAATAGCGATGACTAATACGTAGATGTACTGCCAAGTAGG
AAAGTCCCATAAGGTCATGTACTGGGCATAATGCCAGGCGGGCCATTTACCGTCATTGAC
GTCAATAGGGGGCGTACTTGGCATATGATACACTTGATGTACTGCCAAGTGGGCAGTTTA
CCGTAAATACTCCACCCATTGACGTCAATGGAAAGTCCCTATTGGCGTTACTATGGGAAC
ATACGTCATTATTGACGTCAATGGGCGGGGGTCGTTGGGCGGTCAGCCAGGCGGGCCATT
TACCGTAAGTTATGTAACGCGGAACTCCATATATGGGCTATGAACTAATGACCCCGTAAT
TGATTACTATTACAGTATTACGCGCTATGAGTAACACAAAATTATTCAGATTTCACTTCC
TCTTATTCAGTTTTCCCGCGAAAATGGCCAAATCTTACTCGGTTACGCCCAAATTTACTA
CAACATCCGCCTAAAACCGCGCGAAAATTGTCACTTCCTGTGTACACCGGCGCACACCAA
AAACGTCACTTTTGCCACATCCGTCGCTTACATGTGTTCCGCCACACTTGCAACATCACA
CTTCCGCCACACTACTACGTCACCCGCCCCGTTCCCACGCCCCGCGCCACGTCACAAACT
CCACCCCCTCATTATCATATTGGCTTCAATCCAAAATAAGGTATATTATTGATGATGTTAAG
CTT gtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc , atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagegett cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID: 16 vetor de vaivém de HA, CMV-luc taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAga-kCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC
CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaGGatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccàaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgaoct ccatagaagacaccgggaccgatccagcotgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc
tattttcccacccttaggctgctggtctgagccta.gGAGArCTCTCGAGGTCGACGGT.ATcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCT 51 AGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAG 101 AGCAGGTCGA TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA 151 GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT 201 GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA 251 ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG 301 GAGAAGGCTA ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA 351 TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA 401 TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC 451 GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT 501 GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT 551 ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC 601 CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA 651 CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG 7 01 CAACACGGAG CAAAGTAAAT GGGCAATCTG G CAG GAT G GA GTTTTTCTGG 751 ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT 801 CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA 851 TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA 901 CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT 951 GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG 1001 CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT 1051 GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT 1101 GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT 1151 ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC 1201 AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG 1251 GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA 1301 TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA 1351 CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 1401 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGG 1451 GGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAA 1501 AGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCG 1551 GCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACAT 1601 ATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT 1651 ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCA 1701 GTGCCGTATT TGTATATGAg c
GCCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCC
TT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCAAAGCTtaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg 61 agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag 121 tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt 181 ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg 241 tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga 301 ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca 361 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 421 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 481 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 541 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac 601 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt 661 cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 721 cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 781 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 841 aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata
901 agcagagctg gtttagtgaa ccgtcagatc cgctagAGA37C2GGgaaacgatatgggctgaatacggatccgtat:tcagcccatatcgtttc T CT AGA AAT AAA ATA TCT TTA TTT TCA TTA CAT CTG TGT GTT GGT TTT TTG TGT GGC GG CCGCfccgagcct AAGCTTctag ataagatatc cgatccaccg gatctagata actgatcata 1021 atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 1081 ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 1141 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 1201 cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt 1261 taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgtatc tgttttgcag 1321 cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtg AGCTTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac'gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgaatcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t 1 taaggatccn nncctgtccfc cgaccgatgc ccttgagagc cttcaaccca gtcagctcct 61 tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc 121 aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac cgctttcgct 181 ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac gccctcgctc 241 aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc attatcgccg 301 gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga ggctggatgg 361 ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg ttgcaggcca 421 tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg ctcgcggctc 481 ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat gccgcctcgg 541 cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt gtctgcctcc 601 ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa gccggcggca 661 cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc ggagaactgt 721 gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct ccagcagccg 781 cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga tcgtgctcct 841 gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga atgaatcacc 901 gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac 961 atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt cagcgccctg 1021 caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg gaacacctac 1081 atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt cccgccgcat 1141 ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt catcatcagt 1201 aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca tgaacagaaa 1261 ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct taacatggcc 1321 cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct ggacgcggat 1381 gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta ccgcagctgc 1441 ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 1501 acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 1561 gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact 1621 ggcttaacta tgcggçatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa 1681 taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca 1741 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 1801 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 1861 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 1921 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 1981 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 2041 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 2101 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 2161 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 2221 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 2281 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 2341 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 2401 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 2461 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 2521 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 2581 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 2641 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 2701 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 2761 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 2821 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 2881 caactttatc cgcctccatc cagtctatta attgttgpcg ggaagctaga gtaagtagtt 2941 cgccagttaa tagtttgcgc aacgttgttg ccattgctga agccatga gattatcaaa aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggatcgaat taattcttaa ttaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agfctattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgc-fcattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcctagGAGArcrCTCGAGGTCGACGGTATcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCTAGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAGAGCAGGTCGA TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG GAGAAGGCTA ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT
ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 1401 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGGGGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAAAGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCGGCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACATATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCAGTGCCGTATT TGTATATGAg c
GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCrCGCTGATCAGCCTCGACTGTGCC
TT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC
GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCAAAGCÍTtaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata
agcagagctg gtttagtgaa ccgtcagatc cgctagAGArCiTGGgaaacgatatgggctgaatacggatccgtattcagcccatatcgtttc TCT AGA AAT AAA ATA TCT TTA TTT TCA TTA CAT CTG TGT GTT GGT TTT TTG TGT GGC GG CCGCfccgragcct AAGCTTctag ataagatatc cgatccaccg gatctagata actgatcata atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgfcatc tgttttgcag cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtg AGCTTgtcgactcg aagatctggg cgtggttaag ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat. ccgcccgcga tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagct g cagctgccgt catccctgag caggggggcc acttcgttaa gcatgtccct gactcgcatg ttttccctga ccaaatccgc cagaaggcgc tcgccgccca gcgatagcag ttcttgcaag gaagcaaagt ttttcaacgg tttgagaccg tccgccgtag gcatgctttt gagcgtttga ccaagcagtt ccaggcggtc ccacagctcg gtcacctgct ctacggcatc tcgatccagc atatctcctc gtttcgcggg ttggggcggc tttcgctgta cggcagtagt cggtgctcgt ccagacgggc cagggtcatg tctttccacg ggcgcagggt cctcgtcagc gtagtctggg tcacggtgaa ggggtgcgct ccgggctgcg cgctggccag ggtgcgcttg aggctggtcc tgctggtgct gaagcgctgc cggtcttcgc cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt ggcccttggc gcgcagcttg cccttggagg aggcgccgca cgaggggcag tgcagacttt tgagggcgta gagcttgggc gcgagaaata ccgattccgg ggagtaggca tccgcgccgc aggccccgca gacggtctcg cattccacga gccaggtgag ctctggccgt tcggggtcaa aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tctggtttcc atgagccggt gtccacgctc ggtgacgaaa aggctgtccg tgtccccgta tacagacttg agaggcctgt cctcgagcgg tgttccgcgg tcctcctcgt atagaaactc ggaccactct gagacaaagg ctcgcgtcca ggccagcacg aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt gtaggtgtag gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc tcactctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta ctccctctga aaagcgggca tgacttctgc gctaagattg tcagtttcca 6301 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcat 6361 ccatctggtc agaaaagaca atctttttgt tgtcaagctt ggtggcaaac gacccgtaga 6421 gggcgttgga cagcaacttg gcgatggagc gcagggtttg gtttttgtcg cgatcggcgc 6481 gctccttggc cgcgatgttt agctgcacgt attcgcgcgc aacgcaccgc cattcgggaa 6541 agacggtggt gcgctcgtcg ggcaccaggt gcacgcgcca accgcggttg tgcagggtga 6601 caaggtcaac gctggtggct acctctccgc gtaggcgctc gttggtccag cagaggcggc 6661 cgcccttgcg cgagcagaat ggcggtaggg ggtctagctg cgtctcgtcc ggggggtctg 6721 cgtccacggt aaagaccccg ggcagcaggc gcgcgtcgaa gtagtctatc ttgcatcctt 6781 gcaagtctag cgcctgctgc catgcgcggg cggcaagcgc gcgctcgtat gggttgagtg 6841 ggggacccca tggcatgggg tgggtgagcg cggaggcgta catgccgcaa atgtcgtaaa 6901 cgtagagggg ctctctgagt attccaagat atgtagggta gcatcttcca ccgcggatgc 6961 tggcgcgcac gtaatcgtat agttcgtgcg agggagcgag gaggtcggga ccgaggttgc 7021 tacgggcggg ctgctctgct cggaagacta tctgcctgaa gatggcatgt gagttggatg 7081 atatggttgg acgctggaag acgttgaagc tggcgtctgt gagacctacc gcgtcacgca 7141 cgaaggaggc gtaggagtcg cgcagcttgt tgaccagctc ggcggtgacc tgcacgtcta 7201 gggcgcagta gtccagggtt tccttgatga tgtcatactt atcctgtccc ttttttttcc 7261 acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7321 cgtcggcctc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7381 agcatccctt ttctacgggt agcgcgtatg cctgcgcggc cttccggagc gaggtgtggg 7441 tgagcgcaaa ggtgtccctg accatgactt tgaggtactg gtatttgaag tcagtgtcgt 7501 cgcatccgcc ctgctcccag agcaaaaagt ccgtgcgctt tttggaacgc ggatttggca 7561 gggcgaaggt gacatcgttg aagagtatct ttcccgcgcg aggcataaag ttgcgtgtga 7621 tgcggaaggg tcccggcacc tcggaacggt tgttaattac ctgggcggcg agcacgatct 7681 cgtcaaagcc gttgatgttg tggcccacaa tgtaaagttc caagaagcgc gggatgccct 7741 tgatggaagg caatttttta agttcctcgt aggtgagctc ttcaggggag ctgagcccgt 7801 gctctgaaag ggcccagtct gcaagatgag ggttggaagc gacgaatgag ctccacaggt 7861 cacgggccat tagcatttgc aggtggtcgc gaaaggtcct aaactggcga cctatggcca 7921 ttttttctgg ggtgatgcag tagaaggtaa gcgggtcttg ttcccagcgg tcccatccaa 7981 ggttcgcggc taggtctcgc gcggcagtca ctagaggctc atctccgccg aacttcatga 8041 ccagcatgaa gggcacgagc tgcttcccaa aggcccccat ccaagtatag gtctctacat 8101 cgtaggtgac aaagagacgc tcggtgcgag gatgcgagcc gatcgggaag aactggatct 8161 cccgccacca attggaggag tggctattga tgtggtgaaa gtagaagtcc ctgcgacggg 8221 ccgaacactc gtgctggctt ttgtaaaaac gtgcgcagta ctggcagcgg tgcacgggct 8281 gtacatcctg cacgaggttg acctgacgac cgcgcacaag gaagcagagt gggaatttga 8341 gcccctcgcc tggcgggttt ggctggtggt cttctacttc ggctgcttgt ccttgaccgt 8401 ctggctgctc gaggggagtt acggtggatc ggaccaccac gccgcgcgag cccaaagtcc 8461 agatgtccgc gcgcggcggt cggagcttga tgacaacatc gcgcagatgg gagctgtcca 8521 tggtctggag ctcccgcggc gtcaggtcag gcgggagctc ctgcaggttt acctcgcata 8581 gacgggtcag ggcgcgggct agatccaggt gatacctaat ttccaggggc tggttggtgg 8641 cggcgtcgat ggcttgcaag aggccgcatc cccgcggcgc gactacggta cçgcgcggcg 8701 ggcggtgggc cgcgggggtg tccttggatg atgcatctaa aagcggtgac gcgggcgagc 8761 ccccggaggt agggggggct ccggacccgc cgggagaggg ggcaggggca cgtcggcgcc 8821 gcgcgcgggc aggagctggt gctgcgcgcg taggttgctg gcgaacgcga cgacgcggcg 8881 gttgatctcc tgaatctggc gcctctgcgt gaagacgacg ggcccggtga gcttgagcct 8941 gaaagagagt tcgacagaat caatttcggt gtcgttgacg gcggcctggc gcaaaatctc 9001 ctgcacgtct cctgagttgt cttgataggc gatctcggcc atgaactgct cgatctcttc 9061 ctcctggaga tctccgcgtc cggctcgctc cacggtggcg gcgaggtcgt tggaaatgcg 9121 ggccatgagc tgcgagaagg cgttgaggcc tccctcgttc cagacgcggc tgtagaccac 9181 gcccccttcg gcatcgcggg cgcgcatgac cacctgcgcg agattgagct ccacgtgccg 9241 ggcgaagacg gcgtagtttc gcaggcgctg aaagaggtag ttgagggtgg tggcggtgtg 9301 ttctgccacg aagaagtaca taacccagcg tcgcaacgtg gattcgttga tatcccccaa 9361 ggcctcaagg cgctccatgg cctcgtagaa gtccacggcg aagttgaaaa actgggagtt 9421 gcgcgccgac acggttaact cctcctccag aagacggatg agctcggcga cagtgtcgcg 9481 cacctcgcgc tcaaaggcta caggggcctc ttcttcttct tcaatctcct cttccataag 9541 ggcctcccct tcttcttctt ctggcggcgg tgggggaggg gggacacggc ggcgacgacg 9601 gcgcaccggg aggcggtcga caaagcgctc gatcatctcc ccgcggcgac ggcgcatggt 9661 ctcggtgacg gcgcggccgt tctcgcgggg gcgcagttgg aagacgccgc ccgtcatgtc 9721 ccggttatgg gttggcgggg ggctgccatg cggcagggat acggcgctaa cgatgcatct 9781 caacaattgt tgtgtaggta ctccgccgcc gagggacctg agcgagtccg catcgaccgg 9841 atcggaaaac ctctcgagaa aggcgtctaa ccagtcacag tcgcaaggta ggctgagcac 9901 cgtggcgggc ggcagcgggc ggcggtcggg gttgtttctg gcggaggtgc tgctgatgat 9961 gtaattaaag taggcggtct tgagacggcg gatggtcgac agaagcacca tgtccttggg 10021 tccggcctgc tgaatgcgca ggcggtcggc catgccccag gcttcgtttt gacatcggcg 10081 caggtctttg tagtagtctt gcatgagcct ttctaccggc acttcttctt ctccttcctc 10141 ttgtcctgca tctcttgcat ctatcgctgc ggcggcggcg gagtttggcc gtaggtggcg 10201 ccctcttcct cccatgcgtg tgaccccgaa gcccctcatc ggctgaagca gggotaggtc 10261 ggcgacaacg cgctcggcta atatggcctg ctgcacctgc gtgagggtag actggaagtc 10321 atccatgtcc acaaagcggt ggtatgcgcc cgtgttgatg gtgtaagtgc agttggccat 10381 aacggaccag ttaacggtct ggtgacccgg ctgcgagagc tcggtgtacc tgagacgcga 10441 gtaagccctc gagtcaaata cgtagtcgtt gcaagtccgc accaggtact ggtatcccac 10501 caaaaagtgc ggcggcggct ggcggtagag gggccagcgt agggtggccg gggctccggg 10561 ggcgagatct tccaacataa ggcgatgata tccgtagatg tacctggaca tccaggtgat 10621 gccggcggcg gtggtggagg cgcgcggaaa gtcgcggacg cggttccaga tgttgcgcag 10681 cggcaaaaag tgctccatgg tcgggacgct ctggccggtc aggcgcgcgc aatcgttgac 10741 gctctaccgt gcaaaaggag agcctgtaag cgggcactct tccgtggtct ggtggataaa 10801 ttcgcaaggg tatcatggcg gacgaccggg gttcgagccc cgtatccggc cgtccgccgt 10861 gatccatgcg gttaccgccc gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga 10921 gtgctccttt tggcttcctt ccaggcgcgg cggctgctgc gctagctttt ttggccactg 10981 gccgcgcgca gcgtaagcgg ttaggctgga aagcgaaagc attaagtggc tcgctccctg 11041 tagccggagg gttattttcc aagggttgag tcgcgggacc cccggttcga gtctcggacc 11101 ggccggactg cggcgaacgg gggtttgcct ccccgtcatg caagaccccg cttgcaaatt 11161 cctccggaaa cagggacgag cccctttttt gcttttccca gatgcatccg gtgctgcggc 11221 agatgcgccc ccctcctcag cagcggcaag agcaagagca gcggcagaca tgcagggcac 11281 cctcccctcc tcctaccgcg tcaggagggg cgacatccgc ggttgacgcg gcagcagatg 11341 gtgattacga acccccgcgg cgccgggccc ggcactacct ggacttggag gagggcgagg 11401 gcctggcgcg gctaggagcg ccctctcctg agcggtaccc aagggtgcag ctgaagcgtg 11461 atacgcgtga ggcgtacgtg ccgcggcaga acctgtttcg cgaccgcgag ggagaggagc 11521 ccgaggagat gcgggatcga aagttccacg cagggcgcga gctgcggcat ggcctgaatc 11581 gcgagcggtt gctgcgcgag gaggactttg agcccgacgc gcgaaccggg attagtcccg 11641 cgcgcgcaca cgtggcggcc gccgacctgg taaccgcata cgagcagacg gtgaaccagg 11701 agattaactt tcaaaaaagc tttaacaacc' acgtgcgtac gcttgtggcg cgcgaggagg 11761 tggctatagg actgatgcat ctgtgggact ttgtaagcgc gctggagcaa aacccaaata 11821 gcaagccgct catggcgcag ctgttcctta tagtgcagca cagcagggac aacgaggcat 11881 tcagggatgc gctgctaaac atagtagagc ccgagggccg ctggctgctc gatttgataa 11941 acatcctgca gagcatagtg gtgcaggagc gcagcttgag cctggctgac aaggtggccg 12001 ccatcaacta ttccatgctt agcctgggca agttttacgc ccgcaagata taccataccc 12061 cttacgttcc catagacaag gaggtaaaga tcgaggggtt ctacatgcgc atggcgctga 12121 aggtgcttac cttgagcgac gacctgggcg tttatcgcaa cgagcgcatc cacaaggccg 12181 tgagcgtgag ccggcggcgc gagctcagcg accgcgagct gatgcacagc ctgcaaaggg 12241 ccctggctgg cacgggcagc ggcgatagag aggccgagtc ctactttgac gcgggcgctg 12301 acctgcgctg ggccccaagc cgacgcgccc tggaggcagc tggggccgga cctgggctgg 12361 cggtggcacc cgcgcgcgct ggcaacgtcg gcggcgtgga ggaatatgac gaggacgatg 12421 agtacgagcc agaggacggc gagtactaag cggtgatgtt tctgatcaga tgatgcaaga 12481 cgcaacggac ccggcggtgc gggcggcgct gcagagccag ccgtccggcc ttaactccac 12541 ggacgactgg cgccaggtca tggaccgcat catgtcgctg actgcgcgca atcctgacgc 12601 gttccggcag cagccgcagg ccaaccggct ctccgcaatt ctggaagcgg tggtcccggc 12661 gcgcgcaaac cccacgcacg agaaggtgct ggcgatcgta aacgcgctgg ccgaaaacag 12721 ggccatccgg cccgacgagg ccggcctggt ctacgacgcg ctgcttcagc gcgtggctcg 12781 ttacaacagc ggcaacg.tgc agaccaacct ggaccggctg gtgggggatg tgcgcgaggc 12841 cgtggcgcag cgtgagcgcg cgcagcagca gggcaacctg ggctccatgg ttgcactaaa 12901 cgccttcctg agtacacagc ccgccaacgt gccgcgggga caggaggact acaccaactt 12961 tgtgagcgca ctgcggctaa tggtgactga gacaccgcaa agtgaggtgt accagtctgg 13021 gccagactat tttttccaga ccagtagaca aggcctgcag accgtaaacc tgagccaggc 13081 tttcaaaaac ttgcaggggc tgtggggggt gcgggctccc acaggcgacc gcgcgaccgt 13141 gtctagcttg ctgacgccca actcgcgcct gttgctgctg ctaatagcgc ccttcacgga 13201 cagtggcagc gtgtcccggg acacatacct aggtcacttg ctgacactgt accgcgaggc 13261 cataggtcag gcgcatgtgg acgagcatac tttccaggag attacaagtg tcagccgcgc 13321 gctggggcag gaggacacgg gcagcctgga ggcaacccta aactacctgc tgaccaaccg 13381 gcggcagaag atcccctcgt tgcacagttt aaacagcgag gaggagcgca ttttgcgcta 13441 cgtgcagcag agcgtgagcc ttaacctgat gcgcgacggg gtaacgccca gcgtggcgct 13501 ggacatgacc gcgcgcaaca tggaaccggg catgtatgcc tcaaaccggc cgtttatcaa 13561 ccgcctaatg gactacttgc atcgcgcggc cgccgtgaac cccgagtatt tcaccaatgc 13621 catcttgaac ccgcactggc taccgccccc tggtttctac accgggggat tcgaggtgcc 13681 cgagggtaac gatggattcc tctgggacga catagacgac agcgtgtttt ccccgcaacc 13741 gcagaccctg ctagagttgc aacagcgcga gcaggcagag gcggcgctgc gaaaggaaag 13801 cttccgcagg ccaagcagct tgtccgatct aggcgctgcg gccccgcggt cagatgctag 13861 tagcccattt ccaagcttga tagggtctct taccagcact cgcaccaccc gcccgcgcct 13921 gctgggcgag gaggagtacc taaacaactc gctgctgcag ccgcagcgcg aaaaaaacct 13981 gcctccggca tttcccaaca acgggataga gagcctagtg gacaagatga gtagatggaa 14041 gacgtacgcg caggagcaca gggacgtgcc aggcccgcgc ccgcccaccc gtcgtcaaag 14101 gcacgaccgt cagcggggtc tggtgtggga ggacgatgac tcggcagacg acagcagcgt 14161 cctggatttg ggagggagtg gcaacccgtt tgcgcacctt cgccccaggc tggggagaat 14221 gttttaaaaa aaaaaaagca tgatgcaaaa taaaaaactc accaaggcca tggcaccgag 14281 cgttggtttt cttgtattcc ccttagtatg cggcgcgcgg cgatgtatga ggaaggtcct 14341 cctccctcct acgagagtgt ggtgagcgcg gcgccagtgg cggcggcgct gggttctccc 14401 ttcgatgctc ccctggaccc gccgtttgtg cctccgcggt acctgcggcc taccgggggg 14461 agaaacagca tccgttactc tgagttggca cccctattcg acaccacccg tgtgtacctg 14521 gtggacaaca agtcaacgga tgtggcatcc ctgaactacc agaacgacca cagcaacttt 14581 ctgaccacgg tcattcaaaa caatgactac agcccggggg aggcaagcac acagaccatc 14641 aatcttgacg accggtcgca ctggggcggc gacctgaaaa ccatcctgca taccaacatg 14701 ccaaatgtga acgagttcat gtttaccaat aagtttaagg cgcgggtgat ggtgtcgcgc 14761 ttgcctacta aggacaatca ggtggagctg aaatacgagt gggtggagtt cacgctgccc 14821 gagggcaact actccgagac catgaccata gaccttatga acaacgcgat cgtggagcac 14881 tacttgaaag tgggcagaca gaacggggtt ctggaaagcg acatcggggt aaagtttgac 14941 acccgcaact tcagactggg gtttgacccc gtcactggtc ttgtcatgcc tggggtatat 15001 acaaacgaag ccttccatcc agacatcatt ttgctgccag gatgcggggt ggacttcacc 15061 cacagccgcc tgagcaactt gttgggcatc cgcaagcggc aacccttcca ggagggcttt 15121 aggatcacct acgatgatct ggagggtggt aacattcccg cactgttgga tgtggacgcc 15181 taccaggcga gcttgaaaga tgacaccgaa cagggcgggg gtggcgcagg cggcagcaac 15241 agcagtggca gcggcgcgga agagaactcc aacgcggcag ccgcggcaat gcagccggtg 15301 gaggacatga acgatcatgc cattcgcggc gacacctttg ccacacgggc tgaggagaag 15361 cgcgctgagg ccgaagcagc ggccgaagct gccgcccccg ctgcgcaacc cgaggtcgag 15421 aagcctcaga agaaaccggt gatcaaaccc ctgacagagg acagcaagaa acgcagttac 15481 aacctaataa gcaatgacag caccttcacc cagtaccgca gctggtacct tgcatacaac 15541 tacggcgacc ctcagaccgg aatccgctca tggaccctgc tttgcactcc tgacgtaacc 15601 tgcggctcgg agcaggtcta ctggtcgttg ccagacatga tgcaagaccc cgtgaccttc 15661 cgctccacgc gccagatcag caactttccg gtggtgggcg ccgagctgtt gcccgtgcac 15721 tccaagagct tctacaacga ccaggccgtc tactcccaac tcatccgcca gtttacctct 15781 ctgacccacg tgttcaatcg ctttcccgag aaccagattt tggcgcgccc gccagccccc 15841 accatcacca ccgtcagtga aaacgttcct gctctcacag atcacgggac gctaccgctg 15901 cgcaacagca tcggaggagt ccagcgagtg accattactg acgccagacg ccgcacctgc 15961 ccctacgttt acaaggccct gggcatagtc tcgccgcgcg tcctatcgag ccgcactttt 16021 tgagcaagca tgtccátcct tatatcgccc agcaataaca caggctgggg cctgcgcttc 16081 ccaagcaaga tgtttggcgg ggccaagaag cgctccgacc aacacccagt gcgcgtgcgc 16141 gggcactacc gcgcgccctg gggcgcgcac aaacgcggcc gcactgggcg caccaccgtc 16201 gatgacgcca tcgacgcggt ggtggaggag gcgcgcaact acacgcccac gccgccacca 16261 gtgtccacag tggacgcggc cattcagacc gtggtgcgcg gagcccggcg ctatgctaaa 16321 atgaagagac ggcggaggcg cgtagcacgt cgccaccgcc gccgacccgg cactgccgcc 16381 caacgcgcgg cggcggccct gcttaaccgc gcacgtcgca ccggccgacg ggcggccatg 16441 cgggccgctc gaaggctggc cgcgggtatt gtcactgtgc cccccaggtc caggcgacga 16501 gcggccgccg cagcagccgc ggccattagt gctatgactc agggtcgcag gggcaacgtg 16561 tattgggtgc gcgactcggt tagcggcctg cgcgtgcccg tgcgcacccg ccccccgcgc 16621 aactagattg caagaaaaaa ctacttagac tcgtactgtt gtatgtatcc agcggcggcg 16681 gcgcgcaacg aagctatgtc caagcgcaaa atcaaagaag agatgctcca ggtcatcgcg 16741 ccggagatct atggcccccc gaagaaggaa gagcaggatt acaagccccg aaagctaaag 16801 cgggtcaaaa agaaaaagaa agatgatgat gatgaacttg acgacgaggt ggaactgctg 16861 cacgctaccg cgcccaggcg acgggtacag tggaaaggtc gacgcgtaaa acgtgttttg 16921 cgacccggca ccaccgtagt ctttacgccc ggtgagcgct ccacccgcac ctacaagcgc 16981 gtgtatgatg aggtgtacgg cgacgaggac ctgcttgagc aggccaacga gcgcctcggg 17041 gagtttgcct acggaaagcg gcataaggac atgctggcgt tgccgctgga cgagggcaac 17101 ccaacaccta gcctaaagcc cgtaacactg cagcaggtgc tgcccgcgct tgcaccgtcc 17161 gaagaaaagc gcggcctaaa gcgcgagtct ggtgacttgg cacccaccgt gcagctgatg 17221 gtacccaagc gccagcgact ggaagatgtc ttggaaaaaa tgaccgtgga acctgggctg 17281 gagcccgagg tccgcgtgcg gccaatcaag caggtggcgc cgggactggg cgtgcagacc 17341 gtggacgttc agatacccac taccagtagc accagtattg ccaccgccac agagggcatg 17401 gagacacaaa cgtccccggt tgcctcagcg gtggcggatg ccgcggtgca ggcggtcgct 17461 gcggccgcgt ccaagacctc tacggaggtg caaacggacc cgtggatgtt tcgcgtttca 17521 gccccccggc gcccgcgcgg ttcgaggaag tacggcgccg ccagcgcgct actgcccgaa 17581 tatgccctac atccttccat tgcgcctacc cccggctatc gtggctacac ctaccgcccc 17641 agaagacgag caactacccg acgccgaacc accactggaa cccgccgccg ccgtcgccgt 17701 cgccagcccg tgctggcccc gatttccgtg cgcagggtgg ctcgcgaagg aggcaggacc 17761 ctggtgctgc caacagcgcg ctaccacccc agcatcgttt aaaagccggt ctttgtggtt 17821 cttgcagata tggccctcac ctgccgcctc cgtttcccgg tgccgggatt ccgaggaaga 17881 atgcaccgta ggaggggcat ggccggccac ggcctgacgg gcggcatgcg tcgtgcgcac 17941 caccggcggc ggcgcgcgtc gcaccgtcgc atgcgcggcg gtatcctgcc cctccttatt 18001 ccactgatcg ccgcggcgat tggcgccgtg cccggaattg catccgtggc cttgcaggcg 18061 cagagacact gattaaaaac aagttgcatg tggaaaaatc aaaataaaaa gtctggactc 18121 tcacgctcgc ttggtcctgt aactattttg tagaatggaa gacatcaact ttgcgtctct 18181 ggccccgcga cacggctcgc gcccgttcat gggaaactgg caagatatcg gcaccagcaa 18241 tatgagcggt ggcgccttca gctggggctc gctgtggagc ggcattaaaa atttcggttc 18301 caccgttaag aactatggca gcaaggcctg gaacagcagc acaggccaga tgctgaggga 18361 taagttgaaa gagcaaaatt tccaacaaaa ggtggtagat ggcctggcct ctggcattag 18421 cggggtggtg gacctggcca accaggcagt gcaaaataag attaacagta agcttgatcc 18481 ccgccctccc gtagaggagc ctccaccggc cgtggagaca gtgtctccag aggggcgtgg 18541 cgaaaagcgt ccgcgccccg acagggaaga aactctggtg acgcaaatag acgagcctcc 18601 ctcgtacgag gaggcactaa agcaaggcct gcccaccacc cgtcccatcg cgcccatggc 18661 taccggagtg ctgggccagc acacacccgt aacgctggac •ctgcctcccc ccgccgacac 18721 ccagcagaaa cctgtgctgc caggcccgac cgccgttgtt gtaacccgtc ctagccgcgc 18781 gtccctgcgc cgcgccgcca gcggtccgcg atcgttgcgg cccgtagcca gtggcaactg 18841 gcaaagcaca ctgaacagca tcgtgggtct gggggtgcaa tccctgaagc gccgacgatg 18901 cttctgaata gctaacgtgt cgtatgtgtg tcatgtatgc gtccatgtcg ccgccagagg 18961 agctgctgag ccgccgcgcg cccgctttcc aagatggcta ccccttcgat gatgccgcag 19021 tggtcttaca tgcacatctc gggccaggac gcctcggagt acctgagccc cgggctggtg 19081 cagtttgccc gcgccaccga gacgtacttc agcctgaata acaagtttag aaaccccacg 19141 gtggcgccta cgcacgacgt gaccacagac cggtcccagc gtttgacgct gcggttcatc 19201 cctgtggacc gtgaggatac tgcgtactcg tacaaggcgc ggttcaccct agctgtgggt 19261 gataaccgtg tgctggacat ggcttccacg tactttgaca tccgcggcgt gctggacagg 19321 ggccctactt ttaagcccta ctctggcact gcctacaacg ccctggctcc caagggtgcc 19381 ccaaatcctt gcgaatggga tgaagctgct actgctcttg aaataaacct agaagaagag 19441 gacgatgaca acgaagacga agtagacgag caagctgagc agcaaaaaac tcacgtattt 19501 gggcaggcgc cttattctgg tataaatatt acaaaggagg gtattcaaat aggtgtcgaa 19561 ggtcaaacac ctaaatatgc cgataaaaca tttcaacctg aacctcaaat aggagaatct •19621 cagtggtacg aaactgaaat taatcatgca gctgggagag tccttaaaaa gactacccca 19681 atgaaaccat gttacggttc atatgcaaaa cccacaaatg aaaatggagg gcaaggcatt 19741 cttgtaaagc aacaaaatgg aaagctagaa agtcaagtgg aaatgcaatt tttctcaact 19801 actgaggcga ccgcaggcaa tggtgataac ttgactccta aagtggtatt gtacagtgaa 19861 gatgtagata tagaaacccc agacactcat atttcttaca tgcccactat taaggaaggt 19921 aactcacgag aactaatggg ccaacaatct atgcccaaca ggcctaatta cattgctttt 19981 agggacaatt ttattggtct aatgtattac aacagcacgg gtaatatggg tgttctggcg 20041 ggccaagcat cgcagttgaa tgctgttgta gatttgcaag acagaaacac agagctttca 20101 taccagcttt tgcttgattc cattggtgat agaaccaggt acttttctat gtggaatcag 20161 gctgttgaca gctatgatcc agatgttaga attattgaaa atcatggaac tgaagatgaa 20221 cttccaaatt actgctttcc actgggaggt gtgattaata cagagactct taccaaggta 20281 aaacctaaaa caggtcagga aaatggatgg gaaaaagatg ctacagaatt ttcagataaa 20341 aatgaaataa gagttggaaa taattttgcc atggaaatca atctaaatgc caacctgtgg 20401 agaaatttcc tgtactccaa catagcgctg tatttgcccg acaagctaaa gtacagtcct 20461 tccaacgtaa aaatttctga taacccaaac acctacgact acatgaacaa gcgagtggtg 20521 gctcccgggt tagtggactg ctacattaac cttggagcac gctggtccct tgactatatg 20581 gacaacgtca acccatttaa ccaccaccgc aatgctggcc tgcgctaccg ctcaatgttg 20641 ctgggcaatg gtcgctatgt gcccttccac atccaggtgc ctcagaagtt ctttgccatt 20701 aaaaacctcc ttctcctgcc gggctcatac acctacgagt ggaacttcag gaaggatgtt 20761 aacatggttc tgcagagctc cctaggaaat gacctaaggg ttgacggagc cagcattaag 20821 tttgatagca tttgccttta cgccaccttc ttccccatgg cccacaacac cgcctccacg 20881 cttgaggcca tgcttagaaa cgacaccaac gaccagtcct ttaacgacta tctctccgcc 20941 gccaacatgc tctaccctat acccgccaac gctaccaacg tgcccatatc catcccctcc 21001 cgcaactggg cggctttccg cggctgggcc ttcacgcgcc ttaagactaa ggaaacccca 21061 tcactgggct cgggctacga cccttattac acctactctg gctctatacc ctacctagat 21121 ggaacctttt acctcaacca cacctttaag aaggtggcca ttacctttga ctcttctgtc 21181 agctggcctg gcaatgaccg cctgcttacc cccaacgagt. ttgaaattaa gcgctcagtt 21241 gacggggagg gttacaacgt tgcccagtgt aacatgacca aagactggtt cctggtacaa 21301 atgctagcta actacaacat tggctaccag ggcttctata tcccagagag ctacaaggac 21361 cgcatgtact ccttctttag aaacttccag cccatgagcc gtcaggtggt ggatgatact 21421 aaatacaagg actaccaaca ggtgggcatc ctacaccaac acaacaactc tggatttgtt 21481 ggctaccttg cccccaccat gcgcgaagga caggcctacc ctgctaactt cccctatccg 21541 cttataggca agaccgcagt tgacagcatt acccagaaaa agtttctttg cgatcgcacc 21601 ctttggcgca tcccattctc cagtaacttt atgtccatgg gcgcactcac agacctgggc 21661 caaaaccttc tctacgccaa ctccgcccac gcgctagaca tgacttttga ggtggatccc 21721 atggacgagc ccacccttct ttatgttttg tttgaagtct ttgacgtggt ccgtgtgcac 21781 cggccgcacc gcggcgtcat cgaaaccgtg tacctgcgca cgcccttctc ggccggcaac 21841 gccacaacat aaagaagcaa gcaacatcaa caacagctgc cgccatgggc tccagtgagc 21901 aggaactgaa agccattgtc aaagatcttg gttgtgggcc atattttttg ggcacctatg 21961 acaagcgctt tccaggcttt gtttctccac acaagctcgc ctgcgccata gtcaatacgg 22021 ccggtcgcga gactgggggc gtacactgga tggcctttgc ctggaacccg cactcaaaaa 22081 catgctacct ctttgagccc tttggctttt ctgaccagcg actcaagcag gtttaccagt 22141 ttgagtacga gtcactcctg cgccgtagcg ccattgcttc ttcccccgac cgctgtataa 22201 cgctggaaaa gtccacccaa agcgtacagg ggcccaactc ggccgcctgt ggactattct 22261 gctgcatgtt tctccacgcc tttgccaact ggccccaaac tcccatggat cacaacccca 22321 ccatgaacct tattaccggg gtacccaact ccatgctcaa cagtccccag gtacagccca 22381 ccctgcgtcg caaccaggaa cagctctaca gcttcctgga gcgccactcg' ccctacttcc 22441 gcagccacag tgcgcagatt aggagcgcca cttctttttg tcacttgaaa aacatgtaaa 22501 aataatgtac tagagacact ttcaataaag gcaaatgctt ttatttgtac actctcgggt 22561 gattatttac ccccaccctt gccgtctgcg ccgtttaaaa atcaaagggg ttctgccgcg 22621 catcgctatg cgccactggc agggacacgt tgcgatactg gtgtttagtg ctccacttaa 22681 actcaggcac aaccatccgc ggcagctcgg tgaagttttc actccacagg ctgcgcacca 22741 tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa gtcgcagttg gggcctccgc 22801 cctgcgcgcg cgagttgcga tacacagggt tgcagcactg gaacactatc agcgccgggt 22861 ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc cgcgtccagg tcctccgcgt 22921 tgctcagggc gaacggagtc aactttggta gctgccttcc caaaaagggc gcgtgcccag 22981 gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg accgtgcccg gtctgggcgt 23041 taggatacag cgcctgcata aaagccttga tctgcttaaa agccacctga gcctttgcgc 23101 cttcagagaa gaacatgccg caagacttgc cggaaaactg attggccgga caggccgcgt 23161 cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac cacatttcgg ccccaccggt 23221 tcttcacgat cttggccttg ctagactgct ccttcagcgc gcgctgcccg ttttcgctcg 23281 tcacatccat ttcaatcacg tgctccttat ttatcataat gcttccgtgt agacacttaa 23341 gctcgccttc gatctcagcg cagcggtgca gccacaacgc gcagcccgtg ggctcgtgat 23401 gcttgtaggt cacctctgca aacgactgca ggtacgcctg caggaatcgc cccatcatcg 23461 tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc gcggtgctcc tcgttcagcc 23521 aggtcttgca tacggccgcc agagcttcca cttggtcagg cagtagtttg aagttcgcct 23581 ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg cgcagcctcc atgcccttct 23641 cccacgcaga cacgatcggc acactcagcg ggttcatcac cgtaatttca ctttccgctt 23701 cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg cgccactggg tcgtcttcat 23761 tcagccgccg cactgtgcgc ttacctcctt tgccatgctt gattagcacc ggtgggttgc 23821 tgaaacccac catttgtagc gccacatctt ctctttcttc ctcgctgtcc acgattacct 23881 ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt ctttttcttc ttgggcgcaa 23941 tggccaaatc cgccgccgag gtcgatggcc gcgggctggg tgtgcgcggc accagcgcgt 24001 cttgtgatga gtcttcctcg tcctcggact cgatacgccg cctcatccgc ttttttgggg 24061 gcgcccgggg aggcggcggc gacggggacg gggacgacac gtcctccatg gttgggggac 24121 gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg ctgctcctct tcccgactgg 24181 ccatttcctt ctcctatagg cagaaaaaga tcatggagtc agtcgagaag aaggacagcc 24241 taaccgcccc ctctgagttc gccaccaccg cctccaccga tgccgccaac gcgcctacca 24301 ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt gattatcgag caggacccag 24361 gttttgtaag cgaagacgac gaggaccgct cagtaccaac agaggataaa aagcaagacc 24421 aggacaacgc agaggcaaac gaggaacaag tcgggcgggg ggacgaaagg catggcgact 24481 acctagatgt gggagacgac gtgctgttga agcatctgca gcgccagtgc gccattatct 24541 gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat agcggatgtc agccttgcct 24601 acgaacgcca cctattctca ccgcgcgtac cccccaaacg ccaagaaaac ggcacatgcg 24661 agcccaaccc gcgcctcaac ttctaccccg tatttgccgt gccagaggtg cttgccacct 24721 atcacatctt tttccaaaac tgcaagatac ccctatcctg ccgtgccaac cgcagccgag 24781 cggacaagca gctggccttg cggcagggcg ctgtcatacc tgatatcgcc tcgctcaacg 24841 aagtgccaaa aatctttgag ggtcttggac gcgacgagaa gcgcgcggca aacgctctgc 24901 aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt ggtggaactc gagggtgaca 24961 acgcgcgcct agccgtacta aaacgcagca tcgaggtcac ccactttgcc tacccggcac 25021 ttaacctacc ccccaaggtc atgagcacag tcatgagtga gctgatcgtg cgccgtgcgc 25081 agcccctgga gagggatgca aatttgcaag aacaaacaga ggagggccita cccgcagttg 25141 gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc tgccgacttg gaggagcgac 25201 gcaaactaat gatggccgca gtgctcgtta ccgtggagct tgagtgcatg cagcggttct 25261 ttgctgaccc ggagatgcag cgcaagctag aggaaacatt gcactacacc tttcgacagg 25321 gctacgtacg ccaggcctgc aagatctcca acgtggagct ctgcaacctg gtctcctacc 25381 ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct tcattccacg ctcaagggcg 25441 aggcgcgccg cgactacgtc cgcgactgcg tttacttatt tctatgctac acctggcaga 25501 cggccatggg cgtttggcag cagtgcttgg aggagtgcaa cctcaaggag ctgcagaaac 25561 tgctaaagca aaacttgaag gacctatgga cggccttcaa cgagcgctcc gtggccgcgc 25621 acctggcgga catcattttc cccgaacgcc tgcttaaaac cctgcaacag ggtctgccag 25681 acttcaccag tcaaagcatg ttgcagaact ttaggaactt tatcctagag cgctcaggaa 25741 tcttgcccgc cacctgctgt gcacttccta gcgactttgt gcccattaag taccgcgaat 25801 gccctccgcc gctttggggc cactgctacc ttctgcagct agccaactac cttgcctacc 25861 actctgacat aatggaagac gtgagcggtg acggtctact ggagtgtcac tgtcgctgca 25921 acctatgcac cccgcaccgc tccctggttt gcaattcgca gctgcttaac gaaagtcaaa 25981 ttatcggtac ctttgagctg cagggtccct cgcctgacga aaagtccgcg gctccggggt 26041 tgaaactcac tccggggctg tggacgtcgg cttaccttcg caaatttgta cctgaggact 26101 accacgccca cgagattagg ttctacgaag accaatcccg cccgccaaat gcggagctta 26161 ccgcctgcgt cattacccag ggccacattc ttggccaatt gcaagccatc aacaaagccc 26221 gccaagagtt tctgctacga aagggacggg gggtttactt ggacccccag tccggcgagg 26281 agctcaaccc aatccccccg ccgccgcagc cctatcagca gcagccgcgg gcccttgctt 26341 cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc cacccacgga cgaggaggaa 26401 tactgggaca gtcaggcaga ggaggttttg gacgaggagg aggaggacat gatggaagac 26461 tgggagagcc tagacgagga agcttccgag gtcgaagagg tgtcagacga aacaccgtca 26521 ccctcggtcg cattcccctc gccggcgccc cagaaatcgg caaccggttc cagcatggct 26581 acaacctccg ctcctcaggc gccgccggca ctgcccgttc gccgacccaa ccgtagatgg 26641 gacaccactg gaaccagggc cggtaagtcc aagcagccgc cgccgttagc·ccaagagcaa 26701 caacagcgcc aaggctaccg ctcatggcgc gggcacaaga acgccatagt tgcttgcttg 26761 caagactgtg ggggcaacat ctccttcgcc cgccgctttc ttctctacca tcacggcgtg 26821 gccttccccc gtaacatcct gcattactac cgtcatctct acagcccata ctgcaccggc 26881 ggcagcggca gcggcagcaa cagcagcggc cacacagaag caaaggcgac cggatagcaa 26941 gactctgaca aagcccaaga aatccacagc ggcggcagca gcaggaggag gagcgctgcg 27001 tctggcgccc aacgaacccg tatcgacccg cgagcttaga aacaggattt ttcccactct 27061 gtatgctata tttcaacaga gcaggggcca agaacaagag ctgaaaataa aaaacaggtc 27121 tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc gaagatcagc ttcggcgcac 27181 gctggaagac gcggaggctc tcttcagtaa atactgcgcg ctgactctta aggactagtt 27241 tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat ctccagcggc cacacccggc 27301 gccagcacct gtcgtcagcg ccattatgag caaggaaatt cccacgccct acatgtggag 27361 ttaccagcca caaatgggac ttgcggctgg agctgcccaa gactactcaa cccgaataaa 27421 ctacatgago gcgggacccc acatgatatc ccgggtcaac ggaatccgcg cccaccgaaa 27481 ccgaattctc ttggaacagg cggctattac caccacacct cgtaataacc ttaatccccg 27541 tagttggccc gctgccctgg tgtaccagga aagtcccgct cccaccactg tggtacttcc 27501 cagagacgcc caggccgaag ttcagatgac taactcaggg gcgcagcttg cgggcggctt 27661 tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac ctgacaatca gagggcgagg 27721 tattcagctc aacgacgagt cggtgagctc ctcgcttggt ctccgtccgg acgggacatt 27781 tcagatcggc ggcgccggcc gtccttcatt cacgcctcgt caggcaatcc taactctgca 27841 gacctcgtcc tctgagccgc gctctggagg cattggaact ctgcaattta ttgaggagtt 27901 tgtgccatcg gtctacttta accccttctc gggacctccc ggccactatc cggatcaatt 27961 tattcctaac tttgacgcgg taaaggactc ggcggacggc tacgactgaa tgttaagtgg 28021 agaggcagag caactgcgcc tgaaacacct ggtccactgt cgccgccaca agtgctttgc 28081 ccgcgactcc ggtgagtttt gctactttga attgcccgag gatcatatcg agggcccggc 28141 gcacggcgtc cggcttaccg cccagggaga gcttgcccgt agcctgattc gggagtttac 28201 ccagcgcccc ctgctagttg agcgggaoag gggaccctgt gttctcactg tgatttgcaa 28261 ctgtcctaac cttggattac atcaagatcc tctagttata actagagtac ccggggatct 28321 tattcccttt aactaataaa aaaaaataat aaagcatcac ttacttaaaa tcagttagca 28381 aatttctgtc cagtttattc agcagcacct ccttgccctc ctcccagctc tggtattgca 28441 gcttcctcct ggctgcaaac tttctccaca atctaaatgg aatgtcagtt tcctcctgtt 28501 cctgtccatc cgcacccact atcttcatgt tgttgcagat gaagcgcgca agaccgtctg 28561 aagatacctt caaccccgtg tatccatatg acacggaaac cggtcctcca actgtgcctt 28621 ttcttactcc tccctttgta tcccccaatg ggtttcaaga gagtccccct ggggtactct 28681 ctttgcgcct atccgaacct ctagttacct ccaatggcat gcttgcgctc aaaatgggca 28741 acggcctctc tctggacgag gccggcaacc ttacctccca aaatgtaacc actgtgagcc 28801 cacctctcaa aaaaaccaag tcaaacataa acctggaaat atctgcaccc ctcacagtta 28861 cctcagaagc cctaactgtg gctgccgccg cacctctaat ggtcgcgggc aacacactca 28921 ccatgcaatc acaggccccg ctaaccgtgc acgactccaa acttagcatt gccacccaag 28981 gacccctcac agtgtcagaa ggaaagctag ccctgcaaac atcaggcccc ctcaccacca 29041 ccgatagcag tacccttact atcactgcct caccccctct aactactgcc actggtagct 29101 tgggcattga cttgaaagag cccatttata cacaaaatgg aaaactagga ctaaagtacg 29161 gggctccttt gcatgtaaca gacgacctaa acactttgac cgtagcaact ggtccaggtg 29221 tgactattaa taatacttcc ttgcaaacta aagttactgg agccttgggt tttgattcac 29281 aaggcaatat gcaacttaat gtagcaggag gactaaggat tgattctcaa aacagacgcc 29341 ttatacttga tgttagttat ccgtttgatg ctcaaaacca actaaatcta agactaggac 29401 agggccctct ttttataaac tcagcccaca acttggatat taactacaac aaaggccttt 29461 acttgtttac agcttcaaac aattccaaaa agcttgaggt taacctaagc actgccaagg 29521 ggttgatgtt tgacgctaca gccatagcca ttaatgcagg agatgggctt gaatttggtt 29581 cacctaatgc accaaacaca aatcccctca aaacaaaaat tggccatggc ctagaatttg 29641 attcaaacaa ggctatggtt cctaaactag gaactggcct tagttttgac agcacaggtg 29701 ccattacagt aggaaacaaa aataatgata agctaacttt gtggaccaca ccagctccat 29761 ctcctaactg tagactaaat gcagagaaag atgctaaact cactttggtc ttaacaaaat 29821 gtggcagtca aatacttgct acagtttcag ttttggctgt taaaggcagt ttggctccaa 29881 tatctggaac agttcaaagt gctcatctta ttataagatt tgacgaaaat ggagtgctac 29941 taaacaattc c-ttcctggac ccagaatatt ggaactttag aaatggagat cttactgaag 30001 gcacagccta tacaaacgct gttggattta tgcctaacct atcagcttat ccaaaatctc 30061 acggtaaaac tgccaaaagt aacattgtca gtcaagttta cttaaacgga gacaaaacta 30121 aacctgtaac actaaccatt acactaaacg gtacacagga aacaggagac acaactccaa 30181 gtgcatactc tatgtcattt tcatgggact ggtctggcca caactacatt aatgaaatat 30241 ttgccacatc ctcttacact ttttcataca ttgcccaaga ataaagaatc gtttgtgtta 30301 tgtttcaacg tgtttatttt tcaattgcag aaaatttcaa gtcatttttc attcagtagt 30361 atagccccac caccacatag cttatacaga tcaccgtacc ttaatcaaac tcacagaacc 30421 ctagtattca acctgccacc tccctcccaa cacacagagt acacagtcct ttctccccgg 30481 ctggccttaa aaagcatcat atcatgggta acagacatat tcttaggtgt tatattccac 30541 acggtttcct gtcgagccaa acgctcatca gtgatattaa taaactcccc gggcagctca 30601 cttaagttca tgtcgctgtc cagctgctga gccacaggct gctgtccaac ttgcggttgc 30661 ttaacgggcg gcgaaggaga agtccacgcc tacatggggg tagagtcata atcgtgcatc 30721 aggatagggc ggtggtgctg cagcagcgcg cgaataaact gctgccgccg ccgctccgtc 30781 ctgcaggaat acaacatggc agtggtctcc tcagcgatga ttcgcaccgc ccgcagcata 30841 aggcgccttg tcctccgggc acagcagcgc accctgatct cacttaaatc agcacagtaa 30901 ctgcagcaca gcaccacaat attgttcaaa atcccacagt gcaaggcgct gtatccaaag 30961 ctcatggcgg ggaccacaga acccacgtgg ccatcatacc acaagcgcag gtagattaag 31021 tggcgacccc tcataaacac gctggacata aacattacct cttttggcat gttgtaattc 31081 accacctccc ggtaccatat aaacctctga ttaaacatgg cgccatccac caccatccta 31141 aaccagctgg ccaaaacctg cccgccggct atacactgca gggaaccggg actggaacaa 31201 tgacagtgga gagcccagga ctcgtaacca tggatcatca tgctcgtcat gatatcaatg 31261 ttggcacaac acaggcacac gtgcatacac ttcctcagga ttacaagctc ctcccgcgtt 31321 agaaccatat cccagggaac aacccattcc tgaatcagcg taaatcccac actgcaggga 31381 agacctcgca cgtaactcac gttgtgcatt gtcaaagtgt tacattcggg cagcagcgga 31441 tgatcctcca gtatggtagc gcgggtttct gtctcaaaag gaggtagacg atccctactg 31501 tacggagtgc gccgagacaa ccgagatcgt gttggtcgta gtgtcatgcc aaatggaacg 31561 ccggacgtag tcatatttcc tgaagcaaaa ccaggtgcgg gcgtgacaaa cagatctgcg 3Ί621 tctccggtct cgccgcttag atcgctctgt gtagtagttg tagtatatcc actctctcaa 31681 agcatccagg cgccccctgg cttcgggttc tatgtaaact ccttcatgcg ccgctgccct 31741 gataacatcc accaccgcag aataagccac acccagccaa cctacacatt cgttctgcga 31801 gtcacacacg ggaggagcgg gaagagctgg aagaaccatg tttttttttt tattccaaaa 31861 gattatccaa aacctcaaaa tgaagatcta ttaagtgaac gcgctcccct ccggtggcgt 31921 ggtcaaactc tacagccaaa gaacagataa tggcatttgt aagatgttgc acaatggctt 31981 ccaaaaggca aacggccctc acgtccaagt ggacgtaaag gctaaaccct tcagggtgaa 32041 tctcctctat aaacattcca gcaccttcaa ccatgcccaa ataattctca tctcgccacc 32101 ttctcaatat atctctaagc aaatcccgaa tattaagtcc ggccattgta aaaatctgct 32161 ccagagcgcc ctccaccttc agcctcaagc agcgaatcat gattgcaaaa attcaggttc 32221 ctcacagacc tgtataagat tcaaaagcgg aacattaaca aaaataccgc gatcccgtag 32281 gtcccttcgc agggccagct gaacataatc gtgcaggtct gcacggacca gcgcggccac 32341 ttccccgcca ggaaccttga caaaagaacc cacactgatt atgacacgca tactcggagc 32401 tatgctaacc agcgtagccc cgatgtaagc tttgttgcat gggcggcgat ataaaatgca 32461 aggtgctgct caaaaaatca ggcaaagcct cgcgcaaaaa agaaagcaca tcgtagtcat 32521 gctcatgcag ataaaggcag gtaagctccg gaaccaccac agaaaaagac accatttttc 32581 tctcaaacat gtctgcgggt ttctgcataa acacaaaata aaataacaaa aaaacattta . 32641 aacattagaa gcctgtctta caacaggaaa aacaaccctt ataagcataa gacggactac 32701 ggccatgccg gcgtgaccgt aaaaaaactg gtcaccgtga ttaaaaagca ccaccgacag. 32761 ctcctcggtc atgtccggag tcataatgta agactcggta aacacatcag gttgattcat 32821 cggtcagtgc taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag 32881 acaacattac agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa 32941 cacctgaaaa accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca 33001 gcgcttcaca gcggcagcct aacagtcagc cttaccagta aaaaagaaaa cctattaaaa 33061 aaacaccact cgacacggca ccagctcaat cagtcacagt gtaaaaaagg gccaagtgca 33121 gagcgagtat atataggact aaaaaatgac gtaacggtta aagtccacaa aaaacaccca 33181 gaaaaccgca cgcgaaccta cgcccagaaa cgaaagccaa aaaacccaca acttcctcaa 33241 atcgtcactt ccgttttccc acgttacgta acttcccatt ttaagaaaac tacaattccc 33301 aacacataca agttactccg ccctaaaacc tacgtcaccc gccccgttcc cacgccccgc 33361 gccacgtcac aaactccacc ccctcattat catattggct tcaatccaaa ataaggtata 33421 ttattgatga tnnnnnttaa t SEQ ID NO:17 (ND1.1 214) 1 taaggatccn nncctgtcct cgaccgatgc ccttgagagc cttcaaccca gtcagctcct 61 tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc 121 aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac cgctttcgct 181 ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac gccctcgctc 241 aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc attatcgccg 301 gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga ggctggatgg 361 ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg ttgcaggcca 421 tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg ctcgcggctc 481 ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat gccgcctcgg 541 cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt gtctgcctcc 601 ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa gccggcggca 661 cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc ggagaactgt 721 gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct ccagcagccg 781 cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga tcgtgctcct 841 gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga atgaatcacc 901 gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac 961 atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt cagcgccctg 1021 caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg gaacacctac 1081 atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt cccgccgcat 1141 ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt catcatcagt 1201 aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca tgaacagaaa 1261 ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct taacatggcc 1321 cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct ggacgcggat 1381 gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta ccgcagctgc 1441 ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 1501 acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 1561 gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact 1621 ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa 1681 taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca 1741 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 1801 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 1861 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 1921 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 1981 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 2041 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 2101 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 2161 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 2221 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 2281 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 2341 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 2401 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 2461 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 2521 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 2581 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 2641 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 2701 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 2761 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 2821 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 2881 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 2941 cgccagttaa tagtttgcgc aacgttgttg ccattgctgc agccatga gattatcaaa aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggacto caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggatcgaat taattcttaa ttaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg
taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC
CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgoctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcctagGAGATCrCTCGAGGTCGACGGTAFcg
atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCTAGTGAAGAGC
GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAGAGCAGGTCGA
TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA GACATCTTGG
AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT GAAGCCCCTG
ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA ACCCTATGTG
TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG GAGAAGGCTA
ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA TTACGAGGAA
CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA TACAGATTAT
ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC GTTAGCTCAG
CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT GGTCTGGTTA
ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGXCTT ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT GGTCGATGGT TGGTACGGAT ACCACGATAG CAACGAACAG GGGTCCGGCT ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGGGGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAAAGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCGGCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACATATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT ATCATGATGG CTGGTCTGTC CCTATGGAIG TGTTCCAATG GAAGCCTTCAGTGCCGTATT TGTATATGAg c
GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCC
TT
CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC
ACTCCCAC
TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC
TGGGGGGT
GGGGT G GGGC AG GAC AGC AAGGGGGAG GAT T G GGAAGAC AATAGCAGGC AT GCTGGG GATGC GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCAAAGCrtaacatfcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg. agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata
agcagagctg gtttagtgaa ccgtcagatc cgc taqAGATCTGGgaaacga ta tgggctgaatacggatccgtattcagccca ta tcgt ttc TCT AGA AAT AAA ATA TCT TTA TTT TCA TTA CAT CTG TGT GTT GGT TTT TTG TGT GGC GG CCGCtcgagcct AAGCTTctag ataagatatc cgatccaccg gatctagata actgatcata atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgtatc tgttttgcag cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtg AGCTTgtcgactcg aagatctggg cgtggttaag ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagct g cagctgccgt catccctgag caggggggcc acttcgttaa gcatgtccct gactcgcatg ttttccctga ccaaatccgc cagaaggcgc tcgccgccca gcgatagcag· ttcttgcaag gaagcaaagt ttttcaacgg tttgagaccg tccgccgtag gcatgctttt gagcgtttga ccaagcagtt ccaggcggtc ccacagctcg gtcacctgct ctacggcatc tcgatccagc atatctcctc gtttcgcggg ttggggcggc tttcgctgta cggcagtagt cggtgctcgt ccagacgggc cagggtcatg tctttccacg ggcgcagggt cctcgtcagc gtagtctggg tcacggtgaa ggggtgcgct ccgggctgcg cgctggccag ggtgcgcttg aggctggtcc tgctggtgct gaagcgctgc cggtcttcgc cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt ggcccttggc gcgcagcttg cccttggagg aggcgccgca cgaggggcag tgcagacttt tgagggcgta gagcttgggc gcgagaaata ccgattccgg ggagtaggca tccgcgccgc aggccccgca gacggtctcg cattccacga gccaggtgag ctctggccgt tcggggtcaa aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tctggtttcc atgagccggt gtccacgctc ggtgacgaaa aggctgtccg tgtccccgta tacagacttg agaggcctgt cctcgagcgg tgttccgcgg tcctcctcgt atagaaactc ggaccactct gagacaaagg ctcgcgtcca ggccagcacg aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt gtaggtgtag gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc tcactctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta ctccctctga aaagcgggca tgacttctgc gctaagattg tcagtttcca 6301 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcat 6361 ccatctggtc agaaaagaca atctttttgt tgtcaagctt ggtggcaaac gacccgtaga 6421 gggcgttgga cagcaacttg gcgatggagc gcagggtttg gtttttgtcg cgatcggcgc 6481 gctccttggc cgcgatgttt agctgcacgt attcgcgcgc aacgcaccgc cattcgggaa 6541 agacggtggt gcgctcgtcg ggcaccaggt gcacgcgcca accgcggttg tgcagggtga 6601 caaggtcaac gctggtggct acctctccgc gtaggcgctc gttggtccag cagaggcggc 6661 cgcccttgcg cgagcagaat ggcggtaggg ggtctagctg cgtctcgtcc ggggggtctg 6721 cgtccacggt aaagaccccg ggcagcaggc gcgcgtcgaa gtagtctatc ttgcatcctt 6781 gcaagtctag cgcctgctgc catgcgcggg cggcaagcgc gcgctcgtat gggttgagtg 6841 ggggacccca tggcatgggg tgggtgagcg cggaggcgta catgccgcaa atgtcgtaaa 6901 cgtagagggg ctctctgagt attccaagat atgtagggta gcat'cttcca ccgcggatgc 6961 tggcgcgcac gtaatcgtat agttcgtgcg agggagcgag gaggtcggga ccgaggttgc 7021 tacgggcggg ctgctctgct cggaagacta tctgcctgaa gatggcatgt gagttggatg 7081 atatggttgg acgctggaag acgttgaagc tggcgtctgt gagacctacc gcgtcacgca 7141 cgaaggaggc gtaggagtcg cgcagcttgt tgaccagctc ggcggtgacc tgcacgtcta 7201 gggcgcagta gtccagggtt tccttgatga tgtcatactt atcctgtccc ttttttttcc 7261 acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7321 cgtcggcctc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7381 agcatccctt ttctacgggt agcgcgtatg cctgcgcggc cttccggagc gaggtgtggg 7441 tgagcgcaaa ggtgtccctg accatgactt tgaggtactg gtatttgaag tcagtgtcgt 7501 cgcatccgcc ctgctcccag agcaaaaagt ccgtgcgctt tttggaacgc ggatttggca 7561 gggcgaaggt gacatcgttg aagagtatct ttcccgcgcg aggcataaag ttgcgtgtga 7621 tgcggaaggg tcccggcacc tcggaacggt tgttaattac ctgggcggcg agcacgatct 7681 cgtcaaagcc gttgatgttg tggcccacaa tgtaaagttc caagaagcgc gggatgccct 7741 tgatggaagg caatttttta agttcctcgt aggtgagctc ttcaggggag ctgagcccgt 7801 gctctgaaag ggcccagtct gcaagatgag ggttggaagc gacgaatgag ctccacaggt 7861 cacgggccat tagcatttgc aggtggtcgc gaaaggtcct aaactggcga cctatggcca 7921 ttttttctgg ggtgatgcag tagaaggtaa gcgggtcttg ttcccagcgg tcccatccaa 7981 ggttcgcggc taggtctcgc gcggcagtca ctagaggctc atctccgccg aacttcatga 8041 ccagcatgaa gggcacgagc tgcttcccaa aggcccccat ccaagtatag gtctctacat 8101 cgtaggtgac aaagagacgc tcggtgcgag gatgcgagcc gatcgggaag aactggatct 8161 cccgccacca attggaggag tggctattga tgtggtgaaa gtagaagtcc ctgcgacggg 8221 ccgaacactc gtgctggctt ttgtaaaaac gtgcgcagta ctggcagcgg tgcacgggct 8281 gtacatcctg cacgaggttg acctgacgac cgcgcacaag gaagcagagt gggaatttga 8341 gcccctcgcc tggcgggttt ggctggtggt cttctacttc ggctgcttgt ccttgaccgt 8401 ctggctgctc gaggggagtt acggtggatc ggaccaccac gccgcgcgag cccaaagtcc 8461 agatgtccgc gcgcggcggt cggagcttga tgacaacatc gcgcagatgg gagctgtcca 8521 tggtctggag ctcccgcggc gtcaggtcag gcgggagctc ctgcaggttt acctcgcata 8581 gacgggtcag ggcgcgggct agatccaggt gatacctaat ttccaggggc tggttggtgg 8641 cggcgtcgat ggcttgcaag aggccgcatc cccgcggcgc gactacggta ccgcgcggcg 8701 ggcggtgggc cgcgggggtg tccttggatg atgcatctaa aagcggtgac gcgggcgagc 8761 ccccggaggt agggggggct ccggacccgc cgggagaggg ggcaggggca cgtcggcgcc 8821 gcgcgcgggc aggagctggt gctgcgcgcg taggttgctg gcgaacgcga cgacgcggcg 8881 gttgatctcc tgaatctggc gcctctgcgt gaagacgacg ggcccggtga gcttgagcct 8941 gaaagagagt tcgacagaat caatttcggt gtcgttgacg gcggcctggc gcaaaatctc 9001 ctgcacgtct cctgagttgt cttgataggc gatctcggcc atgaactgct cgatctcttc 9061 ctcctggaga tctccgcgtc cggctcgctc cacggtggcg gcgaggtcgt tggaaatgcg 9121 ggccatgagc tgcgagaagg cgttgaggcc tccctcgttc cagacgcggc tgtagaccac 9181 gcccccttcg gcatcgcggg cgcgcatgac cacctgcgcg agattgagct ccacgtgccg 9241 ggcgaagacg gcgtagtttc gcaggcgctg aaagaggtag ttgagggtgg tggcggtgtg 9301 ttctgccacg aagaagtaca taacccagcg tcgcaacgtg gattcgttga tatcccccaa 9361 ggcctcaagg cgctccatgg cctcgtagaa gtccacggcg aagttgaaaa actgggagtt 9421 gcgcgccgac acggttaact cctcctccag aagacggatg agctcggcga cagtgtcgcg 9481 cacctcgcgc tcaaaggcta caggggcctc ttcttcttct tcaatctcct cttccataag 9541 ggcctcccct tcttcttctt ctggcggcgg tgggggaggg gggacacggc ggcgacgacg 9601 gcgcaccggg aggcggtcga caaagcgctc gatcatctcc ccgcggcgac ggcgcatggt 9661 ctcggtgacg gcgcggccgt tctcgcgggg gcgcagttgg aagacgccgc ccgtcatgtc 9721 ccggttatgg gttggcgggg ggctgccatg cggcagggat acggcgctaa cgatgcatct 9781 caacaattgt tgtgtaggta ctccgccgcc gagggacctg agcgagtccg catcgaccgg 9841 atcggaaaac ctctcgagaa aggcgtctaa ccagtcacag tcgcaaggta ggctgagcac 9901 cgtggcgggc ggcagcgggc ggcggtcggg gttgtttctg gcggaggtgc tgctgatgat 9961 gtaattaaag taggcggtct tgagacggcg gatggtcgac agaagcacca tgtccttggg 10021 tccggcctgc tgaatgcgca ggcggtcggc catgccccag gcttcgtttt gacatcggcg 10081 caggtctttg tagtagtctt gcatgagcct ttctaccggc acttcttctt ctccttcctc 10141 ttgtcctgca tctcttgcat ctatcgctgc ggcggcggcg gagtttggcc gtaggtggcg 10201 ccctcttcct cccatgcgtg tgaccccgaa gcccctcatc ggctgaagca gggctaggtc 10261 ggcgacaacg cgctcggcta atatggcctg ctgcacctgc gtgagggtag actggaagtc 10321 atccatgtcc acaaagcggt ggtatgcgcc cgtgttgatg gtgtaagtgc agttggccat 10381 aacggaccag ttaacggtct ggtgacccgg ctgcgagagc tcggtgtacc tgagacgcga 10441 gtaagccctc gagtcaaata cgtagtcgtt gcaagtccgc accaggtact ggtatcccac 10501 caaaaagtgc ggcggcggct ggcggtagag gggccagcgt agggtggccg gggctccggg 10561 ggcgagatct tccaacataa ggcgatgata tccgtagatg tacctggaca tccaggtgat 10621 gccggcggcg gtggtggagg cgcgcggaaa gtcgcggacg cggttccaga tgttgcgcag 10681 cggcaaaaag tgctccatgg tcgggacgct ctggccggtc aggcgcgcgc aatcgttgac 10741 gctctaccgt gcaaaaggag agcctgtaag cgggcactct tccgtggtct ggtggataaa 10801 ttcgcaaggg tatcatggcg gacgaccggg gttcgagccc cgtatccggc cgtccgccgt 10861 gatccatgcg gttaccgccc gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga 10921 gtgctccttt tggcttcctt ccaggcgcgg cggctgctgc gctagctttt ttggccactg 10981 gccgcgcgca gcgtaagcgg ttaggctgga aagcgaaagc attaagtggc tcgctccctg 11041 tagccggagg gttattttcc aagggttgag tcgcgggacc cccggttcga gtctcggacc 11101 ggccggactg cggcgaacgg gggtttgcct ccccgtcatg caagaccccg cttgcaaatt 11161 cctccggaaa cagggacgag cccctttttt gcttttccca gatgcatccg gtgctgcggc 11221 agatgcgccc ccctcctcag cagcggcaag agcaagagca gcggcagaca tgcagggcac 11281 cctcccctcc tcctaccgcg tcaggagggg cgacatccgc ggttgacgcg gcagcagatg 11341 gtgattacga acccccgcgg cgccgggccc ggcactacct ggacttggag gagggcgagg 11401 gcctggcgcg gctaggagcg ccctctcctg agcggtaccc aagggtgcag ctgaagcgtg 11461 atacgcgtga ggcgtacgtg ccgcggcaga acctgtttcg cgaccgcgag ggagaggagc 11521 ccgaggagat gcgggatcga aagttccacg cagggcgcga gctgcggcat ggcctgaatc 11581 gcgagcggtt gctgcgcgag gaggactttg agcccgacgc gcgaaccggg attagtcccg 11641 cgcgcgcaca cgtggcggcc gccgacctgg taaccgcata cgagcagacg gtgaaccagg 11701 agattaactt tcaaaaaagc tttaacaacc acgtgcgtac gcttgtggcg cgcgaggagg 11761 tggctatagg actgatgcat ctgtgggact ttgtaagcgc gctggagcaa aacccaaata 11821 gcaagccgct catggcgcag ctgttcctta tagtgcagca cagcagggac aacgaggcat 11881 tcagggatgc gctgctaaac atagtagagc ccgagggccg ctggctgctc gatttgataa 11941 acatcctgca gagcatagtg gtgcaggagc gcagcttgag cctggctgac aaggtggccg 12001 ccatcaacta ttccatgctt agcctgggca agttttacgc ccgcaagata taccataccc 12061 cttacgttcc catagacaag gaggtaaaga tcgaggggtt ctacatgcgc atggcgctga 12121 aggtgcttac cttgagcgac gacctgggcg tttatcgcaa cgagcgcatc cacaaggccg 12181 tgagcgtgag ccggcggcgc gagctcagcg accgcgagct gatgcacagc ctgcaaaggg 12241 ccctggctgg cacgggcagc ggcgatagag aggccgagtc ctactttgac gcgggcgctg 12301 acctgcgctg ggccccaagc cgacgcgccc tggaggcagc tggggccgga cctgggctgg 12361 cggtggcacc cgcgcgcgct ggcaacgtcg gcggcgtgga ggaatatgac gaggacgatg 12421 agtacgagcc agaggacggc gagtactaag cggtgatgtt tctgatcaga tgatgcaaga 12481 cgcaacggac ccggcggtgc gggcggcgct gcagagccag ccgtccggcc ttaactccac 12541 ggacgactgg cgccaggtca tggaccgcat catgtcgctg actgcgcgca atcctgacgc 12601 gttccggcag cagccgcagg ccaaccggct ctccgcaatt ctggaagcgg tggtcccggc 12661 gcgcgcaaac cccacgcacg agaaggtgct ggcgatcgta aacgcgctgg ccgaaaacag 12721 ggccatccgg cccgacgagg ccggcctggt ctacgacgcg ctgcttcagc gcgtggctcg 12781 ttacaacagc ggcaacgtgc agaccaacct ggaccggctg gtgggggatg tgcgcgaggc 12841 cgtggcgcag cgtgagcgcg cgcagcagca gggcaacctg ggctccatgg ttgcactaaa 12901 cgccttcctg agtacacagc ccgccaacgt gccgcgggga caggaggact acaccaactt 12961 tgtgagcgca ctgcggctaa tggtgactga gacaccgcaa agtgaggtgt accagtctgg 13021 gccagactat tttttccaga ccagtagaca aggcctgcag accgtaaacc tgagccaggc 13081 tttcaaaaac ttgcaggggc tgtggggggt gcgggctccc acaggcgacc gcgcgaccgt 13141 gtctagcttg ctgacgccca actcgcgcct gttgctgctg ctaatagcgc ccttcacgga 13201 cagtggcagc gtgtcccggg acacatacct aggtcacttg ctgacactgt accgcgaggc 13261 cataggtcag gcgcatgtgg acgagcatac tttccaggag attacaagtg tcagccgcgc 13321 gctggggcag gaggacacgg gcagcctgga ggcaacccta aactacctgc tgaccaaccg 13381 gcggcagaag atcccctcgt tgcacagttt aaacagcgag gaggagcgca ttttgcgcta 13441 cgtgcagcag agcgtgagcc ttaacctgat gcgcgacggg gtaacgccca gcgtggcgct 13501 ggacatgacc gcgcgcaaca tggaaccggg catgtatgcc tcaaaccggc cgtttatcaa 13561 ccgcctaatg gactacttgc atcgcgcggc cgccgtgaac cccgagtatt tcaccaatgc 13621 catcttgaac ccgcactggc taccgccccc tggtttctac accgggggat tcgaggtgcc 13681 cgagggtaac gatggattcc tctgggacga catagacgac agcgtgtttt ccccgcaacc 13741 gcagaccctg ctagagttgc aacagcgcga gcaggcagag gcggcgctgc gaaaggaaag 13801 cttccgcagg ccaagcagct tgtccgatct aggcgctgcg gccccgcggt cagatgctag 13861 tagcccattt ccaagcttga tagggtctct taccagcact cgcaccaccc gcccgcgcct 13921 gctgggcgag gaggagtacc taaacaactc gctgctgcag ccgcagcgcg aaaaaaacct 13981 gcctccggca tttcccaaca acgggataga gagcctagtg gacaagatga gtagatggaa 14041 gacgtacgcg caggagcaca gggacgtgcc aggcccgcgc ccgcccaccc gtcgtcaaag 14101 gcacgaccgt cagcggggtc tggtgtggga ggacgatgac tcggcagacg acagcagcgt 14161 cctggatttg ggagggagtg gcaacccgtt tgcgcacctt cgccccaggc tggggagaat 14221 gttttaaaaa aaaaaaagca tgatgcaaaa taaaaaactc accaaggcca tggcaccgag 14281 cgttggtttt cttgtattcc ccttagtatg cggcgcgcgg cgatgtatga ggaaggtcct 14341 cctccctcct acgagagtgt ggtgagcgcg gcgccagtgg cggcggcgct gggttctccc 14401 ttcgatgctc ccctggaccc gccgtttgtg cctccgcggt acctgcggcc taccgggggg 14461 agaaacagca tccgttactc tgagttggca cccctattcg acaccacccg tgtgtacctg .14521 gtggacaaca agtcaacgga tgtggcatcc ctgaactacc agaacgacca cagcaacttt 14581 ctgaccacgg tcattcaaaa caatgactac agcccggggg aggcaagcac acagaccatc 14641 aatcttgacg accggtcgca ctggggcggc gacctgaaaa ccatcctgca taccaacatg 14701 ccaaatgtga acgagttcat gtttaccaat aagtttaagg cgcgggtgat ggtgtcgcgc 14761 ttgcctacta aggacaatca ggtggagctg aaatacgagt gggtggagtt cacgctgccc 14821 gagggcaact actccgagac catgaccata gaccttatga acaacgcgat cgtggagcac 14881 tacttgaaag tgggcagaca gaacggggtt ctggaaagcg acatcggggt aaagtttgac 14941 acccgcaact tcagactggg gtttgacccc gtcactggtc ttgtcatgcc tggggtatat 15001 acaaacgaag ccttccatcc agacatcatt ttgctgccag gatgcggggt ggacttcacc 15061 cacagccgcc tgagcaactt gttgggcatc cgcaagcggc aacccttcca ggagggcttt 15121 aggatcacct acgatgatct ggagggtggt aacattcccg cactgttgga tgtggacgcc 15181 taccaggcga gcttgaaaga tgacaccgaa cagggcgggg gtggcgcagg cggcagcaac 15241 agcagtggca gcggcgcgga agagaactcc aacgcggcag ccgcggcaat gcagccggtg 15301 gaggacatga acgatcatgc cattcgcggc gacacctttg ccacacgggc tgaggagaag 15361 cgcgctgagg ccgaagcagc ggccgaagct gc.cgcccccg ctgcgcaacc cgaggtcgag 15421 aagcctcaga agaaaccggt gatcaaaccc ctgacagagg acagcaagaa acgcagttac 15481 aacctaataa gcaatgacag caccttcacc cagtaccgca gctggtacct tgcatacaac 15541 tacggcgacc ctcagaccgg aatccgctca tggaccctgc tttgcactcc tgacgtaacc 15601 tgcggctcgg agcaggtcta ctggtcgttg ccagacatga tgcaagaccc cgtgaccttc 15661 cgctccacgc gccagatcag caactttccg gtggtgggcg ccgagctgtt gcccgtgcac 15721 tccaagagct tctacaacga ccaggccgtc tactcccaac tcatccgcca gtttacctct 15781 ctgacccacg tgttcaatcg ctttcccgag aaccagattt tggcgcgccc gccagccccc 15841 accatcacca ccgtcagtga aaacgttcct gctctcacag atcacgggac gctaccgctg 15901 cgcaacagca tcggaggagt ccagcgagtg accattactg acgccagacg ccgcacctgc 15961 ccctacgttt acaaggccct gggcatagtc tcgccgcgcg tcctatcgag ccgcactttt 16021 tgagcaagca tgtccatcct tatatcgccc agcaataaca caggctgggg cctgcgcttc 16081 ccaagcaaga tgtttggcgg ggccaagaag cgctccgacc aacacccagt gcgcgtgcgc 16141 gggcactacc gcgcgccctg gggcgcgcac aaacgcggcc gcactgggcg caccaccgtc 16201 gatgacgcca tcgacgcggt ggtggaggag gcgcgcaact acacgcccac gccgccacca 16261 gtgtccacag tggacgcggc cattcagacc gtggtgcgcg gagcccggcg ctatgctaaa 16321 atgaagagac ggcggaggcg cgtagcacgt cgccaccgcc gccgacccgg cactgccgcc 16381 caacgcgcgg cggcggccct gcttaaccgc gcacgtcgca ccggccgacg ggcggccatg 16441 cgggccgctc gaaggctggc cgcgggtatt gtcactgtgc cccccaggtc caggcgacga 16501 gcggccgccg cagcagccgc ggccattagt gctatgactc agggtcgcag gggcaacgtg 16561 tattgggtgc gcgactcggt tagcggcctg cgcgtgcccg tgcgcacccg ccccccgcgc 16621 aactagattg caagaaaaaa ctacttagac tcgtactgtt gtatgtatcc agcggcggcg 16681 gcgcgcaacg aagctatgtc caagcgcaaa atcaaagaag agatgctcca ggtcatcgcg 16741 ccggagatct atggcccccc gaagaaggaa gagcaggatt acaagccccg aaagctaaag 16801 cgggtcaaaa agaaaaagaa agatgatgat gatgaacttg acgacgaggt ggaactgctg 16861 cacgctaccg cgcccaggcg acgggtacag tggaaaggtc gacgcgtaaa acgtgttttg 16921 cgacccggca ccaccgtagt ctttacgccc ggtgagcgct ccacccgcac ctacaagcgc 16981 gtgtatgatg aggtgtacgg cgacgaggac ctgcttgagc aggccaacga gcgcctcggg 17041 gagtttgcct acggaaagcg gcataaggac atgctggcgt tgccgctgga cgagggcaac 17101 ccaacaccta gcctaaagcc cgtaacactg cagcaggtgc tgcccgcgct tgcaccgtcc 17161 gaagaaaagc gcggcctaaa gcgcgagtct ggtgacttgg cacccaccgt gcagctgatg 17221 gtacccaagc gccagcgact ggaagatgtc ttggaaaaaa tgaccgtgga acctgggctg 17281 gagcccgagg tccgcgtgcg gccaatcaag caggtggcgc cgggactggg cgtgcagacc 17341 gtggacgttc agatacccac taccagtagc accagtattg ccaccgccac agagggcatg 17401 gagacacaaa cgtccccggt tgcctcagcg gtggcggatg ccgcggtgca ggcggtcgct 17461 gcggccgcgt ccaagacctc tacggaggtg caaacggacc cgtggatgtt tcgcgtttca 17521 gccccccggc gcccgcgcgg ttcgaggaag tacggcgccg ccagcgcgct actgcccgaa 17581 tatgccctac atccttccat tgcgcctacc cccggctatc gtggctacac ctaccgcccc 17641 agaagacgag càactacccg acgccgaacc accactggaa cccgccgccg ccgtcgccgt 17701 cgccagcccg tgctggcccc gatttccgtg cgcagggtgg ctcgcgaagg aggcaggacc 17761 ctggtgctgc caacagcgcg ctaccacccc agcatcgttt aaaagccggt ctttgtggtt 17821 cttgcagata tggccctcac ctgccgcctc cgtttcccgg tgccgggatt ccgaggaaga 17881 atgcaccgta ggaggggcat ggccggccac ggcctgacgg gcggcatgcg tcgtgcgcac 17941 caccggcggc ggcgcgcgtc gcaccgtcgc atgcgcggcg gtatcctgcc cctccttatt 18001 ccactgatcg ccgcggcgat tggcgccgtg cccggaattg catccgtggc cttgcaggcg 18061 cagagacact gattaaaaac aagttgcatg tggaaaaatc aaaataaaaa gtctggactc 18121 tcacgctcgc ttggtcctgt aactattttg tagaatggaa gacatcaact ttgcgtctct 18181 ggccccgcga cacggctcgc gcccgttcat gggaaactgg caagatatcg gcaccagcaa 18241 tatgagcggt ggcgccttca gctggggctc gctgtggagc ggcattaaaa atttcggttc 18301 caccgttaag aactatggca gcaaggcctg gaacagcagc acaggccaga tgctgaggga 18361 taagttgaaa gagcaaaatt tccaacaaaa ggtggtagat ggcctggcct ctggcattag 18421 cggggtggtg gacctggcca accaggcagt gcaaaataag attaacagta agcttgatcc 18481 ccgccctccc gtagaggagc ctccaccggc cgtggagaca gtgtctccag aggggcgtgg 18541 cgaaaagcgt ccgcgccccg acagggaaga aactctggtg acgcaaatag'acgagcctcc 18601 ctcgtacgag gaggcactaa agcaaggcct gcccaccacc cgtcccatcg cgcccatggc 18661 taccggagtg ctgggccagc acacacccgt aacgctggac ctgcctcccc ccgccgacac 18721 ccagcagaaa cctgtgctgc caggcccgac cgccgttgtt gtaacccgtc ctagccgcgc 18781 gtccctgcgc cgcgccgcca gcggtccgcg atcgttgcgg cccgtagcca gtggcaactg 18841 gcaaagcaca ctgaacagca tcgtgggtct gggggtgcaa tccctgaagc gccgacgatg 18901 cttctgaata gctaacgtgt cgtatgtgtg tcatgtatgc gtccatgtcg ccgccagagg 18961 agctgctgag ccgccgcgcg cccgctttcc aagatggcta ccccttcgat gatgccgcag 19021 tggtcttaca tgcacatctc gggccaggac gcctcggagt acctgagccc cgggctggtg 19081 cagtttgccc gcgccaccga gacgtacttc agcctgaata acaagtttag aaaccccacg 19141 gtggcgccta cgcacgacgt gaccacagac cggtcccagc gtttgacgct gcggttcatc 19201 cctgtggacc gtgaggatac tgcgtactcg tacaaggcgc ggttcaccct agctgtgggt 19261 gataaccgtg tgctggacat ggcttccacg tactttgaca tccgcggcgt gctggacagg 19321 ggccctactt ttaagcccta ctctggcact gcctacaacg ccctggctcc caagggtgcc 19381 ccaaatcctt gcgaatggga tgaagctgct actgctcttg aaataaacct agaagaagag 19441 gacgatgaca acgaagacga agtagacgag caagctgagc agcaaaaaac tcacgtattt • 19501 gggcaggcgc cttattctgg tataaatatt acaaaggagg gtattcaaat aggtgtcgaa 19561 ggtcaaacac ctaaatatgc cgataaaaca tttcaacctg aacctcaaat aggagaatct 19621 cagtggtacg aaactgaaat taatcatgca gctgggagag tccttaaaaa gactacccca 19681 atgaaaccat gttacggttc atatgcaaaa cccacaaatg aaaatggagg gcaaggcatt 19741 cttgtaaagc aacaaaatgg aaagctagaa agtcaagtgg aaatgcaatt tttctcaact 19801 actgaggcga ccgcaggcaa tggtgataac ttgactccta aagtggtatt gtacagtgaa 19861 gatgtagata tagaaacccc aga'cactcat atttcttaca tgcccactat taaggaaggt 19921 aactcacgag aactaatggg ccaacaatct atgcccaaca ggcctaatta cattgctttt 19981 agggacaatt ttattggtct aatgtattac aacagcacgg gtaatatggg tgttctggcg 20041 ggccaagcat cgcagttgaa tgctgttgta gatttgcaag acagaaacac agagctttca 20101 taccagcttt tgcttgattc cattggtgat agaaccaggt acttttctat gtggaatcag 20161 gctgttgaca gctatgatcc agatgttaga attattgaaa atcatggaac tgaagatgaa 20221 cttccaaatt actgctttcc actgggaggt gtgattaata cagagactct taccaaggta 20281 aaacctaaaa caggtcagga aaatggatgg gaaaaagatg ctacagaatt ttcagataaa 20341 aatgaaataa gagttggaaa taattttgcc atggaaatca atctaaatgc caacctgtgg 20401 agaaatttcc tgtactccaa catagcgctg tatttgcccg acaagctaaa gtacagtcct 20461 tccaacgtaa aaatttctga taacccaaac acctacgact acatgaacaa gcgagtggtg 20521 gctcccgggt tagtggactg ctacattaac cttggagcac gctggtccct tgactatatg 20581 gacaacgtca acccatttaa ccaccaccgc aatgctggcc tgcgctaccg ctcaatgttg 20641 ctgggcaatg gtcgctatgt gcccttccac atccaggtgc ctcagaagtt ctttgccatt 20701 aaaaacctcc ttctcctgcc gggctcatac acctacgagt ggaacttcag gaaggatgtt 20761 aacatggttc tgcagagctc cctaggaaat gacctaaggg ttgacggagc cagcattaag 20821 tttgatagca tttgccttta cgccaccttc ttccccatgg cccacaacac cgcctccacg 20881 cttgaggcca tgcttagaaa cgacaccaac gaccagtcct ttaacgacta tctctccgcc 20941 gccaacatgc tctaccctat acccgccaac gctaccaacg tgcccatatc catcccctcc 21001 cgcaactggg cggctttccg cggctgggcc ttcacgcgcc ttaagactaa ggaaacccca 21061 tcactgggct cgggctacga cccttattac acctactctg gctctatacc ctacctagat 21121 ggaacctttt acctcaacca cacctttaag aaggtggcca ttacctttga ctcttctgtc 21181 agctggcctg gcaatgaccg cctgcttacc cccaacgagt ttgaaattaa gcgctcagtt 21241 gacggggagg gttacaacgt tgcccagtgt aacatgacca aagactggtt cctggtacaa 21301 atgctagcta actacaacat tggctaccag ggcttctata tcccagagag ctacaaggac 21361 cgcatgtact ccttctttag aaacttccag cccatgagcc gtcaggtggt ggatgatact 21421 aaatacaagg actaccaaca ggtgggcatc ctacaccaac acaacaactc tggatttgtt 21481 ggctaccttg cccccaccat gcgcgaagga caggcctacc ctgctaactt cccctatccg 21541 cttataggca agaccgcagt tgacagcatt acccagaaaa agtttctttg cgatcgcacc 21601 ctttggcgca tcccattctc cagtaacttt atgtccatgg gcgcactcac agacctgggc 21661 caaaaccttc tctacgccaa ctccgcccac gcgctagaca tgacttttga ggtggatccc 21721 atggacgagc ccacccttct ttatgttttg tttgaagtct ttgacgtggt ccgtgtgcac 21781 cggccgcacc gcggcgtcat cgaaaccgtg tacctgcgca cgcccttctc ggccggcaac 21841 gccacaacat aaagaagcaa gcaacatcaa caacagctgc cgccatgggc tccagtgagc 21901 aggaactgaa agccattgtc aaagatcttg gttgtgggcc atattttttg ggcacctatg 21961 acaagcgctt tccaggcttt gtttctccac acaagctcgc ctgcgccata gtcaatacgg 22021 ccggtcgcga gactgggggc gtacactgga tggcctttgc ctggaacccg cactcaaaaa 22081 catgctacct ctttgagccc tttggctttt ctgaccagcg actcaagcag gtttaccagt 22141 ttgagtacga gtcactcctg cgccgtagcg ccattgcttc ttcccccgac cgctgtataa 22201 cgctggaaaa gtccacccaa agcgtacagg ggcccaactc ggccgcctgt ggactattct 22261 gctgcatgtt tctccacgcc tttgccaact ggccccaaac tcccatggat cacaacccca 22321 ccatgaacct tattaccggg gtacccaact ccatgctcaa cagtccccag gtacagccca 22381 ccctgcgtcg caaccaggaa cagctctaca gcttcctgga gcgccactcg ccctacttcc 22441 gcagccacag tgcgcagatt aggagcgcca cttctttttg tcacttgaaa aacatgtaaa 22501 aataatgtac tagagacact ttcaataaag gcaaatgctt ttatttgtac actctcgggt 22561 gattatttac ccccaccctt gccgtctgcg ccgtttaaaa atcaaagggg ttctgccgcg · 22621 catcgctatg cgccactggc agggacacgt tgcgatactg gtgtttagtg ctccacttaa 22681 actcaggcac aaccatccgc ggcagctcgg tgaagttttc actccacagg ctgcgcàcca 22741 tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa gtcgcagttg gggcctccgc 22801 cctgcgcgcg cgagttgcga tacaçagggt tgcagcactg gaacactatc agcgccgggt 22861 ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc cgcgtccagg tcctccgcgt 22921 tgctcagggc gaacggagtc aactttggta gctgccttcc caaaaagggc gcgtgcccag 22981 gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg accgtgcccg gtctgggcgt 23041 taggatacag cgcctgcata aaagccttga tctgcttaaa agccacctga gcctttgcgc 23101 cttcagagaa gaacatgccg caagacttgc cggaaaactg attggccgga caggccgcgt 23161 cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac cacatttcgg ccccaccggt 23221 tcttcacgat cttggccttg ctagactgct ccttcagcgc gcgctgcccg ttttcgctcg 23281 tcacatccat ttcaatcacg tgctccttat ttatcataat gcttccgtgt agacacttaa 23341 gctcgccttc gatctcagcg cagcggtgca gccacaacgc gcagcccgtg ggctcgtgat 23401 gcttgtaggt cacctctgca aacgactgca ggtacgcctg caggaatcgc cccatcatcg 23461 tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc gcggtgctcc tcgttcagcc 23521 aggtcttgca tacggccgcc agagcttcca cttggtcagg cagtagtttg aagttcgcct 23581 ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg cgcagcctcc atgcccttct 23641 cccacgcaga cacgatcggc acactcagcg ggttcatcac cgtaatttca ctttccgctt 23701 cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg cgccactggg tcgtcttcat 23761 tcagccgccg cactgtgcgc ttacctcctt tgccatgctt gattagcacc ggtgggttgc 23821 tgaaacccac catttgtagc gccacatctt ctctttcttc ctcgctgtcc acgattacct 23881 ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt ctttttcttc ttgggcgcaa 23941 tggccaaatc cgccgccgag gtcgatggcc gcgggctggg tgtgcgcggc accagcgcgt 24001 cttgtgatga gtcttcctcg tcctcggact cgatacgccg cctcatccgc ttttttgggg 24061 gcgcccgggg aggcggcggc gacggggacg gggacgacac gtcctccatg gttgggggac 24121 gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg ctgctcctct tcccgactgg 24181 ccatttcctt ctcctatagg cagaaaaaga tcatggagtc agtcgagaag aaggacagcc 24241 taaccgcccc ctctgagttc gccaccaccg cctccaccga tgccgccaac gcgcctacca 24301 ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt gattatcgag caggacccag 24361 gttttgtaag cgaagacgac gaggaccgct cagtaccaac agaggataaa aagcaagacc 24421 aggacaacgc agaggcaaac gaggaacaag tcgggcgggg ggacgaaagg catggcgact 24481 acctagatgt gggagacgac gtgctgttga agcatctgca gcgccagtgc gccattatct 24541 gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat agcggatgtc agccttgcct 24601 acgaacgcca cctattctca ccgcgcgtac cccccaaacg ccaagaaaac ggcacatgcg 24661 agcccaaccc gcgcctcaac ttctaccccg tatttgccgt gccagaggtg cttgccacct 24721 atcacatctt tttccaaaac tgcaagatac ccctatcctg ccgtgccaac cgcagccgag 24781 cggacaagca gctggccttg cggcagggcg ctgtcatacc tgatatcgcc tcgctcaacg 24841 aagtgccaaa aatctttgag ggtcttggac gcgacgagaa gcgcgcggca aacgctctgc 24901 aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt ggtggaactc gagggtgaca 24961 acgcgcgcct agccgtacta aaacgcagca tcgaggtcac ccactttgcc tacccggcac 25021 ttaacctacc ccccaaggtc atgagcacag tcatgagtga gctgatcgtg cgccgtgcgc 25081 agcccctgga gagggatgca aatttgcaag aacaaacaga ggagggccta cccgcagttg 25141 gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc tgccgacttg gaggagcgac 25201 gcaaactaat gatggccgca gtgctcgtta ccgtggagct tgagtgcatg cagcggttct 25261 ttgctgaccc ggagatgcag' cgcaagctag aggaaacatt gcactacacc tttcgacagg 25321 gctacgtacg ccaggcctgc aagatctcca acgtggagct ctgcaacctg gtctcctacc 25381 ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct tcattccacg ctcaagggcg 25441 aggcgcgccg cgactacgtc cgcgactgcg tttacttatt tctatgctac acctggcaga 25501 cggccatggg cgtttggcag cagtgcttgg aggagtgcaa cctcaaggag ctgcagaaac 25561 tgctaaagca aaacttgaag gacctatgga cggccttcaa cgagcgctcc gtggccgcgc 25621 acctggcgga catcattttc cccgaacgcc tgcttaaaac cctgcaacag ggtctgccag 25681 acttcaccag tcaaagcatg ttgcagaact ttaggaactt tatcctagag cgctcaggaa 25741 tcttgcccgc cacctgctgt gcacttccta gcgactttgt gcccattaag taccgcgaat 25801 gccctccgcc gctttggggc cactgctacc ttctgcagct agccaactac cttgcctacc 25861 actctgacat aatggaagac gtgagcggtg acggtctact ggagtgtcac tgtcgctgca 25921 acctatgcac cccgcaccgc tccctggttt gcaattcgca gctgcttaac gaaagtcaaa 25981 ttatcggtac ctttgagctg cagggtccct cgcctgacga aaagtccgcg gctccggggt 26041 tgaaactcac tccggggctg tggacgtcgg cttaccttcg caaatttgta cctgaggact 26101 accacgccca cgagattagg ttctacgaag accaatcccg cccgccaaat gcggagctta 26161 ccgcctgcgt cattacccag ggccacattc ttggccaatt gcaagccatc aacaaagccc 26221 gccaagagtt tctgctacga aagggacggg gggtttactt ggacccccag tccggcgagg 26281 agctcaaccc aatccccccg ccgccgcagc cctatcagca gcagccgcgg gcccttgctt 26341 cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc cacccacgga cgaggaggaa 26401 tactgggaca gtcaggcaga ggaggttttg gacgaggagg aggaggacat gatggaagac 26461 tgggagagcc tagacgagga agcttccgag gtcgaagagg tgtcagacga aacaccgtca 26521 ccctcggtcg cattcccctc gccggcgccc cagaaatcgg caaccggttc cagcatggct 26581 acaacctccg ctcctcaggc gccgccggca ctgcccgttc gccgacccaa ccgtagatgg 26641 gacaccactg gaaccagggc cggtaagtcc aagcagccgc cgccgttagc ccaagagcaa 26701 caacagcgcc aaggctaccg ctcatggcgc gggcacaaga acgccatagt tgcttgcttg 26761 caagactgtg ggggcaacat ctccttcgcc cgccgctttc ttctctacca tcacggcgtg 26821 gccttccccc gtaacatcct gcattactac cgtcatctct acagcccata ctgcaccggc 26881 ggcagcggca gcggcagcaa cagcagcggc cacacagaag caaaggcgac cggatagcaa 26941 gactctgaca aagcccaaga aatccacagc ggcggcagca gcaggaggag gagcgctgcg 27001 tctggcgccc aacgaacccg tatcgacccg cgagcttaga aacaggattt ttcccactct 27061 gtatgctata tttcaacaga gcaggggcca agaacaagag ctgaaaataa aaaacaggtc 27121 tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc gaagatcagc ttcggcgcac 27181 gctggaagac gcggaggctc tcttcagtaa atactgcgcg ctgactctta aggactagtt 27241 tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat ctccagcggc cacacccggc 27301 gccagcacct gtcgtcagcg ccattatgag caaggaaatt cccacgccct acatgtggag 27361 ttaccagcca caaatgggac ttgcggctgg agctgcccaa gactactcaa cccgaataaa 27421 ctacatgagc gcgggacccc acatgatatc ccgggtcaac ggaatccgcg cccaccgaaa 27481 ccgaattctc ttggaacagg cggctattac caccacacct cgtaataacc ttaatccccg 27541 tagttggccc gctgccctgg tgtaccagga aagtcccgct cccaccactg tggtacttcc 27601 cagagacgcc caggccgaag ttcagatgac taactcaggg gcgcagcttg cgggcggctt 27661 tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac ctgacaatca gagggcgagg 27721 tattcagctc aacgacgagt cggtgagctc ctcgcttggt ctccgtccgg acgggacatt 27781 tcagatcggc ggcgccggcc gtccttcatt cacgcctcgt caggcaatcc taactctgca 27841 gacctcgtcc tctgagccgc gctctggagg cattggaact ctgcaattta ttgaggagtt 27901 tgtgccatcg gtctacttta accccttctc gggacctccc ggccactatc cggatcaatt 27961 tattcctaac tttgacgcgg taaaggactc ggcggacggc tacgactgaa tgttaagtgg 28021 agaggcagag caactgcgcc tgaaacacct ggtccactgt cgccgccaca agtgctttgc 28081 ccgcgactcc ggtgagtttt gctactttga attgcccgag gatcatatcg agggcccggc 28141 gcacggcgtc cggcttaccg cccagggaga gcttgcccgt agcctgattc gggagtttac 28201 ccagcgcccc ctgctagttg agcgggacag gggaccctgt gttctcactg tgatttgcaa 28261 ctgtcctaac cttggattac atcaagatcc tctagttata actagagtac ccggggatct 28321 tattcccttt aactaataaa aaaaaataat aaagcatcac ttacttaaaa tcagttagca 28381 aatttctgtc cagtttattc agcagcacct ccttgccctc ctcccagctc tggtattgca 28441 gcttcctcct ggctgcaaac tttctccaca atctaaatgg aatgtcagtt tcctcctgtt 28501 cctgtccatc cgcacccact atcttcatgt tgttgcagat gaagcgcgca agaccgtctg 28561 aagatacctt caaccccgtg tatccatatg acacggaaac cggtcctcca actgtgcctt 28621 ttcttactcc tccctttgta tcccccaatg ggtttcaaga gagtccccct ggggtactct 28681 ctttgcgcct atccgaacct ctagttacct ccaatggcat gcttgcgctc aaaatgggca 28741 acggcctctc tctggacgag gccggcaacc ttacctccca aaatgtaacc actgtgagcc 28801 cacctctcaa aaaaaccaag tcaaacataa acctggaaat atctgcaccc ctcacagtta 28861 cctcagaagc cctaactgtg gctgccgccg cacctctaat ggtcgcgggc aacacactca 28921 ccatgcaatc acaggccccg ctaaccgtgc acgactccaa acttagcatt gccacccaag 28981 gacccctcac agtgtcagaa ggaaagctag ccctgcaaac atcaggcccc ctcaccacca 29041 ccgatagcag tacccttact atcactgcct caccccctct aactactgcc actggtagct 29101 tgggcattga cttgaaagag cccatttata cacaaaatgg aaaactagga ctaaagtacg 29161 gggctccttt gcatgtaaca gacgacctaa acactttgac cgtagcaact ggtccaggtg 29221 tgactattaa taatacttcc ttgcaaacta aagttactgg agccttgggt tttgattcac 29281 aaggcaatat gcaacttaat gtagcaggag gactaaggat tgattctcaa aacagacgcc 29341 ttatacttga tgttagttat ccgtttgatg ctcaaaacca actaaatcta agactaggac 29401 agggccctct ttttataaac tcagcccaca acttggatat taactacaac aaaggccttt 29461 acttgtttac agcttcaaaç aattccaaaa agcttgaggt taacctaagc actgccaagg 29521 ggttgatgtt tgacgctaca gccatagcca ttaatgcagg agatgggctt gaatttggtt 29581 cacctaatgc accaaacaca aatcccctca aaacaaaaat tggccatggc ctagaatttg 29641 attcaaacaa ggctatggtt cctaaactag gaactggcct tagttttgac agcacaggtg 29701 ccattacagt aggaaacaaa aataatgata agctaacttt gtggaccaca ccagctccat 29761 ctcctaactg tagactaaat gcagagaaag atgctaaact cactttggtc ttaacaaaat 29821 gtggcagtca aatacttgct acagtttcag ttttggctgt taaaggcagt ttggctccaa 29881 tatctggaac agttcaaagt gctcatctta ttataagatt tgacgaaaat ggagtgctac 29941 taaacaattc cttcctggac ccagaatatt ggaactttag aaatggagat cttactgaag 30001 gcacagccta tacaaacgct gttggattta tgcctaacct atcagcttat ccaaaatctc 30061 acggtaaaac.tgccaaaagt aacattgtca gtcaagttta cttaaacgga gacaaaacta 30121 aacctgtaac actaaccatt acactaaacg gtacacagga aacaggagac acaactccaa 30181 gtgcatactc tatgtcattt tcatgggact ggtctggcca caactacatt aatgaaatat 30241 ttgccacatc ctcttacact ttttcataca ttgcccaaga ataaagaatc gtttgtgtta 30301 tgtttcaacg tgtttatttt tcaattgcag aaaatttcaa gtcatttttc attcagtagt 30361 atagccccac caccacatag cttatacaga tcaccgtacc ttaatcaaac tcacagaacc 30421 ctagtattca acctgccacc tccctcccaa cacacagagt acacagtcct ttctccccgg 30481 ctggccttaa aaagcatcat atcatgggta acagacatat tcttaggtgt tatattccac 30541 acggtttcct gtcgagccaa acgctcatca gtgatattaa taaactcccc gggcagctca 30601 cttaagttca tgtcgctgtc cagctgctga gccacaggct gctgtccaac ttgcggttgc 30661 ttaacgggcg gcgaaggaga agtccacgcc tacatggggg tagagtcata atcgtgcatc 30721 aggatagggc ggtggtgctg cagcagcgcg cgaataaact gctgccgccg ccgctccgtc 30781 ctgcaggaat acaacatggc agtggtctcc tcagcgatga ttcgcaccgc ccgcagcata 30841 aggcgccttg tcctccgggc acagcagcgc accctgatct cacttaaatc agcacagtaa 30901 ctgcagcaca gcaccacaat attgttcaaa atcccacagt gcaaggcgct gtatccaaag 30961 ctcatggcgg ggaccacaga acccacgtgg ccatcatacc acaagcgcag gtagattaag 31021 tggcgacccc tcataaacac gctggacata aacattacct cttttggcat gttgtaattc 31081 accacctccc ggtaccatat aaacctctga ttaaacatgg cgccatccac caccatccta 31141 aaccagctgg ccaaaacctg cccgccggct atacactgca gggaaccggg actggaacaa 31201 tgacagtgga gagcccagga ctcgtaacca tggatcatca tgctcgtcat gatatcaatg 31261 ttggcacaac acaggcacac gtgcatacac ttcctcagga ttacaagctc ctcccgcgtt 31321 agaaccatat cccagggaac aacccattcc tgaatcagcg taaatcccac actgcâggga 31381 agacctcgca cgtaactcac gttgtgcatt gtcaaagtgt tacattcggg cagcagcgga 31441 tgatcctcca gtatggtagc gcgggtttct gtctcaaaag gaggtagacg atccctactg 31501 tacggagtgc gccgagacaa ccgagatcgt gttggtcgta gtgtcatgcc aaatggaacg 31561 ccggacgtag tcatatttcc tgaagcaaaa ccaggtgcgg gcgtgacaaa cagatctgcg 31621 tctccggtct cgccgcttag atcgctctgt gtagtagttg tagtatatcc actctctcaa 31681 agcatccagg cgccccctgg cttcgggttc tatgtaaact ccttcatgcg ccgctgccct 31741 gataacatcc accaccgcag aataagccac acccagccaa cctacacatt cgttctgcga 31801 gtcacacacg ggaggagcgg gaagagctgg aagaaccatg tttttttttt tattccaaaa 31861 gattatccaa aacctcaaaa tgaagatcta ttaagtgaac gcgctcccct ccggtggcgt 31921 ggtcaaactc tacagccaaa gaacagataa tggcatttgt aagatgttgc acaatggctt 31981 ccaaaaggca aacggccctc acgtccaagt ggacgtaaag gctaaaccct tcagggtgaa 32041 tctcctctat aaacattcca gcaccttcaa ccatgcccaa ataattctca tctcgccacc 32101 ttctcaatat atctctaagc aaatcccgaa tattaagtcc ggccattgta aaaatctgct 32161 ccagagcgcc ctccaccttc agcctcaagc agcgaatcat gattgcaaaa attcaggttc 32221 ctcacagacc tgtataagat tcaaaagcgg aacattaaca aaaataccgc gatcccgtag 32281 gtcccttcgc agggccagct gaacataatc gtgcaggtct gcacggacca gcgcggccac 32341 ttccccgcca ggaaccttga caaaagaacc cacactgatt atgacacgca tactcggagc 32401 tatgctaacc agcgtagccc cgatgtaagc tttgttgcat gggcggcgat ataaaatgca 32461 aggtgctgct caaaaaatca ggcaaagcct cgcgcaaaaa agaaagcaca tcgtagtcat 32521 gctcatgcag ataaaggcag gtaagctccg gaaccaccac agaaaaagac accatttttc 32581 tctcaaacat gtctgcgggt ttctgcataa acacaaaata aaataacaaa aaaacattta 32641 aacattagaa gcctgtctta caacaggaaa aacaaccctt ataagcataa gacggactac 32701 ggccatgccg gcgtgaccgt aaaaaaactg gtcaccgtga ttaaaaagca ccaccgacag 32761 ctcctcggtc atgtccggag tcataatgta agactcggta aacacatcag gttgattcat 32821 cggtcagtgc taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag 32881 acaacattac agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa 32941 cacctgaaaa accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca 33001 gcgcttcaca gcggcagcct aacagtcagc cttaccagta aaaaagaaaa cctattaaaa 33061 aaacaccact cgacacggca ccagctcaat cagtcacagt gtaaaaaagg gccaagtgca 33121 gagcgagtat atataggact aaaaaatgac gtaacggtta aagtccacaa aaaacaccca 33181 gaaaaccgca cgcgaaccta cgcccagaaa cgaaagccaa aaaacccaca acttcctcaa 33241 atcgtcactt ccgttttccc acgttacgta acttcccatt ttaagaaaac tacaattccc 33301 aacacataca agttactccg ccctaaaacc tacgtcaôcc gccccgttcc cacgccccgc 33361 gccacgtcac aaactccacc ccctcattat catattggct tcaatccaaa ataaggtata 33421 ttattgatga tnnnnnttaa t
Claims (12)
- REIVINDICAÇÕES1. Vetor de expressão adenovírico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de recetor de tipo toll 3 (TLR-3), em que o agonista de TLR-3 é ARNcd heterólogo e em que o ácido nucleico que codifica para o agonista de TLR-3 compreende uma sequência selecionada do grupo que consiste em: SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 e 12; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico.
- 2. Vetor de expressão adenovírico quimérico da reivindicação 1, em que o primeiro promotor e o segundo promotor são o mesmo, opcionalmente em que o primeiro promotor e o segundo promotor são, cada qual, um promotor de CMV.
- 3. Composição imunogénica compreendendo o vetor de expressão de qualquer uma das reivindicações anteriores e um transportador farmaceuticamente aceitável.
- 4. Vetor de expressão adenovírico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de recetor de tipo toll 3 (TLR-3) , em que o agonista de TLR-3 é ARNcd heterólogo; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico para utilização num método de tratamento que desencadeia uma resposta imunitária, o referido método compreendendo administrar uma quantidade imunogenicamente eficaz do vetor a um indivíduo mamífero, tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e via mucosa, tal como vaginal.
- 5. Vetor para a utilização da reivindicação 4, em que o polipéptido heterólogo é expresso numa célula selecionada do grupo que consiste em uma célula dendrítica, uma célula de micropregas (célula M) e uma célula epitelial intestinal.
- 6. Vetor da reivindicação 1, em que o ARNcd heterólogo é ARN em gancho de cabelo curto (ARNgc).
- 7. Composição imunogénica, a referida composição compreendendo: (a) um vetor de expressão adenovírico quimérico compreendendo um promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico; (b) um agonista de TLR-3, em que o agonista de TLR-3 é ARNcd heterólogo; e (c) um transportador farmaceuticamente aceitável; para utilização num método de tratamento que desencadeia uma resposta imunitária, o referido método compreendendo administrar uma quantidade imunogenicamente eficaz da composição a um indivíduo mamífero, tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e via mucosa, tal como vaginal.
- 8. Composição para a utilização da reivindicação 7, em que o promotor é um promotor de CMV.
- 9. Composição para a utilização da reivindicação 7, em que o agonista de TLR-3 é um ácido nucleico compreendendo uma sequência selecionada do grupo que consiste em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 e 12.
- 10. Composição para a utilização da reivindicação 7, em que o polipéptido heterólogo é expresso numa célula selecionada do grupo que consiste em uma célula dendrítica, uma célula de micropregas (célula M) e uma célula epitelial intestinal.
- 11. Composição para a utilização da reivindicação 7, em que o ARNcd heterólogo é ARN em gancho de cabelo curto (ARNgc).
- 12. Vetor da reivindicação 1, vetor para a utilização da reivindicação 4 ou composição para a utilização da reivindicação 7, em que o polipéptido heterólogo é: (a) um polipéptido env de HIV, tal como um polipéptido selecionado do grupo que consiste em gp41, gpl20 e gpl60; (b) um polipéptido HA de influenza; (c) um antigénio de vírus de herpes simplex (HSV); ou (d) um antigénio de papilomavírus humano (HPV).
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US77802606P | 2006-02-28 | 2006-02-28 | |
| US80164506P | 2006-05-19 | 2006-05-19 | |
| US80299206P | 2006-05-22 | 2006-05-22 | |
| US82149206P | 2006-08-04 | 2006-08-04 | |
| US84665806P | 2006-09-22 | 2006-09-22 | |
| US84819506P | 2006-09-28 | 2006-09-28 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PT1996238T true PT1996238T (pt) | 2016-07-11 |
Family
ID=38459683
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT77521094T PT1996238T (pt) | 2006-02-28 | 2007-02-28 | Vetores adenovíricos quiméricos e arncd como agonista de tlr3 |
Country Status (23)
| Country | Link |
|---|---|
| US (3) | US7879602B2 (pt) |
| EP (1) | EP1996238B1 (pt) |
| JP (1) | JP5016614B2 (pt) |
| KR (2) | KR101105511B1 (pt) |
| CN (2) | CN103122360A (pt) |
| AP (1) | AP2844A (pt) |
| AU (1) | AU2007220988B2 (pt) |
| BR (1) | BRPI0708344B8 (pt) |
| CA (1) | CA2638757C (pt) |
| DK (1) | DK1996238T3 (pt) |
| EA (1) | EA014757B1 (pt) |
| ES (1) | ES2573456T3 (pt) |
| HR (1) | HRP20160795T1 (pt) |
| HU (1) | HUE030281T2 (pt) |
| IL (2) | IL193684A (pt) |
| LT (1) | LT1996238T (pt) |
| MY (1) | MY154956A (pt) |
| NZ (1) | NZ571010A (pt) |
| PL (1) | PL1996238T3 (pt) |
| PT (1) | PT1996238T (pt) |
| RS (1) | RS54843B1 (pt) |
| SI (1) | SI1996238T1 (pt) |
| WO (1) | WO2007100908A2 (pt) |
Families Citing this family (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DK1996238T3 (da) * | 2006-02-28 | 2016-08-01 | Vaxart Inc | Kimæriske adenovirale vektorer og DsRNA som TLR3-agonist |
| WO2009073133A1 (en) * | 2007-11-29 | 2009-06-11 | Vaxinnate Corporation | Compositions of toll-like receptor agonists and papillomavirus antigens and uses thereof |
| US8501926B2 (en) * | 2008-09-24 | 2013-08-06 | The Johns Hopkins University | Malaria vaccine |
| CN102549152B (zh) * | 2009-07-31 | 2015-11-25 | 帕克斯瓦克斯股份有限公司 | 基于腺病毒的载体 |
| ES2538007T3 (es) * | 2009-09-16 | 2015-06-16 | Vaxart, Inc. | Estrategia de inmunización para prevenir una infección por H1N1 |
| US9198959B2 (en) * | 2011-02-22 | 2015-12-01 | Regents Of The University Of Minnesota | Adenovirus vaccine vector and methods of use |
| US10183069B2 (en) | 2011-03-21 | 2019-01-22 | Altimmune Inc. | Rapid and prolonged immunologic-therapeutic |
| AU2013357367B2 (en) | 2012-12-11 | 2019-10-24 | Osivax Sas | Modified coiled coil type proteins having improved properties |
| AU2014315124A1 (en) * | 2013-09-06 | 2016-04-07 | Altimmune Inc. | Methods and compositions for viral vectored vaccines |
| SG11201606814RA (en) | 2014-02-20 | 2016-09-29 | Vaxart Inc | Formulations for small intestinal delivery |
| HUE040440T2 (hu) | 2014-11-04 | 2019-03-28 | Janssen Vaccines & Prevention Bv | Terápiás HPV16-oltóanyagok |
| WO2016166088A1 (en) | 2015-04-14 | 2016-10-20 | Janssen Vaccines & Prevention B.V. | Recombinant adenovirus expressing two transgenes with a bidirectional promoter |
| WO2016200951A1 (en) | 2015-06-12 | 2016-12-15 | Vaxart, Inc. | Formulations for small intestinal delivery of rsv and norovirus antigens |
| KR20180042295A (ko) | 2015-08-20 | 2018-04-25 | 얀센 백신스 앤드 프리벤션 비.브이. | 치료용 hpv18 백신 |
| GB201603577D0 (en) | 2016-03-01 | 2016-04-13 | Oxford Genetics Ltd | Promoter |
| EP3452087A1 (en) | 2016-05-02 | 2019-03-13 | Janssen Vaccines & Prevention B.V. | Therapeutic hpv vaccine combinations |
| CN109154000B (zh) | 2016-05-12 | 2022-07-05 | 扬森疫苗与预防公司 | 有效和平衡的双向启动子 |
| KR102307065B1 (ko) | 2016-06-20 | 2021-09-30 | 얀센 백신스 앤드 프리벤션 비.브이. | 강력하고 균형 잡힌 양방향성 프로모터 |
| US10610104B2 (en) | 2016-12-07 | 2020-04-07 | Progenity, Inc. | Gastrointestinal tract detection methods, devices and systems |
| US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
| CA3046019A1 (en) | 2016-12-14 | 2018-06-21 | Progenity Inc. | Treatment of a disease of the gastrointestinal tract with a tlr modulator |
| BR112019014004A2 (pt) * | 2017-01-06 | 2020-02-11 | Stabilitech Biopharma Ltd | Método de fornecimento de transgene, comprimido ou cápsula, método de preparação de partículas virais e produto |
| CN110268061B (zh) | 2017-02-09 | 2024-07-16 | 扬森疫苗与预防公司 | 用于表达异源基因的有效的短启动子 |
| US20250242012A1 (en) * | 2020-02-25 | 2025-07-31 | Symvivo Corporation | Gene delivery system |
| US20230107927A1 (en) | 2020-02-28 | 2023-04-06 | First Wave Bio, Inc. | Methods of treating iatrogenic autoimmune colitis |
| WO2021248017A2 (en) * | 2020-06-05 | 2021-12-09 | Vaxart, Inc. | Chimeric adenoviral vectors |
| AU2021300632A1 (en) | 2020-07-02 | 2023-02-02 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Method of achieving HIV viral remission using long-acting antiretroviral agents |
| AU2022212276A1 (en) * | 2021-02-01 | 2023-08-17 | Vaxart, Inc. | Chimeric adenoviral vectors |
| WO2025046444A1 (en) | 2023-08-25 | 2025-03-06 | Frem Neemat G | Remote-controlled alteration/induction of cellular apoptosis and methods of use |
| CN119925586A (zh) * | 2025-01-24 | 2025-05-06 | 中国疾病预防控制中心病毒病预防控制所 | 一种内置核酸佐剂的新冠病毒b.1.1.529变异株口服疫苗及其制备方法 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6511845B1 (en) | 1992-08-07 | 2003-01-28 | Alan R. Davis | Methods for producing an immune response against HIV-1 |
| US5676950A (en) * | 1994-10-28 | 1997-10-14 | University Of Florida | Enterically administered recombinant poxvirus vaccines |
| US20020182223A1 (en) | 2000-06-02 | 2002-12-05 | Lacount Douglas J. | Method of rapidly generating double-stranded RNA and methods of use thereof |
| US20020155127A1 (en) | 2000-06-02 | 2002-10-24 | Danher Wang | Genetic vaccine against human immunodeficiency virus |
| EP1327688A1 (en) * | 2002-01-14 | 2003-07-16 | Vereniging Voor Christelijk Wetenschappelijk Onderwijs | Adenoviruses with enhanced lytic potency |
| EP1540004A4 (en) * | 2002-07-31 | 2007-10-03 | Nucleonics Inc | DOUBLE-STRING RNA STRUCTURES AND CONSTRUCTS AND METHOD FOR THE PRODUCTION AND USE THEREOF |
| RU2390351C2 (ru) | 2003-08-11 | 2010-05-27 | Дзе Ресерч Фаундейшн Фо Макробайал Дизизес Оф Осака Юниверсити | Вакцина против вируса гриппа для введения через слизистую и способ предотвращения гриппа |
| GB0321615D0 (en) * | 2003-09-15 | 2003-10-15 | Glaxo Group Ltd | Improvements in vaccination |
| EP1586654A1 (en) * | 2004-04-15 | 2005-10-19 | Vereniging voor christelijk hoger onderwijs, wetenschappelijk onderzoek en patiëntenzorg | Replication competent viruses capable of silencing virus inhibitory factor expression |
| KR100958505B1 (ko) * | 2004-07-18 | 2010-05-17 | 씨에스엘 리미티드 | 면역자극 복합체 및 향상된 인터페론-감마 반응을 유도하기위한 올리고뉴클레오티드 제제 |
| DK1996238T3 (da) * | 2006-02-28 | 2016-08-01 | Vaxart Inc | Kimæriske adenovirale vektorer og DsRNA som TLR3-agonist |
-
2007
- 2007-02-28 DK DK07752109.4T patent/DK1996238T3/da active
- 2007-02-28 ES ES07752109.4T patent/ES2573456T3/es active Active
- 2007-02-28 US US11/712,794 patent/US7879602B2/en active Active
- 2007-02-28 HU HUE07752109A patent/HUE030281T2/en unknown
- 2007-02-28 LT LTEP07752109.4T patent/LT1996238T/lt unknown
- 2007-02-28 CA CA2638757A patent/CA2638757C/en active Active
- 2007-02-28 CN CN2013100288300A patent/CN103122360A/zh active Pending
- 2007-02-28 RS RS20160431A patent/RS54843B1/sr unknown
- 2007-02-28 NZ NZ571010A patent/NZ571010A/xx unknown
- 2007-02-28 WO PCT/US2007/005386 patent/WO2007100908A2/en not_active Ceased
- 2007-02-28 JP JP2008557403A patent/JP5016614B2/ja active Active
- 2007-02-28 BR BRPI0708344A patent/BRPI0708344B8/pt active Search and Examination
- 2007-02-28 EA EA200801907A patent/EA014757B1/ru not_active IP Right Cessation
- 2007-02-28 AU AU2007220988A patent/AU2007220988B2/en active Active
- 2007-02-28 HR HRP20160795TT patent/HRP20160795T1/hr unknown
- 2007-02-28 MY MYPI20083328A patent/MY154956A/en unknown
- 2007-02-28 PL PL07752109.4T patent/PL1996238T3/pl unknown
- 2007-02-28 EP EP07752109.4A patent/EP1996238B1/en active Active
- 2007-02-28 SI SI200731784A patent/SI1996238T1/sl unknown
- 2007-02-28 KR KR1020087023613A patent/KR101105511B1/ko active Active
- 2007-02-28 CN CN2007800153452A patent/CN101432291B/zh active Active
- 2007-02-28 PT PT77521094T patent/PT1996238T/pt unknown
- 2007-02-28 AP AP2008004612A patent/AP2844A/xx active
- 2007-02-28 KR KR1020117027773A patent/KR101273836B1/ko active Active
-
2008
- 2008-08-25 IL IL193684A patent/IL193684A/en active IP Right Grant
-
2010
- 2010-11-12 US US12/945,358 patent/US8222224B2/en active Active
-
2012
- 2012-06-25 US US13/532,701 patent/US8999946B2/en active Active
-
2013
- 2013-11-20 IL IL229523A patent/IL229523A/en active IP Right Grant
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DK1996238T3 (da) | Kimæriske adenovirale vektorer og DsRNA som TLR3-agonist | |
| US12305173B2 (en) | Immunostimulatory compositions | |
| KR20230120646A (ko) | 멀티시스트론성 rna 백신 및 이의 용도 | |
| US9095546B2 (en) | Human respiratory syncytial virus (RSV) vaccine | |
| KR20220038755A (ko) | 한타바이러스 항원성 조성물 | |
| KR101153845B1 (ko) | Kras G12V RNA를 특이적으로 인지할 수 있는 트랜스-스플라이싱 그룹 I 리보자임 | |
| RU2799523C1 (ru) | Иммуностимулирующие композиции | |
| RU2857683C2 (ru) | Мультицистронная самореплицирующаяся РНК для эффективной экспрессии более чем одного антигена, содержащая ее фармацевтическая композиция и способы применения | |
| WO2025240698A1 (en) | Improved adenoviral vectors for antigen delivery | |
| JP2023520611A (ja) | 複製欠損性鳥類アデノウイルスベクター、その設計および使用 | |
| WO2005094415A2 (en) | Recombinant vectors and methods for inducing an immune response | |
| KR20120064656A (ko) | Kras G12V RNA를 특이적으로 인지할 수 있는 트랜스-스플라이싱 그룹 I 리보자임 |