JP2023123766A - アルファウイルス新生抗原ベクター - Google Patents
アルファウイルス新生抗原ベクター Download PDFInfo
- Publication number
- JP2023123766A JP2023123766A JP2023108263A JP2023108263A JP2023123766A JP 2023123766 A JP2023123766 A JP 2023123766A JP 2023108263 A JP2023108263 A JP 2023108263A JP 2023108263 A JP2023108263 A JP 2023108263A JP 2023123766 A JP2023123766 A JP 2023123766A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- composition
- nucleic acid
- neoantigen
- acid sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4748—Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/0005—Vertebrate antigens
- A61K39/0011—Cancer antigens
- A61K39/001184—Cancer testis antigens, e.g. SSX, BAGE, GAGE or SAGE
- A61K39/001188—NY-ESO
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/0005—Vertebrate antigens
- A61K39/0011—Cancer antigens
- A61K39/00119—Melanoma antigens
- A61K39/001191—Melan-A/MART
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K40/00—Cellular immunotherapy
- A61K40/40—Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
- A61K40/41—Vertebrate antigens
- A61K40/42—Cancer antigens
- A61K40/4201—Neoantigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K40/00—Cellular immunotherapy
- A61K40/40—Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
- A61K40/41—Vertebrate antigens
- A61K40/42—Cancer antigens
- A61K40/4267—Cancer testis antigens, e.g. SSX, BAGE, GAGE or SAGE
- A61K40/4269—NY-ESO
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K40/00—Cellular immunotherapy
- A61K40/40—Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
- A61K40/41—Vertebrate antigens
- A61K40/42—Cancer antigens
- A61K40/4271—Melanoma antigens
- A61K40/4272—Melan-A/MART
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/18—Antivirals for RNA viruses for HIV
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/70539—MHC-molecules, e.g. HLA-molecules
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/58—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation
- A61K2039/585—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation wherein the target is cancer
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6037—Bacterial toxins, e.g. diphteria toxoid [DT], tetanus toxoid [TT]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/605—MHC molecules or ligands thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K2121/00—Preparations for use in therapy
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2730/00—Reverse transcribing DNA viruses
- C12N2730/00011—Details
- C12N2730/10011—Hepadnaviridae
- C12N2730/10111—Orthohepadnavirus, e.g. hepatitis B virus
- C12N2730/10134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/14011—Deltaretrovirus, e.g. bovine leukeamia virus
- C12N2740/14034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16111—Human Immunodeficiency Virus, HIV concerning HIV env
- C12N2740/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16211—Human Immunodeficiency Virus, HIV concerning HIV gagpol
- C12N2740/16234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16311—Human Immunodeficiency Virus, HIV concerning HIV regulatory proteins
- C12N2740/16334—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/14011—Filoviridae
- C12N2760/14111—Ebolavirus, e.g. Zaire ebolavirus
- C12N2760/14134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/24011—Flaviviridae
- C12N2770/24211—Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
- C12N2770/24234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/36011—Togaviridae
- C12N2770/36111—Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
- C12N2770/36141—Use of virus, viral particle or viral elements as a vector
- C12N2770/36143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Genetics & Genomics (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Immunology (AREA)
- Pharmacology & Pharmacy (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Oncology (AREA)
- Microbiology (AREA)
- Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Biotechnology (AREA)
- Communicable Diseases (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Toxicology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Pulmonology (AREA)
- AIDS & HIV (AREA)
- Tropical Medicine & Parasitology (AREA)
Abstract
【解決手段】新生抗原発現系を含む、新生抗原発現系を送達するための組成物であって、前記新生抗原発現系が、1つ以上のベクターを含み、前記1つ以上のベクターが、以下を含む、前記組成物:(a)RNAアルファウイルス骨格であって、(i)少なくとも1つのプロモーターヌクレオチド配列と、(ii)少なくとも1つのポリアデニル化(ポリ(A))配列とを含む前記RNAアルファウイルス骨格;ならびに(b)新生抗原カセットであって、(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列を含む、前記新生抗原カセット。
【選択図】図2A
Description
本出願は、EFS-Web経由で提出され、その全容を参照によって本明細書に援用する配列表を含む。20XX年XX月に作成された前記ASCIIコピーは、XXXXXUS_sequencelisting.txtと名前が付けられており、そのサイズはX,XXX,XXXバイトである。
(a)RNAアルファウイルス骨格であって、
(i)少なくとも1つのプロモーターヌクレオチド配列と、
(ii)少なくとも1つのポリアデニル化(ポリ(A))配列と
を含む前記RNAアルファウイルス骨格;ならびに
(b)新生抗原カセットであって、
(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列であって、
(I)前記腫瘍に由来する、少なくとも1つの腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列であって、
(A)コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を有する、MHCクラスIエピトープコード核酸配列と、
(B)任意で5’リンカー配列と、
(C)任意で3’リンカー配列と
を含む、前記MHCクラスI新生抗原コード核酸配列
を含む、前記少なくとも1つの新生抗原コード核酸配列と、
(ii)任意で、前記新生抗原コード核酸配列に機能的に連結された第2のプロモーターヌクレオチド配列と、
(iii)任意で、少なくとも1つのMHCクラスII抗原コード核酸配列と、
(iv)任意で、少なくとも1つのGPGPGリンカー配列(SEQ ID NO:56)と、
(v)任意で、前記アルファウイルスに対して天然のポリ(A)配列または外来性のポリ(A)配列である少なくとも1つの第2のポリ(A)配列と
を含む、前記新生抗原カセット。
(a)RNAアルファウイルス骨格であって、前記RNAアルファウイルス骨格がSEQ ID NO:6に記載の核酸配列を含み、前記RNAアルファウイルス骨格の配列が26Sプロモーターヌクレオチド配列及びポリ(A)配列を含み、前記26Sプロモーター配列が前記RNAアルファウイルス骨格に対して内在性のものであり、前記ポリ(A)配列が前記RNAアルファウイルス骨格に対して内在性のものである、前記RNAアルファウイルス骨格;ならびに
(b)前記26Sプロモーターヌクレオチド配列と前記ポリ(A)配列との間に組み込まれた新生抗原カセットであって、
(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列であって、
(I)互いに直鎖状に連結された、少なくとも10個の腫瘍特異的及び対象特異的MHCクラスI新生抗原コード核酸配列であって、それぞれが、
(A)コードされたペプチド配列を野生型核酸配列によってコードされる対応する核酸配列とは異なるものとする少なくとも1つの変化を有し、アミノ酸7~15個の長さのMHCクラスIエピトープをコードする、MHCクラスIエピトープコード核酸配列と、
(B)前記MHC Iエピトープの天然のN末端アミノ酸配列をコードし、少なくともアミノ酸3個の長さであるペプチドをコードする、5’リンカー配列と、
(C)前記MHC Iエピトープの天然のN末端酸配列をコードし、少なくともアミノ酸3個の長さであるペプチドをコードする、3’リンカー配列と、
を含む、前記MHCクラスI新生抗原コード核酸配列
を含み、
ここで、前記新生抗原カセットが前記26Sプロモーターヌクレオチド配列と機能的に連結され、前記MHCクラスI新生抗原コード核酸配列のそれぞれが、アミノ酸13~25個の長さのポリペプチドをコードし、各MHCクラスI新生抗原コード核酸配列の各3’末端が、前記新生抗原カセット内の最後のMHCクラスI新生抗原コード核酸配列を除いて、それに続くMHCクラスI新生抗原コード核酸配列の5’末端に連結されている、
前記少なくとも1つの新生抗原コード核酸配列と、
(ii)少なくとも2個のMHCクラスII抗原コード核酸配列であって、
(I)PADRE MHCクラスII配列(SEQ ID NO:48)と、
(II)破傷風トキソイドMHCクラスII配列(SEQ ID NO:46)と、
(III)前記PADRE MHCクラスII配列と前記破傷風トキソイドMHCクラスII配列とを連結するGPGPGアミノ酸リンカー配列(SEQ ID NO:56)をコードする、第1の核酸配列と、
(IV)前記少なくとも2個のMHCクラスII抗原コード核酸配列の5’末端と前記少なくとも20個の腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列とを連結するGPGPGアミノ酸リンカー配列(SEQ ID NO:56)をコードする、第2の核酸配列と、
(V)任意で、前記少なくとも2個のMHCクラスII抗原コード核酸配列の3’末端のGPGPGアミノ酸リンカー配列(SEQ ID NO:56)をコードする、第3の核酸配列と
を含む、前記少なくとも2個のMHCクラスII抗原コード核酸配列と
を含む、前記新生抗原カセット。
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
を含む式で示され、式中、Pは、前記第2のプロモーターヌクレオチド配列を含み、ここで、a=0または1であり、Nは、前記MHCクラスIエピトープコード核酸配列のうちの1つを含み、ここで、c=1であり、L5は、前記5’リンカー配列を含み、ここで、b=0または1であり、L3は、前記3’リンカー配列を含み、ここで、d=0または1であり、G5は、GPGPGアミノ酸リンカー(SEQ ID NO:56)をコードする前記少なくとも1つの核酸配列のうちの1つを含み、ここで、e=0または1であり、G3は、GPGPGアミノ酸リンカー(SEQ ID NO:56)をコードする前記少なくとも1つの核酸配列のうちの1つを含み、ここで、g=0または1であり、Uは、前記少なくとも1つのMHCクラスII抗原コード核酸配列のうちの1つを含み、ここで、f=1であり、X=1~400であり、ここで、各Xについて、対応するNcは、エピトープコード核酸配列であり、Y=0、1、または2であり、ここで、各Yについて、対応するUfは、抗原コード核酸配列である。いくつかの態様では、各Xについて、対応するNcは、異なるMHCクラスIエピトープコード核酸配列である。いくつかの態様では、各Yについて、対応するUfは、異なるMHCクラスII抗原コード核酸配列である。
式中、L1及びL2は、それぞれ独立して、-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x-、-S-S-、-C(=O)S-、-SC(=O)-、-RaC(=O)-、-C(=O)Ra-、- RaC(=O)Ra-、-OC(=O)Ra-、-RaC(=O)O-、または直接的結合であり、G1は、Ci~C2アルキレン、-(C=O)-、-O(C=O)-、-SC(=O)-、-RaC(=O)-、または直接的結合であり、-C(=O)-、-(C=O)O-、-C(=O)S-、-C(=O)Ra-、または直接的結合であり、Gは、Ci~C6アルキレンであり、Raは、HまたはC1~C12アルキルであり、R1a及びR1bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R1aは、HもしくはC1~C12アルキルであり、R1bはそれが結合する炭素原子と共に、隣り合ったR1b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R2a及びR2bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R2aは、HもしくはC1~C12アルキルであり、R2bはそれが結合する炭素原子と共に、隣り合ったR2b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R3a及びR3bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R3aは、HもしくはC1~C12アルキルであり、R3bはそれが結合する炭素原子と共に、隣り合ったR及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R4a及びR4bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R4aは、HもしくはC1~C12アルキルであり、R4bはそれが結合する炭素原子と共に、隣り合ったR4b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R5及びR6は、それぞれ独立してHまたはメチルであり、R7は、C4~C20アルキルであり、R8及びR9は、それぞれ独立してC1~C12アルキルであるか、またはR8及びR9は、それらが結合する窒素原子と共に、5、6、または7員の複素環を形成し、a、b、c、及びdは、それぞれ独立して1~24の整数であり、xは0、1、または2である。
式中、L1及びL2は、それぞれ独立して-O(C=O)-、-(C=O)O-、または炭素-炭素二重結合であり、R1a及びR1bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R1aは、HもしくはC1~C12アルキルであり、R1bはそれが結合する炭素原子と共に、隣り合ったR1b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R2a及びR2bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R2aは、HもしくはC1~C12アルキルであり、R2bはそれが結合する炭素原子と共に、隣り合ったR2b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R3a及びR3bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R3aは、HもしくはC1~C12アルキルであり、R3bはそれが結合する炭素原子と共に、隣り合ったR3b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R4a及びR4bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R4aは、HもしくはC1~C12アルキルであり、R4bはそれが結合する炭素原子と共に、隣り合ったR4b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、R5及びR6は、それぞれ独立してHまたはメチルであり、R7は、各出現時に、独立してHまたはC1~C12アルキルであり、R8及びR9は、それぞれ独立して、非置換のC1~C12アルキルであるか、またはR8及びR9は、それらが結合する窒素原子と共に、1個の窒素原子を含む5、6、または7員の複素環を形成し、a及びdは、それぞれ独立して0~24の整数であり、b及びcはそれぞれ独立して1~24の整数であり、eは1または2であり、ただし、R1a、R2a、R3a、もしくはR4aのうちの少なくとも1つが、C1~C12アルキルであるか、またはL1もしくはL2の少なくとも一方が、-O(C=O)-もしくは-(C=O)O-であり、R1a及びR1bは、aが6である場合にはイソプロピルでなく、aが8である場合にはn-ブチルでない。
式中、R10及びR11は、それぞれ独立して、10~30個の炭素原子を含む、直鎖または分枝鎖の飽和または不飽和のアルキル鎖であり、前記アルキル鎖は任意で1つ以上のエステル結合によって中断され、zは、30~60の範囲の平均値を有する。いくつかの態様では、R10及びR11は、それぞれ独立して、12~16個の炭素原子を有する直鎖の飽和アルキル鎖である。いくつかの態様では、平均zは、約45である。
ここから開始
[本発明1001]
新生抗原発現系を含む、新生抗原発現系を送達するための組成物であって、
前記新生抗原発現系が、1つ以上のベクターを含み、
前記1つ以上のベクターが、以下を含む、前記組成物:
(a)RNAアルファウイルス骨格であって、
(i)少なくとも1つのプロモーターヌクレオチド配列と、
(ii)少なくとも1つのポリアデニル化(ポリ(A))配列と
を含む前記RNAアルファウイルス骨格;ならびに
(b)新生抗原カセットであって、
(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列であって、
(I)前記腫瘍に由来する、少なくとも1つの腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列であって、
(A)コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を有する、MHCクラスIエピトープコード核酸配列と、
(B)任意で5’リンカー配列と、
(C)任意で3’リンカー配列と
を含む、前記MHCクラスI新生抗原コード核酸配列
を含む、前記少なくとも1つの新生抗原コード核酸配列と、
(ii)任意で、前記新生抗原コード核酸配列に機能的に連結された第2のプロモーターヌクレオチド配列と、
(iii)任意で、少なくとも1つのMHCクラスII抗原コード核酸配列と、
(iv)任意で、GPGPGアミノ酸リンカー配列(SEQ ID NO:56)をコードする少なくとも1つの核酸配列と、
(v)任意で、前記アルファウイルスに対して天然のポリ(A)配列または外来性のポリ(A)配列である少なくとも1つの第2のポリ(A)配列と
を含む、前記新生抗原カセット。
[本発明1002]
新生抗原発現系を含む、新生抗原発現系を送達するための組成物であって、
前記新生抗原発現系が、1つ以上のベクターを含み、
前記1つ以上のベクターが、以下を含む、前記組成物:
(a)RNAアルファウイルス骨格であって、前記RNAアルファウイルス骨格がSEQ ID NO:6に記載の核酸配列を含み、前記RNAアルファウイルス骨格の配列が26Sプロモーターヌクレオチド配列及びポリ(A)配列を含み、前記26Sプロモーター配列が前記RNAアルファウイルス骨格に対して内在性のものであり、前記ポリ(A)配列が前記RNAアルファウイルス骨格に対して内在性のものである、前記RNAアルファウイルス骨格;ならびに
(b)前記26Sプロモーターヌクレオチド配列と前記ポリ(A)配列との間に組み込まれた新生抗原カセットであって、
(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列であって、
(I)互いに直鎖状に連結された、少なくとも10個の腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列であって、それぞれが、
(A)コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を有し、アミノ酸7~15個の長さのMHCクラスIエピトープをコードする、MHCクラスIエピトープコード核酸配列と、
(B)前記MHC Iエピトープの天然のN末端アミノ酸配列をコードし、少なくともアミノ酸3個の長さであるペプチドをコードする、5’リンカー配列と、
(C)前記MHC Iエピトープの天然のN末端アミノ酸配列をコードし、少なくともアミノ酸3個の長さであるペプチドをコードする、3’リンカー配列と
を含む、前記MHCクラスI新生抗原コード核酸配列
を含み、
ここで、前記新生抗原カセットが前記26Sプロモーターヌクレオチド配列と機能的に連結され、前記MHCクラスI新生抗原コード核酸配列のそれぞれが、アミノ酸13~25個の長さのポリペプチドをコードし、各MHCクラスI新生抗原コード核酸配列の各3’末端が、前記新生抗原カセット内の最後のMHCクラスI新生抗原コード核酸配列を除いて、それに続くMHCクラスI新生抗原コード核酸配列の5’末端に連結されている、
前記少なくとも1つの新生抗原コード核酸配列と、
(ii)少なくとも2個のMHCクラスII抗原コード核酸配列であって、
(I)PADRE MHCクラスII配列(SEQ ID NO:48)と、
(II)破傷風トキソイドMHCクラスII配列(SEQ ID NO:46)と、
(III)前記PADRE MHCクラスII配列と前記破傷風トキソイドMHCクラスII配列とを連結するGPGPGアミノ酸リンカー配列をコードする、第1の核酸配列と、
(IV)前記少なくとも2個のMHCクラスII抗原コード核酸配列の5’末端と前記少なくとも20個の腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列とを連結するGPGPGアミノ酸リンカー配列をコードする、第2の核酸配列と、
(V)任意で、前記少なくとも2個のMHCクラスII抗原コード核酸配列の3’末端のGPGPGアミノ酸リンカー配列をコードする、第3の核酸配列と
を含む、前記少なくとも2個のMHCクラスII抗原コード核酸配列と
を含む、前記新生抗原カセット。
[本発明1003]
前記新生抗原カセットの各要素の順序付けられた配列が、5’から3’に向かって、
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
を含む式で示され、
式中、Pは、前記第2のプロモーターヌクレオチド配列を含み、ここで、a=0または1であり、
Nは、前記MHCクラスIエピトープコード核酸配列のうちの1つを含み、ここで、c=1であり、
L5は、前記5’リンカー配列を含み、ここで、b=0または1であり、
L3は、前記3’リンカー配列を含み、ここで、d=0または1であり、
G5は、GPGPGアミノ酸リンカーをコードする前記少なくとも1つの核酸配列のうちの1つを含み、ここで、e=0または1であり、
G3は、GPGPGアミノ酸リンカーをコードする前記少なくとも1つの核酸配列のうちの1つを含み、ここで、g=0または1であり、
Uは、前記少なくとも1つのMHCクラスII抗原コード核酸配列のうちの1つを含み、ここで、f=1であり、
X=1~400であり、ここで、各Xについて、対応するNcは、エピトープコード核酸配列であり、
Y=0、1、または2であり、ここで、各Yについて、対応するUfは、抗原コード核酸配列である、
本発明1001の組成物。
[本発明1004]
各Xについて、対応するNcが、異なるMHCクラスIエピトープコード核酸配列である、本発明1003の組成物。
[本発明1005]
各Yについて、対応するUfが、異なるMHCクラスII抗原コード核酸配列である、本発明1003または1004の組成物。
[本発明1006]
a=0、b=1、d=1、e=1、g=1、h=1、X=20、Y=2であり、
前記少なくとも1つのプロモーターヌクレオチド配列が、前記RNAアルファウイルス骨格によって与えられる単一の26Sプロモーターヌクレオチド配列であり、
前記少なくとも1つのポリアデニル化ポリ(A)配列が、前記RNAアルファウイルス骨格によって与えられる少なくとも100個の連続したAヌクレオチドのポリ(A)配列であり、
各Nが、アミノ酸7~15個の長さのMHCクラスIエピトープをコードし、
L5が、前記MHC Iエピトープの天然のN末端アミノ酸配列をコードする天然の5’リンカー配列であり、前記5’リンカー配列が、少なくともアミノ酸3個の長さであるペプチドをコードし、
L3が、前記MHC Iエピトープの天然の末端核酸配列をコードする天然の3’リンカー配列であり、前記3’リンカー配列が、少なくともアミノ酸3個の長さであるペプチドをコードし、
Uが、PADREクラスII配列及び破傷風トキソイドMHCクラスII配列のそれぞれであり、
前記RNAアルファウイルス骨格が、SEQ ID NO:6に記載の配列であり、
前記MHCクラスI新生抗原コード核酸配列のそれぞれが、アミノ酸13個~25個の長さのポリペプチドをコードする、
本発明1003~1005のいずれかの組成物。
[本発明1007]
ナノ粒子状の送達ビヒクルをさらに含む、先行本発明のいずれかの組成物。
[本発明1008]
前記ナノ粒子状の送達ビヒクルが、脂質ナノ粒子(LNP)である、本発明1007の組成物。
[本発明1009]
前記LNPが、イオン化可能なアミノ脂質を含む、本発明1008の組成物。
[本発明1010]
前記イオン化可能なアミノ脂質が、MC3様(ジリノレイルメチル-4-ジメチルアミノブチレート)分子を含む、本発明1009の組成物。
[本発明1011]
前記ナノ粒子状の送達ビヒクルが新生抗原発現系を封入する、本発明1007~1010のいずれかの組成物。
[本発明1012]
複数のLNPをさらに含み、前記LNPが、
新生抗原発現系と、
カチオン性脂質と、
非カチオン性脂質と、
LNPの凝集を阻害する複合脂質と
を含み、前記複数のLNPのうち、少なくとも約95%のLNPが、
(a)非ラメラ形態を有するか、または、
(b)高電子密度である、
本発明1008の組成物。
[本発明1013]
前記非カチオン性脂質が、
(1)リン脂質、及び
(2)コレステロールまたはコレステロール誘導体
の混合物である、本発明1012の組成物。
[本発明1014]
前記LNPの凝集を阻害する複合脂質が、ポリエチレングリコール(PEG)-脂質複合体である、本発明1012または1013の組成物。
[本発明1015]
前記PEG-脂質複合体が、PEG-ジアシルグリセロール(PEG-DAG)複合体、PEG-ジアルキルオキシプロピル(PEG-DAA)複合体、PEG-リン脂質複合体、PEG-セラミド(PEG-Cer)複合体、及びこれらの混合物からなる群から選択される、本発明1014の組成物。
[本発明1016]
前記PEG-DAA複合体が、PEG-ジデシルオキシプロピル(C10)複合体、PEG-ジラウリルオキシプロピル(C12)複合体、PEG-ジミリスチルオキシプロピル(C14)複合体、PEG-ジパルミチルオキシプロピル(C16)複合体、PEG-ジステアリルオキシプロピル(C18)複合体、及びこれらの混合物からなる群から選択されるメンバーである、本発明1015の組成物。
[本発明1017]
前記LNPの非ラメラ形態が、逆六方晶(HII)または立方晶相構造を含む、本発明1012~1016のいずれかの組成物。
[本発明1018]
前記カチオン性脂質が、前記LNP中に存在する全脂質の約10mol%~約50mol%を構成する、本発明1012~1017のいずれかの組成物。
[本発明1019]
前記カチオン性脂質が、前記LNP中に存在する全脂質の約20mol%~約50mol%を構成する、本発明1012~1017のいずれかの組成物。
[本発明1020]
前記カチオン性脂質が、前記LNP中に存在する全脂質の約20mol%~約40mol%を構成する、本発明1012~1017のいずれかの組成物。
[本発明1021]
前記非カチオン性脂質が、前記LNP中に存在する全脂質の約10mol%~約60mol%を構成する、本発明1012~1020のいずれかの組成物。
[本発明1022]
前記非カチオン性脂質が、前記LNP中に存在する全脂質の約20mol%~約55mol%を構成する、本発明1012~1020のいずれかの組成物。
[本発明1023]
前記非カチオン性脂質が、前記LNP中に存在する全脂質の約25mol%~約50mol%を構成する、本発明1012~1020のいずれかの組成物。
[本発明1024]
前記複合脂質が、前記LNP中に存在する全脂質の約0.5mol%~約20mol%を構成する、本発明1012~1023のいずれかの組成物。
[本発明1025]
前記複合脂質が、前記LNP中に存在する全脂質の約2mol%~約20mol%を構成する、本発明1012~1023のいずれかの組成物。
[本発明1026]
前記複合脂質が、前記LNP中に存在する全脂質の約1.5mol%~約18mol%を構成する、本発明1012~1023のいずれかの組成物。
[本発明1027]
前記LNPの95%超が非ラメラ形態を有する、本発明1012~1026のいずれかの組成物。
[本発明1028]
前記LNPの95%超が高電子密度である、本発明1012~1027のいずれかの組成物。
[本発明1029]
複数のLNPをさらに含み、前記LNPが、
前記LNP中に存在する全脂質の50mol%~65mol%を構成するカチオン性脂質と、
前記LNP中に存在する全脂質の0.5mol%~2mol%を構成する、LNPの凝集を阻害する複合脂質と、
(a)リン脂質とコレステロールまたはその誘導体との混合物であって、前記リン脂質が前記LNP中に存在する全脂質の4mol%~10mol%を構成し、前記コレステロールまたはその誘導体が前記LNP中に存在する全脂質の30mol%~40mol%を構成する、前記混合物、
(b)リン脂質とコレステロールまたはその誘導体との混合物であって、前記リン脂質が前記LNP中に存在する全脂質の3mol%~15mol%を構成し、前記コレステロールまたはその誘導体が前記LNP中に存在する全脂質の30mol%~40mol%を構成する、前記混合物、または、
(c)前記LNP中に存在する全脂質の49.5mol%以下であり、リン脂質とコレステロールまたはその誘導体との混合物を含み、前記コレステロールまたはその誘導体が、前記LNP中に存在する全脂質の30mol%から40mol%を構成するもの
のいずれかを含む、非カチオン性脂質と
を含む、本発明1008~1028のいずれかの組成物。
[本発明1030]
複数のLNPをさらに含み、前記LNPが、
前記LNP中に存在する全脂質の50mol%~85mol%を構成するカチオン性脂質と、
前記LNP中に存在する全脂質の0.5mol%~2mol%を構成する、LNPの凝集を阻害する複合脂質と、
前記LNP中に存在する全脂質の13mol%~49.5mol%を構成する非カチオン性脂質と
を含む、本発明1008~1028のいずれかの組成物。
[本発明1031]
前記リン脂質が、ジパルミトイルホスファチジルコリン(DPPC)、ジステアロイルホスファチジルコリン(DSPC)、またはこれらの混合物を含む、本発明1029の組成物。
[本発明1032]
前記複合脂質が、ポリエチレングリコール(PEG)-脂質複合体を含む、本発明1029または1030の組成物。
[本発明1033]
前記PEG-脂質複合体が、PEG-ジアシルグリセロール(PEG-DAG)複合体、PEG-ジアルキルオキシプロピル(PEG-DAA)複合体、またはこれらの混合物を含む、本発明1032の組成物。
[本発明1034]
前記PEG-DAA複合体が、PEG-ジミリスチルオキシプロピル(PEG-DMA)複合体、PEG-ジステアリルオキシプロピル(PEG-DSA)複合体、またはこれらの混合物を含む、本発明1033の組成物。
[本発明1035]
前記複合体のPEG部分が、約2000ダルトンの平均分子量を有する、本発明1032~1034のいずれかの組成物。
[本発明1036]
前記複合脂質が、前記LNP中に存在する全脂質の1mol%~2mol%を構成する、本発明1029~1035のいずれかの組成物。
[本発明1037]
前記LNPが、式Iの構造を有する化合物、または、その薬学的に許容される塩、互変異性体、プロドラッグもしくは立体異性体を含む、本発明1008~1036のいずれかの組成物:
式中、
L1及びL2は、それぞれ独立して、-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x-、-S-S-、-C(=O)S-、-SC(=O)-、-RaC(=O)-、-C(=O)Ra-、-RaC(=O)Ra-、-OC(=O)Ra-、-RaC(=O)O-、または直接的結合であり、
G1は、Ci~C2アルキレン、-(C=O)-、-O(C=O)-、-SC(=O)-、-RaC(=O)-、または直接的結合であり、
-C(=O)-、-(C=O)O-、-C(=O)S-、-C(=O)Ra-、または直接的結合であり、
Gは、Ci~C6アルキレンであり、
Raは、HまたはC1~C12アルキルであり、
R1a及びR1bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R1aは、HもしくはC1~C12アルキルであり、R1bはそれが結合する炭素原子と共に、隣り合ったR1b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R2a及びR2bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R2aは、HもしくはC1~C12アルキルであり、R2bはそれが結合する炭素原子と共に、隣り合ったR2b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R3a及びR3bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R3aは、HもしくはC1~C12アルキルであり、R3bはそれが結合する炭素原子と共に、隣り合ったR及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R4a及びR4bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R4aは、HもしくはC1~C12アルキルであり、R4bはそれが結合する炭素原子と共に、隣り合ったR4b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R5及びR6は、それぞれ独立してHまたはメチルであり、
R7は、C4~C20アルキルであり、
R8及びR9は、それぞれ独立してC1~C12アルキルであるか、またはR8及びR9は、それらが結合する窒素原子と共に、5、6、または7員の複素環を形成し、
a、b、c、及びdは、それぞれ独立して1~24の整数であり、xは0、1、または2である。
[本発明1038]
前記LNPが、式IIの構造を有する化合物、または、その薬学的に許容される塩、互変異性体、プロドラッグもしくは立体異性体を含む、本発明1008~1036のいずれかの組成物:
式中、
L1及びL2は、それぞれ独立して-O(C=O)-、-(C=O)O-、または炭素-炭素二重結合であり、
R1a及びR1bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R1aは、HもしくはC1~C12アルキルであり、R1bはそれが結合する炭素原子と共に、隣り合ったR1b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R2a及びR2bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R2aは、HもしくはC1~C12アルキルであり、R2bはそれが結合する炭素原子と共に、隣り合ったR2b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R3a及びR3bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R3aは、HもしくはC1~C12アルキルであり、R3bはそれが結合する炭素原子と共に、隣り合ったR3b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R4a及びR4bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R4aは、HもしくはC1~C12アルキルであり、R4bはそれが結合する炭素原子と共に、隣り合ったR4b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R5及びR6は、それぞれ独立してメチルまたはシクロアルキルであり、
R7は、各出現時に、独立してHまたはC1~C12アルキルであり、
R8及びR9は、それぞれ独立して、非置換のC1~C12アルキルであるか、またはR8及びR9は、それらが結合する窒素原子と共に、1個の窒素原子を含む5、6、または7員の複素環を形成し、
a及びdは、それぞれ独立して0~24の整数であり、b及びcはそれぞれ独立して1~24の整数であり、eは1または2であり、
ただし、
R1a、R2a、R3a、もしくはR4aのうちの少なくとも1つが、C1~C12アルキルであるか、またはL1もしくはL2の少なくとも一方が、-O(C=O)-または-(C=O)O-であり、
R1a及びR1bは、aが6である場合にはイソプロピルでなく、aが8である場合にはn-ブチルでない。
[本発明1039]
中性脂質、ステロイド、及びポリマーコンジュゲート脂質を含む1つ以上の賦形剤をさらに含む、本発明1037または1039の組成物。
[本発明1040]
前記中性脂質が、1,2-ジステアロイル-sn-グリセロ-3-ホスホコリン(DSPC)、1,2-ジパルミトイル-sn-グリセロ-3-ホスホコリン(DPPC)、1,2-ジミリストイル-sn-グリセロ-3-ホスホコリン(DMPC)、1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン(POPC)、1,2-ジオレオイル-sn-グリセロ-3-ホスホコリン(DOPC)、及び 1,2-ジオレオイル-sn-グリセロ-3-ホスホエタノールアミン(DOPE)のうちの少なくとも1つを含む、本発明1039の組成物。
[本発明1041]
前記中性脂質がDSPCである、本発明1040の組成物。
[本発明1042]
前記化合物と前記中性脂質とのモル比が、約2:1~約8:1の範囲である、本発明1039~1041のいずれかの組成物。
[本発明1043]
前記ステロイドがコレステロールである、本発明1039~1042のいずれかの組成物。
[本発明1044]
前記化合物と前記コレステロールとのモル比が、約2:1~1:1の範囲である、本発明1043の組成物。
[本発明1045]
前記ポリマーコンジュゲート脂質がPEG化脂質である、本発明1039~1044のいずれかの組成物。
[本発明1046]
前記化合物と前記PEG化脂質とのモル比が、約100:1~約25:1の範囲である、本発明1045の組成物。
[本発明1047]
前記PEG化脂質が、PEG-DAG、PEGポリエチレン(PEG-PE)、PEG-スクシノイル-ジアシルグリセロール(PEG-S-DAG)、PEG-cer、またはPEGジアルキオキシプロピルカルバメートである、本発明1045または1046の組成物。
[本発明1048]
前記PEG化脂質が、下記構造IIIを有する、本発明1045または1046の組成物、または、その薬学的に許容される塩、互変異性体、もしくは立体異性体:
式中、
R10及びR11は、それぞれ独立して、10~30個の炭素原子を含む、直鎖または分枝鎖の飽和または不飽和のアルキル鎖であり、前記アルキル鎖は任意で1つ以上のエステル結合によって中断され、
zは、30~60の範囲の平均値を有する。
[本発明1049]
R10及びR11が、それぞれ独立して、12~16個の炭素原子を有する直鎖の飽和アルキル鎖である、本発明1048の組成物。
[本発明1050]
前記平均zが、約45である、本発明1048または1049の組成物。
[本発明1051]
前記LNPが、ポリアニオン性の核酸と混合される際に非二重層構造に自己組織化する、本発明1008~1050のいずれかの組成物。
[本発明1052]
前記非二重層構造が、60nm~120nmの直径を有する、本発明1051の組成物。
[本発明1053]
前記非二重層構造が、約70nm、約80nm、約90nm、または約100nmの直径を有する、本発明1051の組成物。
[本発明1054]
前記ナノ粒子状の送達ビヒクルが、約100nmの直径を有する、本発明1007~1053のいずれかの組成物。
[本発明1055]
前記新生抗原カセットが、前記少なくとも1つのプロモーターヌクレオチド配列と前記少なくとも1つのポリ(A)配列との間に組み込まれている、本発明1001、1003~1005、または1007~1054のいずれかの組成物。
[本発明1056]
前記少なくとも1つのプロモーターヌクレオチド配列が、前記新生抗原コード核酸配列と機能的に連結されている、本発明1001、1003~1005、または1007~1055のいずれかの組成物。
[本発明1057]
前記1つ以上のベクターが、1つ以上の+鎖RNAベクターを含む、本発明1001、1003~1005、または1007~1056のいずれかの組成物。
[本発明1058]
前記1つ以上の+鎖RNAベクターが、5’7-メチルグアノシン(m7g)キャップを含む、本発明1057の組成物。
[本発明1059]
前記1つ以上の+鎖RNAベクターが、インビトロ転写によって生成される、本発明1057または1058の組成物。
[本発明1060]
前記1つ以上のベクターが、哺乳動物細胞内で自己複製する、本発明1001、1003~1005、または1007~1059のいずれかの組成物。
[本発明1061]
前記RNAアルファウイルス骨格が、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスの少なくとも1つのヌクレオチド配列を含む、本発明1001、1003~1005、または1007~1060のいずれかの組成物。
[本発明1062]
前記RNAアルファウイルス骨格が、ベネズエラウマ脳炎ウイルスの少なくとも1つのヌクレオチド配列を含む、本発明1001、1003~1005、または1007~1060のいずれかの組成物。
[本発明1063]
前記RNAアルファウイルス骨格が、少なくとも、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスのヌクレオチド配列によってコードされた、非構造タンパク質媒介増幅のための配列、26Sプロモーター配列、ポリ(A)配列、非構造タンパク質1(nsP1)遺伝子、nsP2遺伝子、nsP3遺伝子、及びnsP4遺伝子を含む、本発明1061または1062の組成物。
[本発明1064]
前記RNAアルファウイルス骨格が、少なくとも、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスのヌクレオチド配列によってコードされた、非構造タンパク質媒介増幅のための配列、26Sプロモーター配列、及びポリ(A)配列を含む、本発明1061または1062の組成物。
[本発明1065]
前記非構造タンパク質媒介増幅のための配列が、アルファウイルス5’ UTR、51ntのCSE、24ntのCSE、26Sサブゲノミックプロモーター配列、19ntのCSE、アルファウイルス3’ UTR、またはこれらの組み合わせからなる群から選択される、本発明1063または1064の組成物。
[本発明1066]
前記RNAアルファウイルス骨格が構造ビリオンタンパク質カプシドE2及びE1をコードしていない、本発明1063~1065のいずれかの組成物。
[本発明1067]
前記新生抗原カセットが、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスのヌクレオチド配列内の構造ビリオンタンパク質の代わりに挿入されている、本発明1066の組成物。
[本発明1068]
前記ベネズエラウマ脳炎ウイルスが、SEQ ID NO:3またはSEQ ID NO:5に記載の配列を含む、本発明1061または1062の組成物。
[本発明1069]
前記ベネズエラウマ脳炎ウイルスが、塩基対7544と11175との間の欠失をさらに含むSEQ ID NO:3またはSEQ ID NO:5の配列を含む、本発明1061または1062のの組成物。
[本発明1070]
前記RNAアルファウイルス骨格が、SEQ ID NO:6またはSEQ ID NO:7に記載の配列を含む、本発明1069の組成物。
[本発明1071]
前記新生抗原カセットが、SEQ ID NO:3またはSEQ ID NO:5の配列に記載される塩基対7544と11175との間の前記欠失を置換するように7544位に挿入されている、本発明1069または1070の組成物。
[本発明1072]
前記新生抗原カセットの挿入が、nsP1~4遺伝子及び少なくとも1つの抗原コード核酸配列を含むポリシストロニックRNAの転写をもたらし、前記nsP1~4遺伝子及び前記少なくとも1つの抗原コード核酸配列が別々のオープンリーディングフレーム内にある、本発明1067~1071のいずれかの組成物。
[本発明1073]
前記少なくとも1つのプロモーターヌクレオチド配列が、前記RNAアルファウイルス骨格によってコードされた天然の26Sプロモーターヌクレオチド配列である、本発明1001、1003~1005、または1007~1072のいずれかの組成物。
[本発明1074]
前記少なくとも1つのプロモーターヌクレオチド配列が、外来性のRNAプロモーターである、本発明1001、1003~1005、または1007~1072のいずれかの組成物。
[本発明1075]
前記第2のプロモーターヌクレオチド配列が、26Sプロモーターヌクレオチド配列である、本発明1001、1003~1005、または1007~1074のいずれかの組成物。
[本発明1076]
前記第2のプロモーターヌクレオチド配列が複数の26Sプロモーターヌクレオチド配列を含み、各26Sプロモーターヌクレオチド配列が、前記別々のオープンリーディングフレームのうちの1つ以上の転写をもたらす、本発明1001、1003~1005、または1007~1074のいずれかの組成物。
[本発明1077]
前記1つ以上のベクターが、それぞれ少なくとも300ntのサイズである、先行本発明のいずれかの組成物。
[本発明1078]
前記1つ以上のベクターが、それぞれ少なくとも1kbのサイズである、先行本発明のいずれかの組成物。
[本発明1079]
前記1つ以上のベクターが、それぞれ2kbのサイズである、先行本発明のいずれかの組成物。
[本発明1080]
前記1つ以上のベクターが、それぞれ5kb未満のサイズである、先行本発明のいずれかの組成物。
[本発明1081]
前記少なくとも1つの新生抗原コード核酸配列のうちの少なくとも1つが、腫瘍細胞上のMHCクラスIによって提示されるポリペプチド配列またはその一部をコードする、先行本発明のいずれかの組成物。
[本発明1082]
各抗原コード核酸配列が互いに直接連結されている、本発明1001、1003~1005、または1007~1081のいずれかの組成物。
[本発明1083]
前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つが、リンカーをコードする核酸配列によって異なる抗原コード核酸配列と連結されている、本発明1001、1003~1005、または1007~1082のいずれかの組成物。
[本発明1084]
前記リンカーが、2個のMHCクラスI配列または1個のMHCクラスI配列を1個のMHCクラスII配列と連結する、本発明1083の組成物。
[本発明1085]
前記リンカーが、
(1)少なくとも残基2、3、4、5、6、7、8、9、または10個の長さの連続したグリシン残基、
(2)少なくとも残基2、3、4、5、6、7、8、9、または10個の長さの連続したアラニン残基、
(3)2個のアルギニン残基(RR)、
(4)アラニン、アラニン、チロシン(AAY)、
(5)哺乳動物プロテアソームによって効率的にプロセシングされる、少なくともアミノ酸残基2、3、4、5、6、7、8、9、または10個の長さのコンセンサス配列、及び
(6)元のタンパク質と同種のタンパク質に由来する抗原に隣接し、少なくともアミノ酸残基2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、または2~20個の長さの1つ以上の天然配列
からなる群から選択される、本発明1084の組成物。
[本発明1086]
前記リンカーが、2個のMHCクラスII配列または1個のMHCクラスII配列を1個のMHCクラスI配列と連結する、本発明1083の組成物。
[本発明1087]
前記リンカーが、配列GPGPGを含む、本発明1086の組成物。
[本発明1088]
前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つの配列が、
前記少なくとも1つの抗原コード核酸配列の発現、安定性、細胞トラフィッキング、プロセシング及び提示、ならびに/または免疫原性を高める、分離したまたは連続的な配列
に機能的または直接的に連結されている、本発明1001、1003~1005、または1007~1087のいずれかの組成物。
[本発明1089]
前記分離したまたは連続的な配列が、ユビキチン配列、プロテアソームターゲティング性を高めるように改変されたユビキチン配列(例えば、76位にGlyからAlaへの置換を含むユビキチン配列)、免疫グロブリンシグナル配列(例えばIgK)、主要組織適合性クラスI配列、リソソーム関連膜タンパク質(LAMP)-1、ヒト樹状細胞リソソーム関連膜タンパク質、及び主要組織適合性クラスII配列のうちの少なくとも1つを含み、任意でプロテアソームターゲティング性を高めるように改変された前記ユビキチン配列がA76である、本発明1088の組成物。
[本発明1090]
前記少なくとも1つの新生抗原コード核酸配列のうちの少なくとも1つが、翻訳後の対応する野生型核酸配列と比べて、その対応するMHCアレルに対する増大した結合親和性を有するポリペプチド配列またはその一部をコードする、先行本発明のいずれかの組成物。
[本発明1091]
前記少なくとも1つの新生抗原コード核酸配列の少なくとも1つが、翻訳後の対応する野生型核酸配列と比べて、その対応するMHCアレルに対する増大した結合安定性を有するポリペプチド配列またはその一部をコードする、先行本発明のいずれかの組成物。
[本発明1092]
前記少なくとも1つの新生抗原コード核酸配列のうちの少なくとも1つが、翻訳後の対応する野生型核酸配列と比べて、その対応するMHCアレル上への増大した提示の尤度を有するポリペプチド配列またはその一部をコードする、先行本発明のいずれかの組成物。
[本発明1093]
前記少なくとも1つの変化が、点変異、フレームシフト変異、非フレームシフト変異、欠失変異、挿入変異、スプライスバリアント、ゲノム再編成、またはプロテアソームにより生成されたスプライスされた抗原を含む、先行本発明のいずれかの組成物。
[本発明1094]
前記腫瘍が、肺癌、メラノーマ、乳癌、卵巣癌、前立腺癌、腎臓癌、胃癌、結腸癌、精巣癌、頭頸部癌、膵臓癌、膀胱癌、脳癌、B細胞リンパ腫、急性骨髄性白血病、成人急性リンパ芽球性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺癌、及び小細胞肺癌からなる群から選択される、先行本発明のいずれかの組成物。
[本発明1095]
前記少なくとも1つの新生抗原コード核酸配列が、少なくとも2~10個、2個、3個、4個、5個、6個、7個、8個、9個、または10個の核酸配列を含む、本発明1001、1003~1005、または1007~1094のいずれかの組成物。
[本発明1096]
前記少なくとも1つの新生抗原コード核酸配列が、少なくとも11~20個、15~20個、11~100個、11~200個、11~300個、11~400個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、または最大で400個の核酸配列を含む、本発明1001、1003~1005、または1007~1094のいずれかの組成物。
[本発明1097]
前記少なくとも1つの新生抗原コード核酸配列が少なくとも2~400個の核酸配列を含み、前記新生抗原コード核酸配列のうちの少なくとも2個が、腫瘍細胞表面上のMHCクラスIによって提示されるポリペプチド配列またはその一部をコードする、本発明1001、1003~1005、または1007~1094のいずれかの組成物。
[本発明1098]
前記新生抗原コード核酸配列のうちの少なくとも2つが、腫瘍細胞表面上のMHCクラスIによって提示されるポリペプチド配列またはその一部をコードする、本発明1002または1006の組成物。
[本発明1099]
対象に投与されて翻訳された場合、前記少なくとも1つの新生抗原コード核酸配列によってコードされた新生抗原のうちの少なくとも1つが抗原提示細胞上に提示され、腫瘍細胞表面上の新生抗原の少なくとも1つを標的とする免疫応答をもたらす、先行本発明のいずれかの組成物。
[本発明1100]
前記少なくとも1つの新生抗原コード核酸配列が、対象に投与されて翻訳された場合、MHCクラスIまたはクラスII新生抗原のうちの少なくとも1つが抗原提示細胞上に提示され、腫瘍細胞表面上の新生抗原の少なくとも1つを標的とする免疫応答をもたらし、任意で、前記少なくとも1つの新生抗原コード核酸配列のそれぞれの発現が、前記少なくとも1つのプロモーターヌクレオチド配列によって誘導される、先行本発明のいずれかの組成物。
[本発明1101]
各MHCクラスI新生抗原コード核酸配列が、アミノ酸8~35個の長さ、任意で、アミノ酸9~17個、9~25個、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34または35個のポリペプチド配列をコードする、本発明1001、1003~1005、または1007~1100のいずれかの組成物。
[本発明1102]
前記少なくとも1つのMHCクラスII抗原コード核酸配列が存在する、本発明1001、1003~1005、または1007~1101のいずれかの組成物。
[本発明1103]
前記少なくとも1つのMHCクラスII抗原コード核酸配列が存在し、かつ、前記コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を含む少なくとも1つのMHCクラスII新生抗原コード核酸配列を含む、本発明1001、1003~1005、または1007~1101のいずれかの組成物。
[本発明1104]
前記少なくとも1つのMHCクラスII抗原コード核酸配列が、アミノ酸12~20個、12、13、14、15、16、17、18、19、20個、または20~40個の長さである、本発明1001、1003~1005、または1007~1103のいずれかの組成物。
[本発明1105]
前記少なくとも1つのMHCクラスII抗原コード核酸配列が存在し、かつ、少なくとも1つのユニバーサルMHCクラスII抗原コード核酸配列を含み、任意で、前記少なくとも1つのユニバーサル配列が、破傷風トキソイド及びPADREの少なくとも一方を含む、本発明1001、1003~1005、または1007~1104のいずれかの組成物。
[本発明1106]
前記少なくとも1つのプロモーターヌクレオチド配列または前記第2のプロモーターヌクレオチド配列が誘導性である、本発明1001、1003~1005、または1007~1105のいずれかの組成物。
[本発明1107]
前記少なくとも1つのプロモーターヌクレオチド配列または前記第2のプロモーターヌクレオチド配列が非誘導性である、本発明1001、1003~1005、または1007~1105のいずれかの組成物。
[本発明1108]
前記少なくとも1つのポリ(A)配列が、前記アルファウイルスに天然に存在するポリ(A)配列を含む、本発明1001、1003~1005、または1007~1107のいずれかの組成物。
[本発明1109]
前記少なくとも1つのポリ(A)配列が、前記アルファウイルスに対して外来性のポリ(A)配列を含む、本発明1001、1003~1005、または1007~1107のいずれかの組成物。
[本発明1110]
前記少なくとも1つのポリ(A)配列が、前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つと機能的に連結されている、本発明1001、1003~1005、または1007~1109のいずれかの組成物。
[本発明1111]
前記少なくとも1つのポリ(A)配列が、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、または少なくとも90個の連続したAヌクレオチドである、本発明1001、1003~1005、または1007~1110のいずれかの組成物。
[本発明1112]
前記少なくとも1つのポリ(A)配列が、少なくとも100個の連続したAヌクレオチドである、本発明1001、1003~1005、または1007~1110のいずれかの組成物。
[本発明1113]
前記新生抗原カセットが、
イントロン配列、ウッドチャック肝炎ウイルス転写後調節因子(WPRE)配列、内部リボソーム進入配列(IRES)配列、2A自己切断ペプチド配列をコードするヌクレオチド配列、フリン切断部位をコードするヌクレオチド配列、または、前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つに機能的に連結された、mRNAの核輸送、安定性、もしくは翻訳効率を向上させることが知られている5’もしくは3’末端非コード領域内の配列
のうちの少なくとも1つをさらに含む、先行本発明のいずれかの組成物。
[本発明1114]
前記新生抗原カセットが、緑色蛍光タンパク質(GFP)、GFP変異体、分泌型アルカリホスファターゼ、ルシフェラーゼ、ルシフェラーゼ変異体、または検出可能なペプチドもしくはエピトープを含むがこれらに限定されないレポーター遺伝子をさらに含む、先行本発明のいずれかの組成物。
[本発明1115]
前記検出可能なペプチドまたはエピトープが、HAタグ、Flagタグ、Hisタグ、またはV5タグからなる群から選択される、本発明1114の組成物。
[本発明1116]
前記1つ以上のベクターが、少なくとも1つの免疫調節物質をコードする1つ以上の核酸配列をさらに含む、先行本発明のいずれかの組成物。
[本発明1117]
前記免疫調節物質が、抗CTLA4抗体もしくはその抗原結合フラグメント、抗PD-1抗体もしくはその抗原結合フラグメント、抗PD-L1抗体もしくはその抗原結合フラグメント、抗4-1BB抗体もしくはその抗原結合フラグメント、または抗OX-40抗体もしくはその抗原結合フラグメントである、本発明1116の組成物。
[本発明1118]
前記抗体またはその抗原結合フラグメントが、Fabフラグメント、Fab’フラグメント、一本鎖Fv(scFv)、単一特異的もしくは互いに連結された多重特異性の単一ドメイン抗体(sdAb)(例えば、ラクダ科動物の抗体ドメイン)、または完全長の一本鎖抗体(例えば、フレキシブルリンカーによって重鎖と軽鎖が連結された完全長IgG)である、本発明1117の組成物。
[本発明1119]
前記抗体の重鎖配列と軽鎖配列が、2Aなどの自己切断配列もしくはIRESによって分けられた連続的配列であるか、または前記抗体の重鎖配列と軽鎖配列が、連続したグリシン残基などのフレキシブルリンカーによって連結されている、本発明1117または1118の組成物。
[本発明1120]
前記免疫調節物質がサイトカインである、本発明1116の組成物。
[本発明1121]
前記サイトカインが、IL-2、IL-7、IL-12、IL-15、もしくはIL-21、またはそれぞれのその変異体のうちの1つである、本発明1120の組成物。
[本発明1122]
前記少なくとも1つのMHCクラスI新生抗原コード核酸配列が、
(a)腫瘍から、エクソーム、トランスクリプトーム、または全ゲノムの腫瘍ヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記腫瘍ヌクレオチドシークエンシングデータが、新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられる、工程と、
(b)新生抗原のそれぞれが腫瘍の腫瘍細胞表面上のMHCアレルのうちの1つ以上によって提示される数値的尤度のセットを生成するために、各新生抗原のペプチド配列を提示モデルに入力する工程であって、前記数値的尤度のセットが、受け取った質量分析データに少なくとも基づいて特定されたものである、工程と、
(c)新生抗原のセットのサブセットを、前記数値的尤度のセットに基づいて選択することにより、前記少なくとも1つのMHCクラスI新生抗原コード核酸配列を生成するために用いられる選択された新生抗原のセットを生成する工程と
を行うことによって選択される、本発明1001、1003~1005、または1007~1121のいずれかの組成物。
[本発明1123]
前記MHCクラスIエピトープコード核酸配列のそれぞれが、
(a)腫瘍から、エクソーム、トランスクリプトーム、または全ゲノムの腫瘍ヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記腫瘍ヌクレオチドシークエンシングデータが、新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられる、工程と、
(b)新生抗原のそれぞれが腫瘍の腫瘍細胞表面上のMHCアレルのうちの1つ以上によって提示される数値的尤度のセットを生成するために、各新生抗原のペプチド配列を提示モデルに入力する工程であって、前記数値的尤度のセットが、受け取った質量分析データに少なくとも基づいて特定されたものである、工程と、
(c)前記少なくとも20個のMHCクラスI新生抗原コード核酸配列を生成するために用いられる選択された新生抗原のセットを生成するために、新生抗原のセットのサブセットを、数値的尤度のセットに基づいて選択する工程と
を行うことによって選択される、本発明1002または1006の組成物。
[本発明1124]
前記選択された新生抗原のセットの数が、2~20である、本発明1122の組成物。
[本発明1125]
前記提示モデルが、
(a)前記MHCアレルのうちの特定の1つとペプチド配列の特定の位置の特定のアミノ酸とのペアの存在と、
(b)前記ペアの前記MHCアレルのうちの前記特定の1つによる、前記特定の位置に前記特定のアミノ酸を含むそのようなペプチド配列の腫瘍細胞表面上での提示の尤度と
の間の依存性を表す、本発明1122~1124のいずれかの組成物。
[本発明1126]
前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む、本発明1122~1125のいずれかの組成物。
[本発明1127]
前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む、本発明1122~1126のいずれかの組成物。
[本発明1128]
前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である、本発明1122~1127のいずれかの組成物。
[本発明1129]
前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて中枢性寛容または末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む、本発明1122~1128のいずれかの組成物。
[本発明1130]
前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、本発明1122~1129のいずれかの組成物。
[本発明1131]
エクソームまたはトランスクリプトームのヌクレオチドシークエンシングデータが、腫瘍組織でシークエンシングを行うことによって取得される、本発明1122~1130のいずれかの組成物。
[本発明1132]
前記シークエンシングが、次世代シークエンシング(NGS)または任意の大規模並列処理シークエンシングアプローチである、本発明1131の組成物。
[本発明1133]
前記新生抗原カセットが、前記新生抗原カセット内の隣接配列によって形成されたジャンクショナルエピトープ配列を含む、先行本発明のいずれかの組成物。
[本発明1134]
少なくとも1つの、または各ジャンクショナルエピトープ配列が、MHCに対して500nMよりも高い親和性を有する、本発明1133の組成物。
[本発明1135]
各ジャンクショナルエピトープ配列が非自己である、本発明1133または1134の組成物。
[本発明1136]
前記新生抗原カセットが、翻訳後の野生型核酸配列を含む非治療的MHCクラスIまたはクラスIIエピトープ核酸配列をコードしておらず、前記非治療的エピトープが前記対象のMHCアレル上に提示されると予測される、先行本発明のいずれかの組成物。
[本発明1137]
前記非治療的な予測されたMHCクラスIまたはクラスIIエピトープ配列が、前記新生抗原カセット内の隣接配列によって形成されたジャンクショナルエピトープ配列である、本発明1136の組成物。
[本発明1138]
前記予測が、前記非治療的エピトープの配列を提示モデルに入力することによって生成される提示尤度に基づいたものである、本発明1133~1137のいずれかの組成物。
[本発明1139]
前記新生抗原カセット内における少なくとも1つの抗原コード核酸配列の順序が、
(a)前記少なくとも1つの抗原コード核酸配列の異なる順序に対応した候補新生抗原カセット配列のセットを生成する工程、
(b)前記各候補新生抗原カセット配列について、前記候補新生抗原カセット配列内の非治療的エピトープの提示に基づいた提示スコアを決定する工程、及び
(c)所定の閾値を下回る提示スコアに関連する候補カセット配列を、新生抗原ワクチン用の新生抗原カセット配列として選択する工程
を含む一連の工程によって決定される、本発明1133~1138のいずれかの組成物。
[本発明1140]
先行本発明のいずれかの組成物と、薬学的に許容される担体とを含む、医薬組成物。
[本発明1141]
アジュバントをさらに含む、本発明1140の組成物。
[本発明1142]
免疫調節物質をさらに含む、本発明1140または1141の医薬組成物。
[本発明1143]
前記免疫調節物質が、抗CTLA4抗体もしくはその抗原結合フラグメント、抗PD-1抗体もしくはその抗原結合フラグメント、抗PD-L1抗体もしくはその抗原結合フラグメント、抗4-1BB抗体もしくはその抗原結合フラグメント、または抗OX-40抗体もしくはその抗原結合フラグメントである、本発明1142の医薬組成物。
[本発明1144]
先行の組成物の発明のいずれかの新生抗原カセットと、SEQ ID NO:3またはSEQ ID NO:5の配列から得られる1つ以上の要素とを含む、単離ヌクレオチド配列または単離ヌクレオチド配列のセットであって、任意で、前記1つ以上の要素が、非構造タンパク質媒介増幅に必要な配列、26Sプロモーターヌクレオチド配列、ポリ(A)配列、及びSEQ ID NO:3またはSEQ ID NO:5に記載の配列のnsP1~4遺伝子からなる群から選択され、任意で、前記ヌクレオチド配列がcDNAである、前記単離ヌクレオチド配列または単離ヌクレオチド配列のセット。
[本発明1145]
前記配列または単離ヌクレオチド配列のセットが、SEQ ID NO:6またはSEQ ID NO:7に記載の配列の7544位に挿入された先行の組成物の発明のいずれかの新生抗原カセットを含む、本発明1144の単離ヌクレオチド配列。
[本発明1146]
SEQ ID NO:3またはSEQ ID NO:5の配列から得られた前記1つ以上の要素の5’側に位置するT7またはSP6 RNAポリメラーゼプロモーターのヌクレオチド配列と、
任意で、前記ポリ(A)配列の3’側に位置する1つ以上の制限部位と
をさらに含む、本発明1144または1145の単離ヌクレオチド配列。
[本発明1147]
先行の組成物の発明のいずれかの新生抗原カセットが、SEQ ID NO:8またはSEQ ID NO:9の7563位に挿入されている、本発明1144の単離ヌクレオチド配列。
[本発明1148]
本発明1144~1147のいずれかのヌクレオチド配列を含む、ベクターまたはベクターのセット。
[本発明1149]
本発明1144~1148のいずれかのヌクレオチド配列または単離ヌクレオチド配列のセットを含む単離細胞であって、任意で、前記細胞が、BHK-21、CHO、HEK293もしくはその変異体、911、HeLa、A549、LP-293、PER.C6、またはAE1-2a細胞である、前記単離細胞。
[本発明1150]
先行の組成物の発明のいずれかの組成物と、使用説明書とを含む、キット。
[本発明1151]
がんを有する対象を治療するための方法であって、前記対象に、先行の組成物の発明のいずれかの組成物、または本発明1140~1143のいずれかの医薬組成物を投与することを含む、前記方法。
[本発明1152]
腫瘍に由来する少なくとも1つのMHCクラスI新生抗原コード核酸配列が、がんを有する前記対象の腫瘍に由来する、本発明1151の方法。
[本発明1153]
少なくとも1つのMHCクラスI新生抗原コード核酸配列が、がんを有する前記対象の腫瘍に由来しない、本発明1151の方法。
[本発明1154]
対象に免疫応答を誘導するための方法であって、前記対象に、先行の組成物の発明のいずれかの組成物、または本発明1140~1143のいずれかの医薬組成物を投与することを含む、前記方法。
[本発明1155]
前記組成物が、筋肉内(IM)、皮内(ID)、皮下(SC)、または静脈内(IV)投与される、本発明1151~1154のいずれかの方法。
[本発明1156]
前記組成物が筋肉内投与される、本発明1151~1154のいずれかの方法。
[本発明1157]
1つ以上の免疫調節物質の投与をさらに含み、任意で、前記免疫調節物質が前記組成物または医薬組成物の投与前、投与と同時、または投与後に投与される、本発明1151~1156のいずれかの方法。
[本発明1158]
前記1つ以上の免疫調節物質が、抗CTLA4抗体もしくはその抗原結合フラグメント、抗PD-1抗体もしくはその抗原結合フラグメント、抗PD-L1抗体もしくはその抗原結合フラグメント、抗4-1BB抗体もしくはその抗原結合フラグメント、または抗OX-40抗体もしくはその抗原結合フラグメントからなる群から選択される、本発明1157の方法。
[本発明1159]
前記免疫調節物質が、静脈内(IV)、筋肉内(IM)、皮内(ID)、または皮下(SC)投与される、本発明1157または1158の方法。
[本発明1160]
前記皮下投与が、前記組成物または医薬組成物の投与部位の近くに、または1つ以上のベクターもしくは組成物の流入領域リンパ節に近接して行われる、本発明1159の方法。
[本発明1161]
前記対象に第2のワクチン組成物を投与することをさらに含む、本発明1151~1160のいずれかの方法。
[本発明1162]
前記第2のワクチン組成物が、本発明1151~1160のいずれかの組成物または医薬組成物の投与の前に投与される、本発明1161の方法。
[本発明1163]
前記第2のワクチン組成物が、本発明1151~1160のいずれかの組成物または医薬組成物の投与の後に投与される、本発明1161の方法。
[本発明1164]
前記第2のワクチン組成物が、本発明1151~1160のいずれかの組成物または医薬組成物と同じである、本発明1162または1163の方法。
[本発明1165]
前記第2のワクチン組成物が、本発明1151~1160のいずれかの組成物または医薬組成物と異なる、本発明1162または1163の方法。
[本発明1166]
前記第2のワクチン組成物が、少なくとも1つの抗原コード核酸配列をコードするチンパンジーアデノウイルスベクターを含む、本発明1165の方法。
[本発明1167]
前記チンパンジーアデノウイルスベクターによってコードされる前記少なくとも1つの抗原コード核酸配列が、先行の組成物の発明のいずれかの少なくとも1つの抗原コード核酸配列と同じである、本発明1166の方法。
[本発明1168]
先行の組成物の発明のいずれかの1つ以上のベクターを製造する方法であって、
(a)前記RNAアルファウイルス骨格及び前記新生抗原カセットを含む直線化DNA配列を得ることと、
(b)前記直線化DNA配列を、前記直線化DNA配列をRNAに転写するために必要なすべての構成要素を含んだインビトロ転写反応に加えることにより、前記直線化DNA配列をインビトロ転写することであって、任意で、得られたRNAに前記m7gキャップをインビトロで加えることをさらに含む、前記インビトロ転写することと、
(c)前記インビトロ転写反応から前記1つ以上のベクターを単離することと
を含む、前記方法。
[本発明1169]
前記直線化DNA配列が、DNAプラスミド配列を直線化することにより、またはPCRを用いた増幅により生成される、本発明1168の製造する方法。
[本発明1170]
前記DNAプラスミド配列が、細菌組換えまたは全ゲノムDNA合成または細菌細胞内での合成DNAの増幅を伴う全ゲノムDNA合成のうちの1つを用いて生成される、本発明1169の製造方法。
[本発明1171]
前記1つ以上のベクターを前記インビトロ転写反応から単離することが、フェノールクロロホルム抽出、シリカカラムを用いた精製、または同様のRNA精製法のうちの1つ以上を含む、本発明1168の製造する方法。
[本発明1172]
前記新生抗原発現系を送達するための先行の組成物の発明のいずれかの組成物を製造する方法であって、
(a)ナノ粒子状の送達ビヒクルの成分を提供することと、
(b)前記新生抗原発現系を提供することと、
(c)前記ナノ粒子状の送達ビヒクル及び前記新生抗原発現系が前記新生抗原発現系を送達するための前記組成物を生成するのに充分な条件を提供することと
を含む、前記方法。
[本発明1173]
前記条件がマイクロ流体混合によって提供される、本発明1172の製造する方法。
I.定義
一般に、特許請求の範囲及び明細書において使用される用語は、当業者により理解される通常の意味を有するものとして解釈されるものとする。特定の用語を、さらなる明確性を与えるために下記に定義する。通常の意味と与えられる定義との間に矛盾が存在する場合、与えられる定義が用いられるものとする。
本明細書では、腫瘍細胞、または樹状細胞などのプロフェッショナル抗原提示細胞を含む免疫細胞表面上に提示される可能性が高い、及び/または免疫原性を有する可能性が高い、対象の腫瘍由来の新生抗原を特定するための方法を開示する。例として、かかる1つの方法は、対象の腫瘍細胞から、エクソーム、トランスクリプトーム、または全ゲノムの腫瘍ヌクレオチドシークエンシングデータのうちの少なくとも1つを得る工程であって、前記腫瘍ヌクレオチドシークエンシングデータを用いて新生抗原のセットの各々のペプチド配列を表すデータが取得され、各新生抗原のペプチド配列が、ペプチド配列を対応する野生型の親ペプチド配列とは異なるものにする少なくとも1つの変化を含む、工程と、対象の腫瘍細胞の腫瘍細胞表面上の1つ以上のMHCアレルによって、または腫瘍内に存在する細胞によって新生抗原の各々が提示される数値的尤度のセットを生成するために、各新生抗原のペプチド配列を、1つ以上の提示モデルに入力する工程であって、前記数値的尤度のセットが、受け取った質量分析データに少なくとも基づいて特定されている、工程と、選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記数値的尤度のセットに基づいて選択する工程と、を含む方法を開示する。
また、ある特定の変異(例えば、がん細胞中に存在する変異またはアレル)の特定のための方法も、本明細書に開示する。特に、これらの変異は、がんを有する対象のがん細胞のゲノム、トランスクリプトーム、プロテオーム、またはエクソーム中に存在し得るが、対象由来の正常組織には存在し得ない。
新生抗原は、ヌクレオチドまたはポリヌクレオチドを含むことができる。例えば、新生抗原は、ポリペプチド配列をコードするRNA配列であることができる。ワクチンにおいて有用な新生抗原は、したがって、ヌクレオチド配列またはポリペプチド配列を含むことができる。
また、特異的な免疫応答、例えば、腫瘍特異的な免疫応答を生じることができる免疫原性組成物、例えば、ワクチン組成物も、本明細書に開示する。ワクチン組成物は、典型的に、例えば、本明細書に記載した方法を用いて選択された多数の新生抗原を含む。ワクチン組成物はまた、ワクチンと呼ぶこともできる。
1つ以上の新生抗原の選択に用いられる方法、「カセット」のクローニング及び構築、ならびにウイルスベクターへのその挿入は本明細書に与えられる教示を考慮すれば当該技術分野の範囲内である。「新生抗原カセット」とは、選択された新生抗原または複数の新生抗原と、ネオアンチゲン(複数可)を転写し、転写産物を発現するために必要とされる他の調節エレメントとの組み合わせを意味する。新生抗原または複数の新生抗原は、転写を可能とするような形で調節要素と機能的に連結することができる。かかる要素としては、ウイルスベクターをトランスフェクトした細胞内で新生抗原(複数可)の発現を推進することができる従来の調節エレメントが挙げられる。したがって、新生抗原カセットは、新生抗原(複数可)に連結され、組換えベクターの選択されたウイルス配列内に他の任意選択的な調節エレメントとともに配置された選択されたプロモーターも含むことができる。
(Pa-(L5b-Nc-L3d)X)Z-(P2h-(G5e-Uf)Y)W-G3g
を用いて記述することができる。式中、P及びP2は、プロモーターヌクレオチド配列を含み、Nは、MHCクラスIエピトープコード核酸配列を含み、L5は、5’リンカー配列を含み、L3は、3’リンカー配列を含み、G5は、アミノ酸リンカーをコードする核酸配列を含み、G3は、アミノ酸リンカーをコードする少なくとも1つの核酸配列のうちの1つを含み、Uは、MHCクラスII抗原コード核酸配列を含み、ここで、各Xについて、対応するNcは、エピトープコード核酸配列であり、各Yについて、対応するUfは、抗原コード核酸配列である。組成物及び順序付けられた配列は、存在する要素の数を選択することによってさらに定義することができ、例えば、a=0または1である場合、b=0または1である場合、c=1である場合、d=0または1である場合、e=0または1である場合、f=1である場合、g=0または1である場合、h=0または1である場合、X=1~400であり、Y=0、1、2、3、4または5であり、Z=1~400であり、かつW=0、1、2、3、4または5である。
本明細書に記載されるベクター、例えば本明細書に記載されるC68ベクター、または本明細書に記載されるアルファウイルスベクターは少なくとも1つの新生抗原をコードする核酸を含むことができ、また、同じまたは別のベクターが、免疫チェックポイント分子に結合してその活性を遮断する少なくとも1つの免疫調節因子(例えばscFvなどの抗体)をコードする核酸を含むことができる。ベクターは、新生抗原と、チェックポイント阻害剤をコードする1つ以上の核酸分子とを含むことができる。
V.C.1.すべての腫瘍サブクローンをカバーするペプチドのセットの決定
すべてのまたは大部分の腫瘍サブクローンによって提示されるものを意味するトランカルペプチド(truncal peptide)が、ワクチン中への包含について優先される53。任意で、高い確率で提示されかつ免疫原性であることが予測されるトランカルペプチドがない場合、または、高い確率で提示されかつ免疫原性であることが予測されるトランカルペプチドの数が、追加的な非トランカルペプチドをワクチンに含めることができるほど少ない場合には、腫瘍サブクローンの数及び同一性を推定すること、及びワクチンによってカバーされる腫瘍サブクローンの数を最大化するようにペプチドを選ぶことによって、さらなるペプチドを優先順位付けすることができる54。
上記の新生抗原フィルターのすべてを適用した後、ワクチン技術が対応できるよりも多くの候補新生抗原が、依然としてワクチン包含に利用可能である可能性がある。追加的に、新生抗原解析の種々の態様についての不確定度が残っている可能性があり、候補ワクチン新生抗原の様々な性状の間にトレードオフが存在する可能性がある。したがって、選択プロセスの各段階でのあらかじめ決定されたフィルターの代わりに、少なくとも以下の軸を有する空間に候補新生抗原を置き、積分アプローチを用いて選択を最適化する、積分多次元モデルを考えることができる。
1. 自己免疫または寛容のリスク(生殖細胞系列のリスク)(より低い自己免疫のリスクが、典型的に好ましい)
2. シークエンシングアーチファクトの確率(より低いアーチファクトの確率が、典型的に好ましい)
3. 免疫原性の確率(より高い免疫原性の確率が、典型的に好ましい)
4. 提示の確率(より高い提示の確率が、典型的に好ましい)
5. 遺伝子発現(より高い発現が、典型的に好ましい)
6. HLA遺伝子のカバレッジ(新生抗原のセットの提示に関与する、より多い数のHLA分子は、腫瘍が、HLA分子の下方制御または変異を介して免疫攻撃を回避するであろう確率を低くする可能性がある)
7.HLAクラスのカバレッジ(HLA-I及びHLA-IIの両方をカバーすることで、治療応答の確率が高まり、腫瘍の免疫回避の確率が低くなる可能性がある)
V.D.1.アルファウイルスの生物学
アルファウイルスは、トガウイルス科のメンバーであり、一本鎖プラス鎖RNAウイルスである。アルファウイルスは、自己複製型RNAまたはsrRNAと呼ぶこともできる。メンバーは、一般的に、シンドビス、ロスリバー、マヤロ、チクングニア、及びセムリキ森林ウイルスなどの旧世界型、または、東部ウマ脳炎ウイルス、アウラ、フォートモルガン、もしくはベネズエラウマ脳炎ウイルス及びその誘導株TC-83などの新世界型に分類される(Strauss Microbrial Review 1994)。天然のアルファウイルスゲノムは、通常、長さ約12kbであり、その最初の2/3は、ウイルスゲノムを自己複製するためのRNA複製複合体を形成する非構造タンパク質(nsP)をコードする遺伝子を含んでおり、最後の1/3は、ビリオンを産生するための構造タンパク質をコードするサブゲノム発現カセットを含んでいる(Frolov RNA 2001)。
アルファウイルスは、発現ベクター系として使用するために従来、遺伝子操作がなされている(Pushko 1997,Rheme 2004)。アルファウイルスは、異種抗原の発現が望ましい場合があるワクチン設定においていくつかの長所を有する。アルファウイルスは、宿主のサイトゾル中で自己複製するその能力のため、細胞内の発現カセットの高いコピー数を一般的に得ることができることから、高いレベルの異種抗原の産生を実現することができる。さらに、ベクターは一般的に一過性であるため、バイオセーフティーが高く、ベクターに対する免疫寛容の誘導は低い。また、一般公衆は、一般的にヒトアデノウイルスのような他の標準的ウイルスベクターと比較してアルファウイルスに対する既存の免疫を有していない。アルファウイルスに基づくベクターはまた、感染細胞に対する細胞毒性反応を一般的に生じる。細胞毒性は、発現された異種抗原に対して免疫応答を適性に誘発するためにワクチン設定においてある程度の重要性を有しうる。しかしながら、所望の細胞毒性の程度はバランスの問題であり、そのため、VEEのTC-83株をはじめとするいくつかの弱毒化されたアルファウイルスが開発されている。したがって、本明細書に記載される新生抗原発現ベクターの一例では、高いレベルの新生抗原発現を可能とし、新生抗原に対する強い免疫応答を誘発し、ベクター自体に対する免疫応答は誘発せず、安全に使用することができるアルファウイルス骨格を用いることができる。さらに、新生抗原発現カセットは、ベクターが、VEEまたはその弱毒化誘導株TC-83に由来する配列を含む(ただしこれらに限定されない)どのアルファウイルス配列を用いるかを最適化することを通じて異なるレベルの免疫応答を誘発するように設計することができる。
アルファウイルス送達ベクターは、一般的に、プラス鎖のRNAポリヌクレオチドである。RNA生成のための当該技術分野では周知の従来の方法として、インビトロ翻訳IVTがある。この方法では、所望のベクターのDNA鋳型が、クローニング、制限消化、ライゲーション、遺伝子合成、及びポリメラーゼ連鎖反応(PCR)などの標準的な分子生物学的方法を含む当該技術分野では周知の方法によって最初に生成される。このDNA鋳型は、RNAに転写されることが望ましい配列の5’末端にRNAポリメラーゼのプロモーターを有している。プロモーターとしては、これらに限定されるものではないが、T3、T7、またはSP6などのバクテリオファージポリメラーゼのプロモーターが挙げられる。次に、DNA鋳型は、適当なRNAポリメラーゼ酵素、バッファー剤、及びヌクレオチド(NTP)とインキュベートされる。得られたRNAポリヌクレオチドは、7-メチルグアノシンまたは関連する構造などの5’キャップ構造の付加、及び任意でポリアデニル化(ポリA)テールを有するように3’末端を改変することを含む(ただしこれらに限定されない)方法によって、任意でさらに改変することができる。次に、RNAをフェノールクロロホルム抽出などの当該技術分野では周知の方法を用いて精製することができる。
ワクチンベクターの設計において考慮すべき重要な側面の1つとして、ベクター自体に対する免疫がある(Riley 2017)。これは、例えば特定のヒトアデノウイルス系などのベクター自体に対する既存の免疫の形である場合もあり、またはワクチンの投与後に生じるベクターに対する免疫の形である場合もある。後者は、例えば別々のプライミング及びブースター投与のように同じワクチンの複数回の投与が行われる場合、または異なる新生抗原カセットを送達するために同じワクチンベクターシステムが用いられるような場合に重要な考慮事項となる。
V.E.1.チンパンジーアデノウイルスによるウイルス送達
チンパンジー由来のアデノウイルスヌクレオチド配列、各種の新規ベクター、及びチンパンジーアデノウイルス遺伝子を発現する細胞株を与えることによって1種類以上の新生抗原を送達する(例えば新生抗原カセットにより)ためのワクチン組成物を調製することができる。チンパンジーC68アデノウイルス(本明細書ではChAdV68とも呼ぶ)のヌクレオチド配列を、新生抗原を送達するためのワクチン組成物中に使用することができる(SEQ ID NO:1を参照)。C68アデノウイルス由来ベクターの使用については米国特許第6,083,716号にさらに詳細に記載されており、当該特許の全容をあらゆる目的で参照によって本明細書に援用する。
本明細書に記載される遺伝子のいずれかにおいて欠失を有する組換えチンパンジーアデノウイルス(Ad)を作製するため、欠失させた遺伝子領域の機能(ウイルスの複製及び感染性に不可欠である場合)をヘルパーウイルスまたは細胞株(すなわち、相補性またはパッケージング細胞株)によって組換えウイルスに供給することができる。例えば、複製欠損チンパンジーアデノウイルスベクターを作製するには、ヒトまたはチンパンジーアデノウイルスのE1遺伝子産物を発現する細胞株を使用することができ、そのような細胞株にはHEK293またはその変異体が含まれうる。チンパンジーE1遺伝子を発現する細胞株の作製のプロトコール(米国特許第6,083,716号の実施例3及び4)にしたがって任意の選択されたチンパンジーアデノウイルス遺伝子を発現する細胞株を作製することができる。
本明細書に開示される組成物は、少なくとも1種類の新生抗原を細胞に送達するウイルスベクターを含むことができる。かかるベクターは、C68のようなチンパンジーアデノウイルスDNA配列と、カセットを直接発現するための調節配列に機能的に連結された新生抗原カセットとを含む。C68ベクターは、感染した哺乳動物細胞内でカセットを発現することが可能である。C68ベクターは1つ以上のウイルス遺伝子に機能的欠失を有することができる。新生抗原カセットは、プロモーターなどの1つ以上の調節配列の制御下にある少なくとも1つの新生抗原を含む。任意選択的なヘルパーウイルス及び/またはパッケージング細胞株によって、チンパンジーウイルスベクターに、欠失させたアデノウイルス遺伝子の任意の必要な産物を供給することができる。
本発明において有用なチンパンジーアデノウイルスC68ベクターには、組換え欠損アデノウイルス、すなわち、E1aまたはE1b遺伝子に機能的欠失を有し、任意で例えば温度感受性変異または他の遺伝子における欠失などの他の変異を有するチンパンジーアデノウイルス配列が含まれる。これらのチンパンジー配列は、他のアデノウイルス及び/またはアデノ随伴ウイルス配列からハイブリッドベクターを形成するうえでも有用であると予想される。ヒトアデノウイルスから調製された同種アデノウイルスベクターについては、刊行文献に記載されている[例えば、上記に引用のKozarsky I及びII、ならびに同文献に引用された参照文献、米国特許第5,240,846号を参照]。
最小チンパンジーAd C68ウイルスとしては、複製及びビリオンのカプシド形成に必要なアデノウイルスのシスエレメントのみを含むウイルス粒子がある。すなわち、このベクターは、アデノウイルスのシス作用性の5’及び3’の末端逆位繰り返し配列(ITR)(複製起点として機能する)と、天然の5’パッケージング/エンハンサードメイン(直鎖状のAdのゲノム及びE1プロモーターのエンハンサーエレメントをパッケージングするために必要な配列を含む)とを含む。例えば、国際出願第WO96/13597号において「最小」ヒトAdベクターの調製について述べられ、本明細書に参照によって援用する方法を参照されたい。
組換え複製不全アデノウイルスは、最小チンパンジーアデノウイルス配列以上のものを含んでもよい。これらの他のAdベクターは、ウイルスの遺伝子領域の異なる部分の欠失、ならびに、必要に応じたヘルパーウイルス及び/またはパッケージング細胞株の使用によって形成される感染性ウイルス粒子によって特徴づけることができる。
新生抗原カセットを送達するために用いられるウイルスベクターのチンパンジーアデノウイルス遺伝子の含量に応じて、ヘルパーアデノウイルスまたは非複製ウイルスフラグメントを用いて、カセットを含む感染性の組換えウイルス粒子を生成するのに充分なチンパンジーアデノウイルス遺伝子配列を与えることができる。
アデノウイルス、新生抗原カセット、及び他のベクター因子の選択されたDNA配列の様々な中間プラスミド及びシャトルベクターへのアセンブリ、ならびに組換えウイルス粒子を作製するためのプラスミド及びシャトルベクターの使用は、従来の手法を用いてすべて実現することができる。かかる手法としては、従来のcDNAのクローニング法、インビトロ組換え法(例えば、ギブソンアセンブリ)、アデノウイルスゲノムの重複するオリゴヌクレオチド配列の使用、ポリメラーゼ連鎖反応、及び所望のヌクレオチド配列を与える任意の適当な方法が挙げられる。標準的なトランスフェクション及び同時トランスフェクションの手法、例えば、CaPO4沈殿法またはリポフェクタミンなどのリポソーム媒介トランスフェクション法が用いられる。用いられる他の従来の方法としては、ウイルスゲノムの相同組み換え、アガーオーバーレイ中でのウイルスのプラーク形成、シグナル発生測定の方法などが挙げられる。
したがって、新生抗原カセットを含む得られた組換えチンパンジーC68アデノウイルス(上記に述べたように、アデノウイルスベクターとヘルパーウイルスとの協同、またはアデノウイルスベクターとパッケージング細胞株との協同により作製される)は、新生抗原(複数可)をインビボまたはエクスビボで対象に送達することができる効率的な遺伝子導入担体を与えるものである。
本明細書に開示する方法を用いて特定された複数の新生抗原などの1つ以上の新生抗原を対象に投与することにより、対象に腫瘍特異的な免疫応答を誘導し、腫瘍に対するワクチン接種を行い、対象のがんの症状を治療及び/または緩和する方法も提供される。
ワクチン接種プロトコールを用いて対象に1つ以上の新生抗原を投与することができる。プライミングワクチン及びブースターワクチンを用いて対象への投与を行うことができる。プライミングワクチンは、C68(例えば、SEQ ID NO:1または2に示される配列)またはsrRNA(例えば、SEQ ID NO:3または4に示される配列)に基づいたものとすることができ、ブースターワクチンは、C68(例えば、SEQ ID NO:1または2に示される配列)またはsrRNA(例えば、SEQ ID NO:3または4に示される配列)に基づいたものとすることができる。各ベクターは、通常、新生抗原を含むカセットを含んでいる。カセットは、各抗原を通常取り囲む天然の配列、またはAAYなどの他の非天然のスペーサー配列などのスペーサーによって分離された約20個の新生抗原を含むことができる。カセットは、破傷風トキソイド抗原などのMHCII抗原、及びユニバーサルなクラスII抗原とみなされるPADRE抗原を含んでもよい。カセットは、ユビキチンターゲティング配列などのターゲティング配列を含んでもよい。さらに、各ワクチン用量は、チェックポイント阻害剤(CPI)と組み合わせて(例えば、同時、その前、またはその後で)対象に投与することができる。CPIは、抗体またはその抗原結合部分など、CTLA4、PD1、及び/またはPDL1を阻害するものを含むことができる。かかる抗体としては、トレメリムマブまたはデュルバルマブを挙げることができる。
VIII.A.新生抗原候補の特定
腫瘍及び正常のエクソーム及びトランスクリプトームのNGS解析のための研究法を、新生抗原の特定のスペースに記載し、適用している6,14,15。下記の例は、臨床設定における新生抗原の特定について、より大きな感度及び特異性のためのある特定の最適化を考慮している。これらの最適化は、実験室プロセスに関連するもの及びNGSデータ解析に関連するものの、2つの区域にグループ化することができる。
本明細書に提示したプロセスの改善は、標的とされるがんパネルにおける信頼できるがんドライバー遺伝子の評価について開発された概念16を、新生抗原の特定のために必要な全エクソーム設定及び全トランスクリプトーム設定に拡大することによって、低い腫瘍含量及び少ない体積の臨床標本からの高精度の新生抗原の発見における難題に対処する。具体的には、これらの改善は、以下を含む:
1.低い腫瘍含量またはサブクローン状態のいずれかにより、低い変異体アレル頻度で存在する変異を検出するための、腫瘍エクソームにわたる深い(500xよりも大きい)固有の平均カバレッジのターゲティング。
2.可能性のある新生抗原の見逃しが最も少ないように、100x未満でカバーされる塩基が5%未満である、例として、
a. 個々のプローブQCを有するDNAベースの捕捉プローブの使用17
b.十分にカバーされていない領域についての追加的なベイトの包含
3.可能性のある新生抗原が体細胞性/生殖細胞系列ステータスについて分類されていないままである(したがってTSNAとして使用可能ではない)ことが最も少ないように、20x未満でカバーされる塩基が5%未満である、正常エクソームにわたる均一カバレッジのターゲティング。
4.必要とされるシークエンシングの総量を最小化するために、配列捕捉プローブは、非コードRNAは新生抗原を生じることができないことから、遺伝子のコード領域のみについて設計される。追加的な最適化は、以下を含む:
a.GCリッチであり、標準的なエクソームシークエンシングでは十分に捕捉されないHLA遺伝子についての補充的プローブ18。
b.不十分な発現、プロテアソームによる最適に満たない消化、または異例の配列特性などの要因により、候補新生抗原を少ししかまたは全く生成しないと予測される遺伝子の排除。
5.変異検出、遺伝子及びスプライス変異体(「アイソフォーム」)発現の定量、ならびに融合物検出を可能にするために、腫瘍RNAが同様に、高深度(100Mリードよりも大きい)でシークエンシングされる。FFPE試料由来のRNAは、DNAにおいてエクソームを捕捉するために使用されるのと同じまたは類似したプローブで、プローブベース濃縮19を用いて抽出される。
解析法の改善は、一般的な研究変異コーリングアプローチの最適に満たない感度及び特異性に対処し、具体的には、臨床設定における新生抗原の特定のために関連するカスタマイズ化を考慮する。これらは、以下を含む:
1.アラインメントのための、HG38参照ヒトゲノムまたはより後のバージョンの使用(それが、以前のゲノムリリースとは対照的に、集団多型をより良好に反映する複数のMHC領域アセンブリーを含有するため)。
2.様々なプログラム5からの結果をマージすることによる、単一変異コーラー20の限界の克服。
a.単一ヌクレオチド変異及び挿入欠失は、以下を含む一連のツールで、腫瘍DNA、腫瘍RNA、及び正常DNAから検出される:Strelka21及びMutect22などの、腫瘍及び正常DNAの比較に基づくプログラム;ならびに、低純度の試料において特に有利である23、UNCeqRなどの、腫瘍DNA、腫瘍RNA、及び正常DNAを組み入れるプログラム。
b.挿入欠失は、Strelka及びABRA24などの、局所リアセンブリーを行うプログラムで決定される。
c.構造的再編成は、Pindel25またはBreakseq26などの専用のツールを用いて決定される。
3.試料スワップを検出して阻止するために、同じ患者についての試料由来の変異コールが、選ばれた数の多型部位で比較される。
4.例として、以下による、人工的コールの広範囲のフィルタリングが行われる:
a.潜在的に、低いカバレッジの例においては緩やかな検出パラメータで、及び挿入欠失の例においては許容的な近接基準での、正常DNAにおいて見出される変異の除去。
b.低いマッピング品質または低い塩基品質による変異の除去27。
c.たとえ対応する正常において観察されないとしても、再出現するシークエンシングアーチファクトから生じる変異の除去27。例は、主として1本の鎖上に検出される変異を含む。
d.無関連の対照のセットにおいて検出される変異の除去27。
5.seq2HLA28、ATHLATES29、またはOptitypeのうちの1つを使用する、かつまた、エクソーム及びRNAシークエンシングデータを組み合わせる28、正常エクソームからの正確なHLAコーリング。追加的な潜在的最適化は、ロングリードDNAシークエンシングなどの、HLAタイピングのための専用アッセイの採用30、または、RNA断片を連結して連続性を保持するための方法の適応31を含む。
6.腫瘍特異的スプライス変異体から生じた新生ORFの堅牢な検出は、CLASS32、Bayesembler33、StringTie34、またはそのリファレンスガイドモードにおける類似したプログラム(すなわち、各実験からそれらの全体の転写産物を再作製するように試みるよりもむしろ、公知の転写産物構造を用いる)を用いて、RNA-seqデータから転写産物をアセンブルすることによって、行われる。Cufflinks35が、この目的で一般的に使用されるが、それは頻繁に、信じ難いほど多数のスプライス変異体を産生し、それらの多くは、完全長遺伝子よりもはるかに短く、単純な陽性対照をリカバーすることができない場合がある。コード配列及び潜在的なナンセンス変異依存分解機構は、変異体配列を再導入した、SpliceR36及びMAMBA37などのツールで決定される。遺伝子発現は、Cufflinks35またはExpress(Roberts and Pachter,2013)などのツールで決定される。野生型及び変異体特異的な発現カウント及び/または相対レベルは、ASE38またはHTSeq39などの、これらの目的で開発されたツールで決定される。潜在的なフィルタリング段階は、以下を含む:
a.不十分に発現されていると考えられる候補新生ORFの除去。
b.ナンセンス変異依存分解機構(NMD)を引き起こすと予測される候補新生ORFの除去。
7.腫瘍特異的と直接検証することができない、RNAにおいてのみ観察される候補新生抗原(例えば、新生ORF)は、例として以下を考慮することにより、追加的なパラメータにしたがって、腫瘍特異的である可能性が高いとして分類される:
a.腫瘍DNAのみのシス作用性フレームシフトまたはスプライス部位変異の支持の存在。
b.スプライシング因子における腫瘍DNAのみのトランス作用性変異の確証の存在。例として、R625変異体SF3B1での3つの独立して公開された実験において、最も差次的にスプライシングを呈する遺伝子は、1つの実験がブドウ膜黒色腫患者を検討し40、第2の実験がブドウ膜黒色腫細胞株を検討し41、及び第3の実験が乳がん患者を検討した42にもかかわらず、一致していた。
c.新規のスプライシングアイソフォームについては、RNASeqデータにおける「新規の」スプライス-ジャンクションリードの確証の存在。
d.新規の再編成については、正常DNAには存在しない腫瘍DNAにおけるエクソン近傍リードの確証の存在。
e.GTEx43などの遺伝子発現大要からの欠如(すなわち、生殖細胞系列起源の可能性をより低くする)。
8.アラインメント及びアノテーションベースのエラー及びアーチファクトを直接避けるために、アセンブルされたDNAの腫瘍及び正常リード(またはそのようなリード由来のkマー)を比較することによる、参照ゲノムアラインメントベースの解析の補完(例えば、生殖細胞系列変異またはリピートコンテクスト挿入欠失の近くに生じる体細胞性変異について)。
HLAペプチド分子の単離は、組織試料の溶解及び可溶化後に、古典的な免疫沈降(IP)法を用いて行った(55~58)。清澄化した溶解物を、HLA特異的IPに使用した。
免疫沈降は、ビーズに共有結合されていない抗体を用いて行うこともできる。一般的に、これは、抗体をカラムに保持するためにProteinA及び/またはProteinGでコーティングしたセファロースまたは磁気ビーズを使用して行われる。MHC/ペプチド複合体を選択的に濃縮するために使用することができるいくつかの抗体を下記に示す。
ペプチドYVYVADVAAK(SEQ ID NO:59)を用いて、何が検出の限界かを、LCカラム上にロードした様々な量のペプチドを用いて決定した。試験したペプチドの量は、1pmol、100fmol、10fmol、1fmol、及び100amolであった。(表1)結果を図1Fに示す。これらの結果は、検出の最低限界(LoD)がアトモルの範囲(10-18)にあること、ダイナミックレンジが5桁に及ぶこと、及び、シグナル対ノイズが、低いフェムトモル範囲(10-15)でシークエンシングに十分であるように見えることを示す。
IX.A.システムの概要
図2Aは、1つの実施形態にしたがう、患者におけるペプチド提示の尤度を特定するための環境100の概要である。環境100は、それ自体が提示情報記憶装置165を含む提示特定システム160を導入するコンテクストを提供する。
図2は、1つの実施形態にしたがう、提示情報を取得する方法を説明する。提示情報165は、2つの一般的部類の情報:アレル相互作用情報及びアレル非相互作用情報を含む。アレル相互作用情報は、MHCアレルのタイプに依存する、ペプチド配列の提示に影響を及ぼす情報を含む。アレル非相互作用情報は、MHCアレルのタイプに非依存的な、ペプチド配列の提示に影響を及ぼす情報を含む。
アレル相互作用情報は、主として、ヒト、マウスなど由来の1つ以上の特定されたMHC分子によって提示されていることが公知である、特定されたペプチド配列を含む。注目すべきことに、これは、腫瘍試料から取得されたデータを含んでもよく、または含まなくてもよい。提示されたペプチド配列は、単一のMHCアレルを発現する細胞から特定されてもよい。この例において、提示されたペプチド配列は、概して、あらかじめ決定されたMHCアレルを発現するように操作されてその後合成タンパク質に曝露された単一アレル細胞株から収集される。MHCアレル上に提示されたペプチドは、酸溶出などの技法によって単離され、質量分析により特定される。図2Bは、あらかじめ決定されたMHCアレルHLA-A*01:01上に提示された例示的なペプチドYEMFNDKS(SEQ ID NO:60)が単離され、質量分析により特定される、この例を示す。図2Dは、この別の例を示し、あらかじめ決定されたMHCアレルHLA-DRB1*12:01上に提示された例示的ペプチド
が単離され、質量分析によって特定されている。これらの状況においては、ペプチドが、単一のあらかじめ決定されたMHCタンパク質を発現するように操作された細胞を通して特定されるため、提示されたペプチドとそれが結合したMHCタンパク質との間の直接の関連が、決定的に既知である。
が、特定されたMHCアレルHLA-A*01:01、HLA-A*02:01、HLA-B*07:02、HLA-B*08:01、HLA-C*01:03、及びHLA-C*01:04上に提示されており、単離され、質量分析により特定される、この例を示す。別の例において、図2Cは、6種類の例示的なペプチド
が、特定されたクラスI MHCアレルHLA-A*01:01、HLA-A*02:01、HLA-B*07:02、HLA-B*08:01、及びクラスII MHCアレルHLA-DRB1*10:01、HLA-DRB1:11:01上に提示され、単離され、質量分析によって特定される場合を示している。単一アレル細胞株とは対照的に、これらの例においては、結合したペプチドが、特定される前のMHC分子から単離されるため、提示されたペプチドとそれが結合したMHCタンパク質との間の直接の関連は、未知である可能性がある。
とクラスIIアレルHLA-DRB1:11:01との間の結合親和性予測値を含み得る。
アレル非相互作用情報は、その由来源タンパク質配列内の、新生抗原コード化ペプチドに隣接するC末端配列を含むことができる。MHC-Iでは、C末端フランキング配列は、ペプチドのプロテアソームプロセシングに影響を及ぼし得る。しかし、C末端フランキング配列は、ペプチドが小胞体に輸送され、細胞の表面上のMHCアレルと遭遇する前に、プロテアソームによってペプチドから切断される。その結果、MHC分子は、C末端フランキング配列についてのいかなる情報も受け取らず、したがって、C末端フランキング配列の効果は、MHCアレルタイプに応じて変動することができない。例えば、図2Cに示した例に戻ると、提示情報165は、ペプチドの由来源タンパク質から特定された、提示されたペプチドFJIEJFOESS(SEQ ID NO: 64)のC末端フランキング配列FOEIFNDKSLDKFJI(SEQ ID NO:69)を含み得る。
i.EGFR、KRAS、ALK、RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3などの公知のがんドライバー遺伝子におけるドライバー変異。
ii.抗原提示マシナリーに関与するタンパク質をコードする遺伝子(例えば、B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5、または、プロテアソームもしくはイムノプロテアソームの構成要素をコードする遺伝子のいずれか)におけるもの。その提示が、腫瘍において機能喪失変異の影響下にある抗原提示マシナリーの構成要素に依拠するペプチドは、提示の確率が低減している。
i.抗原提示マシナリーに関与するタンパク質をコードする遺伝子(例えば、B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5、または、プロテアソームもしくはイムノプロテアソームの構成要素をコードする遺伝子のいずれか)におけるもの。
図3は、1つの実施形態による、提示特定システム160のコンピュータ論理構成要素を説明する、ハイレベルブロック図である。この例示的実施形態において、提示特定システム160は、データ管理モジュール312、コード化モジュール314、訓練モジュール316、及び予測モジュール320を含む。提示特定システム160はまた、訓練データ記憶装置170及び提示モデル記憶装置175から構成される。モデル管理システム160のいくつかの実施形態は、本明細書に記載したものとは異なるモジュールを有する。同様に、機能は、本明細書に記載したものは異なる様式で、モジュールの間に分配され得る。
データ管理モジュール312は、提示情報165から訓練データ170のセットを生成する。各々の訓練データのセットは、多数のデータ例を含有し、各データ例iは、少なくとも、提示されるかまたは提示されないペプチド配列piと、ペプチド配列piと結合した1つ以上の関連するMHCアレルaiと、提示特定システム160が、独立変数の新たな値を予測することに関心があるという情報を表す従属変数yiとを含む、独立変数ziのセットを含有する。
からのペプチド提示情報を示す。訓練データ170A中の4番目のデータ例は、アレルHLA-B*07:02、HLA-C*01:03、HLA-A*01:01を含む複数アレル細胞株、及びペプチド配列QIEJOEIJE(SEQ ID NO:73)からのペプチド情報を示す。最初のデータ例は、ペプチド配列QCEIOWARE(SEQ ID NO:70)が、アレルHLA-C*01:03によって提示されなかったことを示す。前の2つの段落において議論したように、ペプチド配列は、データ管理モジュール312によってランダムに生成されてもよく、または提示されるペプチドの由来源タンパク質から特定されてもよい。訓練データ170Aはまた、ペプチド配列-アレルペアについて、1000nMの結合親和性予測値及び1時間の半減期の安定性予測値も含む。訓練データ170Aはまた、ペプチド
のC末端フランキング配列、及び102TPMのmRNA定量測定値などの、アレル非相互作用変数も含む。4番目のデータ例は、ペプチド配列QIEJOEIJE(SEQ ID NO:73)が、アレルHLA-B*07:02、HLA-C*01:03、またはHLA-A*01:01のうちの1つによって提示されたことを示す。訓練データ170Aはまた、アレルの各々についての結合親和性予測値及び安定性予測値、ならびに、ペプチドのC末端フランキング配列及びペプチドについてのmRNA定量測定値も含む。
を含む、単一アレル細胞株からのペプチド提示情報を示す。1番目のデータ例は、ペプチド配列
がアレルHLA-DRB3:01:01によって提示されなかったことを示す。
コード化モジュール314は、訓練データ170に含有される情報を、1つ以上の提示モデルを生成するために使用することができる数値的表示へとコード化する。一実現形態では、コード化モジュール314は、配列(例えば、ペプチド配列またはC末端隣接配列)を、あらかじめ決定された20文字のアミノ酸アルファベットについて、ワン・ホットでコード化する。具体的には、ki個のアミノ酸を有するペプチド配列piは、20・ki要素の行ベクトルとして表され、ペプチド配列のj番目の位置のアミノ酸のアルファベットに対応するpi 20・(j-1)+1,pi 20・(j-1)+2,...,pi 20・jの中の単一要素は、1の値を有する。その以外の、残りの要素は、0の値を有する。例として、所定のアルファベット{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y}について、データ例iの3個のアミノ酸のペプチド配列EAFは、60個の要素の行ベクトル
によって表され得る。C末端隣接配列ci、ならびに、MHCアレルについてのタンパク質配列dh、及び提示情報における他の配列データは、同様に、上記のようにコード化することができる。
によって表され得る。C末端隣接配列ciまたは他の配列データは、同様に、上記のようにコード化することができる。したがって、ペプチド配列piまたはciにおける各々の独立変数または列は、配列の特定の位置の特定のアミノ酸の存在を表す。
と同等の行ベクトルとして表し得、bh iは、ペプチドpi及び関連するMHCアレルhについての結合親和性予測値であり、同様に、sh iは、安定性についてのものである。あるいは、アレル相互作用変数の1つ以上の組み合わせは、個々に(例えば、個々のベクトルまたは行列として)保存されてもよい。
(ただし、
はインジケータ関数であり、Lkはペプチドpkの長さを意味する)として表す。ベクトルTkは、アレル相互作用変数xh iに含まれうる。別の例では、クラスIIMHC分子によって提示されるペプチドについて、コード化モジュール314は、ペプチド長をベクトル
(ただし、
は、インジケータ関数であり、Lkは、ペプチドpkの長さを示す)として表す。ベクトルTkを、アレル相互作用変数xh iに含めることができる。
訓練モジュール316は、ペプチド配列に関連するMHCアレルによってペプチド配列が提示されるかどうかの尤度を生成する、1つ以上の提示モデルを構築する。具体的には、ペプチド配列pk及びペプチド配列pkに関連するMHCアレルakのセットを与えられ、各提示モデルは、ペプチド配列pkが、関連するMHCアレルakのうちの1つ以上によって提示されるであろう尤度を示す、推定値ukを生成する。
訓練モジュール316は、165に保存された提示情報から生成された、記憶装置170に保存された訓練データセットに基づいて、1つ以上の提示モデルを構築する。概して、提示モデルの具体的なタイプに関わらず、提示モデルのすべては、損失関数が最小化されるように、訓練データ170における独立変数と従属変数との間の依存性を捕捉する。具体的には、損失関数
は、訓練データ170における1つ以上のデータ例Sについての従属変数yi∈Sの値と、提示モデルによって生成されたデータ例Sについての推定された尤度ui∈Sとの間の矛盾を表す。本明細書の残りの部分を通じて言及される1つの特定の実現形態において、損失関数
は、以下のような等式(1a)によって与えられる負のlog尤度関数である。
しかし、実際には、別の損失関数が使用されてもよい。例えば、質量分析イオン電流について予測がなされる場合、損失関数は、以下のような等式1bによって与えられる平均二乗損失である。
を最小化するパラメトリックタイプの提示モデルの種々のパラメータは、例えば、バッチ勾配アルゴリズム、確率的勾配アルゴリズムなどの、勾配ベースの数値的最適化アルゴリズムを通して決定される。あるいは、提示モデルは、モデル構造が、訓練データ170から決定され、固定されたパラメータのセットに厳密には基づかない、ノンパラメトリックモデルであり得る。
訓練モジュール316は、アレルごとベースでペプチドの提示尤度を予測するための提示モデルを構築し得る。この例において、訓練モジュール316は、単一のMHCアレルを発現する細胞から生成された訓練データ170におけるデータ例Sに基づいて、提示モデルを訓練し得る。
によって、特定のアレルhについてのペプチドpkの推定提示尤度ukをモデル化し、ただし、ペプチド配列xh kは、ペプチドpk及び対応するMHCアレルhについてのコード化されたアレル相互作用変数を意味し、f(・)は、任意の関数であり、記載の便宜上、本明細書中を通して変換関数と呼ばれる。さらに、gh(・)は、任意の関数であり、記載の便宜上、本明細書中を通して依存性関数と呼ばれ、MHCアレルhについて決定されたパラメータθhのセットに基づいて、アレル相互作用変数xh kについての依存性スコアを生成する。各MHCアレルhについてのパラメータθhのセットの値は、θhに関する損失関数を最小化することによって決定することができ、ここでiは、単一のMHCアレルhを発現する細胞から生成された訓練データ170のサブセットSにおける各例である。
によって与えられるexpit関数である。
別の例として、f(・)はまた、ドメインzの値が0以上である場合、
によって与えられる双曲線正接関数であることもできる。あるいは、予測が、範囲[0,1]の外側の値を有する質量分析イオン電流についてなされる場合、f(・)は、例えば、恒等関数、指数関数、log関数などの任意の関数であることができる。
によって与えられるアフィン関数である。
によって与えられるネットワーク関数である。ノードは、パラメータθhのセットにおける関連するパラメータを各々有する接続を通して、他のノードに接続され得る。1つの特定のノードでの値は、特定のノードに関連する活性化関数によってマッピングされた関連するパラメータによって重み付けられた、特定のノードに接続されたノードの値の和として表され得る。アフィン関数と対照的に、ネットワークモデルは、提示モデルが非線形性、及び異なる長さのアミノ酸配列を有するプロセスデータを組み入れることができるため、有利である。具体的には、非線形モデリングを通して、ネットワークモデルは、ペプチド配列中の異なる位置のアミノ酸間の相互作用、及びこの相互作用がペプチド提示にいかに影響を及ぼすかを捕捉することができる。
として表すことができ、式中、g’h(xh k;θ’h)は、パラメータθ’hのセットを伴うアフィン関数、ネットワーク関数などであり、MHCアレルhについての提示のベースライン確率を表す、MHCアレルのアレル相互作用変数についてのパラメータのセットにおけるバイアスパラメータθh 0を伴う。
によって生成することができ、式中、x3kは、MHCアレルh=3について特定されたアレル相互作用変数であり、θ3は、損失関数最小化を通してMHCアレルh=3について決定されたパラメータのセットである。
によって生成することができ、式中、x3 kは、MHCアレルh=3について特定されたアレル相互作用変数であり、θ3は、MHCアレルh=3に関連するネットワークモデルNN3(・)について決定されたパラメータのセットである。
一実現形態では、訓練モジュール316は、アレル非相互作用変数を組み入れて、
によって、ペプチドpkの推定提示尤度ukをモデル化し、式中、wkは、ペプチドpkについてのコード化されたアレル非相互作用変数を意味し、gw(・)は、アレル非相互作用変数について決定されたパラメータθwのセットに基づく、アレル非相互作用変数wkについての関数である。具体的には、各MHCアレルhについてのパラメータθhのセット及びアレル非相互作用変数についてのパラメータθwのセットの値を、θh及びθwに関する損失関数を最小化することによって決定することができ、iは、単一のMHCアレルを発現する細胞から生成された訓練データ170のサブセットSにおける各例である。
によって与えられ得る。
アレル相互作用変数についての依存性関数gh(・)と同様に、アレル非相互作用変数についての依存性関数gw(・)は、アフィン関数、または別々のネットワークモデルがアレル非相互作用変数wkに関連しているネットワーク関数であり得る。
によって与えられるネットワーク関数であってもよい。このネットワーク関数は、異なるアレル完全非相互作用変数を入力としてそれぞれ取る1つ以上のネットワークモデルも含み得る。
によって与えられ得、式中、g’w(wk;θ’w)は、アレル非相互作用パラメータθ’wのセットを伴うアフィン関数、ネットワーク関数などであり、mkは、ペプチドpkについてのmRNA定量測定値であり、h(・)は、定量測定値を変換する関数であり、かつθw mは、mRNA定量測定値についての依存性スコアを生成するようにmRNA定量測定値と組み合わされる、アレル非相互作用変数についてのパラメータのセットにおけるパラメータである。本明細書の残りの部分を通じて言及される1つの特定の実施形態において、h(・)はlog関数であるが、実際には、h(・)は、様々な異なる関数のうちのいずれか1つであり得る。
によって与えられ、式中、g’w(wk;θ’w)は、アレル非相互作用パラメータθ’wのセットを伴うアフィン関数、ネットワーク関数などであり、okは、ペプチドpkについてヒトプロテオームにおけるタンパク質及びアイソフォームを表す上記の指標ベクトルであり、かつθw oは、指標ベクトルと組み合わされるアレル非相互作用変数についてのパラメータのセットにおける、パラメータのセットである。1つのバリエーションにおいて、ok及びパラメータθw oのセットの次元が有意に高い場合、
(
は、L1ノルム、L2ノルム、組み合わせなどを表す)などのパラメータ正則化項を、パラメータの値を決定する時に損失関数に加えることができる。ハイパーパラメータλの最適値を、適切な方法を通して決定することができる。
ただし、g’w(wk;θ’w)は、アレル非相互作用パラメータθ’wのセットを伴うアフィン関数、ネットワーク関数などであり、
は、ペプチドpkがアレル非相互作用変数に関して上記に述べたソース遺伝子lに由来するものである場合に1に等しいインジケータ関数であり、θw lはソース遺伝子lの「抗原性」を示すパラメータである。1つのバリエーションにおいて、Lが充分に大きく、したがって、パラメータの数θw l=1, 2,...,Lが充分に大きい場合、
のようなパラメータ正則化項(ただし、
は、L1ノルム、L2ノルム、組み合わせなど)をパラメータの値を決定する際に損失関数に加えることができる。ハイパーパラメータλの最適値は適当な方法によって決定することができる。
によって生成することができ、式中、wkは、ペプチドpkについて特定されたアレル非相互作用変数であり、θwは、アレル非相互作用変数について決定されたパラメータのセットである。
によって生成することができ、式中、wkは、ペプチドpkについて特定されたアレル相互作用変数であり、θwは、アレル非相互作用変数について決定されたパラメータのセットである。
訓練モジュール316はまた、2つ以上のMHCアレルが存在する複数アレル設定においてペプチドの提示尤度を予測するための提示モデルを構築し得る。この例において、訓練モジュール316は、単一のMHCアレルを発現する細胞、複数のMHCアレルを発現する細胞、またはそれらの組み合わせから生成された訓練データ170におけるデータ例Sに基づいて、提示モデルを訓練し得る。
一実現形態では、訓練モジュール316は、複数のMHCアレルHのセットに関連したペプチドpkの推定提示尤度ukを、等式(2)~(11)と共に上記で説明したような、単一アレルを発現する細胞に基づいて決定されたセットHにおけるMHCアレルhの各々について決定された提示尤度uk h∈Hの関数としてモデル化する。具体的には、提示尤度ukは、uk h∈Hの任意の関数であることができる。一実現形態では、等式(12)に示すように、関数は最大値関数であり、提示尤度ukは、セットHにおける各MHCアレルhについての提示尤度の最大値として決定することができる。
一実現形態では、訓練モジュール316は、ペプチドpkの推定提示尤度ukを、
によってモデル化し、式中、要素ah kは、ペプチド配列pkに関連する複数のMHCアレルHについて1であり、xh kは、ペプチドpk及び対応するMHCアレルについてのコード化されたアレル相互作用変数を意味する。各MHCアレルhについてのパラメータθhのセットの値は、θhに関する損失関数を最小化することによって決定することができ、iは、単一のMHCアレルを発現する細胞及び/または複数のMHCアレルを発現する細胞から生成された訓練データ170のサブセットSにおける各例である。依存性関数ghは、セクションX.B.1.において上記で導入された依存性関数ghのいずれかの形態であり得る。
によって生成することができ、式中、x2 k、x3 kは、MHCアレルh=2、h=3について特定されたアレル相互作用変数であり、θ2、θ3は、MHCアレルh=2、h=3について決定されたパラメータのセットである。
によって生成することができ、式中、NN2(・)、NN3(・)は、MHCアレルh=2、h=3について特定されたネットワークモデルであり、θ2、θ3は、MHCアレルh=2、h=3について決定されたパラメータのセットである。
一実現形態では、訓練モジュール316は、アレル非相互作用変数を組み入れて、
によって、ペプチドpkの推定提示尤度ukをモデル化し、式中、wkは、ペプチドpkについてのコード化されたアレル非相互作用変数を意味する。具体的には、各MHCアレルhについてのパラメータθhのセット及びアレル非相互作用変数についてのパラメータθwのセットの値を、θh及びθwに関する損失関数を最小化することによって決定することができ、iは、単一のMHCアレルを発現する細胞及び/または複数のMHCアレルを発現する細胞から生成された訓練データ170のサブセットSにおける各例である。依存性関数gwは、セクションX.B.3.において上記で導入された依存性関数gwのいずれかの形態であり得る。
によって生成することができ、式中、wkは、ペプチドpkについて特定されたアレル非相互作用変数であり、θwは、アレル非相互作用変数について決定されたパラメータのセットである。
によって生成することができ、式中、wkは、ペプチドpkについて特定されたアレル相互作用変数であり、θwは、アレル非相互作用変数について決定されたパラメータのセットである。
によって与えられ得る。
別の実現形態において、訓練モジュール316は、ペプチドpkの推定提示尤度ukを、
によってモデル化し、式中、要素ah kは、ペプチド配列pkに関連する複数のMHCアレルh∈Hについて1であり、u’k hは、MHCアレルhについての暗黙のアレルごと提示尤度であり、ベクトルvは、要素vhが、ah k・・・u’k hに対応するベクトルであり、s(・)は、vの要素をマッピングする関数であり、かつr(・)は、入力の値を所定の範囲中にクリップするクリッピング関数である。より詳細に下記に記載するように、s(・)は、総和関数または二次関数であってもよいが、他の実施形態において、s(・)は、最大値関数などの任意の関数であり得ることが認識される。暗黙のアレルごと尤度についてのパラメータθのセットの値は、θに関する損失関数を最小化することによって決定することができ、iは、単一のMHCアレルを発現する細胞及び/または複数のMHCアレルを発現する細胞から生成された訓練データ170のサブセットSにおける各例である。
r(z)=min(max(z,0),1)
であってもよく、zと1の間の最小値が、提示尤度ukとして選ばれる。別の実現形態において、r(・)は、
r(z)=tanh(z)
として与えられる双曲線正接関数であり、ドメインzの値は、0以上である。
によって生成することができ、式中、x2 k、x3 kは、MHCアレルh=2、h=3について特定されたアレル相互作用変数であり、θ2、θ3は、MHCアレルh=2、h=3について決定されたパラメータのセットである。
によって生成することができ、式中、NN2(・)、NN3(・)は、MHCアレルh=2、h=3について特定されたネットワークモデルであり、θ2、θ3は、MHCアレルh=2、h=3について決定されたパラメータのセットである。
1つの実現形態では、MHCアレルhについての暗黙のアレルごと提示尤度を、
によって生成して、提示尤度が、
によって生成されるようにして、ペプチド提示に、アレル非相互作用変数の影響を組み入れる。
によって生成することができ、式中、wkは、ペプチドpkについて特定されたアレル非相互作用変数であり、θwは、アレル非相互作用変数について決定されたパラメータのセットである。
によって生成することができ、式中、wkは、ペプチドpkについて特定されたアレル相互作用変数であり、θwは、アレル非相互作用変数について決定されたパラメータのセットである。
一実現形態では、s(・)は、二次関数であり、ペプチドpkの推定提示尤度ukは、
によって与えられ、式中、要素u’k hは、MHCアレルhについての暗黙のアレルごと提示尤度である。暗黙のアレルごと尤度についてのパラメータθのセットの値は、θに関する損失関数を最小化することによって決定することができ、iは、単一のMHCアレルを発現する細胞及び/または複数のMHCアレルを発現する細胞から生成された訓練データ170のサブセットSにおける各例である。暗黙のアレルごと提示尤度は、上記の等式(18)、(20)、及び(22)において示すいずれかの形態であり得る。
によって生成することができ、式中、x2 k、x3 kは、HLAアレルh=2、h=3について特定されたアレル相互作用変数であり、θ2、θ3は、HLAアレルh=2、h=3について決定されたパラメータのセットである。
によって生成することができ、式中、NN2(・)、NN3(・)は、HLAアレルh=2、h=3について特定されたネットワークモデルであり、θ2、θ3は、HLAアレルh=2、h=3について決定されたパラメータのセットである。
予測モジュール320は、配列データを受け取って、提示モデルを用いて配列データ中の候補新生抗原を選択する。具体的には、配列データは、患者の腫瘍組織細胞から抽出されたDNA配列、RNA配列、及び/またはタンパク質配列であってよい。予測モジュール320は、配列データを、MHC-Iについては8~15個のアミノ酸またはMHC-IIについては6~30個のアミノ酸を有する複数のペプチド配列pkに処理する。例えば、予測モジュール320は、所定の配列「IEFROEIFJEF(SEQ ID NO:76)」を、9個のアミノ酸を有する3種類のペプチド配列「IEFROEIFJ(SEQ ID NO:77)」、「EFROEIFJE(SEQ ID NO:78)」、及び「FROEIFJEF(SEQ ID NO:79)」に処理することができる。一実施形態では、予測モジュール320は、患者の正常組織細胞から抽出された配列データをその患者の腫瘍組織細胞から抽出された配列データと比較して1つ以上の変異を有する部分を特定することによって、変異したペプチド配列である候補新生抗原を特定することができる。
XI.B.1 概要
カセット設計モジュール324は、患者に注射するためのv種類の選択された候補ペプチドに基づいてワクチンカセット配列を生成する。具体的には、容量vのワクチンに含まれる選択されたペプチドのセットpk,k=1,2,…,vについて、カセット配列は、それぞれが対応するペプチドpkの配列を含む一連の治療エピトープ配列p’k,k=1,2,…,vの連結鎖によって与えられる。一実施形態では、カセット設計モジュール324は、各エピトープを互いに対して直接隣接するように連結することができる。例えば、あるワクチンカセットCは、
で表すことができる(式中、p’tiは、カセットのi番目のエピトープを示す)。したがって、tiは、カセットのi番目の位置の選択されたペプチドの添え字k=1,2,…,vに対応する。別の実施形態では、カセット設計モジュール324は、隣接するエピトープ間に1つ以上の任意選択的なリンカー配列を有するように各エピトープを連結することができる。例えば、あるワクチンカセットCは、
で表すことができる(式中、l(ti,tj)は、カセットのi番目のエピトープp’tiとj=i+1番目のエピトープp’j=i+1との間に配置されたリンカー配列を示す)。カセット設計モジュール324は、選択されたエピトープp’k,k=1,2,…,vのどれがカセットの異なる位置に配置されるか、及び、各エピトープ間に配置されるすべてのリンカー配列を決定する。カセット配列Cは、本明細書に記載される方法のいずれかに基づいたワクチンとしてロードすることができる。
により与えられる(ただし、h(・)は、各ジャンクションの距離関数をあるスコアにマッピングする特定の関数である)。本明細書の残りの部分を通じて言及される1つの特定の例では、関数h(・)は、カセットの距離関数にわたった総和である。
v×vの行列Dは、非対称距離行列であり、各要素D(k,m),k=1,2,…,v;m=1,2,…,vは、エピトープp’kからエピトープp’mまでのジャンクションの距離関数に対応している。Pの列k=2,…,vは元のエピトープの各ノードに対応し、列1及び行1は、他のすべてのノードからの距離が0である「ゴーストノード」に対応する。行列への「ゴーストノード」の追加は、ワクチンカセットが環状ではなく直鎖状であり、したがって最初のエピトープと最後のエピトープとの間にジャンクションがないという概念を記号化するものである。換言すれば、配列は環状ではなく、最初のエピトープは配列内の最後のエピトープの後に連結されると仮定されない。エピトープp’kがエピトープp’mのN末端に連結され、そうでない場合には0である、方向付けられた経路(すなわち、カセット内のエピトープ-エピトープジャンクション)が存在する場合にxkmがバイナリー変数を示すものとする。さらに、Eが、すべてvの治療ワクチンエピトープのセットを示し、S⊂Eがエピトープのサブセットを示すものとする。任意のかかるサブセットSにおいて、out(S)が、エピトープ-エピトープジャンクションxkm=1の数を示すものとする(ただし、kはS内のエピトープであり、mはE\S内のエピトープである)。既知の経路行列Pが与えられたものとして、カセット設計モジュール324は、以下の整数線形計画問題を解く経路行列Xを見つける。すなわち、
ただし、Pkmは、以下の制約条件の下で、経路行列Pの要素P(k,m)を示す。すなわち、
最初の2つの制約条件は、各エピトープがカセット内にちょうど1回現れることを保証するものである。最後の制約条件は、カセットが連結されていることを保証するものである。換言すれば、xで記号化されたカセットは連結された直鎖状タンパク質配列である。
v=20個の治療エピトープを含む2個のカセット配列を、1,000,000通りの順列のランダムサンプリングにより(カセット配列C1)、また、等式(27)において整数線形計画問題を解くことにより(カセット配列C2)生成した。距離関数、したがって提示スコアを、等式(14)で記述される提示モデルに基づいて求めた(式中、fは、シグモイド関数であり、xh iは、ペプチドpiの配列であり、gh(・)は、ニューラルネットワーク関数であり、wは、フランキング配列、ペプチドpiのlogTPM(transcripts per kilobase million)、ペプチドpiのタンパク質の抗原性、及びペプチドpiの由来源の試料IDを含み、フランキング配列のgw(・)及びlogTPMは、それぞれニューラルネットワーク関数である)。gh(・)のニューラルネットワーク関数のそれぞれは、単一隠れ層の多層パーセプトロン(MLP)の1つの出力ノードを含み、入力次元231(11残基×残基ごとに21文字(pad文字を含む))の幅256、隠れ層での正規化線形ユニット(ReLU)活性化、出力層での線形活性化、及び、訓練データセット内のHLAアレルごとに1個の出力ノードのものであった。フランキング配列のニューラルネットワーク関数は、単一隠れ層MLPで、入力次元210(N末端フランキング配列の5残基+C末端フランキング配列の5残基×残基ごとに21文字(pad文字を含む))、幅32、隠れ層でのReLU活性化、及び出力層での線形活性化のものであった。RNA logTPMのニューラルネットワーク関数は、単一隠れ層MLPで、入力次元1、幅16、隠れ層でのReLU活性化、及び出力層での線形活性化のものであった。HLA-A*02:04、HLA-A*02:07、HLA-B*40:01、HLA-B*40:02、HLA-C*16:02、及びHLA-C*16:04のHLAアレルについて提示モデルを構築した。2個のカセット配列の提示されるジャンクションエピトープの期待数を示す提示スコアを比較した。結果は、等式(27)を解くことによって生成されたカセット配列の提示スコアが、ランダムサンプリングによって生成されたカセット配列の提示スコアよりも約4倍の改善をともなったことを示した。
これは、提示されるジャンクションエピトープの期待数の提示スコアは6.1であった。1,000,000通りのランダム配列の提示スコアの中央値は、18.3であった。実験は、提示されるジャンクションエピトープの期待数が、ランダムにサンプリングされたカセット間でカセット配列を特定することによって大幅に低減されたことを示している。
これは提示スコア1.7であった。カセット配列C2の提示スコアは、カセット配列C1の提示スコアと比較して約4倍の改善を示し、ランダムに生成された1,000,000通りの候補カセットの提示スコアの中央値と比較して約11倍の改善を示した。カセットC1を生成するためのランタイムは、2.30GHzのIntel Xeon E5-2650 CPUのシングルスレッド上で20秒であった。カセットC2を生成するためのランタイムは、同じCPUのシングルスレッド上で1秒であった。したがって、この例では、等式(27)の整数線形計画問題を解くことによって特定されたカセット配列は、20倍低減された計算コストで約4倍良好な解を生成している。
この例では、腫瘍/正常エクソームのシークエンシング、腫瘍トランスクリプトームのシークエンシング、及び肺癌試料のHLAタイピングに基づいて選択されたv=20個の治療エピトープを含むカセット配列を、1,000,000通りの順列のランダムサンプリングにより、さらに等式(27)で整数線形計画問題を解くことによって生成した。距離関数、したがって提示スコアを、HLAペプチドの結合親和性の予測プログラムであるMHCflurryによって予測された、様々な閾値(例えば、50~1000nM、またはこれよりも高いかもしくは低い値)を下回る親和性で患者のHLAに結合するジャンクションエピトープの数に基づいて求めた。この例では、治療エピトープとして選択される20個の非同義体細胞変異を、上記のセクションXI.Bの提示モデルにしたがって変異をランク付けすることによって腫瘍試料で特定された98個の体細胞変異間から選択した。しかしながら、他の実施形態では、治療エピトープは、安定性に基づくものなど、または提示スコア、親和性といった基準の組み合わせなどの他の基準に基づいて選択することもできる点は理解されよう。さらに、ワクチンに含めるための治療エピトープを優先順位付けするために用いられる基準は、カセット設計モジュール324で使用される距離関数D(k,m)を決定するために用いられる基準と同じである必要はない点は理解されよう。
上記の種々の提示モデルの妥当性を、提示モデルを訓練するために使用されなかった訓練データ170のサブセット、または、訓練データ170と類似した変数及びデータ構造を有する訓練データ170とは別々のデータセットであった、試験データTに対して試験した。
であり、これは、HLAアレル上に提示されると予測されたペプチド例の数に対する、関連するHLAアレル上に提示されると正確に予測されたペプチド例の数の比を示す。一実現形態では、試験データTにおけるペプチドpiは、対応する尤度推定値uiが、所定の閾値t以上である場合に、1つ以上の関連するHLAアレル上に提示されると予測された。提示モデルの性能を示す別の関連性のある測定基準は、
であり、これは、HLAアレル上に提示されることが公知であったペプチド例の数に対する、関連するHLAアレル上に提示されると正確に予測されたペプチド例の数の比を示す。提示モデルの性能を示す別の関連性のある測定基準は、受信者動作特性(ROC)の曲線下面積(AUC)である。ROCは、
によって与えられる、偽陽性率(FPR)に対するリコールをプロットする。
図13Aは、複数アレル質量分析データに基づいて、ペプチド提示予測について、本明細書において提示するような例示的な提示モデル、及び従来の技術水準モデルの性能結果を比較する。結果は、例示的な提示モデルが、親和性及び安定性の予測に基づく従来の技術水準モデルよりも有意に良好に、ペプチド提示の予測において機能したことを示した。
図13Bは、T細胞エピトープデータに基づいて、ペプチド提示予測について、本明細書において提示するような別の例示的な提示モデル、及び従来の技術水準モデルの性能結果を比較する。T細胞エピトープデータは、細胞表面上のMHCアレルによって提示されT細胞によって認識されたペプチド配列を含有する。結果は、例示的な提示モデルが、たとえ質量分析データに基づいて訓練されているとしても、親和性及び安定性の予測に基づく従来の技術水準モデルよりも有意に良好に、T細胞エピトープの予測において機能したことを示した。換言すると、図13Bの結果は、例示的な提示モデルが、質量分析試験データに基づくペプチド提示の予測において従来の技術水準モデルよりも良好に機能しただけではなく、T細胞によって実際に認識されたエピトープの予測においても、従来の技術水準モデルよりも有意に良好に機能したことを示した。これは、本明細書において提示するような様々な提示モデルが、免疫系において免疫原性応答を誘導する可能性が高い抗原の、改善された特定を提供できることのしるしである。
図13Cは、複数アレル質量分析データに基づいて、ペプチド提示予測について、例示的な和の関数モデル(等式(13))、例示的な関数の和モデル(等式(19))、及び例示的な二次モデル(等式(23))の性能結果を比較する。結果は、関数の和モデル及び二次モデルが、和の関数モデルよりも良好に機能したことを示した。これは、和の関数モデルが、実際にはペプチドの提示が有効に独立している場合、複数アレル設定におけるアレルが、ペプチド提示について互いに干渉し得ることを含意するためである。
図13Dは、複数アレル質量分析データについて、ペプチド提示予測に関して、単一アレル質量分析データを伴って及び伴わずに訓練される2つの例示的な提示モデルの性能結果を比較する。結果は、単一アレルデータを伴わずに訓練される例示的な提示モデルが、単一アレルデータを伴って訓練される例示的な提示モデルのものに匹敵する性能を達成することを示した。
図13Eは、図13Dに示す解析において提供されたアレルHLA-A*02:01及びHLA-B*07:02についての単一アレル質量分析データに基づく、図13Dに示す「A2/B7単一アレルデータを伴わない」及び「A2/B7単一アレルデータを伴う」例示的なモデルの性能を示す。結果は、たとえ例示的な提示モデルがこれらの2つのアレルについての単一アレル質量分析データを伴わずに訓練されるとしても、モデルが各MHCアレルについての結合モチーフを学習できることを示す。
図13Fは、図13Dに示す「A2/B7単一アレルデータを伴わない」例示的なモデルによって予測される、ノナマー間で2位及び9位に共通したアンカー残基を示す。ペプチドは、推定尤度が5%よりも上であった場合に、提示されることが予測された。結果は、MHCアレルHLA-A*02:01及びHLA-B*07:02上での提示について特定されたペプチドにおける最も一般的なアンカー残基が、これらのMHCアレルについて既知のアンカーモチーフと一致したことを示す。これは、例示的な提示モデルが、期待されたように、ペプチド配列のアミノ酸の特定の位置に基づいて、ペプチド結合を正確に学習したことを示す。
図13Gは、C末端隣接配列及びN末端隣接配列をアレル相互作用変数として組み入れた例示的な提示モデルと、C末端隣接配列及びN末端隣接配列をアレル非相互作用変数として組み入れた例示的な提示モデルとの間の性能結果を比較する。結果は、C末端隣接配列及びN末端隣接配列のアレル非相互作用変数としての組み入れが、モデル性能を有意に改善したことを示した。より具体的には、様々なMHCアレルにわたって共通である、ペプチド提示に適切な特性を特定し、これらのアレル非相互作用変数についての統計学的強度が、提示モデルの性能を改善するためにMHCアレルにわたって共有されるように、それらをモデル化することが、価値を有する。
図13(H)は、質量分析によって決定された、mRNA存在量と腫瘍細胞上に提示されたペプチドの頻度との間の依存性を示す。結果は、mRNA発現とペプチド提示との間に強い依存性があることを示す。
図13Iは、2つの例示的な提示モデルの性能を示し、そのうち1つは、質量分析腫瘍細胞データに基づいて訓練されており、もう1つは、mRNA定量データ及び質量分析腫瘍細胞データを組み入れている。図13Hから期待されるように、mRNA発現はペプチド提示の強い指標であるため、結果は、mRNA定量測定値を例示的な提示モデルに組み入れることによって、性能の有意な改善があることを示した。
図13Jは、図13Iに関して説明した「例示的なモデル、RNAあり」提示モデルによって生成された結果と、ペプチド提示を予測する時にペプチド長を計上しない従来の技術水準モデルによって予測された結果との間で、異なるペプチド長についてのペプチド提示の確率を比較する。結果は、図13Iからの「例示的なモデル、RNAあり」の例示的な提示モデルが、異なる長さのペプチドにわたって尤度の変動を捕捉したことを示した。
以下は、hによって意味されるMHCアレルHLA-C*16:04について、アレルごと提示モデル(等式(2))のバリエーションについて決定されたパラメータのセットを示し:
式中、relu(・)は、正規化線形ユニット(RELU:rectifiedlinearunit)関数であり、Wh 1、bh 1、Wh 2、及びbh 2は、モデルについて決定されたパラメータθのセットである。アレル相互作用変数xh kは、ペプチド配列からなる。Wh 1の次元は(231x256)であり、bh 1の次元は(1x256)であり、Wh 2の次元は(256x1)であり、かつbh 2はスカラーである。証明の目的で、bh 1、bh 2、Wh 1、及びWh 2の値は、その教示するところのすべてについて本明細書に援用する国際公開第WO2017106638号に詳細に記載されている。
MHCクラスII新生抗原を決定するための方法については、その教示するところのすべてを本明細書に援用する、国際出願第PCT/US2018/028438号により詳細に記載されている。
図13Nは、HLAクラスII分子を含む合計39種の試料の各試料について質量分析を用いてシークエンシングしたペプチドの量を示すヒストグラムである。さらに、複数の試料の各試料について、図13Nに示されるヒストグラムは、異なるq値の閾値で質量分析を用いてシークエンシングしたペプチドの量を示している。具体的には、複数の試料の各試料について、図13Nは、0.01未満のq値、0.05未満のq値、及び0.2未満のq値で質量分析を用いてシークエンシングしたペプチドの量を示している。
以下は、クラスII MHCアレルであるHLA-DRB1*12:01及びHLA-DRB1*10:01の暗黙のアレルごと提示尤度を生成する複数アレル提示モデル(式(16))のバリエーションについて求められるパラメータのセットを示す。
u=expit(relu(X・W1+b1)・W2+b2)
式中、relu(・)は、正規化線形ユニット(ReLU)関数、W1、b1、W2、及びb2は、モデルについて求められたパラメータθのセットである。アレル相互作用変数Xは、入力ペプチド当たり1行のワン・ホットコード化され、中間パッド化された(middle-padded)ペプチド配列からなる1×399行列に含まれる。W1の次元は(399×256)、b1の次元は(1×256)、W2の次元は(256×2)、b2の次元は(1×2)である。出力の第1の行は、アレルHLA-DRB1*12:01によるそのペプチド配列の暗黙のアレルごとの提示の確率を示し、出力の第2の行は、アレルHLA-DRB1*10:01によるそのペプチド配列の暗黙のアレルごとの提示の確率を示す。例示の目的で、W1、b1、W2、及びb2の値は、その教示するところのすべてについて本明細書に援用する、国際出願第PCT/US2018/028438号に詳細に記載されている。
図14は、図1及び図3に示した実体を実施するための例示的なコンピュータ1400を説明する。コンピュータ1400は、チップセット1404に連結された少なくとも1つのプロセッサ1402を含む。チップセット1404は、メモリコントローラハブ1420及び入力/出力(I/O)コントローラハブ1422を含む。メモリ1406及びグラフィックスアダプタ1412は、メモリコントローラハブ1420に連結されており、ディスプレイ1418は、グラフィックスアダプタ1412に連結されている。記憶デバイス1408、入力装置1414、及びネットワークアダプタ1416は、I/Oコントローラハブ1422に連結されている。コンピュータ1400の他の実施形態は、異なるアーキテクチャを有する。
以下は、本明細書を実施するための具体的な実施形態の例である。これらの例はあくまで例示の目的で示されるものにすぎず、本発明の範囲をいかなる意味においても限定しようとするものではない。用いられる数値(例えば、量、温度など)に関して精度を確実とするべく努力に努めてはいるが、ある程度の実験的誤差及び偏差は無論のこと許容されなければならない。
ワクチン接種によって、対応する細胞免疫応答(複数可)を刺激するクラスI MHCに制限された複数の腫瘍特異的新生抗原(TSNA)を送達することができる。1つの例では、複数のエピトープを単一の遺伝子産物をしてコードするようにワクチンカセットを操作しているが、ここで各エピトープはそれらの天然の包囲ペプチド配列内に埋め込まれるか、または非天然リンカー配列によって分離されている。抗原のプロセシング及び提示、ひいてはTSNA特異的CD8 T細胞応答の程度及び幅に潜在的に影響を及ぼしうるいくつかの設計パラメータが特定されている。本例では、いくつかのモデルカセットを設計及び構築して以下を評価した。すなわち、(1)1個の発現カセットに組み込まれた複数のエピトープに対する強いT細胞応答を生じることができるかどうか、(2)どのような条件が、すべてのエピトープの最適なプロセシング及び提示につながる、発現カセット内のTSNA間に配置される最適リンカーを作るか、(3)カセット内の各エピトープの相対位置がT細胞応答に影響するか、(4)カセット内のエピトープの数が個々のエピトープに対するT細胞応答の程度または質に影響するかどうか、(5)細胞ターゲティング配列の付加がT細胞応答を向上させるか。
XIV.B.1.方法及び材料
TCR及びカセット設計及びクローニング
選択されたTCRは、A*0201により提示される場合にペプチドNLVPMVATV(SEQ ID NO:132)(PDB番号5D2N)、CLGGLLTMV(SEQ ID NO:133)(PDB番号3REV)、GILGFVFTL(SEQ ID NO:134)(PDB番号1OGA)LLFGYPVYV(SEQ ID NO:135)(PDB番号1AO7)を認識する。2Aペプチド連結TCRサブユニット(βに続きα)、EMCV IRES、及び2A連結CD8サブユニット(βに続きα及びプロマイシン耐性遺伝子)を含むトランスファーベクターを構築した。オープンリーディングフレーム配列は、コドン最適化され、GeneArt社により合成されたものである。
ペプチドは、ProImmune社またはGenscript社より購入し、水/DMSO(2:8,v/v)に加えた10mM tris(2-カルボキシルエチル)ホスフィン(TCEP)で10mg/mLに希釈した。細胞培地及び補助添加物質は特に断らない限りはGibco社より入手した。熱不活化ウシ胎児血清(FBShi)はSeradigm社より入手した。QUANTI-Luc基質、ゼオシン、及びプロマイシンはInvivoGen社より入手した。Jurkat-Lucia NFAT細胞(InvivoGen社)を10% FBShi、ピルビン酸ナトリウム、及び100μg/mLのゼオシンを添加したRPMI1640中で維持した。形質導入した後、これらの細胞にさらに0.3μg/mLのプロマイシンを加えた。T2細胞(ATCC CRL-1992)をIscove培地(IMDM)+20%FBShi中で培養した。U-87 MG(ATCC HTB-14)細胞を、10%FBShiを添加したMEM Eagles培地中で維持した。
T2細胞はTCRによる抗原認識を調べる目的で日常的に使用されている。T2細胞は、抗原プロセシング用のペプチドトランスポーターを欠失しており(TAP欠損)、内在性のペプチドをMHC上に提示するために小胞体に取り込むことができない。しかしながら、T2細胞には外来性のペプチドを容易に取り込ませることができる。5種類のマーカーペプチド(NLVPMVATV(SEQ ID NO:132)、CLGGLLTMV(SEQ ID NO:133)、GLCTLVAML(SEQ ID NO:136)、LLFGYPVYV(SEQ ID NO:135)、GILGFVFTL(SEQ ID NO:134))及び2種類の無関係のペプチド(WLSLLVPFV(SEQ ID NO:137)、FLLTRICT(SEQ ID NO:138))をT2細胞に取り込ませた。簡単に述べると、T2細胞をカウントし、IMDM +1%FBShiで1×106細胞/mLに希釈した。各ペプチドは10μgペプチド/1×106細胞となるように加えた。次いで細胞を37℃で90分間インキュベートした。細胞をIMDM+20%FBShiで2回洗浄し、5×10E5細胞/mLに希釈し、100μLを96ウェルCostar組織培養プレートにプレーティングした。Jurkat-Lucia TCRクローンをカウントし、RPMI1640+10%FBShi中で5×10E5細胞/mLに希釈し、100μLをT2細胞に加えた。プレートを37℃、5%CO2で一晩インキュベートした。次いでプレートを400gで3分間遠心し、20μLの上清を白色平底Greinerプレートに取った。指示にしたがってQUANTI-Luc基質を調製し、50μL/ウェルで加えた。ルシフェラーゼ発現をMolecular Devices SpectraMax iE3xで読み取った。
トランスジェニックHLA-A2.1(HLA-A2 Tg)マウスをTaconic Labs,Inc社より入手した。これらのマウスは、ヒトHLA-A2.1リーダードメイン、α1ドメイン、及びα2ドメインと、マウスH2-Kb α3ドメイン、膜貫通ドメイン、及び細胞質ドメインからなる導入遺伝子を有するものである(Vitiello et al.,1991)。これらの実験で使用したマウスは、C57Bl/6バックグラウンドの野生型BALB/cAnNTacの雌及びホモ接合型HLA-A2.1Tgの雌の第1世代子孫(F1)である。
HLA-A2 Tgマウスを、前脛骨筋の両側性の筋肉内注射により1×1010~1×106 個のアデノウイルスベクターのウイルス粒子で免疫化した。免疫応答を免疫化の12日後に測定した。
免疫化したマウスの新しく収穫した脾臓及びリンパ節からリンパ球を単離した。GentleMACS組織解離装置を製造者の指示にしたがって使用して、10%ウシ胎児血清をペニシリン及びストレプトマイシンとともに含むRPMI(完全RPMI)中で組織を解離させた。
マウスIFNg ELISpotPLUSキット(MABTECH社)を使用し、ELISPOTハーモナイゼーションガイドライン(Janetzki et al.,2015)にしたがってELISPOT分析を行った。1×105個の脾細胞を、96ウェルIFNg抗体コーティングプレート中で、10uMの示したペプチドと16時間インキュベートした。スポットをアルカリホスファターゼを用いて現像した。反応時間を10分間計り、プレートに水道水を流して反応を停止させた。スポットをAID vSpot Reader Spectrumを用いてカウントした。ELISPOT分析を行うため、飽和度が50%よりも高いウェルを「多すぎてカウント不能」として記録した。複製ウェルの偏差が10%よりも大きい試料は分析から除外した。次いでスポットのカウントを、式:スポットカウント+2×(スポットカウント×コンフルエンス(%)/[100%-コンフルエンス(%)])を用いてウェルのコンフルエンシーについて補正した。ネガティブペプチド刺激ウェル中のスポットカウントを抗原刺激したウェルから引くことによってネガティブバックグラウンドを補正した。最後に、多すぎてカウント不能として示したウェルを、最も高い観察された補正値に設定し、100の位までの概数に四捨五入した。
新しく単離したリンパ球を2~5×106細胞/mLの密度で10uMの示したペプチドと2時間インキュベートした。2時間後、ブレフェルジンAを5ug/mlの濃度にまで加え、細胞を刺激物質とさらに4時間インキュベートした。刺激後、生細胞を製造者のプロトコールにしたがって固定可能な生存率解析用色素eFluor780で標識し、抗CD8 APC(クローン53-6.7,BioLegend社)により1:400の希釈率で染色した。細胞内染色には抗IFNg PE(クローンXMG1.2,BioLegend社)を1:100で使用した。試料をAttune NxT Flow Cytometer(Thermo Scientific社)で収集した。FlowJoを使用してフローサイトメトリーデータをプロットし、分析を行った。抗原特異的応答の程度を評価するため、CD8+細胞のIFNg+の割合(%)及び全IFNg+細胞数/1×106個の生細胞の両方を、各ペプチド刺激物質に対して計算した。
新生抗原カセットの設計の評価の一例として、インビトロの細胞ベースのアッセイを開発し、モデルワクチンカセット内の選択されたヒトエピトープが抗原提示細胞によって発現、プロセシング、及び提示されるかどうかを評価した(図15)。認識後、特性がよく知られているペプチド-HLAの組み合わせに特異的な5種類のTCRのうちの1つを発現するように操作されたJurkat-LuciaレポーターT細胞が活性化され、活性化T細胞の核因子(NFAT)を核内に移行させると、ルシフェラーゼレポーター遺伝子の転写が活性化される。個々のレポーターCD8 T細胞株の抗原刺激をバイオルミネッセンスによって定量した。
ルシフェラーゼの誘導によって測定されるペプチド特異的T細胞認識は、ワクチンカセット抗原の効果的なプロセシング及び提示を示す。
*エピトープ3のレポーターT細胞はまだ生成されていない。
インビトロT細胞活性化アッセイにおけるルシフェラーゼ誘導は、DPPベースのカセットと異なり、すべてのリンカーがカセット抗原の効率的な放出を促進したことを示した。T細胞エピトープのみ(リンカー無し)=9AA、片側に天然リンカー=17AA、両側に天然リンカー=25AA、非天然リンカー=AAY,RR,DPP
*エピトープ3のレポーターT細胞はまだ生成されていない。
インビトロT細胞活性化アッセイを用いることにより、4つのHLA-A*0201制限マーカーエピトープがモデルカセットから効率的に放出され、ターゲティング配列がT細胞の認識及び活性化を大幅に向上させないことが示された。
*エピトープ3のレポーターT細胞はまだ生成されていない。
新生抗原カセット設計の評価の別の例として、HLA-A*02:01に制限された形でCD8 T細胞を刺激することが知られている、特性がよく知られた5つのヒトクラスI MHCエピトープを含むようにワクチンカセットを設計した(図16A、17、19A)。それらのインビボ免疫原性の評価を行うため、これらのマーカーエピトープを含むワクチンカセットをアデノウイルスベクターに組み込み、HLA-A2トランスジェニックマウスに感染させるのに使用した(図18)。このマウスモデルは、ヒトHLA-A*0201及びマウスH2-Kbから一部が構成された導入遺伝子を保有しており、したがって、ヒトHLA-A2.1のリーダー、マウスα3に連結されたα1及びα2ドメイン、膜貫通及び細胞質H2-Kbドメインで構成されたキメラクラスI MHC分子をコードしている(Vitiello et al.,1991)。このキメラ分子は、HLA-A*02:01に制限された抗原提示を可能とする一方で、CD8共受容体とMHC上のα3ドメインとの種の一致した相互作用を維持する。
ELISPOTデータは、HLA-A2トランスジェニックマウスが1×e11個のアデノウイルス粒子による感染17日後にカセット内のすべてのクラスI MHC制限エピトープに対してT細胞応答を生じたことを示した。
ELISPOTデータは、HLA-A2トランスジェニックマウスが5e10アデノウイルス粒子による感染17日後に長いワクチンカセット及び短いワクチンカセットの両方で同等の大きさのT細胞応答を生じたことを示した。
* 技術的なエラーによりT細胞応答が見られなかったと疑われる。
要約すると、モデルカセット評価による知見(図16~19、表2~6)によって、モデルワクチンカセットでは、アデノウイルスベースのベクターとの関連で約20個のエピトープをコードする「数珠つなぎ」アプローチを用いた場合に強い免疫原性が得られることが実証された。エピトープは、両側にその天然の周辺ペプチド配列(例えば、両側に8個のアミノ酸残基)が隣接した最小のCD8 T細胞エピトープ(例えば、9個のアミノ酸残基)をそれぞれが埋め込んだ25マー配列を連結することによって最も効果的にアセンブルされる。本明細書において使用される場合、「天然」または「自然」のフランキング配列とは、その由来源タンパク質内のそのエピトープの天然に存在するという文脈で特定のエピトープのN末端及び/またはC末端側のフランキング配列のことを指す。例えば、HCMV pp65 MHC IのエピトープNLVPMVATV(SEQ ID NO:132)は、その5’末端側に天然の5’配列WQAGILAR(SEQ ID NO:139)が、その3’末端側に天然の3’配列QGQNLKYQ(SEQ ID NO:140)が隣接し、それによりHCMV pp65由来源タンパク質内にみられる
という25マーペプチドを生成する。天然または自然の配列は、天然のフランキング配列(複数可)が隣接したエピトープをコードするヌクレオチド配列のことを指す場合もある。各25マー配列は、それに続く25マー配列に直接連結される。最小のCD8 T細胞エピトープがアミノ酸9個よりも大きいかまたは小さい場合、フランキングペプチドの長さは、全体の長さが依然25マーのペプチド配列となるように調節することができる。例えば、アミノ酸10個のCD8 T細胞エピトープには、アミノ酸8個とアミノ酸7個の配列を隣接させることができる。このコンカテマーの後には、CD4 Tヘルパー細胞を刺激し、ワクチンカセット抗原の全体のインビボ免疫原性を改善するため(Alexander et al.,1994;Panina-Bordignon et al.,1989)に含ませた2個のユニバーサルクラスII MHCエピトープを繋げた。これらのクラスIIエピトープは、GPGPGアミノ酸リンカー(SEQ ID NO:56)によって最後のクラスIエピトープに連結した。2個のクラスIIエピトープは、GPGPGアミノ酸リンカー(SEQ ID NO:56)によって互いに対しても連結し、さらにC末端側にGPGPGアミノ酸リンカー(SEQ ID NO:56)を連結させた。エピトープの位置もその数もT細胞の認識または応答に大きく影響しないようであった。ターゲティング配列も、カセットに由来する抗原の免疫原性に大きく影響しないようであった。
XV.A.ChAd新生抗原カセット送達ベクターの構築
1つの例では、チンパンジーアデノウイルス(ChAd)を操作して新生抗原カセットの送達ベクターとした。さらなる例では、完全長ChAdV68ベクターを、AC_000011.1(米国特許第6083716号に記載の配列2)に基づいて合成し、E1(nt457~3014)及びE3(nt27,816~31,332)配列を欠失させた。CMVプロモーター/エンハンサーの制御下にあるレポーター遺伝子を欠失させたE1配列の代わりに挿入した。このクローンをHEK293細胞にトランスフェクトしたところ、感染性のウイルスは生成されなかった。野生型C68ウイルスの配列を確認するため、単離VR-594をATCCより入手して継代した後、個々に配列決定した(SEQ ID NO:10)。AC_000011.1配列を野生型ChAdV68ウイルスのATCC VR-594配列(SEQ ID NO:10)と比較したところ、6個のヌクレオチドの相違が特定された。1つの例では、改変ChAdV68ベクターを、AC_000011.1に基づいて作製し、対応するATCC VR-594ヌクレオチドを5つの位置で置換した(ChAdV68.5WTnt SEQ ID NO:1)。
XV.B.1.ChAdベクターの評価方法及び材料
リポフェクタミンを用いたHEK293A細胞のトランスフェクション
ChAdV68コンストラクト(ChAdV68.4WTnt.GFP、ChAdV68.5WTnt.GFP、ChAdV68.4WTnt.MAG25マー、及びChAdV68.5WTnt.MAG25マー)のDNAを調製し、以下のプロトコールを用いてHEK293A細胞にトランスフェクトした。
ChAdV68コンストラクト(ChAdV68.4WTnt.GFP、ChAdV68.5WTnt.GFP、ChAdV68.4WTnt.MAG25マー、ChAdV68.5WTnt.MAG25マー)のDNAを調製し、以下のプロトコールを用いてHEK293A細胞にトランスフェクトした。
8%CO2のインキュベーター内の293FreeStyle(商標)(ThermoFisher社)培地中で増殖させた293F細胞内でChAdV68ウイルス生成を行った。感染の当日、細胞を生存率98%で1mL当たり106細胞に希釈し、1LのShakeフラスコ(Corning社)中、1回の生成操作当たり400mLを使用した。1回の感染当たり目標MOIが3.3よりも高い4mLの三次ウイルスストックを使用した。トリパンブルーによって測定される生存率が70%を下回るまで48~72時間にわたって細胞をインキュベートした。次いで感染細胞をベンチトップ遠心分離器で最大速度で遠心して収穫し、1×PBS中で洗浄し、再び遠心してから20mLの10mM Tris pH7.4に再懸濁した。細胞ペレットを、凍結解凍を3回行って溶解し、4,300×gで5分間遠心して清澄化した。
ウイルスDNAをCsCl遠心分離により精製した。2つの不連続な勾配の操作を行った。第1の遠心は、細胞成分からウイルスを精製するためのもので、第2の遠心は、細胞成分からの分離物をさらに精製し、感染性粒子から機能不全粒子を分離するためのものである。
1.1×1012個のウイルス粒子(VP)の消光係数はOD260nmの吸光度の値=1に相当することに基づき、OD260アッセイを用いてVP濃縮を行った。アデノウイルスの2つの希釈度(1:5と1:10)をウイルス溶解バッファー(0.1%SDS,10mM Tris pH7.4,1mM EDTA)中で作った。両方の希釈度でODを2重に測定し、OD260値×希釈係数×1.1×1012VPを掛けることによりVP濃度/mLを測定した。
C57BL/6J系の雌性マウス及びBalb/c系の雌性マウスに、1×108個のChAdV68.5WTnt.MAG25マーのウイルス粒子(VP)を、100uL体積中で両側性の筋肉内注射(各脚50uL)により注射した。
各マウスの脾臓及びリンパ節を、3mLの完全RPMI(RPMI、10%FBS、ペニシリン/ストレプトマイシン)中にプールした。gentleMACS組織解離装置(Miltenyi Biotec社)を製造者の指示にしたがって使用して、機械的解離を行った。解離した細胞を40ミクロンのフィルターに通して濾過し、赤血球をACK溶解バッファー(150mM NH4Cl,10mM KHCO3,0.1mM Na2EDTA)で溶解した。細胞を30ミクロンのフィルターに通して再び濾過した後、完全RPMI中に再懸濁した。細胞を、死細胞及びアポトーシス細胞を除外するためのヨウ化プロピジウム染色を使用してAttune NxTフローサイトメーター(Thermo Fisher社)でカウントした。次に、その後の分析用に細胞を適当な生細胞の濃度に調整した。
マウスIFNg ELISpotPLUSキット(MABTECH社)を使用し、ELISPOTハーモナイゼーションガイドライン{DOI: 10.1038/nprot.2015.068}にしたがってELISPOT分析を行った。5×104個の脾細胞を、96ウェルIFNg抗体コーティングプレート中で、10uMの示したペプチドと16時間インキュベートした。スポットをアルカリホスファターゼを用いて現像した。反応時間を10分間計り、プレートに水道水を流して反応を停止させた。スポットをAID vSpot Reader Spectrumを用いてカウントした。ELISPOT分析を行うため、飽和度が50%よりも高いウェルを「多すぎてカウント不能」として記録した。複製ウェルの偏差が10%よりも大きい試料は分析から除外した。次いでスポットのカウントを、式:スポットカウント+2×(スポットカウント×コンフルエンス(%)/[100%-コンフルエンス(%)])を用いてウェルのコンフルエンシーについて補正した。ネガティブペプチド刺激ウェル中のスポットカウントを抗原刺激したウェルから引くことによってネガティブバックグラウンドを補正した。最後に、多すぎてカウント不能として示したウェルを、最も高い観察された補正値に設定し、100の位までの概数に四捨五入した。
1つの例において、ChAdV68.4WTnt.GFP(図21)及びChAdV68.5WTnt.GFP(図22)のDNAを、HEK293A細胞にトランスフェクトし、ウイルス複製(ウイルスプラーク)をトランスフェクションの7~10日後に観察した。ChAdV68ウイルスプラークを光学(図21A及び22A)及び蛍光顕微鏡法(図21B~C、及び図22B~C)を使用して可視化した。GFPは、増殖性ChAdV68ウイルス送達粒子の生成を示す。
1つの例において、ChAdV68.4WTnt.GFP、ChAdV68.5WTnt.GFP、及びChAdV68.5WTnt.MAG25マーウイルスをHEK293F細胞内で増殖させ、精製ウイルスストックをトランスフェクションの18日後に生成した(図23)。精製ChAdV68ウイルスストック中のウイルス粒子を定量し、同じプロトコールを使用して生成されたアデノウイルス5型(Ad5)及びChAdVY25(近縁のChAdV;Dicks,2012,PloS ONE7,e40385)ウイルスストックと比較した。ChAdV68ウイルス力価は、Ad5及びChAdVY25と同等であった(表7)。
マウス腫瘍抗原を発現するC68ベクターを、マウス免疫原性実験で評価して、C68ベクターがT細胞応答を誘発することを実証する。MHCクラスIエピトープSIINFEKL(SEQ ID NO:57)に対するT細胞応答C57BL/6J系雌性マウスで測定し、MHCクラスIエピトープAH1-A5(Slansky et al.,2000,Immunity13:529-538)に対するT細胞応答をBalb/c系マウスで測定した。図29に示されるように、ChAdV68.5WTnt.MAG25マーによるマウスの免疫後にコントロールに対して強いT細胞応答が測定された。脾細胞106個当たり、8957個及び4019個のスポット形成細胞(SFC)の平均の細胞性免疫応答が、ELISpotアッセイにおいて、C57BL/6J系またはBalb/c系マウスをそれぞれChAdV68.5WTnt.MAG25マーで免疫した場合に免疫の10日後に観察された。
XVI.A.アルファウイルス送達ベクター評価の材料及び方法
RNAを生成するためのインビトロ転写
インビトロ試験を行うため、プラスミドDNAをPmeIによる制限消化によって直鎖状とし、カラムを製造者の指示にしたがって洗浄し(GeneJet DNA cleanup kit,Thermo社)、テンプレートとして使用した。RiboMAX Large Scale RNA production System(Promega社)をm7Gキャップアナログ(Promega)とともに製造者の指示にしがって使用してインビトロ転写を行った。RNeasy kit(Qiagen社)を製造者の指示にしがって使用してmRNAを精製した。
HEK293A細胞を、96ウェルのウェル当たり6e4細胞で、24ウェルのウェル当たり2e5細胞で、トランスフェクションの約16時間前に播種した。細胞にMessengerMAXリポフェクタミン(Invitrogen社)を製造者のプロトコールにしたがって使用してmRNAをトランスフェクションした。96ウェルでは、ウェル当たり0.15uLのリポフェクタミン及び10 ng のmRNAを使用し、24ウェルでは、ウェル当たり0.75uLのリポフェクタミン及び150ngのmRNAを使用した。GFPを発現するmRNA(TriLink Biotechnologies社)をトランスフェクションのコントロールとして使用した。
ルシフェラーゼレポーターアッセイを、白い壁の96ウェルプレートで、ONE-Gloルシフェラーゼアッセイ(Promega社)を製造者のプロトコールにしたがって使用して各条件を三重にして行った。発光度をSpectraMaxを使用して測定した。
トランスフェクトした細胞をトランスフェクションの2時間後に新鮮な培地で洗い、新鮮な培地に交換してトランスフェクトしなかったmRNAをすべて除去した。次いで細胞を異なる時点でRLT plus lysis buffer(Qiagen社)中に収穫し、いずれも製造者のプロトコールにしたがってQiaShredder(Qiagen社)を使用してホモジナイズし、RNeasy kit(Qiagen社)を使用して抽出した。Nanodrop(Thermo Scientific社)を使用して全RNAを定量した。製造者のプロトコールにしたがってqTower3 (Analytik Jena)でQuantitect Probe One-Step RT-PCR kit(Qiagen社)を使用し、反応当たり20ngの全RNAを使用してqRT-PCRを行った。各試料を各プローブについて三重に試験した。ActinまたはGusBを参照遺伝子として用いた。カスタムプライマー/プローブはIDT社により生成されたものである(表8)。
C57BL/6J系マウスの左下脇腹に105個のB16-OVA細胞/動物を注射した。腫瘍を免疫化の前、3日間にわたって増殖させた。
Balb/c系マウスの左下脇腹に106個/動物のCT26細胞を注射した。腫瘍を免疫化の前、7日間にわたって増殖させた。
srRNAワクチンについては、マウスに100uL体積中、10ugのRNAを、両側性に筋肉内注射(各脚50uL)により注射した。Ad5ワクチンについては、マウスに5×1010個のウイルス粒子(VP)を、100uL体積中で両側性に筋肉内注射(各脚50uL)により注射した。各動物に、抗CTLA-4(クローン9D9,BioXcell社)、抗PD-1(クローンRMP1-14,BioXcell社)、または抗IgG(クローンMPC-11,BioXcell社)を、用量250ugで、週2回、腹腔内注射により注射した。
各時点においてマウスに腹腔内注射により150mg/kgのルシフェリン基質を注射し、注射の10~15分後にIVISインビボイメージングシステム(PerkinElmer社)を使用して生物発光を測定した。
各マウスの脾臓及びリンパ節を、3mLの完全RPMI(RPMI、10%FBS、ペニシリン/ストレプトマイシン)中にプールした。gentleMACS組織解離装置(Miltenyi Biotec社)を製造者の指示にしたがって使用して、機械的解離を行った。解離した細胞を40ミクロンのフィルターに通して濾過し、赤血球をACK溶解バッファー(150mM NH4Cl,10mM KHCO3,0.1mM Na2EDTA)で溶解した。細胞を30ミクロンのフィルターに通して再び濾過した後、完全RPMI中に再懸濁した。細胞を、死細胞及びアポトーシス細胞を除外するためのヨウ化プロピジウム染色を使用してAttune NxTフローサイトメーター(Thermo Fisher社)でカウントした。次に、その後の分析用に細胞を適当な生細胞の濃度に調整した。
マウスIFNg ELISpotPLUSキット(MABTECH社)を使用し、ELISPOTハーモナイゼーションガイドライン{DOI: 10.1038/nprot.2015.068}にしたがってELISPOT分析を行った。5×104個の脾細胞を、96ウェルIFNg抗体コーティングプレート中で、10uMの示したペプチドと16時間インキュベートした。スポットをアルカリホスファターゼを用いて現像した。反応時間を10分間計り、プレートに水道水を流して反応を停止させた。スポットをAID vSpot Reader Spectrumを用いてカウントした。ELISPOT分析を行うため、飽和度が50%よりも高いウェルを「多すぎてカウント不能」として記録した。複製ウェルの偏差が10%よりも大きい試料は分析から除外した。次いでスポットのカウントを、式:スポットカウント+2×(スポットカウント×コンフルエンス(%)/[100%-コンフルエンス(%)])を用いてウェルのコンフルエンシーについて補正した。ネガティブペプチド刺激ウェル中のスポットカウントを抗原刺激したウェルから引くことによってネガティブバックグラウンドを補正した。最後に、多すぎてカウント不能として示したウェルを、最も高い観察された補正値に設定し、100の位までの概数に四捨五入した。
XVI.B.1.アルファウイルスベクターのインビトロ評価
本明細書の一実現形態では、新生抗原発現システム用のRNAアルファウイルス骨格を、ベネズエラウマ脳炎ウイルス(VEE)(Venezuelan Equine Encephalitis(VEE)(Kinney,1986,Virology 152:400-413)ベースの自己複製RNA(srRNA)ベクターから生成した。1つの例では、26Sサブゲノムプロモーターの3’側に位置するVEEの構造タンパク質をコードする配列を欠失させ(VEE配列の7544~11,175を欠失させた。番号付けはKinney et al 1986に基づく。SEQ ID NO:6)、抗原配列(SEQ ID NO:14及びSEQ ID NO:4)またはルシフェラーゼレポーター(例えばVEE-ルシフェラーゼ、SEQ ID NO:15)に置き換えた(図24)。RNAをインビトロでsrRNA DNAベクターから転写させ、HEK293A細胞にトランスフェクトしてルシフェラーゼレポーターの発現を測定した。さらに、ルシフェラーゼをコードする(非複製)mRNAを比較のためにトランスフェクトした。VEE-ルシフェラーゼのsrRNAでは、2時間の測定値を23時間の測定値と比較した場合にsrRNAレポーターシグナルの約30,000倍の増大が観察された(表9)。これに対して、同じ時間でのmRNAレポーターのシグナルの増大は10倍未満であった(表9)。
96ウェル中、ウェル当たり10ngのVEE-ルシフェラーゼsrRNAまたは10ngの非複製ルシフェラーゼmRNA(TriLink L-6307)をHEK293A細胞にトランスフェクトした。トランスフェクト後の異なる時点で発光を測定した。ルシフェラーゼ発現を相対発光単位(RLU)として報告する。各データポイントは、3つのトランスフェクトしたウェルの平均±SDである。
HEK293A細胞にVEE-ルシフェラーゼsrRNAをトランスフェクトし(24ウェルのウェル当たり150ng)、トランスフェクション後の異なる時間にqRT-PCRによりRNAレベルを定量した。各測定値はアクチン参照遺伝子に対して正規化し、2時間の時点に対する倍率変化を示す。
HEK293細胞にVEE-MAG25マーsrRNAをトランスフェクトし(24ウェルのウェル当たり150ng)、トランスフェクション後の異なる時間にqRT-PCRによりRNAレベルを定量した。各測定値はGusB参照遺伝子に対して正規化し、2時間の時点に対する倍率変化を示す。グラフ上の異なる線は、いずれもsrRNAのエピトープカセット領域を検出する2つの異なるqPCRプライマー/プローブのセットを表す。
別の例において、VEE-ルシフェラーゼレポーターの発現をインビボで評価した。マウスに、脂質ナノ粒子(MC3)に封入された10ugのVEE-ルシフェラーゼsrRNAを注射し、注射の24及び48時間後、ならびに7及び14日後に撮影して生物発光シグナルを測定した。ルシフェラーゼシグナルが注射の24時間後に検出され、時間とともに増大し、srRNA注射の7日後にピークとなった(図25)。
1つの実現形態において、VEE srRNAベクターがインビボで抗原特異的免疫応答を誘導するかを調べるため、2つの異なるMHCクラスIマウス腫瘍エピトープであるSIINFEKL(SEQ ID NO:57)及びAH1-A5(Slansky et al.,2000,Immunity 13:529-538)を発現するVEE srRNAベクターを作製した(VEE-UbAAY,SEQ ID NO:14)。SFL(SIINFEKL(SEQ ID NO:57))エピトープは、B16-OVAメラノーマ細胞株によって発現され、AH1-A5(SPSYAYHQF(SEQ ID NO:58);Slansky et al.,2000,Immunity)エピトープは、CT26結腸癌細胞株によって発現される関連エピトープを標的とするT細胞を誘導する(AH1/SPSYVYHQF(SEQ ID NO:193);Huang et al.,1996,Proc Natl Acad Sci USA 93:9730-9735)。1つの例では、インビボ実験において、VEE-UbAAY srRNA が、T7ポリメラーゼ(TriLink Biotechnologies)を使用したインビトロ転写によって生成され、脂質ナノ粒子(MC3)に封入された。
*Vax群のマウス#6からの結果は、三重のウェル間のばらつきが大きいことから分析から除外した。
ChAdV68及び自己複製RNA(srRNA)を用いた異なる投与プロトコールを、マウスCT26腫瘍モデルで評価した。
腫瘍の注入
Balb/c系マウスにCT26細胞株を注射した。腫瘍細胞注射の7日後にマウスを異なる実験アーム(各群当たりマウス28~40匹)をランダムカセット配列し、処置を開始した。Balb/c系マウスの左下脇腹に106個/動物のCT26細胞を注射した。腫瘍を免疫化の前、7日間にわたって増殖させた。各実験アームは表15に詳細に記載したとおりである。
srRNAワクチンについては、マウスに100uL体積中、10ugのVEE-MAG25マーsrRNAを、両側性に筋肉内注射(各脚50uL)により注射した。C68ワクチンについては、マウスに100uL体積中1×1011個のChAdV68.5WTnt.MAG25マーのウイルス粒子(VP)を、両側性に筋肉内注射(各脚50uL)により注射した。各動物に、抗PD-1(クローンRMP1-14,BioXcell社)、または抗IgG(クローンMPC-11,BioXcell社)を、用量250ugで、週2回、腹腔内注射により注射した。
各マウスの脾臓及びリンパ節を、3mLの完全RPMI(RPMI、10%FBS、ペニシリン/ストレプトマイシン)中にプールした。gentleMACS組織解離装置(Miltenyi Biotec社)を製造者の指示にしたがって使用して、機械的解離を行った。解離した細胞を40ミクロンのフィルターに通して濾過し、赤血球をACK溶解バッファー(150mM NH4Cl,10mM KHCO3,0.1mM Na2EDTA)で溶解した。細胞を30ミクロンのフィルターに通して再び濾過した後、完全RPMI中に再懸濁した。細胞を、死細胞及びアポトーシス細胞を除外するためのヨウ化プロピジウム染色を使用してAttune NxTフローサイトメーター(Thermo Fisher社)でカウントした。次に、その後の分析用に細胞を適当な生細胞の濃度に調整した。
マウスIFNg ELISpotPLUSキット(MABTECH社)を使用し、ELISPOTハーモナイゼーションガイドライン{DOI: 10.1038/nprot.2015.068}にしたがってELISPOT分析を行った。5×104個の脾細胞を、96ウェルIFNg抗体コーティングプレート中で、10uMの示したペプチドと16時間インキュベートした。スポットをアルカリホスファターゼを用いて現像した。反応時間を10分間計り、プレートに水道水を流して反応を停止させた。スポットをAID vSpot Reader Spectrumを用いてカウントした。ELISPOT分析を行うため、飽和度が50%よりも高いウェルを「多すぎてカウント不能」として記録した。複製ウェルの偏差が10%よりも大きい試料は分析から除外した。次いでスポットのカウントを、式:スポットカウント+2×(スポットカウント×コンフルエンス(%)/[100%-コンフルエンス(%)])を用いてウェルのコンフルエンシーについて補正した。ネガティブペプチド刺激ウェル中のスポットカウントを抗原刺激したウェルから引くことによってネガティブバックグラウンドを補正した。最後に、多すぎてカウント不能として示したウェルを、最も高い観察された補正値に設定し、100の位までの概数に四捨五入した。
ChAdV68.5WTnt.MAG25マー/VEE-MAG25マーsrRNAの異種プライム/ブースト、またはVEE-MAG25マーsrRNAの同種プライム/ブーストワクチンの免疫原性及び有効性をCT26マウス腫瘍モデルで評価した。Balb/c系マウスにCT26細胞株を注射した。腫瘍細胞注射の7日後にマウスを異なる実験アームをランダムカセット配列し、処置を開始した。各実験アームは表15に詳細に、また表16により一般的に記載したとおりである。
ChAdV68及び自己複製RNA(srRNA)を用いた異なる投与プロトコールを、非ヒト霊長類(NHP)で評価した。
プライミングワクチンを各NHPで筋肉内(IM)注射して実験を開始した(ワクチンプライム)。1回以上のブースターワクチン(ワクチンブースト)も各NHPに筋肉内注射した。下記表に概略を示し、下記に要約した各グループにしたがって、投与ごとに両側性注射で投与した。
Mamu A*01インドアカゲザルを、LNP-1またはLNP-2中で製剤化した1×1012個のウイルス粒子(注射1回当たり5×1011個のウイルス粒子)のChAdV68.5WTnt.MAG25マー、30ugのVEE-MAG25マーsrRNA、100ugのVEE-MAG25マーsrRNA、または300ugのVEE-MAG25マーsrRNAで両側性に免疫した。30ug、100ugまたは300ugのVEE-MAG25マー srRNAのワクチンブーストをプライムワクチン接種後の示した時間に筋肉内投与した。
PBMCを、プライムワクチン接種後の示した時間にLymphocyte Separation Medium(LSM,MP Biomedicals社)及びLeucoSep分離チューブ(Greiner Bio-One社)を使用して単離し、10%FBS及びペニシリン/ストレプトマイシンを含んだRPMIに再懸濁した。細胞を、死細胞及びアポトーシス細胞を除外するためのヨウ化プロピジウム染色を使用してAttune NxTフローサイトメーター(Thermo Fisher社)でカウントした。次に、その後の分析用に細胞を適当な生細胞の濃度に調整した。実験に用いたそれぞれのサルについて、ELISpotまたはフローサイトメトリー法を用いてT細胞応答を測定した。ワクチンにコードされた6種類の異なるアカゲザルMamu-A*01クラスIエピトープに対するT細胞応答を、ELISpot(ex vivo enzyme-linked immunospot)(エクスビボ酵素結合免疫スポット)分析を用いてIFN-γなどのサイトカインの誘導を測定することにより、PBMCから観測した。サルIFNg ELISpotPLUSキット(MABTECH社)を使用し、ELISPOTハーモナイゼーションガイドライン{DOI: 10.1038/nprot.2015.068}にしたがってELISpot分析を行った。200,000個のPBMCを、96ウェルIFNg抗体コーティングプレート中で、10uMの示したペプチドと16時間インキュベートした。スポットをアルカリホスファターゼを用いて現像した。反応時間を10分間計り、プレートに水道水を流して反応を停止させた。スポットをAID vSpot Reader Spectrumを用いてカウントした。ELISPOT分析を行うため、飽和度が50%よりも高いウェルを「多すぎてカウント不能」として記録した。複製ウェルの偏差が10%よりも大きい試料は分析から除外した。次に、スポットのカウントを、式:スポットカウント+2×(スポットカウント×コンフルエンス(%)/[100%-コンフルエンス(%)])を用いてウェルのコンフルエンシーについて補正した。ネガティブペプチド刺激ウェル中のスポットカウントを抗原刺激したウェルから引くことによってネガティブバックグラウンドを補正した。最後に、多すぎてカウント不能として示したウェルを、最も高い観察された補正値に設定し、100の位までの概数に四捨五入した。
この実験は、(a)同種のプライム/ブーストまたは異種のプライム/ブーストとしてのVEE-MAG25マー srRNAの30μg及び100μgの用量とChAdV68.5WTnt.MAG25マーとの組み合わせの免疫原性及び予備的安全性を評価し、(b)LNP2に対してLNP1を使用した脂質ナノ粒子中のVEE-MAG25マー srRNAの免疫応答を比較し、(c)VEE-MAG25マー srRNA及びChAdV68.5WTnt.MAG25マーによる免疫化に対するT細胞応答の速度論を評価するように設計した。
6種類の異なるMamu-A*01制限エピトープに対する末梢血単核細胞(PBMC)中の抗原特異的細胞性免疫応答を、免疫化の前、及び初期免疫化の1、2、3、4、5、6、8、9、及び10週後に測定した。表21に示すように、各動物に、4及び8週目に、LNP1またはLNP2のいずれかと製剤化した用量30μgまたは100μgのVEE-MAG25マー srRNAによるブースト免疫を行った。6種類のエピトープすべてに対する複合的な免疫応答を、それぞれの免疫モニタリング時点についてプロットした(図34A~D及び表22~25)。
この実験は、(a)同種のプライム/ブーストまたは異種のプライム/ブーストとしてのVEE-MAG25マー srRNAの300μgの用量とChAdV68.5WTnt.MAG25マーとの組み合わせの免疫原性を評価し、(b)用量300μgで、LNP2に対してLNP1を使用した脂質ナノ粒子中のVEE-MAG25マー srRNAの免疫応答を比較し、(c)VEE-MAG25マー srRNA及びChAdV68.5WTnt.MAG25マーによる免疫化に対するT細胞応答の速度論を評価するように設計した。
Mamu-A*01インドアカゲザルを、ChAdV68.5-WTnt.MAG25マーで免疫化した。6種類の異なるMamu-A*01制限エピトープに対する末梢血単核細胞(PBMC)中の抗原特異的細胞性免疫応答を、免疫化の前、及び初期免疫化の4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23及び24週後に測定した(図35及び表27)。動物に、4、12、及び20週目にLNP2製剤を用いてVEE-MAG25マー srRNAによる免疫化を行った。最初のChAdV68.5WTnt.MAG25マーによる初期免疫化の4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23または24週後に、PBMC106個当たり1750、4225、1100、2529、3218、1915、1708、1561、5077、4543、4920、5820、3395、2728、1996、1465、4730、2984、2828、または3043SFC(6つのエピトープの合計)の複合的な抗原特異的免疫応答が観察された(図35)。VEE-MAG25マー srRNAによる2度目のブースト免疫化の1週後(13週目)に測定された免疫応答は、ブースト免疫化の直前(12週目)に測定された免疫応答よりも約3倍高かった。VEE-MAG25マー srRNAによる3度目のブースト免疫化の1週後(21週目)に測定された免疫応答は、2度目のブーストで観察された応答と同様、ブースト免疫化の直前(20週目)に測定された免疫応答よりも約3倍高かった。
本発明の一実現形態では、srRNAの用量範囲実験を、mamu A01インドアカゲザルで実施することによって、どのsrRNA用量をNHP免疫原性実験に進めるべきかを特定することができる。1つの例では、mamu A01インドアカゲザルに、複数のmamu A01制限エピトープを含むモデル抗原をコードしたsrRNAベクターを筋肉内注射により投与することができる。別の例では、抗CTLA-4モノクローナル抗体を、筋肉内ワクチン注射の部位の近位に皮下投与することで1つの動物群でワクチン流入領域のリンパ節をターゲティングすることができる。最初の免疫化後、2週間ごとにPBMCを採取して免疫モニタリングを行うことができる。各実験アームを下記に記載する(表30)。
本発明の一実施形態では、免疫原性を実証するためにmamu A01インドアカゲザルでワクチン実験を行うことができる。1つの例では、mamu A01インドアカゲザルに、複数のmamu A01制限エピトープを含むモデル抗原をコードしたChAdV及び/またはsrRNAベクターを筋肉内注射により投与することができる。別の例では、一部のグループに対して、抗CTLA-4モノクローナル抗体を、筋肉内ワクチン注射の部位の近位に皮下投与する。最初の免疫化後、2週間ごとにPBMCを採取して免疫モニタリングを行うことができる。各実験アームを下記に記載する(表31)。
T細胞は、患者の血液、リンパ節、または腫瘍から単離することができる。T細胞は、例えば、抗原-MHCテトラマー結合細胞を分取することにより、またはT細胞と抗原でパルスした抗原提示細胞とのインビトロ共培養物中で刺激した活性化された細胞を分取することにより、抗原特異的T細胞について濃縮することができる。抗原ロードテトラマー及び他のMHCベースの試薬をはじめとする、抗原特異的T細胞の同定のためのさまざまな試薬が当該技術分野で知られている。
1.本明細書では、新生抗原または複数の新生抗原を含むウイルスベクターを開示する。特定の実施形態では、例えば以下のような本明細書に開示される方法を用いて新生抗原が特定される。特定の実施形態では、新生抗原は、例えば以下のような本明細書に開示される少なくとも1つの特性または性質を有する。
前記対象の腫瘍細胞からエクソーム、トランスクリプトーム、または全ゲノムの腫瘍ヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記腫瘍ヌクレオチドシークエンシングデータが、新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を対応する野生型の親ペプチド配列とは異なるものとする少なくとも1つの変化を有する、工程と、
前記新生抗原のそれぞれが前記対象の腫瘍細胞の腫瘍細胞表面上の1つ以上のMHCアレルによって提示される数値的尤度のセットを生成するために、各新生抗原のペプチド配列を1つ以上の提示モデルに入力する工程であって、前記数値的尤度のセットが、受け取った質量分析データに少なくとも基づいて特定されたものである、工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記数値的尤度のセットに基づいて選択する工程と、を含む方法を開示する。
MHCアレルのうちの特定の1つとペプチド配列の特定の位置の特定のアミノ酸とのペアの存在と、
前記ペアの前記MHCアレルのうちの特定の1つによる、前記特定の位置に前記特定のアミノ酸を含むそのようなペプチド配列の腫瘍細胞表面上での提示の尤度と、の間の依存性を表す。
前記1つ以上の提示モデルを、対応する新生抗原のペプチド配列に適用することによって、前記1つ以上のMHCアレルのそれぞれについて、前記対応する新生抗原のペプチド配列のアミノ酸の少なくとも位置に基づいて、前記MHCアレルが前記対応する新生抗原を提示するかどうかを示す依存性スコアを生成することを含む。
前記依存性スコアを変換することによって、各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成することと、
前記アレルごと尤度を組み合わせて前記数値的尤度を生成することと、をさらに含む。
前記依存性スコアの組み合わせを変換して前記数値的尤度を生成することを含む。
前記アレル非相互作用特性に基づいて、対応する新生抗原のペプチド配列が提示されるかどうかを示す、前記アレル非相互作用特性についての依存性スコアを生成するために、1つ以上の提示モデルのうちのアレル非相互作用モデルを前記アレル非相互作用特性に適用することを含む。
1つ以上のMHCアレルの各MHCアレルについての前記依存性スコアを、前記アレル非相互作用特性についての依存性スコアと組み合わせることと、
前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す、前記MHCアレルについての対応するアレルごと尤度を生成するために、各MHCアレルについての前記組み合わされた依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記数値的尤度を生成することと、をさらに含む。
前記MHCアレルの各々についての依存性スコアと、前記アレル非相互作用特性についての依存性スコアとの組み合わせを変換することにより、前記数値的尤度を生成することを含む。
前記試料中に存在する前記訓練ペプチドのセットのペプチド存在量;
前記試料中の前記訓練ペプチドのセットのペプチド長に関連するデータをさらに含む。
a.MHCアレルと新生抗原コード化ペプチドとが結合する予測親和性;
b.新生抗原コード化ペプチド-MHC複合体の予測安定性;
c.新生抗原コード化ペプチドの配列及び長さ;
d.質量分析プロテオミクスまたは他の手段によって評価される、特定のMHCアレルを発現する他の個体由来の細胞の類似した配列を有する新生抗原コード化ペプチドの提示の確率;
e.対象とされる対象の特定のMHCアレルの発現レベル(例えば、RNA-seqまたは質量分析によって測定される);
f.特定のMHCアレルを発現する他の別個の個体における、特定のMHCアレルによる提示の、全体的な新生抗原コード化ペプチド配列とは独立した確率;
g.他の別個の対象における、同じ分子のファミリー(例えば、HLA-A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)のMHCアレルによる提示の、全体的な新生抗原コード化ペプチド配列とは独立した確率。
a.その由来源タンパク質配列内の、新生抗原コード化ペプチドに隣接するC末端及びN末端配列;
b.任意で、腫瘍細胞内の対応するプロテアーゼの発現(RNA-seqまたは質量分析によって測定される)にしたがって重み付けされる、新生抗原コード化ペプチド内のプロテアーゼ切断モチーフの存在;
c.適切な細胞タイプにおいて測定される由来源タンパク質の代謝回転速度;
d.RNA-seqもしくはプロテオーム質量分析によって測定される、または、DNAもしくはRNA配列データにおいて検出される生殖細胞系列もしくは体細胞系列スプライシング変異のアノテーションから予測される、腫瘍細胞に最も高発現している特定のスプライス変異体(「アイソフォーム」)を任意で考慮した、由来源タンパク質の長さ;
e.腫瘍細胞におけるプロテアソーム、イムノプロテアソーム、胸腺プロテアソーム、または他のプロテアーゼの発現のレベル(RNA-seq、プロテオーム質量分析、または免疫組織化学によって測定することができる);
f.新生抗原コード化ペプチドの由来源遺伝子の発現(例えば、RNA-seqまたは質量分析によって測定される);
g.細胞周期の異なる段階における新生抗原コード化ペプチドの由来源遺伝子の典型的な組織特異的発現;
h.例えば、uniProtまたはPDB http://www.rcsb.org/pdb/home/home.doにみることができるような、由来源タンパク質及び/またはそのドメインの特性の包括的なカタログ;
i.ペプチドを含む由来源タンパク質のドメインの性質を説明する特性、例えば、二次構造または三次構造(例えば、βシートに対するαヘリックス);選択的スプライシング;
j.他の別個の対象における、対象とされる新生抗原コード化ペプチドの由来源タンパク質に由来するペプチドの提示の確率;
k.ペプチドが、技術的バイアスのために質量分析によって検出されないか、または過剰に表現される確率;
l.腫瘍細胞、間質、または腫瘍浸潤リンパ球(TIL)の状態について情報を与える、RNASeqによって測定される、種々の遺伝子モジュール/経路の発現(ペプチドの由来源タンパク質を含む必要はない);
m.腫瘍細胞内の新生抗原コード化ペプチドの由来源遺伝子のコピー数;
n.ペプチドがTAPに結合する確率、またはTAPに対するペプチドの測定または予測される結合親和性;
o.腫瘍細胞におけるTAPの発現レベル(RNA-seq、プロテオーム質量分析、免疫組織化学によって測定することができる);
p.以下を含むがただしこれらに限定されない、腫瘍変異の有無:
i.EGFR、KRAS、ALK、RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3などの公知のがんドライバー遺伝子におけるドライバー変異、
ii.抗原提示マシナリーに関与するタンパク質をコードする遺伝子(例えば、B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5、または、プロテアソームもしくはイムノプロテアソームの構成要素をコードする遺伝子のいずれか)における変異;その提示が、腫瘍において機能喪失変異を生ずる抗原提示マシナリーの構成要素に依存するペプチドは、提示の確率が低い;
q.以下を含むがただしこれらに限定されない、機能的生殖細胞系列多型の有無:
i.抗原提示マシナリーに関与するタンパク質をコードする遺伝子(例えば、B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5、または、プロテアソームもしくはイムノプロテアソームの構成要素をコードする遺伝子のいずれか)における多型;
r.腫瘍タイプ(例えば、NSCLC、メラノーマ);
s.臨床的腫瘍サブタイプ(例えば、扁平上皮肺癌対非扁平上皮);
t.喫煙歴;
u.任意でドライバー変異によって層別化される、関連する腫瘍タイプまたは臨床的サブタイプにおけるペプチドの由来源遺伝子の典型的な発現。
複数の試料に由来する主要組織適合性複合体(MHC)から溶出された複数の単離ペプチドに関連するデータを含む質量分析データを受け取る工程と、
前記試料中に存在する訓練ペプチド配列のセット及び各訓練ペプチド配列に関連する1つ以上のMHCを少なくとも特定することにより、訓練データセットを取得する工程と、
前記訓練ペプチド配列を含む訓練データセットを用いて、提示モデルの数値的パラメータのセットを訓練する工程であって、前記提示モデルが、腫瘍細胞表面上の1つ以上のMHCアレルによって腫瘍細胞由来のペプチド配列が提示される複数の数値的尤度を与える、工程と、を実行することを含む方法も開示される。
ペプチド配列の特定の位置の特定のアミノ酸の存在と、
前記特定の位置に前記特定のアミノ酸を有する前記ペプチド配列の、腫瘍細胞上のMHCアレルのうちの1つによる提示の尤度との間の依存性を表す。
前記試料中に存在する前記訓練ペプチドのセットのペプチド存在量;
前記試料中の前記訓練ペプチドのセットのペプチド長に関連するデータをさらに含む。
既知のタンパク質配列のセットを含むデータベースとのアラインメントにより訓練ペプチド配列のセットを比較することによって、前記訓練ペプチド配列に基づいて、前記訓練ペプチド配列よりも長くかつ前記訓練ペプチド配列を含む前記訓練タンパク質配列のセットを取得することを含む。
細胞株からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得するために、細胞株に対して質量分析を行うかまたは質量分析がこれまでに行われていることを含んでもよく、前記ヌクレオチドシークエンシングデータは、変異を含む少なくとも1つのタンパク質配列を含む。
ワン・ホット(one-hot)エンコーディングスキームを用いて前記訓練ペプチド配列をコードすることを含む。
正常組織試料からエクソーム、トランスクリプトーム、及び全ゲノムの正常ヌクレオチドシークエンシングデータのうちの少なくとも1つを取得することと、
前記正常ヌクレオチドシークエンシングデータを用いて、前記提示モデルの前記パラメータのセットを訓練することと、を含む。
前記パラメータのセットのロジスティック回帰を行うことを含む。
レフトパディング(left-padded)ワン・ホットエンコーディングスキームを用いて前記訓練ペプチド配列をコードすることを含む。
ディープラーニングアルゴリズムを用いて前記パラメータのセットについて値を決定することを含む。
複数の新鮮なまたは凍結腫瘍試料に由来する主要組織適合性複合体(MHC)から溶出された複数の単離ペプチドに関連するデータを含む質量分析データを受け取る工程と、
前記腫瘍試料中に存在し、各訓練ペプチド配列に関連する1つ以上のMHCアレル上に提示される訓練ペプチド配列のセットを少なくとも特定することにより、訓練データセットを取得する工程と、
前記訓練ペプチド配列に基づいて、訓練タンパク質配列のセットを取得する工程と、
前記訓練タンパク質配列及び前記訓練ペプチド配列を用いて、提示モデルの数値的パラメータのセットを訓練する工程であって、前記提示モデルが、腫瘍細胞表面上の1つ以上のMHCアレルによって腫瘍細胞由来のペプチド配列が提示される複数の数値的尤度を与える、工程と、を含む方法が開示される。
MHCアレルのうちの特定の1つとペプチド配列の特定の位置の特定のアミノ酸とのペアの存在と、
前記ペアの前記MHCアレルのうちの特定の1つによる、前記特定の位置に前記特定のアミノ酸を含むそのようなペプチド配列の腫瘍細胞表面上での提示の尤度と、の間の依存性を表す。
SEQUENCE LISTING
<110> GRITSTONE BIO, INC.
<120> ALPHAVIRUS NEOANTIGEN VECTORS
<150> US 62/590,163
<151> 2017-11-22
<150> US 62/523,201
<151> 2017-06-21
<150> US 62/503,283
<151> 2017-05-08
<160> 193
<170> PatentIn version 3.5
<210> 1
<211> 36519
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600
gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660
atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720
tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780
tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840
tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900
gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960
caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020
gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080
ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140
agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200
ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260
acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320
attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380
gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440
taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500
aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560
atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620
tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680
tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740
atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800
tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860
gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920
cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980
agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040
ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100
aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160
agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220
ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280
gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340
tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400
gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460
caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520
tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580
tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640
agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700
cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760
cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820
gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880
ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940
gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000
cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060
cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120
gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180
gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240
atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300
ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360
caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420
ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480
cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540
gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600
gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660
ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720
gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780
cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840
gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900
ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960
cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020
tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080
tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140
ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200
tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260
ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320
ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380
gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440
ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500
ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560
tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620
gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680
gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740
ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800
ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860
ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920
tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980
gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040
aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100
cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160
gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220
cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280
tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340
gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400
gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460
actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520
aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580
tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640
ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700
ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760
gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820
tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880
gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940
gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000
cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060
cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120
cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180
tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240
cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300
cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360
ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420
ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480
ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540
ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600
aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660
tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720
gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780
ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840
cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900
cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960
catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020
ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080
agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140
gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200
ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260
tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320
ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380
tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440
agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500
tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560
tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620
actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680
ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740
gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800
accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860
gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920
gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980
cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040
tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100
cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160
ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220
cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280
ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340
ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400
ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880
ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940
gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240
ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300
gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420
cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480
ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540
ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600
aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660
gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720
caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780
ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840
ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900
caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960
gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020
ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080
gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140
gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200
gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260
ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320
gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380
gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500
ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560
atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620
gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680
ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740
ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800
ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860
tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920
tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980
ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040
gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100
agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160
gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220
gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280
cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340
cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400
catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460
tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520
ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580
gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640
taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700
ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760
cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820
gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880
catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940
ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000
gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060
gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120
caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180
aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240
aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300
ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360
accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420
caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480
gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540
gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600
agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660
tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720
tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780
tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840
gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900
aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960
tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020
ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080
gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140
cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200
ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260
tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320
tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380
gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440
atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500
ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560
agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620
cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680
aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740
ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800
gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860
tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920
cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980
ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040
cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100
acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160
acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220
ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280
tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340
cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400
agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460
tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520
agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580
gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640
acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700
aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760
tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820
ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880
aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940
ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000
acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060
tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120
ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180
tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240
cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300
cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360
cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420
cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480
ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540
ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600
ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660
acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720
tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780
ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840
cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900
gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960
cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020
ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080
ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140
gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200
gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260
attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320
ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380
caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440
ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500
ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560
gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620
gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680
catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740
cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800
gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860
gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920
caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980
ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040
cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100
tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160
tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220
aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280
cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340
gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400
tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460
gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520
cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580
cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640
tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700
gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760
ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820
ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880
gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940
cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000
ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060
ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120
cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180
gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240
tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300
cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360
ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420
acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480
tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540
acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600
tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660
actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720
catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780
tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840
caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900
acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960
agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020
aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080
gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140
aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200
atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260
tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320
agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380
ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440
atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500
gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560
ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620
gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680
ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740
ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800
actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860
tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920
acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980
tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040
gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100
tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160
gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220
ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280
tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340
tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400
accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460
accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520
acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580
acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640
tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700
aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760
ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820
ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880
tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940
ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000
ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060
tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120
ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180
cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240
ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300
gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360
cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420
ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480
gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540
gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600
caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660
ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720
ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780
tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840
agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900
ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960
ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020
atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080
gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140
cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200
catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260
ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320
gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380
ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440
caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500
cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560
ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620
cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680
ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740
gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800
gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860
agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920
caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980
gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040
cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100
atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160
cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220
cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280
gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340
ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400
ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460
gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520
agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580
gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640
gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700
cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760
ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820
cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880
gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940
ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000
cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060
ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120
aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180
gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240
cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300
catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360
gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420
actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480
cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540
cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600
catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660
ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720
catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780
gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840
ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900
tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960
gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020
cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080
ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140
ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200
cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260
gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320
ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380
ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440
ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500
gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560
cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620
tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680
aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740
cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800
gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860
agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920
tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980
tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040
aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100
gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160
aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220
gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280
agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340
gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400
tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460
gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520
ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580
ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640
tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700
gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760
gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820
gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880
acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940
cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000
gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060
ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120
ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180
ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240
gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300
cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360
tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420
gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480
aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540
agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600
actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660
gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720
cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780
accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840
acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900
tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960
acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020
caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080
tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140
gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200
cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260
gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320
caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380
gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440
cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500
tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560
tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620
tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680
agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740
actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800
atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860
agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920
aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980
ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040
tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100
gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160
cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220
ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280
atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340
atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400
aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460
tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520
tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580
tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640
tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700
tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760
aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820
gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880
cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940
ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000
aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060
gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120
gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180
agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240
ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300
gcatttttga tgtgggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360
gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420
gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480
cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540
attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600
cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660
caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720
gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780
cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840
tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900
gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960
ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020
gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080
gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140
aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200
accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260
ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320
ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380
cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440
caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500
cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560
ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620
cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680
cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740
gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800
cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860
atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920
tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980
caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040
ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100
ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160
gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220
aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280
cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340
gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400
ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460
ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520
acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580
ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640
ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700
tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760
acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820
tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880
acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940
ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000
agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060
gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120
cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180
aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240
atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300
agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360
gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420
cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480
taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540
ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600
tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660
gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720
cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780
agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840
gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900
cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960
gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020
gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080
acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140
gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200
caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260
cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320
ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380
gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440
ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500
attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560
gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620
cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680
tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740
tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800
gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860
tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920
agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980
aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040
ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100
gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160
tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220
ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280
ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340
cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400
taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460
aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520
tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580
aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640
tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700
gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760
gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820
attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880
tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940
gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000
aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060
agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120
agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180
tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240
aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300
gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360
acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420
cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480
aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519
<210> 2
<211> 31588
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320
atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380
agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440
gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500
gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560
tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620
ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680
ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740
gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800
cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860
tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920
agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980
acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040
tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100
gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160
accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220
agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280
tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340
cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400
gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460
cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520
tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580
atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640
gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700
gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760
agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820
gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880
gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180
taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240
ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300
aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360
tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420
ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480
cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540
ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600
ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660
ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720
aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780
cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840
cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900
tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960
gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020
cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080
aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140
ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200
aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260
atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320
cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380
aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440
ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500
tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560
ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620
tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680
ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740
cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800
atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860
tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920
agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980
gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040
cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100
cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160
tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220
cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280
cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340
gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400
gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460
gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520
tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580
ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640
gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700
gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760
ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820
aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880
ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940
tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000
tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060
tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120
ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180
tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240
tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300
ccagggcagc ttgccattcg cgcacggcca gcgcgcgctc gtagggactg aggggcgtgc 6360
cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420
ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480
gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540
tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600
tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660
gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720
agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780
cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840
gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900
ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960
cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020
ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080
aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140
aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200
agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260
ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320
cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380
ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440
cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500
gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560
tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620
tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680
accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740
actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800
gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860
gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920
tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980
ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040
tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100
ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160
gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220
acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280
gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340
gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400
gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460
gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520
cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580
tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640
cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700
atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760
gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820
gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880
ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940
ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000
gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060
ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120
cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180
ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240
gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300
agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360
gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420
atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480
gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540
acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600
catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660
gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720
ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780
tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840
cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900
gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960
gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020
gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080
gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140
ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200
tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260
cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320
gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380
ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440
gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500
tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560
tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620
actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680
gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740
ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800
gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860
ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920
cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980
gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040
ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100
aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160
gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220
ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280
gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340
catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400
ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460
agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520
gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580
gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640
cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700
ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760
ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820
cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880
tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940
gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000
ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060
aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120
gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180
gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240
ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300
aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360
tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420
caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480
acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540
acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600
gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660
cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720
aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780
cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840
gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900
atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960
aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020
atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080
cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140
tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200
ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260
ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320
aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380
tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440
gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500
tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560
cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620
catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680
gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740
cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800
cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860
tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920
gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980
agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040
ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100
tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160
agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220
ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280
gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340
accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400
ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460
gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520
ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580
cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640
caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700
agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760
ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820
cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880
tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940
cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000
tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060
agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120
ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180
tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240
tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300
ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360
ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420
gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480
gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540
tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600
accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660
gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720
cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780
gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840
gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900
gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960
ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020
aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080
gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140
ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200
cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260
gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320
cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380
ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440
ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500
caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560
gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620
catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680
gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740
gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800
caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860
gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920
catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980
gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040
atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100
ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160
gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220
aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280
tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340
cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400
gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460
ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520
ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580
ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640
gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700
gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760
gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820
cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880
cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940
gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000
ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060
accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120
tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180
gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240
accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300
gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360
ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420
tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480
agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540
aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600
aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660
ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720
gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780
ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840
tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900
ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960
gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020
actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080
tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140
acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200
gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260
gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320
cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380
tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440
ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500
agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560
gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620
tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680
gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740
ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800
gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860
cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920
cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980
acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040
ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100
aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160
cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220
actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280
agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340
tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400
gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460
tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520
cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580
acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640
gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700
ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760
aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820
tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880
cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940
cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000
cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060
cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120
gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180
ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240
caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300
ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360
caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420
caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480
tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540
gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600
tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660
cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720
gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780
cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840
gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900
cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960
gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020
atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080
ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140
gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200
gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260
cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320
ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380
ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440
gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500
cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560
gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620
ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680
gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740
ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800
cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860
gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920
cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980
tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040
aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100
gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160
gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220
ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280
ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340
tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400
agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460
gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520
tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580
cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640
caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700
cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760
ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820
cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880
cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940
cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000
gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060
ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120
ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180
tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240
gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300
cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360
gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420
gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480
ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540
gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600
cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660
gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720
tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780
cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840
cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900
gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960
ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020
cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080
cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140
atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200
ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260
ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320
gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380
acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440
aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500
aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560
tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620
tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680
ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740
ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800
gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860
agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920
aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980
ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040
ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100
gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160
cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220
catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280
cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340
cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400
gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460
ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520
agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580
ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640
ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700
gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760
ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820
caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880
catcagcgag tcggtggacg gctacgattg aaactaatca cccccttatc cagtgaaata 26940
aagatcatat tgatgatgat tttacagaaa taaaaaataa tcatttgatt tgaaataaag 27000
atacaatcat attgatgatt tgagtttaac aaaaaaataa agaatcactt acttgaaatc 27060
tgataccagg tctctgtcca tgttttctgc caacaccact tcactcccct cttcccagct 27120
ctggtactgc aggccccggc gggctgcaaa cttcctccac acgctgaagg ggatgtcaaa 27180
ttcctcctgt ccctcaatct tcattttatc ttctatcaga tgtccaaaaa gcgcgtccgg 27240
gtggatgatg acttcgaccc cgtctacccc tacgatgcag acaacgcacc gaccgtgccc 27300
ttcatcaacc cccccttcgt ctcttcagat ggattccaag agaagcccct gggggtgttg 27360
tccctgcgac tggccgaccc cgtcaccacc aagaacgggg aaatcaccct caagctggga 27420
gagggggtgg acctcgattc ctcgggaaaa ctcatctcca acacggccac caaggccgcc 27480
gcccctctca gtttttccaa caacaccatt tcccttaaca tggatcaccc cttttacact 27540
aaagatggaa aattatcctt acaagtttct ccaccattaa atatactgag aacaagcatt 27600
ctaaacacac tagctttagg ttttggatca ggtttaggac tccgtggctc tgccttggca 27660
gtacagttag tctctccact tacatttgat actgatggaa acataaagct taccttagac 27720
agaggtttgc atgttacaac aggagatgca attgaaagca acataagctg ggctaaaggt 27780
ttaaaatttg aagatggagc catagcaacc aacattggaa atgggttaga gtttggaagc 27840
agtagtacag aaacaggtgt tgatgatgct tacccaatcc aagttaaact tggatctggc 27900
cttagctttg acagtacagg agccataatg gctggtaaca aagaagacga taaactcact 27960
ttgtggacaa cacctgatcc atcaccaaac tgtcaaatac tcgcagaaaa tgatgcaaaa 28020
ctaacacttt gcttgactaa atgtggtagt caaatactgg ccactgtgtc agtcttagtt 28080
gtaggaagtg gaaacctaaa ccccattact ggcaccgtaa gcagtgctca ggtgtttcta 28140
cgttttgatg caaacggtgt tcttttaaca gaacattcta cactaaaaaa atactggggg 28200
tataggcagg gagatagcat agatggcact ccatatacca atgctgtagg attcatgccc 28260
aatttaaaag cttatccaaa gtcacaaagt tctactacta aaaataatat agtagggcaa 28320
gtatacatga atggagatgt ttcaaaacct atgcttctca ctataaccct caatggtact 28380
gatgacagca acagtacata ttcaatgtca ttttcataca cctggactaa tggaagctat 28440
gttggagcaa catttggggc taactcttat accttctcat acatcgccca agaatgaaca 28500
ctgtatccca ccctgcatgc caacccttcc caccccactc tgtggaacaa actctgaaac 28560
acaaaataaa ataaagttca agtgttttat tgattcaaca gttttacagg attcgagcag 28620
ttatttttcc tccaccctcc caggacatgg aatacaccac cctctccccc cgcacagcct 28680
tgaacatctg aatgccattg gtgatggaca tgcttttggt ctccacgttc cacacagttt 28740
cagagcgagc cagtctcggg tcggtcaggg agatgaaacc ctccgggcac tcccgcatct 28800
gcacctcaca gctcaacagc tgaggattgt cctcggtggt cgggatcacg gttatctgga 28860
agaagcagaa gagcggcggt gggaatcata gtccgcgaac gggatcggcc ggtggtgtcg 28920
catcaggccc cgcagcagtc gctgccgccg ccgctccgtc aagctgctgc tcagggggtc 28980
cgggtccagg gactccctca gcatgatgcc cacggccctc agcatcagtc gtctggtgcg 29040
gcgggcgcag cagcgcatgc ggatctcgct caggtcgctg cagtacgtgc aacacagaac 29100
caccaggttg ttcaacagtc catagttcaa cacgctccag ccgaaactca tcgcgggaag 29160
gatgctaccc acgtggccgt cgtaccagat cctcaggtaa atcaagtggt gccccctcca 29220
gaacacgctg cccacgtaca tgatctcctt gggcatgtgg cggttcacca cctcccggta 29280
ccacatcacc ctctggttga acatgcagcc ccggatgatc ctgcggaacc acagggccag 29340
caccgccccg cccgccatgc agcgaagaga ccccgggtcc cggcaatggc aatggaggac 29400
ccaccgctcg tacccgtgga tcatctggga gctgaacaag tctatgttgg cacagcacag 29460
gcatatgctc atgcatctct tcagcactct caactcctcg ggggtcaaaa ccatatccca 29520
gggcacgggg aactcttgca ggacagcgaa ccccgcagaa cagggcaatc ctcgcacaga 29580
acttacattg tgcatggaca gggtatcgca atcaggcagc accgggtgat cctccaccag 29640
agaagcgcgg gtctcggtct cctcacagcg tggtaagggg gccggccgat acgggtgatg 29700
gcgggacgcg gctgatcgtg ttcgcgaccg tgtcatgatg cagttgcttt cggacatttt 29760
cgtacttgct gtagcagaac ctggtccggg cgctgcacac cgatcgccgg cggcggtctc 29820
ggcgcttgga acgctcggtg ttgaaattgt aaaacagcca ctctctcaga ccgtgcagca 29880
gatctagggc ctcaggagtg atgaagatcc catcatgcct gatggctctg atcacatcga 29940
ccaccgtgga atgggccaga cccagccaga tgatgcaatt ttgttgggtt tcggtgacgg 30000
cgggggaggg aagaacagga agaaccatga ttaactttta atccaaacgg tctcggagta 30060
cttcaaaatg aagatcgcgg agatggcacc tctcgccccc gctgtgttgg tggaaaataa 30120
cagccaggtc aaaggtgata cggttctcga gatgttccac ggtggcttcc agcaaagcct 30180
ccacgcgcac atccagaaac aagacaatag cgaaagcggg agggttctct aattcctcaa 30240
tcatcatgtt acactcctgc accatcccca gataattttc atttttccag ccttgaatga 30300
ttcgaactag ttcctgaggt aaatccaagc cagccatgat aaagagctcg cgcagagcgc 30360
cctccaccgg cattcttaag cacaccctca taattccaag atattctgct cctggttcac 30420
ctgcagcaga ttgacaagcg gaatatcaaa atctctgccg cgatccctga gctcctccct 30480
cagcaataac tgtaagtact ctttcatatc ctctccgaaa tttttagcca taggaccacc 30540
aggaataaga ttagggcaag ccacagtaca gataaaccga agtcctcccc agtgagcatt 30600
gccaaatgca agactgctat aagcatgctg gctagacccg gtgatatctt ccagataact 30660
ggacagaaaa tcgcccaggc aatttttaag aaaatcaaca aaagaaaaat cctccaggtg 30720
gacgtttaga gcctcgggaa caacgatgaa gtaaatgcaa gcggtgcgtt ccagcatggt 30780
tagttagctg atctgtagaa aaaacaaaaa tgaacattaa accatgctag cctggcgaac 30840
aggtgggtaa atcgttctct ccagcaccag gcaggccacg gggtctccgg cgcgaccctc 30900
gtaaaaattg tcgctatgat tgaaaaccat cacagagaga cgttcccggt ggccggcgtg 30960
aatgattcga caagatgaat acacccccgg aacattggcg tccgcgagtg aaaaaaagcg 31020
cccgaggaag caataaggca ctacaatgct cagtctcaag tccagcaaag cgatgccatg 31080
cggatgaagc acaaaattct caggtgcgta caaaatgtaa ttactcccct cctgcacagg 31140
cagcaaagcc cccgatccct ccaggtacac atacaaagcc tcagcgtcca tagcttaccg 31200
agcagcagca cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc 31260
gctctctgct caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata 31320
cccgccaaat aatcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa 31380
atacgcgcac ttcctcaaac gcccaaaact gccgtcattt ccgggttccc acgctacgtc 31440
atcaaaacac gactttcaaa ttccgtcgac cgttaaaaac gtcacccgcc ccgcccctaa 31500
cggtcgcccg tctctcagcc aatcagcgcc ccgcatcccc aaattcaaac acctcatttg 31560
catattaacg cgcacaaaaa gtttgagg 31588
<210> 3
<211> 11447
<212> DNA
<213> Venezuelan equine encephalitis virus
<400> 3
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620
ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680
attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740
gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800
gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860
acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920
gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980
ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040
cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100
gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160
cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220
tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280
tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340
gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400
catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460
aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520
gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580
taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640
ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700
acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760
gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820
atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880
aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940
gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000
agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060
gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120
caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180
gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240
cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300
agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360
caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420
actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480
cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540
ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600
aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660
caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720
ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780
taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840
ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900
gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960
gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020
gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080
ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140
cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200
atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260
catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320
cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380
ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440
tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500
cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560
tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620
agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680
agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740
agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800
cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860
caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920
gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980
gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040
cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100
ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160
tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220
gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280
ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340
attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400
ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447
<210> 4
<211> 9577
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560
ttaagccacc atggcaggca tgtttcaggc gctgagcgaa ggctgcaccc cgtatgatat 7620
taaccagatg ctgaacgtgc tgggcgatca tcaggtctca ggccttgagc agcttgagag 7680
tataatcaac tttgaaaaac tgactgaatg gaccagttct aatgttatgc ctatcctgtc 7740
tcctctgaca aagggcatcc tgggcttcgt gtttaccctg accgtgcctt ctgagagagg 7800
acttagctgc attagcgaag cggatgcgac caccccggaa agcgcgaacc tgggcgaaga 7860
aattctgagc cagctgtatc tttggccaag ggtgacctac cattccccta gttatgctta 7920
ccaccaattt gaaagacgag ccaaatataa aagacacttc cccggctttg gccagagcct 7980
gctgtttggc taccctgtgt acgtgttcgg cgattgcgtg cagggcgatt gggatgcgat 8040
tcgctttcgc tattgcgcgc cgccgggcta tgcgctgctg cgctgcaacg ataccaacta 8100
tagcgctctg ctggctgtgg gggccctaga aggacccagg aatcaggact ggcttggtgt 8160
cccaagacaa cttgtaactc ggatgcaggc tattcagaat gccggcctgt gtaccctggt 8220
ggccatgctg gaagagacaa tcttctggct gcaagcgttt ctgatggcgc tgaccgatag 8280
cggcccgaaa accaacatta ttgtggatag ccagtatgtg atgggcatta gcaaaccgag 8340
ctttcaggaa tttgtggatt gggaaaacgt gagcccggaa ctgaacagca ccgatcagcc 8400
gttttggcaa gccggaatcc tggccagaaa tctggtgcct atggtggcca cagtgcaggg 8460
ccagaacctg aagtaccagg gtcagtcact agtcatctct gcttctatca ttgtcttcaa 8520
cctgctggaa ctggaaggtg attatcgaga tgatggcaac gtgtgggtgc ataccccgct 8580
gagcccgcgc accctgaacg cgtgggtgaa agcggtggaa gaaaaaaaag gtattccagt 8640
tcacctagag ctggccagta tgaccaacat ggagctcatg agcagtattg tgcatcagca 8700
ggtcagaaca tacggccccg tgttcatgtg tctcggcgga ctgcttacaa tggtggctgg 8760
tgctgtgtgg ctgacagtgc gagtgctcga gctgttccgg gccgcgcagc tggccaacga 8820
cgtggtcctc cagatcatgg agctttgtgg tgcagcgttt cgccaggtgt gccataccac 8880
cgtgccgtgg ccgaacgcga gcctgacccc gaaatggaac aacgaaacca cccagcccca 8940
gatcgccaac tgcagcgtgt atgacttttt tgtgtggctc cattattatt ctgttcgaga 9000
cacactttgg ccaagggtga cctaccatat gaacaaatat gcgtatcata tgctggaaag 9060
acgagccaaa tataaaagag gaccaggacc tggcgctaaa tttgtggccg cctggacact 9120
gaaagccgct gctggtcctg gacctggcca gtacatcaag gccaacagca agttcatcgg 9180
catcaccgaa ctcggacccg gaccaggctg atgattcgaa cggccgtatc acgcccaaac 9240
atttacagcc gcggtgtcaa aaaccgcgtg gacgtggtta acatccctgc tgggaggatc 9300
agccgtaatt attataattg gcttggtgct ggctactatt gtggccatgt acgtgctgac 9360
caaccagaaa cataattgaa tacagcagca attggcaagc tgcttacata gaactcgcgg 9420
cgattggcat gccgccttaa aatttttatt ttattttttc ttttcttttc cgaatcggat 9480
tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 9577
<210> 5
<211> 11447
<212> DNA
<213> Venezuelan equine encephalitis virus
<400> 5
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620
ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680
attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740
gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800
gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860
acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920
gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980
ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040
cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100
gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160
cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220
tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280
tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340
gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400
catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460
aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520
gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580
taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640
ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700
acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760
gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820
atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880
aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940
gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000
agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060
gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120
caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180
gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240
cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300
agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360
caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420
actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480
cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540
ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600
aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660
caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720
ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780
taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840
ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900
gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960
gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020
gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080
ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140
cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200
atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260
catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320
cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380
ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440
tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500
cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560
tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620
agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680
agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740
agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800
cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860
caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920
gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980
gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040
cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100
ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160
tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220
gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280
ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340
attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400
ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447
<210> 6
<211> 7894
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 6
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560
tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620
cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680
ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740
ttggcatgcc gccttaaaat ttttatttta ttttttcttt tcttttccga atcggatttt 7800
gtttttaata tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 7894
<210> 7
<211> 7893
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 7
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560
tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620
cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680
ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740
ttggcatgcc gccttaaaat ttttatttta tttttctttt cttttccgaa tcggattttg 7800
tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 7893
<210> 8
<211> 7927
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 8
taatacgact cactatagga tgggcggcgc atgagagaag cccagaccaa ttacctaccc 60
aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120
cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180
gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240
acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300
tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360
ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420
gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480
tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540
acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600
accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660
gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720
cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780
ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840
ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900
gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960
ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020
acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080
gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140
gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200
aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260
gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320
tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380
atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440
ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500
cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560
gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620
cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680
acacctcgtg gcttgataaa ggttaccagc tacgctggcg aggacaagat cggctcttac 1740
gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800
gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860
taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920
ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980
catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040
cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100
gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160
gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220
tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280
ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340
aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400
cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460
ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520
ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580
cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640
tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700
ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760
cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820
acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880
acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940
ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000
acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060
gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120
gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180
gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240
ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300
aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360
cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420
atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480
agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540
ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600
ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660
ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720
tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780
aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840
gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900
gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960
gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020
acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080
attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140
ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200
gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260
ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320
tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380
accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440
gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500
actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560
tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620
ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680
tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740
gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800
tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860
catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920
gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980
tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040
gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100
gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160
ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220
caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280
tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340
gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400
agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460
catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520
agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580
cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640
ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700
tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760
caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820
atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880
ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940
gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000
gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060
ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120
actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180
gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240
aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300
ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360
ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420
aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480
aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540
ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600
aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660
gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720
aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780
gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840
tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900
ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960
catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020
acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080
ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140
tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200
gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260
gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320
cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380
acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440
gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500
tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560
actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620
ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680
ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740
tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat tttttctttt 7800
cttttccgaa tcggattttg tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaatacgtag 7920
tttaaac 7927
<210> 9
<211> 7926
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 9
taatacgact cactatagga taggcggcgc atgagagaag cccagaccaa ttacctaccc 60
aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120
cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180
gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240
acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300
tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360
ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420
gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480
tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540
acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600
accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660
gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720
cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780
ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840
ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900
gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960
ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020
acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080
gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140
gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200
aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260
gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320
tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380
atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440
ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500
cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560
gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620
cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680
acacctcgtg gcttgataaa ggttaccagc tacgatggcg aggacaagat cggctcttac 1740
gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800
gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860
taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920
ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980
catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040
cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100
gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160
gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220
tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280
ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340
aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400
cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460
ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520
ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580
cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640
tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700
ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760
cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820
acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880
acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940
ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000
acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060
gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120
gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180
gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240
ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300
aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360
cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420
atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480
agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540
ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600
ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660
ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720
tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780
aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840
gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900
gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960
gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020
acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080
attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140
ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200
gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260
ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320
tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380
accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440
gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500
actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560
tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620
ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680
tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740
gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800
tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860
catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920
gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980
tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040
gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100
gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160
ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220
caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280
tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340
gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400
agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460
catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520
agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580
cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640
ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700
tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760
caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820
atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880
ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940
gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000
gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060
ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120
actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180
gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240
aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300
ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360
ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420
aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480
aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540
ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600
aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660
gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720
aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780
gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840
tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900
ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960
catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020
acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080
ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140
tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200
gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260
gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320
cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380
acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440
gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500
tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560
actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620
ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680
ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740
tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat ttttcttttc 7800
ttttccgaat cggattttgt ttttaatatt tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aatacgtagt 7920
ttaaac 7926
<210> 10
<211> 36519
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 10
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600
gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660
atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720
tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780
tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840
tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900
gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960
caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020
gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080
ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140
agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200
ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260
acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320
attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380
gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440
taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500
aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560
atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620
tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680
tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740
atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800
tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860
gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920
cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980
agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040
ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100
aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160
agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220
ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280
gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340
tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400
gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460
caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520
tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580
tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640
agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700
cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760
cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820
gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880
ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940
gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000
cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060
cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120
gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180
gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240
atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300
ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360
caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420
ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480
cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540
gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600
gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660
ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720
gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780
cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840
gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900
ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960
cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020
tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080
tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140
ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200
tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260
ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320
ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380
gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440
ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500
ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560
tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620
gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680
gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740
ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800
ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860
ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920
tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980
gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040
aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100
cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160
gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220
cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280
tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340
gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400
gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460
actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520
aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580
tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640
ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700
ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760
gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820
tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880
gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940
gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000
cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060
cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120
cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180
tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240
cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300
cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360
ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420
ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480
ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540
ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600
aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660
tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720
gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780
ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840
cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900
cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960
catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020
ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080
agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140
gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200
ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260
tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320
ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380
tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440
agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500
tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560
tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620
actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680
ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740
gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800
accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860
gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920
gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980
cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040
tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100
cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160
ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220
cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280
ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340
ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400
ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880
ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940
gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240
ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300
gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420
cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480
ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540
ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600
aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660
gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720
caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780
ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840
ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900
caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960
gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020
ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080
gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140
gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200
gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260
ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320
gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380
gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440
gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500
ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560
atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620
gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680
ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740
ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800
ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860
tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920
tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980
ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040
gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100
agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160
gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220
gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280
cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340
cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400
catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460
tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520
ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580
gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640
taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700
ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760
cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820
gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880
catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940
ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000
gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060
gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120
caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180
aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240
aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300
ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360
accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420
caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480
gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540
gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600
agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660
tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720
tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780
tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840
gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900
aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960
tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020
ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080
gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140
cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200
ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260
tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320
tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380
gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440
atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500
ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560
agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620
cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680
aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740
ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800
gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860
tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920
cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980
ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040
cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100
acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160
acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220
ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280
tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340
cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400
agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460
tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520
agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580
gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640
acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700
aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760
tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820
ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880
aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940
ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000
acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060
tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120
ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180
tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240
cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300
cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360
cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420
cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480
ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540
ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600
ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660
acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720
tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780
ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840
cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900
gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960
cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020
ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080
ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140
gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200
gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260
attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320
ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380
caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440
ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500
ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560
gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620
gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680
catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740
cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800
gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860
gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920
caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980
ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040
cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100
tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160
tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220
aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280
cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340
gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400
tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460
gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520
cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580
cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640
tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700
gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760
ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820
ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880
gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940
cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000
ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060
ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120
cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180
gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240
tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300
cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360
ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420
acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480
tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540
acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600
tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660
actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720
catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780
tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840
caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900
acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960
agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020
aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080
gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140
aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200
atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260
tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320
agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380
ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440
atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500
gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560
ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620
gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680
ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740
ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800
actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860
tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920
acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980
tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040
gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100
tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160
gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220
ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280
tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340
tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400
accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460
accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520
acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580
acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640
tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700
aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760
ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820
ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880
tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940
ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000
ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060
tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120
ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180
cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240
ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300
gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360
cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420
ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480
gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540
gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600
caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660
ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720
ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780
tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840
agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900
ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960
ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020
atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080
gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140
cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200
catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260
ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320
gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380
ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440
caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500
cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560
ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620
cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680
ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740
gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800
gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860
agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920
caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980
gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040
cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100
atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160
cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220
cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280
gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340
ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400
ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460
gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520
agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580
gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640
gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700
cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760
ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820
cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880
gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940
ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000
cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060
ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120
aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180
gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240
cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300
catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360
gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420
actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480
cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540
cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600
catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660
ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720
catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780
gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840
ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900
tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960
gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020
cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080
ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140
ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200
cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260
gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320
ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380
ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440
ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500
gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560
cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620
tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680
aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740
cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800
gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860
agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920
tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980
tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040
aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100
gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160
aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220
gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280
agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340
gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400
tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460
gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520
ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580
ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640
tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700
gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760
gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820
gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880
acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940
cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000
gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060
ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120
ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180
ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240
gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300
cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360
tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420
gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480
aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540
agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600
actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660
gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720
cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780
accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840
acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900
tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960
acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020
caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080
tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140
gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200
cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260
gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320
caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380
gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440
cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500
tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560
tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620
tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680
agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740
actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800
atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860
agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920
aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980
ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040
tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100
gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160
cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220
ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280
atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340
atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400
aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460
tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520
tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580
tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640
tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700
tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760
aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820
gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880
cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940
ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000
aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060
gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120
gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180
agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240
ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300
gcatttttga tgttggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360
gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420
gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480
cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540
attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600
cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660
caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720
gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780
cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840
tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900
gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960
ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020
gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080
gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140
aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200
accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260
ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320
ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380
cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440
caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500
cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560
ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620
cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680
cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740
gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800
cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860
atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920
tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980
caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040
ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100
ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160
gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220
aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280
cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340
gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400
ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460
ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520
acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580
ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640
ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700
tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760
acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820
tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880
acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940
ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000
agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060
gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120
cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180
aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240
atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300
agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360
gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420
cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480
taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540
ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600
tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660
gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720
cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780
agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840
gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900
cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960
gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020
gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080
acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140
gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200
caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260
cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320
ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380
gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440
ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500
attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560
gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620
cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680
tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740
tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800
gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860
tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920
agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980
aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040
ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100
gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160
tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220
ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280
ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340
cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400
taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460
aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520
tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580
aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640
tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700
gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760
gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820
attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880
tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940
gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000
aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060
agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120
agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180
tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240
aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300
gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360
acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420
cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480
aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519
<210> 11
<211> 31867
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 11
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920
tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980
tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220
aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280
ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340
gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400
gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460
cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520
gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580
ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640
cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700
gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760
tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820
ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880
tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940
ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000
tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060
acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120
aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180
ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240
agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300
aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360
gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420
ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480
gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540
tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600
gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660
ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720
agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780
atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840
agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900
tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960
agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020
cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080
ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140
tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200
ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260
aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320
agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380
cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440
tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500
ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560
cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620
ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680
aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740
gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800
cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860
gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920
tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980
tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040
agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100
cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160
ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220
cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280
gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340
ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400
gcacggccag cgcgctctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460
gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520
tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580
gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640
cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700
agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760
tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820
tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880
cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940
gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000
aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060
ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120
agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180
tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240
ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300
cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360
cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420
gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480
cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540
tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600
cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660
cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720
gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780
tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840
agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900
ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960
ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020
cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080
gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140
gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200
tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260
tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320
tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380
caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440
aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500
ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560
gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620
ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680
ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740
ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800
ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860
gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920
gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980
cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040
acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100
cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160
tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220
gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280
ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340
ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400
gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460
gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520
ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580
gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640
gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700
ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760
gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820
ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880
gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940
cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000
ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060
gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120
catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180
gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240
gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300
ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360
ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420
tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480
agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540
gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600
gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660
cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720
ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780
gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840
ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900
gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960
gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020
gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080
ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140
ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200
gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260
ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320
gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380
gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440
gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500
ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560
cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620
ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680
ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740
ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800
aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860
ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920
atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980
gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040
caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100
cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160
gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220
gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280
cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340
cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400
ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460
cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520
ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580
ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640
cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700
gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760
ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820
ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880
ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940
aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000
ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060
tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120
ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180
cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240
ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300
aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360
gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420
atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480
gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540
cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600
ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660
atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720
gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780
ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840
tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900
gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960
cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020
tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080
gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140
agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200
gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260
aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320
ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380
gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440
tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500
gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560
tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620
tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680
tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740
cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800
agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860
tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920
cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980
cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040
tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100
ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160
cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220
ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280
gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340
gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400
gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460
tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520
ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580
cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640
cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700
gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760
cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820
cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880
gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940
gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000
ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060
aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120
ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180
gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240
ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300
gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360
ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420
gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480
ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540
ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600
ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660
aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720
ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780
gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840
cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900
ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960
cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020
ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080
ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140
cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200
atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260
cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320
tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380
acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440
gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500
aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560
agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620
ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680
cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740
cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800
cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860
caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920
ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980
gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040
agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100
tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160
gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220
acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280
ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340
acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400
aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460
tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520
aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580
agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640
cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700
atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760
ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820
aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880
atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940
acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000
atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060
ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120
actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180
cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240
tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300
acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360
actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420
atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480
gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540
tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600
ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660
tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720
accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780
ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840
tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900
tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960
tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020
tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080
tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140
ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200
ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260
acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320
gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380
gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440
actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500
ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560
actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620
cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680
agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740
tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800
tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860
ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920
gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980
aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040
catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100
attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160
gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220
ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280
gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340
gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400
cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460
ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520
ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580
cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640
aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700
atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760
gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820
ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880
cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940
gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000
gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060
ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120
catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180
ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240
agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300
cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360
cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420
gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480
ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540
gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600
cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660
ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720
cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780
gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840
ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900
ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960
gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020
agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080
cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140
gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200
gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260
aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320
gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380
cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440
cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500
gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560
cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620
cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680
cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740
ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800
cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860
ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920
ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980
tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040
caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100
tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160
gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220
cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280
gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340
cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400
cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460
catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520
ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580
gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640
gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700
ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760
cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820
aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880
gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940
ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000
caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060
gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120
gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180
ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240
gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300
atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360
tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420
agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480
aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540
tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600
cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660
ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720
ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780
cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840
gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900
acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960
tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020
gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080
gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140
cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200
tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260
attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320
tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380
ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440
tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500
ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560
gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620
tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680
gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740
tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800
tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860
tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920
cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980
ctacgattga atgtcccatg gtggcgcagc tgacctagct cggcttcgac acctggacca 26040
ctgccgccgc ttccgctgct tcgctcggga tctcgccgag tttgcctact ttgagctgcc 26100
cgaggagcac cctcagggcc cggcccacgg agtgcggatc gtcgtcgaag ggggcctcga 26160
ctcccacctg cttcggatct tcagccagcg tccgatcctg gtcgagcgcg agcaaggaca 26220
gacccttctg actctgtact gcatctgcaa ccaccccggc ctgcatgaaa gtctttgttg 26280
tctgctgtgt actgagtata ataaaagctg agatcagcga ctactccgga cttccgtgtg 26340
ttcctgaatc catcaaccag tctttgttct tcaccgggaa cgagaccgag ctccagctcc 26400
agtgtaagcc ccacaagaag tacctcacct ggctgttcca gggctccccg atcgccgttg 26460
tcaaccactg cgacaacgac ggagtcctgc tgagcggccc tgccaacctt actttttcca 26520
cccgcagaag caagctccag ctcttccaac ccttcctccc cgggacctat cagtgcgtct 26580
cgggaccctg ccatcacacc ttccacctga tcccgaatac cacagcgtcg ctccccgcta 26640
ctaacaacca aactaacctc caccaacgcc accgtcgcga cggccacaat acatgcccat 26700
attagactat gaggccgagc cacagcgacc catgctcccc gctattagtt acttcaatct 26760
aaccggcgga gatgactgac ccactggcca acaacaacgt caacgacctt ctcctggaca 26820
tggacggccg cgcctcggag cagcgactcg cccaacttcg cattcgccag cagcaggaga 26880
gagccgtcaa ggagctgcag gatgcggtgg ccatccacca gtgcaagaga ggcatcttct 26940
gcctggtgaa acaggccaag atctcctacg aggtcactcc aaacgaccat cgcctctcct 27000
acgagctcct gcagcagcgc cagaagttca cctgcctggt cggagtcaac cccatcgtca 27060
tcacccagca gtctggcgat accaaggggt gcatccactg ctcctgcgac tcccccgact 27120
gcgtccacac tctgatcaag accctctgcg gcctccgcga cctcctcccc atgaactaat 27180
caccccctta tccagtgaaa taaagatcat attgatgatg attttacaga aataaaaaat 27240
aatcatttga tttgaaataa agatacaatc atattgatga tttgagttta acaaaaaaat 27300
aaagaatcac ttacttgaaa tctgatacca ggtctctgtc catgttttct gccaacacca 27360
cttcactccc ctcttcccag ctctggtact gcaggccccg gcgggctgca aacttcctcc 27420
acacgctgaa ggggatgtca aattcctcct gtccctcaat cttcatttta tcttctatca 27480
gatgtccaaa aagcgcgtcc gggtggatga tgacttcgac cccgtctacc cctacgatgc 27540
agacaacgca ccgaccgtgc ccttcatcaa cccccccttc gtctcttcag atggattcca 27600
agagaagccc ctgggggtgt tgtccctgcg actggccgac cccgtcacca ccaagaacgg 27660
ggaaatcacc ctcaagctgg gagagggggt ggacctcgat tcctcgggaa aactcatctc 27720
caacacggcc accaaggccg ccgcccctct cagtttttcc aacaacacca tttcccttaa 27780
catggatcac cccttttaca ctaaagatgg aaaattatcc ttacaagttt ctccaccatt 27840
aaatatactg agaacaagca ttctaaacac actagcttta ggttttggat caggtttagg 27900
actccgtggc tctgccttgg cagtacagtt agtctctcca cttacatttg atactgatgg 27960
aaacataaag cttaccttag acagaggttt gcatgttaca acaggagatg caattgaaag 28020
caacataagc tgggctaaag gtttaaaatt tgaagatgga gccatagcaa ccaacattgg 28080
aaatgggtta gagtttggaa gcagtagtac agaaacaggt gttgatgatg cttacccaat 28140
ccaagttaaa cttggatctg gccttagctt tgacagtaca ggagccataa tggctggtaa 28200
caaagaagac gataaactca ctttgtggac aacacctgat ccatcaccaa actgtcaaat 28260
actcgcagaa aatgatgcaa aactaacact ttgcttgact aaatgtggta gtcaaatact 28320
ggccactgtg tcagtcttag ttgtaggaag tggaaaccta aaccccatta ctggcaccgt 28380
aagcagtgct caggtgtttc tacgttttga tgcaaacggt gttcttttaa cagaacattc 28440
tacactaaaa aaatactggg ggtataggca gggagatagc atagatggca ctccatatac 28500
caatgctgta ggattcatgc ccaatttaaa agcttatcca aagtcacaaa gttctactac 28560
taaaaataat atagtagggc aagtatacat gaatggagat gtttcaaaac ctatgcttct 28620
cactataacc ctcaatggta ctgatgacag caacagtaca tattcaatgt cattttcata 28680
cacctggact aatggaagct atgttggagc aacatttggg gctaactctt ataccttctc 28740
atacatcgcc caagaatgaa cactgtatcc caccctgcat gccaaccctt cccaccccac 28800
tctgtggaac aaactctgaa acacaaaata aaataaagtt caagtgtttt attgattcaa 28860
cagttttaca ggattcgagc agttattttt cctccaccct cccaggacat ggaatacacc 28920
accctctccc cccgcacagc cttgaacatc tgaatgccat tggtgatgga catgcttttg 28980
gtctccacgt tccacacagt ttcagagcga gccagtctcg ggtcggtcag ggagatgaaa 29040
ccctccgggc actcccgcat ctgcacctca cagctcaaca gctgaggatt gtcctcggtg 29100
gtcgggatca cggttatctg gaagaagcag aagagcggcg gtgggaatca tagtccgcga 29160
acgggatcgg ccggtggtgt cgcatcaggc cccgcagcag tcgctgccgc cgccgctccg 29220
tcaagctgct gctcaggggg tccgggtcca gggactccct cagcatgatg cccacggccc 29280
tcagcatcag tcgtctggtg cggcgggcgc agcagcgcat gcggatctcg ctcaggtcgc 29340
tgcagtacgt gcaacacaga accaccaggt tgttcaacag tccatagttc aacacgctcc 29400
agccgaaact catcgcggga aggatgctac ccacgtggcc gtcgtaccag atcctcaggt 29460
aaatcaagtg gtgccccctc cagaacacgc tgcccacgta catgatctcc ttgggcatgt 29520
ggcggttcac cacctcccgg taccacatca ccctctggtt gaacatgcag ccccggatga 29580
tcctgcggaa ccacagggcc agcaccgccc cgcccgccat gcagcgaaga gaccccgggt 29640
cccggcaatg gcaatggagg acccaccgct cgtacccgtg gatcatctgg gagctgaaca 29700
agtctatgtt ggcacagcac aggcatatgc tcatgcatct cttcagcact ctcaactcct 29760
cgggggtcaa aaccatatcc cagggcacgg ggaactcttg caggacagcg aaccccgcag 29820
aacagggcaa tcctcgcaca gaacttacat tgtgcatgga cagggtatcg caatcaggca 29880
gcaccgggtg atcctccacc agagaagcgc gggtctcggt ctcctcacag cgtggtaagg 29940
gggccggccg atacgggtga tggcgggacg cggctgatcg tgttcgcgac cgtgtcatga 30000
tgcagttgct ttcggacatt ttcgtacttg ctgtagcaga acctggtccg ggcgctgcac 30060
accgatcgcc ggcggcggtc tcggcgcttg gaacgctcgg tgttgaaatt gtaaaacagc 30120
cactctctca gaccgtgcag cagatctagg gcctcaggag tgatgaagat cccatcatgc 30180
ctgatggctc tgatcacatc gaccaccgtg gaatgggcca gacccagcca gatgatgcaa 30240
ttttgttggg tttcggtgac ggcgggggag ggaagaacag gaagaaccat gattaacttt 30300
taatccaaac ggtctcggag tacttcaaaa tgaagatcgc ggagatggca cctctcgccc 30360
ccgctgtgtt ggtggaaaat aacagccagg tcaaaggtga tacggttctc gagatgttcc 30420
acggtggctt ccagcaaagc ctccacgcgc acatccagaa acaagacaat agcgaaagcg 30480
ggagggttct ctaattcctc aatcatcatg ttacactcct gcaccatccc cagataattt 30540
tcatttttcc agccttgaat gattcgaact agttcgtgag gtaaatccaa gccagccatg 30600
ataaagagct cgcgcagagc gccctccacc ggcattctta agcacaccct cataattcca 30660
agatattctg ctcctggttc acctgcagca gattgacaag cggaatatca aaatctctgc 30720
cgcgatccct gagctcctcc ctcagcaata actgtaagta ctctttcata tcctctccga 30780
aatttttagc cataggacca ccaggaataa gattagggca agccacagta cagataaacc 30840
gaagtcctcc ccagtgagca ttgccaaatg caagactgct ataagcatgc tggctagacc 30900
cggtgatatc ttccagataa ctggacagaa aatcgcccag gcaattttta agaaaatcaa 30960
caaaagaaaa atcctccagg tggacgttta gagcctcggg aacaacgatg aagtaaatgc 31020
aagcggtgcg ttccagcatg gttagttagc tgatctgtag aaaaaacaaa aatgaacatt 31080
aaaccatgct agcctggcga acaggtgggt aaatcgttct ctccagcacc aggcaggcca 31140
cggggtctcc ggcgcgaccc tcgtaaaaat tgtcgctatg attgaaaacc atcacagaga 31200
gacgttcccg gtggccggcg tgaatgattc gacaagatga atacaccccc ggaacattgg 31260
cgtccgcgag tgaaaaaaag cgcccgagga agcaataagg cactacaatg ctcagtctca 31320
agtccagcaa agcgatgcca tgcggatgaa gcacaaaatt ctcaggtgcg tacaaaatgt 31380
aattactccc ctcctgcaca ggcagcaaag cccccgatcc ctccaggtac acatacaaag 31440
cctcagcgtc catagcttac cgagcagcag cacacaacag gcgcaagagt cagagaaagg 31500
ctgagctcta acctgtccac ccgctctctg ctcaatatat agcccagatc tacactgacg 31560
taaaggccaa agtctaaaaa tacccgccaa ataatcacac acgcccagca cacgcccaga 31620
aaccggtgac acactcaaaa aaatacgcgc acttcctcaa acgcccaaaa ctgccgtcat 31680
ttccgggttc ccacgctacg tcatcaaaac acgactttca aattccgtcg accgttaaaa 31740
acgtcacccg ccccgcccct aacggtcgcc cgtctctcag ccaatcagcg ccccgcatcc 31800
ccaaattcaa acacctcatt tgcatattaa cgcgcacaaa aagtttgagg tatattattg 31860
atgatgg 31867
<210> 12
<211> 32788
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 12
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320
atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380
agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440
gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500
gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560
tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620
ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680
ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740
gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800
cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860
tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920
agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980
acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040
tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100
gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160
accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220
agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280
tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340
cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400
gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460
cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520
tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580
atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640
gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700
gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760
agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820
gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880
gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180
taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240
ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300
aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360
tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420
ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480
cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540
ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600
ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660
ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720
aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780
cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840
cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900
tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960
gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020
cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080
aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140
ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200
aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260
atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320
cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380
aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440
ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500
tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560
ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620
tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680
ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740
cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800
atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860
tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920
agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980
gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040
cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100
cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160
tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220
cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280
cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340
gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400
gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460
gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520
tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580
ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640
gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700
gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760
ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820
aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880
ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940
tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000
tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060
tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120
ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180
tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240
tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300
ccagggcagc ttgccattcg cgcacggcca gcgcgctctc gtagggactg aggggcgtgc 6360
cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420
ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480
gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540
tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600
tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660
gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720
agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780
cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840
gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900
ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960
cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020
ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080
aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140
aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200
agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260
ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320
cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380
ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440
cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500
gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560
tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620
tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680
accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740
actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800
gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860
gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920
tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980
ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040
tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100
ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160
gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220
acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280
gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340
gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400
gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460
gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520
cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580
tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640
cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700
atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760
gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820
gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880
ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940
ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000
gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060
ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120
cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180
ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240
gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300
agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360
gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420
atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480
gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540
acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600
catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660
gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720
ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780
tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840
cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900
gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960
gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020
gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080
gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140
ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200
tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260
cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320
gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380
ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440
gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500
tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560
tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620
actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680
gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740
ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800
gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860
ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920
cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980
gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040
ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100
aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160
gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220
ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280
gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340
catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400
ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460
agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520
gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580
gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640
cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700
ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760
ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820
cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880
tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940
gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000
ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060
aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120
gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180
gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240
ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300
aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360
tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420
caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480
acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540
acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600
gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660
cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720
aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780
cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840
gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900
atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960
aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020
atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080
cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140
tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200
ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260
ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320
aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380
tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440
gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500
tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560
cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620
catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680
gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740
cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800
cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860
tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920
gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980
agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040
ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100
tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160
agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220
ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280
gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340
accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400
ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460
gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520
ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580
cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640
caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700
agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760
ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820
cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880
tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940
cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000
tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060
agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120
ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180
tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240
tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300
ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360
ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420
gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480
gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540
tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600
accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660
gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720
cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780
gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840
gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900
gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960
ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020
aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080
gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140
ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200
cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260
gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320
cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380
ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440
ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500
caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560
gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620
catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680
gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740
gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800
caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860
gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920
catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980
gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040
atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100
ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160
gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220
aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280
tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340
cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400
gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460
ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520
ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580
ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640
gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700
gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760
gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820
cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880
cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940
gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000
ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060
accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120
tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180
gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240
accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300
gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360
ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420
tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480
agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540
aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600
aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660
ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720
gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780
ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840
tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900
ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960
gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020
actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080
tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140
acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200
gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260
gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320
cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380
tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440
ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500
agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560
gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620
tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680
gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740
ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800
gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860
cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920
cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980
acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040
ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100
aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160
cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220
actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280
agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340
tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400
gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460
tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520
cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580
acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640
gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700
ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760
aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820
tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880
cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940
cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000
cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060
cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120
gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180
ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240
caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300
ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360
caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420
caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480
tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540
gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600
tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660
cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720
gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780
cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840
gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900
cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960
gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020
atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080
ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140
gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200
gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260
cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320
ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380
ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440
gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500
cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560
gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620
ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680
gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740
ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800
cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860
gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920
cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980
tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040
aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100
gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160
gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220
ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280
ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340
tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400
agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460
gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520
tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580
cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640
caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700
cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760
ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820
cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880
cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940
cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000
gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060
ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120
ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180
tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240
gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300
cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360
gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420
gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480
ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540
gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600
cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660
gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720
tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780
cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840
cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900
gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960
ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020
cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080
cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140
atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200
ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260
ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320
gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380
acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440
aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500
aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560
tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620
tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680
ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740
ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800
gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860
agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920
aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980
ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040
ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100
gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160
cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220
catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280
cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340
cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400
gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460
ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520
agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580
ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640
ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700
gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760
ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820
caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880
catcagcgag tcggtggacg gctacgattg aatgtcccat ggtggcgcag ctgacctagc 26940
tcggcttcga cacctggacc actgccgccg cttccgctgc ttcgctcggg atctcgccga 27000
gtttgcctac tttgagctgc ccgaggagca ccctcagggc ccggcccacg gagtgcggat 27060
cgtcgtcgaa gggggcctcg actcccacct gcttcggatc ttcagccagc gtccgatcct 27120
ggtcgagcgc gagcaaggac agacccttct gactctgtac tgcatctgca accaccccgg 27180
cctgcatgaa agtctttgtt gtctgctgtg tactgagtat aataaaagct gagatcagcg 27240
actactccgg acttccgtgt gttcctgaat ccatcaacca gtctttgttc ttcaccggga 27300
acgagaccga gctccagctc cagtgtaagc cccacaagaa gtacctcacc tggctgttcc 27360
agggctcccc gatcgccgtt gtcaaccact gcgacaacga cggagtcctg ctgagcggcc 27420
ctgccaacct tactttttcc acccgcagaa gcaagctcca gctcttccaa cccttcctcc 27480
ccgggaccta tcagtgcgtc tcgggaccct gccatcacac cttccacctg atcccgaata 27540
ccacagcgtc gctccccgct actaacaacc aaactaacct ccaccaacgc caccgtcgcg 27600
acggccacaa tacatgccca tattagacta tgaggccgag ccacagcgac ccatgctccc 27660
cgctattagt tacttcaatc taaccggcgg agatgactga cccactggcc aacaacaacg 27720
tcaacgacct tctcctggac atggacggcc gcgcctcgga gcagcgactc gcccaacttc 27780
gcattcgcca gcagcaggag agagccgtca aggagctgca ggatgcggtg gccatccacc 27840
agtgcaagag aggcatcttc tgcctggtga aacaggccaa gatctcctac gaggtcactc 27900
caaacgacca tcgcctctcc tacgagctcc tgcagcagcg ccagaagttc acctgcctgg 27960
tcggagtcaa ccccatcgtc atcacccagc agtctggcga taccaagggg tgcatccact 28020
gctcctgcga ctcccccgac tgcgtccaca ctctgatcaa gaccctctgc ggcctccgcg 28080
acctcctccc catgaactaa tcaccccctt atccagtgaa ataaagatca tattgatgat 28140
gattttacag aaataaaaaa taatcatttg atttgaaata aagatacaat catattgatg 28200
atttgagttt aacaaaaaaa taaagaatca cttacttgaa atctgatacc aggtctctgt 28260
ccatgttttc tgccaacacc acttcactcc cctcttccca gctctggtac tgcaggcccc 28320
ggcgggctgc aaacttcctc cacacgctga aggggatgtc aaattcctcc tgtccctcaa 28380
tcttcatttt atcttctatc agatgtccaa aaagcgcgtc cgggtggatg atgacttcga 28440
ccccgtctac ccctacgatg cagacaacgc accgaccgtg cccttcatca accccccctt 28500
cgtctcttca gatggattcc aagagaagcc cctgggggtg ttgtccctgc gactggccga 28560
ccccgtcacc accaagaacg gggaaatcac cctcaagctg ggagaggggg tggacctcga 28620
ttcctcggga aaactcatct ccaacacggc caccaaggcc gccgcccctc tcagtttttc 28680
caacaacacc atttccctta acatggatca ccccttttac actaaagatg gaaaattatc 28740
cttacaagtt tctccaccat taaatatact gagaacaagc attctaaaca cactagcttt 28800
aggttttgga tcaggtttag gactccgtgg ctctgccttg gcagtacagt tagtctctcc 28860
acttacattt gatactgatg gaaacataaa gcttacctta gacagaggtt tgcatgttac 28920
aacaggagat gcaattgaaa gcaacataag ctgggctaaa ggtttaaaat ttgaagatgg 28980
agccatagca accaacattg gaaatgggtt agagtttgga agcagtagta cagaaacagg 29040
tgttgatgat gcttacccaa tccaagttaa acttggatct ggccttagct ttgacagtac 29100
aggagccata atggctggta acaaagaaga cgataaactc actttgtgga caacacctga 29160
tccatcacca aactgtcaaa tactcgcaga aaatgatgca aaactaacac tttgcttgac 29220
taaatgtggt agtcaaatac tggccactgt gtcagtctta gttgtaggaa gtggaaacct 29280
aaaccccatt actggcaccg taagcagtgc tcaggtgttt ctacgttttg atgcaaacgg 29340
tgttctttta acagaacatt ctacactaaa aaaatactgg gggtataggc agggagatag 29400
catagatggc actccatata ccaatgctgt aggattcatg cccaatttaa aagcttatcc 29460
aaagtcacaa agttctacta ctaaaaataa tatagtaggg caagtataca tgaatggaga 29520
tgtttcaaaa cctatgcttc tcactataac cctcaatggt actgatgaca gcaacagtac 29580
atattcaatg tcattttcat acacctggac taatggaagc tatgttggag caacatttgg 29640
ggctaactct tataccttct catacatcgc ccaagaatga acactgtatc ccaccctgca 29700
tgccaaccct tcccacccca ctctgtggaa caaactctga aacacaaaat aaaataaagt 29760
tcaagtgttt tattgattca acagttttac aggattcgag cagttatttt tcctccaccc 29820
tcccaggaca tggaatacac caccctctcc ccccgcacag ccttgaacat ctgaatgcca 29880
ttggtgatgg acatgctttt ggtctccacg ttccacacag tttcagagcg agccagtctc 29940
gggtcggtca gggagatgaa accctccggg cactcccgca tctgcacctc acagctcaac 30000
agctgaggat tgtcctcggt ggtcgggatc acggttatct ggaagaagca gaagagcggc 30060
ggtgggaatc atagtccgcg aacgggatcg gccggtggtg tcgcatcagg ccccgcagca 30120
gtcgctgccg ccgccgctcc gtcaagctgc tgctcagggg gtccgggtcc agggactccc 30180
tcagcatgat gcccacggcc ctcagcatca gtcgtctggt gcggcgggcg cagcagcgca 30240
tgcggatctc gctcaggtcg ctgcagtacg tgcaacacag aaccaccagg ttgttcaaca 30300
gtccatagtt caacacgctc cagccgaaac tcatcgcggg aaggatgcta cccacgtggc 30360
cgtcgtacca gatcctcagg taaatcaagt ggtgccccct ccagaacacg ctgcccacgt 30420
acatgatctc cttgggcatg tggcggttca ccacctcccg gtaccacatc accctctggt 30480
tgaacatgca gccccggatg atcctgcgga accacagggc cagcaccgcc ccgcccgcca 30540
tgcagcgaag agaccccggg tcccggcaat ggcaatggag gacccaccgc tcgtacccgt 30600
ggatcatctg ggagctgaac aagtctatgt tggcacagca caggcatatg ctcatgcatc 30660
tcttcagcac tctcaactcc tcgggggtca aaaccatatc ccagggcacg gggaactctt 30720
gcaggacagc gaaccccgca gaacagggca atcctcgcac agaacttaca ttgtgcatgg 30780
acagggtatc gcaatcaggc agcaccgggt gatcctccac cagagaagcg cgggtctcgg 30840
tctcctcaca gcgtggtaag ggggccggcc gatacgggtg atggcgggac gcggctgatc 30900
gtgttcgcga ccgtgtcatg atgcagttgc tttcggacat tttcgtactt gctgtagcag 30960
aacctggtcc gggcgctgca caccgatcgc cggcggcggt ctcggcgctt ggaacgctcg 31020
gtgttgaaat tgtaaaacag ccactctctc agaccgtgca gcagatctag ggcctcagga 31080
gtgatgaaga tcccatcatg cctgatggct ctgatcacat cgaccaccgt ggaatgggcc 31140
agacccagcc agatgatgca attttgttgg gtttcggtga cggcggggga gggaagaaca 31200
ggaagaacca tgattaactt ttaatccaaa cggtctcgga gtacttcaaa atgaagatcg 31260
cggagatggc acctctcgcc cccgctgtgt tggtggaaaa taacagccag gtcaaaggtg 31320
atacggttct cgagatgttc cacggtggct tccagcaaag cctccacgcg cacatccaga 31380
aacaagacaa tagcgaaagc gggagggttc tctaattcct caatcatcat gttacactcc 31440
tgcaccatcc ccagataatt ttcatttttc cagccttgaa tgattcgaac tagttcgtga 31500
ggtaaatcca agccagccat gataaagagc tcgcgcagag cgccctccac cggcattctt 31560
aagcacaccc tcataattcc aagatattct gctcctggtt cacctgcagc agattgacaa 31620
gcggaatatc aaaatctctg ccgcgatccc tgagctcctc cctcagcaat aactgtaagt 31680
actctttcat atcctctccg aaatttttag ccataggacc accaggaata agattagggc 31740
aagccacagt acagataaac cgaagtcctc cccagtgagc attgccaaat gcaagactgc 31800
tataagcatg ctggctagac ccggtgatat cttccagata actggacaga aaatcgccca 31860
ggcaattttt aagaaaatca acaaaagaaa aatcctccag gtggacgttt agagcctcgg 31920
gaacaacgat gaagtaaatg caagcggtgc gttccagcat ggttagttag ctgatctgta 31980
gaaaaaacaa aaatgaacat taaaccatgc tagcctggcg aacaggtggg taaatcgttc 32040
tctccagcac caggcaggcc acggggtctc cggcgcgacc ctcgtaaaaa ttgtcgctat 32100
gattgaaaac catcacagag agacgttccc ggtggccggc gtgaatgatt cgacaagatg 32160
aatacacccc cggaacattg gcgtccgcga gtgaaaaaaa gcgcccgagg aagcaataag 32220
gcactacaat gctcagtctc aagtccagca aagcgatgcc atgcggatga agcacaaaat 32280
tctcaggtgc gtacaaaatg taattactcc cctcctgcac aggcagcaaa gcccccgatc 32340
cctccaggta cacatacaaa gcctcagcgt ccatagctta ccgagcagca gcacacaaca 32400
ggcgcaagag tcagagaaag gctgagctct aacctgtcca cccgctctct gctcaatata 32460
tagcccagat ctacactgac gtaaaggcca aagtctaaaa atacccgcca aataatcaca 32520
cacgcccagc acacgcccag aaaccggtga cacactcaaa aaaatacgcg cacttcctca 32580
aacgcccaaa actgccgtca tttccgggtt cccacgctac gtcatcaaaa cacgactttc 32640
aaattccgtc gaccgttaaa aacgtcaccc gccccgcccc taacggtcgc ccgtctctca 32700
gccaatcagc gccccgcatc cccaaattca aacacctcat ttgcatatta acgcgcacaa 32760
aaagtttgag gtatattatt gatgatgg 32788
<210> 13
<211> 30684
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 13
ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60
aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120
gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180
tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240
aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300
gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360
gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420
tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480
atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540
tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600
gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840
atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900
atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960
tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080
aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200
cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260
tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320
acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380
agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440
tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500
acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560
aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620
accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680
tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740
tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800
actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860
tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920
tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980
tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040
atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220
aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280
ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340
gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400
gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460
cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520
gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580
ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640
cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700
gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760
tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820
ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880
tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940
ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000
tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060
acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120
aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180
ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240
agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300
aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360
gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420
ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480
gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540
tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600
gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660
ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720
agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780
atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840
agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900
tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960
agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020
cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080
ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140
tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200
ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260
aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320
agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380
cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440
tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500
ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560
cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620
ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680
aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740
gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800
cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860
gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920
tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980
tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040
agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100
cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160
ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220
cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280
gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340
ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400
gcacggccag cgcgcgctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460
gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520
tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580
gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640
cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700
agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760
tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820
tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880
cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940
gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000
aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060
ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120
agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180
tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240
ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300
cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360
cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420
gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480
cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540
tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600
cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660
cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720
gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780
tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840
agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900
ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960
ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020
cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080
gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140
gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200
tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260
tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320
tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380
caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440
aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500
ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560
gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620
ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680
ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740
ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800
ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860
gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920
gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980
cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040
acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100
cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160
tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220
gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280
ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340
ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400
gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460
gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520
ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580
gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640
gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700
ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760
gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820
ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880
gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940
cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000
ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060
gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120
catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180
gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240
gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300
ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360
ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420
tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480
agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540
gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600
gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660
cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720
ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780
gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840
ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900
gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960
gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020
gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080
ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140
ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200
gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260
ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320
gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380
gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440
gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500
ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560
cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620
ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680
ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740
ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800
aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860
ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920
atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980
gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040
caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100
cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160
gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220
gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280
cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340
cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400
ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460
cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520
ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580
ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640
cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700
gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760
ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820
ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880
ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940
aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000
ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060
tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120
ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180
cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240
ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300
aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360
gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420
atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480
gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540
cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600
ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660
atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720
gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780
ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840
tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900
gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960
cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020
tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080
gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140
agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200
gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260
aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320
ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380
gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440
tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500
gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560
tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620
tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680
tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740
cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800
agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860
tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920
cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980
cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040
tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100
ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160
cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220
ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280
gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340
gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400
gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460
tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520
ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580
cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640
cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700
gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760
cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820
cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880
gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940
gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000
ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060
aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120
ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180
gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240
ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300
gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360
ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420
gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480
ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540
ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600
ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660
aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720
ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780
gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840
cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900
ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960
cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020
ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080
ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140
cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200
atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260
cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320
tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380
acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440
gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500
aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560
agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620
ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680
cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740
cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800
cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860
caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920
ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980
gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040
agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100
tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160
gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220
acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280
ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340
acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400
aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460
tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520
aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580
agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640
cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700
atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760
ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820
aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880
atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940
acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000
atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060
ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120
actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180
cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240
tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300
acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360
actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420
atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480
gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540
tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600
ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660
tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720
accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780
ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840
tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900
tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960
tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020
tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080
tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140
ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200
ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260
acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320
gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380
gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440
actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500
ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560
actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620
cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680
agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740
tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800
tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860
ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920
gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980
aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040
catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100
attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160
gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220
ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280
gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340
gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400
cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460
ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520
ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580
cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640
aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700
atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760
gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820
ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880
cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940
gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000
gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060
ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120
catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180
ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240
agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300
cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360
cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420
gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480
ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540
gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600
cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660
ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720
cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780
gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840
ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900
ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960
gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020
agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080
cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140
gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200
gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260
aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320
gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380
cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440
cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500
gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560
cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620
cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680
cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740
ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800
cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860
ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920
ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980
tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040
caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100
tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160
gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220
cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280
gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340
cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400
cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460
catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520
ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580
gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640
gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700
ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760
cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820
aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880
gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940
ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000
caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060
gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120
gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180
ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240
gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300
atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360
tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420
agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480
aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540
tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600
cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660
ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720
ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780
cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840
gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900
acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960
tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020
gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080
gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140
cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200
tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260
attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320
tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380
ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440
tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500
ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560
gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620
tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680
gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740
tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800
tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860
tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920
cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980
ctacgattga aactaatcac ccccttatcc agtgaaataa agatcatatt gatgatgatt 26040
ttacagaaat aaaaaataat catttgattt gaaataaaga tacaatcata ttgatgattt 26100
gagtttaaca aaaaaataaa gaatcactta cttgaaatct gataccaggt ctctgtccat 26160
gttttctgcc aacaccactt cactcccctc ttcccagctc tggtactgca ggccccggcg 26220
ggctgcaaac ttcctccaca cgctgaaggg gatgtcaaat tcctcctgtc cctcaatctt 26280
cattttatct tctatcagat gtccaaaaag cgcgtccggg tggatgatga cttcgacccc 26340
gtctacccct acgatgcaga caacgcaccg accgtgccct tcatcaaccc ccccttcgtc 26400
tcttcagatg gattccaaga gaagcccctg ggggtgttgt ccctgcgact ggccgacccc 26460
gtcaccacca agaacgggga aatcaccctc aagctgggag agggggtgga cctcgattcc 26520
tcgggaaaac tcatctccaa cacggccacc aaggccgccg cccctctcag tttttccaac 26580
aacaccattt cccttaacat ggatcacccc ttttacacta aagatggaaa attatcctta 26640
caagtttctc caccattaaa tatactgaga acaagcattc taaacacact agctttaggt 26700
tttggatcag gtttaggact ccgtggctct gccttggcag tacagttagt ctctccactt 26760
acatttgata ctgatggaaa cataaagctt accttagaca gaggtttgca tgttacaaca 26820
ggagatgcaa ttgaaagcaa cataagctgg gctaaaggtt taaaatttga agatggagcc 26880
atagcaacca acattggaaa tgggttagag tttggaagca gtagtacaga aacaggtgtt 26940
gatgatgctt acccaatcca agttaaactt ggatctggcc ttagctttga cagtacagga 27000
gccataatgg ctggtaacaa agaagacgat aaactcactt tgtggacaac acctgatcca 27060
tcaccaaact gtcaaatact cgcagaaaat gatgcaaaac taacactttg cttgactaaa 27120
tgtggtagtc aaatactggc cactgtgtca gtcttagttg taggaagtgg aaacctaaac 27180
cccattactg gcaccgtaag cagtgctcag gtgtttctac gttttgatgc aaacggtgtt 27240
cttttaacag aacattctac actaaaaaaa tactgggggt ataggcaggg agatagcata 27300
gatggcactc catataccaa tgctgtagga ttcatgccca atttaaaagc ttatccaaag 27360
tcacaaagtt ctactactaa aaataatata gtagggcaag tatacatgaa tggagatgtt 27420
tcaaaaccta tgcttctcac tataaccctc aatggtactg atgacagcaa cagtacatat 27480
tcaatgtcat tttcatacac ctggactaat ggaagctatg ttggagcaac atttggggct 27540
aactcttata ccttctcata catcgcccaa gaatgaacac tgtatcccac cctgcatgcc 27600
aacccttccc accccactct gtggaacaaa ctctgaaaca caaaataaaa taaagttcaa 27660
gtgttttatt gattcaacag ttttacagga ttcgagcagt tatttttcct ccaccctccc 27720
aggacatgga atacaccacc ctctcccccc gcacagcctt gaacatctga atgccattgg 27780
tgatggacat gcttttggtc tccacgttcc acacagtttc agagcgagcc agtctcgggt 27840
cggtcaggga gatgaaaccc tccgggcact cccgcatctg cacctcacag ctcaacagct 27900
gaggattgtc ctcggtggtc gggatcacgg ttatctggaa gaagcagaag agcggcggtg 27960
ggaatcatag tccgcgaacg ggatcggccg gtggtgtcgc atcaggcccc gcagcagtcg 28020
ctgccgccgc cgctccgtca agctgctgct cagggggtcc gggtccaggg actccctcag 28080
catgatgccc acggccctca gcatcagtcg tctggtgcgg cgggcgcagc agcgcatgcg 28140
gatctcgctc aggtcgctgc agtacgtgca acacagaacc accaggttgt tcaacagtcc 28200
atagttcaac acgctccagc cgaaactcat cgcgggaagg atgctaccca cgtggccgtc 28260
gtaccagatc ctcaggtaaa tcaagtggtg ccccctccag aacacgctgc ccacgtacat 28320
gatctccttg ggcatgtggc ggttcaccac ctcccggtac cacatcaccc tctggttgaa 28380
catgcagccc cggatgatcc tgcggaacca cagggccagc accgccccgc ccgccatgca 28440
gcgaagagac cccgggtccc ggcaatggca atggaggacc caccgctcgt acccgtggat 28500
catctgggag ctgaacaagt ctatgttggc acagcacagg catatgctca tgcatctctt 28560
cagcactctc aactcctcgg gggtcaaaac catatcccag ggcacgggga actcttgcag 28620
gacagcgaac cccgcagaac agggcaatcc tcgcacagaa cttacattgt gcatggacag 28680
ggtatcgcaa tcaggcagca ccgggtgatc ctccaccaga gaagcgcggg tctcggtctc 28740
ctcacagcgt ggtaaggggg ccggccgata cgggtgatgg cgggacgcgg ctgatcgtgt 28800
tcgcgaccgt gtcatgatgc agttgctttc ggacattttc gtacttgctg tagcagaacc 28860
tggtccgggc gctgcacacc gatcgccggc ggcggtctcg gcgcttggaa cgctcggtgt 28920
tgaaattgta aaacagccac tctctcagac cgtgcagcag atctagggcc tcaggagtga 28980
tgaagatccc atcatgcctg atggctctga tcacatcgac caccgtggaa tgggccagac 29040
ccagccagat gatgcaattt tgttgggttt cggtgacggc gggggaggga agaacaggaa 29100
gaaccatgat taacttttaa tccaaacggt ctcggagtac ttcaaaatga agatcgcgga 29160
gatggcacct ctcgcccccg ctgtgttggt ggaaaataac agccaggtca aaggtgatac 29220
ggttctcgag atgttccacg gtggcttcca gcaaagcctc cacgcgcaca tccagaaaca 29280
agacaatagc gaaagcggga gggttctcta attcctcaat catcatgtta cactcctgca 29340
ccatccccag ataattttca tttttccagc cttgaatgat tcgaactagt tcctgaggta 29400
aatccaagcc agccatgata aagagctcgc gcagagcgcc ctccaccggc attcttaagc 29460
acaccctcat aattccaaga tattctgctc ctggttcacc tgcagcagat tgacaagcgg 29520
aatatcaaaa tctctgccgc gatccctgag ctcctccctc agcaataact gtaagtactc 29580
tttcatatcc tctccgaaat ttttagccat aggaccacca ggaataagat tagggcaagc 29640
cacagtacag ataaaccgaa gtcctcccca gtgagcattg ccaaatgcaa gactgctata 29700
agcatgctgg ctagacccgg tgatatcttc cagataactg gacagaaaat cgcccaggca 29760
atttttaaga aaatcaacaa aagaaaaatc ctccaggtgg acgtttagag cctcgggaac 29820
aacgatgaag taaatgcaag cggtgcgttc cagcatggtt agttagctga tctgtagaaa 29880
aaacaaaaat gaacattaaa ccatgctagc ctggcgaaca ggtgggtaaa tcgttctctc 29940
cagcaccagg caggccacgg ggtctccggc gcgaccctcg taaaaattgt cgctatgatt 30000
gaaaaccatc acagagagac gttcccggtg gccggcgtga atgattcgac aagatgaata 30060
cacccccgga acattggcgt ccgcgagtga aaaaaagcgc ccgaggaagc aataaggcac 30120
tacaatgctc agtctcaagt ccagcaaagc gatgccatgc ggatgaagca caaaattctc 30180
aggtgcgtac aaaatgtaat tactcccctc ctgcacaggc agcaaagccc ccgatccctc 30240
caggtacaca tacaaagcct cagcgtccat agcttaccga gcagcagcac acaacaggcg 30300
caagagtcag agaaaggctg agctctaacc tgtccacccg ctctctgctc aatatatagc 30360
ccagatctac actgacgtaa aggccaaagt ctaaaaatac ccgccaaata atcacacacg 30420
cccagcacac gcccagaaac cggtgacaca ctcaaaaaaa tacgcgcact tcctcaaacg 30480
cccaaaactg ccgtcatttc cgggttccca cgctacgtca tcaaaacacg actttcaaat 30540
tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac ggtcgcccgt ctctcagcca 30600
atcagcgccc cgcatcccca aattcaaaca cctcatttgc atattaacgc gcacaaaaag 30660
tttgaggtat attattgatg atgg 30684
<210> 14
<211> 8602
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 14
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560
ttaaagtccg ccatatgagg ccaccatgca gatcttcgtg aagaccctga ccggcaagac 7620
catcacccta gaggtggagc ccagtgacac catcgagaac gtgaaggcca agatccagga 7680
taaagagggc atcccccctg accagcagag gctgatcttt gccggcaagc agctggaaga 7740
tggccgcacc ctctctgatt acaacatcca gaaggagtca accctgcacc tggtccttcg 7800
cctgagaggt ggcgctgctt acagtataat caactttgaa aaactggctg cttacggcat 7860
cctgggcttt gtgtttacac tggctgccta cctgctgttt ggctatcctg tgtacgtggc 7920
cgcttatgga ctgtgtaccc tggtggccat gctggctgct tacaatctgg tgcctatggt 7980
ggccacagtg gccgcctatt gtcttggcgg actgctgaca atggtggcag cctacagccc 8040
gagctatgcg tatcatcagt ttgcagccta cggcccagga ccaggcgcta aatttgtggc 8100
tgcctggaca ctgaaagccg ccgctggacc aggtcctgga cagtacatca aggccaacag 8160
caagttcatc ggcatcaccg aactcggccc aggaccaggc tatccctacg atgtgcctga 8220
ttacgcctga tagtgatgat tcgaacggcc gtatcacgcc caaacattta cagccgcggt 8280
gtcaaaaacc gcgtggacgt ggttaacatc cctgctggga ggatcagccg taattattat 8340
aattggcttg gtgctggcta ctattgtggc catgtacgtg ctgaccaacc agaaacataa 8400
ttgaatacag cagcaattgg caagctgctt acatagaact cgcggcgatt ggcatgccgc 8460
cttaaaattt ttattttatt ttttcttttc ttttccgaat cggattttgt ttttaatatt 8520
tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 8580
aaaaaaaaaa aaaaaaaaaa aa 8602
<210> 15
<211> 9595
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 15
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560
ttaaagtccg ccatatgaga tggaagatgc caaaaacatt aagaagggcc cagcgccatt 7620
ctacccactc gaagacggga ccgccggcga gcagctgcac aaagccatga agcgctacgc 7680
cctggtgccc ggcaccatcg cctttaccga cgcacatatc gaggtggaca ttacctacgc 7740
cgagtacttc gagatgagcg ttcggctggc agaagctatg aagcgctatg ggctgaatac 7800
aaaccatcgg atcgtggtgt gcagcgagaa tagcttgcag ttcttcatgc ccgtgttggg 7860
tgccctgttc atcggtgtgg ctgtggcccc agctaacgac atctacaacg agcgcgagct 7920
gctgaacagc atgggcatca gccagcccac cgtcgtattc gtgagcaaga aagggctgca 7980
aaagatcctc aacgtgcaaa agaagctacc gatcatacaa aagatcatca tcatggatag 8040
caagaccgac taccagggct tccaaagcat gtacaccttc gtgacttccc atttgccacc 8100
cggcttcaac gagtacgact tcgtgcccga gagcttcgac cgggacaaaa ccatcgccct 8160
gatcatgaac agtagtggca gtaccggatt gcccaagggc gtagccctac cgcaccgcac 8220
cgcttgtgtc cgattcagtc atgcccgcga ccccatcttc ggcaaccaga tcatccccga 8280
caccgctatc ctcagcgtgg tgccatttca ccacggcttc ggcatgttca ccacgctggg 8340
ctacttgatc tgcggctttc gggtcgtgct catgtaccgc ttcgaggagg agctattctt 8400
gcgcagcttg caagactata agattcaatc tgccctgctg gtgcccacac tatttagctt 8460
cttcgctaag agcactctca tcgacaagta cgacctaagc aacttgcacg agatcgccag 8520
cggcggggcg ccgctcagca aggaggtagg tgaggccgtg gccaaacgct tccacctacc 8580
aggcatccgc cagggctacg gcctgacaga aacaaccagc gccattctga tcacccccga 8640
aggggacgac aagcctggcg cagtaggcaa ggtggtgccc ttcttcgagg ctaaggtggt 8700
ggacttggac accggtaaga cactgggtgt gaaccagcgc ggcgagctgt gcgtccgtgg 8760
ccccatgatc atgagcggct acgttaacaa ccccgaggct acaaacgctc tcatcgacaa 8820
ggacggctgg ctgcacagcg gcgacatcgc ctactgggac gaggacgagc acttcttcat 8880
cgtggaccgg ctgaagagcc tgatcaaata caagggctac caggtagccc cagccgaact 8940
ggagagcatc ctgctgcaac accccaacat cttcgacgcc ggggtcgccg gcctgcccga 9000
cgacgatgcc ggcgagctgc ccgccgcagt cgtcgtgctg gaacacggta aaaccatgac 9060
cgagaaggag atcgtggact atgtggccag ccaggttaca accgccaaga agctgcgcgg 9120
tggtgttgtg ttcgtggacg aggtgcctaa aggactgacc ggcaagttgg acgcccgcaa 9180
gatccgcgag attctcatta aggccaagaa gggcggcaag atcgccgtgt aattcgaacg 9240
gccgtatcac gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgga cgtggttaac 9300
atccctgctg ggaggatcag ccgtaattat tataattggc ttggtgctgg ctactattgt 9360
ggccatgtac gtgctgacca accagaaaca taattgaata cagcagcaat tggcaagctg 9420
cttacataga actcgcggcg attggcatgc cgccttaaaa tttttatttt attttttctt 9480
ttcttttccg aatcggattt tgtttttaat atttcaaaaa aaaaaaaaaa aaaaaaaaaa 9540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 9595
<210> 16
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 16
Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys
1 5 10 15
Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp Trp Tyr Gln Gln Lys
20 25 30
Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Ser Leu Gln
35 40 45
Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
50 55 60
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr
65 70 75 80
Cys Gln Gln Tyr Tyr Ser Thr Pro Phe Thr Phe Gly Pro Gly Thr Lys
85 90 95
Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
100 105 110
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
115 120 125
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val
130 135
<210> 17
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 17
Gly Val Val Gln Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser
1 5 10 15
Gly Phe Thr Phe Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro
20 25 30
Gly Lys Gly Leu Glu Trp Val Ala Val Ile Trp Tyr Asp Gly Ser Asn
35 40 45
Lys Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp
50 55 60
Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu
65 70 75 80
Asp Thr Ala Val Tyr Tyr Cys Ala Arg Asp Pro Arg Gly Ala Thr Leu
85 90 95
Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val Trp Gly Gln Gly Thr Thr Val
100 105 110
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
115 120 125
Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu
130 135 140
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
145 150 155 160
Ala Leu Thr Ser Gly Val His
165
<210> 18
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 18
Gly Phe Thr Phe Ser Ser Tyr Gly Met His
1 5 10
<210> 19
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 19
Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val
1 5 10 15
<210> 20
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 20
Asp Pro Arg Gly Ala Thr Leu Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val
1 5 10 15
<210> 21
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 21
Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp
1 5 10
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 22
Ala Ala Ser Ser Leu Gln Ser
1 5
<210> 23
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 23
Gln Gln Tyr Tyr Ser Thr Pro Phe Thr
1 5
<210> 24
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Arg Val Ser Ser Ser
20 25 30
Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu
35 40 45
Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
65 70 75 80
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Leu Pro
85 90 95
Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
100 105
<210> 25
<211> 121
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Arg Tyr
20 25 30
Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr Trp Gly
100 105 110
Gln Gly Thr Leu Val Thr Val Ser Ser
115 120
<210> 26
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 26
Arg Tyr Trp Met Ser
1 5
<210> 27
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 27
Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val Lys
1 5 10 15
Gly
<210> 28
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 28
Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr
1 5 10
<210> 29
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 29
Arg Ala Ser Gln Arg Val Ser Ser Ser Tyr Leu Ala
1 5 10
<210> 30
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 30
Asp Ala Ser Ser Arg Ala Thr
1 5
<210> 31
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 31
Gln Gln Tyr Gly Ser Leu Pro Trp Thr
1 5
<210> 32
<211> 2019
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 32
gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60
caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120
cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180
ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240
caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300
ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360
tcatcaggtc tcaggccttg agcagcttga gagtataatc aactttgaaa aactgactga 420
atggaccagt tctaatgtta tgcctatcct gtctcctctg acaaagggca tcctgggctt 480
cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540
gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600
aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660
taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720
cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780
ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840
agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900
ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960
gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020
tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080
cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140
aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200
actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260
agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320
gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380
catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440
gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500
cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560
tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620
cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680
ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740
tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800
acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860
ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920
ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980
gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019
<210> 33
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala
65 70 75 80
Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val
85 90 95
Leu Gly Asp His Gln Val Ser Gly Leu Glu Gln Leu Glu Ser Ile Ile
100 105 110
Asn Phe Glu Lys Leu Thr Glu Trp Thr Ser Ser Asn Val Met Pro Ile
115 120 125
Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr
130 135 140
Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr
145 150 155 160
Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr
165 170 175
Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln
180 185 190
Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln
195 200 205
Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln
210 215 220
Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr
225 230 235 240
Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val
245 250 255
Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg
260 265 270
Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr
275 280 285
Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu
290 295 300
Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser
305 310 315 320
Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp
325 330 335
Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp
340 345 350
Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val
355 360 365
Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala
370 375 380
Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp
385 390 395 400
Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn
405 410 415
Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu
420 425 430
Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His
435 440 445
Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu
450 455 460
Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu
465 470 475 480
Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met
485 490 495
Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro
500 505 510
Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln
515 520 525
Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His
530 535 540
Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met
545 550 555 560
Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg
565 570 575
Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala
580 585 590
Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe
595 600 605
Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly
610 615
<210> 34
<211> 1638
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 34
atggccggga tgttccaggc actgtccgaa ggctgcacac cctatgatat taaccagatg 60
ctgaatgtcc tgggagacca ccaggtctct ggcctggagc agctggagag catcatcaac 120
ttcgagaagc tgaccgagtg gacaagctcc aatgtgatgc ctatcctgtc cccactgacc 180
aagggcatcc tgggcttcgt gtttaccctg acagtgcctt ctgagcgggg cctgtcttgc 240
atcagcgagg cagacgcaac cacaccagag tccgccaatc tgggcgagga gatcctgtct 300
cagctgtacc tgtggccccg ggtgacatat cactcccctt cttacgccta tcaccagttc 360
gagcggagag ccaagtacaa gagacacttc ccaggctttg gccagtctct gctgttcggc 420
taccccgtgt acgtgttcgg cgattgcgtg cagggcgact gggatgccat ccggtttaga 480
tactgcgcac cacctggata tgcactgctg aggtgtaacg acaccaatta ttccgccctg 540
ctggcagtgg gcgccctgga gggccctcgc aatcaggatt ggctgggcgt gccaaggcag 600
ctggtgacac gcatgcaggc catccagaac gcaggcctgt gcaccctggt ggcaatgctg 660
gaggagacaa tcttctggct gcaggccttt ctgatggccc tgaccgacag cggccccaag 720
acaaacatca tcgtggattc ccagtacgtg atgggcatct ccaagccttc tttccaggag 780
tttgtggact gggagaacgt gagcccagag ctgaattcca ccgatcagcc attctggcag 840
gcaggaatcc tggcaaggaa cctggtgcct atggtggcca cagtgcaggg ccagaatctg 900
aagtaccagg gccagagcct ggtcatcagc gcctccatca tcgtgtttaa cctgctggag 960
ctggagggcg actatcggga cgatggcaac gtgtgggtgc acaccccact gagccccaga 1020
acactgaacg cctgggtgaa ggccgtggag gagaagaagg gcatcccagt gcacctggag 1080
ctggcctcca tgaccaatat ggagctgatg tctagcatcg tgcaccagca ggtgaggaca 1140
tacggacccg tgttcatgtg cctgggaggc ctgctgacca tggtggcagg agccgtgtgg 1200
ctgacagtgc gggtgctgga gctgttcaga gccgcccagc tggccaacga tgtggtgctg 1260
cagatcatgg agctgtgcgg agcagccttt cgccaggtgt gccacaccac agtgccatgg 1320
cccaatgcct ccctgacccc caagtggaac aatgagacaa cacagcctca gatcgccaac 1380
tgtagcgtgt acgacttctt cgtgtggctg cactactata gcgtgaggga taccctgtgg 1440
ccccgcgtga cataccacat gaataagtac gcctatcaca tgctggagag gcgcgccaag 1500
tataagagag gccctggccc aggcgcaaag tttgtggcag catggaccct gaaggccgcc 1560
gccggccccg gccccggcca gtatatcaag gctaacagta agttcattgg aatcacagag 1620
ctgggacccg gacctgga 1638
<210> 35
<211> 546
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Met Ala Gly Met Phe Gln Ala Leu Ser Glu Gly Cys Thr Pro Tyr Asp
1 5 10 15
Ile Asn Gln Met Leu Asn Val Leu Gly Asp His Gln Val Ser Gly Leu
20 25 30
Glu Gln Leu Glu Ser Ile Ile Asn Phe Glu Lys Leu Thr Glu Trp Thr
35 40 45
Ser Ser Asn Val Met Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu
50 55 60
Gly Phe Val Phe Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Ser Cys
65 70 75 80
Ile Ser Glu Ala Asp Ala Thr Thr Pro Glu Ser Ala Asn Leu Gly Glu
85 90 95
Glu Ile Leu Ser Gln Leu Tyr Leu Trp Pro Arg Val Thr Tyr His Ser
100 105 110
Pro Ser Tyr Ala Tyr His Gln Phe Glu Arg Arg Ala Lys Tyr Lys Arg
115 120 125
His Phe Pro Gly Phe Gly Gln Ser Leu Leu Phe Gly Tyr Pro Val Tyr
130 135 140
Val Phe Gly Asp Cys Val Gln Gly Asp Trp Asp Ala Ile Arg Phe Arg
145 150 155 160
Tyr Cys Ala Pro Pro Gly Tyr Ala Leu Leu Arg Cys Asn Asp Thr Asn
165 170 175
Tyr Ser Ala Leu Leu Ala Val Gly Ala Leu Glu Gly Pro Arg Asn Gln
180 185 190
Asp Trp Leu Gly Val Pro Arg Gln Leu Val Thr Arg Met Gln Ala Ile
195 200 205
Gln Asn Ala Gly Leu Cys Thr Leu Val Ala Met Leu Glu Glu Thr Ile
210 215 220
Phe Trp Leu Gln Ala Phe Leu Met Ala Leu Thr Asp Ser Gly Pro Lys
225 230 235 240
Thr Asn Ile Ile Val Asp Ser Gln Tyr Val Met Gly Ile Ser Lys Pro
245 250 255
Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Glu Leu Asn
260 265 270
Ser Thr Asp Gln Pro Phe Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu
275 280 285
Val Pro Met Val Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Gly
290 295 300
Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe Asn Leu Leu Glu
305 310 315 320
Leu Glu Gly Asp Tyr Arg Asp Asp Gly Asn Val Trp Val His Thr Pro
325 330 335
Leu Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Ala Val Glu Glu Lys
340 345 350
Lys Gly Ile Pro Val His Leu Glu Leu Ala Ser Met Thr Asn Met Glu
355 360 365
Leu Met Ser Ser Ile Val His Gln Gln Val Arg Thr Tyr Gly Pro Val
370 375 380
Phe Met Cys Leu Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp
385 390 395 400
Leu Thr Val Arg Val Leu Glu Leu Phe Arg Ala Ala Gln Leu Ala Asn
405 410 415
Asp Val Val Leu Gln Ile Met Glu Leu Cys Gly Ala Ala Phe Arg Gln
420 425 430
Val Cys His Thr Thr Val Pro Trp Pro Asn Ala Ser Leu Thr Pro Lys
435 440 445
Trp Asn Asn Glu Thr Thr Gln Pro Gln Ile Ala Asn Cys Ser Val Tyr
450 455 460
Asp Phe Phe Val Trp Leu His Tyr Tyr Ser Val Arg Asp Thr Leu Trp
465 470 475 480
Pro Arg Val Thr Tyr His Met Asn Lys Tyr Ala Tyr His Met Leu Glu
485 490 495
Arg Arg Ala Lys Tyr Lys Arg Gly Pro Gly Pro Gly Ala Lys Phe Val
500 505 510
Ala Ala Trp Thr Leu Lys Ala Ala Ala Gly Pro Gly Pro Gly Gln Tyr
515 520 525
Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu Gly Pro Gly
530 535 540
Pro Gly
545
<210> 36
<211> 2019
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 36
gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60
caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120
cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180
ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240
caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300
ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360
tcatcagttt aagcacatca aagcctttga ccggacattt gctaacaacc caggtcccat 420
ggttgtgttt gccacacctg ggcctatcct gtctcctctg acaaagggca tcctgggctt 480
cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540
gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600
aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660
taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720
cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780
ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840
agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900
ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960
gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020
tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080
cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140
aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200
actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260
agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320
gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380
catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440
gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500
cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560
tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620
cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680
ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740
tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800
acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860
ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920
ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980
gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019
<210> 37
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala
65 70 75 80
Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val
85 90 95
Leu Gly Asp His Gln Phe Lys His Ile Lys Ala Phe Asp Arg Thr Phe
100 105 110
Ala Asn Asn Pro Gly Pro Met Val Val Phe Ala Thr Pro Gly Pro Ile
115 120 125
Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr
130 135 140
Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr
145 150 155 160
Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr
165 170 175
Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln
180 185 190
Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln
195 200 205
Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln
210 215 220
Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr
225 230 235 240
Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val
245 250 255
Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg
260 265 270
Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr
275 280 285
Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu
290 295 300
Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser
305 310 315 320
Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp
325 330 335
Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp
340 345 350
Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val
355 360 365
Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala
370 375 380
Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp
385 390 395 400
Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn
405 410 415
Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu
420 425 430
Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His
435 440 445
Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu
450 455 460
Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu
465 470 475 480
Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met
485 490 495
Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro
500 505 510
Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln
515 520 525
Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His
530 535 540
Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met
545 550 555 560
Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg
565 570 575
Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala
580 585 590
Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe
595 600 605
Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly
610 615
<210> 38
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60
gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120
cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180
atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtggc 228
<210> 39
<211> 228
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60
gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120
cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180
atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtgcc 228
<210> 40
<211> 78
<212> DNA
<213> Homo sapiens
<400> 40
atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60
cagacctggg cgggctct 78
<210> 41
<211> 201
<212> DNA
<213> Homo sapiens
<400> 41
ccgtcttccc agcccaccat ccccatcgtg ggcatcattg ctggcctggt tctctttgga 60
gctgtgatca ctggagctgt ggtcgctgct gtgatgtgga ggaggaagag ctcagataga 120
aaaggaggga gctactctca ggctgcaagc agtgacagtg cccagggctc tgatgtgtct 180
ctcacagctt gtaaagtgtg a 201
<210> 42
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
atggagaccg atacactgct gctgtgggtg ctgctcctgt gggtgccagg aagcacaggc 60
<210> 43
<211> 3178
<212> DNA
<213> Homo sapiens
<400> 43
ggcaccgatt cggggcctgc ccggacttcg ccgcacgctg cagaacctcg cccagcgccc 60
accatgcccc ggcagctcag cgcggcggcc gcgctcttcg cgtccctggc cgtaattttg 120
cacgatggca gtcaaatgag agcaaaagca tttccagaaa ccagagatta ttctcaacct 180
actgcagcag caacagtaca ggacataaaa aaacctgtcc agcaaccagc taagcaagca 240
cctcaccaaa ctttagcagc aagattcatg gatggtcata tcacctttca aacagcggcc 300
acagtaaaaa ttccaacaac taccccagca actacaaaaa acactgcaac caccagccca 360
attacctaca ccctggtcac aacccaggcc acacccaaca actcacacac agctcctcca 420
gttactgaag ttacagtcgg ccctagctta gccccttatt cactgccacc caccatcacc 480
ccaccagctc atacagctgg aaccagttca tcaaccgtca gccacacaac tgggaacacc 540
actcaaccca gtaaccagac cacccttcca gcaactttat cgatagcact gcacaaaagc 600
acaaccggtc agaagcctga tcaacccacc catgccccag gaacaacggc agctgcccac 660
aataccaccc gcacagctgc acctgcctcc acggttcctg ggcccaccct tgcacctcag 720
ccatcgtcag tcaagactgg aatttatcag gttctaaacg gaagcagact ctgtataaaa 780
gcagagatgg ggatacagct gattgttcaa gacaaggagt cggttttttc acctcggaga 840
tacttcaaca tcgaccccaa cgcaacgcaa gcctctggga actgtggcac ccgaaaatcc 900
aaccttctgt tgaattttca gggcggattt gtgaatctca catttaccaa ggatgaagaa 960
tcatattata tcagtgaagt gggagcctat ttgaccgtct cagatccaga gacagtttac 1020
caaggaatca aacatgcggt ggtgatgttc cagacagcag tcgggcattc cttcaagtgc 1080
gtgagtgaac agagcctcca gttgtcagcc cacctgcagg tgaaaacaac cgatgtccaa 1140
cttcaagcct ttgattttga agatgaccac tttggaaatg tggatgagtg ctcgtctgac 1200
tacacaattg tgcttcctgt gattggggcc atcgtggttg gtctctgcct tatgggtatg 1260
ggtgtctata aaatccgcct aaggtgtcaa tcatctggat accagagaat ctaattgttg 1320
cccgggggga atgaaaataa tggaatttag agaactcttt catcccttcc aggatggatg 1380
ttgggaaatt ccctcagagt gtgggtcctt caaacaatgt aaaccaccat cttctattca 1440
aatgaagtga gtcatgtgtg atttaagttc aggcagcaca tcaatttcta aatacttttt 1500
gtttatttta tgaaagatat agtgagctgt ttattttcta gtttccttta gaatatttta 1560
gccactcaaa gtcaacattt gagatatgtt gaattaacat aatatatgta aagtagaata 1620
agccttcaaa ttataaacca agggtcaatt gtaactaata ctactgtgtg tgcattgaag 1680
attttatttt acccttgatc ttaacaaagc ctttgctttg ttatcaaatg gactttcagt 1740
gcttttacta tctgtgtttt atggtttcat gtaacataca tattcctggt gtagcactta 1800
actccttttc cactttaaat ttgtttttgt tttttgagac ggagtttcac tcttgtcacc 1860
caggctggag tacagtggca cgatctcggc ttatggcaac ctccgcctcc cgggttcaag 1920
tgattctcct gcttcagctt cccgagtagc tgggattaca ggcacacact accacgcctg 1980
gctaattttt gtatttttat tatagacggg tttcaccatg ttggccagac tggtcttgaa 2040
ctcttgacct caggtgatcc acccacctca gcctcccaaa gtgctgggat tacaggcatg 2100
agccattgcg cccggcctta aatgtttttt ttaatcatca aaaagaacaa catatctcag 2160
gttgtctaag tgtttttatg taaaaccaac aaaaagaaca aatcagctta tattttttat 2220
cttgatgact cctgctccag aattgctaga ctaagaatta ggtggctaca gatggtagaa 2280
ctaaacaata agcaagagac aataataatg gcccttaatt attaacaaag tgccagagtc 2340
taggctaagc actttatcta tatctcattt cattctcaca acttataagt gaatgagtaa 2400
actgagactt aagggaactg aatcacttaa atgtcacctg gctaactgat ggcagagcca 2460
gagcttgaat tcatgttggt ctgacatcaa ggtctttggt cttctcccta caccaagtta 2520
cctacaagaa caatgacacc acactctgcc tgaaggctca cacctcatac cagcatacgc 2580
tcaccttaca gggaaatggg tttatccagg atcatgagac attagggtag atgaaaggag 2640
agctttgcag ataacaaaat agcctatcct taataaatcc tccactctct ggaaggagac 2700
tgaggggctt tgtaaaacat tagtcagttg ctcattttta tgggattgct tagctgggct 2760
gtaaagatga aggcatcaaa taaactcaaa gtatttttaa atttttttga taatagagaa 2820
acttcgctaa ccaactgttc tttcttgagt gtatagcccc atcttgtggt aacttgctgc 2880
ttctgcactt catatccata tttcctattg ttcactttat tctgtagagc agcctgccaa 2940
gaattttatt tctgctgttt tttttgctgc taaagaaagg aactaagtca ggatgttaac 3000
agaaaagtcc acataaccct agaattctta gtcaaggaat aattcaagtc agcctagaga 3060
ccatgttgac tttcctcatg tgtttcctta tgactcagta agttggcaag gtcctgactt 3120
tagtcttaat aaaacattga attgtagtaa aggtttttgc aataaaaact tactttgg 3178
<210> 44
<211> 1858
<212> DNA
<213> Mus sp.
<400> 44
attccggagg tgaaaaacaa tggcacaacg tgtataatgg ccagcttctc tgcctccttt 60
ctgaccacct acgagactgc gaatggttct cagatcgtga acatttccct gccagcctct 120
gcagaagtac tgaaaaatgg cagttcttgt ggtaaagaaa atgtttctga ccccagcctc 180
acaattactt ttggaagagg atatttactg acactcaact tcacaaaaaa tacaacacgt 240
tacagtgtcc agcatatgta ttttacatat aacttgtcag atacagaaca ttttcccaat 300
gccatcagca aagagatcta caccatggat tccacaactg acatcaaggc agacatcaac 360
aaagcatacc ggtgtgtcag tgatatccgg gtctacatga agaatgtgac cgttgtgctc 420
cgggatgcca ctatccaggc ctacctgtcg agtggcaact tcagcaagga agagacacac 480
tgcacacagg atggaccttc cccaaccact gggccaccca gcccctcacc accacttgtg 540
cccacaaacc ccactgtatc caagtacaat gttactggta acaacggaac ctgcctgctg 600
gcctctatgg cactgcaact gaatatcacc tacctgaaaa aggacaacaa gacggtgacc 660
agagcgttca acatcagccc aaatgacaca tctagtggga gttgcggtat caacttggtg 720
accctgaaag tggagaacaa gaacagagcc ctggaattgc agtttgggat gaatgccagc 780
tctagcctgt ttttcttgca aggagtgcgc ttgaatatga ctcttcctga tgccctagtg 840
cccacattca gcatctccaa ccattcactg aaagctcttc aggccactgt gggaaactca 900
tacaagtgca acactgagga acacatcttt gtcagcaaga tgctctccct caatgtcttc 960
agtgtgcagg tccaggcttt caaggtggac agtgacaggt ttgggtctgt ggaagagtgt 1020
gttcaggatg gtaacaacat gttgatcccc attgctgtgg gcggtgccct ggcagggctg 1080
atcctcatcg tcctcattgc ctacctcatt ggcaggaaga ggagtcacgc cggctatcag 1140
accatctagc ctggtgggca ggtgcaccag agatgcacag gggcctgttc tcacatcccc 1200
aagcttagat aggtgtggaa gggaggcaca ctttctggca aactgtttta aaatctgctt 1260
tatcaaatgt gaagttcatc ttgcaacatt tactatgcac aaaggaataa ctattgaaat 1320
gacggtgtta attttgctaa ctgggttaaa tattgatgag aaggctccac tgatttgact 1380
tttaagactt ggtgtttggt tcttcattct tttactcaga tttaagccta tcaaagggat 1440
actctggtcc agaccttggc ctggcaaggg tggctgatgg ttaggctgca cacacttaag 1500
aagcaacggg agcagggaag gcttgcacac aggcacgcac agggtcaacc tctggacact 1560
tggcttgggc tacctggcct tgggggggct gaactctggc atctggctgg gtacacaccc 1620
ccccaatttc tgtgctctgc cacccgtgag ctgccacttt cctaaataga aaatggcatt 1680
atttttattt acttttttgt aaagtgattt ccagtcttgt gttggcgttc agggtggccc 1740
tgtctctgca ctgtgtacaa taatagattc acactgctga cgtgtcttgc agcgtaggtg 1800
ggttgtacac tgggcatcag ctcacgtaat gcattgcctg taacgatgct aataaaaa 1858
<210> 45
<211> 2339
<212> DNA
<213> Homo sapiens
<400> 45
ggcccaaccg ccgcccgcgc ccccgctctc cgcaccgtac ccggccgcct cgcgccatgg 60
cggcccccgg cagcgcccgg cgacccctgc tgctgctact gctgttgctg ctgctcggcc 120
tcatgcattg tgcgtcagca gcaatgttta tggtgaaaaa tggcaacggg accgcgtgca 180
taatggccaa cttctctgct gccttctcag tgaactacga caccaagagt ggccctaaga 240
acatgacctt tgacctgcca tcagatgcca cagtggtgct caaccgcagc tcctgtggaa 300
aagagaacac ttctgacccc agtctcgtga ttgcttttgg aagaggacat acactcactc 360
tcaatttcac gagaaatgca acacgttaca gcgtccagct catgagtttt gtttataact 420
tgtcagacac acaccttttc cccaatgcga gctccaaaga aatcaagact gtggaatcta 480
taactgacat cagggcagat atagataaaa aatacagatg tgttagtggc acccaggtcc 540
acatgaacaa cgtgaccgta acgctccatg atgccaccat ccaggcgtac ctttccaaca 600
gcagcttcag caggggagag acacgctgtg aacaagacag gccttcccca accacagcgc 660
cccctgcgcc acccagcccc tcgccctcac ccgtgcccaa gagcccctct gtggacaagt 720
acaacgtgag cggcaccaac gggacctgcc tgctggccag catggggctg cagctgaacc 780
tcacctatga gaggaaggac aacacgacgg tgacaaggct tctcaacatc aaccccaaca 840
agacctcggc cagcgggagc tgcggcgccc acctggtgac tctggagctg cacagcgagg 900
gcaccaccgt cctgctcttc cagttcggga tgaatgcaag ttctagccgg tttttcctac 960
aaggaatcca gttgaataca attcttcctg acgccagaga ccctgccttt aaagctgcca 1020
acggctccct gcgagcgctg caggccacag tcggcaattc ctacaagtgc aacgcggagg 1080
agcacgtccg tgtcacgaag gcgttttcag tcaatatatt caaagtgtgg gtccaggctt 1140
tcaaggtgga aggtggccag tttggctctg tggaggagtg tctgctggac gagaacagca 1200
tgctgatccc catcgctgtg ggtggtgccc tggcggggct ggtcctcatc gtcctcatcg 1260
cctacctcgt cggcaggaag aggagtcacg caggctacca gactatctag cctggtgcac 1320
gcaggcacag cagctgcagg ggcctctgtt cctttctctg ggcttagggt cctgtcgaag 1380
gggaggcaca ctttctggca aacgtttctc aaatctgctt catccaatgt gaagttcatc 1440
ttgcagcatt tactatgcac aacagagtaa ctatcgaaat gacggtgtta attttgctaa 1500
ctgggttaaa tattttgcta actggttaaa cattaatatt taccaaagta ggattttgag 1560
ggtgggggtg ctctctctga gggggtgggg gtgccgctgt ctctgagggg tgggggtgcc 1620
gctgtctctg aggggtgggg gtgccgctct ctctgagggg gtgggggtgc cgctttctct 1680
gagggggtgg gggtgccgct ctctctgagg gggtgggggt gctgctctct ccgaggggtg 1740
gaatgccgct gtctctgagg ggtgggggtg ccgctctaaa ttggctccat atcatttgag 1800
tttagggttc tggtgtttgg tttcttcatt ctttactgca ctcagattta agccttacaa 1860
agggaaagcc tctggccgtc acacgtagga cgcatgaagg tcactcgtgg tgaggctgac 1920
atgctcacac attacaacag tagagaggga aaatcctaag acagaggaac tccagagatg 1980
agtgtctgga gcgcttcagt tcagctttaa aggccaggac gggccacacg tggctggcgg 2040
cctcgttcca gtggcggcac gtccttgggc gtctctaatg tctgcagctc aagggctggc 2100
acttttttaa atataaaaat gggtgttatt tttatttttt tttgtaaagt gatttttggt 2160
cttctgttga cattcggggt gatcctgttc tgcgctgtgt acaatgtgag atcggtgcgt 2220
tctcctgatg ttttgccgtg gcttggggat tgtacacggg accagctcac gtaatgcatt 2280
gcctgtaaca atgtaataaa aagcctcttt cttttaaaaa aaaaaaaaaa aaaaaaaaa 2339
<210> 46
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
cagtacatca aggccaacag caagttcatc ggcatcaccg aactc 45
<210> 47
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 47
Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu
1 5 10 15
<210> 48
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
gctaaatttg tggctgcctg gacactgaaa gccgccgct 39
<210> 49
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 49
Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala
1 5 10
<210> 50
<211> 593
<212> DNA
<213> Woodchuck hepatitis virus
<400> 50
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tgt 593
<210> 51
<211> 589
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
tctccccccc ccccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa 60
taaggccggt gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat 120
gtgagggccc ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct 180
ctcgccaaag gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct 240
tcttgaagac aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc 300
gacaggtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa 360
ccccagtgcc acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc 420
gtattcaaca aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg 480
gggcctcggt gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc 540
ccgaaccacg gggacgtggt tttcctttga aaaacacgat gataatatg 589
<210> 52
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtag 720
<210> 53
<211> 1563
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 60
gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 120
aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 180
atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 240
gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 300
aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 360
aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 420
acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 480
ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 540
gtgaaccgca actggtactc ggacgccgac gtgcctgcct cggcccgcca ggaggggtgc 600
caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 660
cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 720
ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 780
gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 840
catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 900
ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 960
cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1020
gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1080
ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1140
ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1200
gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1260
ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1320
gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1380
ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1440
ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1500
gacgccgcgc acccgggtta ctctagagtc ggggcggccg gccgcttcga gcagacatga 1560
taa 1563
<210> 54
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 54
atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60
accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120
gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180
gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240
tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300
gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360
agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420
aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480
ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540
ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600
agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660
catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720
gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780
cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840
aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900
atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960
aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020
ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080
gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140
acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200
tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260
ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320
ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380
caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440
cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500
tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560
gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620
aaggccaaga agggcggcaa gatcgccgtg taa 1653
<210> 55
<211> 66
<212> DNA
<213> Foot-and-mouth disease virus
<400> 55
gtaaagcaaa cactgaactt tgaccttctc aagttggctg gagacgttga gtccaatcct 60
gggccc 66
<210> 56
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 56
Gly Pro Gly Pro Gly
1 5
<210> 57
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 57
Ser Ile Ile Asn Phe Glu Lys Leu
1 5
<210> 58
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 58
Ser Pro Ser Tyr Ala Tyr His Gln Phe
1 5
<210> 59
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Tyr Val Tyr Val Ala Asp Val Ala Ala Lys
1 5 10
<210> 60
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 60
Tyr Glu Met Phe Asn Asp Lys Ser
1 5
<210> 61
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 61
Tyr Glu Met Phe Asn Asp Lys Ser Gln Arg Ala Pro Asp Asp Lys Met
1 5 10 15
Phe
<210> 62
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 62
Tyr Glu Met Phe Asn Asp Lys Ser Phe
1 5
<210> 63
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ile or Leu
<400> 63
His Arg Xaa Glu Ile Phe Ser His Asp Phe Xaa
1 5 10
<210> 64
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Pyrrolysine
<400> 64
Phe Xaa Ile Glu Xaa Phe Xaa Glu Ser Ser
1 5 10
<210> 65
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Pyrrolysine
<400> 65
Asn Glu Ile Xaa Arg Glu Ile Arg Glu Ile
1 5 10
<210> 66
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Selenocysteine
<400> 66
Xaa Phe Lys Ser Ile Phe Glu Met Met Ser Xaa Asp Ser Ser Xaa
1 5 10 15
<210> 67
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Pyrrolysine
<400> 67
Lys Asn Phe Leu Glu Asn Phe Ile Glu Ser Xaa Phe Ile
1 5 10
<210> 68
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Selenocysteine
<220>
<221> MOD_RES
<222> (21)..(21)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (27)..(27)
<223> Ile or Leu
<400> 68
Xaa Phe Lys Ser Ile Phe Glu Met Met Ser Xaa Asp Ser Ser Xaa Ile
1 5 10 15
Phe Leu Lys Ser Xaa Phe Ile Glu Ile Phe Xaa
20 25
<210> 69
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Ile or Leu
<400> 69
Phe Xaa Glu Ile Phe Asn Asp Lys Ser Leu Asp Lys Phe Xaa Ile
1 5 10 15
<210> 70
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Pyrrolysine
<400> 70
Gln Cys Glu Ile Xaa Trp Ala Arg Glu
1 5
<210> 71
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Selenocysteine
<400> 71
Phe Ile Glu Xaa His Phe Trp Ile
1 5
<210> 72
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Selenocysteine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ile or Leu
<400> 72
Phe Glu Trp Arg His Arg Xaa Thr Arg Xaa Xaa Arg
1 5 10
<210> 73
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Ile or Leu
<400> 73
Gln Ile Glu Xaa Xaa Glu Ile Xaa Glu
1 5
<210> 74
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ile or Leu
<400> 74
Phe Xaa Glu Leu Phe Ile Ser Asx Xaa Ser Xaa Phe Ile Glu
1 5 10
<210> 75
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Ile or Leu
<400> 75
Gln Cys Glu Ile Xaa Trp Ala Arg Glu Phe Leu Lys Glu Ile Gly Xaa
1 5 10 15
<210> 76
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Ile or Leu
<400> 76
Ile Glu Phe Arg Xaa Glu Ile Phe Xaa Glu Phe
1 5 10
<210> 77
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Ile or Leu
<400> 77
Ile Glu Phe Arg Xaa Glu Ile Phe Xaa
1 5
<210> 78
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Ile or Leu
<400> 78
Glu Phe Arg Xaa Glu Ile Phe Xaa Glu
1 5
<210> 79
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Ile or Leu
<400> 79
Phe Arg Xaa Glu Ile Phe Xaa Glu Phe
1 5
<210> 80
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 80
Ser Ile Asn Phe Glu Lys Leu
1 5
<210> 81
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 81
Leu Leu Leu Leu Leu Val Val Val Val
1 5
<210> 82
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 82
Glu Lys Leu Ala Ala Tyr Leu Leu Leu
1 5
<210> 83
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 83
Lys Leu Ala Ala Tyr Leu Leu Leu Leu Leu
1 5 10
<210> 84
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 84
Phe Glu Lys Leu Ala Ala Tyr Leu
1 5
<210> 85
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 85
Ala Ala Tyr Leu Leu Leu Leu Leu
1 5
<210> 86
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 86
Tyr Leu Leu Leu Leu Leu Val Val Val
1 5
<210> 87
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 87
Val Val Val Val Ala Ala Tyr Ser Ile Asn
1 5 10
<210> 88
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 88
Val Val Val Val Ala Ala Tyr
1 5
<210> 89
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 89
Ala Tyr Ser Ile Asn Phe Glu Lys
1 5
<210> 90
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 90
Tyr Asn Tyr Ser Tyr Trp Ile Ser Ile Phe Ala His Thr Met Trp Tyr
1 5 10 15
Asn Ile Trp His Val Gln Trp Asn Lys
20 25
<210> 91
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 91
Ile Glu Ala Leu Pro Tyr Val Phe Leu Gln Asp Gln Phe Glu Leu Arg
1 5 10 15
Leu Leu Lys Gly Glu Gln Gly Asn Asn
20 25
<210> 92
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 92
Asp Ser Glu Glu Thr Asn Thr Asn Tyr Leu His Tyr Cys His Phe His
1 5 10 15
Trp Thr Trp Ala Gln Gln Thr Thr Val
20 25
<210> 93
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 93
Gly Met Leu Ser Gln Tyr Glu Leu Lys Asp Cys Ser Leu Gly Phe Ser
1 5 10 15
Trp Asn Asp Pro Ala Lys Tyr Leu Arg
20 25
<210> 94
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 94
Val Arg Ile Asp Lys Phe Leu Met Tyr Val Trp Tyr Ser Ala Pro Phe
1 5 10 15
Ser Ala Tyr Pro Leu Tyr Gln Asp Ala
20 25
<210> 95
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 95
Cys Val His Ile Tyr Asn Asn Tyr Pro Arg Met Leu Gly Ile Pro Phe
1 5 10 15
Ser Val Met Val Ser Gly Phe Ala Met
20 25
<210> 96
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 96
Phe Thr Phe Lys Gly Asn Ile Trp Ile Glu Met Ala Gly Gln Phe Glu
1 5 10 15
Arg Thr Trp Asn Tyr Pro Leu Ser Leu
20 25
<210> 97
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 97
Ala Asn Asp Asp Thr Pro Asp Phe Arg Lys Cys Tyr Ile Glu Asp His
1 5 10 15
Ser Phe Arg Phe Ser Gln Thr Met Asn
20 25
<210> 98
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 98
Ala Ala Gln Tyr Ile Ala Cys Met Val Asn Arg Gln Met Thr Ile Val
1 5 10 15
Tyr His Leu Thr Arg Trp Gly Met Lys
20 25
<210> 99
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 99
Lys Tyr Leu Lys Glu Phe Thr Gln Leu Leu Thr Phe Val Asp Cys Tyr
1 5 10 15
Met Trp Ile Thr Phe Cys Gly Pro Asp
20 25
<210> 100
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 100
Ala Met His Tyr Arg Thr Asp Ile His Gly Tyr Trp Ile Glu Tyr Arg
1 5 10 15
Gln Val Asp Asn Gln Met Trp Asn Thr
20 25
<210> 101
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 101
Thr His Val Asn Glu His Gln Leu Glu Ala Val Tyr Arg Phe His Gln
1 5 10 15
Val His Cys Arg Phe Pro Tyr Glu Asn
20 25
<210> 102
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 102
Gln Thr Phe Ser Glu Cys Leu Phe Phe His Cys Leu Lys Val Trp Asn
1 5 10 15
Asn Val Lys Tyr Ala Lys Ser Leu Lys
20 25
<210> 103
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 103
Ser Phe Ser Ser Trp His Tyr Lys Glu Ser His Ile Ala Leu Leu Met
1 5 10 15
Ser Pro Lys Lys Asn His Asn Asn Thr
20 25
<210> 104
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 104
Ile Leu Asp Gly Ile Met Ser Arg Trp Glu Lys Val Cys Thr Arg Gln
1 5 10 15
Thr Arg Tyr Ser Tyr Cys Gln Cys Ala
20 25
<210> 105
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 105
Tyr Arg Ala Ala Gln Met Ser Lys Trp Pro Asn Lys Tyr Phe Asp Phe
1 5 10 15
Pro Glu Phe Met Ala Tyr Met Pro Ile
20 25
<210> 106
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 106
Pro Arg Pro Gly Met Pro Cys Gln His His Asn Thr His Gly Leu Asn
1 5 10 15
Asp Arg Gln Ala Phe Asp Asp Phe Val
20 25
<210> 107
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 107
His Asn Ile Ile Ser Asp Glu Thr Glu Val Trp Glu Gln Ala Pro His
1 5 10 15
Ile Thr Trp Val Tyr Met Trp Cys Arg
20 25
<210> 108
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 108
Ala Tyr Ser Trp Pro Val Val Pro Met Lys Trp Ile Pro Tyr Arg Ala
1 5 10 15
Leu Cys Ala Asn His Pro Pro Gly Thr
20 25
<210> 109
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 109
His Val Met Pro His Val Ala Met Asn Ile Cys Asn Trp Tyr Glu Phe
1 5 10 15
Leu Tyr Arg Ile Ser His Ile Gly Arg
20 25
<210> 110
<211> 484
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 110
Thr His Val Asn Glu His Gln Leu Glu Ala Val Tyr Arg Phe His Gln
1 5 10 15
Val His Cys Arg Phe Pro Tyr Glu Asn Ala Met His Tyr Gln Met Trp
20 25 30
Asn Thr Tyr Arg Ala Ala Gln Met Ser Lys Trp Pro Asn Lys Tyr Phe
35 40 45
Asp Phe Pro Glu Phe Met Ala Tyr Met Pro Ile Cys Val His Ile Tyr
50 55 60
Asn Asn Tyr Pro Arg Met Leu Gly Ile Pro Phe Ser Val Met Val Ser
65 70 75 80
Gly Phe Ala Met Ala Tyr Ser Trp Pro Val Val Pro Met Lys Trp Ile
85 90 95
Pro Tyr Arg Ala Leu Cys Ala Asn His Pro Pro Gly Thr Ala Asn Asp
100 105 110
Asp Thr Pro Asp Phe Arg Lys Cys Tyr Ile Glu Asp His Ser Phe Arg
115 120 125
Phe Ser Gln Thr Met Asn Ile Glu Ala Leu Pro Tyr Val Phe Leu Gln
130 135 140
Asp Gln Phe Glu Leu Arg Leu Leu Lys Gly Glu Gln Gly Asn Asn Asp
145 150 155 160
Ser Glu Glu Thr Asn Thr Asn Tyr Leu His Tyr Cys His Phe His Trp
165 170 175
Thr Trp Ala Gln Gln Thr Thr Val Ile Leu Asp Gly Ile Met Ser Arg
180 185 190
Trp Glu Lys Val Cys Thr Arg Gln Thr Arg Tyr Ser Tyr Cys Gln Cys
195 200 205
Ala Phe Thr Phe Lys Gly Asn Ile Trp Ile Glu Met Ala Gly Gln Phe
210 215 220
Glu Arg Thr Trp Asn Tyr Pro Leu Ser Leu Ser Phe Ser Ser Trp His
225 230 235 240
Tyr Lys Glu Ser His Ile Ala Leu Leu Met Ser Pro Lys Lys Asn His
245 250 255
Asn Asn Thr Gln Thr Phe Ser Glu Cys Leu Phe Phe His Cys Leu Lys
260 265 270
Val Trp Asn Asn Val Lys Tyr Ala Lys Ser Leu Lys His Val Met Pro
275 280 285
His Val Ala Met Asn Ile Cys Asn Trp Tyr Glu Phe Leu Tyr Arg Ile
290 295 300
Ser His Ile Gly Arg His Asn Ile Ile Ser Asp Glu Thr Glu Val Trp
305 310 315 320
Glu Gln Ala Pro His Ile Thr Trp Val Tyr Met Trp Cys Arg Val Arg
325 330 335
Ile Asp Lys Phe Leu Met Tyr Val Trp Tyr Ser Ala Pro Phe Ser Ala
340 345 350
Tyr Pro Leu Tyr Gln Asp Ala Lys Tyr Leu Lys Glu Phe Thr Gln Leu
355 360 365
Leu Thr Phe Val Asp Cys Tyr Met Trp Ile Thr Phe Cys Gly Pro Asp
370 375 380
Ala Ala Gln Tyr Ile Ala Cys Met Val Asn Arg Gln Met Thr Ile Val
385 390 395 400
Tyr His Leu Thr Arg Trp Gly Met Lys Tyr Asn Tyr Ser Tyr Trp Ile
405 410 415
Ser Ile Phe Ala His Thr Met Trp Tyr Asn Ile Trp His Val Gln Trp
420 425 430
Asn Lys Gly Met Leu Ser Gln Tyr Glu Leu Lys Asp Cys Ser Leu Gly
435 440 445
Phe Ser Trp Asn Asp Pro Ala Lys Tyr Leu Arg Pro Arg Pro Gly Met
450 455 460
Pro Cys Gln His His Asn Thr His Gly Leu Asn Asp Arg Gln Ala Phe
465 470 475 480
Asp Asp Phe Val
<210> 111
<211> 484
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 111
Ile Glu Ala Leu Pro Tyr Val Phe Leu Gln Asp Gln Phe Glu Leu Arg
1 5 10 15
Leu Leu Lys Gly Glu Gln Gly Asn Asn Ile Leu Asp Gly Ile Met Ser
20 25 30
Arg Trp Glu Lys Val Cys Thr Arg Gln Thr Arg Tyr Ser Tyr Cys Gln
35 40 45
Cys Ala His Val Met Pro His Val Ala Met Asn Ile Cys Asn Trp Tyr
50 55 60
Glu Phe Leu Tyr Arg Ile Ser His Ile Gly Arg Thr His Val Asn Glu
65 70 75 80
His Gln Leu Glu Ala Val Tyr Arg Phe His Gln Val His Cys Arg Phe
85 90 95
Pro Tyr Glu Asn Phe Thr Phe Lys Gly Asn Ile Trp Ile Glu Met Ala
100 105 110
Gly Gln Phe Glu Arg Thr Trp Asn Tyr Pro Leu Ser Leu Ala Met His
115 120 125
Tyr Gln Met Trp Asn Thr Ser Phe Ser Ser Trp His Tyr Lys Glu Ser
130 135 140
His Ile Ala Leu Leu Met Ser Pro Lys Lys Asn His Asn Asn Thr Val
145 150 155 160
Arg Ile Asp Lys Phe Leu Met Tyr Val Trp Tyr Ser Ala Pro Phe Ser
165 170 175
Ala Tyr Pro Leu Tyr Gln Asp Ala Gln Thr Phe Ser Glu Cys Leu Phe
180 185 190
Phe His Cys Leu Lys Val Trp Asn Asn Val Lys Tyr Ala Lys Ser Leu
195 200 205
Lys Tyr Arg Ala Ala Gln Met Ser Lys Trp Pro Asn Lys Tyr Phe Asp
210 215 220
Phe Pro Glu Phe Met Ala Tyr Met Pro Ile Ala Tyr Ser Trp Pro Val
225 230 235 240
Val Pro Met Lys Trp Ile Pro Tyr Arg Ala Leu Cys Ala Asn His Pro
245 250 255
Pro Gly Thr Cys Val His Ile Tyr Asn Asn Tyr Pro Arg Met Leu Gly
260 265 270
Ile Pro Phe Ser Val Met Val Ser Gly Phe Ala Met His Asn Ile Ile
275 280 285
Ser Asp Glu Thr Glu Val Trp Glu Gln Ala Pro His Ile Thr Trp Val
290 295 300
Tyr Met Trp Cys Arg Ala Ala Gln Tyr Ile Ala Cys Met Val Asn Arg
305 310 315 320
Gln Met Thr Ile Val Tyr His Leu Thr Arg Trp Gly Met Lys Tyr Asn
325 330 335
Tyr Ser Tyr Trp Ile Ser Ile Phe Ala His Thr Met Trp Tyr Asn Ile
340 345 350
Trp His Val Gln Trp Asn Lys Gly Met Leu Ser Gln Tyr Glu Leu Lys
355 360 365
Asp Cys Ser Leu Gly Phe Ser Trp Asn Asp Pro Ala Lys Tyr Leu Arg
370 375 380
Lys Tyr Leu Lys Glu Phe Thr Gln Leu Leu Thr Phe Val Asp Cys Tyr
385 390 395 400
Met Trp Ile Thr Phe Cys Gly Pro Asp Ala Asn Asp Asp Thr Pro Asp
405 410 415
Phe Arg Lys Cys Tyr Ile Glu Asp His Ser Phe Arg Phe Ser Gln Thr
420 425 430
Met Asn Asp Ser Glu Glu Thr Asn Thr Asn Tyr Leu His Tyr Cys His
435 440 445
Phe His Trp Thr Trp Ala Gln Gln Thr Thr Val Pro Arg Pro Gly Met
450 455 460
Pro Cys Gln His His Asn Thr His Gly Leu Asn Asp Arg Gln Ala Phe
465 470 475 480
Asp Asp Phe Val
<210> 112
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 112
Ser Ser Thr Pro Tyr Leu Tyr Tyr Gly Thr Ser Ser Val Ser Tyr Gln
1 5 10 15
Phe Pro Met Val Pro Gly Gly Asp Arg
20 25
<210> 113
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 113
Glu Met Ala Gly Lys Ile Asp Leu Leu Arg Asp Ser Tyr Ile Phe Gln
1 5 10 15
Leu Phe Trp Arg Glu Ala Ala Glu Pro
20 25
<210> 114
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 114
Ala Leu Lys Gln Arg Thr Trp Gln Ala Leu Ala His Lys Tyr Asn Ser
1 5 10 15
Gln Pro Ser Val Ser Leu Arg Asp Phe
20 25
<210> 115
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 115
Val Ser Ser His Ser Ser Gln Ala Thr Lys Asp Ser Ala Val Gly Leu
1 5 10 15
Lys Tyr Ser Ala Ser Thr Pro Val Arg
20 25
<210> 116
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 116
Lys Glu Ala Ile Asp Ala Trp Ala Pro Tyr Leu Pro Glu Tyr Ile Asp
1 5 10 15
His Val Ile Ser Pro Gly Val Thr Ser
20 25
<210> 117
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 117
Ser Pro Val Ile Thr Ala Pro Pro Ser Ser Pro Val Phe Asp Thr Ser
1 5 10 15
Asp Ile Arg Lys Glu Pro Met Asn Ile
20 25
<210> 118
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 118
Pro Ala Glu Val Ala Glu Gln Tyr Ser Glu Lys Leu Val Tyr Met Pro
1 5 10 15
His Thr Phe Phe Ile Gly Asp His Ala
20 25
<210> 119
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 119
Met Ala Asp Leu Asp Lys Leu Asn Ile His Ser Ile Ile Gln Arg Leu
1 5 10 15
Leu Glu Val Arg Gly Ser
20
<210> 120
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 120
Ala Ala Ala Tyr Asn Glu Lys Ser Gly Arg Ile Thr Leu Leu Ser Leu
1 5 10 15
Leu Phe Gln Lys Val Phe Ala Gln Ile
20 25
<210> 121
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 121
Lys Ile Glu Glu Val Arg Asp Ala Met Glu Asn Glu Ile Arg Thr Gln
1 5 10 15
Leu Arg Arg Gln Ala Ala Ala His Thr
20 25
<210> 122
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 122
Asp Arg Gly His Tyr Val Leu Cys Asp Phe Gly Ser Thr Thr Asn Lys
1 5 10 15
Phe Gln Asn Pro Gln Thr Glu Gly Val
20 25
<210> 123
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 123
Gln Val Asp Asn Arg Lys Ala Glu Ala Glu Glu Ala Ile Lys Arg Leu
1 5 10 15
Ser Tyr Ile Ser Gln Lys Val Ser Asp
20 25
<210> 124
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 124
Cys Leu Ser Asp Ala Gly Val Arg Lys Met Thr Ala Ala Val Arg Val
1 5 10 15
Met Lys Arg Gly Leu Glu Asn Leu Thr
20 25
<210> 125
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 125
Leu Pro Pro Arg Ser Leu Pro Ser Asp Pro Phe Ser Gln Val Pro Ala
1 5 10 15
Ser Pro Gln Ser Gln Ser Ser Ser Gln
20 25
<210> 126
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 126
Glu Leu Val Leu Glu Asp Leu Gln Asp Gly Asp Val Lys Met Gly Gly
1 5 10 15
Ser Phe Arg Gly Ala Phe Ser Asn Ser
20 25
<210> 127
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 127
Val Thr Met Asp Gly Val Arg Glu Glu Asp Leu Ala Ser Phe Ser Leu
1 5 10 15
Arg Lys Arg Trp Glu Ser Glu Pro His
20 25
<210> 128
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 128
Ile Val Gly Val Met Phe Phe Glu Arg Ala Phe Asp Glu Gly Ala Asp
1 5 10 15
Ala Ile Tyr Asp His Ile Asn Glu Gly
20 25
<210> 129
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 129
Thr Val Thr Pro Thr Pro Thr Pro Thr Gly Thr Gln Ser Pro Thr Pro
1 5 10 15
Thr Pro Ile Thr Thr Thr Thr Thr Val
20 25
<210> 130
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 130
Gln Glu Glu Met Pro Pro Arg Pro Cys Gly Gly His Thr Ser Ser Ser
1 5 10 15
Leu Pro Lys Ser His Leu Glu Pro Ser
20 25
<210> 131
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 131
Pro Asn Ile Gln Ala Val Leu Leu Pro Lys Lys Thr Asp Ser His His
1 5 10 15
Lys Ala Lys Gly Lys
20
<210> 132
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 132
Asn Leu Val Pro Met Val Ala Thr Val
1 5
<210> 133
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 133
Cys Leu Gly Gly Leu Leu Thr Met Val
1 5
<210> 134
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 134
Gly Ile Leu Gly Phe Val Phe Thr Leu
1 5
<210> 135
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 135
Leu Leu Phe Gly Tyr Pro Val Tyr Val
1 5
<210> 136
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 136
Gly Leu Cys Thr Leu Val Ala Met Leu
1 5
<210> 137
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 137
Trp Leu Ser Leu Leu Val Pro Phe Val
1 5
<210> 138
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 138
Phe Leu Leu Thr Arg Ile Cys Thr
1 5
<210> 139
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 139
Trp Gln Ala Gly Ile Leu Ala Arg
1 5
<210> 140
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 140
Gln Gly Gln Asn Leu Lys Tyr Gln
1 5
<210> 141
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 141
Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr
1 5 10 15
Val Gln Gly Gln Asn Leu Lys Tyr Gln
20 25
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 142
gtggtgtgca gcgagaatag 20
<210> 143
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 143
cgctcgttgt agatgtcgtt ag 22
<210> 144
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 144
ttcatgcccg tgttg 15
<210> 145
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 145
gtttttgatc cagacccaga tg 22
<210> 146
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 146
gcccattatt cagagcgagt a 21
<210> 147
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 147
tcaccaggat ccac 14
<210> 148
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 148
ccttgcacat gccggag 17
<210> 149
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 149
acagagcctc gcctttg 17
<210> 150
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 150
gtgagctggc gg 12
<210> 151
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 151
ctgaaagctc ggtttgctaa tg 22
<210> 152
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 152
ccatgctgga agagacaatc t 21
<210> 153
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 153
tggcgctgac cgata 15
<210> 154
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 154
tatgcctatc ctgtctcctc tg 22
<210> 155
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 155
gctaatgcag ctaagtcctc tc 22
<210> 156
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 156
tgaccgtgcc ttctg 15
<210> 157
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 157
Tyr Glu Met Phe Asn Asp Lys Ser Phe Gln Arg Ala Pro Asp Asp Lys
1 5 10 15
Met Phe
<210> 158
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Selenocysteine
<220>
<221> MOD_RES
<222> (7)..(8)
<223> Pyrrolysine
<400> 158
Phe Glu Gly Arg Lys Xaa Xaa Xaa Ile
1 5
<210> 159
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Pyrrolysine
<220>
<221> MOD_RES
<222> (10)..(10)
<223> Ile or Leu
<220>
<221> MOD_RES
<222> (14)..(14)
<223> Pyrrolysine
<400> 159
Pro Xaa Phe Ile Xaa Glu Xaa Xaa Ile Xaa Gly Glu Ile Xaa
1 5 10
<210> 160
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 160
Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala
1 5 10
<210> 161
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 161
Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu
1 5 10
<210> 162
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 162
Asp Leu Met Gly Tyr Ile Pro Ala Val
1 5
<210> 163
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 163
Phe Leu Pro Ser Asp Phe Phe Pro Ser Val
1 5 10
<210> 164
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 164
Phe Leu Leu Thr Arg Ile Leu Thr Ile
1 5
<210> 165
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 165
Phe Leu Leu Ser Leu Gly Ile His Leu
1 5
<210> 166
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 166
Ile Leu Lys Glu Pro Val His Gly Val
1 5
<210> 167
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 167
Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr
1 5 10
<210> 168
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 168
Cys Ile Asn Gly Val Cys Trp Thr Val
1 5
<210> 169
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 169
Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu
1 5 10
<210> 170
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 170
Phe Leu Tyr Ala Leu Ala Leu Leu Leu
1 5
<210> 171
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 171
Ala Ala Gly Ile Gly Ile Leu Thr Val
1 5
<210> 172
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 172
Ser Leu Leu Met Trp Ile Thr Gln Val
1 5
<210> 173
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 173
Lys Leu Gly Gly Ala Leu Gln Ala Lys
1 5
<210> 174
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 174
Arg Leu Arg Ala Glu Ala Gln Val Lys
1 5
<210> 175
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 175
Glu Glu Asn Leu Leu Asp Phe Val Arg Phe
1 5 10
<210> 176
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 176
Glu Glu Tyr Leu Gln Ala Phe Thr Tyr
1 5
<210> 177
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 177
Cys Thr Pro Tyr Asp Ile Asn Gln Met
1 5
<210> 178
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 178
Thr Thr Pro Glu Ser Ala Asn Leu
1 5
<210> 179
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 179
Cys Ala Pro Pro Gly Tyr Ala Leu Leu
1 5
<210> 180
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 180
Ser Gly Pro Lys Thr Asn Ile Ile Val
1 5
<210> 181
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 181
Leu Ser Pro Arg Thr Leu Asn Ala Trp
1 5
<210> 182
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 182
Thr Val Pro Trp Pro Asn Ala Ser Leu
1 5
<210> 183
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 183
Glu Gly Pro Arg Asn Gln Asp Trp Leu
1 5
<210> 184
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 184
Asp Trp Glu Asn Val Ser Pro Glu Leu
1 5
<210> 185
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 185
Ser Ile Ile Val Phe Asn Leu Leu
1 5
<210> 186
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 186
Ala Ser Met Thr Asn Met Glu Leu Met
1 5
<210> 187
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 187
Ala Gln Leu Ala Asn Asp Val Val Leu
1 5
<210> 188
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 188
Ser Val Tyr Asp Phe Phe Val Trp Leu
1 5
<210> 189
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 189
Met Asn Lys Tyr Ala Tyr His Met Leu
1 5
<210> 190
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 190
Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu
1 5 10 15
<210> 191
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 191
Ser Ile Asn Phe Glu Lys Leu Ala Ala Tyr Leu Leu Leu Leu Leu Val
1 5 10 15
Val Val Val
<210> 192
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 192
Leu Leu Leu Leu Leu Val Val Val Val Ala Ala Tyr Ser Ile Asn Phe
1 5 10 15
Glu Lys Leu
<210> 193
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 193
Ser Pro Ser Tyr Val Tyr His Gln Phe
1 5
Claims (173)
- 新生抗原発現系を含む、新生抗原発現系を送達するための組成物であって、
前記新生抗原発現系が、1つ以上のベクターを含み、
前記1つ以上のベクターが、以下を含む、前記組成物:
(a)RNAアルファウイルス骨格であって、
(i)少なくとも1つのプロモーターヌクレオチド配列と、
(ii)少なくとも1つのポリアデニル化(ポリ(A))配列と
を含む前記RNAアルファウイルス骨格;ならびに
(b)新生抗原カセットであって、
(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列であって、
(I)前記腫瘍に由来する、少なくとも1つの腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列であって、
(A)コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を有する、MHCクラスIエピトープコード核酸配列と、
(B)任意で5’リンカー配列と、
(C)任意で3’リンカー配列と
を含む、前記MHCクラスI新生抗原コード核酸配列
を含む、前記少なくとも1つの新生抗原コード核酸配列と、
(ii)任意で、前記新生抗原コード核酸配列に機能的に連結された第2のプロモーターヌクレオチド配列と、
(iii)任意で、少なくとも1つのMHCクラスII抗原コード核酸配列と、
(iv)任意で、GPGPGアミノ酸リンカー配列(SEQ ID NO:56)をコードする少なくとも1つの核酸配列と、
(v)任意で、前記アルファウイルスに対して天然のポリ(A)配列または外来性のポリ(A)配列である少なくとも1つの第2のポリ(A)配列と
を含む、前記新生抗原カセット。 - 新生抗原発現系を含む、新生抗原発現系を送達するための組成物であって、
前記新生抗原発現系が、1つ以上のベクターを含み、
前記1つ以上のベクターが、以下を含む、前記組成物:
(a)RNAアルファウイルス骨格であって、前記RNAアルファウイルス骨格がSEQ ID NO:6に記載の核酸配列を含み、前記RNAアルファウイルス骨格の配列が26Sプロモーターヌクレオチド配列及びポリ(A)配列を含み、前記26Sプロモーター配列が前記RNAアルファウイルス骨格に対して内在性のものであり、前記ポリ(A)配列が前記RNAアルファウイルス骨格に対して内在性のものである、前記RNAアルファウイルス骨格;ならびに
(b)前記26Sプロモーターヌクレオチド配列と前記ポリ(A)配列との間に組み込まれた新生抗原カセットであって、
(i)対象内に存在する腫瘍に由来する、少なくとも1つの新生抗原コード核酸配列であって、
(I)互いに直鎖状に連結された、少なくとも10個の腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列であって、それぞれが、
(A)コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を有し、アミノ酸7~15個の長さのMHCクラスIエピトープをコードする、MHCクラスIエピトープコード核酸配列と、
(B)前記MHC Iエピトープの天然のN末端アミノ酸配列をコードし、少なくともアミノ酸3個の長さであるペプチドをコードする、5’リンカー配列と、
(C)前記MHC Iエピトープの天然のN末端アミノ酸配列をコードし、少なくともアミノ酸3個の長さであるペプチドをコードする、3’リンカー配列と
を含む、前記MHCクラスI新生抗原コード核酸配列
を含み、
ここで、前記新生抗原カセットが前記26Sプロモーターヌクレオチド配列と機能的に連結され、前記MHCクラスI新生抗原コード核酸配列のそれぞれが、アミノ酸13~25個の長さのポリペプチドをコードし、各MHCクラスI新生抗原コード核酸配列の各3’末端が、前記新生抗原カセット内の最後のMHCクラスI新生抗原コード核酸配列を除いて、それに続くMHCクラスI新生抗原コード核酸配列の5’末端に連結されている、
前記少なくとも1つの新生抗原コード核酸配列と、
(ii)少なくとも2個のMHCクラスII抗原コード核酸配列であって、
(I)PADRE MHCクラスII配列(SEQ ID NO:48)と、
(II)破傷風トキソイドMHCクラスII配列(SEQ ID NO:46)と、
(III)前記PADRE MHCクラスII配列と前記破傷風トキソイドMHCクラスII配列とを連結するGPGPGアミノ酸リンカー配列をコードする、第1の核酸配列と、
(IV)前記少なくとも2個のMHCクラスII抗原コード核酸配列の5’末端と前記少なくとも20個の腫瘍特異的かつ対象特異的なMHCクラスI新生抗原コード核酸配列とを連結するGPGPGアミノ酸リンカー配列をコードする、第2の核酸配列と、
(V)任意で、前記少なくとも2個のMHCクラスII抗原コード核酸配列の3’末端のGPGPGアミノ酸リンカー配列をコードする、第3の核酸配列と
を含む、前記少なくとも2個のMHCクラスII抗原コード核酸配列と
を含む、前記新生抗原カセット。 - 前記新生抗原カセットの各要素の順序付けられた配列が、5’から3’に向かって、
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
を含む式で示され、
式中、Pは、前記第2のプロモーターヌクレオチド配列を含み、ここで、a=0または1であり、
Nは、前記MHCクラスIエピトープコード核酸配列のうちの1つを含み、ここで、c=1であり、
L5は、前記5’リンカー配列を含み、ここで、b=0または1であり、
L3は、前記3’リンカー配列を含み、ここで、d=0または1であり、
G5は、GPGPGアミノ酸リンカーをコードする前記少なくとも1つの核酸配列のうちの1つを含み、ここで、e=0または1であり、
G3は、GPGPGアミノ酸リンカーをコードする前記少なくとも1つの核酸配列のうちの1つを含み、ここで、g=0または1であり、
Uは、前記少なくとも1つのMHCクラスII抗原コード核酸配列のうちの1つを含み、ここで、f=1であり、
X=1~400であり、ここで、各Xについて、対応するNcは、エピトープコード核酸配列であり、
Y=0、1、または2であり、ここで、各Yについて、対応するUfは、抗原コード核酸配列である、
請求項1に記載の組成物。 - 各Xについて、対応するNcが、異なるMHCクラスIエピトープコード核酸配列である、請求項3に記載の組成物。
- 各Yについて、対応するUfが、異なるMHCクラスII抗原コード核酸配列である、請求項3または4に記載の組成物。
- a=0、b=1、d=1、e=1、g=1、h=1、X=20、Y=2であり、
前記少なくとも1つのプロモーターヌクレオチド配列が、前記RNAアルファウイルス骨格によって与えられる単一の26Sプロモーターヌクレオチド配列であり、
前記少なくとも1つのポリアデニル化ポリ(A)配列が、前記RNAアルファウイルス骨格によって与えられる少なくとも100個の連続したAヌクレオチドのポリ(A)配列であり、
各Nが、アミノ酸7~15個の長さのMHCクラスIエピトープをコードし、
L5が、前記MHC Iエピトープの天然のN末端アミノ酸配列をコードする天然の5’リンカー配列であり、前記5’リンカー配列が、少なくともアミノ酸3個の長さであるペプチドをコードし、
L3が、前記MHC Iエピトープの天然の末端核酸配列をコードする天然の3’リンカー配列であり、前記3’リンカー配列が、少なくともアミノ酸3個の長さであるペプチドをコードし、
Uが、PADREクラスII配列及び破傷風トキソイドMHCクラスII配列のそれぞれであり、
前記RNAアルファウイルス骨格が、SEQ ID NO:6に記載の配列であり、
前記MHCクラスI新生抗原コード核酸配列のそれぞれが、アミノ酸13個~25個の長さのポリペプチドをコードする、
請求項3~5のいずれか1項に記載の組成物。 - ナノ粒子状の送達ビヒクルをさらに含む、先行請求項のいずれか1項に記載の組成物。
- 前記ナノ粒子状の送達ビヒクルが、脂質ナノ粒子(LNP)である、請求項7に記載の組成物。
- 前記LNPが、イオン化可能なアミノ脂質を含む、請求項8に記載の組成物。
- 前記イオン化可能なアミノ脂質が、MC3様(ジリノレイルメチル-4-ジメチルアミノブチレート)分子を含む、請求項9に記載の組成物。
- 前記ナノ粒子状の送達ビヒクルが新生抗原発現系を封入する、請求項7~10のいずれか1項に記載の組成物。
- 複数のLNPをさらに含み、前記LNPが、
新生抗原発現系と、
カチオン性脂質と、
非カチオン性脂質と、
LNPの凝集を阻害する複合脂質と
を含み、前記複数のLNPのうち、少なくとも約95%のLNPが、
(a)非ラメラ形態を有するか、または、
(b)高電子密度である、
請求項8に記載の組成物。 - 前記非カチオン性脂質が、
(1)リン脂質、及び
(2)コレステロールまたはコレステロール誘導体
の混合物である、請求項12に記載の組成物。 - 前記LNPの凝集を阻害する複合脂質が、ポリエチレングリコール(PEG)-脂質複合体である、請求項12または13に記載の組成物。
- 前記PEG-脂質複合体が、PEG-ジアシルグリセロール(PEG-DAG)複合体、PEG-ジアルキルオキシプロピル(PEG-DAA)複合体、PEG-リン脂質複合体、PEG-セラミド(PEG-Cer)複合体、及びこれらの混合物からなる群から選択される、請求項14に記載の組成物。
- 前記PEG-DAA複合体が、PEG-ジデシルオキシプロピル(C10)複合体、PEG-ジラウリルオキシプロピル(C12)複合体、PEG-ジミリスチルオキシプロピル(C14)複合体、PEG-ジパルミチルオキシプロピル(C16)複合体、PEG-ジステアリルオキシプロピル(C18)複合体、及びこれらの混合物からなる群から選択されるメンバーである、請求項15に記載の組成物。
- 前記LNPの非ラメラ形態が、逆六方晶(HII)または立方晶相構造を含む、請求項12~16のいずれか1項に記載の組成物。
- 前記カチオン性脂質が、前記LNP中に存在する全脂質の約10mol%~約50mol%を構成する、請求項12~17のいずれか1項に記載の組成物。
- 前記カチオン性脂質が、前記LNP中に存在する全脂質の約20mol%~約50mol%を構成する、請求項12~17のいずれか1項に記載の組成物。
- 前記カチオン性脂質が、前記LNP中に存在する全脂質の約20mol%~約40mol%を構成する、請求項12~17のいずれか1項に記載の組成物。
- 前記非カチオン性脂質が、前記LNP中に存在する全脂質の約10mol%~約60mol%を構成する、請求項12~20のいずれか1項に記載の組成物。
- 前記非カチオン性脂質が、前記LNP中に存在する全脂質の約20mol%~約55mol%を構成する、請求項12~20のいずれか1項に記載の組成物。
- 前記非カチオン性脂質が、前記LNP中に存在する全脂質の約25mol%~約50mol%を構成する、請求項12~20のいずれか1項に記載の組成物。
- 前記複合脂質が、前記LNP中に存在する全脂質の約0.5mol%~約20mol%を構成する、請求項12~23のいずれか1項に記載の組成物。
- 前記複合脂質が、前記LNP中に存在する全脂質の約2mol%~約20mol%を構成する、請求項12~23のいずれか1項に記載の組成物。
- 前記複合脂質が、前記LNP中に存在する全脂質の約1.5mol%~約18mol%を構成する、請求項12~23のいずれか1項に記載の組成物。
- 前記LNPの95%超が非ラメラ形態を有する、請求項12~26のいずれか1項に記載の組成物。
- 前記LNPの95%超が高電子密度である、請求項12~27のいずれか1項に記載の組成物。
- 複数のLNPをさらに含み、前記LNPが、
前記LNP中に存在する全脂質の50mol%~65mol%を構成するカチオン性脂質と、
前記LNP中に存在する全脂質の0.5mol%~2mol%を構成する、LNPの凝集を阻害する複合脂質と、
(a)リン脂質とコレステロールまたはその誘導体との混合物であって、前記リン脂質が前記LNP中に存在する全脂質の4mol%~10mol%を構成し、前記コレステロールまたはその誘導体が前記LNP中に存在する全脂質の30mol%~40mol%を構成する、前記混合物、
(b)リン脂質とコレステロールまたはその誘導体との混合物であって、前記リン脂質が前記LNP中に存在する全脂質の3mol%~15mol%を構成し、前記コレステロールまたはその誘導体が前記LNP中に存在する全脂質の30mol%~40mol%を構成する、前記混合物、または、
(c)前記LNP中に存在する全脂質の49.5mol%以下であり、リン脂質とコレステロールまたはその誘導体との混合物を含み、前記コレステロールまたはその誘導体が、前記LNP中に存在する全脂質の30mol%から40mol%を構成するもの
のいずれかを含む、非カチオン性脂質と
を含む、請求項8~28のいずれか1項に記載の組成物。 - 複数のLNPをさらに含み、前記LNPが、
前記LNP中に存在する全脂質の50mol%~85mol%を構成するカチオン性脂質と、
前記LNP中に存在する全脂質の0.5mol%~2mol%を構成する、LNPの凝集を阻害する複合脂質と、
前記LNP中に存在する全脂質の13mol%~49.5mol%を構成する非カチオン性脂質と
を含む、請求項8~28のいずれか1項に記載の組成物。 - 前記リン脂質が、ジパルミトイルホスファチジルコリン(DPPC)、ジステアロイルホスファチジルコリン(DSPC)、またはこれらの混合物を含む、請求項29に記載の組成物。
- 前記複合脂質が、ポリエチレングリコール(PEG)-脂質複合体を含む、請求項29または30に記載の組成物。
- 前記PEG-脂質複合体が、PEG-ジアシルグリセロール(PEG-DAG)複合体、PEG-ジアルキルオキシプロピル(PEG-DAA)複合体、またはこれらの混合物を含む、請求項32に記載の組成物。
- 前記PEG-DAA複合体が、PEG-ジミリスチルオキシプロピル(PEG-DMA)複合体、PEG-ジステアリルオキシプロピル(PEG-DSA)複合体、またはこれらの混合物を含む、請求項33に記載の組成物。
- 前記複合体のPEG部分が、約2000ダルトンの平均分子量を有する、請求項32~34のいずれか1項に記載の組成物。
- 前記複合脂質が、前記LNP中に存在する全脂質の1mol%~2mol%を構成する、請求項29~35のいずれか1項に記載の組成物。
- 前記LNPが、式Iの構造を有する化合物、または、その薬学的に許容される塩、互変異性体、プロドラッグもしくは立体異性体を含む、請求項8~36のいずれか1項に記載の組成物:
式中、
L1及びL2は、それぞれ独立して、-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x-、-S-S-、-C(=O)S-、-SC(=O)-、-RaC(=O)-、-C(=O)Ra-、-RaC(=O)Ra-、-OC(=O)Ra-、-RaC(=O)O-、または直接的結合であり、
G1は、Ci~C2アルキレン、-(C=O)-、-O(C=O)-、-SC(=O)-、-RaC(=O)-、または直接的結合であり、
-C(=O)-、-(C=O)O-、-C(=O)S-、-C(=O)Ra-、または直接的結合であり、
Gは、Ci~C6アルキレンであり、
Raは、HまたはC1~C12アルキルであり、
R1a及びR1bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R1aは、HもしくはC1~C12アルキルであり、R1bはそれが結合する炭素原子と共に、隣り合ったR1b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R2a及びR2bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R2aは、HもしくはC1~C12アルキルであり、R2bはそれが結合する炭素原子と共に、隣り合ったR2b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R3a及びR3bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R3aは、HもしくはC1~C12アルキルであり、R3bはそれが結合する炭素原子と共に、隣り合ったR及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R4a及びR4bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R4aは、HもしくはC1~C12アルキルであり、R4bはそれが結合する炭素原子と共に、隣り合ったR4b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R5及びR6は、それぞれ独立してHまたはメチルであり、
R7は、C4~C20アルキルであり、
R8及びR9は、それぞれ独立してC1~C12アルキルであるか、またはR8及びR9は、それらが結合する窒素原子と共に、5、6、または7員の複素環を形成し、
a、b、c、及びdは、それぞれ独立して1~24の整数であり、xは0、1、または2である。 - 前記LNPが、式IIの構造を有する化合物、または、その薬学的に許容される塩、互変異性体、プロドラッグもしくは立体異性体を含む、請求項8~36のいずれか1項に記載の組成物:
式中、
L1及びL2は、それぞれ独立して-O(C=O)-、-(C=O)O-、または炭素-炭素二重結合であり、
R1a及びR1bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R1aは、HもしくはC1~C12アルキルであり、R1bはそれが結合する炭素原子と共に、隣り合ったR1b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R2a及びR2bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R2aは、HもしくはC1~C12アルキルであり、R2bはそれが結合する炭素原子と共に、隣り合ったR2b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R3a及びR3bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R3aは、HもしくはC1~C12アルキルであり、R3bはそれが結合する炭素原子と共に、隣り合ったR3b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R4a及びR4bは、各出現時に、独立して、(a)HもしくはC1~C12アルキルであるか、または(b)R4aは、HもしくはC1~C12アルキルであり、R4bはそれが結合する炭素原子と共に、隣り合ったR4b及びそれが結合する炭素原子と共に炭素-炭素二重結合を形成し、
R5及びR6は、それぞれ独立してメチルまたはシクロアルキルであり、
R7は、各出現時に、独立してHまたはC1~C12アルキルであり、
R8及びR9は、それぞれ独立して、非置換のC1~C12アルキルであるか、またはR8及びR9は、それらが結合する窒素原子と共に、1個の窒素原子を含む5、6、または7員の複素環を形成し、
a及びdは、それぞれ独立して0~24の整数であり、b及びcはそれぞれ独立して1~24の整数であり、eは1または2であり、
ただし、
R1a、R2a、R3a、もしくはR4aのうちの少なくとも1つが、C1~C12アルキルであるか、またはL1もしくはL2の少なくとも一方が、-O(C=O)-または-(C=O)O-であり、
R1a及びR1bは、aが6である場合にはイソプロピルでなく、aが8である場合にはn-ブチルでない。 - 中性脂質、ステロイド、及びポリマーコンジュゲート脂質を含む1つ以上の賦形剤をさらに含む、請求項37または39に記載の組成物。
- 前記中性脂質が、1,2-ジステアロイル-sn-グリセロ-3-ホスホコリン(DSPC)、1,2-ジパルミトイル-sn-グリセロ-3-ホスホコリン(DPPC)、1,2-ジミリストイル-sn-グリセロ-3-ホスホコリン(DMPC)、1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン(POPC)、1,2-ジオレオイル-sn-グリセロ-3-ホスホコリン(DOPC)、及び 1,2-ジオレオイル-sn-グリセロ-3-ホスホエタノールアミン(DOPE)のうちの少なくとも1つを含む、請求項39に記載の組成物。
- 前記中性脂質がDSPCである、請求項40に記載の組成物。
- 前記化合物と前記中性脂質とのモル比が、約2:1~約8:1の範囲である、請求項39~41のいずれか1項に記載の組成物。
- 前記ステロイドがコレステロールである、請求項39~42のいずれか1項に記載の組成物。
- 前記化合物と前記コレステロールとのモル比が、約2:1~1:1の範囲である、請求項43に記載の組成物。
- 前記ポリマーコンジュゲート脂質がPEG化脂質である、請求項39~44のいずれか1項に記載の組成物。
- 前記化合物と前記PEG化脂質とのモル比が、約100:1~約25:1の範囲である、請求項45に記載の組成物。
- 前記PEG化脂質が、PEG-DAG、PEGポリエチレン(PEG-PE)、PEG-スクシノイル-ジアシルグリセロール(PEG-S-DAG)、PEG-cer、またはPEGジアルキオキシプロピルカルバメートである、請求項45または46に記載の組成物。
- R10及びR11が、それぞれ独立して、12~16個の炭素原子を有する直鎖の飽和アルキル鎖である、請求項48に記載の組成物。
- 前記平均zが、約45である、請求項48または49に記載の組成物。
- 前記LNPが、ポリアニオン性の核酸と混合される際に非二重層構造に自己組織化する、請求項8~50のいずれか1項に記載の組成物。
- 前記非二重層構造が、60nm~120nmの直径を有する、請求項51に記載の組成物。
- 前記非二重層構造が、約70nm、約80nm、約90nm、または約100nmの直径を有する、請求項51に記載の組成物。
- 前記ナノ粒子状の送達ビヒクルが、約100nmの直径を有する、請求項7~53のいずれか1項に記載の組成物。
- 前記新生抗原カセットが、前記少なくとも1つのプロモーターヌクレオチド配列と前記少なくとも1つのポリ(A)配列との間に組み込まれている、請求項1、3~5、または7~54のいずれか1項に記載の組成物。
- 前記少なくとも1つのプロモーターヌクレオチド配列が、前記新生抗原コード核酸配列と機能的に連結されている、請求項1、3~5、または7~55のいずれか1項に記載の組成物。
- 前記1つ以上のベクターが、1つ以上の+鎖RNAベクターを含む、請求項1、3~5、または7~56のいずれか1項に記載の組成物。
- 前記1つ以上の+鎖RNAベクターが、5’7-メチルグアノシン(m7g)キャップを含む、請求項57に記載の組成物。
- 前記1つ以上の+鎖RNAベクターが、インビトロ転写によって生成される、請求項57または58に記載の組成物。
- 前記1つ以上のベクターが、哺乳動物細胞内で自己複製する、請求項1、3~5、または7~59のいずれか1項に記載の組成物。
- 前記RNAアルファウイルス骨格が、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスの少なくとも1つのヌクレオチド配列を含む、請求項1、3~5、または7~60のいずれか1項に記載の組成物。
- 前記RNAアルファウイルス骨格が、ベネズエラウマ脳炎ウイルスの少なくとも1つのヌクレオチド配列を含む、請求項1、3~5、または7~60のいずれか1項に記載の組成物。
- 前記RNAアルファウイルス骨格が、少なくとも、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスのヌクレオチド配列によってコードされた、非構造タンパク質媒介増幅のための配列、26Sプロモーター配列、ポリ(A)配列、非構造タンパク質1(nsP1)遺伝子、nsP2遺伝子、nsP3遺伝子、及びnsP4遺伝子を含む、請求項61または62に記載の組成物。
- 前記RNAアルファウイルス骨格が、少なくとも、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスのヌクレオチド配列によってコードされた、非構造タンパク質媒介増幅のための配列、26Sプロモーター配列、及びポリ(A)配列を含む、請求項61または62に記載の組成物。
- 前記非構造タンパク質媒介増幅のための配列が、アルファウイルス5’ UTR、51ntのCSE、24ntのCSE、26Sサブゲノミックプロモーター配列、19ntのCSE、アルファウイルス3’ UTR、またはこれらの組み合わせからなる群から選択される、請求項63または64に記載の組成物。
- 前記RNAアルファウイルス骨格が構造ビリオンタンパク質カプシドE2及びE1をコードしていない、請求項63~65のいずれか1項に記載の組成物。
- 前記新生抗原カセットが、アウラウイルス、フォートモルガンウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、セムリキ森林ウイルス、シンドビスウイルス、またはマヤロウイルスのヌクレオチド配列内の構造ビリオンタンパク質の代わりに挿入されている、請求項66に記載の組成物。
- 前記ベネズエラウマ脳炎ウイルスが、SEQ ID NO:3またはSEQ ID NO:5に記載の配列を含む、請求項61または62に記載の組成物。
- 前記ベネズエラウマ脳炎ウイルスが、塩基対7544と11175との間の欠失をさらに含むSEQ ID NO:3またはSEQ ID NO:5の配列を含む、請求項61または62に記載のの組成物。
- 前記RNAアルファウイルス骨格が、SEQ ID NO:6またはSEQ ID NO:7に記載の配列を含む、請求項69に記載の組成物。
- 前記新生抗原カセットが、SEQ ID NO:3またはSEQ ID NO:5の配列に記載される塩基対7544と11175との間の前記欠失を置換するように7544位に挿入されている、請求項69または70に記載の組成物。
- 前記新生抗原カセットの挿入が、nsP1~4遺伝子及び少なくとも1つの抗原コード核酸配列を含むポリシストロニックRNAの転写をもたらし、前記nsP1~4遺伝子及び前記少なくとも1つの抗原コード核酸配列が別々のオープンリーディングフレーム内にある、請求項67~71のいずれか1項に記載の組成物。
- 前記少なくとも1つのプロモーターヌクレオチド配列が、前記RNAアルファウイルス骨格によってコードされた天然の26Sプロモーターヌクレオチド配列である、請求項1、3~5、または7~72のいずれか1項に記載の組成物。
- 前記少なくとも1つのプロモーターヌクレオチド配列が、外来性のRNAプロモーターである、請求項1、3~5、または7~72のいずれか1項に記載の組成物。
- 前記第2のプロモーターヌクレオチド配列が、26Sプロモーターヌクレオチド配列である、請求項1、3~5、または7~74のいずれか1項に記載の組成物。
- 前記第2のプロモーターヌクレオチド配列が複数の26Sプロモーターヌクレオチド配列を含み、各26Sプロモーターヌクレオチド配列が、前記別々のオープンリーディングフレームのうちの1つ以上の転写をもたらす、請求項1、3~5、または7~74のいずれか1項に記載の組成物。
- 前記1つ以上のベクターが、それぞれ少なくとも300ntのサイズである、先行請求項のいずれか1項に記載の組成物。
- 前記1つ以上のベクターが、それぞれ少なくとも1kbのサイズである、先行請求項のいずれか1項に記載の組成物。
- 前記1つ以上のベクターが、それぞれ2kbのサイズである、先行請求項のいずれか1項に記載の組成物。
- 前記1つ以上のベクターが、それぞれ5kb未満のサイズである、先行請求項のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列のうちの少なくとも1つが、腫瘍細胞上のMHCクラスIによって提示されるポリペプチド配列またはその一部をコードする、先行請求項のいずれか1項に記載の組成物。
- 各抗原コード核酸配列が互いに直接連結されている、請求項1、3~5、または7~81のいずれか1項に記載の組成物。
- 前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つが、リンカーをコードする核酸配列によって異なる抗原コード核酸配列と連結されている、請求項1、3~5、または7~82のいずれか1項に記載の組成物。
- 前記リンカーが、2個のMHCクラスI配列または1個のMHCクラスI配列を1個のMHCクラスII配列と連結する、請求項83に記載の組成物。
- 前記リンカーが、
(1)少なくとも残基2、3、4、5、6、7、8、9、または10個の長さの連続したグリシン残基、
(2)少なくとも残基2、3、4、5、6、7、8、9、または10個の長さの連続したアラニン残基、
(3)2個のアルギニン残基(RR)、
(4)アラニン、アラニン、チロシン(AAY)、
(5)哺乳動物プロテアソームによって効率的にプロセシングされる、少なくともアミノ酸残基2、3、4、5、6、7、8、9、または10個の長さのコンセンサス配列、及び
(6)元のタンパク質と同種のタンパク質に由来する抗原に隣接し、少なくともアミノ酸残基2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、または2~20個の長さの1つ以上の天然配列
からなる群から選択される、請求項84に記載の組成物。 - 前記リンカーが、2個のMHCクラスII配列または1個のMHCクラスII配列を1個のMHCクラスI配列と連結する、請求項83に記載の組成物。
- 前記リンカーが、配列GPGPGを含む、請求項86に記載の組成物。
- 前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つの配列が、
前記少なくとも1つの抗原コード核酸配列の発現、安定性、細胞トラフィッキング、プロセシング及び提示、ならびに/または免疫原性を高める、分離したまたは連続的な配列
に機能的または直接的に連結されている、請求項1、3~5、または7~87のいずれか1項に記載の組成物。 - 前記分離したまたは連続的な配列が、ユビキチン配列、プロテアソームターゲティング性を高めるように改変されたユビキチン配列(例えば、76位にGlyからAlaへの置換を含むユビキチン配列)、免疫グロブリンシグナル配列(例えばIgK)、主要組織適合性クラスI配列、リソソーム関連膜タンパク質(LAMP)-1、ヒト樹状細胞リソソーム関連膜タンパク質、及び主要組織適合性クラスII配列のうちの少なくとも1つを含み、任意でプロテアソームターゲティング性を高めるように改変された前記ユビキチン配列がA76である、請求項88に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列のうちの少なくとも1つが、翻訳後の対応する野生型核酸配列と比べて、その対応するMHCアレルに対する増大した結合親和性を有するポリペプチド配列またはその一部をコードする、先行請求項のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列の少なくとも1つが、翻訳後の対応する野生型核酸配列と比べて、その対応するMHCアレルに対する増大した結合安定性を有するポリペプチド配列またはその一部をコードする、先行請求項のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列のうちの少なくとも1つが、翻訳後の対応する野生型核酸配列と比べて、その対応するMHCアレル上への増大した提示の尤度を有するポリペプチド配列またはその一部をコードする、先行請求項のいずれか1項に記載の組成物。
- 前記少なくとも1つの変化が、点変異、フレームシフト変異、非フレームシフト変異、欠失変異、挿入変異、スプライスバリアント、ゲノム再編成、またはプロテアソームにより生成されたスプライスされた抗原を含む、先行請求項のいずれか1項に記載の組成物。
- 前記腫瘍が、肺癌、メラノーマ、乳癌、卵巣癌、前立腺癌、腎臓癌、胃癌、結腸癌、精巣癌、頭頸部癌、膵臓癌、膀胱癌、脳癌、B細胞リンパ腫、急性骨髄性白血病、成人急性リンパ芽球性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺癌、及び小細胞肺癌からなる群から選択される、先行請求項のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列が、少なくとも2~10個、2個、3個、4個、5個、6個、7個、8個、9個、または10個の核酸配列を含む、請求項1、3~5、または7~94のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列が、少なくとも11~20個、15~20個、11~100個、11~200個、11~300個、11~400個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、または最大で400個の核酸配列を含む、請求項1、3~5、または7~94のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列が少なくとも2~400個の核酸配列を含み、前記新生抗原コード核酸配列のうちの少なくとも2個が、腫瘍細胞表面上のMHCクラスIによって提示されるポリペプチド配列またはその一部をコードする、請求項1、3~5、または7~94のいずれか1項に記載の組成物。
- 前記新生抗原コード核酸配列のうちの少なくとも2つが、腫瘍細胞表面上のMHCクラスIによって提示されるポリペプチド配列またはその一部をコードする、請求項2または6に記載の組成物。
- 対象に投与されて翻訳された場合、前記少なくとも1つの新生抗原コード核酸配列によってコードされた新生抗原のうちの少なくとも1つが抗原提示細胞上に提示され、腫瘍細胞表面上の新生抗原の少なくとも1つを標的とする免疫応答をもたらす、先行請求項のいずれか1項に記載の組成物。
- 前記少なくとも1つの新生抗原コード核酸配列が、対象に投与されて翻訳された場合、MHCクラスIまたはクラスII新生抗原のうちの少なくとも1つが抗原提示細胞上に提示され、腫瘍細胞表面上の新生抗原の少なくとも1つを標的とする免疫応答をもたらし、任意で、前記少なくとも1つの新生抗原コード核酸配列のそれぞれの発現が、前記少なくとも1つのプロモーターヌクレオチド配列によって誘導される、先行請求項のいずれか1項に記載の組成物。
- 各MHCクラスI新生抗原コード核酸配列が、アミノ酸8~35個の長さ、任意で、アミノ酸9~17個、9~25個、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34または35個のポリペプチド配列をコードする、請求項1、3~5、または7~100のいずれか1項に記載の組成物。
- 前記少なくとも1つのMHCクラスII抗原コード核酸配列が存在する、請求項1、3~5、または7~101のいずれか1項に記載の組成物。
- 前記少なくとも1つのMHCクラスII抗原コード核酸配列が存在し、かつ、前記コードされたペプチド配列を野生型核酸配列によってコードされる対応するペプチド配列とは異なるものとする少なくとも1つの変化を含む少なくとも1つのMHCクラスII新生抗原コード核酸配列を含む、請求項1、3~5、または7~101のいずれか1項に記載の組成物。
- 前記少なくとも1つのMHCクラスII抗原コード核酸配列が、アミノ酸12~20個、12、13、14、15、16、17、18、19、20個、または20~40個の長さである、請求項1、3~5、または7~103のいずれか1項に記載の組成物。
- 前記少なくとも1つのMHCクラスII抗原コード核酸配列が存在し、かつ、少なくとも1つのユニバーサルMHCクラスII抗原コード核酸配列を含み、任意で、前記少なくとも1つのユニバーサル配列が、破傷風トキソイド及びPADREの少なくとも一方を含む、請求項1、3~5、または7~104のいずれか1項に記載の組成物。
- 前記少なくとも1つのプロモーターヌクレオチド配列または前記第2のプロモーターヌクレオチド配列が誘導性である、請求項1、3~5、または7~105のいずれか1項に記載の組成物。
- 前記少なくとも1つのプロモーターヌクレオチド配列または前記第2のプロモーターヌクレオチド配列が非誘導性である、請求項1、3~5、または7~105のいずれか1項に記載の組成物。
- 前記少なくとも1つのポリ(A)配列が、前記アルファウイルスに天然に存在するポリ(A)配列を含む、請求項1、3~5、または7~107のいずれか1項に記載の組成物。
- 前記少なくとも1つのポリ(A)配列が、前記アルファウイルスに対して外来性のポリ(A)配列を含む、請求項1、3~5、または7~107のいずれか1項に記載の組成物。
- 前記少なくとも1つのポリ(A)配列が、前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つと機能的に連結されている、請求項1、3~5、または7~109のいずれか1項に記載の組成物。
- 前記少なくとも1つのポリ(A)配列が、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、または少なくとも90個の連続したAヌクレオチドである、請求項1、3~5、または7~110のいずれか1項に記載の組成物。
- 前記少なくとも1つのポリ(A)配列が、少なくとも100個の連続したAヌクレオチドである、請求項1、3~5、または7~110のいずれか1項に記載の組成物。
- 前記新生抗原カセットが、
イントロン配列、ウッドチャック肝炎ウイルス転写後調節因子(WPRE)配列、内部リボソーム進入配列(IRES)配列、2A自己切断ペプチド配列をコードするヌクレオチド配列、フリン切断部位をコードするヌクレオチド配列、または、前記少なくとも1つの抗原コード核酸配列のうちの少なくとも1つに機能的に連結された、mRNAの核輸送、安定性、もしくは翻訳効率を向上させることが知られている5’もしくは3’末端非コード領域内の配列
のうちの少なくとも1つをさらに含む、先行請求項のいずれか1項に記載の組成物。 - 前記新生抗原カセットが、緑色蛍光タンパク質(GFP)、GFP変異体、分泌型アルカリホスファターゼ、ルシフェラーゼ、ルシフェラーゼ変異体、または検出可能なペプチドもしくはエピトープを含むがこれらに限定されないレポーター遺伝子をさらに含む、先行請求項のいずれか1項に記載の組成物。
- 前記検出可能なペプチドまたはエピトープが、HAタグ、Flagタグ、Hisタグ、またはV5タグからなる群から選択される、請求項114に記載の組成物。
- 前記1つ以上のベクターが、少なくとも1つの免疫調節物質をコードする1つ以上の核酸配列をさらに含む、先行請求項のいずれか1項に記載の組成物。
- 前記免疫調節物質が、抗CTLA4抗体もしくはその抗原結合フラグメント、抗PD-1抗体もしくはその抗原結合フラグメント、抗PD-L1抗体もしくはその抗原結合フラグメント、抗4-1BB抗体もしくはその抗原結合フラグメント、または抗OX-40抗体もしくはその抗原結合フラグメントである、請求項116に記載の組成物。
- 前記抗体またはその抗原結合フラグメントが、Fabフラグメント、Fab’フラグメント、一本鎖Fv(scFv)、単一特異的もしくは互いに連結された多重特異性の単一ドメイン抗体(sdAb)(例えば、ラクダ科動物の抗体ドメイン)、または完全長の一本鎖抗体(例えば、フレキシブルリンカーによって重鎖と軽鎖が連結された完全長IgG)である、請求項117に記載の組成物。
- 前記抗体の重鎖配列と軽鎖配列が、2Aなどの自己切断配列もしくはIRESによって分けられた連続的配列であるか、または前記抗体の重鎖配列と軽鎖配列が、連続したグリシン残基などのフレキシブルリンカーによって連結されている、請求項117または118に記載の組成物。
- 前記免疫調節物質がサイトカインである、請求項116に記載の組成物。
- 前記サイトカインが、IL-2、IL-7、IL-12、IL-15、もしくはIL-21、またはそれぞれのその変異体のうちの1つである、請求項120に記載の組成物。
- 前記少なくとも1つのMHCクラスI新生抗原コード核酸配列が、
(a)腫瘍から、エクソーム、トランスクリプトーム、または全ゲノムの腫瘍ヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記腫瘍ヌクレオチドシークエンシングデータが、新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられる、工程と、
(b)新生抗原のそれぞれが腫瘍の腫瘍細胞表面上のMHCアレルのうちの1つ以上によって提示される数値的尤度のセットを生成するために、各新生抗原のペプチド配列を提示モデルに入力する工程であって、前記数値的尤度のセットが、受け取った質量分析データに少なくとも基づいて特定されたものである、工程と、
(c)新生抗原のセットのサブセットを、前記数値的尤度のセットに基づいて選択することにより、前記少なくとも1つのMHCクラスI新生抗原コード核酸配列を生成するために用いられる選択された新生抗原のセットを生成する工程と
を行うことによって選択される、請求項1、3~5、または7~121のいずれか1項に記載の組成物。 - 前記MHCクラスIエピトープコード核酸配列のそれぞれが、
(a)腫瘍から、エクソーム、トランスクリプトーム、または全ゲノムの腫瘍ヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記腫瘍ヌクレオチドシークエンシングデータが、新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられる、工程と、
(b)新生抗原のそれぞれが腫瘍の腫瘍細胞表面上のMHCアレルのうちの1つ以上によって提示される数値的尤度のセットを生成するために、各新生抗原のペプチド配列を提示モデルに入力する工程であって、前記数値的尤度のセットが、受け取った質量分析データに少なくとも基づいて特定されたものである、工程と、
(c)前記少なくとも20個のMHCクラスI新生抗原コード核酸配列を生成するために用いられる選択された新生抗原のセットを生成するために、新生抗原のセットのサブセットを、数値的尤度のセットに基づいて選択する工程と
を行うことによって選択される、請求項2または6に記載の組成物。 - 前記選択された新生抗原のセットの数が、2~20である、請求項122に記載の組成物。
- 前記提示モデルが、
(a)前記MHCアレルのうちの特定の1つとペプチド配列の特定の位置の特定のアミノ酸とのペアの存在と、
(b)前記ペアの前記MHCアレルのうちの前記特定の1つによる、前記特定の位置に前記特定のアミノ酸を含むそのようなペプチド配列の腫瘍細胞表面上での提示の尤度と
の間の依存性を表す、請求項122~124のいずれか1項に記載の組成物。 - 前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む、請求項122~125のいずれか1項に記載の組成物。
- 前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む、請求項122~126のいずれか1項に記載の組成物。
- 前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である、請求項122~127のいずれか1項に記載の組成物。
- 前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて中枢性寛容または末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む、請求項122~128のいずれか1項に記載の組成物。
- 前記選択された新生抗原のセットを選択することが、前記提示モデルに基づいて選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、請求項122~129のいずれか1項に記載の組成物。
- エクソームまたはトランスクリプトームのヌクレオチドシークエンシングデータが、腫瘍組織でシークエンシングを行うことによって取得される、請求項122~130のいずれか1項に記載の組成物。
- 前記シークエンシングが、次世代シークエンシング(NGS)または任意の大規模並列処理シークエンシングアプローチである、請求項131に記載の組成物。
- 前記新生抗原カセットが、前記新生抗原カセット内の隣接配列によって形成されたジャンクショナルエピトープ配列を含む、先行請求項のいずれか1項に記載の組成物。
- 少なくとも1つの、または各ジャンクショナルエピトープ配列が、MHCに対して500nMよりも高い親和性を有する、請求項133に記載の組成物。
- 各ジャンクショナルエピトープ配列が非自己である、請求項133または134に記載の組成物。
- 前記新生抗原カセットが、翻訳後の野生型核酸配列を含む非治療的MHCクラスIまたはクラスIIエピトープ核酸配列をコードしておらず、前記非治療的エピトープが前記対象のMHCアレル上に提示されると予測される、先行請求項のいずれか1項に記載の組成物。
- 前記非治療的な予測されたMHCクラスIまたはクラスIIエピトープ配列が、前記新生抗原カセット内の隣接配列によって形成されたジャンクショナルエピトープ配列である、請求項136に記載の組成物。
- 前記予測が、前記非治療的エピトープの配列を提示モデルに入力することによって生成される提示尤度に基づいたものである、請求項133~137のいずれか1項に記載の組成物。
- 前記新生抗原カセット内における少なくとも1つの抗原コード核酸配列の順序が、
(a)前記少なくとも1つの抗原コード核酸配列の異なる順序に対応した候補新生抗原カセット配列のセットを生成する工程、
(b)前記各候補新生抗原カセット配列について、前記候補新生抗原カセット配列内の非治療的エピトープの提示に基づいた提示スコアを決定する工程、及び
(c)所定の閾値を下回る提示スコアに関連する候補カセット配列を、新生抗原ワクチン用の新生抗原カセット配列として選択する工程
を含む一連の工程によって決定される、請求項133~138のいずれか1項に記載の組成物。 - 先行請求項のいずれか1項に記載の組成物と、薬学的に許容される担体とを含む、医薬組成物。
- アジュバントをさらに含む、請求項140に記載の組成物。
- 免疫調節物質をさらに含む、請求項140または141に記載の医薬組成物。
- 前記免疫調節物質が、抗CTLA4抗体もしくはその抗原結合フラグメント、抗PD-1抗体もしくはその抗原結合フラグメント、抗PD-L1抗体もしくはその抗原結合フラグメント、抗4-1BB抗体もしくはその抗原結合フラグメント、または抗OX-40抗体もしくはその抗原結合フラグメントである、請求項142に記載の医薬組成物。
- 先行の組成物の請求項のいずれか1項に記載の新生抗原カセットと、SEQ ID NO:3またはSEQ ID NO:5の配列から得られる1つ以上の要素とを含む、単離ヌクレオチド配列または単離ヌクレオチド配列のセットであって、任意で、前記1つ以上の要素が、非構造タンパク質媒介増幅に必要な配列、26Sプロモーターヌクレオチド配列、ポリ(A)配列、及びSEQ ID NO:3またはSEQ ID NO:5に記載の配列のnsP1~4遺伝子からなる群から選択され、任意で、前記ヌクレオチド配列がcDNAである、前記単離ヌクレオチド配列または単離ヌクレオチド配列のセット。
- 前記配列または単離ヌクレオチド配列のセットが、SEQ ID NO:6またはSEQ ID NO:7に記載の配列の7544位に挿入された先行の組成物の請求項のいずれか1項に記載の新生抗原カセットを含む、請求項144に記載の単離ヌクレオチド配列。
- SEQ ID NO:3またはSEQ ID NO:5の配列から得られた前記1つ以上の要素の5’側に位置するT7またはSP6 RNAポリメラーゼプロモーターのヌクレオチド配列と、
任意で、前記ポリ(A)配列の3’側に位置する1つ以上の制限部位と
をさらに含む、請求項144または145に記載の単離ヌクレオチド配列。 - 先行の組成物の請求項のいずれか1項に記載の新生抗原カセットが、SEQ ID NO:8またはSEQ ID NO:9の7563位に挿入されている、請求項144に記載の単離ヌクレオチド配列。
- 請求項144~147のいずれか1項に記載のヌクレオチド配列を含む、ベクターまたはベクターのセット。
- 請求項144~148のいずれか1項に記載のヌクレオチド配列または単離ヌクレオチド配列のセットを含む単離細胞であって、任意で、前記細胞が、BHK-21、CHO、HEK293もしくはその変異体、911、HeLa、A549、LP-293、PER.C6、またはAE1-2a細胞である、前記単離細胞。
- 先行の組成物の請求項のいずれか1項に記載の組成物と、使用説明書とを含む、キット。
- がんを有する対象を治療するための方法であって、前記対象に、先行の組成物の請求項のいずれか1項に記載の組成物、または請求項140~143のいずれか1項に記載の医薬組成物を投与することを含む、前記方法。
- 腫瘍に由来する少なくとも1つのMHCクラスI新生抗原コード核酸配列が、がんを有する前記対象の腫瘍に由来する、請求項151に記載の方法。
- 少なくとも1つのMHCクラスI新生抗原コード核酸配列が、がんを有する前記対象の腫瘍に由来しない、請求項151に記載の方法。
- 対象に免疫応答を誘導するための方法であって、前記対象に、先行の組成物の請求項のいずれか1項に記載の組成物、または請求項140~143のいずれか1項に記載の医薬組成物を投与することを含む、前記方法。
- 前記組成物が、筋肉内(IM)、皮内(ID)、皮下(SC)、または静脈内(IV)投与される、請求項151~154のいずれか1項に記載の方法。
- 前記組成物が筋肉内投与される、請求項151~154のいずれか1項に記載の方法。
- 1つ以上の免疫調節物質の投与をさらに含み、任意で、前記免疫調節物質が前記組成物または医薬組成物の投与前、投与と同時、または投与後に投与される、請求項151~156のいずれか1項に記載の方法。
- 前記1つ以上の免疫調節物質が、抗CTLA4抗体もしくはその抗原結合フラグメント、抗PD-1抗体もしくはその抗原結合フラグメント、抗PD-L1抗体もしくはその抗原結合フラグメント、抗4-1BB抗体もしくはその抗原結合フラグメント、または抗OX-40抗体もしくはその抗原結合フラグメントからなる群から選択される、請求項157に記載の方法。
- 前記免疫調節物質が、静脈内(IV)、筋肉内(IM)、皮内(ID)、または皮下(SC)投与される、請求項157または158に記載の方法。
- 前記皮下投与が、前記組成物または医薬組成物の投与部位の近くに、または1つ以上のベクターもしくは組成物の流入領域リンパ節に近接して行われる、請求項159に記載の方法。
- 前記対象に第2のワクチン組成物を投与することをさらに含む、請求項151~160のいずれか1項に記載の方法。
- 前記第2のワクチン組成物が、請求項151~160のいずれか1項に記載の組成物または医薬組成物の投与の前に投与される、請求項161に記載の方法。
- 前記第2のワクチン組成物が、請求項151~160のいずれか1項に記載の組成物または医薬組成物の投与の後に投与される、請求項161に記載の方法。
- 前記第2のワクチン組成物が、請求項151~160のいずれか1項に記載の組成物または医薬組成物と同じである、請求項162または163に記載の方法。
- 前記第2のワクチン組成物が、請求項151~160のいずれか1項に記載の組成物または医薬組成物と異なる、請求項162または163に記載の方法。
- 前記第2のワクチン組成物が、少なくとも1つの抗原コード核酸配列をコードするチンパンジーアデノウイルスベクターを含む、請求項165に記載の方法。
- 前記チンパンジーアデノウイルスベクターによってコードされる前記少なくとも1つの抗原コード核酸配列が、先行の組成物の請求項のいずれか1項に記載の少なくとも1つの抗原コード核酸配列と同じである、請求項166に記載の方法。
- 先行の組成物の請求項のいずれか1項に記載の1つ以上のベクターを製造する方法であって、
(a)前記RNAアルファウイルス骨格及び前記新生抗原カセットを含む直線化DNA配列を得ることと、
(b)前記直線化DNA配列を、前記直線化DNA配列をRNAに転写するために必要なすべての構成要素を含んだインビトロ転写反応に加えることにより、前記直線化DNA配列をインビトロ転写することであって、任意で、得られたRNAに前記m7gキャップをインビトロで加えることをさらに含む、前記インビトロ転写することと、
(c)前記インビトロ転写反応から前記1つ以上のベクターを単離することと
を含む、前記方法。 - 前記直線化DNA配列が、DNAプラスミド配列を直線化することにより、またはPCRを用いた増幅により生成される、請求項168に記載の製造する方法。
- 前記DNAプラスミド配列が、細菌組換えまたは全ゲノムDNA合成または細菌細胞内での合成DNAの増幅を伴う全ゲノムDNA合成のうちの1つを用いて生成される、請求項169に記載の製造方法。
- 前記1つ以上のベクターを前記インビトロ転写反応から単離することが、フェノールクロロホルム抽出、シリカカラムを用いた精製、または同様のRNA精製法のうちの1つ以上を含む、請求項168に記載の製造する方法。
- 前記新生抗原発現系を送達するための先行の組成物の請求項のいずれか1項に記載の組成物を製造する方法であって、
(a)ナノ粒子状の送達ビヒクルの成分を提供することと、
(b)前記新生抗原発現系を提供することと、
(c)前記ナノ粒子状の送達ビヒクル及び前記新生抗原発現系が前記新生抗原発現系を送達するための前記組成物を生成するのに充分な条件を提供することと
を含む、前記方法。 - 前記条件がマイクロ流体混合によって提供される、請求項172に記載の製造する方法。
Applications Claiming Priority (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762503283P | 2017-05-08 | 2017-05-08 | |
| US62/503,283 | 2017-05-08 | ||
| US201762523201P | 2017-06-21 | 2017-06-21 | |
| US62/523,201 | 2017-06-21 | ||
| US201762590163P | 2017-11-22 | 2017-11-22 | |
| US62/590,163 | 2017-11-22 | ||
| JP2019561211A JP2020518648A (ja) | 2017-05-08 | 2018-05-08 | アルファウイルス新生抗原ベクター |
| PCT/US2018/031696 WO2018208856A1 (en) | 2017-05-08 | 2018-05-08 | Alphavirus neoantigen vectors |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019561211A Division JP2020518648A (ja) | 2017-05-08 | 2018-05-08 | アルファウイルス新生抗原ベクター |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023123766A true JP2023123766A (ja) | 2023-09-05 |
| JP2023123766A5 JP2023123766A5 (ja) | 2023-12-05 |
Family
ID=64105513
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019561211A Pending JP2020518648A (ja) | 2017-05-08 | 2018-05-08 | アルファウイルス新生抗原ベクター |
| JP2023108263A Pending JP2023123766A (ja) | 2017-05-08 | 2023-06-30 | アルファウイルス新生抗原ベクター |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019561211A Pending JP2020518648A (ja) | 2017-05-08 | 2018-05-08 | アルファウイルス新生抗原ベクター |
Country Status (17)
| Country | Link |
|---|---|
| US (4) | US11504421B2 (ja) |
| EP (1) | EP3634449A4 (ja) |
| JP (2) | JP2020518648A (ja) |
| KR (1) | KR102945203B1 (ja) |
| CN (1) | CN110612116A (ja) |
| AU (3) | AU2018266705B2 (ja) |
| BR (1) | BR112019023477A2 (ja) |
| CA (1) | CA3062591A1 (ja) |
| CO (1) | CO2019013609A2 (ja) |
| IL (2) | IL270396B2 (ja) |
| MX (2) | MX2019013259A (ja) |
| PE (1) | PE20191842A1 (ja) |
| PH (1) | PH12019502518A1 (ja) |
| SG (1) | SG11201910101SA (ja) |
| TW (2) | TW202333779A (ja) |
| WO (1) | WO2018208856A1 (ja) |
| ZA (1) | ZA201907461B (ja) |
Families Citing this family (43)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020500552A (ja) * | 2016-11-23 | 2020-01-16 | グリットストーン オンコロジー インコーポレイテッド | 新生抗原のウイルスによる送達方法 |
| US11965892B2 (en) | 2017-02-12 | 2024-04-23 | Biontech Us Inc. | HLA-based methods and compositions and uses thereof |
| EP3634449A4 (en) | 2017-05-08 | 2021-03-17 | Gritstone Oncology, Inc. | ALPHAVIRUS NEOANTIGEN VECTORS |
| AU2019275072A1 (en) | 2018-05-23 | 2021-01-21 | Seattle Project Corp. | Shared antigens |
| GB201812474D0 (en) | 2018-07-31 | 2018-09-12 | Autolus Ltd | Nucleic acid construct |
| WO2020072371A1 (en) * | 2018-10-01 | 2020-04-09 | The Wistar Institute | Melanoma canine vaccine compositions and methods of use thereof |
| CN109536464B (zh) * | 2018-12-10 | 2022-06-10 | 中国科学院武汉病毒研究所 | 一种缺失衣壳蛋白基因的基孔肯雅病毒感染性克隆及构建方法和在制备减毒疫苗中的应用 |
| BR112021010611A2 (pt) * | 2018-12-14 | 2021-08-24 | Glaxosmithkline Biologicals S.A. | Composições e métodos de vacina de reforço (prime boost) heterólogo |
| TWI852977B (zh) | 2019-01-10 | 2024-08-21 | 美商健生生物科技公司 | 前列腺新抗原及其用途 |
| MX2021014525A (es) | 2019-05-30 | 2022-03-17 | Gritstone Bio Inc | Adenovirus modificados. |
| WO2020252039A1 (en) * | 2019-06-12 | 2020-12-17 | Biontech Us Inc. | Neoantigen compositions and uses thereof |
| KR20220041844A (ko) * | 2019-07-02 | 2022-04-01 | 그릿스톤 바이오, 인코포레이티드 | Hiv 항원 및 mhc 복합체 |
| KR20240137107A (ko) | 2019-07-16 | 2024-09-19 | 길리애드 사이언시즈, 인코포레이티드 | Hiv 백신, 및 이의 제조 및 사용 방법 |
| CN110515301B (zh) * | 2019-08-06 | 2021-06-08 | 大连理工大学 | 一种结合dmpc的改进的admm算法 |
| MX2022001664A (es) | 2019-08-09 | 2022-07-19 | Nutcracker Therapeutics Inc | Aparato microfluídico y metodos de uso del mismo. |
| WO2021092095A1 (en) * | 2019-11-04 | 2021-05-14 | Gritstone Oncology, Inc. | Neoantigen vaccine therapy |
| CR20220220A (es) | 2019-11-18 | 2022-09-20 | Janssen Biotech Inc | Vacunas basadas en calr y jak2 mutantes y sus usos |
| AU2021236068A1 (en) | 2020-03-09 | 2022-10-06 | Arcturus Therapeutics, Inc. | Compositions and methods for inducing immune responses |
| IL296752A (en) * | 2020-04-03 | 2022-11-01 | Gritstone Bio Inc | Infectious disease antigens and vaccines |
| CA3173803A1 (en) * | 2020-04-21 | 2021-10-28 | Karin Jooss | Capping compounds, compositions and methods of use thereof |
| EP4175664A2 (en) | 2020-07-06 | 2023-05-10 | Janssen Biotech, Inc. | Prostate neoantigens and their uses |
| CN115836350A (zh) * | 2020-07-14 | 2023-03-21 | 米尼奥公司 | 用于确定新抗原的呈递可能性的方法、系统和计算机程序产品 |
| CN111951887B (zh) * | 2020-07-27 | 2024-06-28 | 深圳市新合生物医疗科技有限公司 | 基于深度学习的白细胞抗原与多肽结合亲和力预测方法 |
| CN116438308A (zh) | 2020-08-06 | 2023-07-14 | 磨石生物公司 | 多表位疫苗盒 |
| EP4196128A4 (en) | 2020-08-14 | 2024-06-12 | Arcturus Therapeutics, Inc. | METHOD FOR FREEZE DILIZATION OF LIPID NANOPARTICLES |
| CN114438128A (zh) * | 2020-10-30 | 2022-05-06 | 上海市公共卫生临床中心 | 一种增强型溶瘤腺病毒及其应用 |
| WO2022115645A1 (en) | 2020-11-25 | 2022-06-02 | Akagera Medicines, Inc. | Lipid nanoparticles for delivery of nucleic acids, and related methods of use |
| US12275766B2 (en) | 2020-12-23 | 2025-04-15 | Janssen Biotech, Inc. | Neoantigen peptide mimics |
| CN112553232B (zh) * | 2020-12-29 | 2022-10-21 | 中国科学院武汉病毒研究所 | 多功能自组装纳米颗粒的可控生物合成方法 |
| US12053517B2 (en) | 2021-01-14 | 2024-08-06 | Gilead Sciences, Inc. | HIV vaccines and methods of using |
| AU2022210420A1 (en) * | 2021-01-19 | 2023-09-07 | Seattle Project Corp. | Modified alphavirus vectors |
| IL319926A (en) | 2021-03-19 | 2025-05-01 | Tiba Biotech Llc | Alphavirus-derived artificial RNA replicon expression systems |
| WO2022229966A1 (en) | 2021-04-29 | 2022-11-03 | Yeda Research And Development Co. Ltd. | T cell receptors directed against ras-derived recurrent neoantigens and methods of identifying same |
| CN113517030B (zh) * | 2021-07-19 | 2022-09-20 | 中国人民解放军国防科技大学 | 基于病毒传播网络的基因序列表示学习方法 |
| WO2023003679A1 (en) * | 2021-07-22 | 2023-01-26 | The Government Of The United States Of America, As Represented By The Secretary Of The Navy | Single domain antibodies that bind and neutralize venezuelan equine encephalitis virus |
| CA3230564A1 (en) * | 2021-09-13 | 2023-03-16 | Jean-Pol DETIFFE | Method to generate personalized neoantigens of a tumor of a patient |
| EP4490738A4 (en) * | 2022-03-08 | 2026-03-04 | Avalo Inc | SYSTEM AND METHOD FOR GENOMIC ASSOCIATION |
| WO2023183827A2 (en) * | 2022-03-21 | 2023-09-28 | Gritstone Bio, Inc. | Low-dose neoantigen vaccine therapy |
| CA3256897A1 (en) | 2022-05-25 | 2023-11-30 | Akagera Medicines, Inc. | Lipid nanoparticles for the administration of nucleic acids and their methods of use |
| US20260034208A1 (en) * | 2022-07-26 | 2026-02-05 | Yale University | Virus-like vesicles (vlvs) based vaccines and methods of preventing, ameliorating, and/or treating covid-19 and/or hepatocellular carcinoma (hcc) |
| CN121586776A (zh) * | 2023-07-19 | 2026-02-27 | 上海复诺健生物科技有限公司 | 自扩增核酸分子及其应用 |
| WO2025106713A1 (en) * | 2023-11-14 | 2025-05-22 | Avalo, Inc. | System and method for gene-environment analysis |
| WO2025201315A1 (zh) * | 2024-03-25 | 2025-10-02 | 南京金斯瑞生物科技有限公司 | 利用自复制rna制备与多次跨膜蛋白特异结合的抗体的方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6083716A (en) * | 1996-09-06 | 2000-07-04 | The Trustees Of The University Of Pennsylvania | Chimpanzee adenovirus vectors |
| JP2012516679A (ja) * | 2009-02-02 | 2012-07-26 | オカイロス アーゲー | サルアデノウイルスの核酸配列及びアミノ酸配列、それを含有するベクター、並びにその使用 |
| US9402888B2 (en) * | 2013-03-14 | 2016-08-02 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for treating cancer |
| JP2022534282A (ja) * | 2019-05-30 | 2022-07-28 | グリットストーン バイオ インコーポレイテッド | 改変アデノウイルス |
Family Cites Families (225)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US1837028A (en) | 1924-11-11 | 1931-12-15 | Om Edwards Co Inc | Window construction |
| US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
| US4722848A (en) | 1982-12-08 | 1988-02-02 | Health Research, Incorporated | Method for immunizing animals with synthetically modified vaccinia virus |
| US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
| GB8311018D0 (en) | 1983-04-22 | 1983-05-25 | Amersham Int Plc | Detecting mutations in dna |
| US6090406A (en) | 1984-04-12 | 2000-07-18 | The Liposome Company, Inc. | Potentiation of immune responses with liposomal adjuvants |
| US5019369A (en) | 1984-10-22 | 1991-05-28 | Vestar, Inc. | Method of targeting tumors in humans |
| US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
| US5223427A (en) | 1987-03-31 | 1993-06-29 | The Scripps Research Institute | Hybridomas producing monoclonal antibodies reactive with human tissue-factor glycoprotein heavy chain |
| US5217879A (en) | 1989-01-12 | 1993-06-08 | Washington University | Infectious Sindbis virus vectors |
| US5703055A (en) | 1989-03-21 | 1997-12-30 | Wisconsin Alumni Research Foundation | Generation of antibodies through lipid mediated DNA delivery |
| FR2650840B1 (fr) | 1989-08-11 | 1991-11-29 | Bertin & Cie | Procede rapide de detection et/ou d'identification d'une seule base sur une sequence d'acide nucleique, et ses applications |
| EP0452457B1 (en) | 1989-11-03 | 1997-08-20 | Vanderbilt University | Method of in vivo delivery of functioning foreign genes |
| US5279833A (en) | 1990-04-04 | 1994-01-18 | Yale University | Liposomal transfection of nucleic acids into animal cells |
| US5204253A (en) | 1990-05-29 | 1993-04-20 | E. I. Du Pont De Nemours And Company | Method and apparatus for introducing biological substances into living cells |
| US6770283B1 (en) | 1990-12-13 | 2004-08-03 | Bioption Ab | DNA expression systems based on alphaviruses |
| US6004744A (en) | 1991-03-05 | 1999-12-21 | Molecular Tool, Inc. | Method for determining nucleotide identity through extension of immobilized primer |
| US6037135A (en) | 1992-08-07 | 2000-03-14 | Epimmune Inc. | Methods for making HLA binding peptides and their uses |
| EP0646178A1 (en) | 1992-06-04 | 1995-04-05 | The Regents Of The University Of California | expression cassette with regularoty regions functional in the mammmlian host |
| US9340577B2 (en) | 1992-08-07 | 2016-05-17 | Epimmune Inc. | HLA binding motifs and peptides and their uses |
| US5662907A (en) | 1992-08-07 | 1997-09-02 | Cytel Corporation | Induction of anti-tumor cytotoxic T lymphocytes in humans using synthetic peptide epitopes |
| US20050271676A1 (en) | 1993-03-05 | 2005-12-08 | Epimmune Inc. | Inducing cellular immune responses to human immunodeficiency virus-1 using peptide and nucleic acid compositions |
| DE69435171D1 (de) | 1993-09-14 | 2009-01-08 | Pharmexa Inc | Pan dr-bindeproteinen zur erhöhung der immunantwort |
| US6413935B1 (en) | 1993-09-14 | 2002-07-02 | Epimmune Inc. | Induction of immune response against desired determinants |
| DK0814154T3 (da) | 1993-09-15 | 2009-08-31 | Novartis Vaccines & Diagnostic | Rekombinante alfavirusvektorer |
| US6015686A (en) | 1993-09-15 | 2000-01-18 | Chiron Viagene, Inc. | Eukaryotic layered vector initiation systems |
| PT728214E (pt) | 1993-11-09 | 2004-11-30 | Ohio Med College | Linhas celulares estaveis capazes de expressar o gene de replicacao do virus adeno-associado |
| US5505947A (en) | 1994-05-27 | 1996-04-09 | The University Of North Carolina At Chapel Hill | Attenuating mutations in Venezuelan Equine Encephalitis virus |
| US5851806A (en) | 1994-06-10 | 1998-12-22 | Genvec, Inc. | Complementary adenoviral systems and cell lines |
| FR2726285B1 (fr) | 1994-10-28 | 1996-11-29 | Centre Nat Rech Scient | Adenovirus depourvus de particules contaminantes viables, preparation et utilisation |
| DE69534166T2 (de) | 1994-10-28 | 2006-03-09 | Trustees Of The University Of Pennsylvania | Rekombinanter adenovirus und methoden zu dessen verwendung |
| US5552350A (en) | 1994-12-12 | 1996-09-03 | Ceramco Inc. | Low-fusing temperature porcelain |
| US5792462A (en) | 1995-05-23 | 1998-08-11 | University Of North Carolina At Chapel Hill | Alphavirus RNA replicon systems |
| US5851796A (en) | 1995-06-07 | 1998-12-22 | Yale University | Autoregulatory tetracycline-regulated system for inducible gene expression in eucaryotes |
| UY24367A1 (es) | 1995-11-23 | 2000-10-31 | Boehringer Ingelheim Int | Vacunas contra tumores y procedimiento para su produccion |
| US5849589A (en) | 1996-03-11 | 1998-12-15 | Duke University | Culturing monocytes with IL-4, TNF-α and GM-CSF TO induce differentiation to dendric cells |
| US6451592B1 (en) | 1996-04-05 | 2002-09-17 | Chiron Corporation | Recombinant alphavirus-based vectors with reduced inhibition of cellular macromolecular synthesis |
| EP0803573A1 (en) | 1996-04-25 | 1997-10-29 | Gesellschaft für Biotechnologische Forschung mbH (GBF) | Polycistronic expression construct with cytokines for multivalent vaccines |
| US6514731B1 (en) | 1996-05-24 | 2003-02-04 | Chiron Corporation | Methods for the preparation of hepatitis C virus multiple copy epitope fusion antigens |
| CA2259179C (en) | 1996-07-03 | 2008-09-23 | University Of Pittsburgh | Emulsion formulations for hydrophilic active agents |
| US7732129B1 (en) | 1998-12-01 | 2010-06-08 | Crucell Holland B.V. | Method for the production and purification of adenoviral vectors |
| US5849561A (en) | 1997-05-22 | 1998-12-15 | Cornell Research Foundation, Inc. | Method for the production of non-group C adenoviral vectors |
| ES2180258T3 (es) | 1998-07-07 | 2003-02-01 | Transgene Sa | Utilizacion de pautas de lectura abierta adenovirales de e4 para mejorar la expresion de genes. |
| EP1000628A1 (en) | 1998-09-28 | 2000-05-17 | Fondation Mondiale Recherche et Prevention SIDA | Use of antigenic complexes of HIV envelope and HLA class I antigens as HIV vaccine |
| US20030072767A1 (en) | 1998-09-30 | 2003-04-17 | Alexander Gaiger | Compositions and methods for WT1 specific immunotherapy |
| US20080050393A1 (en) | 1998-12-03 | 2008-02-28 | Tang Y Tom | Novel nucleic acids and polypeptides |
| CA2354374A1 (en) | 1998-12-07 | 2000-06-15 | U.S. Medical Research Institute Of Infectious Diseases | Live attenuated venezuelan equine encephalitis vaccine |
| WO2000047229A2 (en) | 1999-02-11 | 2000-08-17 | Genzyme Corporation | Polynucleotide encoding multimers of antigenic peptides in order to enhance presentation of the antigenic peptide by mhc molecules |
| US7262049B2 (en) | 1999-03-16 | 2007-08-28 | Dana-Farber Cancer Institute, Inc. | Pseudotyped lentiviral vectors and uses thereof |
| DE60038011T2 (de) | 1999-04-08 | 2009-02-12 | Novartis Vaccines and Diagnostics, Inc., Emeryville | Verbesserung der immunantwort als anwendung in impfstoff und gentherapie |
| DE60044125D1 (de) | 1999-04-14 | 2010-05-20 | Novartis Vaccines & Diagnostic | Zusammensetzungen und verfahren zur auslösung einer immunantwort auf basis alphavirus-vektoren-systeme |
| US8647864B2 (en) | 1999-04-14 | 2014-02-11 | Novartis Ag | Compositions and methods for generating an immune response utilizing alphavirus-based vector systems |
| WO2003104467A1 (en) | 2002-04-25 | 2003-12-18 | Crucell Holland B.V. | Means and methods for the production of adenovirus vectors |
| WO2000073465A1 (en) | 1999-05-28 | 2000-12-07 | Ajinomoto Co.,Inc. | Peptides capable of inducing hiv-specific ctl and preventives/remedies for aids containing the peptides |
| US6365394B1 (en) | 1999-09-29 | 2002-04-02 | The Trustees Of The University Of Pennsylvania | Cell lines and constructs useful in production of E1-deleted adenoviruses in absence of replication competent adenovirus |
| JP2003521245A (ja) | 1999-12-21 | 2003-07-15 | エピミューン, インコーポレイテッド | ペプチドおよび核酸組成物を使用する、前立腺癌抗原に対する細胞性免疫応答の誘導 |
| EP1242108B1 (en) | 1999-12-28 | 2007-07-11 | Pharmexa Inc. | Optimized minigenes and peptides encoded thereby |
| US7462354B2 (en) | 1999-12-28 | 2008-12-09 | Pharmexa Inc. | Method and system for optimizing minigenes and peptides encoded thereby |
| US20040248113A1 (en) | 1999-12-28 | 2004-12-09 | Alessandro Sette | Method and system for optimizing multi-epitope nucleic acid constructs and peptides encoded thereby |
| WO2001055393A2 (en) | 2000-01-28 | 2001-08-02 | The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Mhc class ii restricted t cell epitopes from the cancer antigen ny-eso-1 |
| WO2001055177A2 (en) | 2000-01-28 | 2001-08-02 | Statens Serum Institut | Methods to identify ctl epitopes of hiv |
| US20010055596A1 (en) | 2000-03-24 | 2001-12-27 | Meagher Madeleine Joy | Compositions and methods for therapy and diagnosis of colon cancer |
| US6436703B1 (en) | 2000-03-31 | 2002-08-20 | Hyseq, Inc. | Nucleic acids and polypeptides |
| US20040115625A1 (en) | 2000-10-02 | 2004-06-17 | Reinhard Ebner | Cancer gene determination and therapeutic screening using signature gene sets |
| US6783939B2 (en) | 2000-07-07 | 2004-08-31 | Alphavax, Inc. | Alphavirus vectors and virosomes with modified HIV genes for use in vaccines |
| EP2336339A3 (en) | 2000-09-25 | 2011-09-14 | The Regents of the University of Michigan | Production of viral vectors |
| US20020137081A1 (en) | 2001-01-08 | 2002-09-26 | Olga Bandman | Genes differentially expressed in vascular tissue activation |
| WO2002061113A2 (en) | 2001-02-01 | 2002-08-08 | The Johns Hopkins University | Nucleic acid derived vaccine that encodes an antigen linked to a polypeptide that promotes antigen presentation |
| CN1147587C (zh) | 2001-05-30 | 2004-04-28 | 方炳良 | 一种增强细胞特异性目的基因表达的方法 |
| US20030232324A1 (en) | 2001-05-31 | 2003-12-18 | Chiron Corporation | Chimeric alphavirus replicon particles |
| JP4608210B2 (ja) | 2001-05-31 | 2011-01-12 | ノバルティス バクシンズ アンド ダイアグノスティックス,インコーポレーテッド | キメラアルファウイルスレプリコン粒子 |
| EP1409748B1 (en) | 2001-06-22 | 2011-10-26 | The Trustees of The University of Pennsylvania | Recombinant Adenoviruses comprising simian adenovirus proteins and uses thereof. |
| US20040136963A1 (en) | 2001-06-22 | 2004-07-15 | The Trustees Of The University Of Pennsylvania | Simian adenovirus vectors and methods of use |
| EP1497440B1 (en) | 2002-04-25 | 2008-08-20 | Crucell Holland B.V. | Stable adenoviral vectors and methods for propagation thereof |
| WO2004023973A2 (en) | 2002-09-12 | 2004-03-25 | Incyte Corporation | Molecules for diagnostics and therapeutics |
| AU2003295328A1 (en) | 2002-10-02 | 2004-04-23 | Genentech, Inc. | Compositions and methods for the diagnosis and treatment of tumor |
| CA2500955A1 (en) | 2002-10-03 | 2004-04-15 | Genencor International, Inc. | Optimized multi-epitope constructs and uses thereof |
| US20040208848A1 (en) | 2002-12-13 | 2004-10-21 | Smith Jonathan F. | Multi-antigenic alphavirus replicon particles and methods |
| US7078218B2 (en) | 2002-12-13 | 2006-07-18 | Alphavax, Inc. | Alphavirus particles and methods for preparation |
| GB2398300A (en) | 2003-02-17 | 2004-08-18 | Isis Innovation | Method and compositions for boosting immune response |
| US7425328B2 (en) | 2003-04-22 | 2008-09-16 | Purdue Pharma L.P. | Tissue factor antibodies and uses thereof |
| WO2005033265A2 (en) | 2003-04-25 | 2005-04-14 | Epimmune Inc. | Optimized multi-epitope constructs and uses thereof |
| US7605235B2 (en) | 2003-05-30 | 2009-10-20 | Centocor, Inc. | Anti-tissue factor antibodies and compositions |
| KR20060017635A (ko) | 2003-06-05 | 2006-02-24 | 와이어쓰 홀딩스 코포레이션 | 베네쥬엘라 말 뇌염 바이러스 레플리콘 벡터 및파라믹소바이러스 단백질 항원을 포함하는 면역원성 조성물 |
| US7291498B2 (en) | 2003-06-20 | 2007-11-06 | The Trustees Of The University Of Pennsylvania | Methods of generating chimeric adenoviruses and uses for such chimeric adenoviruses |
| DE10347710B4 (de) | 2003-10-14 | 2006-03-30 | Johannes-Gutenberg-Universität Mainz | Rekombinante Impfstoffe und deren Verwendung |
| DE602005017743D1 (de) | 2004-01-23 | 2009-12-31 | Angeletti P Ist Richerche Bio | Impfstoffträger für schimpansen-adenovirus |
| US8119336B2 (en) | 2004-03-03 | 2012-02-21 | Ibis Biosciences, Inc. | Compositions for use in identification of alphaviruses |
| CA2563500C (en) | 2004-04-28 | 2016-06-28 | The Trustees Of The University Of Pennsylvania | Immunization regimen with e4-deleted adenovirus prime and e1-deleted adenovirus boost |
| ES2361000T3 (es) | 2004-04-28 | 2011-06-13 | The Trustees Of The University Of Pennsylvania | Suministro secuencial de moléculas inmunogénicas mediante administraciones de un adenovirus y de un virus adeno-asociado. |
| EP2848692B1 (en) | 2004-05-21 | 2017-08-16 | Novartis Vaccines and Diagnostics, Inc. | Alphavirus vectors for influenza virus vaccines |
| JP5689576B2 (ja) | 2004-05-25 | 2015-03-25 | ノバルティス ヴァクシンズ アンド ダイアグノスティクス, インコーポレイテッド | αウイルスレプリコンパッケージング構築物 |
| US20060051405A1 (en) | 2004-07-19 | 2006-03-09 | Protiva Biotherapeutics, Inc. | Compositions for the delivery of therapeutic agents and uses thereof |
| CN101056977B (zh) | 2004-10-04 | 2013-01-30 | 拜欧瓦克西姆有限公司 | 用于治疗hiv感染患者的亚型匹配的灭活全病毒疫苗 |
| US20060198854A1 (en) * | 2004-12-28 | 2006-09-07 | Peter Pushko | Vector platforms derived from the alphavirus vaccines |
| US7220549B2 (en) | 2004-12-30 | 2007-05-22 | Helicos Biosciences Corporation | Stabilizing a nucleic acid for nucleic acid sequencing |
| FR2882557A1 (fr) | 2005-02-25 | 2006-09-01 | Centre Nat Rech Scient | Epitopes de vih et composition pharmaceutique les contenant |
| US7283337B2 (en) | 2005-03-04 | 2007-10-16 | Headway Technologies, Inc. | Abutted exchange bias design for sensor stabilization |
| CA2609142C (en) | 2005-05-27 | 2016-02-09 | Fondazione Centro San Raffaele Del Monte Tabor | Therapeutic gene vectors comprising mirna target sequences |
| PL2578685T3 (pl) | 2005-08-23 | 2020-01-31 | The Trustees Of The University Of Pennsylvania | Rna zawierający zmodyfikowane nukleozydy i sposoby jego zastosowania |
| CA2626253A1 (en) | 2005-10-18 | 2007-04-26 | Novartis Vaccines And Diagnostics, Inc. | Mucosal and systemic immunizations with alphavirus replicon particles |
| KR101499750B1 (ko) | 2006-02-27 | 2015-03-06 | 더 보드 오브 리전츠 오브 더 유니버시티 오브 텍사스 시스템 | 가감염성 플라비바이러스 및 이들의 용도 |
| CA2663295C (en) | 2006-09-12 | 2020-03-10 | Alphavax, Inc. | Alphavirus replicon particles matched to protein antigens as immunological adjuvants |
| US9085638B2 (en) | 2007-03-07 | 2015-07-21 | The Johns Hopkins University | DNA vaccine enhancement with MHC class II activators |
| GB0706914D0 (en) | 2007-04-10 | 2007-05-16 | Isis Innovation | Novel adenovirus vectors |
| EP2162540A2 (en) | 2007-05-22 | 2010-03-17 | Amgen Inc. | Compositions and methods for producing bioactive fusion proteins |
| US8969542B2 (en) | 2007-05-31 | 2015-03-03 | Genimmune N.V. | HPV polyepitope constructs and uses thereof |
| US8460913B2 (en) | 2007-06-21 | 2013-06-11 | Alpha Vax, Inc. | Promoterless cassettes for expression of alpha virus structural proteins |
| US20100015179A1 (en) | 2007-08-16 | 2010-01-21 | Frolov Ilya V | Attenuation of encephalitogenic alphavirus and uses thereof |
| WO2009034190A2 (en) | 2007-09-14 | 2009-03-19 | Genimmune N.V. | Affinity tag |
| GB0719526D0 (en) | 2007-10-05 | 2007-11-14 | Isis Innovation | Compositions and methods |
| US20100285050A1 (en) | 2007-10-05 | 2010-11-11 | Isis Innovation Limited | Compositions and Methods |
| AU2008338803B2 (en) | 2007-11-26 | 2015-02-05 | Glaxosmithkline Biologicals S.A. | Methods of generating alphavirus particles |
| WO2009092113A2 (en) | 2008-01-19 | 2009-07-23 | Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Methods and compositions for the delivery of vaccines to disrupted epithelium |
| US20090253184A1 (en) | 2008-01-23 | 2009-10-08 | Introgen Therapeutics, Inc. | Compositions and methods related to an adenoviral trans-complementing cell line |
| KR101668849B1 (ko) | 2008-01-24 | 2016-10-24 | 보드 오브 리전츠, 더 유니버시티 오브 텍사스 시스템 | 모기에서 복제 불가능한 약독화된 재조합 알파바이러스 및 그의 용도 |
| WO2009120947A1 (en) | 2008-03-28 | 2009-10-01 | Virxsys Corporation | Lentivirus-based immunogenic vectors |
| WO2009146902A1 (en) | 2008-06-03 | 2009-12-10 | Okairòs Ag | A vaccine for the prevention and therapy of hcv infections |
| US8093021B2 (en) | 2008-06-13 | 2012-01-10 | New York University | Defective sindbis viral vectors |
| ES2544702T3 (es) | 2008-07-17 | 2015-09-02 | Medigen, Inc. | Vacunas en forma de ADNi y métodos para utilizarlas |
| RS53782B1 (sr) | 2008-10-01 | 2015-06-30 | Immatics Biotechnologies Gmbh | Preparati tumor-asociranih peptida i odgovarajuća antikancerska vakcina za tretman glioblastoma (gbm) i drugih kancera |
| WO2010037402A1 (en) | 2008-10-02 | 2010-04-08 | Dako Denmark A/S | Molecular vaccines for infectious disease |
| US8807362B2 (en) | 2008-10-17 | 2014-08-19 | Jeong-min Lee | Bottle cap |
| EP2370455B1 (en) | 2008-11-26 | 2019-07-03 | Government of the United States of America, as represented by the Secretary, Department of Health and Human Services | Virus like particle compositions and methods of use |
| US8680258B2 (en) | 2008-12-01 | 2014-03-25 | Alphavax, Inc. | Use of microRNAs to control virus helper nucleic acids |
| DE102008061522A1 (de) | 2008-12-10 | 2010-06-17 | Biontech Ag | Verwendung von Flt3-Ligand zur Verstärkung von Immunreaktionen bei RNA-Immunisierung |
| CN101579528B (zh) | 2009-06-24 | 2011-06-29 | 中国人民解放军军事医学科学院军事兽医研究所 | 一种hiv复合多表位dna疫苗及其应用 |
| CA2766907A1 (en) | 2009-07-06 | 2011-01-13 | Novartis Ag | Self replicating rna molecules and uses thereof |
| GB0918154D0 (en) | 2009-10-16 | 2009-12-02 | Isis Innovation | Mycobacterial vaccines |
| ES2647662T3 (es) | 2009-12-31 | 2017-12-26 | Medigen, Inc. | Vacunas de ADN infeccioso frente al virus chikungunya |
| WO2013040142A2 (en) | 2011-09-16 | 2013-03-21 | Iogenetics, Llc | Bioinformatic processes for determination of peptide binding |
| GB201006405D0 (en) | 2010-04-16 | 2010-06-02 | Isis Innovation | Poxvirus expression system |
| EP2569633B1 (en) | 2010-05-14 | 2016-02-10 | The General Hospital Corporation | Compositions and methods of identifying tumor specific neoantigens |
| US9770463B2 (en) | 2010-07-06 | 2017-09-26 | Glaxosmithkline Biologicals Sa | Delivery of RNA to different cell types |
| NZ606591A (en) | 2010-07-06 | 2015-02-27 | Novartis Ag | Cationic oil-in-water emulsions |
| ES2557382T3 (es) | 2010-07-06 | 2016-01-25 | Glaxosmithkline Biologicals Sa | Liposomas con lípidos que tienen un valor de pKa ventajoso para el suministro de ARN |
| MX342608B (es) | 2010-07-06 | 2016-10-06 | Novartis Ag * | Particulas de suministro similares a viriones para moleculas de arn de autorreplicacion. |
| ES2646669T3 (es) | 2010-07-06 | 2017-12-14 | Glaxosmithkline Biologicals Sa | Procedimientos de aumento de una respuesta inmunitaria mediante el suministro de ARN |
| US9192661B2 (en) | 2010-07-06 | 2015-11-24 | Novartis Ag | Delivery of self-replicating RNA using biodegradable polymer particles |
| EP2591114B1 (en) | 2010-07-06 | 2016-06-08 | GlaxoSmithKline Biologicals SA | Immunisation of large mammals with low doses of rna |
| BR112013003579A2 (pt) | 2010-08-16 | 2016-06-07 | Salk Inst For Biological Studi | adenovírus, células, e, métodos para tratar câncer |
| MX2013002332A (es) | 2010-08-31 | 2013-03-18 | Novartis Ag | Lipidos apropiados para suministro liposomal del arn que codifica la proteina. |
| LT4226941T (lt) | 2010-08-31 | 2025-01-10 | Glaxosmithkline Biologicals Sa | Pegilintos liposomos, skirtos imunogeną koduojančios rnr pristatymui |
| SI4043040T1 (sl) | 2010-08-31 | 2023-04-28 | Glaxosmithkline Biologicals Sa | Mali liposomi za dostavo imunogen-kodirajoče RNA |
| KR102759126B1 (ko) | 2010-12-30 | 2025-01-24 | 파운데이션 메디신 인코포레이티드 | 종양 샘플의 다유전자 분석의 최적화 |
| US9487563B2 (en) | 2011-01-31 | 2016-11-08 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Virus-like particles and methods of use |
| US8722044B2 (en) | 2011-03-15 | 2014-05-13 | Janssen Biotech, Inc. | Human tissue factor antibody and uses thereof |
| CA2835644C (en) | 2011-05-13 | 2021-06-15 | Novartis Ag | Pre-fusion rsv f antigens |
| PL3892295T3 (pl) | 2011-05-24 | 2023-07-24 | BioNTech SE | Zindywidualizowane szczepionki przeciwnowotworowe |
| GB201108879D0 (en) | 2011-05-25 | 2011-07-06 | Isis Innovation | Vector |
| WO2012171541A1 (en) | 2011-06-15 | 2012-12-20 | Scil Proteins Gmbh | Human fusion proteins comprising interferons and hetero-dimeric modified ubiquitin proteins |
| EP4115875A1 (en) | 2011-07-06 | 2023-01-11 | GlaxoSmithKline Biologicals S.A. | Liposomes having useful n:p ratio for delivery of rna molecules |
| CA2841047A1 (en) | 2011-07-06 | 2013-01-10 | Novartis Ag | Immunogenic compositions and uses thereof |
| EP2729165B1 (en) | 2011-07-06 | 2017-11-08 | GlaxoSmithKline Biologicals SA | Immunogenic combination compositions and uses thereof |
| EP2559441B1 (en) | 2011-08-16 | 2021-07-21 | Samsung Electronics Co., Ltd. | Protein complex for intracellular delivery and uses thereof |
| MX366055B (es) | 2011-08-31 | 2019-06-26 | Novartis Ag | Liposomas pegilados para admistracion de acido ribonucleico (arn) que codifica para inmunogeno. |
| RU2014118727A (ru) | 2011-10-11 | 2015-11-20 | Новартис Аг | Рекомбинантные самореплицирующиеся полицистронные молекулы рнк |
| KR102181258B1 (ko) | 2012-02-16 | 2020-11-20 | 브이엘피 테라퓨틱스 엘엘씨 | 바이러스 유사 입자 조성물 |
| US20160289674A1 (en) | 2012-04-02 | 2016-10-06 | Moderna Therapeutics, Inc. | Modified polynucleotides for the production of membrane proteins |
| US9283287B2 (en) | 2012-04-02 | 2016-03-15 | Moderna Therapeutics, Inc. | Modified polynucleotides for the production of nuclear proteins |
| SG11201407343XA (en) | 2012-05-18 | 2014-12-30 | Univ Pennsylvania | Subfamily e simian adenoviruses a1302, a1320, a1331 and a1337 and uses thereof |
| WO2013190090A1 (en) | 2012-06-21 | 2013-12-27 | Philip Morris Products S.A. | Gene signatures for classifying and grading lung cancer |
| EP2870236B1 (en) | 2012-07-04 | 2018-01-10 | Sirion Biotech GmbH | Means and methods to increase adenovirus production |
| US20150140068A1 (en) | 2012-07-06 | 2015-05-21 | Novartis Ag | Immunogenic compositions and uses thereof |
| US8961995B2 (en) | 2012-09-20 | 2015-02-24 | Uab Research Foundation | Methods and compositions for alphavirus replicons |
| GB201220119D0 (en) | 2012-11-08 | 2012-12-26 | Univ Cork | Vector |
| US10106781B2 (en) | 2012-11-16 | 2018-10-23 | Beth Israel Deaconess Medical Center, Inc. | Recombinant adenoviruses and use thereof |
| KR101429696B1 (ko) | 2012-11-21 | 2014-08-13 | 국립암센터 | 안전성 및 항암활성이 증가된 재조합 아데노바이러스 및 이의 용도 |
| EP2983702A2 (en) | 2013-04-07 | 2016-02-17 | The Broad Institute, Inc. | Compositions and methods for personalized neoplasia vaccines |
| SG10201709917VA (en) | 2013-06-03 | 2017-12-28 | Vlp Therapeutics Llc | Malaria vaccine |
| TWI636065B (zh) | 2013-08-05 | 2018-09-21 | 伊瑪提克斯生物科技有限公司 | 新穎肽類,細胞及其用於治療多種腫瘤的用途,其製造方法及包含其等之醫藥組成物 |
| WO2015063647A1 (en) | 2013-11-01 | 2015-05-07 | Pfizer Inc. | Vectors for expression of prostate-associated antigens |
| GB201319446D0 (en) | 2013-11-04 | 2013-12-18 | Immatics Biotechnologies Gmbh | Personalized immunotherapy against several neuronal and brain tumors |
| US20160310584A1 (en) | 2013-12-06 | 2016-10-27 | The Broad Institute Inc. | Formulations for neoplasia vaccines |
| KR20230076867A (ko) | 2013-12-20 | 2023-05-31 | 더 브로드 인스티튜트, 인코퍼레이티드 | 신생항원 백신과의 병용 요법 |
| CA2960096A1 (en) | 2014-09-03 | 2016-03-10 | Bavarian Nordic A/S | Methods and compositions for enhancing immune responses |
| CN107075730A (zh) | 2014-09-12 | 2017-08-18 | 利兰·斯坦福青年大学托管委员会 | 循环核酸的鉴定及用途 |
| CN118994363A (zh) | 2014-11-26 | 2024-11-22 | 美国卫生和人力服务部 | 抗突变的kras的t细胞受体 |
| US10975442B2 (en) | 2014-12-19 | 2021-04-13 | Massachusetts Institute Of Technology | Molecular biomarkers for cancer immunotherapy |
| EP3234130B1 (en) | 2014-12-19 | 2020-11-25 | The Broad Institute, Inc. | Methods for profiling the t-cell- receptor repertoire |
| EP3250233A4 (en) | 2015-01-29 | 2018-07-25 | Agency for Science, Technology and Research | Nanocapsules carrying chikungunya-associated peptides |
| WO2016124670A1 (en) | 2015-02-06 | 2016-08-11 | Scil Proteins Gmbh | Novel binding proteins comprising a ubiquitin mutein and antibodies or antibody fragments |
| WO2016154047A2 (en) | 2015-03-20 | 2016-09-29 | Memorial Sloan-Kettering Cancer Center | Monoclonal antigen-binding proteins to intracellular oncogene products |
| WO2016154246A1 (en) | 2015-03-23 | 2016-09-29 | The Johns Hopkins University | Hla-restricted epitopes encoded by somatically mutated genes |
| IL294183B2 (en) | 2015-05-20 | 2023-10-01 | Dana Farber Cancer Inst Inc | shared neoantigens |
| CN120842296A (zh) | 2015-09-21 | 2025-10-28 | 垂林克生物技术有限公司 | 用于合成5’-加帽rna的组合物和方法 |
| CN115418401A (zh) | 2015-10-08 | 2022-12-02 | 会聚基因学有限公司 | 用于膀胱癌的尿监测的诊断测定 |
| MX2018004544A (es) | 2015-10-12 | 2018-11-09 | Nantomics Llc | Composiciones y métodos para los neoepítopos de cáncer viral. |
| EP4011451A1 (en) | 2015-10-22 | 2022-06-15 | ModernaTX, Inc. | Metapneumovirus mrna vaccines |
| ES2970865T3 (es) | 2015-12-16 | 2024-05-31 | Gritstone Bio Inc | Identificación, fabricación y uso de neoantígenos |
| CN114959918A (zh) | 2016-02-29 | 2022-08-30 | 基础医疗股份有限公司 | 用于评估肿瘤突变负荷的方法和系统 |
| CA3014466A1 (en) | 2016-03-03 | 2017-09-08 | Cue Biopharma, Inc. | T-cell modulatory multimeric polypeptides and methods of use thereof |
| JP2019513373A (ja) | 2016-03-31 | 2019-05-30 | ネオン セラピューティクス, インコーポレイテッド | ネオ抗原およびその使用方法 |
| AU2017254477A1 (en) | 2016-04-18 | 2018-11-01 | Jennifer G. ABELIN | Improved HLA epitope prediction |
| EP3452082A1 (en) | 2016-05-04 | 2019-03-13 | Fred Hutchinson Cancer Research Center | Cell-based neoantigen vaccines and uses thereof |
| BE1024796B9 (fr) | 2016-06-02 | 2019-01-08 | Glaxosmithkline Biologicals Sa | Constructions antigeniques du virus zika |
| SG11201811442UA (en) | 2016-06-20 | 2019-01-30 | Isa Pharmaceuticals B V | Formulation of a peptide vaccine |
| GB2549809C (en) | 2016-06-23 | 2022-11-30 | Univ Oxford Innovation Ltd | Vector |
| CN107698593A (zh) | 2016-08-09 | 2018-02-16 | 南京天印健华医药科技有限公司 | 作为fgfr抑制剂的杂环化合物 |
| EP3500294A4 (en) | 2016-08-22 | 2020-07-29 | Arbutus Biopharma Corporation | ANTI-PD-1 ANTIBODIES, OR THEIR FRAGMENTS, FOR THE TREATMENT OF HEPATITIS B |
| JP2020500552A (ja) | 2016-11-23 | 2020-01-16 | グリットストーン オンコロジー インコーポレイテッド | 新生抗原のウイルスによる送達方法 |
| WO2018102585A1 (en) | 2016-11-30 | 2018-06-07 | Advaxis, Inc. | Personalized immunotherapy in combination with immunotherapy targeting recurrent cancer mutations |
| ES2959811T3 (es) | 2016-12-09 | 2024-02-28 | Glaxosmithkline Biologicals Sa | Construcciones de adenovirus de chimpancé con antígenos de Lyssavirus |
| GB201620968D0 (en) | 2016-12-09 | 2017-01-25 | Glaxosmithkline Biologicals Sa | Adenovirus polynucleotides and polypeptides |
| GB201621732D0 (en) | 2016-12-20 | 2017-02-01 | Agricultural Research Council | A multi-epitope dna vaccine for heartwater |
| AU2017379901B2 (en) | 2016-12-21 | 2024-02-15 | Arbutus Biopharma Corporation | Methods for ameliorating infusion reactions |
| CA3058807A1 (en) | 2017-04-03 | 2018-10-11 | Biontech Us Inc. | Protein antigens and uses thereof |
| EP3634449A4 (en) | 2017-05-08 | 2021-03-17 | Gritstone Oncology, Inc. | ALPHAVIRUS NEOANTIGEN VECTORS |
| AU2018279627B2 (en) | 2017-06-09 | 2023-08-10 | Seattle Project Corp. | Neoantigen identification, manufacture, and use |
| AR112166A1 (es) | 2017-06-16 | 2019-09-25 | Arbutus Biopharma Corp | Composiciones terapéuticas y métodos para el tratamiento de hepatitis b |
| JP7760242B2 (ja) | 2017-07-21 | 2025-10-27 | ジェネンテック, インコーポレイテッド | がんの治療法及び診断法 |
| CN111868260B (zh) | 2017-08-07 | 2025-02-21 | 约翰斯霍普金斯大学 | 用于评估和治疗癌症的方法和材料 |
| WO2019090156A1 (en) | 2017-11-03 | 2019-05-09 | Guardant Health, Inc. | Normalizing tumor mutation burden |
| TW201930340A (zh) | 2017-12-18 | 2019-08-01 | 美商尼恩醫療公司 | 新抗原及其用途 |
| WO2019170773A1 (en) | 2018-03-06 | 2019-09-12 | Cancer Research Technology Limited | Improvements in variant detection |
| US12024738B2 (en) | 2018-04-14 | 2024-07-02 | Natera, Inc. | Methods for cancer detection and monitoring |
| JP2021524247A (ja) | 2018-05-23 | 2021-09-13 | グリットストーン バイオ インコーポレイテッド | 免疫チェックポイント阻害剤の共発現ベクター |
| AU2019275072A1 (en) | 2018-05-23 | 2021-01-21 | Seattle Project Corp. | Shared antigens |
| AU2019374874A1 (en) | 2018-11-07 | 2021-06-10 | Gritstone Bio, Inc. | Alphavirus neoantigen vectors and interferon inhibitors |
| KR20220041844A (ko) | 2019-07-02 | 2022-04-01 | 그릿스톤 바이오, 인코포레이티드 | Hiv 항원 및 mhc 복합체 |
| WO2021092095A1 (en) | 2019-11-04 | 2021-05-14 | Gritstone Oncology, Inc. | Neoantigen vaccine therapy |
| WO2021119545A1 (en) | 2019-12-11 | 2021-06-17 | Gritstone Bio, Inc. | Durable vaccination |
| WO2021142437A1 (en) | 2020-01-10 | 2021-07-15 | Gritstone Bio, Inc. | Cell-free dna monitoring |
| EP4138890A4 (en) | 2020-04-21 | 2024-07-31 | Gritstone bio, Inc. | ANTIGEN CODING CASSETTES |
| CN116438308A (zh) | 2020-08-06 | 2023-07-14 | 磨石生物公司 | 多表位疫苗盒 |
-
2018
- 2018-05-08 EP EP18798194.9A patent/EP3634449A4/en active Pending
- 2018-05-08 PE PE2019002380A patent/PE20191842A1/es unknown
- 2018-05-08 SG SG11201910101S patent/SG11201910101SA/en unknown
- 2018-05-08 AU AU2018266705A patent/AU2018266705B2/en active Active
- 2018-05-08 KR KR1020197034437A patent/KR102945203B1/ko active Active
- 2018-05-08 JP JP2019561211A patent/JP2020518648A/ja active Pending
- 2018-05-08 IL IL270396A patent/IL270396B2/en unknown
- 2018-05-08 CN CN201880030476.6A patent/CN110612116A/zh active Pending
- 2018-05-08 US US16/612,352 patent/US11504421B2/en active Active
- 2018-05-08 CA CA3062591A patent/CA3062591A1/en active Pending
- 2018-05-08 BR BR112019023477-2A patent/BR112019023477A2/pt not_active Application Discontinuation
- 2018-05-08 IL IL315224A patent/IL315224A/en unknown
- 2018-05-08 MX MX2019013259A patent/MX2019013259A/es unknown
- 2018-05-08 TW TW112116974A patent/TW202333779A/zh unknown
- 2018-05-08 WO PCT/US2018/031696 patent/WO2018208856A1/en not_active Ceased
- 2018-05-08 TW TW107115639A patent/TW201907937A/zh unknown
-
2019
- 2019-11-06 MX MX2025009055A patent/MX2025009055A/es unknown
- 2019-11-08 PH PH12019502518A patent/PH12019502518A1/en unknown
- 2019-11-11 ZA ZA2019/07461A patent/ZA201907461B/en unknown
- 2019-12-02 CO CONC2019/0013609A patent/CO2019013609A2/es unknown
-
2022
- 2022-03-11 US US17/693,029 patent/US11510973B2/en active Active
- 2022-10-11 US US18/045,812 patent/US12109257B2/en active Active
-
2023
- 2023-04-20 AU AU2023202423A patent/AU2023202423B2/en active Active
- 2023-06-30 JP JP2023108263A patent/JP2023123766A/ja active Pending
-
2024
- 2024-09-11 US US18/830,813 patent/US20250249084A1/en active Pending
-
2026
- 2026-02-26 AU AU2026201462A patent/AU2026201462A1/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6083716A (en) * | 1996-09-06 | 2000-07-04 | The Trustees Of The University Of Pennsylvania | Chimpanzee adenovirus vectors |
| JP2012516679A (ja) * | 2009-02-02 | 2012-07-26 | オカイロス アーゲー | サルアデノウイルスの核酸配列及びアミノ酸配列、それを含有するベクター、並びにその使用 |
| US9402888B2 (en) * | 2013-03-14 | 2016-08-02 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for treating cancer |
| JP2022534282A (ja) * | 2019-05-30 | 2022-07-28 | グリットストーン バイオ インコーポレイテッド | 改変アデノウイルス |
Non-Patent Citations (4)
| Title |
|---|
| BIOTHERAPY, 1998, VOL.12 NO.5, P.785-787, JPN6022022594, ISSN: 0005518139 * |
| CURR OPIN MOL THER., 2002, VOL.4 NO.1, P.28-34, JPN6022022593, ISSN: 0005741824 * |
| VIROLOGY, 1997, VOL.239, P.389-401, JPN6022022591, ISSN: 0005518137 * |
| VIROLOGY, 2008, VOL.370 NO.1, P.22-32, JPN6022022592, ISSN: 0005518138 * |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2023123766A (ja) | アルファウイルス新生抗原ベクター | |
| KR102950716B1 (ko) | 신생항원의 바이러스성 전달 | |
| KR20210013105A (ko) | 공유 항원 | |
| KR20220016137A (ko) | 변형된 아데노바이러스 | |
| KR20210090650A (ko) | 알파바이러스 신생항원 벡터 및 인터페론 억제제 | |
| KR20230046313A (ko) | 다중에피토프 백신 카세트 | |
| KR20210013589A (ko) | 면역 체크포인트 억제제 공동-발현 벡터 | |
| KR20220098379A (ko) | 공유 네오항원을 표적으로 하는 항원-결합 단백질 | |
| KR20220041844A (ko) | Hiv 항원 및 mhc 복합체 | |
| KR20230015914A (ko) | 캡핑 화합물, 조성물 및 이의 사용 방법 | |
| KR20230006825A (ko) | 전염성 질병 항원 및 백신 | |
| KR20230014694A (ko) | 항원-코딩 카세트 | |
| KR20170102002A (ko) | 에볼라 바이러스 백신접종을 위한 방법 및 조성물 | |
| EP4125973A1 (en) | Neoantigen vaccine therapy | |
| RU2803566C2 (ru) | Неоантигенные векторы на основе альфавируса | |
| TWI918097B (zh) | 經修飾之腺病毒 | |
| KR20260057158A (ko) | 알파바이러스 신생항원 벡터 | |
| KR20230117163A (ko) | 상동 아데노바이러스 백신접종 | |
| KR20260052208A (ko) | 신생항원의 바이러스성 전달 | |
| TW202613314A (zh) | 新抗原之病毒遞送 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230731 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230731 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231127 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240404 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240610 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241002 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250203 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20250321 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250801 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20251201 |













































































































































