CZ96699A3 - Isolovaná lidská molekula nukleové kyseliny kodující polypeptidy, růstový protein a jeho použití a způsob - Google Patents
Isolovaná lidská molekula nukleové kyseliny kodující polypeptidy, růstový protein a jeho použití a způsob Download PDFInfo
- Publication number
- CZ96699A3 CZ96699A3 CZ99966A CZ96699A CZ96699A3 CZ 96699 A3 CZ96699 A3 CZ 96699A3 CZ 99966 A CZ99966 A CZ 99966A CZ 96699 A CZ96699 A CZ 96699A CZ 96699 A3 CZ96699 A3 CZ 96699A3
- Authority
- CZ
- Czechia
- Prior art keywords
- seq
- human growth
- dna
- gene
- shox
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/02—Drugs for disorders of the endocrine system of the hypothalamic hormones, e.g. TRH, GnRH, CRH, GRH, somatostatin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/06—Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Diabetes (AREA)
- General Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Endocrinology (AREA)
- Hematology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Obesity (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Description
Oblast techniky
Vynález se týká izolace, identifikace a charakterizace nově identifikovaných lidských genů, které odpovídají za vady lidského růstu, zvláště za malou výšku postavy nebo Turnérův syndrom. Dále se vynález týká diagnózy a terapie takových vad. Izolovaná genomová DNA nebo její fragmenty se mohou použít pro farmaceutické účely nebo jako diagnostické nástroje nebo činidla pro identifikaci nebo charakterizaci genetických defektů, které se podílejí na uvedených vadách. Vynález dále popisuje lidské růstové proteiny (transkripční faktory A, B a C) , které se exprimují po transkripci uvedené DNA na RNA nebo mRNA a které se mohou použít při terapii vad spojených s mutacemi v uvedených genech. Dále se popisují vhodné sekvence cDNA, které se mohou použít při přípravě rekombinantních proteinů vhodných pro léčbu takových vad. Předmětem vynálezu jsou dále plazmidové vektory vhodné pro expresi DNA těchto genů a vhodné buňky, které obsahují takovou DNA. Dále se popisují metody genetické léčby uvedených vad v oboru molekulární medicíny za použití expresivního plazmidu připraveného inkorporací DNA dównstream expresivního promotoru, který umožňuje expresi v savčí hostitelské buňce.
Dosavadní stav techniky
Růst je základní aspekt vývoje organizmu. Je regulovaný vysoce organizovaným a komplexním systémem. Výška postavy je multifaktorový rys, který je ovlivněn faktory prostředí a genetickými faktory. Vývojové malformace, které zahrnují výšku postavy, jsou běžným jevem u lidí všech ras. V případě lidí je četnost výskytu 3 ze 100 a retardace růstu vede k malé • · · · · • · · · • · · · · · • · · · · · • · velikosti postavy, za což ve většině případů odpovídají vrozené vady.
Turnérův syndorm je běžná ohromo zoinální vada (Rosenfeld RG, Tesch L-G, Rodriguez-Rigau LJ, McCauley E, Albertsson-Wikland K, Asch R, Cara J, Conte F, Halí JG, Lippe B, Nagel TC, Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendations for diagnosis, treatment, and management of individuals with Turner syndrom. The Endocrinologist 4(5) : 351-358) s četností výskytu 1:2 500 u živě narozených žen. Odhaduje se, že 1 až 2 % oplodnění u lidí má karyotyp 45,X a že až 99 % takových plodů nepřichází na svět v termínu (Halí J.G., Gilchrist D.M. (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37: obinson A (1990): Demography and prevalence of Turner syndrome. In: Turner Syndrome., edited by Rosenfield R.G., Grumbach M.M., pp. 93 - 100, New York, Marcel Dekker). U lidí s Turnérovým syndromem (nebo s UllrichTurnerovým syndromem) existuje podstatná klinická variabilita fenotypu (Ullrich, 1930; Turner, 1938). Malá výška postavy je konsistentní nález a spolu s gonádovou dysgenezí se považuje za vedoucí symptom uvedených vad. Turnerový syndrom je skutečná multifaktorová vada. Uvažuje se, že za embryonální letalitu, malou výšku postavy, gonodovou dysgenezi a charakteristické somatické rysy odpovídají monosomy genů, které jsou běžné u X a Y chromozomů. Ukazuje se, že pro normální vývoj člověka jsou nutné diploidy těchto homologních genů X-Y. Očekává se, že Turnérovy geny (nebo anti-Turnerovy geny) se u žen exprimují jak z aktivního tak z neaktivního chromozomu X nebo chromozomu Y, aby se zajistila správná dávka genového produktu. Haplo-nedostatečnost (nedostatečnost způsobená pouze jednou aktivní kopií) naznačuje mechanizmus vedoucí k onemocnění.
Dosud se objasnila řada mechanizmů, které vedou k malé výšce postavy. Nedostatečnost růstového hormonu a receptorů růstového hormonu, stejně jako vady skeletu se popisují jako • · · · · · · · · · ···· · ··· · ·· · • · · · · · ···· · ··· ··· ······ · · • · · · · ·· · ·· ·· příklady fenotypu s malou výškou postavy (Martial et al.,(1979; Phillips et al., 1981; Leung et al., 1987; Goddard et al., 1995). Identifikovaly se mutace ve třech genech, které kódují receptor lidského fibroblastového růstového faktoru (FGFR 1-3) a způsobují řadu vad skeletu. Tyto vady zahrnují většinu forem trpasličího vzrůstu, achondroplázie (Shiang et al. , 1994; Rousseau et al., 1994; Muenke and Schell, 1995) . Dobře známá a častá chromozomální vada ( objevuje se u jedné z 2 500 žen) Turnérův syndrom (45,X) je také spojena s malou výškou postavy. Všechny tyto důvody však odpovídají pouze za malou část pacientů s malou výškou postavy. Většina případů zatím zůstává nevysvětlena.
Věří se, že chromozomy X a Y nesou geny, které ovlivňují výšku postavy (Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G. (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922). To se může u pacientů s abnormalitami pohlavních chromozomů odvodit ze vztahu genotyp-fenotyp. Cytogenetické studie dokazují, že delece konců krátkých ramen buď chromozomu X nebo Y vedou u některých jedinců k malé výšce postavy (Zuffardi et al., 1982); Curry et al., 1984). Uvádí se více než 20 uspořádání chromozomu, které se spojují s delecemi konců chromozomu Xp a Yp a které nesou gen(y) odpovědné za malou výšku postavy, s pseudoautozornálni oblastí (PARI) (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerino G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome . Proč. Nati. Acad. Sci USA 86: 10001-10005.; Schaefer L., Ferrero G.B., Grillo A., Bassi M.T. Roth E.J. Wapenaar M.C., Van Ommen -J.B., Mohandas T.K., Rocchi M., Zoghbi H.Y. Ballabio A. (1993): A high resolution deletion map of human chromosome Xp22. Nátuře genetics 4: 272279). Pozice těchto genů se zúžila na distální DNA o velikosti i
• · ·
700 kb oblasti PARI, kterou lemuje markér DXYS15 (Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T.,
Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834;
Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629) .
Regulace růstu u savců je organizována jako komplexní systém. Je možné, že vysoce organizovaným způsobem spolu reaguje více genů (proteinů), které podporují růst. Jeden z těchto genů, který odpovídá za výšku postavy, se zmapoval až do pseudoautozomální oblasti PARI (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerino G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome . Proč. Nati. Acad. Sci USA 86: 10001-10005) , což je oblast, o které se ví, že je volně zaměnitelná mezi chromozomy X a Y (Rappold G.A. (1993) : The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324). Celá oblast RAPI je přibližně 2 700 kb velká.
U pacientů s delecí se definovala kritická oblast ovlivňující výšku postavy. K malé výšce postavy dochází v případě, když se deletuje celá oblast o velikosti 700 kb nebo když je specifický gen v této kritické oblasti přítomen v haploidním stavu nebo když je přerušen nebo mutován (jako je případ
*· ·· · · · ·· • · « · · · · · ··· · ··· · · · · • · · · · ···· · ··· ··· • · · · · · · ·· ·· · '♦· «· idiotypické malé výšky postavy nebo Turnérův syndrom). Frekvence výskytu Turnérova syndromu ve světě je jedna z 2 500 žen; četnost výskytu tohoto druhu idiopatické malé výšky postavy se odhaduje na 1 případ ze 4 000 až 5 000 osob. Ženám s Turnérovým syndromem a některým jednotlivcům s malou výškou postavy se obvykle po několik let až po několik desítek let aplikuje růstový hormon (GH) , ačkoli je známo, že jejich hladina růstového hormonu v těle je normální a nedostatečnost GH zde není problémem. Léčba takových pacientů je velmi nákladná (odhaduje se přibližně na 30 000 USD ročně). Proto je nutné získat způsob rozlišení pacientů malého vzrůstu, kteří mají genetický defekt a pacienti, kteří nevykazují genetický defekt uvedeného genu. U pacientů s genetickým defektem tohoto genu - buď s úplnou delecí genu (jako je v případě Turnérova syndromu) nebo s bodovou mutací (jako je tomu u idiopatické malé výšky postavy)- je možné aplikovat alternativní léčbu bez lidského růstového hormonu.
Korelace genotyp/fenotyp podporují existenci růstového genu v proximální části Yq a v distální části Yp. Malá výška postavy se také objevuje u jedinců s terminálními delecemi Xp. Proběhlo rozsáhlé vyhledávání pacientů s částečnými monosomiemi pseudoautozomální oblasti. Na základě korelací genotyp-fenotyp se stanovila minimální běžná delece oblasti DNA o velikosti 700 kb (Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P.,
Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the • 4 4 4 4 4 4 4 4 4
494 «49 9944
9444 4 994 9 49 · • 9 444 4 4444 4 444 444 • 44444 4 4
44444 44 4 44 44 critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834). Zjistilo se, že uvedená oblast leží mezi genetickými markéry DXYS20 (3cosPP) a DXYS15 (113D) a u všech genů, které aspirují na řízení růstu, a leží v oblasti PARI (například receptor hemopoietického růstového faktoru; CSF2RA) (Gough N.M., Gearing D.P., Nicola N.A., Baker E., Pritchard
M. , Callen D.F., Sutherland G.R. (1990). Localization of the human GM-CSF receptor gene to the X-Aby pseudoautosomal region. Nátuře 345: 734736), se odstranily na základě jejich fyzikální pozice (Rappold G. A., Wilson T.A., Henke A., Gough
N. M. (1992): Arrangment and localization of the human GM-CSF receptor achain gene CSF2RA within the X-Aby pseudoautosomal region. Genomics 14: 455-461). Geny se nacházely v deleční oblasti o velikosti 700 kb PARI oblasti o velikosti 2 700 kb. Nedávno se objevily u jednotlivců s malým vzrůstem delece pseudoautozomální oblasti (PARI) pohlavních chromozomů a následně se také definovala minimální běžná oblast delece o velikosti 700 kb. Na základě analýzy DNA Southernovým přenosem u pacientů TIK a SS za použití odlišných pseudoautozomální ch markérů se identifikovala Xp terminální delece přibližně 700 kb od DXYS15 (113D) (Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P.,
Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834) .
·
• 4 · ·>·
Podstata vynálezu
Oblast genu odpovídající za malý vzrůst postavy se identifikovala jako oblast o velikosti přibližně 500 kb , s výhodou o velikosti přibližně 170 kb v PARI oblasti chromozomů X a Y. V této oblasti se identifikovaly tři geny jako kandidáti, kteří odpovídají za malý vzrůst. Tyto geny se označily SHOX (také jako SHOX93 nebo HOX93) (SHOX znamená gen obsahující homeobox malého vzrůstu), pET92 a SHOT (gen nesoucí homeobox podobný SHOX na chromozomu 3) . Zvláště významný je gen SHOX, který má dvě oddělená místa sestřihu, což vede ke vzniku dvou variací (SHOXa a b) . Během předchozích výzkumů se analyzovala podstatná část nukleotidové sekvence genu malého vzrůstu (SEQ ID NO: 8) . Mohou se předpovědět a identifikovat exony nebo jejich části (například exon I [G310]/ exon II [ET93]; exon IV [G108]; pET92) . Získané informace o sekvenci se pak mohou použít pro navržení vhodných primerů nebo nukleotidových sond, které hybridizují s částmi genu SHOX nebo jeho fragmenty. Gen SHOX se pak může izolovat běžnými metodami. Na základě další analýzy sekvence DNA genů zodpovědných za malý vzrůst se izoluje nukleotidová sekvence exonu I až V (uvedeno na obrázku č. 1 až 2). Gen SHOX obsahuje homeobox (SEQ ID NO: 1) o velikosti přibližně 180 bp (obrázek č. 2 a obrázek č. 3). Začíná nukleotidem, který kóduje aminokyselinu v pozici 117 (Q) , končí nukleotidem kódujícím aminokyselinu v pozici 176 (E) , to znamená od CAG(440) do GAG(619). U pacientů z Německa (AI) s malou výškou postavy a u pacientů Japonska, kde se testovalo 250 jednotlivců s idiopatickým malým vzrůstem, se identifikoval homeobox jako sekvence homeobox-pET93(SHOX) a zjistily se dvě bodové mutace. Obě bodové mutace se našly ve stejné pozici a vedou ke zkrácení proteinu v pozici aminokyseliny 195. To naznačuje, že zde může existovat tzv. horké místo. Na základě skutečnosti, že obě mutace, které vedou ke zkrácení proteinu, se vyskytují • · •9 ·9 · « 9 9 9 9 · · ·
999 9 99« · 99 · • 99* 9 999· 9 999 999
9 9 9 9 · · • 99 9-9 9 9« 99 ve stejné pozici, je pravděpodobné, že putativní horké místo rekombinace existuje v exonu 4(G108). Primery specifické pro exon jsou například GCA CAG CCA ACC ACC TAG (forward) nebo TGG AAA GGC ATG ATC CGT AAG (reverzní) . Shora uvedený nový gen obsahující homeobox, SHOX, který se nachází v intervalu 170 kb, je alternativně sestřižen a dává vznik dvěma proteinům s odlišnými funkcemi. Při demonstraci skutečnosti, že malá výška postavy je způsobena mutacemi v SHOX, se použila analýza mutace a sekvenování DNA.
Identifikace a klonování kritické oblasti malého vzrůstu podle vynálezu se uskutečnila následujícím způsobem. U 15 jednotlivců s částečnými monosomy v pseudoautozomální oblasti (PARI) se provedla rozsáhlá fyzikální mapovací studie. Korelací výšky těchto jedinců s delečními body se definovala kritická oblast malého vzrůstu (SS) o přibližné velikosti 700 kb. Tato oblast se následně klonovala jako překrývající se kosmidový kontig za použiti kvasinkových umělých chromozomů (YAC) z PARI (Ried K., Mertz A., Nagaraja R., Trusnich M., Riley J., Anand R., Page D., Lehrach H., Elloiso J., Rappold G.A. (1995): Characterization of a yeast artificial chromosome conting spanning the pseudoautosomal region. Genomics 29: 787792) a pomocí metody „chodícího kosmidu (cosmid walking). Za účelem vyhledání genů odpovědných za SS v tomto intervalu se na přibližně 600 kb velkou oblast mezi distálním koncem kosmidu 56G10 a proximálním koncem 51D11 aplikovala řada metod. Za použití selekce cDNA, trapování exonu a CpG klonování se identifikovaly dva nové geny.
Pozice kritického intervalu malého vzrůstu se zúžila na menší interval DNA o velikosti 170 kb tím, že se charakterizovaly ' tři další jedinci (GA, AT a RY) , kteří vykazují malý vzrůst postavy. Za účelem přesného stanovení pozice bodu přerušení u těchto jedinců se provedla na chromozomech v metafázi za použití kosmidu vhodných pro kontig fluorescenční hybridizace in šitu (FISH). Pacient GA, který vykazuje terminální deleci a • · • · · 9 9 9 9 9 · ·
9 9 9 9 9 9 9 · · · 9 • 9 · · · 9 9999 9 999 999
99999* 9 9
99999 99 9 99 99 normální výšku vzrůstu, definuje distální hranici kritické oblasti (bod přerušení se nachází na kosmidu 110E3) a pacient AT vykazující inverzi X chromozomu a normální výšku vzrůstu definoval proximální hranici (bod přerušení se nachází na kosmidu 34F5). Bod přerušení chromozomu Y u pacienta RY, který vykazuje terminální deleci a malý vzrůst, se také nachází na kosmidu 34F5, což naznačuje, že tato oblast obsahuje sekvence s predispozicí k přestavění chromozomů.
Celá oblast ohraničená Xp/Yp se klonovala jako sada přesahujících kosmidu. Ke studiu šesti pacientů s přestavěným chromozomem X, kdy tři z nich jsou normálního vzrůstu a tři mají malou výšku vzrůstu, se použila fluorescenční hybridizace in šitu (FISH) s kosmidy s této oblasti. Korelace genotypufenotypu zúžily kritický interval pro malý vzrůst na 270 kb DNA nebo na dokonce menší interval, jako je 170 kb, který obsahuje gen nebo geny důležité pro růst člověka. Tento interval pokrývá minimálně šest až osm kosmidu a jsou nyní dostupné pro hybridizaci FISH interfáze a metafáze, která je dostupný nástroj pro diagnózu pacientů s idiopatickým malým vzrůstem postavy.
Skutečnost, že cílový gen vede k vadám růstu u lidí (např. oblast malého vzrůstu), nebyla dříve známa. Biologická a klinická asociace pacientů s uvedenou deleci vysvětluje funkci uvedeného genu. V této studii se použila fluorescenční in šitu hybridizace (FISH) za účelem testování metafáze a interfáze jádra lymfocytu u šesti pacientů. Cílem bylo testovat u všech přesahujících kosmidů jejich použitelnost jako sondy pro FISH hybridizaci a stanovit oblasti porušení genu u všech čtyř případů, a tímto způsobem stanovit minimální kritickou oblast genu malého vzrůstu.
Duplikace nebo delece genomové DNA se může uskutečnit kvantitativní PCR nebo odhadem dávky na Southernových blotech nebo použitím RFLP.
·4 444 44 44
444 4 4 4 4444
4444 4 4 4 4 4 4« 4 4 4 444 444444 444 444 • 44444 · 4
44444 44 4 «4 44
Zvláště vhodnou metodou pro přesné rozlišení mezi jednou a zdvojenou dávkou markérů je hybridizace FISH, přičemž její klinická aplikace je v současnosti rutinní záležitostí. Zatímco při FISH hybridizaci interfáze se může zhodnotit absence nebo přítomnost molekulového markéru, hybridizace FISH metafáze chromozomů může poskytnout semi-kvantitativní stanovení delecí uvnitř kosmidu. Uvedeným způsobem se může stanovit delece o velikosti přibližně 10 kb (což odpovídá 25 % redukci signálu). Zvláště je důležité, že prakticky všechny geny onemocnění na lidském X chromosomu jsou spojeny s menšími a většími delecemi v rozmezí od několika kilobazí do několika megabazí DNA (Nelson, D.L., Ballabio A., Cremers F., Monaco A.P., Schlessinger D., (1995). -Report of the sixth international workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342).
Vynález dále popisuje sekvence DNA nebo jejich fragmenty, které jsou části genů odpovědných za lidský růst (nebo v případě defektu v těchto genech odpovídají za malý vzrůst). Identifikovaly se tři geny odpovědné za lidský růst. Jsou to SHOX, pET92 a SHOT) . Sekvence DNA nebo fragmenty těchto genů stejně jako sekvence DNA těchto genů v plné délce se mohou transformovat do vhodného vektoru a mohou se dále transfekovat do buněk. Když se takové vektory zavedou do buněk vhodným způsobem, jako jsou přítomny u zdravých jedinců, je možné uvedeným způsobem léčit onemocnění spojené s malým vzrůstem, to znamená například Turnérův syndrom. Onemocnění spojené s malým vzrůstem se může léčit odstraněním nebo mutací růstových genů odpovědných za malý vzrůst. Je také možné stimulovat geny, které kompenzují působení genů odpovědných za malou výšku postavy, to znamená inzercí sekvencí DNA před, za nebo do růstových genů/genů odpovídajících za malou výšku za účelem zvýšit expresi zdravých alel. Uvedenými modifikacemi genů se růstové geny/geny odpovídajících za malou výšku aktivují nebo deaktivují. To se může uskutečnit inzercí • 44 ··· 4« • •4 4*4 « 4 4 4
4444 · 444 4 44 4 44 444 4 4*44 · 444 444
4444 4 4 · 4
4 4 4 4 44 4 44 44 sekvencí DNA do vhodných míst, které jsou v genu nebo blízko genu umístěny tak, že tyto inzerované sekvence DNA interferují s růstovými geny/geny odpovídajícími za malou výšku a tak aktivují nebo brání jejich transkripci. Je také možné před růstové geny začlenit regulační element (například promotorovou sekvenci), aby se geny stimulovaly a staly se aktivní. Dále je možné stimulovat promotorovou sekvenci za účelem nadměrné exprese - v případě Turnérova syndromusprávně fungujících alel a tak kompenzovat chybějící alely. Modifikace genů se může obecně dosáhnout inzercí exogenních sekvencí DNA do růstového genu/genu odpovídajícího za malý vzrůst prostřednictvím homologní rekombinace.
Sekvence DNA podle vynálezu se mohou také použít k transformaci uvedených sekvencí do zvířat, jako jsou savci, prostřednictvím vhodného vektorového systému. Tyto transgenni zvířata se pak mohou použít pro zkoumání in vivo při testování a identifikaci farmaceutických činidel, která jsou použitelná při léčbě onemocnění spojených s malým vzrůstem. Jestliže zvířata pozitivně reagují na aplikaci sloučeniny nebo činidla, pak uvedené činidlo nebo sloučenina nebo jejich deriváty jsou vhodná jako farmaceutická činidla. Sekvence DNA podle vynálezu se mohou také využívat v genetických experimentech za účelem nalezení způsobů, jak kompenzovat ztráty genů odpovědných za malý vzrůst postavy.
Dále vynález popisuje sekvence DNA, které se mohou využít při transformaci buněk. Tyto buňky se mohou použít k identifikaci farmaceutických činidel, jenž se mohou použít při léčbě onemocnění spojených s malou výškou postavy nebo k testování takových látek nebo knihovny látek. Ve vhodném testovacím systému se mohou identifikovat změny fenotypu nebo změny expresivního paternu těchto buněk, což umožňuje identifikaci činidla vhodného pro přípravu léků.
Sekvence DNA podle vynálezu se také mohou použít při tvorbě vhodných primerů, které za přísných podmínek hybridizují se
| • 00 * · · • 000 | 0 0 0 0 · · 9 0 » · | • 9 «9 9 0 0 0 0 0 0 0 | ||
| 12 | 0 0» 00· 00 | 0 · 0 9 9 · | 9 9 0 · · · | |
| segmenty genů odpovídajících za | malý | vzrůst | nebo s | jejich |
| fragmenty. Mohou se konstruovat vhodné | sekvence | primerů, | které | |
| se používají při diagnóze lidí, | které | mají genetický | defekt |
způsobující malý vzrůst. Proto je nutné poznamenat, že dvě mutace nalezené v identické pozici naznačují, že existuje mutační horké místo.
Sekvence DNA podle vynálezu zahrnují i takové sekvence, které se degenerovaly na specifické sekvence na základě degenerace genetického kódu nebo které hybridizují za přísných podmínek se specificky danými sekvencemi.
Vynález zdůrazňuje zvláště následující rysy:
a) Molekulu izolované nukleotidové kyseliny kódující polypeptidy obsahující oblast homeoboxu šedesáti amininokyselin, které mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulující aktivitu lidského růstu.
b) Molekulu izolované DNA obsahující nukleotidovou sekvenci, jak je uvedeno na obrázku č. 2, 3 nebo 4 a zvláště, jak je uvedeno V SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15.
c) Molekuly DNA jsou schopny hybridizovat s molekulami DNA popsanými v odst. b).
d) Molekuly DNA podle odstavce c) jsou schopny hybridizovat s molekulami DNA podle odst. 2 při teplotě 60 °C až 70 °C a v přítomnosti roztoku standardního pufru.
e) Molekuly DNA obsahují nukleotidové sekvence, které vykazují % nebo vyšší homologii s nukleotidovou sekvencí SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15 a kódují polypeptid, který má regulační aktivitu lidského růstu.
f) Lidské růstové proteiny mají aminokyselinovou sekvenci SEQ ID NO: 11, 13 nebo 16 nebo jejich funkční fragment.
g) Protilátky získané při imunizaci zvířat lidskými růstovými proteiny podle odst. f) nebo jejich antigenní varianty.
h) Farmaceutické kompozice obsahující lidské růstové proteiny nebo jejich funkční fragmenty pro léčbu vad způsobených genetickými mutacemi lidského růstového genu.
* φ φφφ φ φφφφ • φ
ΦΦ 4
Φ Φ Φ • Φ Φ
ΦΦΦ 4
Způsob testování látky účinné při léčbě vad zmiňovaných shora v textu podle odst. h) zahrnující detekci mediátorové RNA hybridizující s libovolnými molekulami DNA popsanými v odstavcích a) až e) , přičemž se měří zesílení exprese molekuly DNA jako odezvy na léčbu hostitelské buňky substancí. Expresivní vektor nebo plazmid obsahující libovolné molekuly nukleové kyseliny popsané v odstavcích a) až e) , které umožňují, aby molekuly DNA se exprimovaly v savčích buňkách.
k) Způsob stanovení genu nebo genů v biologických vzorcích tkání nebo tělních tekutin odpovědných za malý vzrůst.
V případě metody popsané shora v textu v odstavci k) se pro detekci specifických nukleotidových sekvencí s výhodou používají nukleotidové amplifikační metody PCR, které jsou dobře známy v oboru a popisují se například v publikacích Mullis et al., 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 263-273 a Saiki et al., Science 239, 487-491. Stanovené nukleotidové sekvence odpovídající za malý vzrůst jsou hlavně ty, které jsou reprezentovány sekvencemi SEQ ID NO: 2 až SEQ ID NO: 7.
V principu všechny oligonukleotidové primery a sondy vhodné pro amplifikaci a detekci genetického defektu, který odpovídá za poškození lidského růstu v biologických vzorcích, jsou vhodné pro amplifikaci cílové sekvence spojované s malým vzrůstem. V tabulce č. 1 jsou uvedeny vhodný pár primerů specifický pro exon podle vynálezu. Následuje vhodná detekce, přičemž se například provádí radioaktivní nebo jiné značení.
Tabulka č. 1
| exon | Sense | Antisense | Produkt | Ta (°C) |
| primer | primer | (bp) |
44
4 4
444 4 4
4 4 4 4
4 4 4 4
44 »4 4
44
4 4 4
4 4 4
444 444
4
| 5'-I(G310) | SPI | ASP1 | 194 | 58 |
| 3'-I(G310) | SP2 | ASP2 | 295 | 58 |
| II (ET93) | SP3 | ASP3 | 262 | 76/72/68 |
| III (ET45) | SP4 | ASP4 | 120 | 65 |
| IV(GI08) | SP5 | ASP5 | 154 | 62 |
| Va (SHOXa) | SP6 | ASP6 | 265 | 61 |
Vysvětlení zkratek u primerů:
SP 1: ATTTCCAATGGAAAGGCGTAAATAAC
SP 2: ACGGCTTTTGTATCCAAGTCTTTTG
SP 3: GCCCTGTGCCCTCCGCTCCC
SP 4: GGCTCTTCACATCTCTCTCTGCTTC
SP 5: CCACACATGACACCTGCTCCCTTTG
SP 6: CCCGCAGGTCCAGGCTAGCTG
ASP1: CGCCTCCGCCGTTACCGTCCTTG
ASP2 ; CCCTGGAGCCGGCGCGCAAAG
ASP3: CCCCGCCCCCGCCCCCGG
ASP4; CTTCAGGTCCCCCCAGTCCCG
ASP5: CTAGGGATCTTCAGAGGAAGAAATVkG
ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG
Jako targetová DNA může také sloužit jednořetězcová RNA. Metody zpětné transkribce RNA na cDNA jsou dobře známy v oboru a popisuje je Sambrook et al., Molecular Cloning A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. V jiném případě preferované metody reverzní transkripce využívají termostabilní DNA polymerázy, které vykazují RT aktivitu.
Shora popsaná metoda se může použít při selekci těch osob ze skupiny lidí, jejichž malý vzrůst postavy se spojuje s genetickým defektem, což umožňuje specifičtější léčbu.
Vynález dále popisuje transkripční faktory A, B a C, které se mohou použít jako farmaceutická činidla. Tyto transkripční faktory inicijují stále neznámou kaskádu biologických účinků na molekulární úrovni, které se spojují s lidským růstem. Tyto *
999 9 999 9 99 9
999 9 9999 · 999 999
9 9 9 9 9 9
9* 99 9 99 99 proteiny nebo jejich funkční fragmenty mají mitogenní účinek na různé buňky. Zvláště mají osteogenní účinek. Mohou se použít při léčbě onemocnění kostí, jako je například osteoporéza, a zvláště všech onemocnění spojených s poškozením regulace vápníku v kostech.
Termín „izolovaný'' znamená původní derivaci molekuly DNA klonováním. Vynález se týká jak přirozeně se vyskytujících sekvencí tak i synteticky připravených.
Molekuly DNA podle vynálezu se mohou použít ve formách genové terapie, která zahrnuje použití expresivních plazmidů připravených inkorporací vhodné sekvence DNA podle vynálezu downstream od expresivního promotoru, který ovlivňuje expresi v savčí hostitelské buňce. Vhodné hostitelské buňky jsou prokaryontní a eukaryontní buňky. Prokaryontní hostitelské buňky jsou například E. coli, Bacillus subtilis a podobně. Prostřednictvím transfekce hostitelských buněk replikony, které pocházejí z druhů adaptovatelných na hostitele, to jsou plazmidové vektory obsahující počáteční bod replikace a regulační sekvence, se mohou uvedené hostitelské buňky transfekovat požadovaným genem nebo cDNA. Takové vektory jsou s výhodou ty, které mají sekvenci, jenž vybaví transfekované buňky vlastnostmi (fenotypem), na jejichž základě se mohou selektovat. V typickém případě se používají jako hostitelé bakterie E. coli kmen K12a, z vektorů se používá buď pBR322 nebo plazmidy pUC. Příklady vhodných promotorů v případě hostitelů E. coli jsou promotor trp, lac promotor nebo lpp promotor. Jestliže je to nutné, sekrece expresivního produktu skrz buněčnou membránu se může ovlivnit spojením sekvence DNA kódující sekvenci signálního peptidu s 5'upstream částí genu. Eukaryontní hostitelské buňky zahrnují buňky získané z obratlovců nebo kvasinek, atd. Jako hostitelské buňky obratlovců se mohou použít buňky COS (Cell, 1981, 23: 175-182) nebo buňky CHO. Aby došlo k expresi mohou se s výhodou použít promotory, které jsou umístěny 5'upstream genu a mají místa
I 9 9 9 > · · · •99 999 sestřihu RNA, polyadenylační a transkripční terminační sekvence.
Při léčbě vad způsobených mutacemi lidských růstových genů se mohou použít jako činidla podporující růst transkripční faktory A, B a C podle vynálezu. Na základě polymorfizmu, který je znám u eukaryontních genů, se může substituovat jedna nebo více aminokyselin. Jedna nebo více aminokyselin v polypeptidech může být deletována nebo začleněna do jednoho nebo více míst aminokyselinové sekvence polypeptidů SEQ ID NO: 11, 13 nebo 16. Takové polypeptidy jsou nazývány ekvivalentní polypeptidy, pokud vykazují biologickou aktivitu nemodifikovaného polypeptidů, jenž zůstává v podstatě beze změn.
Přehled obrázků na výkrese
Na obrázku č. 1 je zobrazena genetická mapa genu SHOX, který zahrnuje pět exonů, které se označily následujícím způsobem: exon I: G310; exon 2: ET93; exon III: ET45; exon IV: G108; a exony Va a Vb, přičemž exony Va a Vb vedou ke vzniku dvou různých míst sestřihu genu SHOX. Exon II a III obsahuje homeobox o velikosti 180 nukleotidů.
Na obrázcích č. 2 a 3 jsou nukleotidy a předpovězené aminokyselinové sekvence SHOXa a SHOXb.
SHOXa: Předpovězený začátek translace začíná nukleotidem 92, první v rámci je stop kodon (TGA) - nukleotidy 968 - 970, přičemž vzniká otevřený čtecí rámec o velikosti 876 bp, který kóduje předpovězený protein tvořený 292 aminokyselinami (označený jako transkripční faktor A nebo protein SHOX). V rámci je 5'stop kodon v pozici nukleotidu 4, počáteční kodon a předpovězený terminační stop kodon znázorněný tučným písmem. Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 117 (Q) až 176 (E), to v nukleotidové sekvenci odpovídá CAG až GAG) . Pozice intronů je označená šipkami. Dva
99 99 9 99
9 9 9 9 9 9
9999 9 999 9 99 9
999 9 9999 9 999 999
999999 9 9
99999 99 9 99 99 putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
SHOXb: Otevřený čtecí rámec o velikosti 876 bp se nachází od A v prvním metioninu nukleotidu 92 do terminačního kodonu v rámci v pozici 767 - 769, což tvoří otevřený čtecí rámec o velikosti 675 bp, který kóduje předpovězený protein o velikosti 225 aminokyselin (transkripčni faktor B nebo protein SHOXb). Pozice intronů jsou označeny šipkami. Exony I až IV jsou identické s SHOXa, exon V je specifický pro SHOXb. Putativní polyadenylační signál v 3' nepřekládané oblasti je podtržen.
Na obrázku č. 4 je nukleotidová sekvence a předpovězená aminokyselinová sekvence SHOT. Předpovězený počátek translace začíná v pozici nukleotidu 43, první v rámci je terminační kodon (TGA) - pozice nukleotidů 613 - 615, přičemž vzniká otevřený čtecí rámec o velikosti 573 bp, který kóduje předpovězený protein tvořený 190 aminokyselinami (označený jako transkripčni faktor C nebo protein SHOT). Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 11(Q) až 70 (E), to v nukleotidové sekvenci odpovídá CAG až GAG).
Pozice intronů je označená šipkami. Dva putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
Na obrázku č. 5 je uvedena organizace exon/intron lidského genu SHOX a pozice v nukleotidové sekvenci.
Popis sekvencí SEQ ID:
SEQ ID NO. 1: překládaná aminokyselinová sekvence oblasti
| homeoboxu | (180 | ' bp) | |||||
| SEQ | ID | NO. | 2: | exon | II (ET93) | genu | SHOX |
| SEQ | ID | NO. | 3: | exon | I (G310) | genu ; | SHOX |
| SEQ | ID | NO. | 4 : | exon | III (ET45) | genu | SHOX |
| SEQ | ID | NO. | 5: | exon | IV (G108) | genu | SHOX |
| SEQ | ID | NO. | 6: | exon | Va genu SHOX |
«9 9* 9 99 ·· • •9 9 9 · 9999
9999 9 999 9 99 9
9 « 9 9 9999 9 999 99«
9 9 9 · 9 * 9 «99 9« 9« 9 9« «9
| SEQ ID NO. | 7: exon Vb genu SHOX | ||
| SEQ | ID | NO. | 8: předchozí nukleotidová sekvence genu SHOX |
| SEQ | ID | NO. | 9: gen ET92 |
| SEQ | ID | NO. | 10: sekvence SHOXa (také uvedeno na obrázku č. 2) |
| SEQ | ID | NO. | 11: transkripční faktor A (také uvedeno na obrázku |
č. 2)
| SEQ ID | NO. | 12: sekvence SHOXb | (také uvedeno na obrázku č. 3) |
| SEQ ID | NO: | 13: transkripční | faktor B (také uvedeno na obrázku |
| Č. 3) | |||
| SEQ ID | NO. | 14: gen SHOX | |
| SEQ ID | NO. | 15: sekvence SHOT | (také uvedeno na obrázku č. 4) |
| SEQ ID | NO: | 16: transkripční | faktor C (také uvedeno na obrázku |
č. 4) .
Příklady provedeni vynálezu
Příklad 1: Pacienti
Všech šest studovaných pacientů vykazuje de novo odchylky na pohlavním chromozomu.
Pacient s označením CC je dívka s karyotypem 45,X/46,X psu dic (X) (Xqter ->Xp22.3 : : Xp22.3->Xqter) . Při posledním testu jí bylo 6 1/2 roku, její výška byla 114 cm (25 až 50 % percentil) . Výška postavy její matky je 155 cm, otec nebyl zařazen do analýzy. Detailněji je případ popsán v publikaci Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819.
Pacient s označením GA je dívka s karyotypem 46,X der X (3pter-»3p23: :Xp22.3-»Xqter) . Při posledním testu jí bylo 17 let a zjistila se normální výška (159 cm). Výška její matky je 160 cm, její otec měří 182 cm. Detailněji se pacientka popisuje v publikaci Kulharya A.S., Roop H., Kukolich M.K., Nachtman R.G., Belmont J.W., Garcia-Heras J., (1995): Mild • 9 • Λ*
I ··>· «9
I 9 9 » 9 9
999
9 • 9 99 phenotypic effects of a de novo deletion Xpter—»Xp22.3 a duplication 3pter—>3p23. Am. J. Med. Genet. 56: 16-21.
Pacient s označením SS je dívka s karyotypem 46,X rea (X) (Xqter—»Xq26: :Xp22.3->Xq26: ) . V jedenácti letech její výška byla pod 3 percentil křivky růstu japonských dívek.; její předpovězená výška v dospělosti (148,5 cm) leží pod její cílovou výškou (163 cm) a cílové rozmezí je (155 až 191 cm) . Detailněji je případ popsán v publikaci Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992) girl with a terminál Xp deletion
Short stature in a distal to DXYS15:
localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459.
Pacient z označením AK je dívka s karyotypem 46,X rea (X) (Xqter-»Xp22.3: :Xp22.3->Xp21.3 :) . Ve 13-ti letech její výška je pod 2 percentil křivky růstu japonských děvčat; její předpovídaná výška v dospělosti (142,8 cm) je pod její cílovou výškou (155,5 cm) a cílové rozmezí je (147,5 až 163,5). Detailněji se případ popisuje v publikaci Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834. Pacient označený RY má karyotyp 46,X,r(Y)/46,Xdic r (Y)/45, X[95: 3: 2], jak se zjistilo testem 100 lymfocytů; V 16ti letech je její výška 148 cm; jeho tři bratři dosáhly normální výšky 170 cm (bratr 1, 16 let), 164 cm (bratr 2, 9 let) a 128 cm (bratr 3, 9 let) . Růstová retardace tohoto pacienta je tak silná, že by měla být kompatibilní s další delecí lokusu GCY na Yq.
Pacient s označením AT je chlapec s ataxii a inv(X); v sedmi letech dosahuje normální výšky 116 cm, výška rodičů je 156 cm a 190 cm.
• 9
«I ·· • ··
9
9
9 9 9
999 ·9·
Pacienti pro analýzu mutací
U 250 jednotlivců s idiopatickým malým vzrůstem postavy se vyšetřovaly mutace genu SHOXa. Pacienti se vybraly podle následujících kriterií: výška chronologického věku byla pod 3 centil národního výškového standardu mínus 2 standardní odchylky (SDS); nebylo známé žádné kauzativní onemocnění zvláště : normální váha (délka) v prenatálním stavu, normální tělesné proporce, žádné chronické onemocnění, normální příjem potravy, žádné psychiatrické obtíže, žádná dysplázie skeletu, žádná nedostatečnost růstového hormonu nebo hormonů štítné žlázy.
Rodina A:
Případy 1 a 2 jsou děti malého vzrůstu německé nepokrevné rodiny. Chlapec (případ 1) se narodil v 38 týdnu těhotenství císařským řezem. Porodní váha byla 2 660 g, porodní délka byla 47 cm. Vyvíjel se normálně s výjimkou subnormálního růstu. Při schůzce ve věku 6,4 roku byl proporcionálně malý (106,8 cm, 2,6 SDS) a obézní 22,7 kg) ale jinak normální. Stáří jeho kostí nebylo retardované (odpovídalo 6 letům) a dysplázie kostí se vyloučila na základě vyšetření X-paprsky. Nepravděpodobná je nedostatečnost v hladinách IGF-I a IGFBP-3 stejně jako parametry štítné žlázy, které se v séru prokazují GH nebo nedostatečnost hormonů štítné žlázy. Dívka (případ 2) se narodila v termínu císařským řezem. Porodní váha byla 2 920 g, porodní délka byla 47 cm. Její vývoj byl normální, ale ve 12 měsících se projevil její malý růst (délka 67 cm, -3,0 SDS). Ve čtyřech letech měřila 89,6 cm (-3,6 SDS). Neprojevily se žádné dysmorfní ani dysproporcionální rysy. Nebyla obézní (13 kg). Stáří jejich kostí odpovídalo 3,5 letům a vyloučila se dysplázie kostí. Hormonální parametry byly normální. Je zajímavé poznamenat, že růst děvčete i chlapce odpovídá 50 percentil růstové křivky žen s Turnérovým syndromem. Matka je nejmenší z rodiny a má střední rhizomelickou disproporci • · · · (142,3 cm, -3,8 SDS) . Jedna ze sester (150 cm, -2,5 SDS) a babička z matčiny strany (153 cm, -2,0 SDS) jsou malé postavy, aniž mají nějakou disproporci. Druhá sestra má normální výšku postavy (167 cm, +0,4 SDS). Výška otce je 166 cm (-1,8 cm) a výška dědečka z matčiny strany je 165 cm (-1,9 SDS). Další pacient je japonského původu a vykazuje identické mutace.
Příklad 2: Identifikace genu odpovídajícího za malý vzrůst
A. Hybridizace in sítu
a) Fluorescenční hybridizace in sítu
Provedla se fluorescenční hybridizace in sítu (FISH) za použití kosmidů, které leží v Xp/Yp pseudoautozomální oblasti (PARI). Uskutečnily se FISH studie za použití kosmidů 64/75cos (LLNlcll0H032), E22cos(2e2), Fl/14cos (110A7), Ml/70cos (110E3), P99F2cos(43C11), P99cos (LLNLcll0P2410), B6cosb (1CRFC104H0425), F20cos (34F5), F21cos (ICRFcl04G0411), F3cos2 (9E3), F3cosl (11E6), P117cos (29B11), P6cosl(ICRFcl04P0117), P6cos2 (LLNLcll0E0625) a E4cos (15G7) podle metody popsané v publikacích (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo). Jeden mikrogram kosmidového klonu se značil biotinem a hybridizoval se s metafází lidských chromozomů za podmínek, které redukují signál z repetivních sekvencí DNA. Detekce hybridizačního signálu probíhá prostřednictvím avidinu spojeného s FITC. Zviditelnění FITC proběhlo za použití chlazeného zdvojeného kamerového sytému (Photometrics, Tucson, AZ) .
b) Fyzikální mapování
Kosmidy se získaly z Lawrence Livermore National Laboratory Xa Y-chromozomové knihovny a z X-chromozomové knihovny instituce Imperiál Cancer Research Fund London (nyní Max Plaňek Institute for Molecular Genetics Berlin). Za použití
• · ·
........
kosmidů distálních k DXYS15, jmenovitě E4cos, P6cos2, P6cosl, P117cos a F3cosl lze stanovit, že jsou stále přítomny dvě kopie E4cos, P6cos2, P6cosl a jedna kopie P117cos a F3cosl. Body porušení na mapě kosmidu P6cosl obou pacientů AK a SS jsou od sebe v maximální vzdálenosti lOkb. Zjistilo se, že abnormální X-chromozomy AK a SS měly deletováno přibližně 630 kb DNA.
Další kosmidy se získaly z ICRF X-chromozomové specifické kosmidové knihovny (ICRFclG4), z Lawrence Livermore Xchromosomové specifické kosmidové knihovny (LLNLcllO) a Ychromozomové specifické knihovny (LLCO3'M'), stejně jako ze samostatně připravené kosmidové knihovny zahrnující celý genom. Kosmidy se identifikovaly hybridizací se všemi známými sondami, které mapují uvedenou oblast a použitím celé YAC jako sondy. Za účelem ověření překryvů v případech, kde nebylo možno použít známých sond, se použily terminační sondy z několika kosmidů.
c) Hybridizace Southernovým přenosem
Analýza Southernovým přenosem za použití pseudoautozomálních markérů poskytuje důkaz, že bod porušení X-chromozomu u pacienta CC leží mezi DXYS20(3cosPP) a DXYS60(U7A ( Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819). Za účelem potvrdit tento nález a definovat pozici bodu porušení, se použily kosmidy 64/75cos, E22cos, Fl/14cos, Ml/70cos, F2cos, P99F2cos a P99cos jako sondy při hybridizací FISH. Pozice bodu porušení na abnormálním chromozomu X u pacinta CC je mezi kosmidy 64/75cos (jedna kopie) a Fl/14cos (dvě kopie) na E22PAC. Pacient CC s normální výškou následně ztratil přibližně 269 až 290 kb DNA.
• ·
Hybridizace Southernovým přenosem se provedla za přísných podmínek v Churchově pufru (0,5 M NaPi pH7,2, 7 % SDS, 1 mM
EDTA) při teplotě 65 °C a promývání se provedlo 40 mM NaPi, 1 % SDS při teplotě 65 °C.
d) Analýza hybridizaci FISH
Biotinem značená kosmidová DNA (velikost inzertu 32 až 45 kb) nebo kosmidové fragmenty (10 až 16 kb) se hybridizovaly s metafází chromozomů, které pochází ze stimulovaných lymfocytů pacientů, za podmínek, jenž se popisují dříve v textu (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo). Hybridizované sondy se detekovaly prostřednictvím avidinu spojeného s FITC.
e) Amplifikace pCR
Všechny reakce PCR se provedly v objemech 50 ul. V tomto objemu je obsaženo 100 pg až 200 pg templátu, 20 pmolkaždého primeru, 200 uM dNTP (Pharmacia), 1,5 mM MgC12, 75 mM Tris/Hcl pH9, 20 mM (NH4)2SO4 0,01 % (hmot. /objem) Tween 20 a 2 U
Goldstar DNA polymerázy (Eurogentec). Termocykly se provedly na zařízení GeneE (Techne).
f) Amplifikace exonu
Za účelem amplifikace exonu se použily čtyři kosmidové sebrané roztoky, kdy každý zahrnuje čtyři až pět klonů z kosmidových kontigů. Kosmidy v každém kosmidovém roztoku se částečně štěpily restrikčním enzymem Sau3A. Frakce čištěné na gelu v rozmezí velikostí 4 až 10 kb se klonovaly do vektoru pSPL3B štěpeného restrikčním enzymem BamHI (Burn et al., 1995) a použily se při experimentech amplifikace exonu, jak se popisuje dříve v textu (Church et al., 1994).
g) Sekvenování genů ·· ··
Sonifikované fragmenty dvou kosmidů LLOYNCO3'M'15D10 a LLOYNCO3'M'34F5 se odděleně sub-klónovaly do vektorů M13mpl8. Z každé kosmidové knihovny se vybralo alespoň 1 000 plaků, připravila se DNA M13 a sekvenovala se za použití barvivém značených terminátorů, termo-sekvenázy (Amersham) a univerzálního M13-primeru (MWG-BioTech). Gely se provedly na sekvenátoru ABI-377 a data se uspořádala a editovala pomocí programu GAP4 (Staden).
Ze všech šesti pacientů pacient GA měl nejméně chrakterizovaný bod porušení chromozomu. Nejvzdálenější markéry, jejichž přítomnost na chromozomu X se testovala dříve, byly DXS1060 a DXS996, mapují přibližně 6 Mb od telomeru (Nelson, D.L., Ballabio A., CremersF., Monaco A.P., Schlessinger D., (1995). -Report of the sixth International workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342). Testovalo se několik kosmidů, které obsahují odlišné sekvence genů z PARI (MIC2, ANT3, CSF2RA a XE7). Všechny byly přítomny na translokačním chromozomu. Kosmidy pokrývající kritickou oblast odpovídající za malý vzrůst postavy, například z chromozomu, přičemž translokační bod porušení je na kosmidů Ml/70cos. Kvantitaivní srovnání intenzity signálu Ml/70cos mezi normálním a znovu uspořádaným chromozomem X ukazuje, že je deletováno přibližně 70 % kosmidů.
Tabulka č. 2
| CC | GA | AK | SS | |
| 64/75cos | - | - | ||
| E22cos | - | - | ||
| Fl/14cos | + | - | ||
| Ml/70cos | + | (+) | ||
| F2cos | + | + | ||
| P99F2cos | + | + | ||
| P99cos | + | + | ||
| B6cos | + |
• · > · · · · • · > ·«
| F20cos | ||||
| F21cos | ||||
| F3cos2 | ||||
| F3cosl | — | |||
| P117cos | — | |||
| P6cosl | + | + | ||
| P6cos2 | + | + | ||
| E4cos | + | + |
Tabulka č. 2: Tabulka udává souhrn dat z hybridizace FISH pro 16 kosmidů testovaných u čtyř pacientů (-) jedna kopie; indikuje, že kosmid je deletován na znovu uspořádaném chromozomu X, ale je přítomen na normálním chromozomu X (+) dvě kopie; indikuje, že kosmid je přítomen na znovu uspořádaném i na normálním chromozomu X ((+)) oblast bodu porušení; indikuje, že bod porušení se vyskytuje na kosmidu, jak ukazuje hybridizace FISH.
Molekulová analýza u šesti pacientů se znovu uspořádaným chromozomem X za použití kosmidových fluoresčenčně značených kosmidových sond a hybridizace in šitu indikuje, že oblast odpovídající za malý vzrůst je zúžena na interval o velikosti 270 kb, který je ohraničený bodem porušení pacienta GA z jeho centromerové distální strany a u pacientů AK a SS na jeho centromerové proximální straně.
Korelace genotyp-fenotyp může být informativní a může posloužit k zobrazení kritického intervalu, který odpovídá za malý vzrůst postavy, na lidském chromozomu X a Y. V této studii se použila analýza hybridizací FISH ke studiu rozšíření metafáze a interfáze jádra lymfocytů u pacientů, kteří nesou delece a translokace na chromozomu X a body porušení v Xp22.3. Tyto body porušení se jeví být přítomny u dvou ze čtyř pacientů (AK a SS) , což je způsobeno přítomností sekvencí ·· ·· » · · « proximálně 510/520 podstatnou redukci s predispozicí k znovu uspořádání chromozomu. Zjistil se další pacient s kruhovým Y s porušením nacházejícím se v kritické oblasti o velikosti 270 kb, což redukuje kritický interval na 170 kb.
Korelací výšky šesti jedinců s jejich místem porušení se mapoval interval o velikosti 170 kb v pseudoautozomální oblasti, jehož přítomnost nebo absence má podstatný účinek na výšku vzrůstu. Tento interval je ohraničen místem porušení na chromozomu X pacienta GA v místě vzdáleném 340 kb distálně od telemoru (Xptel) a místem porušení u pacientů AT a RY kb Xptel. Toto uspořádání zahrnuje kritického intervalu na téměř jednu čtvrtinu jeho původní velikosti (Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629). Pro experimenty FISH za účelem testování prevealence a signifikance uvedeného genomového lokusu na velké sérii pacientů s idiopatickým malým vzrůstem je nyní dostupná malá sada šesti až osmi kosmidů.
B. Identifikace kandidáta genu odpovídajícího za malý vzrůst Za účelem hledání transkripčních jednotek v nejmenší kritické oblasti o velikosti 170 kb se provedlo trapování exonu a selekce cDNA u šesti kosmidů (110E3, F2cos, 43C11, 02410, 15D10, 34F5). Trapováním exonu se izolovaly tři různé
pozitivní klony (ET93, ET45 a G108). Všechny z nich se mapovaly zpět ke kosmidu 34F5. Předchozí studie za použití cDNA selekčních protokolů a přístupu k 25 různým knihovnám cDNA vedly k neúspěchu, což naznačuje, že geny v tomto intervalu se exprimují s velmi malým nadbytkem.
Za účelem zjištění, zda nějaký gen v uvedeném intervalu chybí, se stanovila za použití náhodné M13 metody a terminátorové chemie nukleotidová sekvence vzdálená přibližně 140 kb od uvedené oblasti PARI. Za účelem sekvenční analýzy se vybraly kosmidy se vzájemným minimálním překryvem, aby spolu pokryly kritický interval. Provedla se sekvenční analýza a následná předpověď proteinu pomocí programu „X Grail, verze 1.3c, stejně jako trapování exonu pomocí programu FEXHB, což potvrdilo všechny 3 dříve klonované exony. Nedetekoval se žádný jiný gen kódující protein, než co už byl dříve izolován.
C. Izolace genu SHOX odpovídajícího za malý vzrůst
Za předpokladu, že všechny tři exonové klony ET93, ET45 a G108 jsou součástí stejného genu, použily se spolu jako sondy k testování 14 různých knihoven cDNA vytvořených z 12 různých fetálních (plíce, játra, mozek 1 a 2) a dospělých tkání (vaječníky, placenta 1 a 2, fibroblasty, skeletové svalstvo, kostní dřeň, mozek, mozkový kmen, hypotalamus, podvěsek mozkový). Mezi přibližně 14 milióny klony nanesenými na plotny se nedetekoval ani jeden klon. Za účelem izolace transkriptu v plné délce se uskutečnil 3'a 5'RACE. Za účelem 3'RACE se použily primery z exonu G108 na RNA z placenty, skeletového svalstva a fibroblastů z kostní dřeně a z tkáně, kde se exprimuje G108. Ze všech tří tkání se získaly dva různé 3'RACE klony velikosti 1173 a 652 bp, což naznačuje, že existují dva různé 3'exony a a b. Tyto dvě odlišné formy se nazývají SHOXa a SHOXb.
Za účelem zvýšení šancí pro izolaci celé 5'části genu, o kterém se ví, že je exprimován s malým přebytkem, se buněčná • ·0 00 0 000 000 • 000 0 ··* • · 000 0 0 0 0 1 ♦ 0 0 0 0 «
........
linie Hela ošetřila retinoovou kyselinou a forbolesterem ΡΜΆ. RNA z takové indukované buněčné linie a RNA z placenty a skeletového svalstva se použila ke konstrukci „Mararhonovy knihovny cDNA. Ze všech tří tkání se izolovaly identické klony 5'RACE cDNA.
Experimentální postup:
RT-PCR a konstrukce knihovny CDNA.
Od firmy Clontech se získala lidská polyA+RNA ze srdce, pankreasu, skeletového svalstva, fetálních ledvin a jater. Celková RNA se izolovala z buněčné linie fibroblastů z kostní dřeně činidlem TRIZOL (Gibco-BRL), způsobem, který popisuje výrobce. První řetězec syntézy cDNA se získal pomocí kitu „Superscript first strand cDNA synthesis kit (Gibco-BRL), kdy počátečním materiálem je 100 ng polyA+RNA nebo 10 ug celkové RNA za použití oligo (dt)-ada+RNAptorového primeru (GGCCACGCGTCGACTAGTAC[dT]2oN. Po syntéze prvního řetězce cDNA se reakce naředila 1/10. Při dalších experimentech PCR se použilo 5 ul tohoto ředění. „Marathonova knihovna cDNA se zkonstruovala z polyA+RNA skeletového svalstva a placenty amplifikačním kitem pro cDNA (Clontech), jak popisuje výrobce. Knihovny cDNA z fetálního mozku (katalogové číslo # HL5015b), fetální plíce (HL3022a), vaječníků (HLlO98a), podvěsku mozkového (HL1097v) a hypotalamu (HL1172b) se získaly od firmy Clontech. Knihovny cDNA mozku, ledvin, jater a plic se staly součástí rychlého testu panelu lidské cDNA knihovny (Clontech). cDNA knihovna fetálního svalstva se získala z instituce UK Human Genome Mapping Project Resources Center.
D. Sekvenační analýza a struktura genu SHOX
Na základě analýzy sekvencí získaných klonů pomocí 5' a 3'RACE se uspořádala sekvence SHOXa a SHOXb (1349 a 1870 bp). Identifikoval se jedne otevřený čtecí rámec o velikosti 1870 bp (SHOXa) a 1349 bp (SHOXb), který dává vzniku dvou proteinů ·· BB ► · B 4
BBB
B B o 292 aminokyselinách (SHOXa) a 225 aminokyselinách (SHOXb). Oba transkripty a i b se dělí o běžný 5'konec, ale mají odlišný poslední 3'exon . Toto zjištění naznačuje, že se používá alternativní signály sestřihu. Dosáhlo se úplného a sekvenovanou genomovou DNA LL0YNC3M34F5, což umožňuje uspořádání mezi dvěmi cDNA z kosmidů LL0YNCO3M15D10a ustanovení struktury exon-intron (obrázek č. 4) . Gen se skládá ze 6 exonů, jejichž velikost se pohybuje v rozmezí od 58 bp (exon III) do 1146 bp (exon Va). Exon I obsahuje CpG, startovací kodon a 5'oblast. Stop kodon stejně jako 3'nekódující oblast se nachází v každém alternativně sestřiženém exonu Va a Vb.
Příklad 3:
Identifikovaly se dvě cDNA, které tvoří 160 kb velkou oblast, která je kritická pro malý vzrůst. Tyto cDNA korespondují s geny SHOX a pET92. cDNA se se identifikovaly hybridizací subklónů kosmidů s knihovnami cDNA.
Sada kosmidových klonů, které úplně pokrývají kritickou oblast, je genetickým materiálem pro identifikaci kauzativního genu. Projekty pozičního klonování, které vedou k izolaci genů z uvedené oblasti, se uskutečnily trapováním exonu a selekcí cDNA. Zjištěním jejich polohy v pseudoatozomální oblasti se tyto geny mohou vyhnout X-deaktivaci a může se uplatnit účinek dávky.
Klonování genu, který když není přítomen (haploid) nebo je deficitní odpovídá za malý vzrůst, je dalším krokem přesnosti diagnózy a poskytuje základy pro analýzu mutací v genu pomocí například jednořetězcového konformačního polymorfizmu (SSCP). Navíc klonování uvedeného genu a jeho následná biochemická charakterizace otevřela cestu k hlubšímu porozumění biologických procesů, které jsou zahrnuty v řízení růstu. Sekvence DNA podle vynálezu poskytují první molekulový test pro identifikaci jednotlivců se specifickou vadou genu ·· ·· ·· • · · · • · · · • · · · ··♦ · · · >
• · · · · ···· · ··· • · · · · • ·· ·· · v komplexní heterogenní skupině pacientů, kteří vykazují idiopatický malý vzrůst.
Příklad 4: Expresní patern SHOXa a SHOXb
Analýza northernovým přenosem za použití jednotlivých exonů jako hybridizačních sond ukázala odlišný expresivní profil každého exonu, což silně naznačuje, že pruhy o různé velikosti a intenzitě reprezentují produkty křížové hybridizace s jinými genovými sekvencemi bohatými na G,C. Aby se dosáhlo více realistického expresivního profilu genů SHOXa a b, provedly se s RNA z různých tkání RT-PCR experimenty. Zatímco exprese SHOXa se pozorovala ve fibroblastech skeletového svalstva, placenty, pankreasu, srdce a kostní dřeně, exprese SHOXb se omezila na fibroblasty fetální ledviny, skeletového svalstva a kostní dřeně, přičemž zdaleka nej silnější expresi vykazují fibroblasty kostní dřeně.
Exprese SHOXa v několika cDNA knihovnách připravených z fetálního mozku a ze svalstva, z mozku dospělých, z plic a z podvěsku mozkového a skutečnost, že v žádné uvedené knihovně není exprimován SHOXb, podává další důkaz, že exprese jedné formy sestřihu (SHOXa) je více rozšířena než druhá (SHOXb), která se exprimuje převážně tkáňově specifickým způsobem.
K odhadu transkripční aktivity SHOXa a SHOXb na X a Y chromozomu se použila RT-PCR RNA, která se extrahovala z různých buněčných linií, jenž vykazují aktivní X, neaktivní X nebo Y chromozom. Všechny buněčné linie vykazují produkt amplifikace očekávané délky 119 bp (SHOXa) a 541 bp (SHOXb), což je důkaz, že jak SHOXa i b unikly deaktivaci chromozomu X. Geny SHOXa a b kódují nové proteiny homeodomén. Gen SHOX je vysoce konzervativní mezi jednotlivými živočišnými druhy od savců po ryby a ptáky. Na samém 5'konci a 3' konci vedle homeodomény jsou pravděpodobně konzervativní oblasti mezi člověkem a myší, což znamená funkční signifikanci. Během • 4 • ·· 4· 4 • 4444 4
4
• ··· 4 4
4
evoluce mezi člověkem a myší se v těchto oblastech aminokyselin neakumulovaly rozdíly.
Experimentální postupy:
a) 5'a 3 'RACE
Za účelem klonování transkriptů 5'konce SHOXa a b se provedla metoda 5'RACE za použití zkonstruované „Marathonových cDNA knihoven. Použily se následující oligonukleotidové primery: SHOX B rev. GAAAGGCATCCGTAAGGCTCCC (pozice 697-718, reverzní řetězec [r]) a adaptorový primer API. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 66 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 25 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX A rev,
GACGCCTTTATGCATCTGATTCTC (pozice 617-640 r) a adaptorového primeru AP2. PCR se provedlo během 35 cyklů s teplotou renaturace 60 °C.
Za účelem klonování transkriptů 3'konce SHOXa a b se provedla metoda 3'RACE, jak popisuje v publikaci Frohman et al., 1988, za použití prvního řetězce cDNA s primerem oligo(dT)adaptoru. Použily se následující oligonukleotidové primery: SHOX A for GAATCAGATGCATAAAGGCGTC (pozice 619-640) a oligo(dT)adaptor. . Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX B for, GGGAGCCTTACGGATGCCTTTC (pozice 697-718) a oligo(dT)adaptoru. PCR se provedlo během 35 cyklů s teplotou renaturace 62 °C.
• ·· ··
4· t * ♦ · • 4 4 4 • · ···· · • · » ·· · • 4 * 4 • · • 44 »4 a· a « • 4 »44 4 • 4
Za účelem potvrdit sekvence transkriptů SHOXa a SHOXb se uskutečnila PCR 5'oligonukleotidovým primerem a
3'oligonukleotidovým primerem. V případě SHOXa se použily následující primery: G310 for AGCCCCGGCTGCTCGCCAGC (pozice 5978) a SHOX D rev CTGCGCGGCGGGTCAGAGCCCCAG (pozice 959-982 r) . V případě SHOXb se použily následující primery: G310 for AGCCCCGGCTGCTGCCAGC a SHOX2A rev GCCTCAGCAGCAAAGCAAGATCCC (pozice 1215-1238 r) . Obě PCR se provedly za podmínek: 94 °C po dobu 2 .minut, 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřint, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Produkty se čistily na gelu a klonovaly se za účelem sekvenační analýzy.
b) Analýza SSCP
Amplifikovaná genomová DNA pocházející z pacientů se analyzovala způsobem SSCP, který se popisuje v publikaci Orita M., Suzuki Y., Sekiya T., and Hayashi K., (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5:874-879). 1 až 5 ul produktů PCR se smíchalo s 5 ul denaturačního roztoku, který obsahuje 95 % formamidu a 10 mM EDTA pH8, a denaturovaly se při teplotě 95 °C po dobu 10 minut. Vzorky se ihned ochladily na ledu a nanesly se na 10 % polyakrylamidový gel (akrylamid : bisakryamid = 37,5 : 1 a 29 : 1; gel s více sloty, báze TGGE, Qiagen), který obsahuje 2 % glycerol a 1 x TBE. Elektroforéza proběhla při teplotě 15 °C při napětí 500 V po dobu 3 až 5 hodin a obarvila se stříbrem, jak se popisuje TGGE manuálu (Qiagen, 1993).
c) Klonování a sekvenování produktů PCR
Produkty PCR se klonovaly do vektoru pMOSBlue za použití pMOSBlueT-sady vektorů od firmy Amersham. Kultura z jedné ·« 9 • · ·
kolonie kultivovaná přes noc se lyžovala povalením ve 100 ul vody po dobu 10 minut. Lyzáty se použily jako templáty pro PCR se specifickými primery. SSCP produktů PCR umožnila identifikaci klonů, které obsahují různé alely. Klony se sekvenovaly za použití vektorových primerů Uni a T7 značených CY5 způsobem sekvenování v cyklech, jak popisuje výrobce (ThermoSequenase Kit (Amersham)) na atomatickém sekvenétoru ALF (Pharmacia).
d) Testování cDNA knihoven pomocí PCR
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA a prvního řetězce cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po
| dobu 2 | minut, | 94 | 1 °c | po | dobu 30 | vteřin, 68 | °C po dobu | 30 |
| vteřin, | 72 °C | PO | dobu | 40 | vteřin po | 5 cyklů. 94 | ° C po dobu | 30 |
| vteřin, | 65 °C | PO | dobu | 30 | vteřin, 72 | ° C po dobu | 40 vteřin po | 5 |
cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů
e) PCR testování knihoven cDNA
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA s SHOXa a b specifickými primery.
V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu.
V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for.
V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů.
Příklad 5: Expresivní patern 0G12, což je putativní homolog SHOX a SHOT
Za účelem stanovení expresivního paternu se provedla hybridizace in šitu u embryí myší z 5. dne p.c. a 18,5 dne p.c. , u fetálních a u nově narozených zvířat. Expresi bylo možno ukázat u vyvíjejících se zárodků noh, v mesodermu nasalních postupů, které se podílejí na tvorbě nosu a patra, u očních víček, u aorty, ve vyvíjejících se žláz samic, ve vyvíjející se páteři (omezených na diferenciaci motorických neuronů) a v mozku. Na základě tohoto expresivního paternu a na mapování pozice jeho lidského homologu SHOT, SHOT reprezentuje pravděpodobně kandidáta Cornelia de Lange syndromu, který zahrnuje malý vzrůst.
Příklad 6: Izolace nového genu homeoboxu podobného SHOX SHOT na chromozomu 3, který souvisí s lidským růstem/s malým vzrůstem postavy.
U člověka se izoloval nový gen nazývaný SHOT (SHOX homolog na chromozomu 3), který vykazuje nejvíce homologie s myším genem OG12 a lidským SHOX. Lidský gen SHOT a myší OG12 jsou vysoce homologní. Vykazují 99 % identity na úrovni proteinu. Ačkoli se to ještě neprokázalo, díky homologii mezi SHOT a SHOX (jde o identitu pouze v homeooblasti) je pravděpodobné, že gen SHOT také odpovídá za malý vzrůst nebo lidský růst.
Gen SHOT se izoloval za použití primerů ze dvou nových lidských EST (HS 1224703 a HS 126759) z databáza EMBL, přičemž se amplifikuje reverzně přepsaná RNA z linie fibroblastů kostní dřeně (Rao E., Weiss B., Mertz A., et al., (1995): Construction of a cosmid conting spanning the short stature candidate region in the pseudosomal region PAR 1. In: Turner • ·
9 9 • 9 9 «
« ·» • 9 · · · · 9 • · · β 9 9 9 · • 9 9 9999 · ··· 999
9 9 9 9
Λ 9 9 9 9 9 syndrome in a life spán respective: Research and clinical aspects. Proceeding of the 4th International Symposium on Turner Syndrome, Gothenburg, Sweden, 18-21 May, 1995., edited by Albertsson-Wikland K., Ranke M.B., pp. 19-24, Elsevier. 5'a 3'konec genu SHOT se generoval RACE-PCR z fibroblastové knihovny kostní dřeně, která se zkonstruovala podle publikace Rao E., Weiss B., Fukami M., Rump A., Niesler B., Metz A.,
Muroya K., Binder G., Kirsch S., Winkelmann M., Nordsiek G., Heinrich U., Breuning Μ. H., Ranke M.B., Rosenthal A., Ogata T., Rappold G.A. (1997): Pseudoautosomal deletions encompassing a navel homeobox gene cause groxth failure in idiopathic short stature and Turner syndrome. Nátuře Genet 15:54-62. Gen SHOT se mapoval analýzou FISH chromozomu 3q25/q26 a dále se mapoval myší homolog syntetické oblasti na myším chromozomu 3. Na základě expresivního paternu OG12, což je myší homolog genu SHOT, gen SHOT reprezentuje kandidáta odpovídajícího za Cornelia Lange syndrom (který vykazuje malou výšku vzrůstu a další rysy, kam patří kraniofaciální abnormality) , který se mapoval v tomto intervalu na chromozomu 3q25/26.
Příklad 7: Vyhledávání mutací u pacientů s idiopatickým malým vzrůstem
Sekvence DNA podle vynálezu se používají při PCR, LCR a při jiných známých technologiích, za účelem stanovení, zda takoví jednotlivci s malou výškou vzrůstu vykazují malé delece nebo bodové mutace v genu odpovídajícím za malý vzrůst.
U 91 (z celkového počtu 250 jednotlivců) nezávislých pacientů mužského a ženského pohlaví s idiopatickou malou výškou vzrůstu (odhad četnosti idiopatické malé výšky vzrůstu v obecné populaci se odhaduje na 2 až 2,5 %) se testovala přítomnost malých změn v uspořádání nebo bodové mutace v genu SHOXa. Navrhlo se šest sad primerů PCR, ne pouze za účelem amplifikace jednotlivých exonů, ale také sekvencí, které ·· ·· t· ·« lemují exon a malé části 5ÚTR. V případě největšího exonu, exon I, se generovaly dva další primery uvnitř exonu. Primery, které se používaly při PCR, se uvádějí v tabulce č. 2.
Provedl se jednořetězcový konformační polymorfizmus (SSCP) všech amplifikováných exonů, jehož velikost se pohybuje v rozmezí od 120 do 295 bp. Pouze v případě dvou jednotlivců s malou výškou vzrůstu (Y91 a AI) se identifikoval posun pohyblivosti pruhů. Klonovaly se a sekvenovaly fragmenty, které vykazují pozměněné paterny SSCP (unikátní konformery SSCP) . Aby se zabránilo vzniku PCR a sekvenačních artifaktů, sekvenování se provedlo na dvou řetězcích za použití dvou nezávislých reakcí PCR. Mutace u pacienta Y91 se nachází v pozici 28 bp 5'konce startovacího kodonu v 5'UTR a zahrnuje substituci, kdy guanin se nahradí citidínem. Aby se zjistilo, jestli tato mutace reprezentuje řídký polymorfizmus nebo je odpovědná za fenotyp regulací exprese genu, například slabším navázáním translačních iniciačních faktorů, testovaly se pacientovi rodiče a sestra. Přestože sestra a otec pacienta dosahují normální CP (data nejsou uvedeny). Uvedená substituce bází reprezentuje řídký polymorfizmus, který neovlivňuje fenotyp.
Klonování a sekvenování unikátních konformerů SSCP pacienta Al vykazuje transici bází, kdy citidin nahradí thymidin (nukleotid 674), která zavede terminační kodon do pozice aminokyseliny 195 předpovězených aminokyselinových sekvencí 225 a 292. Aby se stanovilo, zda tato nesmyslná mutace je geneticky asociována s malou výškou vzrůstu rodiny, provedla se rodová analýza. Zjistilo se, že všech šest jednotlivců s malou výškou vzrůstu (definovanou jako výška nižší než 2 standardní odchylky) vykazuje nenormální posun SSCP a transici cytidinu za thymidin. Ani otec, ani jedna z tet a dědeček z matčiny strany, kteří dosáhly normální výšky nevykazují mutaci, což naznačuje, že babička přenesla mutovanou alelu na její dvě dcery a na jejich dvě vnoučata. U této rodiny * 4 • ·
4 44 44
4 4 4 4 4
4 4 4 4 4 4
44444 4 444 444 • · 4 4 <4 4 ·· «4 existuje shoda mezi přítomností mutovaných alel a fenotypu vykazujícího malou výšku vzrůstu.
Stejná situace, která se popisuje shora v textu, se zjistila u jiného pacienta s malou výškou vzrůstu, který je japonského původu.
Příklad 8:
Sekvence DNA podle vynálezu se používají pro charakterizaci funkce genu nebo genů. Sekvence DNA se mohou použít jako otázky při vyhledávání bází v databázích aminokyselin a nukleových kyselin za účelem identifikace příbuzných genů nebo genových produktů. Jako otázka pro vyhledávání v databázi aminokyselin se použila částečná aminokyselinová sekvence SHOX93. Test vykazuje velmi vysokou homologii s mnoha známými proteiny homeoboxů. Sekvence cDNA podle vynálezu se mohou použít při produkci peptidu rekombinantní metodou. Při produkci proteinu rekombinantním způsobem se mohou použít různé expresivní systémy, které jsou dobře známy v oboru.
Běžnou syntézou peptidu (syntéza proteinů podle Merrifieldovy metody) se syntetizoval peptid se sekvencí CSKSFDQKSKDGNGG a podle standardního protokolu se získaly polyklonální protilátky z králíků a kuřat.
6*4 4» 4 «4 44
| 38 | 4 4 4 4 4 4 «4444 «4 4 | 4 4 4 4 4 4 | |||
| Seznam literatury | |||||
| Ashworth A., Rastan S., | Lovell- | Badge R., | Kay | G., (1991): | X- |
| chromosome inactivation | may | explain | the | difference | in |
viability of XO humans and mice. Nátuře 351: 406-408.
Blagowidow N., Page D.C., Huff D., Mennuti MT (1989): UllrichTurner syndrome in an XY female fetus with deletion of the sex-determining portio of the Y chromosome. Am. J. med. Genet. 34: 159-162.
Cantrell M.A., Bicknell J.N., Pagon RA et al. (1989): Molecular analysis 46,XY females and regional assignment of a new Y-chromosome-specific probe. Human. Genet. 83. 88-92.
ConnorJ.M., Loughlin S.A.R. (1989): Molecular genetics of Turner's syndrome.Acta Pediatr. Scand. (Suppl.) 356: 77-80.
Disteche C.M., Casanova M., Saal H., Friedman C., Sybert V., Graham J., Thline H., Page D.C., Fellous M., (1986): Smáli deletions of the short arm of the Y-chromosome in 46,XY females. Proč. Nati. Acad. Sci USA 83: 7841-7844.
Ferguson-Smith M.A. (1965) : Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. med. Gent. 2: 142-155.
Ferrari D., Kosher R.A., Dealy C.N. (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research
Communications. 205(1):429-434.
9
I 9 ·
99999 9 999 99« «
9> 9 99 99
Fischer M., Bur-Romero P., Brown L.G. et al., (1990): Homologous ribosomal protin genes in the human X- and Ychromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.
Freund C., Horsford D.J., Mclnnes R.R. (1996): Transcription factor genes and the developing eye: a genetic perspective: Hum. Mol. Genet. 5: 1471-1488.
Gehring W. J., Qian Y.Q., Billeter, Furukubo-Tokunaga K., Schier A. F., Resendez-Perez D., Affolter M., Otting G., Wuthrich K., (1994): Homeodomein-DNA recognition . Cell 78:
211-223.
Grumbach M.M., Conte F.A. ¢1992): Disorders of sexual differentation. In: Williams textbook of endocrinology, 8th edn.m edited by Wilson J.D., Foster D.W., pp. 853-952, Philadelphia, WB Saunders.
Hernandez D., Fisher E.M.C. (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.
Kenyon C., (1994) : If birds can fly, why can't we? Homeotic genes and evolution . Cell 78: 175-180.
Krumlauf R., (1994): Hox genes in vertebrate development. Cell
78: 191-201.
Lawrence P.A., Morata G., (1994): Homeobox genes: their function in Drosophila segmentation and pattern formation. Cell 78: 181-189.
F FF FF F FF FF
FFF FFF FFFF
F F · · · FFF F FF F * F FFF F FFFF · FFF FFF FFFFFF F F
FFF FF <F F FF F-F
Lehrach H., Drmnac R., Hoheisel J.D., Larin Z., Lemon G.,
Monaco A.P., Nizetic D., et al., Hybridization finger printing in genome mapping and sequencing. In Davies K.E., Tilghman S.,
Eds. Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.
Levilliers J., Quack B., Weissenbach J., Petit C., (1989):
Exchange of terminál pdrtions of X- and Y-chromosomal short arms in human XY females. Proč. Nati. Acad. Sci. USA 86: 22962300.
Lippe B.M. (1991) : Turner Syndrome. Endocrinol. Metab. Clin.
North Am. 20: 121-152. Magenis R.E., Tochen M.L. Holahan K.P.,
Carey T., Allen L., Brown M.G. (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinantns. J. Pediatr 105: 916-919.
Pohlschmidt M., RappoldG.A., Krause M., Ahlert D., Hosenfeld D., Weissenbach J., Gal A. (1991): Ring Y chromosome: Molecular characterization by DNA probes. Cytogenet. Cell Genet. 56: 65-68.
Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 41123/93.
Osenfeld R.G. (1992): Turner syndrome: a guide for physicians.
Second edition. The Turner's Syndrome Sciety.
Rovescalli A.C., Asoh S., Nirenberg M. (1996): Gloning and characterization four murine homeobox genes. Proč. Nati. Acad.
Sci. USA 93: 10691-10696.
Shalet S.M. (1993): Leukemia in children treated with growth hormone. Journal o fPediatric Endocrinology 6: 109-11
Vimpani G.' Farquhar J deficiency.
| 41 | • · · 4 4 · 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 | 44 4 44 44 4 4 4 4 4 4 4 4 444 4 44 4 4 4 4444 4 444 444 4 4 4 4 4 44 4 44 44 | ||
| • / | Vimpani | A.F., Lidgard | G.P., Cameron | E.H.D., |
| w. | (1977) | Prevalence of | severe growth | hormone |
| Br. | Med. J. | 2: 427-430. |
Zinn A.R., Page D.C., Fisher E.M.C. (1993): Turner syndrome: the čase of the missing sex chromosome. TIG 9(3): 90-93.
• «» 9· 9 99 99
999 999 9 9 9 9 • · · · · 9 19 1 9 1 9 • 1 9 11 9 1111 1 111 111
199 19 19 1 9· «9
Sekvenční protokol (1)
Obecné informace:
| Navrhovatel: | ||
| (A) | JMÉNO | : Rappold-Hoerbrand, Gudrun |
| (B) | ULICE | : Hausackerweg 14 |
| (C) | MĚSTO | : Heidelberg |
| (D) | ZEMĚ: | Německo |
| (E) | ZIP: | 69118 |
(ii) Název vynálezu: Molekula nukleové kyseliny kódující polypeptidy a způsoby jejího použití.
(iii) Počet sekvencí: 16 (iv) Počítačem čitelná forma:
(A) TYP MÉDIA: disketa (B) POČÍTAČ: kompatibilní s IBM PC (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.30 EPO (2) (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DATUM PODÁNÍ: 01-10-1996 (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DAT UM PODÁNÍ: 01-10-1996
Informace o sekvenci SEQ ID NO: 1:
(i) CHARAKTERIŠTIKA SEKVENCE:
(A) DÉLKA: 60 aminokyselin (B) TYP: aminokyselinová (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární
9* ·· 4 44 44
4 4 4 4 4 4
4 4 4 « 44 4
4 · « 4 4 ···· 4 444 444 · » 4 · 4 4 4
........ ** ·’ (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 1
| Gin 1 | Arg | Arg | Ser | Au:g 5 | Thr | Aan | Phe | Thr | Leu 10 | Glu | Gin | Leu | Aan | Glu 15 | Leu |
| Glu | Arg | Leu | Phe 20 | Aap | Glu | Thr | Hia | Tyr 25 | Pro | Aap | Ala | Phe | Met 30 | Arg | Glu |
| Glu | Leu | Ser 35 | Gin | Arg | Leu | Gly | Leu 40 | Ser | Glu | Ala | Arg | Val 45 | Gin | Val | Trp |
| Phe | Gin 50 | Aan | Arg | Arg | Ala | Lya 55 | Cya | Arg | Ly3 | Gin | Glu 60 |
(2) Informace o sekvenci SEQ ID NO: 2:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 209 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon II: ET93 (v) TYP FRAGMENTU: lineární (xi) POPIS SEKVENCE: SEQ ID NO: 2
| GGATTTATGA | ATGCAAAGAG | AAGCGCGAGG | ACGTGAAGTC | GGAGGACGAG | GACGGGCAGA | 60 |
| CCAAGCTGAA | ACAGAGGCGC | AGCCGCACCA | ACTTCACGCT | GGAGCAGCTG | AACGAGCTCG | 120 |
| AGCGACTCTT | CGACGAGACC | CATTAGCCCG | ACGCCTTCAT | GCGCGAGGAG | CTCAGCCAGC | 180 |
| GCCTGGGGCT | CTCCGAGGCG | CGCGTGCAG | 209 |
(2) Informace o sekvenci SEQ ID NO: 3:
(i) CHARAKTERIŠTIKA SEKVENCE:
(A) DÉLKA: 368 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis= „exon I: G310 (xi) POPIS SEKVENCE: SEQ ID NO: 3:
• 9 • 9 • 999 • 9 k · > 9
9 » 9
I 9
9 9 9
9
| GTGATCCACC | CGCGCGCACG | GGCCGTCCTC | TCCGCGCGGG | GAGACGCGCG | CATCCACCAG | 60 |
| CCCCGGCTGC | TCGCCAGCCC | CGGCCCCAGC | CATGGAAGAG | CTCACGGCTT | TTGTATCCAA | 120 |
| GTCTTTTGAC | CAGAAAAGCA | AGGACGGTAA | CGGCGGAGGC | GGAGGCGGCG | GAGGTAAGAA | 180 |
| GGATTCCATT | ACGTACCGGG | AAGTTTTGGA | GAGCGGACTG | GCGCGCTCCC | GGGAGCTGGG | 240 |
| GACGTCGGAT | TCCAGCCTCC | AGGACATCAC | GGAGGGCGGC | GGCCACTGCC | CGGTGCATTT | - 300 |
| GTTCAAGGAC | CACGTAGACA | ATGACAAGGA | GAAACTGAAA | GAATTCGGCA | CCGCGAGAGT | 360 |
| GGCAGAAG | r | 368 |
(3) Informace o sekvenci SEQ ID NO: 4:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 58 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon III: ET45 (xi) POPIS SEKVENCE: SEQ ID NO: 4:
GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAACAAG AGAATCAGAT GCATAAAG (2) Informace o sekvenci SEQ ID NO: 5:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 89 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon IV: G108 (xi) POPIS SEKVENCE: SEQ ID NO: 5:
GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA
TGGGAGCCTT ACGGATGCCT TTCCAACAG •44 444
4» (2) Informace o sekvenci SEQ ID NO: 6:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1166 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon : Va (Xij POPIS SEKVENCE: SEQ ID NO: 6:
| GTCCAGGCTC | AGCTGCAGCT | GGAÁGGCGTG | GCCCACGCGC | ACCCGCACCT | GCACCCGCAC |
| CTGGCGGCGC | ACGCGCCCTA | cctgatgttc | CCCCCGCCGC | CCTTCGGGCT | GCCCATCGCG |
| TCGCTGGCCG | AGTCCGCCTC | GGCCGCCGCC | GTGGTCGCCG | CCGCCGCCAA | AAGCAACAGC |
| AAGAATTCCA | GCATCGCCGA | CCTGCGGCTC | AAGGCGCGGA | AGCACGCGGA | GGCCCTGGGG |
| CTCTGACCCG | CCGCGCAGCC | CCCCGCGCGC | CCGGACTCCC | GGGCTCCGCG | CACCCCGCCT |
| GCACCGCGCG | TCCTGCACTC | AACCCCGCCT | GGAGCTCCTT | CCGCGGCC^C | CGTGCTCCGG |
| GCACCCCGGG | AGCTCCTGCA | AGAGGCCTGA | GGAGGGAGGC | TCCCGGGACC | GTCCACGCAC |
| GACCCAGCCA | GACCCTCGCG | GAGATGGTGC | AGAAGGCGGA | GCGGGTGAGC | GGCCGTGCGT |
| CCAGCCCGGG | CCTCTCCAAG | GCTGCCCGTG | CGTCCTGGGA | cCC.TGGAGAA | GGGTAAACCC |
| CCGCCTGGCT | GCGTCTTCCT | CTGCTATACC | CTATGCATGC | GGTTAACTAC | ACACGTTTGG |
| AAGATCCTTA | GAGTCTATTG | AAACTGCAAA | GATCCCGGAG | CTGGTCTCCG | ATGAAAATGC |
| CATTTCTTCG | TTGCCAACGA | TTTTCTTTAC | TACCATGCTC | CTTCCTTCAT | CCCGAGAGGC |
| TGCGGAACGG | GTGTGGATTT | GAATGTGGAC | TTCGGAATCC | CAGGAGGCAG | GGGCCGGGCT |
| CTCCTCCACC | GCTCCCCCGG | AGCCTCCCAG | GCAGCAATAA | GGAAATAGTT | CTCTGGCTGA |
| GGCTGAGGAC | GTGAACCGCG | GGCTTTGGAA | AGGGAGGGGA | GGGAGACCCG | AACCTCCCAC |
| GTTGGGACTC | CGACGTTCCG | GGGACCTGAA | TGAGGACCGA | CTTTATAACT | TTTCCAGTGT |
| TTGATTCCCA | AATTGGGTCT | GGTTTTGTTT | TGGATTGGTA | TTTTTTTTTT | TTTTTTTTTT |
| TGCTGTGTTA | CAGGATTCAG | ACGCAAAAGA | CTTGCATAAG | AGACGGACGC | GTGGTTGCAA |
| GGTGTCATAC | TGATATGCAG | CATTAACTTT | ACTGACATGG | AGTGAAGTGC | AATATTATAA |
| ATATTATAGA | TTAAAAAAAA | AATAGC |
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1166 (2) Informace o sekvenci SEQ ID NO: 7:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 625 párů baží (E) TYP: nukleová kyselina (F) DRUH ŘETĚZCE: jednořetězcová
9-9
99
9 9 «9 9 9 · « 9 9
9 9 9 9
99 99 9
9 9 9 « 9 9 9
999 999
9
99 • 9 • 999 (G) TOPOLOGIE: lineární (iii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon Vb (xi) POPIS SEKVENCE: SEQ ID NO: 7:
ATGGAGTTTT GCTCTTGTCG CCCAGGCTGG AGTATAATGG CATGATCTCG ACTCACTGCA 60
ACCTCCGCCT CCCGAGTTCA AGCGATTCTC CTGCCTCAGC CTCCCGAGTA GCTGGGATTA 120
CAGGTGCCCA CCACCATGTC AAGATAATGT TTGTATTTTC AGTAGAGATG GGGTTTGACC 180
ATGTTGGCCA GGCTGGTCTC GAACTCCTGA CCTCAGGTGA TCCACCGGCC TTAGCCTCCC 240
AAAGTGCTGG GATGACAGGC GTGAGCCCCT GCGCGCGGCC TTTGTAACTT TATTTTTAAT 300
TTTTTTTTTT TTTTAAGAAA GACAGAGTCT TGCTCTGTCA CCCAGGCTGG AGCACACTGG 360
TGCGATCATA GCTCACTGCA GCCTCAAACT CCTGGGCTCA AGCAATCCTC CCACCTCAGC 420
CTCCTGAGTA GCTGGGACTA CAGGCACCCA CCACCACACC CAGCTAATTT TTTTGATTTT 480
TACTAGAGAC GGGATCTTGC TTTGCTGCTG AGGCTGGTCT TGAGCTCCTG AGCTCCAAAG 540
ATCCTCTCAC CTCCACCTCC CAAAGTGTTA GAATTACAAG CATGAACCAC TGCCCGTGGT 600
CTCCAAAAAA AGGACTGTTA CGTGG
625
B BB BB · BB BB ··· BBB BBBB • BBB B BBB B B B B
B B · B B B BBBB · BBB BBB BBBBBB B * (2) Informace o sekvenci SEQ ID NO: 8: (i) CHARAKTERISTIKA SEKVENCE:
| (A) | DÉLKA: 15577 párů baží | |
| (B) | TYP: nukleová kyselina | |
| (C) | DRUH ŘETĚZCE: jednořetězcová | |
| (D) | TOPOLOGIE: lineární | |
| (ii) | TYP | MOLEKULY: jiná nukleová kyselina |
| (A) | POPIS: /popis = „HOX93 | |
| (ix) | RYSY: | |
| (A) | NÁZEV/KLÍČ: exon | |
| (B) | POZICE: 1498..1807 | |
| (D) | JINÉ INFORMACE: /funkce = „část exonu I (G310) | |
| (ix) | RYSY: | |
| (A) | NÁZEV/KLÍČ: misc_ | |
| (B) | POZICE: 3844..4068 | |
| (D) | JINÉ INFORMACE: /funkce = „oblast pET92 (první |
část)
| (ix) | RYSY: | |||
| (A) (B) (D) část | NÁZEV/KLÍČ: misc_ POZICE: 4326..4437 | |||
| JINÉ INFORMACE: /funkce = ) | „oblast pET92 | (druhá | ||
| (ix) | RYSY: | |||
| (A) | NÁZEV/KLÍČ: misc_ | |||
| (B) | POZICE: 4545..4619 | |||
| (D) | JINÉ INFORMACE: /funkce = | „oblast pET92 | (třetí |
část) (ix) RYSY:
(A) NÁZEV/KLÍČ: misc_ (B) POZICE: 5305..5512 (D) JINÉ INFORMACE: /funkce = „část exonu II (ET93) (ix) RYSY:
(A) NÁZEV/KLÍČ: mise
44
4 4
44
4 4 4
4 4 4
444 444
4 (B) POZICE: 11620..11729 (D) JINÉ INFORMACE: /funkce (G108) (xi) POPIS SEKVENCE: SEQ ID NO: 8:
„část exonu IV
| CTCTCCCTGT | TGTGTCTCTC | TTTCTCTCTC | TCCATCTCTC | TCCGTCTTTC | CCCCTCTGTC | 60 |
| TCTTTCTCTG | TCTCCATCCC | TCTGTCTCTC | CCTTTCTCTC | TGTCTTTCCT | TGTCTCTCTC | 120 |
| TTTCTCTCTC | TCTCTCCATC | TCTCTCTCTC | CCGGTCTCTC | TCTCTCCATC | TCCCCGTCTC | 180 |
| TCCGTTTCTC | TCTCTGCCTC | TCCCTGTCTG | TCTCTCTCTT | TGTGTGTGTT | ACACACACCC | 240 |
| CAACCCACCG | TCACTCATGT | CCCCCCACTG | CTGTGCCATC | TCACACAAGT | TCACAGCTCA | 300 |
| GCTGTCATCC | TGGGTCCCCA | GGCCCCGCCG | GGGAGGAAGA | TGCGCCGTGG | GGTTACGGGA | 360 |
| GGAAGGGGAC | TCCGGGCCTC | CTGGTGCCCC | ACTTTATTTG | CAGAAGGTCC | TTGGCAGGAA | 420 |
| CCGTGACGCG | TTTGGTTTCC | AGGACTTGGA | AAACGAATTT | CAGGTCGCGA | TGGCGAGCAC | 480 |
| CGGCTTCCCC | TGAAGCACAT | TCAATAGCGA | GAGGCGGGAG | GGAGCGAGCA | GGAGCATCCC | 540 |
| ACCATGAAAA | CCAAAAACAC | AAGTATTTTT | TTCACCCGGT | AAATACCCCA | GACGCCAGGG | 600 |
| TGACAGCGCG | GCGCTAAGGG | AGGAGGCCTC | GCGCCGGGGT | CCGCCGGGAT | T CTGGCGCGGG | 660 |
| CGGAAAGAAT | ATAGATCTTT | ACGAACCGGA | TCTCCCGGGG | ACCTGGGCTT | CTTTCTGCGG | 720 |
| GCGCTGGAAA | CCCGGGAGGC | GGCCCCGGGG | ATCCTCGGCC | TCCGCCGCCG | CCGCCTCCCA | 780 |
| AGCGCCCGCG | TCCCGGTTTG | GGGACACCCG | GCCCCTTCTT | CTCACTTTCG | GGGATTCTCC | 840 |
| AGCCGCGTTC | CATCTCACCA | ACTCTCCATC | CAAGGGCGCG | CCGCCACCAA | CTTGGAGCTC | 900 |
| ATCTTCTCCC | AAAATCGTGC | GTCCCCGGGG | CGCCCGGGTC | CCCCCCCTCG | CCATCTCAAC | 960 |
| CCCGGCGCGA | CCCGGGCGCT | TCCTGGAAAG | ATCCAGGCGC | CGGGCTCTGC | GCTCCTCCCG | 1020 |
| GGAGCGAGGG | CGGCCGGACA | ACTGGGACCC | TCCTCTCTCC | AGCCGTGAAC | TCCTTGTCTC | 1080 |
• 99 99 9 99 94
999 «99 9999
9 9« 9 999 9 99 9 • 9 9 9 9 9 9999 · 999 999
9499*9 9 9
999 99 99 9 99 99
| TCTGTCTCTC | T C aGCAGGAA | AAC ± GGAGTT | TGCTTTTCCT | CCGGCCACGG | AAAGAACGCG | 1140 |
| GGTAACCTGT | GTGGGGGGCT | CGGGCGCCTG | CGCCCCCCTC | CTGCGCGCGC | GCTCTCCCTT | 1200 |
| CCAAAAATGG | GATCTTTCCC | CCTTCGCACC | AAGGTGTACG | GACGCCAAAC | AGTGATGAAA | 1260 |
| TGAGAAGAAA | GCCAATTGCC | GGCCTGGGGG | GTGGGGGAGA | CACAGCGTCT | CTGCGTGCGT | 1320 |
| CCGCCGCGGA | GCCCGGAGAC | CAGTAATTGC | ACCAGACAGG | CAGCGCATGG | GGGGCTGGGC | 1380 |
| GAGGTCGCCG | CGTATAAATA | GTGAGATTTC | CAATGGAAAG | GCGTAAATAA | CAGCGCTGGT | 1440 |
| GATCCACGCG | CGCGCACGGG | CCGTCCTCTC | CGCGCGGGGA | GACGCGCGCA | TCCACCAGCC | 1500 |
| CCGGCTGCTC | GCCAGCCCCG | GCCCCAGCCA | TGGAAGAGCT | CACGGCTTTT | GTATCCAAGT | 1560 |
| CTTTTGACCA | GAAAAGCAAG | GACGGTAACG | GCGGAGGCGG | AGGCGGCGGA | GGTAAGAAGG | 1620 |
| ATTCCATTAC | GTACCGGGAA | GTTTTGGAGA | GCGGACTGGC | GCGCTCCCGG | GAGCTGGGGA | 1680 |
| CGTCGGATTC | CAGCCTCCAG | GACATCACGG | AGGGCGGCGG | CCACTGCCCG | GTGCATTTGT | 1740 |
| TCAAGGACCA | CGTAGACAAT | GACAAGGAGA | AACTGAAAGA | ATTCGGCACC | GCGAGAGTGG | 1800 |
| CAGAAGGTAA | GTTCCTTTGC | GCGCCGGCTC | CAGGGGGGCC | CTCCTGGGGT | TCGGCGCCTC | 1860 |
| CTCGCCACGG | AGTCGGCCCC | GCGCGCCCCT | CGCTGTGCAC | ATTTGCAGCT | CCCGTCTCGC | 1920 |
| CAGGGTAAGG | CCCGGGCCGT | CAGGCTTTGC | CTAAGAAAGG | AAGGAAGGCA | GGAGTGGACC | 1980 |
| CGACCGGAGA | CGCGGGTGGT | GGGTAGCGGG | GTGCGGGGGG | ACCCAGGGAG | GGTCGCAGCG | 2040 |
| GGGGCCGCGC | GCGTGGGCAC | CGACACGGGA | AGGTCCCGGG | CTGGGGTGGA | TCCGGGTGGC | 2100 |
| TGTGCCTGAA | GCCGTAGGGC | CTGAGATGTC | TTTTTCATTT | TCTTTTTCTT | TCCTTTCCTT | 2160 |
| TTTTTGTTTG | TTTGTTTGTT | TGTTTGAGAC | AGAGTCTCGC | TCTGTCCCCC | AGGCTGGAGT | 2220 |
| GCAGTGGTGC | GATCTCGGCT | CACTGCAACC | TCCGCCTCCT | GGGTTCAAGC | GATTCTCCTG | 2280 |
| CCTCAGCCTC | CCCAGTAGCT | GGGATTACAG | GCATGCACCA | CCACGCCTGG | CTAATTTTTG | 2340 |
| TGCTTTTAGT | AAAGACGGGG | ATTCACCATG | TTGGCCAGGC | TGGTCTCGAA | CTCCTGACCT | 2400 |
| CAGGTGATCC | ACCCGCCTCG | GCCTCCCAAA | GTGCTGGGAT | GACAGGCGTG | AGGCACCGCG | 2 4 60 |
| CCCGGCCTGG | GTCCTGACGG | CTTAGGATGT | gtgtttctgt | CTCTGCCTGT | CTGCCTTGTA | , 2520 |
| TTTACGGTCA | CCCAGACGCA | CAGAGGAGCC | GTCTCCACGC | GCCTTCCCAG | CGCTCAGCGC | 2580 |
| CTGCCGGGCC | CCCGGAGATC | ACGGGAAGAC | TCGAGGCTGC | GTGGTAGGAG | ACGGGAAGGC | 264 0 |
| CCCGGGTCAG | CTCGGTTCTG | TTTCNCTTTA | AGGAACCCTT | CATTATTATT | TCATTGTTTT | 2700 |
| CCTTTGAACG | TCGAGGCTTG | ATCTTGGCGA | AAGCTGTTGG | GTCCATAAAA | ACCACTCCCG | 2760 |
| TGAGCGGAGG | TGGCCGGGAT | CTGGATGGGG | CGCGAGGGGC | CCCGGGGAAG | CTGGCGGCTT | 2820 |
| CGCGGGCGCG | TCCTAAGTCA | AGGTTGTCAG | AGCGCAGCCG | GTTGTGCGCG | GCCCGGGGGN | 2880 |
| AGCTCCCCTC | TGGCCCTTCC | TCCTGAGACC | TCAGTGGTGG | GTCGTCCCGT | GGTGGAAATC | 2940 |
| GGGGAGTAAG | AGGCTCAGAG | AGAGGGGCTG | GCCCCGGGGA | TCTCTGTGCA | CACACGACAA | 3000 |
| CTGGGCGGCA | TACATCTTAA | GAATAAAATG | GGCTGGCTGT | GTCGGGGCAC | AGCTGGAGAC | 3060 |
• 00 00 • · · 0 0
0 0 0 * 0 • · 0 0 0 0
0 0 0 0
0 0 0 0 00 ·· • · 0 · • · 0 · • 00 · · · 0
0 0
00 00
| GGCTATGGAC | GCCTGTTATG | TTTTCATTAC | AAAGACGCAG | AGAATCTAGC | CTCGGCTTTT | 3120 |
| GCTGATTCGC | AAAGTTGAGG | TGCGAGGGTG | AATGCCCCAA | AGGTAATTCT | TCCTAAGACT | 3180 |
| CTGGGGCTAC | CTGCTCTCCG | GGGCCCTGCA | TTTGGGGTGT | GGAGTGGCCC | CGGGAAATAG | 3240 |
| CCCTTGTATT | CGTAGGAGGC | ACCAGGCAGC | TTCCCAAGGC | CCTGACTTTG | TCGAAGCAGA | 3300 |
| AAGCTGTGGC | TACGGTTTAC | AAAGCAGTCC | CCGGTTTCTG | ACCGTCTAAG | AGGCAGGAGC | 3360 |
| CCAGCCTGCC | TTTGACAGTG | AGAGGAGTTC | CTCGCTACAC | ACTGCTGCGG | GCACCCGGCA | 3420 |
| CTGTAATTCA | TACACAGAGA | GTTGGCCTTC | CTGGACGCAA | GGCTGGGAGC | CGCTTGAGGG | 3480 |
| CCTGCGTGTA | ATTTAAGAGG | GTTCGCANGC | GCCCGGCGGC | CGCTTCTGNT | GGGGTTGCTT | 3540 |
| TTTGGTTGTC | CTTCNGCAAA | CACCGTTTTG | CTCCTCTNGN | AACTCTCTCT | TNCTCCCCCN | 3600 |
| TGGCCNGTNG | GACCCGGGNA | NGAGCAAAGT | GTCCTCCAGA | CCNTTTTGAA | ANGTGAGAGG | 3660 |
| AAAATAAAGA | CCAGGCCAAA | NNGACCCAGG | GCCACAGGAG | AGGAGACAGA | GAGTCCCCGT | 3720 |
| TACATTTTNC | CCCTTGGCTG | GGTGCAGAAA | GACCCCCGGG | CCAGGACTGC | CACCCAGGCT | 3780 |
| ACTATTTATT | CATCAGATCC | AAGTTAAATC | GAGGTTGGAG | GGCAGGGGAG | AGTCTGAGGT | 3840 |
| TACCGTGGAA | GCCTGGAGTT | TTTGGGNAAC | AGCGTGTCCC | CGCCGAGCCT | GGGAGCCCGT | 3900 |
| GGGTTCTGCA | AAGCCTGCGG | GTGTTTGAGG | ACTTTGAAGA | CCAGTTTGTC | AGTTGGGCTC | 3960 |
| AATTNCCTGG | GGTTCAGACT | TAGAGAAATG | AAGGAGGGAG | AGCTGGGGTC | GTCTCCAGGA | 4020 |
| AACGATTCAC | TTGGGGGGAA | GGAATGGAGT | gttcttgcag | GCACATGTCT | GTTAGGAGGT | 4080 |
| GAAACAGAAT | GTGAAATCCA | CGTTGGAGTA | AGCGTCCAGC | GCTGAATGTA | GCTCGGGGTG | 4140 |
| GGGTGGGAGG | GCCCTGGTGT | GGATCGTGGA | AGGNAAGAAA | GACAGAACAG | GGTGCTAGTA | 4200 |
| TTTACC.CCGT | TNCCCTGTAG | ACACCCTGGA | TTTGTCAGCT | TTGCAAGCTT | CTTGGTTGCA | 4260 |
| GCGGCCTTGC | CTGTGCCCCT | TTGAGACTGT | TTCCAGACTA | AACTTCCAAA | TGTCAGCCGC | 4320 |
| TTACCCTTGA | CAGCAAGGGA | CATCTCATTA | GGGCATCGCG | TGCTTCTCAT | CTGTGNCTCA | 4380 |
| GCAGGCCCNG | AGATAGG/vAN | CANGAGGGGC | NGTTGGNAGA | TGCNCACTTC | CACCAGCCCT | 4440 |
| GGGNTTGAAG | GGGANGCGAN | GGGANGACNA | CCTTTTANCT | TAAACCCCTN | GAGCTTGGTN | 4500 |
| CAGAGAGGNC | TGAATGTCTA | AAATGAGGAA | GAAAAGGTTT | TTCACCTGGA | AACGCTTGAG | 4560 |
| GGCTGAGTCT | TCTGGCCNTT | CTGACNTCCC | CCAGCAAATA | CAGACAGGTC | ACCAANCTAC ř GACCGCGTGT | 4620 |
| TGGAGATGAG | AAAGTGCCAT | TTTTGGCACA | CTCTGGTGGG | GTAGGTGCCC | 4680 | |
| GAAAAANGTG | GGAANNGGAG | AGATTTCTGN | CGCACGCGGT | TCAGCCCCCA | GGCGCGGNTG | 4740 |
| GCNGCATTCN | AGGNTACTCA | GACGCGGTTC | TGCTGTTCTG | CTGAGAAACA | GGCTTGGGGT | 4800 |
| AGGGGCTCCT | AGCTCCGCCA | GATCGCGGAG | GGACCCCCAG | CCCTCCTGCG | CTGCAGCGGT | 4860 |
| GGGGATAGCG | TCTCTCCGTA | GGCCTAGAAT | CTGCAACCCG | CCCCGGGTCC | TCCCCGTGTC | 4920 |
| CTTCCCGGGC | GTCCCGCCGG | GGATCCCACA | GTTGGCAGCT | CTTCCTCAAA | TTCTTTCCCT | 4980 |
| TAAAAATAGG | ATTTGACACC | CCACTCTCCT | TAAAAAAAAA | AAATAAGAAA | AAAAGGTTAG | 5040 |
| GTTATGTCAA | CAGAGGTGAA | GTGGATAATT | GAGGAAACGA | TTCTGAGATG | AGGCCAAGAA | 5100 |
9 9 9 9 • 99 9« • · ♦ · · • »99 · · • · 9 9 9 9 • 99 · 9 «
999 99 99 9
99
9 9 9
9 9 9
999 999
9
| AACAACGCTC | GTGCAAAGCC | CAGGTTTTTG | GGAAAGCAGC | GAGTATCCTC | CTCGGCTTTT | 5160 |
| GCGTTATGGA | CCCCACGCAG | TTTTTGCGTC | AAAGCGCATT | GGTTTTCGAG | GGCCCCCTTT | 5220 |
| CCACCGCGGG | ATGCACGAAG | GGGTTCGCCA | CGTTGCGCAA | AACCTCCCCG | GCCTCAGCCC | 5280 |
| TGTGCCCTCC | GCTCCCCACG | CAGGGATTTA | TGAATGCAAA | GAGAAGCGCG | AGGACGTGAA | 5340 |
| GTCGGAGGAC | GAGGACGGGC | AGACCAAGCT | GAAACAGAGG | CGCAGCCGCA | CCAACTTCAC | 5400 |
| GCTGGAGCAG | CTGAACGAGC | TCGAGCGACT | TTTTGACGAG | ACCCATTAGC | CCGACGCCTT | 5460 |
| CATGCGCGAG | GAGCTCAGCC | AGCGCCTGGG | GCTTTCCGAG | GCGCGCGTGC | AGGTAGGAAC | 5520 |
| GCGGGGGCGG | GGGCGGGGGG | CCCGGAGCCA | TCGCGTGGTC | CTCGGGAGCG | CACAGCACGC | 5580 |
| GTACAGCCAC | CTGCGCCCGG | GCCGCCGCCG | TCCCCTTCCC | GGAGCGCGGG | GAGGTTGGGT | 5640 |
| GAGGGACGGG | CTGGGGTTCC | TGGACTTTTG | GAGACGCCTG | AGGGCTGTAG | GATGGGTTCA | 5700 |
| TTGCGTTTGT | TTTTCACCAA | CAGCAAACAA | ATATATATAC | ATATATATTA | TACAAATAAC | 57 60 |
| ΑΑΑΤΑΑΑΤΑΤ | ATATGTTATA | CAGATGGGTA | TATTGTATAT | ATTATAGATA | TTTGTTCGTC | 5820 |
| CTTGGTGCAA | AGACACCGGG | TGAACCCATA | TATTGGCTCC | TGACTGCCTT | CGGTTCCCCT | 5880 |
| GGGATTGGTT | ATAGGGGGAA | CACATGCAAA | CAAAACTTTC | CCTGGATTAT | ACTTAGGAGA | 5940 |
| CGAAGCTACA | GATGCGTTTG | ATGCAGAGTG | TTTTACAAGA | TTTTTCATTT | AAAAAAAAAT | 6000 |
| GTGTCTTTTG | GCCCCTGATT | CCCCTCCGTC | TTCCCGTGTG | GCTGCATTGA | AAAGGTTTCC | 6060 |
| TTAGGATGAA | AGGAGAGGGG | TGTCCTCTGT | CCCTAGGTGG | AGAGAAACAG | GGTCTTCTCT | 6120 |
| TTCCTCCGTT | TTTTCACCTA | CCGTTTCTAT | CTCCCTCCTC | CCCTCTCCAG | CCCTGTCCTC | 6180 |
| TGCTACAAAC | CACCCCCTCC | TCCCTCCGGC | TGTGGGGAGC | GCAGGAGCAC | GTTGGGCATC | 6240 |
| TGGATGAGCG | GNAGACTATT | AGCGGGGCAC | GGGGGCTCCC | cgaggagcgc | GCGAATTCAC | 6300 |
| GCTGCCCCAT | GAGACCAGGC | ACCGGGGGGC | GGAGGGGCCT | TGGGTGTCCG | CAGAGGGACG | 6360 |
| GGCGGGCAGA | GCCTTCCTCC | GCATTCTAAA | CATTCACTTA | AiAGGTATGAG | TTTANTTTCA | 6420 |
| GGGGTGCTGC | TGGGAGAGCC | TCCAAATGGC | TTCTTCCAGC | CCCTGCCTGA | CAGTTCAGCT | 6480 |
| CCCCTGGAAG | GTCAACTCCT | CTAGTCCTTT | CTCCTGGTTC | TGGGCAGGAC | AGAAGTGGGG | 6540 |
| GGAGGGAGAG | AGAGAGAGAG | AGAGAGAGAG | ACGGTCAGGA | TCCCCGGACC | CTGGGGAACC | 6600 |
| CGTCAAAAAT | AAATGZvAATT | AAGATTGCCG | ACCAGAG/aGA | GAACCGTGAC | AAAGCAAACG r | 6660 |
| GCGTTCAAAG | CAAAGAGACG | AACTGAAAGC | CCGTTCCCGT | AGGACTGGTT | ATGAGGTCAA | 6720 |
| CACATTCAAA | CACAGCTTGC | TCTGGATTTT | GCTGAGCAGA | GGAAGATACA | GATGCATTTG | 67 80 |
| ATCCAAAGTG | TGTTACATCT | TTCATTATAT | GTGTGTCTAT | ATATATAAAC | ATATATAAAT | 6840 |
| ATATAAACAT | ACATAAATGT | ATGTAAATAT | ATATAATCTA | TATACATATA | ΤΑΑΑΤΛΤΑΤΑ | 6900 |
| AACACATATA | TAATATATAA | ATCTATAAAC | ΑΤΑΤΑΤΛΑΤΑ | TATAAACATA | AATATATAAA | 6960 |
| CATATATAAT | ATATAAATAT | ATTAACATAT | ATAAAATATG | ΤΑΤΛΑΑΤΑΤΑ | TATAAACATA | 7020 |
| TAAACATATA | ΤΑΑΑΤΛΤΑΤΑ | AACATATAAA | TATATAAACA | ΤΑΤΛΤΑΑΑΤΑ | TATACAAACA | 7080 |
• 44 ··
4« 4 · ·
4444 4 ·
4 4 4 4 4
4 4 4 4
444 44 ·· '·»>
4 4 4
4 4 4
444 444
4 4
44 4 4 • · 4444
| TATTGTATAT | ATATAAATAT | ATATAAAAAC | ATATATATAC | ATATAAAAAT | ATATATAAAC | 7140 |
| ATATATACAT | ATAAAGAAAT | ATATATAAAC | ATATATACAT | ATAAATATAC | ATATATAAAC | 7200 |
| ATATATATAC | ATAAAATATA | TATAAACATA | TATACATATA | AAAATATATA | TATATTAACA | 7260 |
| TATATATACA | TATAAAAATA | TATATATTAA | CATATATATA | CATATAAAAA | TATATATATA | 7320 |
| TTTTTGGCCC | CTGATTCCCT | TCGGTTCCTG | TGGGATGGGT | GATTGAGTCA | ACACATTCAA | 7380 |
| ACACAACTTT | TCCATCGATG | TTGCTTAGGA | GATGAGGATA | CAGATGCGTT | TGATGGAGAG | 7440 |
| GGTTTTACAA | GCTCTTTCAT | TTAAATATAT | ATATATATAT | ATATATATTT | TTTGGCTCCT | 7500 |
| GATTCTCTTC | CGTCTTCCCA | TGTGGCTGCA | TTTTAAAAGG | CTTCCCTAAG | ATCGTTACGA | 7560 |
| TTAAATCAAC | CCTCCCCAGG | CATCTTTACC | GAGGGCTGTG | GTCCCCAAAG | CGATACAGCC | 7620 |
| CAGGAGGGAG | AGAGGCTTTG | GTGACTTGGA | GGAAGGACTG | TGTCCCTCCT | TAGGGCGTCT | 7680 |
| GTGGCCTCAG | TGAGGGAAGG | AAGCTGCATC | AGACAGGGGT | TTCCTCGCTG | TCCACCCCTC | 7740 |
| TGGGAGAAGA | TGGATTGGGC | TGCCCCGNTA | TAAATTAATG | AAAAGATTAA | AGTTTCGCTA | 7800 |
| AAGGGGACAT | CGAGTTTATG | TGTCATCTCC | TGGTGNTCTG | TGTGCCNTGG | GATNCTGCAA | 7860 |
| TATATCCCAN | NGCCCTTGAT | GNNNTACTGT | TTNCTATAAA | ΑΑ1ΊΝΤΑΑΑΤΝ | TACTTGTNNA | 7920 |
| ATTTAANTTC | CNNNACACTA | TTTNCTTTCC | NNGTNAGTCT | NATTANCCGA | NCGAGAGCAN | 7980 |
| CGNTTAGTTN | CAGCTNGCGG | AAAATTGGTT | GTGGGGTGTG | TGCGGACCCC | NGAGNAACGC | 8040 |
| CCNNTAAAAT | NAAAGACAAA | NTCNGGGGAC | AAGNCTNGGG | GGTTATCGNN | ATTGCNNAGG | 8100 |
| GGTCGNCATG | AAAANTTTAA | CGACGGTAAA | TAATAATAAA | AANNCAAACA | TGGGAATGNC | 8160 |
| AATAAAAGAC | ATAATTCTCC | NNATCSCCGC | GG<jvjtG\jAAAG | GATCCTATAG | TAAAGGCGAG | 8220 |
| TGCGCTTTGA | GGGGTCATAA | AAATCAATTA | GTTCCAACAC | CCACGTCCCG | CGTTGAGGGG | 8280 |
| acggggacga | GCAGGGACAG | AAAAAGAAAC | CATATTTGAA | TCCCATCTCT | CTGTGAATTC | 8340 |
| TTGGGTCACA | TGCGTCTCAG | TACAGCCCGT | CCCGTGCTGT | GACCGGATAG | AGTTTCAATT | 8400 |
| TACTGTGGAA | ATTTGCTGTA | AATAAATTGA | GCATCCGATA | GAAGCTGŤTG | CTGATTAACC | 8460 |
| TTTTATTTTT | AGCGTGGCCC | TGCAAAGTCG | TATCACCCAG | CTGTCAGGCT | TCTAATCGAA | 8520 |
| AGTTATGAGA | CC.ACGGTGAG | GGGCAGGCGG | ΤΑΑΤΪΤΑΑΤΤ | ACAACAAATA | TCTTTGGGTT | 8580 |
| TATGGCGCAG | AGCTAAATTA | AATGTCATTA | TTCACTGTCT | GTNAATGGNA | AATCAAAANN r TTTAATNGAA | 8640 |
| GGAAATCGCA | NTTACGGNCA | TTTGGGNNAA | ANGAAAGCGG | GGNAGTGCTC | 8700 | |
| NNGAAATAAC | TGTCTTAAGC | AGTGTCACAC | ACTTCACTTA | CCATATTCGN | GGCCTNAATT | 8760 |
| GGAANNTGGA | TCGTNNGAAT | CACTCCNAAG | ACTNGATTTA | TTANGCGCTT | CACGNCAGCN | 8820 |
| NGGCNTAATT | CATCNACTTN | NGTATTCTTC | ATCNNNNATT | TTTTTTTTTC | CTCTCNNGCC | 8880 |
| GTGTTNNGAA | GGGAGAGTGA | ATGAGGCTTT | CCACGTTTCA | GGAGGATTTT | CTTTTTTGAA | 8940 |
| AAATGCCCTT | CCAGAGGCTT | TTGGGTGGCT | GGCTTGCTTT | CTGGGCCCTG | GAGGANGACA | 9000 |
| GGCGGANGAG | TCCAGGTGGG | CATGGAGAGG | CACAGTGGCA | GGTCACCTGG | ATGGTCAGTG | 9060 |
| GAGGTGGAGG | TCTGAAGGCG | CCAGCTTTGG | AAATTATTGG | TGAATTTCGA | TGTCAGCACC | 9120 |
• ·4 ·
• 444 ·· r ·
4 4
444 44 ♦
4
4
4 • · 4444 • 4
4
4
444
4
4
444
| AGGNCAGGGG | CCTTTTTGGC | GGGGGTGTGA | GGGANGGATG | ANCTTTGCTG | GGAAANNCAG | 9180 |
| GATCAGGTTC | TCCAGGCGCA | CTGCAGCCCG | GTAGGACCCA | CTTTGGAAAT | GAAAAGCCAG | 9240 |
| TTNCCGAAAG | CTGGGCTGGA | AGCTTCCGTG | TTGGGTTCAA | GAGCAAGTTC | ACGTTGCGCT | 9300 |
| GTGTAGACTC | CTGGCTGCTC | CCAAACTCTG | AGGGTTTTCT | GAGGTTCCCT | TCATAGGGGC | 9360 |
| ACCGGCCCTG | GGCCATGCAC | AGTGCGTAAG | GGTGGCTGTG | GGCCGAGGGA | CCCAGCACGT | 9420 |
| GTTTTGCCCA | CAACAGCCGG | AGTGACTGGT | TCACTCACCG | CCTTGGCGGA | GGACGCCTGT | 9480 |
| TCTCTGGACG | AATCATTTCT | CTTGGGTGGT | GACTGCCTTG | TGGGTCAAGG | TGCAGGTTTT | 9540 |
| CTGCCACAGA | AAACCTGTTA | GGAGGAATTA | AGCGACTAAG | ACTGTCAGGG | AGGTGGTGGT | 9600 |
| GGGGGANGAG | GNAGGGGGTG | GTGTCCAGAT | TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | 9660 |
| TCCAGCTGGT | CTGTCTGTGG | AGGAGGGGAT | TGTCAATACT | GGGAGAGCAG | AGGAGGCTCG | 9120 |
| TAGGAGGTGA | GAGGGGGTGG | AATTTGCATG | CAAATCTTCA | CATGAGGCCT | GTGTGAATTT | 9780 |
| CTCCAGCCTC | CTGAGGGTCC | CCTGCGCTAT | TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | 9840 |
| GACTCAGAAG | TCCTTAGAGG | GGCAGAATGC | CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | 9900 |
| TCCTCAGGAC | CCTTGGTCAT | GAATGGGACC | CTTTCATGTA | TGGGGACCCT | TGGTAATATG | 9960 |
| AATGGGACGC | CTTCAGCTCC | CCAGGGCTTC | CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | 10020 |
| CGAGGAGGCC | GAGAAGGGCA | AAGACATTTT | CTGGGCTTGG | TGTGTCAAGA | GCTAGATTGG | 10080 |
| AGAAGGGGCT | GGATTTGGAA | CTCTTTAGCC | ATCAGCTCAC | CCTCTCCGTT | TGTGGCTAAA | 10140 |
| GTCTGAAGGT | GGAAACTTCG | GTTCTCCTAC | AGGGTCTACA | GGAGTTGGGG | GGCGGGGCGC | 10200 |
| CCACACAGAA | CGCTGGAAAG | TTCGACAGTC | CACTTCCACT | GGCTCGGAAC | TCACTTTTTC | 10260 |
| ACCTTAAGTT | CATCAGCGGT | AACGCATAGG | TCTCACTTAG | GCAGGGCACG | GATGATTTAA | 10 320 |
| CAATTTCTAC | TTCTAGGTCA | GGTGCGGTGG | CTCACACCTC | TAATCCCAGC | ACTTTGGGAG | 0380 |
| GCCCAGGAGG | GTGGATCGCT | TGAGGTCAGG | AGTTTGAGAC | CAGCCTGGCC | AACATGGTGA | 10440 |
| AACCCCGTCT | CTACTAAAAT | ACGAAAATTA | GCCAGGCATG | GTGGTGAGCA | CCTGTAATTC | 10500 |
| CAGCTACTCG | GGAGGCTGAG | GCAGGACAAT | CGCTTGAACC | TGGGAGGTGG | ACGTTGCAGT | 10560 |
| GAGGTGAGAT | CACACCACTG | CACTCCAGCC | TGGATGAGAG | AGCAAGACTC | TGTCTCAAAA | 10620 |
| ACAAAATAAA | ACAAAAACAA | AACAAAAATC | AAAAAAGAAA | ACCCAATTTC | CAGTTCTAGG | 10680 |
| CCAGGTGCAG | TGGCTCACGC | CTGTCATCCC | AGCACTTTGG | GAGGCCCAGG | AGGGTGGATC | 10740 |
| GCTTGAGGTC | AGGAGTTCGA | GACCAGCCTG | GCCAACATGG | TGAAACCCCA | TCTTTACTAA | 10800 |
| AAATACAAAC | GTTAGCTGGG | TGTGGTGGTG | TGCGCCTGTA | ATCCCAGCTA | CTCGGGAAGC | 10860 |
| TGAGGCTGGA | GAATTGCTTG | AATCTGGGAG | GTGGAGGTTG | CAGGGAGGCG | AGATAGTGCC | 10920 |
| ACTGCAGTCC | AGCCTGGACC | AGAGAGCAAG | ACTCCGTCTC | AAAAACAAAA | GAAAGCAAAA | 10980 |
| ACAAAAAACA | AGAGACCAGC | CTGGCCAACA | TGGTGAAACC | GCGTCTTTAC | TAAAATACAA | 11040 |
| AATTAGCCGG | GCATGGTGGT | GGGCACCTGT | AGTCCCAGCT | ACTCGGGAGG | CTGAGGCAGG | 11100 |
• φ • φ
| 54 | Φ | 1 Φ Φ Φ · · · | • | |||
| AGAATGGCTT | GAACCTGGGA | GGTGGAGCTT | GCAGTGAGCC | GAGATAGTGC | CACTGCACTC | 11160 |
| CAGCCTGGGC | GACAGAGCGA | GACTTGATTT | CAGAACCACC | ACCACCACAA | CAAAACAAAA | 11220 |
| CAAAAAATCC | AAAAAAACCC | CAATTTCCAG | TAGTAGGTAG | TCAGTGATGC | AGGGCTGGAG | 11280 |
| ACAGAGGGGC | GGTAAGTGTC | TGGGCGCCCA | CCATCAGTCA | CCTCCCAGCT | CCCANGAGGT | 11340 |
| GCAAAGTGCT | TGGTTCAGCC | TCATGGGAAG | GATGCTCCCT | GGGGAGGCTG | GGCTGGGTTC | 11400 |
| ACAGGGCTCT | TCACATCTCT | CTCTGCTTCT | NCCCCAAGGT | TTGGTTNCCA | GAACCGGAGA | 11460 |
| GCCAAGTGCC | GNCAAACAAG | AGAATCAGAT | GCATAAAGGT | GGGTGTCGGG | ACTGGGGGGA | 11520 |
| CCTGAAGCTG | GGGGATCCTG | GTCCAGGAGG | GATGGGGTCG | ACAAGGTGCT | GGCTACACCC | 11580 |
| AGGACCACCA | CACTGACACC | TGCTCCCTTT | GGACACAGGC | GTCATCTTGG | GCACAGCCAA | 11640 |
| CCACCTAGAC | GCCTGCCNGA | GTGGCACCCT | ACGTCAACAT | GGGAGCCTTA | CGGATGCCTT | 11700 |
| TCCAACAGGT | AGCTCACTTT | TTCTTCCTCT | GNAAGATCCC | TAGGGACCTG | CTGCTCCCTT | 11760 |
| CCCCTTTCCC | CTATTTGCTG | CCGCATCGTG | ACACTCCTAG | TCCCTCCCTG | CCCCTGCAGA | 11820 |
| CTTCTCAGCT | GGCCCTTAGA | AAAAAAGCCT | CTTTTCCGAG | GAGGCATTTA | CAGGCACCTT | 11880 |
| GGCACCTATG | AAATCAGGCT | GGGCCAGGCG | GGGTGGCTCA | CACCTGTCAT | CCCAGCACTT | 11940 |
| TGGGAGGCCA | AGGTTAGGAG | TTTGAGACCA | GCCTGGACAA | CATAGCAAAA | GCCTGTCTCT | 12000 |
| ACTAAAAATA | CAAAAAAAAA | TTAACAGGGA | GTGGTGGTGG | GCACCTGTAA | TCCCAGCTAC | 12060 |
| TTGGGAGGCT | GAGGCAGGAG | AATCACTTGA | ACCCGGGAGG | CCGAGGTTGC | GGTGAGCCGA | 12120 |
| GATCGTGCCA | TTGCACTCCA | GGCTGGGCGA | CAGAGTGAGA | CTCTGTCTCA | AAAAATAAAT | 12180 |
| ΑΑΑΤΛΛΑΤΑΛ | ATGTAAAAAA | ATAAAAATAG | GTCGGGCACG | GTGGCTCACG | TCTGTAATCC | 12240 |
| CAGCACTTTG | GAAGGCCGAG | GTGGGTGGAT | GACAGGGTCA | AGAGATTGAG | ACCATCCTGG | 12300 |
| CCAACATGGC | AAAATGCCGT | CTCTACTAAA | AAATACAAAA | ATTAGGCGGG | CGTGGTGGCG | 12360 |
| .GGTGCCTGTA | ATCCCAGCTA | CTCGGGAGGC | TGAGGCAGGA | GAATCGGTTG | AACCCGGGAT | 12420 |
| GCGGAGGTTG | CAGTGAGCGG | AGATCACATC | ACTGCACTCC | AGGCTGGGCA | ACAAGAGCGA | 12480 |
| AACTGCGTCT | TACAATAAAT | AAATAGATAA | ATAAATAAAC | AAATAAACTT | TACTTTAGAA | 12540 |
| ACAAATCCCT | GTCCGTGTTT | GTCTTTTCAC | CTGTCCTGCA | GGGAAAACAA | AACATAAAAT | 12600 |
| GTCAAGGCAA | ATAGTAGTG/3 | TTTCATTCCG | GGAAAAAGAA | AGTGGATGTT | TGCCTTCACC | 12660 |
| ctttctcgtc | CTTCCTCTGG | TGCTCCTCAN | GGCCCANGGG | NAGAGGGTGG | AAAGTNCAGA | 12720 |
| GGAAGAAAGA | CGGGGCTGGG | GGGGGGGGTC | CGTGGGGACC | CAGGCAGGCA | TGTTCCCNAT | 12780 |
| TTCCNTGTCT | TCACNTTCAA | AGNAGGGGCC | CCTCGNCTCT | GGAATGAGGC | CTACGGTTTC | 12840 |
| CTTTCCCNGA | AGAGTTNCCC | CTTTGTGAGC | TTACGGCTTC | GGAGTGAACC | TCGGTGCAAC | 12900 |
| CTGTTATTAA | AACACACAGA | GGCTAATGCC | AGCAAAAACA | CGCCCCCCGC | TCCTGGTTTC | 12960 |
| AGAGGGAAGA | AAAAAATTCA | TAAGCACGGC | CATGCTTTTC | TAATAAAAAT | TCATTAAATA | 13020 |
| ATCGTTATAA | GGGATGAAGC | CGGGAGGGGA | GAGGAGAGGA | ACACAATCAA | GAGACTTTCT | 13080 |
TTGAACTTTT TCTCCCTGCT TCAAATACAA AGCAATCTTC TGTGGGCCTG GGCCTGGGGG 13140 • ·
| GTTTCCCCCT | TTCTCTGCAG | CCCATTGGGA | GGAAGAAAAT | GCTTCCCTGA | ANGTTGCTGC | 13200 |
| AAAATTGTTT | CTGTTTTTCT | TTTCTTTTTC | TTTTTTTTTT | TTTTTTGAGA | CGGAGTCTCG | 13260 |
| CTCTGTCACC | AGGCTGGAGT | GCAATGGTAT | GATCTCAGCT | CACTGCAACC | TCCACGTTCC | 13320 |
| TGTTTCAAGT | CATTCTCCTG | CCTCAGCCTC | CTGAGTAGCT | GGGACTACAG | GCGCCCGCCA | 13380 |
| CCACGCCCGG | CTAGTGTTTG | TATTTTTAGA | AAAGACAGGG | TTTCCCCATG | TTGGCCAGGC | 13440 |
| TGGTCTTGAA | CTCCTGTCCT | CAAGTGATCT | GCCTGCCTCG | GCCTCCCAAA | GTGCTGTGTT | 13500 |
| TCTGTTTTTC | TTTCCCCGCT | TTCTTAGGAG | GCCATCGGGA | AGAATAAAAT | GCTTTCCTTG | 13560 |
| AAGTTGATGC | AAAATTGTTT | CTGTTTTTCT | TTTCTCTTTT | CTTTCTTTTT | GAGATGGAGT | 13620 |
| CTCGCTCTTT | CACCCAGGCT | GGAGGGCAGT | GGCGCGACCT | CGGCTCACTG | CAACCTCCGC | 13680 |
| CTCCCGGGTT | CAAGCGATTC | TCCTGCCTCA | GCCTCCGGAG | TAGCTGGGAT | TACAGGCACC | 13740 |
| TGCCAGTATG | CCTGGCTAAT | TTTATTATTT | TTAGTAGAGA | CGGGGTTTCA | CCATGTTGGC | 13800 |
| CAGGCTGGTC | TCAAACTCCT | GACCTCAGGT | GATCCGCCCG | CCTCGCCTCC | CAAAGTGATG | 13860 |
| GGATGANCAG | GNCATNGAGC | NCACCGTGCC | CGGCCCTCTA | ACTCTTTACC | AGACATAAAG | 13920 |
| TCTCCNNTTC | CCCTTTCTAA | ATGTATATAT | TGTGTTTTTA | AAAGTTAACA | GCAGGGATCC | 13980 |
| CACCTCATTN | CCCCGCTNCT | CTCCCCAAGA | CCTGTCCTGC | ACGTTGCACA | CAGCAGGTGT | 14040 |
| GCCCTGGACA | TATCCCAAAC | CCACGCTGAA | AGAAAGAGGG | TCTCACTACA | CGTATGATAT | 14100 |
| CTGTGNATCC | TTTAAACATC | TCCGTGGCTT | CCAGGCAACA | CAGCCATAAA | TAGGAATCTC | 14160 |
| ATGTCTGACA | TGATACCGGG | ACCATGTATG | GGNAAATTCT | GGGTGTGAAG | TTCCAGCTAC | 14220 |
| CCCCGCAGAG | GCANCCATTG | CATACCCTCC | AGAAACTCCC | CTGCCGTTNC | AAGCCAAAGA | 14280 |
| CACAACACAA | ACAGCNTCCG | AGAGAGGGTG | TCATTGAAAA | TCAATACCAT | CATAAGAGCA | 14340 |
| CACAGCACCG | TCTTTCTCTT | CTGCCCGTTG | ATACACAATT | ATGAGCAATT | TGCTAACACT | 14400 |
| GACAACTCGT | GGCAAGAACA. | GGTCGTGTTG | ATACGGTTGC | CTCGTGAGGA | CCCATCTGTC | 14460 |
| TTCTGGGGTC | TTGCCTGGAA | CGGAGATCGG | AGTTCAGGGT | GGCTAATAGA | ATCATTACTC | 14520 |
| ACCTAGGGAC | ACAGAATNAT | GAGGGTTACC | CCCAGTTAAG | TGCATACAGT | CAAACGGACG | 14580 |
| GCTGCTCTGG | AAGGTACAGT | GACGTGAACA | GCTTTTATGA | AATGCCTAGA | TCTGGACCTT | 14 640 |
| CCATACCTGA | GCCACCGTTC | CAAAGCACTG | GGCGTTTTTC | AGATACTTTC | ATGAGAA7ÝTG | 14700 |
| TTGTCAACAC | CGCAAGTTTG | CAGTACACAG | TCTGAAAGAT | ATTCTTGTAT | ATGTAGATGT | 14760 |
| CTGTAGATGC | CCTGAAGGTG | TGTAGACTTT | AGACACCCAG | AAGGTGTGTA | GATGTCTGTA | 14820 |
| GACACCTTCT | ATGTGTGTAG | ATGTCTGTAG | ACGCCCTGCA | GGTGTGTAGA | TATATCTAGA | 14880 |
| TGGTCTGCCT | GTGTATGATA | CACGCTAAAA | AGACATTTGT | GGTGGACACT | AGTTGATTAT | 14940 |
| TTAGGACTAT | GAGATGGGAA | AGGAAGNAGC | AACCAGCAGT | GAAAGGCATG | TGGTGGGTGG | 15000 |
| GGGGTTGGCA | TTGCAGTGGG | GTCCTCNTGA | NGCAGGTGAC | ACCCACTATA | GGGCTGCCCT | 15060 |
| TGGNATGGAC | gctttgtnga | AGCTGTTTGA | TTTCACCACA | CCAAGCCTGG | AGGCACGGAC | 15120 |
| 56 | • · 9 · • · · · * • · « · « • » · « • · · · · | • » • · · • · · · · • · • · « | ||||
| ATTCCAGGAT | GGTGAGGAGT | CTGCAAAGGA | GGAGATTGGA | GGAGGTG£AA | TATCCCTAGA | 15180 |
| GTACGAGAGA | TGAGATAGGA | GAGCTGTATA | AATAGCACTA | CCAGCCGGAT | GCGGTGGCTC | 15240 |
| ACGCCTGTCA | TCCCAGCAGT | TTAGGAGGCT | GAGGCAGGCG | GATCACCTGA | GGTCAGGAGT | 15300 |
| TCCAGAACAG | CCTGGCCAAC | ACAATGAAAC | CCGATCTTTA | CTAAAAATAC | AAGATTAGCT | 15360 |
| GGGCACGGTG | TCTCACGCCT | GTCATCCCTG | CACTTTGGGA | GGTCGAGGTG | CGOAGATCAT | 15420 |
| GAGGTCAGTT | TGGCCAACGC | GGCGAAACCC | CGTCTCTACT | AAAAATACAA | AAAAGTAGCC | 15480 |
| GGGCGTGGTG | GTGGGCACCT | GTAGTCCCAG | CTACTAGGGA | GGCTGAGGCA | GGAGAATCGC | 15540 |
| TTGAACCCGG | ATGCGGACAT | TGCAGTGAGC | CGAGATC | 15577 |
(2) Informace o sekvenci SEQ ID NO: 9:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 753 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „segment genu ET92 (xi) POPIS SEKVENCE: SEQ ID NO: 9:
| CGTGGAAGCC | TGGAGTTTTT | GGGAACAGCG | TGTCCCCGCC | GAGCCTGGGA | GCCCGTGGGT | 60 |
| TCTGCAAAGC | CTGCGGGTGT | TTGAGGACTT | TGAAGACCAG | TTTGTCAGTT | GGGCTCAATT | 120 |
| CCTGGGGTTC | AGACTTAGAG | AAATGAAGGA | GGGAGAGCTG | GGGTCGTCTC | CAGGAAACGA | 180 |
| TTCACTTGGG | GGGAAGGAAT | GGAGTGTTCT | TGCAGGCAGA | TGTCTGTTAG | GAGGTGAAAC | 240 |
| AGAATGTGAA | ATCCACGTTG | GAGTAAGCGT | CCAGCGCTGA | ATGTAGCTCG | GGGTGGGGTG | 300 |
| GGAGGGCCCT | GGTGTGGATC | GTGGAAGGAA | GAAAGACAGA | ACAGGGTGCT | AGTATTTACC | 360 |
| CCGTTCCCTG | TAGACACCCT | GGATTTGTCA | GCTTTGCAAG | CTTCTTGGTT | GCAGCGGCCT | 420 |
| TGCCTGTGCC | CCTTTGAGAC | TGTTTCCAGA | CTAAACTTCC | AAATGTCAGC | CCCTTACCCT | 480 |
| TGACAGCAAG | GGACATCTCA | TTAGGGCATC | GCGTGCTTCT | CATCTGTGCT | CAGCAGGCCC | 54 0 |
| GAGATAGGAA | CAGAGGGGCG | TTGGAGATGC | CACTTCCACC | AGCCCTGGGT | TGAAGGGGAG | 600 |
| CGAGGGAGAC | ACCTTTTACT | TAAACCCCTG | AGCTTGGTCA | GAGAGGCTGA | ATGTCTAAAA | 660 |
| TGAGGAAGAA | AAGGTTTTTC | ACCTGGAAAC | GCTTGAGGGC | TGAGTCTTCT | GCCCTTCTGA | 720 |
CTCCCCCAGC AAATACAGAC AGGTCACCAA CTA
753 • · • · (2) Informace o sekvenci SEQ ID NO: 10:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1890párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOXa (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..968 (xi) POPIS SEKVENCE: SEQ ID NO: 10:
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
5
| TCC Ser | AAG Lys 10 | TCT Ser | TTT Phe | GAC CAG AAA | AGC AAG GAC | GGT Gly | AAC Asn 20 | GGC Gly | GGA Gly | GGC Gly | GGA Gly | 162 | ||||
| Asp | Gin | Ly3 15 | Ser | Lys | Asp | |||||||||||
| GGC | GGC | GGA | GGT | AAG | AAG | GAT | TCC | ATT | ACG | TAC | CGG | GAA | GTT | TTG | GAG | 210 |
| Gly 25 | Gly | Gly | Gly | Lys | Lys 30 | Asp | Ser | Ile | Thr | Tyr 35 | Arg | Glu | Val | Leu | Glu 40 | |
| AGC | GGA | CTG | GCG | CGC | TCC | CGG | GAG | CTG | GGG | ACG | TCG | GAT | TCC | AGC | CTC | 258 |
| Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu | Leu | Gly 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | |
| CAG | GAC | ATC | ACG | GAG | GGC | GGC | GGC | CAC | TGC | CCG | GTG | CAT | TTG | TTC | AAG | 306 |
| Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly | His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | |
| GAC | CAC | GTA | GAC | AAT | GAC | AAG | GAG | A7A | CTG | AAA | GAA | TTC | GGC | ACC | GCG | 354 |
| Asp | His | Val 75 | Asp | Asn | Asp | Lys | Glu 80 | Lys | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | |
| AGA | GTG | GCA | GAA | GGG | ATT | TAT | GAA | TGC | AAA | GAG | AAG | CGC | GAG | GAC | GTG | 402 |
| Arg | Val 90 | Al a | Glu | Gly | Ile | Tyr 95 | Glu | Cys | Lys | Glu | Lys 100 | Arg | Glu | Asp | Val | |
| AAG | TCG | GAG | GAC | GAG | GAC | GGG | CAG | ACC | AAG | CTG | AAA | CAG | AGG | CGC | AGC | 450 |
| Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin | Thr | Lys | Leu 115 | Lys | Gin | Arg | Arg | Ser 120 | |
| CGC | ACC | AAC | TTC | ACG | CTG | GAG | CAG | CTG | AAC | GAG | CTC | GAG | CGA | CTC | TTC | 498 |
| Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin | Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | |
| GAC | GAG | ACC | CAT | TAC | CCC | GAC | GCC | TTC | ATG | CGC | GAG | GAG | CTC | AGC | CAG | 546 |
| Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala | Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin r | |
| CGC | CTG | GGG | CTC | TCC | GAG | GCG | CGC | GTG | CAG | GTT | TGG | TTC | CAG | AAC | CGG | 594 |
| Arg | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 | Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | |
| AGA | GCC | AAG | TGC | CGC | AAA | CAA | GAG | AAT | CAG | ATG | CAT | AAA | GGC | GTC | ATC | 642 |
| Arg | Al a 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu | Asn | Gin | Met | His 180 | Lys | Gl y | Val | I le |
• · • · >
690
TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC Leu Gly Thr Ala Aan His Leu Asp Ala Cys Arg Val Ala Pro Tyr Val 185 190 195 200
AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG GTC CAG GCT CAG CTG Asn Met Gly Ala Leu Arg Met Pro Phe Gin Gin Val Gin Ala Gin Leu
738
| 205 | 210 | 215 | ||||||||||||||
| CAG | CTG | GAA | GGC | .GTG | GCC | CAC | GCG | CAC | CCG | CAC | CTG | CAC | CCG | CAC | CTG | 786 |
| Gin | Leu | Glu | Gly | Val | Ala | His | Ala | His | Pro | His | Leu | HÍ3 | Pro | His | Leu | |
| 220 | 225 | 230 | ||||||||||||||
| GCG | GCG | CAC | GCG | CCC | TAC | CTG | ATG | TTC | CCC | CCG | CCG | CCC | TTC | GGG | CTG | 834 |
| Ala | Ala | His | Ala | Pro | Tyr | Leu | Met | Phe | Pro | Pro | Pro | Pro | Phe | Gly | Leu | |
| 235 | 240 | 245 | ||||||||||||||
| CCC | ATC | GCG | TCG | CTG | GCC | GAG | TCC | GCC | TCG | GCC | GCC | GCC | GTG | GTC | GCC | 882 |
| Pro | Ile | Ala | Ser | Leu | /Via | Glu | Ser | Ala | Ser | Ala | Ala | Ala | Val | Val | Ala | |
| 2S0 | 255 | 260 | ||||||||||||||
| GCC | GCC | GCC | AAA | AGC | AAC | AGC | AAG | AAT | TCC | AGC | ATC | GCC | GAC | CTG | CGG | 930 |
| Ala | Ala | Ala | Lys | Ser | Asn | Ser | Lys | Asn | Ser | Ser | Ile | Ala | Asp | Leu | Arg | |
| 265 | 270 | 275 | 280 | |||||||||||||
| CTC | AAG | GCG | CGG | AAG | CAC | GCG | GAG | GCC | CTG | GGG | CTC | TG ACCCGCCGCG | 978 | |||
| Leu | Lya | Ala | Arg | Lys | His | Ala | Glu | Ala | Leu | Gly | Leu |
285
290
| CAGCCCCCCG | CGCGCCCGGA | CTCCCGGGCT | CCGCGCACCC | CGCCTGCACC | GCGCGTCCTG | 1038 |
| CACTCAACCC | CGCCTGGAGC | TCCTTCCGCG | GCCACCGTGC | TCCGGGCACC | CCGGGAGCTC | 1098 |
| CTGCAAGAGG | CCTGAGGAGG | GAGGCTCCCG | GGACCGTCCA | CGCACGACCC | AGCCAGACCC | 1158 |
| TCGCGGAGAT | GGTGCAGAAG | GCGGAGCGGG | TGAGCGGCCG | TGCGTCCAGC | CCGGGCCTCT | 1218 |
| CCAAGGCTGC | CCGTGCGTCC | TGGGACCCTG | GAGAAGGGTA | AACCCCCGCC | TGGCTGCGTC | 1278 |
| TTCCTCTGCT | ATACCCTATG | CATGCGGTTA | ACTACACACG | TTTGGAAGAT | CCTTAGAGTC | 1338 |
| TATTGAAACT | GCAAAGATCC | CGGAGCTGGT | CTCCGATGAA | AATGCCATTT | CTTCGTTGCC | 1398 |
| AACGATTTTC | TTTACTACCA | 'PQ/’' 'Τ' f* c' 'Γ *Γ f* | TTCATCCCGA | GAGGCTGCGG | AACGGGTGTG | 1458 |
| GATTTGAATG | TGGACTTCGG | AATCCCAGGA | GGCAGGGGCC | GGGCTCTCCT | CCACCGCTCC | 1518 |
| CCCGGAGCCT | CCCAGGCAGC | AATAAGGAAA | TAGTTCTCTG | GCTGAGGCTG | AGGACGTGAA | 1578 |
| CCGCGGGCTT | TGGAAAGGGA | GGGGAGGGAG | ACCCGAACCT | CCCACGTTGG | GACTCCCACG | 1638 |
| TTCCGGGGAC | CTGAATGAGG | ACCGACTTTA | TAACTTTTCC | AGTGTTTGAT | TCCCAAATTG | 1698 |
| GGTCTGGTTT | TGTTTTGGAT | TGGTATTTTT | T T T T T T | TTTTTTGCTG | TGTTACAGGA | 1758 |
| TTCAGACGCA | AAAGACTTGC | ATAAGAGACG | GACGCGTGGT | TGCAAGGTGT | CATACTGATA | 1818 |
| TGCAGCATTA | ACTTTACTGA | CATGGAGTGA | AGTGCAATAT | ΤΛΤΑΑΑΤΑΤΤ | ATAGATTAAA | 1878 |
f
AAAAAAATAG CA
1890 ·· • A 9 • 9 9 9 • 9 9 • 9 9
9 9 9 9
9« 9
9
9.9
99
9 9 9 • 9 9 9 (2) Informace o sekvenci SEQ ID NO: 11:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 292 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 11:
| Met 1 | Glu | Glu | Leu | Thr 5 | Ala | Phe | Val | Ser | Lys 10 | Ser | Phe | Asp | Gin | Lys 15 | Ser |
| Lys | Asp | Gly | Asn 20 | Gly | Gly | Gly | Gly | Gly 25 | Gly | Gly | Gly | Lys | Lys 30 | Asp | Ser |
| Xle | Thr | Tyr 35 | Arg | Glu | Val | Leu | Glu 40 | Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu |
| Leu | Gly 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly |
| His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | Asp | His | Val 75 | Asp | Asn | Asp | Lys | Glu 80 |
| Ly3 | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | Arg | Val 90 | Ala | Glu | Gly | Ile | Tyr 95 | Glu |
| Cy3 | Ly3 | Glu | Lys 100 | Arg | Glu | Asp | Val | Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin |
| Thr | Lys | Leu 115 | Lys | Gin | Arg | Arg | Ser 120 | Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin |
| Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala |
| Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin | Arg | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 |
| Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | Arg | Ala 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu |
| Asn | Gin | Met | His 180 | Lys | Gly | Val | Ile | Leu 185 | Gly | Thr | Ala | Asn | His 190 | Leu | Asp |
| Ala | Cys | Arg 195 | Val | Ala | Pro | Tyr | Val 200 | Asn | Met | Gly | Ala | Leu 205 | Arg | Met | Pro |
| Phe | Gin 210 | Gin | Val | Gin | Ala | Gin 215 | Leu | Gin | Leu | Glu | Gly 220 | Val | Ala | His | Ala |
| His 225 | Pro | His | Leu | His | Pro 230 | His | Leu | Ala | Ala | His 235 | Ala | Pro | Tyr | Leu | Met 240 |
| Phe | Pro | Pro | Pro | Pro 245 | Phe | Gly | Leu | Pro | Ile 250 | Ala | Ser | Leu | Ala | Glu 255 | Ser |
| Ala | Ser | Ala | Ala 260 | Ala | Val | Val | Ala | Ala 265 | Ala | Ala | Lys | Ser | Asn 270 | Ser | Ly3 |
| Asn | Ser | Ser 275 | Ile | Ala | Asp | Leu | Arg 280 | Leu | Lys | Ala | Arg | Lys 285 | His | Ala | Glu |
Ala Leu Gly Leu 290 ·· ·· « « · · ··* ·· (2) Informace o sekvenci SEQ ID NO: 12:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1354 párů bázi (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOXb (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..768 (xi) POPIS SEKVENCE: SEQ ID NO: 12:
GTGATCCACC CGGCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
295 300
| TCC Ser | AAG Lys | TCT Ser | TTT Phe | GAC Asp 305 | CAG AAA AGC AAG GAC | GGT AAC Gly Asn | GGC Gly | GGA Gly | GGC Gly 315 | GGA Gly | 162 | |||||
| Gin | Lys | Ser | Lys | Asp 310 | ||||||||||||
| GGC | GGC | GGA | GGT | AAG | AAG | GAT | TCC | ATT | ACG | TAC | CGG | GAA | GTT | TTG | GAG | 210 |
| Gly | Gly | Gly | Gly | Lys | Lys | Asp | Ser | Ile | Thr | Tyr | Arg | Glu | Val | Leu | Glu | |
| 320 | 325 | 330 | ||||||||||||||
| AGC | GGA | CTG | GCG | CGC | TCC | CGG | GAG | CTG | GGG | ACG | TCG | GAT | TCC | AGC | CTC | 258 |
| Ser | Gly | Leu | Ala | Arg | Ser | Arg | Glu | Leu | Gly | Thr | Ser | Asp | Ser | Ser | Leu | |
| 335 | 340 | 345 | ||||||||||||||
| CAG | GAC | ATC | ACG | GAG | GGC | GGC | GGC | CAC | TGC | CCG | GTG | CAT | TTG | TTC | AAG | 306 |
| Gin | Asp | Ile | Thr | Glu | Gly | Gly | Gly | His | Cys | Pro | Val | His | Leu | Phe | Lys | |
| 350 | 355 | 360 | ||||||||||||||
| GAC | CAC | GTA | GAC | AAT | GAC | AAG | GAG | AAA | CTG | AAA | GAA | TTC | GGC | ACC | GCG | 354 |
| Asp | His | Val | Asp | Asn | A3p | Lys | Glu | Lys | Leu | Lys | Glu | Phe | Gly | Thr | Ala | |
| 365 | 370 | 375 | 380 | |||||||||||||
| AGA | GTG | GCA | GAA | GGG | ATT | TAT | GAA | TGC | AAA | GAG | AAG | CGC | GAG | GAC | GTG | 402 |
| Arg | Val | Ala | Glu | Gly | Ile | Tyr | Glu | Cys | Lys | Glu | Lys | Arg | Glu | Asp | Val | |
| 385 | 390 | 395 | ||||||||||||||
| AAG | TCG | GAG | GAC | GAG | GAC | GGG | CAG | ACC | AAG | CTG | AAA | CAG | AGG | CGC | AGC | 450 |
| Lys | Ser | Glu | Asp | Glu | Asp | Gly | Gin | Thr | Lys | Leu | Lys | Gin | Arg | Arg | Ser | |
| 400 | 4 05 | 4 10 | ||||||||||||||
| CGC | ACC | AAC | TTC | ACG | CTG | GAG | CAG | CTG | AAC | GAG | CTC | GAG | CGA | CTC | TTC | 498 |
| Arg | Thr | Asn | Phe | Thr | Leu | Glu | Gin | Leu | Asn | Glu | Leu | Glu | Arg | Leu | Phe | |
| 415 | 420 | 425 | ||||||||||||||
| GAC | GAG | ACC | CAT | TAC | CCC | GAC | GCC | TTC | ATG | CGC | GAG | GAG | CTC | AGC | CAG | 546 |
| Asp | Glu | Thr | His | Tyr | Pro | Asp | Ala | Phe | Met | Arg | Glu | Glu | Leu | Ser | Gin | |
| 430 | 435 | 440 | ||||||||||||||
| CGC | CTG | GGG | CTC | TCC | GAG | GCG | CGC | GTG | CAG | GTT | TGG | TTC | CAG | AAC | CGG | 594 |
| Arg | Leu | G1 y | Leu | Ser | Glu | Ala | Arg | Val | Gin | Val | Trp | Phe | Gin | Asn | Arg | |
| 445 | 450 | 455 | 4 60 r |
• 9
9 · 9
| AGA GCC AAG TGC | CGC AAA CAA GAG AAT | CAG ATG | CAT His | AAA Lys | GGC Gly | GTC Val 475 | ATC Ile | 642 | ||||||||
| Arg Ala Lys | Cys | Arg 465 | Lya | Gin | Glu | Asn | Gin 470 | Met | ||||||||
| TTG | GGC | ACA | GCC | AAC | CAC | CTA | GAC | GCC | TGC | CGA | GTG | GCA | CCC | TAC | GTC | 690 |
| Leu | Gly | Thr | Ala | Aan | HÍ3 | Leu | Asp | Ala | Cys | Arg | Val | Ala | Pro | Tyr | Val | |
| 480 | 485 | 4 90 | ||||||||||||||
| AAC | ATG | GGA | GCC | TTA | CGG | ATG | CCT | TTC | CAA | CAG | ATG | GAG | TTT | TGC | TCT | 738 |
| Asn | Met | G1 y | Ala | Leu | Arg | Met | Pro | Phe | Gin | Gin | Met | Glu | Phe | Cys | Ser | |
| 495 | 500 | 505 | ||||||||||||||
| TGT | CGC | CCA | GGC | TGG | AGT | ATA | ATG | GCA | TGA | TCTCGACTCA CTGCAACCTC | 788 | |||||
| Cy3 | Arg | Pro | Gly | Trp | Ser | Ile | Met | Ala | * | |||||||
| 510 | 515 |
CGCCTCCCGA GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC GAGTAGCTGG GATTACAGGT 848
GCCCACCACC ATGTCAAGAT AATGTTTGTA TTTTCAGTAG AGATGGGGTT TGACCATGTT 908
GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCAC CCGCCTTAGC CTCCCAAAGT 968
GCTGGGATGA CAGGCGTGAG CCCCTGCGCC CGGCCTTTGT AACTTTATTT TTAATTTTTT 1028
TTTTTTTTTA AGAAAGACAG AGTCTTGCTC TGTCACCCAG GCTGGAGCAC ACTGGTGCGA 1088
TCATAGCTCA CTGCAGCCTC AAACTCCTGG GCTCAAGCAA TCCTCCCACC TCAGCCTCCT 1148
GAGTAGCTGG GACTACAGGC ACCCACCACC ACACCCAGCT AATTTTTTTG ATTTTTACTA 1208
GAGACGGGAT CTTGCTTTGC TGCTGAGGCT GGTCTTGAGC TCCTGAGCTC CAAAGATCCT 1268
CTCACCTCCA CCTCCCAAAG TGTTAGAATT ACAAGCATGA ACCACTGCCC GTGGTCTCCA 1328
AAAAAAGGAC TGTTACGTGG AAAAAA 1354 (2) Informace o sekvenci SEQ ID NO: 13:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 226 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 13:
· • F FF F F · F • · F ·
FFF FFF
F F
F · ··
| Met 1 | Glu | Glu | Leu | Thr 5 | Ala | Phe | Val | Ser | Lys 10 | Ser | Phe | Asp | Gin | Lys 15 | Ser |
| Lys | Asp | Gly | Asn 20 | Gly | Gly | Gly | Glv | Gly 25 | Gly | Gly | Gly | Lys | Lys 30 | Asp | Ser |
| Xle | Thr | Tyr 35 | Arg | Glu | Val | Leu | Glu 40 | Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu |
| Leu | Gly 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly |
| His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | Asp | His | Val 75 | Asp | Asn | Asp | Lys | Glu 80 |
| Ly3 | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | Arg | Val 90 | Ala | Glu | Gly | Ile | Tyr 95 | Glu |
| Cys | Lys | Glu | Lys 100 | Arg | Glu | Asp | Val | Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin, r |
| Thr | Lys | Leu 115 | Lys | Gin | Arg | Arg | Ser 120 | Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin |
| Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala |
| Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin | Arg | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 |
| Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | Arg | Ala 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu |
| Asn | Gin | Met | His | Lys | Gly | Val | I le | Leu | Gly | Thr | Al a | Asn | Hi 3 | Leu | Asp |
| 180 | 185 | 190 | |||||||||||||
| Ala | Cys | Arg 195 | Val | Ala | Pro | Tyr | Val 200 | Asn | Met | Gly | Ala | Leu 205 | Arg | Met | Pro |
| Phe | Gin 210 | Gin | Met | Glu | Phe | Cys 215 | Ser | Cys | Arg | Pro | Gly 220 | Trp | Ser | Ile | Met |
Ala
225
4 4 4 4
4 4 ··
4444 * 4
4 4 4 4 4
4 4 4 4 4 •«•44 4 4 4 (2) Informace o sekvenci SEQ ID NO: 14:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 32367 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „kosmid: LLNOYCO3'M'34F5 (xi) POPIS SEKVENCE: SEQ ID NO: 14:
| TTTCTCTGTC | TCCATCCCTC | TGTCTCTCCC | TTTCTCTCTG | TCTTTCCTTG | TCTCTCTCTT | 60 |
| TCTCTCTCTC | TCTCCATCTC | TCTCTCTCCC | TGTCTCTCTC | TCTCCATCTC | CCCGTCTCTC | 120 |
| CGTTTCTCTC | TCTGCCTCTC | CCTGTCTGTC | TCTCTCTTTC | TGTGTCTTAC | ACACACCCCA | 180 |
| ACCCACCGTC | ACTCATGTCC | CCCCACTGCT | GTGCCATCTC | ACACAAGTTC | ACAGCTCAGC | 240 |
| TGTCATCCTG | GGTCCCCAGG | CCGCGCCGGG | GAGGAAGATG | CGCCGTGGGG | TTACGGGAGG | 300 |
| AAGGGGACTC | CGGGCCTCCT | GGTGCCCCAC | TTTATTTGCA | GAAGGTCCTT | GGCAGGAACC | 360 |
| GTGACGCGTT | TGGTTTCCAG | GACTTGGAAA | ACGAATTTCA | GGTCGCGATG | GCGAGCACCG | 420 |
| GCTTCCCCTG | AAGCACATTC | AATAGCGAGA | GGCGGGAGGG | AGCGAGCAGG | AGCATCCCAC | 480 |
| CATGAAAACC | AAAAACACAA | gtattttttt | CACCCGGTAA | ATACCCCAGA | CGCCAGGGTG | 540 |
| ACAGCGCGGC | GCTAAGGGAG | GAGGCCTCGC | GCCGGGGTCC | GCCGGGATCT | GGCGCGGGCG | 600 |
| GAAAGAATAT | AGATCTTTAC | GAACCGGATC | TCCCGGGGAC | CTGGGCTTCT | TTCTGCGGGC | 660 |
| GCTGGAGACC | CGGGAGGCGG | CCCCGGGGAT | CCTCGGCCTC | CGCCGCCGCC | GCCTCCCAAG | 720 |
| CGCCCGCGTC | CCGGTTTGGG | GACACCCGGC | CCCTTCTTCT | CACTTTCGGG | GATTCTC^AG | 780 |
| CCGCGTTCCA | TCTCACCAAC | TCTCCATCCA | AGGGCGCGCC | GCCACCAACT | TGGAGCTCAT | 840 |
| CTTCTCCCAA | GATCGTGCGT | CCCCGGGGCG | CCCGGGTCCC | CCCCCTCGCC | ATCTCAACCC | 900 |
| CGGCGCGACC | CGGGCGCTTC | CTGGAAAGAT | CCAGGCGCCG | GGCTCTGCGC | TCCTCCCGGG | 960 |
| AGCGAGGGCG | GCCGGACGAC | TGGGACCCTC | CTCTCTCCAG | CCGTGAACTC | CTTGTCTCTC | 1020 |
| TGTCTCTCTC | TGCAGGAAAA | CTGGAGTTTG | CTTTTCCTCC | GGCCACGGAG | AGAACGCGGG | 1080 |
| TAACCTGTGT | GGGGGGCTCG | GGCGCCTGCG | CCCCCCTCCT | GCGCGCGCGC | TCTCCCTTCC | 1140 |
| AAAAATGGGA | TCTTTCCCCC | TTCGCACCAA | GGTGTACGGA | CGCCAAACAG | TGATGAAATG | 1200 |
• Β Β ·»· ·· ·· •« · #·· BBBB • BBB » Β Β · Β · · · » · · « · · ···· · BBB BBB • Β Β Β Β Β · · • Β · · Β Β Β * Β· · *
| AGAAGAAAGC | CAATTGCCGG | CCTGGGGGGT | GGGGGAGACA | CAGCGTCTCT | GCGTGCGTCC | 1260 |
| GCCGCGGAGC | CCGGAGACCA | GTAATTGCAC | CAGACAGGCA | GCGCATGGGG | GGCTGGGCGA | 1320 |
| GGTCGCCGCG | TATAAATAGT | GAGATTTCCA | ATGGAAAGGC | GTAAATAACA | GCGCTGGTGA | 1380 |
| TCCACCCGCG | CGCACGGGCC | GTGCTCTCCG | CGCGGGGAGA | CGCGCGCATC | CACCAGCCCC | 1440 |
| GGCTGCTCGC | CAGCCCCGGC | CCCAGCCATG | GAAGAGCTCA | CGGCTTTTGT | ATCCAAGTCT | 1500 |
| TTTGACCAGA | AAAGCAAGGA | CGGTAACGGC | GGAGGCGGAG | GCGGCGGAGG | TAAGAAGGAT | 1560 |
| TCCATTACGT | ACCGGGAAGT | TTTGGAGAGC | GGACTGGCGC | GCTCCCGGGA | GCTGGGGACG | 1620 |
| TCGGATTCCA | GCCTCCAGGA | CATCACGGAG | GGCGGCGGCC | ACTGCCCGGT | gcatttgttc | 1680 |
| AAGGACCACG | TAGACAATGA | CAAGGAGAAA | CTGAAAGAAT | TCGGCACCGC | GAGAGTGGCA | 1740 |
| GAAGGTAAGT | TCCTTTGCGC | GCCGGCTCCA | GGGGGGCCCT | CCTGGGGTTC | GGCGCCTCGT | 1800 |
| CGCCACGGAG | TCGGCCCCGC | GCGCCCCTCG | CTGTGCACAT | TTGCAGCTCC | CGTCTCGCCA | 1860 |
| GGGTAAGGCC | CGGGCCGTCA | GGCTTTGCCT | AAGAAAGGAA | GGAAGGCAGG | AGTGGACCCG | 1920 |
| ACCGGAGACG | CGGGTGGTGG | GTAGCGGGGT | GCGGGGGGAC | CCAGGGAGGG | TCGCAGCGGG | 1980 |
| GGCCGCGCGC | GTGGGCACCG | ACACGGGAAG | GTCCCGGGCT | GGGGTGGATC | CGGGTGGCTG | 2040 |
| TGCCTGAAGC | CGTAGGGCCT | GAGATGTCTT | TTTCATTTTC | TTTTTCTTTC | CTTTCCTTTT | 2100 |
| TTTGTTTGTT | TGTTTGTTTG | TTTGAGACAG | AGTCTCGCTC | TGTCCCCCAG | GCTGGAGTGC | 2160 |
| AGTGGTGCGA | TCTCGGCTCA | CTGCAACCTC | CGCCTCCTGG | GTTCAAGCGA | TTCTCCTGCC | 2220 |
| TCAGCCTCCC | CAGTAGCTGG | GATTACAGGC | ATGCAGCACC | ACGCCTGGCT | AATTTTTGTG | 2280 |
| CTTTTAGTAA | AGACGGGGAT | TCACCATGTT | GGCCAGGCTG | GTCTCGAACT | CCTGACCTCA | 2340 |
| GGTGATCCAC | CCGCCTCGGC | CTCCCAAAGT | GCTGGGATGA | CAGGCGTGAG | GCACCGCGCC | 2400 |
| CGGCCTGGGT | CCTGACGGCT | TAGGATGTGT | GTTTCTGTCT | CTGCCTGTCT | GCCTTGTATT | 2460 |
| TACGGTCACC | CAGACGCACA | GAGGAGCCGT | CTCCACGCGC | CTTCCCAGCG | CTCAGCGCCT | 2520 |
| GCCGGGCCCC | CGGAGATCAC | GGGAAGACTC | GAGGCTGCGT | GGTAGGAGAC | GGGAAGGCCC | 2580 |
| CGGGTCAGCT | CGGTTCTGTT | TCCTTTAAGG | AACCCTTCAT | TATTATTTCA | TTGTTTTCCT | 2640 |
| TTGAACGTCG | AGGCTTGATC | TTGGCGAAAG | CTGTTGGGTC | CATAAAAACC | ACTCCCGTGA | 2700 |
| GCGGAGGTGG | CCGGGATCTG | GATGGGGCGC | GAGGGGCCCC | GGGGAAGCTG | GCGGCTTCGC | 2760 |
| GGGCGCGTCC | TAAGTCAAGG | TTGTCAGAGC | GCAGCCGGTT | GTGCGCGGCC | r CGGGGGAGCT | 2820 |
| CCCCTCTGGC | CCTTCCTCCT | GAGACCTCAG | TGGTGGGTCG | TCCCGTGGTG | GAAATCGGGG | 2880 |
| AGTAAGAGGC | TCAGAGAGAG | GGGCTGGCCC | CGGGGATCTC | TGTGCACACA | CGACAACTGG | 2940 |
| GCGGCATACA | TCTTAAGAAT | AAAATGGGCT | GGCTGTGTCG | GGGCACAGCT | GGAGACGGCT | 3000 |
| ATGGACGCCT | GTTATGTTTT | CATTACAAAG | ACGGAGAGAA | TCTAGCCTCG | gcttttgctg | 3060 |
| ATTCGCAGAG | TTGAGGTGCG | AGGGTGAATG | CCCCAAAGGT | aattcttcct | AAGACTCTGG | 3120 |
| GGCTACCTGC | TCTCCGGGGC | CCTGCATTTG | GGGTGTGGAG | TGGCCCCGGG | AAATAGCCCT | 3180 |
| TGTATTCGTA | GGAGGCACCA | GGCAGCTTCC | CAAGGCCCTG | ACTTTGTCGA | AGCAGAAAGC | 3240 |
• 9 •
• 9 · · * · · · 9
9« 9 • · · 9 9 »9 99 • 9 9 9 9
9 9 9 9 9 >99· 9 »·· 999 • 9 9 • 9 9 9 9
| TGTGGCTACG | GTTTACAAAG | CAGTCCCCGG | TTTCTGACCG | TCTAAGAGGC | AGGAGCCCAG | 3300 |
| CCTGCCTTTG | ACAGTGAGAG | GAGTTCCTCC | CTACACACTG | CTGCGGGCAC | CCGGCACTGT | 3360 |
| AATTCATACA | CAGAGAGTTG | GCCTTCCTGG | ACGCAAGGCT | GGGAGCCGCT | TGAGGGCCTG | 3420 |
| CGTGTAATTT | AAGAGGGTTC | GCAGCGCCCG | GCGGCCGCTT | CTGTGGGGTT | GCTTTTTGGT | 3480 |
| TGTCCTTCGC | AGACACCGTT | TTGCTCCTCT | GAACTCTCTC | TTCTCCCCCT | GGCCGTGGAC | 3540 |
| CCGGGAGAGC | AAAGTGTCCT | CCAGACCTTT | TGAAAGTGAG | AGGAAAATAA | AGACCAGGCC | 3600 |
| AAAGACCCAG | GGCCACAGGA | GAGGAGACAG | AGAGTCCCCG | TTACATTTTC | CCCTTGGGTG | 3660 |
| GGTGCAGAAA | GACCCCCGGG | CCAGGACTGC | CACCCAGGCT | ACTATTTATT | CATCAGATCC | 3720 |
| AAGTTAAATC | GAGGTTGGAG | GGCAGGGGAG | AGTCTGAGGT | TACCGTGGAA | GCCTGGAGTT | 3780 |
| TTTGGGAACA | GCGTGTCCCC | GCCGAGCCTG | GGAGCCCGTG | GGTTCTGCAA | AGCCTGCGGG | 3840 |
| TGTTTGAGGA | CTTTGAAGAC | CAGTTTGTCA | GTTGGGCTCA | ATTCCTGGGG | TTCAGACTTA | 3900 |
| GAGAAATGAA | GGAGGGAGAG | CTGGGGTCGT | CTCCAGGAAA | CGATTCACTT | GGGGGGAAGG | 3960 |
| AATGGAGTGT | TCTTGCAGGC | ACATGTCTGT | TAGGAGGTGA | AACAGAATGT | GAAATCCACG | 4020 |
| TTGGAGTAAG | CGTCCAGCGC | TGAATGTAGC | TCGGGGTGGG | GTGGGAGGGC | CCTGGTGTGG | 4080 |
| ATCGTGGAAG | GAAGAAAGAC | AGAACAGGGT | GCTAGTATTT | ACCCCGTTCC | CTGTAGACAC | 4140 |
| CCTGGATTTG | TCAGCTTTGC | AAGCTTCTTG | GTTGCAGCGG | CCTTGCCTGT | GCCCCTTTGA | 4200 |
| GACTGTTTCC | AGACTAAACT | TCCAAATGTC | AGCCCCTTAC | CCTTGACAGC | AAGGGACATC | 4260 |
| TCATTAGGGC | ATCGCGTGCT | TCTCATCTGT | GCTCAGCAGG | CCCGAGATAG | GAACAGAGGG | 4320 |
| GCGTTGGAGA | TGCCACTTCC | ACCAGCCCTG | GGTTGAAGGG | GAGCGAGGGA | GACACCTTTT | 4380 |
| ACTTAAACCC | CTGAGCTTGG | TCAGAGAGGC | TGAATGTCTA | AAATGAGGAA | GAAAAGGTTT | 4440 |
| TTCACCTGGA | AACGCTTGAG | GGCTGAGTCT | TCTGCCCTTC | TGACTCCCCC | AGCAAATACA | 4500 |
| GACAGGTCAC | CAACTACTGG | AGATGAGAAA | GTGCCATTTT | TGGCACACTC | TGGTGGGGTA | 4560 |
| GGTGCCCGAC | CGCGTGTGAA | AAAGTGGGAA | GGAGAGATTT | CTGCGCACGC | GGTTCAGCCC | 4620 |
| CCAGGCGCGG | TGGCGCATTC | AGGTACTCAG | ACGCGGTTCT | GCTGTTCTGC | TGAGAAACAG | - 4 680 |
| GCTTCGGGTA | GGGGCTCCTA | GCTCCGCCAG | ATCGCGGAGG | GACCCCCAGC | CCTCCTGCGC | 4740 |
| TGCAGCGGTG | GGGATAGCGT | CTCTCCGTAG | GGCTAGAATC | TGCAACCCGC | CCCGGGTCeT | 4800 |
| CCCCGTGTCC | TTCCCGGGCG | TCCCGCCGGG | GATCCCACAG | TTGGCAGCTC | TTCCTCAAAT | 4860 |
| TCTTTCCCTT | AAAAATAGGA | TTTGACACCC | CACTCTCCTT | AAAAAAAAAA | AATAAGAAAA | 4920 |
| AAAGGTTAGG | TTATGTCAAC | AGAGGTGzAAG | TGGATAATTG | AGGAAACGAT | TCTGAGATGA | 4980 |
| GGCCAAGAAA | ACAACGCTCG | TGCAAAGCCC | AGGTTTTTGG | GAAAGCAGCG | AGTATCCTCC | 5040 |
| TCGGCTTTTG | CGTTATGGAC | CCCACGCAGT | TTTTGCGTCA | AAGCGCATTG | GTTTTCGAGG | 5100 |
| GCCCCCTTTC | CACCGCGGGA | TGCACGAAGG | GGTTCGCCAC | GTTGCGCAAA | ACCTCCCCGG | 5160 |
| CCTCAGCCCT | GTGCCCTCCG | CTCCCCACGC | AGGGATTTAT | GAATGCAAAG | AGAAGCGCGA | 5220 |
99 9· 9
| 66 | * · · « • · ·· * • · * · · • · · » ··« ·· ·< | 9 9 • 9 9 9 99 9 9 • 9 9 | ||||
| GGACGTGAAG | TCGGAGGACG | AGGACGGGCA | GACCAAGCTG | AAACAGAGGC | GCAGCCGCAC | 5280 |
| CAACTTCACG | CTGGAGCAGC | TGAACGAGCT | CGAGCGACTC | TTCGACGAGA | CCCATTACCC | 5340 |
| CGACGCCTTC | ATGCGCGAGG | AGCTCAGCCA | GCGCCTGGGG | CTCTCCGAGG | CGCGCGTGCA | 5400 |
| GGTAGGAACC | CGGGGGCGGG | GGCGGGGGGC | CCGGAGCCAT | CGCCTGGTCC | TCGGGAGCGC | 5460 |
| ACAGCACGCG | TACAGCCACC | TGCGCCCGGG | CCGCCGCCGT | CCCCTTCCCG | GAGCGCGGGG | 5520 |
| AGGTTGGGTG | AGGGACGGGC | TGGGGTTCCT | GGACTTTTGG | AGACGCCTGA | GGCCTGTAGG | 5580 |
| ATGGGTTCAT | TGCGTTTGTT | TTTCACCAAC | AGCAAACAAA | TATATATACA | TATATATTAT | 5640 |
| ACAAATAACA | AATAAATATA | TATGTTATAC | AGATGGGTAT | ATTGTATATA | TTATAGATAT | 5700 |
| TTGTTCGTCC | TTGGTGCAAA | GACACCCGGT | GAACGCATAT | ATTGGCTCCT | GACTGCCTTC | 5760 |
| GGTTCCCCTG | GGATTGGTTA | TAGGGGCAAC | ACATGCAAAC | AAAACTTTCC | CTGGATTATA | 5820 |
| CTTAGGAGAC | GAAGCTACAG | ATGCGTTTGA | TCCAGAGTGT | TTTACAAGAT | TTTTCATTTA | 5880 |
| AAAAAAAATG | TGTCTTTTGG | CCCCTGATTC | CCCTCCGTCT | TCCCGTGTGG | CTGCATTGAA | 5940 |
| AAGGTTTCCT | TAGGATGAAA | GGAGAGGGGT | GTGCTCTGTC | CCTAGGTGGA | GAGAAACAGG | 6000 |
| GTCTTCTCTT | TCCTCCGTTT | TTTCAGCTAC | GGTTTGTATC | TCCCTCCTCC | CCTCTCCAGC | 6060 |
| CCTGTCCTCT | GCTACAAACC | ACCCCCTCCT | CCCTCCGGCT | GTGGGGAGCG | CAGGAGCACG | 6120 |
| TTGGGCATCT | GGATGAGCGG | AGACTATTAG | CGGGGCACGG | GGGCTCCCCG | AGGAGCGCGC | 6180 |
| GAATTCACGC | TGCCCCATGA | GACCAGGCAC | CGGGGGGCGG | AGGGGCCTTG | GGTGTCCGCA | 6240 |
| GAGGGACGGG | CGGGCAGAGC | CTTCCTCCGC | ATTCTAAACA | TTCACTTAAA | GGTATGAGTT | 6300 |
| TATTTCAGGG | GTGCTGCTGG | GAGAGCCTCC | AAATGGCTTC | TTCCAGCCCC | TGCCTGACAG | 6360 |
| TTCAGCTCCC | CTGGAAGGTC | ZáACTCCTCTA | GTCCTTTCTC | CTGGTTCTGG | GCAGGACAGA | 6420 |
| AGTGGGGGGA | GGGAGAGAGA | GAGAGAGAGA | GAGAGAGACG | GTCAGGATCC | CCGGACCCTG | 6480 |
| GGGAACCCGT | CAAAAATAAA | TGAAATTAAG | ATTGCCGACC | AGAGAGAGAA | CCGTGACAAA | 6540 |
| GCAAACGGCG | TTCAAAGCAA | AGAGACGAAC | TGAAAGCCCG | TTCCCGTAGG | ACTGGTTATG | 6600 |
| AGGTCAACAC | ATTCAAACAC | AGGTTGCTCT | GGATTTTGCT | GAGCAGAGGA | AGATACAGAT | 6660 |
| GCATTTGATC | CAAAGTGTGT | TACATCTTTC | ATTATATGTG | TGTCTATATA | TATAAACATA | 6720 |
| ΤΑΤΛΑΑΤΑΤΑ | TAAACATACA | TAAATGTATG | TAAATATATA | TAATCTATAT | ACATATATAA | 6780 |
| ATATATAAAC | ACATATATAA | TATATAAATC | TATAAACATA | TATAATATAT | AAACATAAAT | 6840 |
| ATATAAACAT | ATATAATATA | TAAATATATT | AACATATATA | AAATATGTAT | AAATATATAT | 6900 |
| AAACATATAA | ACATATATAA | ATATATAAAC | ATATAAATAT | ATAAACATAT | ATAAATATAT | 6960 |
| ACAAACATAT | TGTATATATA | TAAATATATA | TAAAAACATA | TATATACATA | TAAAAATATA | 7020 |
| TATAAACATA | TATACATATA | AAGAAATATA | TATAAACATA | TATACATATA | AATATACATA | 7080 |
| TATAAACATA | TATATACATA | AAATATATAT | AAACATATAT | ACATATAAAA | ATATATATAT | 7140 |
| ATTAACATAT | ATATACATAT | AAAAATATAT | ATATTAACAT | ATATATACAT | ATAAAAATAT | 7200 |
| ATATATATTT | TTGGCCCCTG | ATTCCCTTCG | GTTCCTGTGG | GATGGGTGAT | TGAGTCAACA | 7260 |
9« 99 • 9 '9 • *4
4 ·
4 44 4
4 · fl ·
4 · 4
.....
• ·« ·· • · » · · · « # · « · · · • •««v * ··· · · · • « · *
CATTCAAACA
TGGAGAGGGT
GGCTCCTGAT
GTTACGATTA
TACAGCCCAG
GGCGTCTGTG
ACCCCTCTGG
TCGCTAAAGG
CAATATATCC
CCACACTATT
ATTGGTTGTG
AAGCTGGGGG
AAAACAAACA
CCTATAGTAA
CGTCCCGCGT
CATCTCTCTG
CGGATAGAGT
GCTGTTGCTG
TCAGGCTTCT
ACAAATATCT z\TGGAAATCA
AATGAAGAAA
TTGGAATGGA
TCATCACTTG
ATGAGGCTTT
TTGGGTGGCT
TGGAGAGGCA
AGCTTTGGAA
GGTGTGAGGG
CCGGTAGGAC
TGTTGGGTTC
TGAGGGTTTT
AGGGTGGCTG
CAACTTTTCC
TTTACAAGCT
TCTCTTCCGT
AATCAACCCT
GAGGGAGAGA
GCCTCAGTGA
CAGAAGATGG
GGACATCGAG
CAGCCCTTGA
TCTTTCCGTA
GGGTGTGTGC
TTATCGATTG
TGGGAATGCA
AGGCGAGTGC
TGAGGGGACG
TGAATTCTTG
TTCAATTTAC
ATTAACCTTT
AATCGAAAGT
TTGGGTTTAT
AAAGGAAATC
TAACTGTCTT
TCGTGAATCA
TATTCTTCAT
CCACGTTTCA
GGCTTGCTTT
CAGTGGCAGG
ATTATTGGTG
AGGATGACTT
CCACTTTGGA
AAGAGCAAGT
CTGAGGTTCC
TGGGCCGAGG
ATCGATGTTG
CTTTCATTTA
CTTCCCATGT
CCCCAGGCAT
GGCTTTGGTG
GGGAAGGAAG
ATTGGGCTGC
TTTATGTGTC
TGTACTGTTT
GTCTATTACC
GGACCCCGAG
CAGGGGTGGC
ATAAAAGACA
GCTTTGAGGG
GGGACGAGCA
GGTCACATGC
TGTGGAAATT
TATTTTTAGC
TATGAGACCA
GGCGCAGAGC
GCATTACGGC
AAGCAGTGTC
CTCCAAGACT
CATTTTTTTT
GGAGGATTTT
CTGGGCCCTG
TCACCTGGAT
AATTTCGATG
TGCTGGGAAA
AATGAAAAGC
TCACGTTGCG
CTTCATAGGG
GACCCAGCAC
CTTAGGAGAT
AATATATATA
GGCTGCATTT
CTTTACCGAG
ACTTGGAGGA
CTGCATCAGA
CCCGTATAAA
ATCTCCTGGT
CTATAAAAAT
GACGAGAGCA
AACGCCCTAA
ATGAAAATTT
TAATTCTCCA
GTCATAAAAA
GGGACAGAAA
GTCTCAGTAC
TGCTGTAAAT
GTGGCCCTGC
CGGTGAGGGG
TAAATTAAAT
ATTTGGGAAA
ACACACTTCA
GATTTATTAG
TTTCCTCTCG
CTTTTTTGAA
GAGGAGACAG
GGTCAGTGGA
TCAGCACCAG
CAGGATCAGG
CAGTTCCGAA
CTGTGTAGAC
GCACCGGCCC
GTGTTTTGCC
GAGGATACAG
TATATATATA
TAAAAGGCTT
GGCTGTGGTC
AGGACTGTGT
CAGGGGTTTC
TTAATGAAAA
GTCTGTGTGC
AAATTACTTG
CGTTAGTTCA
AATAAAGACA
AACGACGGTA
TCGCCGCGGG
TCAATTAGTT
AAGAAACCAT
AGCCCGTCCC
AAATTGAGCA
AAAGTCGTAT
CAGGCGGTAA
GTCATTATTC
GAAAGCGGGG
CTTACCATAT
CGCTTCACGC
CCGTGTTGAA
AAATGCCCTT
GCGGAGAGTC
GGTGGAGGTC
GCAGGGGCCT
TTCTCCAGGC
AGCTGGGCTG
TCCTGGCTGC
TGGGCCATGC
CACAACAGCC
ATGCGTTTGA
TATATTTTTT
GCCTAAGATC
CCCAAAGCGA
CCCTCCTTAG
CTCGCTGTCC
GATTAAAGTT
CTGGGATCTG
TAATTTAATT
GCTGCGGAAA
AATCGGGGAC
AATAATAATA
GGGAAAGGAT
CCAACACCCA
ATTTGAATCC
GTGCTGTGAC
TCCGATAGAA
CACCCAGCTG
TTTAATTACA
ACTGTCTGTA
AGTGCTCTTT
TCGGGCCTAA
AGCGGCTAAT
GGGAGAGTGA
CCAGAGGCTT
CAGGTGGGCA r
TGAAGGCGCC
TTTTGGCGGG
GCACTGCAGC
GAAGCTTCCG
TCCCAAACTC
ACAGTGCGTA
GGAGTGACTG
7320
7380
7440
7500
7560
7620
7680
7740
7800
7860
7920
7980
8040
8100
8160
8220
8280
8340
8400
8460
8520
8580
8640
8700
8760
8 20
8880
8940
9000
9060
9120
9180
9240 » 9 » 9
999 *
• 9 9 ·
| 68 | • 9 9 9 9 •9999 9« | • « | ||||
| GTTCACTCAC | CGCCTTGGCG | GAGGACGCCT | GTTCTCTGGA | CGAATCATTT | CTCTTGGGTG | 9300 |
| GTGACTGCCT | TGTGGGTCAA | GGTGCAGGTT | TTCTGCCACA | GAAAACCTGT | TAGGAGGAAT | 9360 |
| TAAGCGACTA | AGACTGTCAG | GGAGGTGGTG | GTGGGGGAGA | GGAGGGGGTG | GTGTCCAGAT | 9420 |
| TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | TCCAGCTGGT | CTGTCTGTGG | AGGAGGGGAT | 9480 |
| TGTCAATACT | GGGAGAGCAG | AGGAGGCTCG | TAGGAGGTGA | GAGGGGGTGG | AATTTGCATG | 9540 |
| caaatcttca | CATGAGGCCT | GTGTGAATTT | CTCCAGCCTC | CTGAGGGTCC | CCTGCGCTAT | 9600 |
| TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | GACTCAGAAG | TCCTTAGAGG | GGCAGAATGC | 9660 |
| CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | TCCTCAGGAC | CCTTGGTCAT | GAATGGGACC | 9720 |
| CTTTCATGTA | TGGGGACCCT | TGGTAATATG | AATGGGACGC | CTTCAGCTCC | CCAGGGCTTC | 9780 |
| CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | CGAGGAGGCC | GAGAAGGGCA | AAGACATTTT | 9840 |
| CTGGGCTTGG | TGTGTCAAGA | GCTAGATTGG | AGAAGGGGCT | GGATTTGGAA | CTCTTTAGCC | 9900 |
| ATCAGCTCAC | CCTCTCCGTT | TGTGGCTAAA | GTCTGAAGGT | GGAAACTTCG | GTTCTCCTAC | 9960 |
| AGGGTGTACA | GGAGTTGGGG | GGCGGGGCGC | CCACACAGAA | CGCTGGAAAG | TTCGACAGTC | 10020 |
| CACTTCCACT | GGCTCGGAAC | TCACTTTTTC | ACCTTAAGTT | CATCAGCGGT | AACGCATAGG | 10080 |
| TCTCACTTAG | GCAGGGCACG | GATGATTTAA | CAATTTCTAC | TTCTAGGTCA | GGTGCGGTGG | 10140 |
| CTCACACCTC | TAATCCCAGC | ACTTTGGGAG | GCCCAGGAGG | GTGGATCGCT | TGAGGTCAGG | 10200 |
| AGTTTGAGAC | CAGCCTGGCC | AACATGGTGA | AACCCCGTCT | CTACTAAAAT | ACGAAAATTA | 10260 |
| GCCAGGCATG | GTGGTGAGCA | CCTGTAATTC | CAGCTACTCG | GGAGGCTGAG | GCAGGAGAAT | 10320 |
| CGCTTGAACC | TGGGAGGTGG | ACGTTC-CAGT | GAGGTGAGAT | CACACCACTG | CACTCCAGCC | 10380 |
| TGGATGAGAG | AGCAAGACTC | TGTCTCAAAA | ACAAAATAAA | ACAAAAACAA | AACAAAAATC | 10440 |
| AAAAAAGzAAA | ACCCAATTTC | CAGTTCTAGG | CCAGGTGCAG | TGGCTCACGC | CTGTCATCCC | 10500 |
| AGCACTTTGG | GAGGCCCAGG | AGGGTGGATC | GCTTGAGGTC | AGGAGTTCGA | GACCAGCCTG | 10560 |
| GCCAACATGG | TGAAACCCCA | TCTCTACTAA | AAATACAAAC | GTTAGCTGGG | TGTGGTGGTG | 10620 |
| TGCGCCTGTA | ATCCCAGCTA | CTCGGGAAGC | TGAGGCTGGA | GAATTGCTTG | AATCTGGGAG | 10680 |
| GTGGAGGTTG | CAGGGAGGCG | AGATAGTGCC | ACTGCAGTCC | AGCCTGGACC | AGAGAGCAAG | 10740 |
| ACTCCGTCTC | AAAAACAAAA | GAAAGCAAAA | ACAAAAAACA | AGAGAC.CAGC | CTGGCCAACA | 10800 |
| TGGTGAAACC | GCGTCTCTAC | TAAAATACAA | AATTAGCCGG | GCATGGTGGT | r GGGCACCTGT | 10860 |
| AGTCCCAGCT | ACTCGGGAGG | CTGAGGCAGG | AGAATGGCTT | GAACCTGGGA | GGTGGAGCTT | 10920 |
| GCAGTGAGCC | GAGATÁGTGC | CACTGCACTC | CAGCCTGGGC | GACAGAGCGA | GACTTGATTT | 10980 |
| CAGAACCACC | ACCACCACAA | CAAAACAAAA | CAAAAAATCC | AAAAAAACCC | CAATTTCCAG | 11040 |
| TACTAGGTAG | TCAGTGATGC | AGGGCTGGAG | ACAGAGGGGC | GGTAAGTGTC | TGGGCGCCCA | 11100 |
| CCATCAGTCA | CCTCCCAGCT | CCCAGAGGTG | CAAAGTGCTT | GGTTCAGCCT | CATGGGAAGG | 11160 |
| ATGCTCCCTG | GGGAGGCTGG | GCTGGGTTCA | CAGGGCTCTT | CACATCTCTC | TCTGCTTCTC | 11220 |
| CCCAAGGTTT | GGTTCCAGAA | CCGGAGAGCC | AAGTGCCGCA | AACAAGAGAA | TCAGATGCAT | 11280 |
• 99
9
999
9 9
9 9
999 9· • ·
| AAAGGTGGGT | GTCGGGACTG | GGGGGACCTG | AAGCTGGGGG | ATCCTGCTCC | AGGAGGGATG | 11340 |
| GGGTCGACGA | GGTGCTGGCT | ACACCCAGGA | CCACCACACT | GACACCTGCT | CGCTTTGGAC | 11400 |
| ACAGGCGTCA | TCTTGGGCAC | AGCCAACCAC | CTAGACGCCT | GCCGAGTGGC | ACGCTACGTC | 11460 |
| AACATGGGAG | CCTTACGGAT | GCCTTTCCAA | CAGGTAGCTC | ACTTTTTCTT | CCTCTGAAGA | 11520 |
| TCCCTAGGGA | CCTGCTGCTC | CCTTCCCCTT | TCCCGTATTT | GCTGGCGCAT | CCTGACACTC | 11580 |
| CTAGTCCCTC | CCTGCCCCTG | CAGACTTCTC | AGCTGGCCCT | TAGAAAAAAA | GCCTCTTTTC | 11640 |
| CGAGGAGGCA | TTTACAGGCA | CCTTGGCACC | TATGAAATCA | GGCTGGGCCA | GGCGGGGTGG | 11700 |
| CTCACACCTG | TCATCCCAGC | ACTTTGGGAG | GCTGAGGAGG | GTGCATCACC | TGAGATCAGG | 11760 |
| AGTTCAAGAC | CAGCCTGGCC | AACTTAACGA | AACCCCGTCT | ATTAAAAATA | CAAAATGGGT | 11820 |
| GTGGTGGCTC | ACGCCTGTCA | TCCCAGCACT | TTGGGAGGCC | GAGGCAGGTG | GATCACCTGA | 11880 |
| GGTCAGGAAT | TCGAGACCAG | CCTGACCAAC | ATGCTGAAAC | CCCGTCTGTA | CTGAAAACAC | 11940 |
| AAAGCTTAGC | CGGGCGTGGT | GGTGCACACC | TGTGATCCCA | GGTACTTGGG | AGGGAGAATC | 12000 |
| ACTTGAACCT | GGGAGGTGGA | GGTTGCCGTG | AGCCAATATC | GCGCCACTGC | ACTCCACTCT | 12060 |
| GGGTGACAGA | GTGAGACTCC | AAGACTCCAT | CTCAAAAAAA | AAAAAAAAAA | TCAGGCTGTA | 12120 |
| AAAATCCACT | TTTGGGAAGG | TGAACACACA | CAAGCCCAAA | CAGAAATCTG | ACAAAAACCA | 12180 |
| GAGGGGTGAA | AAGTCCACAC | AGTCAGGCAC | CCCCACCTGG | CTTGCTGCCT | GGTTAAGAAG | 12240 |
| GGCGCAGATG | CCTGTGCCTG | GATACCAGAG | ATGGGACAGA | CACCCATTCC | CTTTTCATCA | 12300 |
| CCACCCCCGA | GTGCCCGAGG | GCCTGGGGCG | TCTGCCTGGC | CCCTGGCCCC | TGGCTTGGGC | 12360 |
| TCTGCACCTC | TGAACTGGAG | ACACCCTACT | CAGCTCCCCA | CTTACTTTGG | AGTGAGCAGC | 12420 |
| GCTTGGGTGC | CCAGCGTGGA | TTTGGGGCTT | CCAGGGAGTC | GGGGTTCGGT | CGCGGAGCCC | 12480 |
| AAGCTTCCCA | AGGGCGCCCC | CGCCCTGCCC | TGGCTTAGTG | GTGGGGATGG | GATGGGGGGA | 12540 |
| AACGGGGAGC | TGCGTGGAAG | GAGGTGAAGG | GTCACAGGAG | GAGAGAGCGC | AGCGCCCACG | 12600 |
| TGCGCCCTGC | CTGAACGCGC | AGCGCAGCGC | CCGGGTGCGG | TGCCCCTTGC | CCCTTCGGTC | 12660 |
| CCTAATTTGG | GGATCGGGAG | TGCATGCGCG | GGCGGAACGG | GCTTGGGGGG | GGGGGTCTGG | 12720 |
| CAGGGCGGAC | GCGTGGCCTC | CCTTCTTCAC | cgttttattc | CAAGGGGACA | GGCTGGGGAT | 12780 |
| TGTATTTGGG | CGCGTGTTTG | GCTGAGGGTG | CAGGGACTTG | GGGGGTGGCG | GTGGGGAGGG | 12840 |
| CGGAAGGTAT | AAACGTATAA | ATCATAAGTA | AACAACTCAG | AAATGGACCC | CGAGCGCTGG | 12900 |
| TCGCCGCTAG | CTCTCCAGCT | CTCCCTGGCC | CAGGCCCGAA | GGAGAGGGGT | CCGCATCCCT | 12960 |
| CCGCGGTTCT | CCTCTCCTGG | GTACCTGGCC | TTGAGGTGGG | GGAACGAGCC | TACTTCTTGT | 13020 |
| ACCGTCTTTT | GCCGACGGCG | GGACCCAGTG | AAATTAGGCC | GTTGGAGCCC | GCAGGCCTGC | 13080 |
| CTGGCTTTGC | GCACCGGAGT | CTTGGGGACC | TGGTGTCCCC | GGGAAAAACT | TGGGGACCTG | 13140 |
| GTATCCCCGG | GAGAGGCTTG | GGGACCTGGT | GTCCCGGGAG | AGGCTTGGGT | ACCTGGTTTC | 13200 |
| TCTGGAAGAG | GCTTGGACAC | CTGGTGTCCT | GGGAGGGCCT | TTGGGACCTG | GTGTCCTGGG | 13260 |
« 4 44
4 4 • 4 ·
44
4 4 4
4 4 4
444 444
4
44
| AGAGGCTTGG | AGATCTGTTG | TCCTGGGAGA | GGCTTGGGGA | CCTGGTGTCC | CTGGAGAGGC | 13320 |
| TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GAGACCTGGT | GTTCTGGGAG | AGCCTTGGGG | 13380 |
| ACCTGGTGTT | CTGGGAGAGG | CTTGGGGACC | TGGTGTCTCT | GGAAGAGGCT | TGGACACCTG | 13440 |
| GTGACCCGGG | AGGGCCTTGG | GGATCTGGTG | TCCCGGGAGA | GCCTTGGGGA | CCTGGTGTCC | 13500 |
| TGGGAGAGGC | TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GGGACCTGGT | GTCCTGAGAG | 13560 |
| AGCCTTGGGG | ATCTGGTGTC | CCAGGAGAGG | CTTGGGGACC | TGGTGTCTCT | GGAAGAGGCT | 13620 |
| TGGACACCTG | GTGTCCTGGG | GAGAGGCTTG | GGGACCTGGT | GTCCTGGGAG | AGGCTTGGGG | 13680 |
| ACCTGGTGTC | CTGGGAGAGG | CTTGGAGATC | TGGTGAGCCG | GGAGAGGCTT | GGGGACCTGG | 13740 |
| TGTCCCGGGA | GAGGCTTGGG | GACTTGGTGT | CCCGGGAGAG | GCTTGAACAC | CTGGTGTCCC | 13800 |
| AGGAGAGGCT | TGGGGACCTG | GTGACCTTGG | AGAGGCCTGG | GGACCTGGTG | ACCCGGGAGA | 13860 |
| GCCTTGGGGA | CCTGGTGTCC | TGGGGAGAGC | CTTGGGGACC | TGGTGACCTT | GGAGAGGCTT | 13920 |
| GGGGACCTGG | TGTCTCGGGA | GTGCCTTGGG | GACCTAGTGA | CCCGGGAGAG | GCTTGGGGAC | 13980 |
| CTGGTGTCCC | GGGAGAGGCT | TGGGGACCTG | GTGTCCTGGG | AGAGCCTTGG | GGATCTGGTG | 14040 |
| TCCTGGGGAG | AGGCTGGGGG | ACCTGGTGTC | TCGGGAGAGA | GCCTTGGGGA | CCTGGTGACC | 14100 |
| CGGGAGAGGC | TTGGACACCT | GGTGTCCCGG | GAGAGGCTTG | GGGACCTGGT | GACCCGGGAG | 14160 |
| AGCCTTGGGG | ACCTGGTGTC | CTGGGGAGAG | GCTGGGGGAC | CTGGTGTCTC | GGGAGAGAGC | 14220 |
| CTTGGGGACC | TGGTGACCCG | GGAGAGGCTT | GGACACCTGG | TGTCCCGGGA | GAGGCTTGGG | 14280 |
| AGCCTGGTGT | CCCGGGAGAG | CCTTGGGGAC | CAGGTGACCT | TGGAGAGGCT | TGGGGACCTG | 14340 |
| GTGATCTTGG | AGAGGCTTC-G | GGACCTGGTG | TCTCGGGAGA | GGTTACGGGG | GCTGGTTGGG | 14400 |
| GGAGAGAACG | TTGTGAGCCA | AAGTCCCTGA | ATCCCTGCGA | AAAGÁGCGCA | TCGGGAGCTC | 14460 |
| CCCCTGAGGG | CGTTCCATTT | GTGGACCCCC | CTCCCATGCG | CTTTGCAGGG | AGCTGTTCGG | 14520 |
| ATTCCCCTGG | CCCGGCTCCC | GCGGATGCAT | CCAGTGGCAG | CGCCAATTCT | GGGCCAGGGG | 14580 |
| GAAGGAGGAA | AGGCGGGTGT | GGGGTGGTCT | CCACGGCTGG | AGAAGGGGCG | ACGCTCCCTA | 14640 |
| GGGGAGAAGA | GGCACGTTGG | GGGTTTCCGG | GGGCGCGGGG | CGGAGCAGGC | CCCCCAGTCC | 14700 |
| CCATCCTGCG | CCCTCACCCC | GCCGGGTCCG | CTCCCGCAGG | TCCAGGCTCA | GCTGCAGCTG | 14760 |
| GAAGGCGTGG | CCCACGCGCA | CCCGCACCTG | CACCCGCACC | TGGCGGCGCA | CGCGCCCTAC r GTCCGCCTCG | 14820 |
| CTGATGTTCC | CCCCGCCGCC | CTTCGGGCTG | CCCATCGCGT | CGCTGGCCGA | 14880 | |
| GCCGCCGCCG | TGGTCGCCGC | CGCCGCCAAA | AGCAACAGCA | AGAATTCCAG | CATCGCCGAC | 14940 |
| CTGCGGCTCA | AGGCGCGGAA | GCACGCGGAG | GCCCTGGGGC | TCTGACCCGC | CGCGCAGCCC | 15000 |
| CCCGCGCGCC | CGGACTCCCG | GGCTCCGCGC | ACCCCGCCTG | CACCGCGCGT | CCTGCACTCA | 15060 |
| ACCCCGCCTG | GAGCTCCTTC | CGCGGCCACC | GTGCTCCGGG | CACCCCGGGA | GCTCCTGCAA | 15120 |
| GAGGCCTGAG | GAGGGAGGCT | CCCGGGACCG | TCCACGCACG | ACCCAGCCAG | ACCCTCGCGG | 15180 |
| AGATGGTGCA | GAAGGCGGAG | CGGGTGAGCG | GCCGTGCGTC | CAGCCCGGGC | CTCTCCAAGG | 15240 |
CTGCCCGTGC GTCCTGGGAC CCTGGAGAAG GGTAAACCCC CGCCTGGCTG CGTCTTCCTC 15300
999· • 9
9
9
999 9 9 • 9 99 • 99
| TGCTATACCC | TATGCATGCG | GTTAACTACA | CACGTTTGGA | AGATCCTTAG | AGTCTATTGA | 15360 |
| AACTGCAAAG | ATCCCGGAGC | TGGTCTCCGA | TGAAAATGCC | ATTTCTTCGT | TGCCAACGAT | 15420 |
| TTTCTTTACT | ACCATGCTCC | TTCCTTCATC | CCGAGAGGCT | GCGGAACGGG | TGTGGATTTG | 15480 |
| AATGTGGACT | TCGGAATCCC | AGGAGGCAGG | GGCCGGGCTC | TCCTCCACCG | CTCCCCCGGA | 15540 |
| GCCTCCCAGG | CAGCAATAAG | GAAATAGTTC | TCTGGCTGAG | GCTGAGGACG | TGAACCGCGG | 15600 |
| GCTTTGGAAA | GGGAGGGGAG | GGAGACCGGA | ACCTCCCACG | TTGGGACTCC | CACGTTCCGG | 15660 |
| GGACCTGAAT | GAGGACCGAC | TTTATAACTT | TTCCAGTGTT | TGATTCCCAA | ATTGGGTCTG | 15720 |
| GTTTTGTTTT | GGATTGGTAT | TTTTTTTTTT | TTTTTTTTTT | GCTGTGTTAC | AGGATTCAGA | 15780 |
| CGCAAAAGAC | TTGCATAAGA | GACGGACGCG | TGGTTGCAAG | GTGTCATACT | GATATGCAGC | 15840 |
| ATTAACTTTA | CTGACATGGA | GTGAAGTGCA | ATATTATAAA | TATTATAGAT | ΤΑΑΑΑΑΆΑΑΑ | 15900 |
| ATAGCCGTGC | ACTCTTGACC | CCGTCAACGT | CCAACGTGGA | AAAGGCGTTA | CCTCTTCTCC | 15960 |
| CAGCGCTGGC | CGCCTGGCCA | CTGAGGGCCC | TTTGCAAAAA | TCACGGGTGT | AGAGATGGCC | 16020 |
| CTGGGCGCGC | TGGGAGTGTG | GTTGTGTTTC | TGAAGGGGAT | AAAAGAGGGC | ACGGTGGTGC | 16080 |
| CAAGATATCA | GTTTGGTACC | TGAGCTGTTT | GTGGTTGGGA | AGCGTAAAAG | CCAGGGAGAG | 16140 |
| ATCCAGAGAG | TTTTCAAGTT | TTTGCAGATG | TAGGTGGTTC | CAGCTTTTCT | TTCTCCCCTA | 16200 |
| CTCCATCTTC | TGCGTTCCCC | CAGTTCTTTT | ATTTCTTTGT | TTTTTATTTT | TGAGACAGAG | 16260 |
| ACTTGCTTTG | TCGCCCAGGC | TGGAGTGCAG | TGGCGCAATG | TCAGCTCACT | GCCACCTCCA | 16320 |
| CCTCCCGGGT | TCAAGCGATG | CTCCTGCCTC | AGCCTCCCGA | GTAGCTGGGA | CTACAGGCAC | 16380 |
| CTGCCACCAC | CCCCGGCTAA | TTTTTTGTAT | TTATAGTAGA | GACGGGGTTT | CACCGTGTTG | 16440 |
| GCCAGGCTCG | TCTCGAACTC | CTGACCTCAG | GTGATCTGCC | CGCCTCGGCC | TCCCAACGTG | 16500 |
| CCCCCAGTTT | TATAAACAGC | AGATAGCAAC | TTGTCGTCAC | AGCTGGCATG | GGCTGGACAG | 16560 |
| TTGCTTGAAA | TGACCTAACC | AAAAACATTC | AAGGGTTCTG | CCCCCAGATT | TCGGGAGATC | 16620 |
| CACGTTCCAT | GTTCTGATTG | GTTTTCTGGG | AACACAGCAA | GGGGTTTGGT | GAGCTCCGAG | 16680 |
| AAGATCCATC | TGCATGATTG | GCATTAGTTA | CCACAGCCTG | CCCAGAGAGA | AACTATCTTC | _16740 |
| TCCCAACATT | TACTAACATC | CACTGGTCAA | CTCTCTTATT | TCCATAACAC | ATTTGCATCT | 16800 |
| TTCTGGATTC | AAGCTTGGTG | GTTTTCTTTC | CTAACTTCTG | ATTTAGATAC | TTCTCCCfGA | 16860 |
| GGT GvjGoAT A | AAAGAAAAAA | AAAAAACAAC | *£* | CTTCCGCATA | ACACTTTCTA | 16920 |
| TCTTGTCACT | GAGCTGAACT | GTAGATCCAT | TTGGACCCGT | CTCATTTGTA | TCTTCTGATA | 16980 |
| TTCTTTATAC | AAACCAAAAG | TCCCCTTCAA | CATTTTTTAT | GTCAAAATGT | TACAACCGCT | 17040 |
| GTAAAATGAC | GGAGAGAGAG | AGAAAGAATC | CCAGACATTA | ACGGTATTAG | AGAGTTTGCC | 17100 |
| TCATTCATCC | ATTTTTCTTA | AAAGCTGGAA | ATTAAAAAAA | AAAAAGAGAG | AGAGAGGCTT | 17160 |
| TAATAGTTAA | GCTGAAATTT | TTATCGAAAA | GAAGAATTGC | ATTTTGAATC | TTTGGGAAGT | 17220 |
| AGGTTCATTC | ATCAGAGTAT | GTAACCCTTT | GGAAAAGTGG | TTGGTAAGAT | ATGTACAGCC | 17280 |
9
| 72 | 9 9 9 9 9 9 99 9 9 9 «99 • 9 9 9 999 99 9 | 9 9 9 9 9 99999 · 9 9 9 9 | ||||
| CTAGATTTTT | TTTTTTTTAA | CCAAAAAGGC | TGAGTAATTT | TGAAAAATCG | AAACATAACA | 17340 |
| GTGTGTCATC | ATTTCCTCCC | AAGAAAAAGC | TCACTCCACG | TGAGTAGAAA | GACATCTACC | 17400 |
| TGGTCCCTGT | AGAATCTGAA | CGTTTCTCTT | TAGAGACGGA | ATTTCAATCT | TGTTGCCCAG | 17460 |
| GCTGGAGTGC | AGTGGCACAA | TCTCGGCTCA | CCGCAACCTC | CGCCTCCCGG | GTTCAAGCCA | 17520 |
| TTCTCCTGCC | TCAGTCTCCC | GAGTAGCTGG | GATTACAGGC | ACCTGCCACC | AGGCCTGGGT | 17580 |
| AACTTTCTGG | TATTTTTAGT | AGAGACAGGG | TTTCAGCCTC | CCGAGTAGCT | GGGATTACAG | 17640 |
| GCACCTGCCA | CCAGGCCTGG | GTAACTTTCT | GGTATTTTTA | GTAGAGACAG | GGTTTCAGCC | 17700 |
| TCCGGAGTAG | CTGGGATTAC | AGGCACCTGC | CACCAGGCCT | GGGTAACTTT | CTGGTAGTTT | 17760 |
| TAGTAGAGAC | AGGGTTTCGG | CCTCCCGAGT | AGCTGGGATT | ACAGGCACCT | GCCACCAGGC | 17820 |
| CTGGGTAACT | TTCTGGTATT | TTTAGTAGAG | ACAGGGTTTC | GGCCTCCCGA | GTAGCTGGGA | 17880 |
| TTACAGGCAC | CTGCCACCAG | GCCTGGGTAA | CTTTCTGGTA | TTTTTAGTAC | AGACAGGGTT | 17940 |
| TCGGCCTCCT | GAGTAGCTGG | GATTACAGGC | ACCTGCCACC | AGGCCTGGGT | AACTTTCTGG | 18000 |
| TAGTTTTAGT | AGAGACAGGG | TTTCAGCCTC | CCGAGTAGCT | GGGATTACAG | GCACCTGCCA | 18060 |
| CCAGGCCTGG | GTAATTTTTT | TGCATTTTTG | GTAGAGACAG | GTTTTTGCCG | TGTTGGCCCG | 18120 |
| GCTGGTCTCA | AACTCCTGAC | CTCAGGTTGA | CCTGCCCGCT | TTGTCCCTCG | CAAAGTGCTG | 18180 |
| GGATTACAGG | CGTGAGCCAC | CACACCTGGC | CTGAATCTGA | ACTTTTAAAA | GGGAGTTACT | 18240 |
| GACTCTCAAC | TGTGCGGGGA | CGGTTTCACT | TTGATTTAAT | ATGGAAAGAG | GGCCAAGTGT | 18300 |
| CATCCTCACA | AATGGGTCCC | CGAAGCAGAT | CAAACGCAGA | GAACTGTGAG | GGTGGGACAC | 18360 |
| GAGTGTCTGT | GGACACTGGC | TGCCTTTGGC | TTTTCTCCTG | CGAGAGAAGT | TGGGTGACTT | 18420 |
| TCTGTAGGTG | GATGAGTGAT | CCCTGAATGA | GTGTGGGGTA | CGTGTATGCT | AGCTGCTTCT | 18480 |
| TTCTCCCTGA | AACTCTCGGA | T GvrAAGv, A/^G | TAAGAAATTC | AGCTTGGGCT | G j GACCAG l Γ | 18540 |
| CTCACCACCA | ACGCCCTCTT | CTCTCTCCCT | TCTCCTTCCT | TCCTTCCTTC | CTTCCTTTCT | 18600 |
| TTCTTTTTCT | TTCTTTCTCT | CTTTCTTTCT | TTTCTTTCTT | TCTGTTTCTT | TCCTTTTTAT | 18660 |
| CTTTCTCTCT | TTTTCTTTCT | CTTTTCCTTT | TTTGTTTCTT | TCTTTCTTTT | TCTTTCTTTC | 18720 |
| TTTTTCTTTC | TTCTTTCTTT | CTTCGATGAA | GTCTCACTCT | GTCACCCAGG | CTGGAGTGCA | *18780 |
| GTGGTGCAAT | CCCAGCTCAC | 1 <jGA I CCl C Γ | ACCTCCTGGC | TTCAAGAAAT | TCTCCTGCCT | 18840 |
| CAGCCTCCCA | AGTAGCTGGG | ATGACAGGCA | CCCACCACCA | TTCCCGGATA | ATTTTTGTAT | 18900 |
| TTTTTAGTAG | AGACTGGGTT | TCGCCATGTT | GGCCAGGCTG | GTCTTGAACT | CCTGACCTCA | 18960 |
| CATGATCCAC | CCGCCTCAGC | CTCCCAGAGT | GCTGGGATTA | CGGGGTGAGG | CACCGCGCCC | 19020 |
| GGCCTCCTCT | CTCTTTTTCT | GAGATGTTTA | GGAAGGACTG | GGCTGATGGG | GACCCTCTGT | 19080 |
| ATGTGATGTG | CGTGGGTTTG | GTTTCCCGGA | AGGCCCTCCA | GAGACACGTT | TGCGTGAACA | 19140 |
| TTCAGCATGG | AAACAACATA | CGTCTCTCCA | CAGGAGGTGA | GAAATTGAAT | TTATGGGGTG | 19200 |
| GGTGTACGCT | GGCGATTCTT | GGTGCTTTTT | GCTCAAAACA | AGGTTCTTTT | GAAAGTCACG | 19260 |
TTCCTGCTTT CCCTGTGGCT TCCCGGTGAG CTCGCTCGCA GAGCAAGGAA TACCACCCAG 19320
9 9 9
9
| 73 | 4 4 4 4 « 444 4 4 4 · 4 4 4*4 * 44444 4 | 4 4 4 4 4 4 44 44 4 4 4 4 | ||||
| AGAGCAACGT | GGGCTGTGTT | CCGTTGTAAC | GCCGTTGCAG | AGAGAGGATT | TGGTGTGTGA | 19380 |
| GATCCGTACC | AGCTCCAGCA | CACTGATAGG | AACACGTTGC | TGGCCGAACT | GAACGATGCT | 19440 |
| GGGTTGGGTC | CTGATTGATA | CGTATTTTCT | TCCCTCCTCT | CCCCAAAACT | TGGCCAAATA | 19500 |
| GTCCGTGGAG | GGTTGTCAGT | CGCCGCAGTT | GAGCAAAAAA | CACTTCTTCC | TTTGAGTGGC | 19560 |
| TGTTCTGGTG | AAATCTGTTT | CTGACATATC | CACTTTTCTC | TCTCTTTTCT | CTCTCTCTGA | 19620 |
| CTGCGAAGCA | CCCACAGGGA | GAAGGAATTG | GATGTATCGG | ATGTTGGTAT | TAGATTTTCT | 19680 |
| TTCTCCGTTC | GAGTCTCTGA | CTGGTGCATA | CTTTGCAAAG | GTGTGTTCCT | GGCAATTGCC | 19740 |
| AAGAGTTAGA | AAAATGCACC | TTCTCTGGTG | GCCGTTGGGG | TGTTGTTTCA | CAGGCAGTGG | 19800 |
| TGACAGGGCC | CCTTGGCTGT | GGCTGTCTTC | TCCAGCGCCG | TGGATAAAGA | GACGGGACAG | 19860 |
| ATTCTGTGCC | TCTGTACGAT | TTAGAGCGTA | ACTGACCGCG | TCCAACACCC | GTTTTTCCAC | 19920 |
| TTACAAAGCT | GGTGGTGCGA | CGGGCTTGGT | GTCTCCCGTA | CGGGAAGGAG | GCCTTTGGGC | 19980 |
| CGCTCCAAAG | ACGCCCTGTC | GTAGGAATGG | CCTCTCCATC | CCGCCAAAGT | CCAGCCAGGC | 20040 |
| CCCCGAAATG | GTCCCATTTC | CTTGGAAGCC | TGAGTTTCTG | TTCTGGTCTT | GCTGCTGTCC | 20100 |
| TTGGCCACGT | CAGCACGTGG | GAGCATCTGT | GGATACCGCA | GAGTCTGGGG | ACAGCTGGGC | 20160 |
| GTTTAACCGA | AATGAAGCCG | AGACGGGTTT | CAGGTTTTGG | TGCCAAGCTC | TGGTCAGGAT | 20220 |
| GAAAGGGAAA | TACCAGAGTC | CTCTGTCCTC | GCCTCTGGGT | TTCATGCTGA | CCTTTCTAAC | 20280 |
| ATTTGTTTTC | CCCTAAGAAC | AAGCAGAAGC | CTCCAGCTCC | CTTTAGCTCC | ACAGTTTTCC | 20340 |
| CGGGGACATA | GCGAGGATGG | CACACGGCAG | CCACTCCCAC | GACACACATT | TCGGAGGCAC | 2Ό4ΟΟ |
| TTTGCTGGAA | GCCGCTTGTC | TCCTCCAGCT | TTGGGAGGTC | TGGGGAGGAG | AGAGGCTTTC | 20460 |
| GGTGGACACG | TTTGACATTA | AAAAAAAAAA | AAAAAAAAAA | AAAAAAACTG | GTGCCTAATT | 20520 |
| TATTAAAGAG | AATTAGCTTA | GCGAGTATAT | GCTGATATTC | TTCGACACAC | GTGGGTAAGT | 20580 |
| TGATGCCATT | TATAAATGTT | TTATTGAAAT | TTGATATTTA | ATGAGAAGCC | GGTTAAGGAA | 2064 0 |
| TGTAGACAAT | ATCCCGTTTC | AAAGCTATGA | AATGTGCTAT | TTATTGAAAG | GGGATGTGGC | 20700 |
| TTCACGAGTT | CAGCCCATTG | TACGTGCAGG | TCCCGTGGGA | AGGAGGCAAA | AGCCCCTGCT | 20760 |
| TCTTACTTTG | TGATGTATGT | GCATTTGTTA | TTTATTTTTT | TTTCCTTGGT | CGGACGTTCA | *20820 |
| TAAATATGTA | CTATTTTAAT | TATGTCGAGT | GTAAATTTGA | CATCGCGTTG | CATTTATTTT | 20880 |
| TATATTTCTG | AAAACTGTTG | CTTTTTCTTT | TTCCCTCCCC | CATTGACGAC | ATAGCGGtCC | 20940 |
| CCGCGTCCGG | GTTACAAATA | CATCTACAGA | TATTTTCAGG | GATTGCTTCA | GATGAAAACA | 21000 |
| AATCACACAC | CGTTTCCCAA | ACCAACAGTC | TTCACATTTC | TATCCCTCTG | TTATTGTCGG | 21060 |
| CAGGCGGTGA | GGGGTAGAAA | AAAAACAAAC | AAACAAACAG | AAAAAAAAAC | CAAAAAAAAC | 21120 |
| CACCCTGAGT | TTCTCTGGTG | ACGCCCTCAT | TCTCCTAACG | TTCAATAATC | TCAATGTTGA | 21180 |
| GTTGCAGCAA | CAGACTGTAT | TTTTGTGACG | CCCCGTAGTA | TGAATGTACA | TCTTGTAAAA | 21240 |
• 4
4 «44
CTGAGATATA AATAAACTTA TAAATATTTG TATTCAAGTG TTAAAAAAAA AAAAATTCTC 21300
4 4 4 *
• 44 » 44 44
4 4 4 4
4444 4 ·
4 444 444444
4 4 4 4 4 ·*· ·* ·* * • 44 4
4
| AACCTCTCCC | CTGAGGACAG | gcttattgga | AAAAAAAAAA | AAAAAAAAAA | ATCCTGAGTC | 21360 |
| GGCCGTGGCT | GAACACAGAG | TGTTGTTCTG | CTGCGTGCAT | TTCCAGGGTG | GGTACCCAGT | 21420 |
| GTTGCCCCCC | AGCCTTAGAT | CGGGAGGTAC | CATTGACTTT | TGGTTGTATC | CCATCCCCTT | 21480 |
| CCTTTACTGA | AACCTACCTC | CCCGCTTCTC | AGCCAACGTC | CCCCCAGAAG | GTGGCAAAAA | 21540 |
| AAACAGAGGA | AAAAGCCCTG | ATTTGAATCA | AGTCAGAGCT | GCTAATTCTC | CACTTTCTTT | 21600 |
| ΑΑΤΤ7ΆΤΤΑΑ | TTTATTTTTT | TTTTTGAGAC | TGAGTCTCGC | TCTGTCGCCC | AGGCCGGAGG | 21660 |
| AGTGCAGGGG | CGCGATCTCG | GCTCACCGCG | ACCTCCGCCT | CCCGGGTTCA | AGCGACTCTC | 21720 |
| CTGCCTCAGC | CTCCCGAGTA | GCTGGGATGA | CAGTCACCTG | CACCACCGCG | CCGGGCTCAT | 21780 |
| TTTTGTATTT | TTAGTAGCAA | TGGGGTTTCA | CCGTGTTGGT | CAGGCTGGTC | TCGAACTCCT | 21840 |
| GACCTCGTGA | TCCACCCGCG | TCTGGGCCCG | GCCGGTGATG | TGTGTGCTTT | TAACTTTTAT | 21900 |
| TTTGTTCCAG | TTTTCGACAG | TGGGACGGAT | TTTCCAGCAC | GGTCTTGCAA | GGATGATTGA | 21960 |
| GTCATTTTTG | AGACAAAAAA | TATAATAATA | ATAAATGGAA | AAAGAAATCG | ACTTTTAAAA | 22020 |
| ATGACAAATT | TTTTTTTTTT | TTTTTTGCAT | AGATTTTTCT | CTCTTTATGT | AAAGGAAAGT | 22080 |
| TCATGATTGG | ATTTGGCCGG | CCTGACTGCT | TCCCGGCTGT | GATAAAAAAC | ACATGTGAGC | 22140 |
| TGGGAGGGAA | GTGGGGGAGG | GACACAGCTG | CCCACACAGG | GTTCCCACCG | CGGTTACAGG | 22200 |
| GTGGGCAGTG | CTGGGGGAGC | TTTCTCTGTG | GGGGGCTCAG | AGCCTGAGGA | CAGGTGAGGC | 22260 |
| TCTCCGACAC | CTCCCCAGTT | GCCTGGAGTC | TAAACCGTCC | GTTGTCTGTA | CCGTCCGTTC | 22320 |
| TTCCTGCTGA | CTCCTGGTAG | TTCCTGAAAG | CTTCTCTTGG | CCAGAGAAGG | GGTTTCAGAG | 22380 |
| GCCGTGTGTC | CAGGCCATTC | TGCAAAGTGC | AACTTGACCG | TTCCTTTCCT | TTTCTGGCCT | 22440 |
| GCGTGGTCTG | AAGCTCAGAG | CCCTCTCTTC | ACCCAGCCTG | TGTGTGTCTT | GCCGGACAGA | 22500 |
| AGAAAAATGG | TGCTTTTTGC | GTGTTAGCAG | AGGTGCTTTT | CATGGCTGAC | CTCAACGCGT | 22560 |
| CCATCTCCAG | CCTTGACCAA | GCTGTTTTTT | AGGGGCAAAC | GCAGGCAAGT | TCTGAATGCA | 22620 |
| CACAGTTATT | TCATGGTTAA | ACTATTCAGC | TTTGGCCGGG | CGCAGTGTGG | CTCTCACGCC | 22680 |
| TGTCATCCCA | GCACTTTGGG | AGGCCGAGGC | GGGTGGATCA | CCTGAGGTCA | GGAGTTCGAG | 22740 |
| ACCAGCCTGG | CCAACACGGT | GAAACTCTAT | CTCTACTAAA | AATACAAAAA | TTAGCCGGGC | 22800 |
| GTGGTGGTGT | GTATCTGTAA | TCCCAGCTAC | TCAGGAAGCT | GAGGCAGGAG | AATCGCTTGG | 22860 |
| ACCCAGGAGG | CGGAGGTTGC | ACTGAGCCGA | GATCGCGCCA | TTGCACTCCA | GCCTGGGCG/A | 22920 |
| CAGAGCCAGA | CGCTGTCTCA | AAAAAATGAA | ΤΑΑΤΑΑΛΑΤΑ | AAATAACAGG | AACTAAATAA | 22980 |
| AATAAAACGT | TCAGCTTTGT | TCTGCAAATC | CACTCCTATT | GTTTTACGTG | GTTTGAGAGA | 23040 |
| CTCTGTCCCT | TAGAAATAGA | TGTTTGTTGC | CAATTGTAAT | GAATCTGTTT | CAAAAATGAA | 23100 |
| CAGAATATTC | AAATGGTTTG | AGAGATCTTT | TCCCTTAGAA | ATAGCTTGTT | GCCAATCACA | 23160 |
| AAGAATGTTT | TTCAAAAATG | AATGGAATCT | TCCTGGATAT | CGCTTCCAGA | TCTTCATTTT | 23220 |
| TTTTGCATAG | TTCAACCTGA | AAAGTAAGTG | TCTCAGCCCT | GAATTTCTTT | CTGATTTTTC | 23280 |
| CATGGGTTGT | CTTGCAGACT | TCTCTGGACT | TGACCACATT | TAAAAAAAAA | AAAATTAACT | 23340 |
«9
9 4
9 4«
4 4
4 4
94« ··
9994 9
4 • 4 4«
4 4
4 ·
444 944 «
94
| TTTTCACACG | GACACGGTTT | CAATAGGAAT | GAGATCTTTG | AGTTTTTATG | TAACAGATTC | 23400 |
| TTACCATCAG | TTCTCAGATT | CCCAAATTAC | ACACAAAAAG | CCACGGACTT | CGCCTCCTGC | 234 60 |
| TAACATGTCC | TTCTGTTTCT | GAGGCTTCTG | TTGGTGTTAG | ACTTTCATGT | TTAATAGCAG | 23520 |
| ACAATGTAGG | GATTTAAAGA | AAAATGCAGA | GAAAGCAAAA | ACACTGACCA | AACACACGGA | 23580 |
| GATAAGCTTT | CTAAAGCCTT | TGTTCTTGGA | GTTGTCGTTA | AAAAAAAAAA | GTTGTTTTAA | 23640 |
| ACTTTGCAAG | CATGCCTATA | TTGAACTCAT | AAGCAAGAGA | GCCAAGAAAA | ATAGTGTCGG | 23700 |
| TCGTCTACTC | TACACGTTTT | CCCAAAACAG | ACGTATTTTA | ATTTCTTTTG | TTTGAACTCA | 23760 |
| CAGATGCTGA | GAGTTAAAAG | TTAAATTTTT | GTCATGAACA | ATAGTGGCCA | AAACCACAGT | 23820 |
| TACTTTTGCA | CTATAGCATA | AT7VAGAAAAA | TACAGGCTGG | GCTCGGTGGC | TCACACCTGT | 23880 |
| AATCAAAGCA | CTTTTGGAGG | CGAAACAGCC | AGATCCCTTG | AGCCCAGGAG | ATTGAGACCA | 23940 |
| GCCTGGGCAA | CATAGCGAGA | CCCTCATCTC | TACAAAAAAG | GTTTGTTACA | TATGTAACAA | 2 4000 |
| ACCTGCACAT | TGTGCACATG | TACCCTAAAA | CTTAAAGTAT | AATAATAAAA | AAATTAAAAA | 24060 |
| AAAATTCACC | AATCAACTGC | CTGCTGGTGC | CTTCAAGAGA | CTCACCTAAC | ACATAAGGAC | 24120 |
| TTGCATAAAC | TTATAAAACA | ATTCAATGGA | AGAATCCTTG | AAAGTATTCT | GAGAAGACAG | 24180 |
| TATAATAAAC | TGATTTCTAA | AAAGGCTATA | AAAAATTGAA | TAAATCATTG | TTGGGCATCC | 24240 |
| TGTGCTGAAA | TATAATGCAG | CCAATAAAAA | TTACAAAATG | AATAAACATT | TTATAACAAT | 24300 |
| AAAAAAAAGT | CAAATAATTA | GGCAGGCATG | GTGGTGCTCT | CCTACGGTTG | AAGCTATTCA | 24360 |
| GCAGGCAAGA | GGATACTTTG | TTTTTGTTTT | TTAATTTTTT | TTGAGACAGA | GTCTCGCTCT | 24420 |
| GTTGCCAGGC | TGGAGTGCAG | TGGCGTGATC | TCAGCTCACT | GTAATTTCTG | CCTCCCGGGT | 24480 |
| TCAAGCGATT | TTCCTGCCCC | AGCCTCCCGA | GTAGCTGGGA | TTACAGGTGC | CCGCCACCAC | 24540 |
| ACCTGGCTAA | TTTCTTTTGT | ATTTTTAGTA | GAGACGAGGT | TTCCCCATGT | TGGCCAGGCT | 24600 |
| GGTTTTGAGC | TCCCGACCTC | GGGTGATCCA | CCCGCCTCAG | CCTCCCAAAG | TGCTGGGATG | 24660 |
| ACAGGCGTGA | GCCACCGCGC | CTGGCCCAGG | AGGATTATTT | GATCCCAGGA | GGTGGAGGCT | 24720 |
| GCAGGAAGCC | ATGATTGCAC | CACTGCACTC | CAGCCTGGCT | GACAGAGTGA | GACCACATCT | 24780 |
| CTAAATAAAT | GAATAAATAC | AGGCAGAAAC | TTTTTTTGTT | TTGTTTTGAT | GGAGTCTTGC | *24840 |
| TCTGTCACCA | GGCAGGAGTG | CAGTGGTGCC | ATCTCAGCTC | ACTGCAACCT | CCACCTCCTG | 2 4 900 |
| GGTTCAAGCA | ATCCTCCTGC | CTCAGCCTCC | CGAGTAGCTG | GGATTACAGG | TGCCCGCGAC | 24960 |
| CACGCCCGGC | TAATTTTTTG | TATGTTTAGT | AGAGACGGGA | TTTCACCGTG | TTAGCCAGGA | 25020 |
| TGGTCTTGAT | CTCTTGACTT | TGTGATCTGC | CTGCCTCAGC | CTCCCAAAGT | GCTGGGATTA | 25080 |
| CAGGCATGAG | CCCAGGAGTT | CAAGACCAGC | CTCAGCAACA | AAGTGAGACC | TTTTCTCTCC | 25140 |
| AAAAAATCAA | AAATTTAGCC | AGCTGTGGTG | GCTCCTGCCC | GTGATCCCAG | TACTGTGGGA | 25200 |
| GGCTGAGGCA | GAATTGCTTG | AGCCCAGGAG | TTCGAGACCA | ACCTCAGCAA | AAAGGACTCT | 25260 |
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTATAT ATATATATAT ATATATATAT 25320
| • 76 | • ·« ·· • · · • · ·· · • · · « · • · · * «· ·· ·« | • ·» • · * * • · · · · ···*· · ·»· • « · • ·· | »· « * • · • · · • ·· | |||
| GAGTTTCAAA | AATTGCTGGG | TGACCAGCTC | ATCTACTGGT | TTTCCCCTTG | GGAAAGTGAA | 25380 |
| ATTGTCATGT | ATTGAAGATT | TCCAAGGAAG | TTGTATTGAA | TGAGAAACAA | ACTCAATCTG | 25440 |
| TTCGTGTTTA | AAGAGCTGCA | GTGCGTTTGC | TGTGTTTCCC | ATAAAACTGC | ACTTCCAAAA | 25500 |
| GACACGCTGA | GAAAGGAGAC | CAGGATTTGT | AATTCAGAAA | TTGGAAAGCA | AGTTAGGCTG | 25560 |
| GACGTGGTAG | CTCATGCTTG | TTGTAATCTC | AGCACTCTGG | GAGGCTGAGG | CAGGAGGATC | 25620 |
| ACTTGAGCCC | AGGAGTTCAA | GACCAGCCCG | TGCCACATGG | TGAAACCCTG | TCTCTCCAAA | 25680 |
| AAATAAAACA | TTTAGCCAGA | TGTGGTGACT | CATGCCTGTA | ATCCCGGTAT | TCTGGGAGGC | 25740 |
| TGAGGCAGAG | TTGCTTGAGC | CCAGGAGTTC | AAGACCAGCC | TCGGCAACAA | AGTGAGACCC | 25800 |
| TGTCTCTCCA | AAAAATAAAA | CATTTAGCCA | GCTGTGGTGA | CTCATGCCTG | TAATCTCAGT | 25860 |
| ACTCTGGGAG | GCTGGGGCAG | AATGGCTTGA | GCCCAGGAGT | TCGAGACCAA | CCTCAGCAAC | 25920 |
| AAAGTGAGAT | CTTGTTTGTC | CAAAAAATCA | AAAATTTAGC | CAGCTGTGCT | GGCTCATGCC | 25980 |
| TGTAATCCCG | GTACTCTGGG | AGGCTGAGGC | AGAATCGTTT | GAGCCCAGGA | GTTCGAGACC | 2 6040 |
| AACCTCAGCA | ACAAAGTGAG | ATCTTGTTTC | TCCAAAAAAA | TCAAAAATTT | AGCCAGCTGT | 26100 |
| GCTGGCTGGT | GCCTGTAATC | CCGGTACTCT | GGGAGGCTGA | GGCGGAATTG | CTTGAGCCCA | 2 6160 |
| GGAGTTCAAG | ACCAGCCTCA | GCAACAAAGT | GAGATCTTGT | TTCTCCAAAA | AATAAAACAT | 26220 |
| TTAGTCAGCT | GTGGTGGGTC | AAGCCTGTGA | TCCCAGCATT | TTGGGAGGCC | GAGGCGGGCG | 26280 |
| GATCACGAGG | TCATGAGATC | GAGACCATCC | TGGCTAACAC | GGTGAAACCC | CGTCTCTACT | 26340 |
| AAAAATACAA | AGAAAATTAG | CCGGGCGTGG | TGGCGGGCGC | CTGTAGTCCC | AGCTACTCAG | 26400 |
| GAGGCTGAGG | CAGGAGAÁTG | CCGTGAGCCT | GGGAGGCGGA | CCATGCAGTG | AGTCAAGATC | 26460 |
| GCGCCACTGC | CCTCCAGCCT | GGGCCACAGA | GCAAGACTCC | GTCTCAAAAA | /AAAAAAAAAA | 26520 |
| AAAACTGCTG | CCCAACCTGT | GTTTGCACCA | CTGCCCTCCA | GCCTGGGCAA | CAGAGCAAGA | 26580 |
| CTCCGTCTCA | AAAAAAAAAA | AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCAGCC | 26640 |
| TGGGCAACAG | AGCAAGACTC | CGTCTCAAAA | AAAAAAAAAA | AAAATGCTGC | CCAAGCTGTG | 26700 |
| TTTGCACCAC | TGCCCTCCAG | CCTGGGCAAC | AGAGCAAGAC | TCTGTCTCAA | /AAAAAAAAAA | 26760 |
| AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCGGCC | TGGGCAACAG | AGCAAGACTC | _ 26820 |
| CGTCTCAAAA | AAAAAAAAAA | AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCAGCC | 26880 |
| TGGGCAACAA | AGCAAGCCTC | AGCTTTCTGC | CATCTCCACA | ACCAAGAAAG | CAATTCACAC | 26940 |
| AGAAATCAGT | GGATCGTGCA | GTGACCTCTT | CAGAAAACCA | ATGAGTTTTC | CACCTGAGGA | 27000 |
| ACTGTTTCTG | AGCCCCATTC | AGAAAAACAC | ATCCCTGTAA | CTGCAGGGCA | GATTTACTCA | 27060 |
| CTGTATGCCT | GTTTAAATAA | AGCTTCCAGC | CTCTGCATGG | GGTCTGTCTG | GAAGCTCCTG | 27120 |
| TATCTGTCCC | ACATTCTTGG | AATCACAATG | CACCCTTGGG | AGGAAGATAT | GTATTTAAAG | 27180 |
| GGAGTGGATG | TTATGGTGAG | AAAATGCTGC | CCATCCTTCT | AGAAGACAAA | AGCCACACAA | 27240 |
| AATACATCAC | AAGAACCAGT | TTTTTTCAGA | GAAGAACCTG | CACAAAGAAC | CTGCTCCCCC | 27300 |
| CACACCCCCA | CACACAGGTG | AATTAACAGG | ATGTATGTTT | TATCATAAAA | GCACAGGTTT | 27360 |
·· • · • · • 9 · 9 9 9
9 9 9 9 ·
9·· 99 99 9 • ·· ·· · • ··· • · ···· • 9 99
9 9 9
9 9 9
999 999
9
99
| GTTTCCTATG | CACTCTCTGA | GGATTTGGCC | ATATGCAAAG | ATGTACAAAA | ACCTTCTCTT | 27420 |
| TCCCCAGGGA | ACCGTAACCC | GTCTGAAAAG | ATGCCCTTCT | CAGAAGCGAG | TTGAACGATT | 27480 |
| GTTGGAAAAG | ATAAAATACG | ACGTGCACAC | ACACAGTAGA | GAAATGTCAC | CCATGCAAAT | 27540 |
| TATGTGTTTG | AATGGAACAC | ATTCAGGAAG | CTAAATGGGG | TATGACCACA | CATTTGGGTT | 27600 |
| GATTTATTTG | ACGAGTGGAA | GGGGCAGATG | GAAATGAATA | CTGCTGTTTT | CCTTTGGAAG | 27660 |
| GCCATATATG | GGAATACGAA | GAGGATTACT | TTGGAAGTTT | AGCTTCTCCA | GGTGGTCTCT | 27720 |
| CTCTCTCTCT | CTTTTTTTGA | GACAGAGTCT | CACTCTGTCA | CCCAGGCTGC | AGTGCAATGG | 27780 |
| CGTGCTCTCG | GCTCACTGCA | ACCTCAGCCT | CCCAGGTACA | AGCGATTCTC | CTGCCTCAGC | 27840 |
| CTCCCGAGTA | GCTGGGATCA | CAGGTGTGCA | CCACCACGGC | TGGCTAATGT | TTGTATTTTC | 27900 |
| AGTAGAGATG | AGGTTTTACC | ATGTTGGGCA | GGCTGGTCTT | GAACTCGTGA | CCTCAGGTGA | 27960 |
| TCCGCCTGCC | TCGGCCTCCC | AAAGTGCTGG | GATGACAGAC | ATGAGCTAGC | ACGCCCGGCC | 28020 |
| CCAGGTGGTC | TTTTTAGCGG | GTATTAAAGC | AGCTTTCTCT | CTGAGCCTTA | AACCATGAAG | 28080 |
| ATAGACAGAC | TCAGTGTATG | GGTTTTAGAG | TTGTAATTTT | ATAAAAATAA | GAAAAAGTCG | 28140 |
| ACCTATCATT | GATGGTTAGT | ATTTTTTGTA | GCAGTTGCAT | GCAATATTAG | GATAAGGCAT | 28 200 |
| GTTCTCAAAA | AGAACTCTTT | 3? T T T 3? *5* T | TTTGAGACGG | AGTCTGGCTC | TGTCACCCAG | 28260 |
| GCTGGAGTGC | AGTGGCACGA | TCTCCGCTCA | CTGCAAGCTC | CTCTTCCCGG | GTTCACGCCA | 28320 |
| TTCTCCTGCC | TCAGGCTCCC | CAGTAGCTGG | GACTACAGGC | GCCCGCCACC | ACGGCCGGCT | 28380 |
| AATTTTTTGT | ATTTTTAGTA | GAGACGGGGT | TTCACCATGT | TAGCCAGGAA | GGTCTCGATC | 28440 |
| TCC7GACCTC | ATGATCCC-TC | CGCCTCAGCC | TCCCAAAGTG | CTGGGACTAC | AGGCGTGAGC | 28500 |
| CACTGCACTT | GGCCTTTTTT | TTTTTTTAGA | TGGACTTTTG | CTCTTGTCGC | CCAGGCTGGA | 28560 |
| GTATAATGGC | ATGATCTCGA | CTCACTGCAA | CCTCCGCCTC | CCGAGTTCAA | GCGATTCTCC | 2 8 620 |
| TGCCTCAGCC | TCCCGAGTAG | CTGGGATTAC | AGGTGCCCAC | CACCATGTCA | AGATAATGTT | 2 8 680 |
| TGTATTTTCA | GTAGAGATGG | GGTTTGACCA | TGTTGGCCAG | GCTGGTCTCG | AACTCCTGAC | 28740 |
| CTCAGGTGAT | CCACCCGCCT | TAGCCTCCCA | AAGTGCTGGG | ATGACAGGCG | TGAGCCCCTG | 28800 |
| CGCCCGGCCT | TTGTAACTTT | ATTTTTAATT | TTTTTTTTTT | TTTAAGAAAG | ACAGAGTCTT | *28860 |
| GCTCTGTCAC | CCAGGCTGGA | GGAGAC Γ Gvj Γ | GGGATCATAG | CTCACTGCAG | CC I CzWAC I C | 28920 |
| CTGGGCTCAA | GCAATCCTCC | CACCTCAGCC | TCCTGAGTAG | CTGGGACTAC | AGGCACCČAC | 2 8980 |
| CACCACACCC | AGCTAATTTT | TTTGATTTTT | ACTAGAGACG | GGATCTTGCT | TTGCTGCTGA | 29040 |
| GGCTGGTCTT | GAGCTCCTGA | GCTCCAAAGA | TCCTCTCACC | TCCACCTCCC | AAAGTGTTAG | 29100 |
| AATTACAAGC | ATGAACCACT | GCCCGTGGTC | TCCAAAAAAA | GGACTGTTAC | GTGGATGTTC | 29160 |
| TAGCTTCCTG | TTCTCGTCTT | TTCTTTGTTA | ATTGTACAGT | TTGAGGGTGT | GTGTGCGTGT | 29220 |
| GCGCACGTGT | GTGTGTGCAG | TCTCCTGATT | TCATGTATTT | AATTGTTATT | ACCACCACCT | 29280 |
| CCATCTCTCA | TTCCTTCTTA | CCCTCACTGT | GTAAAGATAC | ATGTTGTTTT | TAAATTTTAT | 29340 |
| GTATTTATAT | TTATTTATTT | GTATTTCTGA | GACAGAGTCT | CACTCTGTTG | CCCAGGCTAG | 29400 |
| TGGCATGATC | TCAGCTCACA | GCAACCTTTG | CCTCCTGGGT | TCAAGCGATT | CTCCTGCCTC | 29460 |
| AGCCTCCCGA | GTAGCTGAGA | TTACAGGCAC | ACACCACCAC | ACCCGGCTAG | TTTTGTTTTG | 29520 |
| AGACGGAGTC | TCGCTCTGTT | GCAGGCTGCA | GTGCAGTGGC | GTGATCCTGG | CTCACTGCAA | 29580 |
| CCTCTGCCTC | CTGGATTCAA | GCGATTCTCC | TGCCTCAGCC | TCCCAAGTAG | CTGGGATTAC | 29640 |
| AGGCGCCCAC | CGCCACACCT | GGCTAATTTT | TTATTGGTAG | TAGAGACGGG | GTTTCTCCAT | 29700 |
| GTTGACCAGA | CTGGTCTTGA | ACTCCCAACC | TCGGGTGATC | CACCCACCTG | GGCCTCCCAA | 29760 |
| AGTGCTGGGA | TGACAGGCGA | GGGCCACCGC | GTCCAGCCTT | CTTCTTCTTC | TTCTTTTTTT | 29820 |
| TTTTTTTAAG | ATGGAGTTTC | ACTCTGTTGC | CCAGGCTGGA | GTGCAGTGGT | GCAATCTCGG | 29880 |
| CTCCCTGGAA | CCTCCACCTC | CCAGGTTCAA | GAAATTCTTT | TGCCTCAGCC | TCCCGAGTAG | 29940 |
| CTGGGACTAC | AGGTGCCCGC | CACCACACCC | ACCTAATGTT | TGTATTTTTT | TGGTAGAGAC | 30000 |
| GGGGCTTCAC | CACATTGGCC | AGGCTGGTCT | TGAACTCCTG | ACTTCAGATG | ATCCTCCTGC | 30060 |
| CTCAGCCTCC | CAGAGTGTTG | GGATTACAGG | CGTGAGCCAC | GGTGCCCGGC | CAGACGTCAT | 30120 |
| GTCTTAGGAA | ATCAGAAAGT | GGGTAGTTTC | CGCACTCTGA | GGAGAAAAAG | AGACGTCCGG | 30180 |
| CGAAGAGAAA | GGAGAGTGAA | AGGATGTCTC | CTCTTGTCTG | TAGCCTGTTC | TCAATCGTGA | 30240 |
| GTGAGCCAAT | TGCCAGAAAC | TGAGGGTGCT | TCATTTGGCC | AGGCAAGCTT | CTCAACAGAA | 30300 |
| TGTCTAAGTA | CTTGTTAATG | CTGAGAAGCT | CTCCAAGCTA | CTGCACTCCA | GCCTGGGTGA | 30360 |
| CAGAGCACGA | CCTTGTCTGA | AAACAATTAA | TTAATCAATT | AATTAATATA | ATGAAATCAT | 30420 |
| ACTGAACTCA | GGAGACCATT | GGGGTGGGCA | GGGCTGGGGT | TGGAAAGGAA | CATAAAATAT | 30480 |
| GGTGCAATGG | actttgctcc | AGTCTCCCTC | CCCATCTCTT | CTCGCCAAGA | GTCTCTGGAG | 30540 |
| GGAGCATGGG | GAAGATGCTT | TGGGAATCTG | TAACTTCTTG | TCTTGTAAAC | AGAATATCTA | 30600 |
| AGTAATTGTT | AATGCTGAGA | AGTTATAGAT | TTCCAAAGCC | TTTCTCCAGG | CTACGGACAA | 30660 |
| GGGTCATGGG | TTACTCAGTG | TTACAGAAAG | AATGACATGG | AGATGTTTGT | TACATCTTAA | 30720 |
| GGAACCATGA | GGGGCCAGAG | TATTTTACTC | TAAGTG7AGA | TGGTACATTG | GCCACGCCTG | 30780 |
| TCCCAACACC | ACCAATGGTG | GCACCTAACT | TTTGTGTTTG | TGCCCCACAT | TTCTTCTTCT | 30840 |
| TTTCTGACGT | AAATGCAAGT | GATATTCCTT | GGAAACCATG | CTGCAGCAAG | AGGCCATCTG | 30900 |
| ACTACTAGTG | ATACCCTGTA | GCTCACCTAC | AGCAGCTCAC | TTGAAGCAGC | TCACČCATAG | 30960 |
| CTCAGGTATA | GCTCACCTGC | AGCGGCTCAC | CTGTAGCTCA | CGTGTAGCTC | ACTTGTAGCA | 3 1020 |
| GCTCACTGGT | AGCTCACCTG | CAGCAGCTCA | CCTGTACCTC | ACCTGTACCT | CACCTGCAGC | 31080 |
| AGCTCACCTG | TAGCTCACCT | GTACGTGAGC | CACCGTACCC | GGCCAGCAAG | ACCCCATTTC | 31140 |
| TAAAATAAAT | ACACAAAAAT | TAGCCGGACG | CGGTGGCGCG | TGTCTGTAGT | TGTAGCTACT | 31200 |
| CAGGAGGCTG | AGGTGGGAGG | ATTGCTGGAG | GCTGGGAGGT | AGAGGCTGCA | GTGAACCGTG | 31260 |
| ATCCAGCCAC | TGTACTCTAG | CCTGGATGAC | ATAGCAAAAC | CTTGTCTCAA | AAAACAAAAA | 31320 |
| CAAAAAACAA | AACAAAGAAA | CAAACAAAAA | ACCCACACAC | ACCGGAAAAC | AAAACAAAAA | 31380 |
• ·0 · ··· · · · · • 0 Q · 0 0000 0 000 000
0 0 0 0 · ·
| 79 | •to ·· ·· | 0 | ||||
| GCAAAAAGGA | AAGAAAAGAG | AGCCAGGTCC | CAAATATATA | TTTCCTTGGA | GAACCATTTG | 31440 |
| CAAAGAGCAC | ACTTAAGGCC | GGGCGCGGTG | GCTCACGCCT | GTCATCCCGG | CACTTTGGGA | 31500 |
| GGCCGAGGTG | GGTGGATCAC | GAGGTTGGGA | GATCGÁGACC | ATCCTGGCCA | ACATGGCGAA | 31560 |
| ACCCCATCTC | TACTAAAAAT | ACAAAAAATC | AGCCAGGTGC | TGAGGCAGGT | GCCTGTAGTC | 31620 |
| CCAGCCACTC | AGGAGGCTGA | GGCAGGAGAA | TGGCATGAAC | CTGGGAGGTG | GAGGTTGGAG | 31680 |
| TGAGCCGAGA | TCGCGCCCCT | GCACTCCAGC | CTGGGCGACA | GAGCGAGACT | CCTTCTCAAA | 31740 |
| TAAATAAATA | AATAAATAAC | AAAGAGCAAA | CTTAAAATTG | TCTCAGAAAT | CCCACGGGAT | 31800 |
| ATTGGATCTC | CCTCATGCCT | ATCTGATGAC | ACTTTGAGTG | TCTGGGGCCC | CGTGCCTATT | 318 60 |
| TTCTGGGGTT | CCCAGAAGCT | GCCGTTCTGA | AAGTGTGGCT | CTCGGGGACG | TGGCACAGGT | 31920 |
| GTGGATGTCT | GTTTTAAATG | TCAGGCGTTT | GGACGTTGAG | GAACGTGAGG | CTGAAGGTCG | 31980 |
| GCTTCGCCGA | CCCCCTGAGT | TTAGGGTCCT | gccttttaaa | ATCTTCCCAG | CACTCTGTTG | 32040 |
| TTCACGCAAG | CGTCCCATCT | GTTTGGGTGG | CCGTGCCGTC | TGCATCTGTC | TCGAACCTTC | 32100 |
| ACAGCTTTGC | AGAATATCCT | GTTTCTCAAT | ACGGATGGAG | AAACACGAGA | CGCGTTTTCT | 32160 |
| GGGTTATTTT | AGCCGTCACG | GAGAACCCCA | GACTGATGTG | TGCTAATGAC | CTCATTAATG | 32220 |
| ATACTCTGAG | GCAGACAGCC | CTGCCTGATC | TTAACAACAT | TTTTTAAATT | TCTTTTTTTG | 32280 |
| TTGTTGTTGT | TACAGCATCA | TTCATATAAC | GTAGGAAACC | GTGATCAGTA | GCTTTTAGGA | 32340 |
| TATTTGCAAC | AGGGTGTAAC | ADAAABD | 32367 |
(2) Informace o sekvenci SEQ ID NO: 15:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 806 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (iii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOT (ix) RYSY:
(A) NÁZEV/KLÍČ: CDS (B) POZICE: 43..615 (xi) POPIS SEKVENCE: SEQ ID NO: 15:
| GTGTCCCCGG | AGCTGAAAGA | TCGCAAAGAG | GATGCGAAAG | GGATGGAGGA | CGAAGGCCAG | 60 |
| ACCAAAATCA | AGCAGAGGCG | AAGTCGGACC | AATTTCACCC | TGGAACAACT | CAATGAGCTG | 120 |
| GAGAGGCTTT | TTGACGAGAC | CCACTATCCC | GACGCCTTCA | TGCGAGAGGA | ACTGAGCCAG | 180 |
| CGACTGGGCC | TGTCGGAGGC | CCGAGTGCAG | GTTTGGTTTC | AAAATCGAAG | AGCTAAATGT | 240 |
| AGAAAACAAG | AAAATCAACT | CCATAAAGGT | GTTCTCATAG | GGGCCGCCAG | CCAGTTTGAA | 300 |
| GCTTGTAGAG | TCGCACCTTA | TGTCAACGTA | GGTGCTTTAA | GGATGCCATT | TCAGCAGGTT | 360 |
| CAGGCGCAGC | TGCAGCTGGA | CAGCGCTGTG | GCGCACGCGC | ACCACCACCT | GCATCCGCAC | 420 |
«· »44 ·· • 4 4 4 4 4
4 4 * 4 ·
4 4 4 4 »44 44 44 ř» 4 4 4 4 4 4
4
4 4
| CTGGCCGCGC | ACGCGCCCTA | CATGATGTTC | CCAGCACCGC | CCTTCGGACT | GCCGCTCGCC | 480 |
| ACGCTGGCCG | CGGATTCGGC | TTCCGCCGCC | TCGGTAGTGG | CGGCCGCAGC | AGCCGCCAAG | 540 |
| ACCACCAGCA | AGGACTGCAG | CATCGCCGAT | CTCAGACTGA | AAGCCAAAAA | GCACGCCGCA | 600 |
| GCCCTGGGTC | TGTGACVCCA | ACGCCAGCAC | CAATGTCGCG | CCTGTCCCGC | GGCACTCAGC | 660 |
| CTGCASNCCC | TNDDKANMCG | TTRCTYHTCM | ATTACACTTT | GGGACCYCGG | GDBAGVCCTT | 720 |
| TTNNAGACTT | YVATKGGSCW | CSCTGGBCCC | TBRKGAWAC | TTGSGHYCGR | GAACCGAKHT | 780 |
| GCCCABAYGA | GGACCRGTTT | GGAKDG | 806 |
(2) Informace o sekvenci SEQ ID NO: 16:
(i) CHARAKTERISTIKA SEKVENCE:
| (A) | DÉLKA: 190 aminokyselin | |
| (B) | TYP: aminokyselina | |
| (C) | DRUH ŘETĚZCE: jednořetě | |
| (D) | TOPOLOGIE: lineární | |
| (ii) | TYP | MOLEKULY: peptid |
| (xi) | POPIS | SEKVENCE: SEQ ID NO: 16: |
| Met 1 | Glu | Asp | Glu | Gly 5 | Gin | Thr | Lys | Ile | Lys 10 | Gin | Arg | Arg | Ser | Arg 15 | Thr |
| Asn | Phe | Thr | Leu 20 | Glu | Gin | Leu | Asn | Glu 25 | Leu | Glu | Arg | Leu | Phe 30 | Asp | Glu |
| Thr | His | Tyr 35 | Pro | A3p | Ala | Phe | Met 40 | Arg | Glu | Glu | Leu | Ser 4 5 | Gin | Arg | Leu |
| Gly | Leu 60 | Ser | Glu | Ala | Arg | Val 55 | Gin | Val | Trp | Phe | Gin 60 | Asn | Arg | Arg | Ala |
| Lys 65 | Cys | Arg | Lys | Gin | Glu 70 | Asn | Gin | Leu | His | Lys 75 | Gly | Val | Leu | Ile | Gly 80 |
| Ala | Al a | Ser | Gin | Phe 85 | Glu | Ala | Cys | Arg | Val 90 | Ala | Pro | Tyr | Val | Asn 95 | Val |
| Gly | Ala | Leu | Arg 100 | Met | Pro | Phe | Gin | Gin 105 | Val | Gin | Ala | Gin | Leu 110 | Gin | Leu |
| Asp | Ser | Ala 115 | Val | Ala | Hi 3 | Ala | His 120 | His | Hi 3 | Leu | His | Pro 125 | His | Leu T | Ala |
| Ala | His 130 | Ala | Pro | Tyr | Met | Met 135 | Phe | Pro | Ala | Pro | Pro 140 | Phe | Gly | Leu | Pro |
| Leu 145 | Ala | Thr | Leu | Ala | Ala 150 | Asp | Ser | Ala | Ser | Ala 155 | Ala | Ser | Val | Val | Ala 160 |
| Ala | Ala | Ala | Ala | Ala 165 | Ly3 | Thr | Thr | Ser | Ly3 170 | Asp | Ser | Ser | Ile | Ala 175 | Asp |
| Leu | Arg | Leu | Lys | Ala | Lys | Lys | His | Ala | Ala | Ala | Leu | Gly | Leu |
180 185 .. 190
Změněné nároky
·«· ····♦· ·· • · · * 99 9 99· • · 9 9
Claims (35)
- PATENTOVÉ NÁROKY1. Molekula nukleové kyseliny kódující polypeptidy, které obsahují oblast homeoboxu tvořenou 60-ti aminokyselinami a mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulační aktivitu lidského růstu a dále obsahují nukleotidovou sekvenci SHOX ET93 (SEQ ID NO:2) a nukleotidovou sekvenci SHOX ET45 (SEQ ID NO: 4).
- 2. Molekula DNA podle nároku 1, která kóduje polypeptid, jehož délka je 150 až 350 aminokyselin.
- 3. Molekula DNA podle libovolného z nároků 1 nebo 2, která dále obsahuje nukleotidovou sekvenci SHOX G310 (SEQ ID NO: 3).
- 4. Molekula DNA podle libovolného z nároků 1 až 3, která dále obsahuje nukleotidovou sekvenci SHOX G108 (SEQ ID NO: 5).
- 5. Molekula DNA podle libovolného z nároků 1 až 4, která dále obsahuje nukleotidovou sekvenci SHOX Va (SEQ ID NO: 6) nebo SHOX Vb (SEQ ID NO: 7) .
- 6. Molekula DNA podle libovolného z nároků 1 až 5, která kóduje polypeptid vybraný ze skupina, která zahrnuje:a) transkripční faktor A, který má v podstatě aminokyselinovou sekvenci (SEQ ID NO: 11),b) transkripční faktor B, který má v podstatě aminokyselinovou sekvenci (SEQ ID NO: 13).
- 7. Sekvence DNA podle libovolného z nároků 1 až 6, přičemž DNA je genomová nebo izolovaná DNA odpovědná za regulaci lidského růstu.φφ φφ φ φ φ φ Φ· φ · • φφφ φ φ φ φ φ φφ φφΦΦΦΦ φφφ φφ r φ φ φ » φ φ φ φφφ φφφΦ φ φ φ φ φ
- 8. Sekvence DNA podle libovolného z nároků 1 až 6, přičemž DNA je cDNA.
- 9. cDNA podle nároku 8, která v podstatě obsahuje nukleotidovou sekvenci SHOXa (SEQ ID NO: 10) nebo SHOXb (SEQ ID NO: 12).
- 10. DNA podle nároku 7, která v podstatě obsahuje nukleotidovou sekvenci genu SHOX (SEQ ID NO: 14).
- 11. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 11) (transkripční faktor SHOXa), nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu
- 12. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 13) (transkripční faktor SHOXb), nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu.
- 13. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 16) (transkripční faktor SHOT) , nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu.
- 14. cDNA kódující protein, který má aminokyselinovou sekvenci danou v (SEQ ID NO: 11), (SEQ ID NO: 13) nebo (SEQ ID NO: 16).
- 15. Farmaceutická kompozice, vyznačuj ící se tím, že obsahuje protein podle libovolného z nároků11, 12 nebo 13..)99 99 99 9 9 9 9 ·9999 9 99« 99 999 999999999999 9 9 • 9999 99 » 99 999 99 9999 999
- 16. Způsob léčby malé výšky vyznačující se tím, že zahrnuje subjektu, je-li to nutné, terapeuticky účinné proteinu podle nároku 11, 12 nebo 13.postavy, aplikaci množství
- 17. Použití proteinu podle nároku 11, 12 nebo 13 při přípravě farmaceutické kompozice vhodné pro léčbu malé výšky postavy.
- 18. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při přípravě farmaceutické kompozice pro léčbu vad spojených s mutacemi genu odpovídajícího za malou výšku postavy.
- 19. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při přípravě kitu pro identifikaci jedinců, kteří mají genetický defekt odpovědný za poškození lidského růstu.
- 20. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při identifikaci genu odpovědného za malou výšku lidské postavy.
- 21. Způsob stanovení malé výšky postavy na základě molekul RNA nebo DNA, vyznačující se tím, že molekula biologického vzorku, který se zkoumá, se amplifikuje v přítomnosti dvou nukleotidových sond komplementárních s libovolnou ze sekvencí DNA uvedených v SEQ ID NO: 2 až SEQ ID NO: 7 a následně se stanoví pomocí vhodného detekčního systému.<*99 9· 99 9 9 · • 999 9 9999 999 9 9 9 99 9 9 9 999999 99 9 ·99 9 99 9 9
- 22. Použití způsobu podle nároku 21 při identifikaci osob, které mají genetický defekt odpovědný za malou výšku postavy.
- 23. Transgenní zvíře nebo zvíře s deaktivovaným genem, vyznačující se tím, že je transformované genem odpovědným za malou výšku postavy, který obsahuje sekvenci DNA podle libovolného z nároků 1 až 10 nebo 14.
- 24. Buňky transformované sekvencí DNA podle libovolného z nároků 1 až 10 nebo 14.
- 25. Testovací systém, vyznačující se tím, že je vhodný pro identifikaci nebo testování činidel použitelných při léčbě malé výšky lidské postavy, který zahrnuje buňky podle nároku 24.
- 26. Způsob identifikace nebo testování kandidátů farmaceutických činidel použitelných při léčbě vad vztahujících se k mutacím genu odpovídajícího za malou výšku postavy, vyznačující se tím, že zahrnuje testovací systém podle nároku 25 a stanovení změn fenotypu uvedených buněk nebo změn produktů exprese uvedených buněk po té, co se uvedené buňky dostanou do kontaktu s uvedenými kandidáty farmaceutických činidel.
- 27. Expresivní vektor, vyznačující se tím, že obsahuje molekulu DNA podle nároků 1 až 10 nebo 14, která je schopna způsobit expresi kódovaného polypeptidu.
- 28. Způsob in vivo léčby genovou terapií vad růstu u lidí spojených alespoň s jednou mutací v genu SHOX nebo SHOT, vyznačující se tím, že zahrnuje zavedení expresivního plazmidu do lidských buněk, ve kterém molekula DNA podle libovolného z nároků 1 až 10 nebo 14 je začleněna ve • »· »· · • ·»«9 9 99»99» 9 * »· « • 9 99 9 99 99999» ·» ·999 9 99 9 9999 999999 směru 3'konce polynukleotidu od expresivního promotoru, jenž způsobuje expresi v lidské hostitelské buňce.
- 29. Způsob podle nároku 28, vyznačuj ící se tím, zeje vhodný pro léčbu Turnérova syndromu nebo malé výšky postavy.
- 30. Použití lidských růstových proteinů nebo jejich funkčních fragmentů, které mají regulační aktivitu lidského růstu, při přípravě léků pro léčbu pacientů, jenž vykazují genetickou mutaci genů lidského růstu SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) s tou podmínkou, že je vyloučena příprava léků pro léčbu pacientů trpících Turnérovým syndromem.
- 31. Použití lidských růstových proteinů nebo jejich funkčních fragmentů, které mají regulační aktivitu lidského růstu, při přípravě léků pro léčbu pacientů, jenž vykazují genetickou mutaci genů lidského růstu SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) a u nichž se použitím molekul DNA schopných hybridizovat se sekvencí DNA genů lidského růstu SHOX nebo SHOT zjistilo, že mají genetický defekt odpovědný za malou výšku postavy, s tou podmínkou, že je vyloučena příprava léků pro léčbu pacientů trpících Turnérovým syndromem.
- 32. Použití podle nároků 30 až 31, kde genetická mutace je způsobena horkým místem mutace v sekvenci DNA kódující bod zkrácení proteinu v pozici aminokyseliny 195 v lidském růstovém genu SHOX.
- 33. Použití podle libovolného z nároků 30 až 32, kde lidský růstový protein je lidský růstový hormon.
- 34. Způsob léčby pacientů vykazujících vady způsobené mutacemi lidských růstových genů SHOX (SEQ ID NO: 8) nebo SHOT • 44 • 4 44444 4 4 444444 4444 (SEQ ID NO: 15) , vyznačující se tím, že zahrnuje aplikaci pacientovi, je-li to nutné, farmaceuticky aktivní množství lidského růstového proteinu s tou podmínkou, že se vyloučí léčba pacientů trpících Turnérovým syndromem.
- 35. Způsob léčby pacientů vykazujících vady způsobené mutacemi lidských růstových genů SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) a u nichž se použitím molekul DNA schopných hybridizovat se sekvencí DNA lidských růstových genů SHOX nebo SHOT zjistilo, že mají genetický defekt odpovědný za malou výšku postavy, vyznačující se tím, že zahrnuje aplikaci pacientovi, je-li to nutné, farmaceuticky aktivní množství lidského růstového proteinu s tou podmínkou, že je vyloučena léčba pacientů trpících Turnérovým syndromem.• ·« ·· * . ·· ·· · φ φ φ φφφφ φ φ · · φ φφφ « φφ · • φ φφφ φ φφφφ · φφφ φφφ ···«·· · φΦΦΦ·· φφ « φ» φφ
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US2763396P | 1996-10-01 | 1996-10-01 | |
| EP97100583 | 1997-01-16 | ||
| PCT/EP1997/005355 WO1998014568A1 (en) | 1996-10-01 | 1997-09-29 | Human growth gene and short stature gene region |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CZ96699A3 true CZ96699A3 (cs) | 1999-08-11 |
| CZ297640B6 CZ297640B6 (cs) | 2007-02-21 |
Family
ID=26145174
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CZ0096699A CZ297640B6 (cs) | 1996-10-01 | 1997-09-29 | Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití |
Country Status (20)
| Country | Link |
|---|---|
| US (2) | US7252974B2 (cs) |
| EP (2) | EP1260228A3 (cs) |
| JP (2) | JP2000515025A (cs) |
| KR (1) | KR20000048838A (cs) |
| CN (1) | CN1232499A (cs) |
| AT (1) | ATE230026T1 (cs) |
| AU (1) | AU744188C (cs) |
| BR (1) | BR9712185A (cs) |
| CA (2) | CA2647169A1 (cs) |
| CZ (1) | CZ297640B6 (cs) |
| DE (1) | DE69718052T2 (cs) |
| DK (1) | DK0946721T3 (cs) |
| ES (1) | ES2188992T3 (cs) |
| HU (1) | HU225131B1 (cs) |
| IL (1) | IL129015A0 (cs) |
| NO (1) | NO991554L (cs) |
| NZ (1) | NZ334970A (cs) |
| PL (1) | PL194248B1 (cs) |
| SI (1) | SI0946721T1 (cs) |
| WO (1) | WO1998014568A1 (cs) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2368223A1 (en) * | 1999-03-19 | 2000-09-28 | Craig A. Rosen | 48 human secreted proteins |
| CA2368469A1 (en) * | 1999-03-26 | 2000-10-05 | Craig A. Rosen | 50 human secreted proteins |
| WO2002083921A2 (en) | 2001-04-10 | 2002-10-24 | Agensys, Inc. | Nuleic acids and corresponding proteins useful in the detection and treatment of various cancers |
| US7927597B2 (en) | 2001-04-10 | 2011-04-19 | Agensys, Inc. | Methods to inhibit cell growth |
| US20040248132A1 (en) | 2001-10-04 | 2004-12-09 | Toshiyuki Sakai | DR5 gene promoter and siah-1 gene promoter |
| EP1583554A2 (en) * | 2003-01-13 | 2005-10-12 | Gudrun Rappold-Hoerbrand | Use of natriuretic peptides for the treatment of stature disorders related to the shox gene |
| EP1877577A2 (en) | 2005-04-15 | 2008-01-16 | Epigenomics Inc. | Methods and nucleic acids for analyses of cellular proliferative disorders |
| US7382944B1 (en) | 2006-07-14 | 2008-06-03 | The United States Of America As Represented By The Administration Of The National Aeronautics And Space Administration | Protective coating and hyperthermal atomic oxygen texturing of optical fibers used for blood glucose monitoring |
| PL2258871T3 (pl) * | 2007-01-19 | 2014-10-31 | Epigenomics Ag | Sposoby i kwasy nukleinowe do analizy zaburzeń proliferacyjnych komórki |
| EP2994541A4 (en) * | 2013-05-06 | 2017-01-18 | Capilet Genetics AB | Diagnostic test for skeletal atavism in horses |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3445933A1 (de) * | 1984-12-17 | 1986-06-19 | Röhm GmbH, 6100 Darmstadt | Arzneimittel mit diuretischer wirksamkeit |
| US4983511A (en) * | 1989-01-09 | 1991-01-08 | Olin Corporation | Method and kit for detecting live microorganisms in chlorine- or bromine-treated water |
-
1997
- 1997-09-29 CN CN97198471A patent/CN1232499A/zh active Pending
- 1997-09-29 EP EP02011329A patent/EP1260228A3/en not_active Withdrawn
- 1997-09-29 SI SI9730485T patent/SI0946721T1/xx unknown
- 1997-09-29 WO PCT/EP1997/005355 patent/WO1998014568A1/en not_active Ceased
- 1997-09-29 ES ES97944906T patent/ES2188992T3/es not_active Expired - Lifetime
- 1997-09-29 NZ NZ334970A patent/NZ334970A/xx unknown
- 1997-09-29 CA CA002647169A patent/CA2647169A1/en not_active Abandoned
- 1997-09-29 AU AU46252/97A patent/AU744188C/en not_active Ceased
- 1997-09-29 PL PL97332568A patent/PL194248B1/pl not_active IP Right Cessation
- 1997-09-29 IL IL12901597A patent/IL129015A0/xx unknown
- 1997-09-29 KR KR1019990702836A patent/KR20000048838A/ko not_active Withdrawn
- 1997-09-29 CZ CZ0096699A patent/CZ297640B6/cs not_active IP Right Cessation
- 1997-09-29 CA CA002267097A patent/CA2267097A1/en not_active Abandoned
- 1997-09-29 JP JP10516222A patent/JP2000515025A/ja active Pending
- 1997-09-29 EP EP97944906A patent/EP0946721B1/en not_active Expired - Lifetime
- 1997-09-29 BR BR9712185-1A patent/BR9712185A/pt unknown
- 1997-09-29 AT AT97944906T patent/ATE230026T1/de active
- 1997-09-29 DK DK97944906T patent/DK0946721T3/da active
- 1997-09-29 DE DE69718052T patent/DE69718052T2/de not_active Expired - Lifetime
- 1997-09-29 HU HU9904175A patent/HU225131B1/hu not_active IP Right Cessation
-
1999
- 1999-03-30 NO NO991554A patent/NO991554L/no not_active Application Discontinuation
-
2002
- 2002-05-31 US US10/158,160 patent/US7252974B2/en not_active Expired - Fee Related
-
2004
- 2004-03-02 JP JP2004058276A patent/JP2004201692A/ja active Pending
-
2007
- 2007-05-15 US US11/748,769 patent/US20090111744A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| US20090111744A1 (en) | 2009-04-30 |
| AU744188B2 (en) | 2002-02-14 |
| EP1260228A3 (en) | 2003-03-05 |
| JP2000515025A (ja) | 2000-11-14 |
| NZ334970A (en) | 2000-12-22 |
| NO991554D0 (no) | 1999-03-30 |
| DK0946721T3 (da) | 2003-04-14 |
| US7252974B2 (en) | 2007-08-07 |
| PL194248B1 (pl) | 2007-05-31 |
| WO1998014568A1 (en) | 1998-04-09 |
| EP1260228A2 (en) | 2002-11-27 |
| CA2267097A1 (en) | 1998-04-09 |
| ES2188992T3 (es) | 2003-07-01 |
| CZ297640B6 (cs) | 2007-02-21 |
| HUP9904175A2 (hu) | 2000-04-28 |
| CA2647169A1 (en) | 1998-04-09 |
| PL332568A1 (en) | 1999-09-27 |
| HUP9904175A3 (en) | 2002-01-28 |
| JP2004201692A (ja) | 2004-07-22 |
| ATE230026T1 (de) | 2003-01-15 |
| KR20000048838A (ko) | 2000-07-25 |
| AU4625297A (en) | 1998-04-24 |
| HU225131B1 (en) | 2006-06-28 |
| AU744188C (en) | 2003-07-24 |
| NO991554L (no) | 1999-05-14 |
| EP0946721B1 (en) | 2002-12-18 |
| DE69718052D1 (de) | 2003-01-30 |
| CN1232499A (zh) | 1999-10-20 |
| BR9712185A (pt) | 1999-08-31 |
| US20030059805A1 (en) | 2003-03-27 |
| DE69718052T2 (de) | 2003-07-31 |
| SI0946721T1 (en) | 2003-06-30 |
| IL129015A0 (en) | 2000-02-17 |
| EP0946721A1 (en) | 1999-10-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2021200783B2 (en) | Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4) | |
| RU2745324C2 (ru) | Композиции и способы модулирования экспрессии tau | |
| TWI834177B (zh) | 用於減少tau表現之組合物及方法 | |
| RU2768285C1 (ru) | Олигонуклеотиды для модуляции экспрессии тау-белка | |
| ES2792126T3 (es) | Método de tratamiento basado en polimorfismos del gen KCNQ1 | |
| KR20130123357A (ko) | 저산소증과 관련된 질환의 진단방법 및 키트 | |
| AU744188C (en) | Human growth gene and short stature gene region | |
| US6262334B1 (en) | Human genes and expression products: II | |
| US6566061B1 (en) | Identification of polymorphisms in the PCTG4 region of Xq13 | |
| CN115362255A (zh) | 用无七之子2(sos2)抑制剂治疗眼科疾患 | |
| CA2433869C (en) | Gene for identifying individuals with familial dysautonomia | |
| US20160250182A1 (en) | Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson's disease risk | |
| CA2348657C (fr) | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante | |
| CN111278468A (zh) | 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞 | |
| Class et al. | Patent application title: Human Growth Gene and Short Stature Gene Region Inventors: Gudrun Rappold-Hoerbrand (Heidelberg, DE) Ercole Rao (Riedstadt, DE) | |
| KR20240032895A (ko) | 미토겐-활성화된 단백질 키나제 키나제 키나제 15 (map3k15) 억제제를 이용한 대사 장애 치료 방법 | |
| US20160184454A1 (en) | Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson's disease risk | |
| MXPA99002809A (en) | Human growth gene and short stature gene region | |
| US6627745B1 (en) | Pyrin gene and mutants thereof, which cause familial Mediterranean fever | |
| KR100968360B1 (ko) | Her-2 유전자 복제수 변화에 의해 발생되는 유방암의 진단 방법 | |
| RU2805557C2 (ru) | Варианты b4galt1 и их применение | |
| HK1023146A (en) | Human growth gene and short stature gene region | |
| US20030203380A1 (en) | Gene linked to osteoarthritis | |
| CN116606920A (zh) | 一种定性分析和定量分析基因rilpl1的试剂盒 | |
| CN116355923A (zh) | 先天性心脏病相关dgkd基因新发变异位点及其应用 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PD00 | Pending as of 2000-06-30 in czech republic | ||
| MM4A | Patent lapsed due to non-payment of fee |
Effective date: 20110929 |