JPH09224686A - プラテノリドシンターゼ遺伝子 - Google Patents

プラテノリドシンターゼ遺伝子

Info

Publication number
JPH09224686A
JPH09224686A JP9034678A JP3467897A JPH09224686A JP H09224686 A JPH09224686 A JP H09224686A JP 9034678 A JP9034678 A JP 9034678A JP 3467897 A JP3467897 A JP 3467897A JP H09224686 A JPH09224686 A JP H09224686A
Authority
JP
Japan
Prior art keywords
ala
gly
leu
val
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9034678A
Other languages
English (en)
Inventor
Stanley Gene Burgett
スタンリー・ジーン・バーゲット
Stuart Allen Kuhstoss
スチュアート・アラン・クストス
Ramachandra Nagaraja Rao
ラマチャンドラ・ナガラジャ・ラオ
Mark A Richardson
マーク・アラン・リチャードソン
Paul Robert Rosteck Jr
ポール・ロバート・ロステック・ジュニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eli Lilly and Co
Original Assignee
Eli Lilly and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eli Lilly and Co filed Critical Eli Lilly and Co
Publication of JPH09224686A publication Critical patent/JPH09224686A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • C12P19/62Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin the hetero ring having eight or more ring members and only oxygen as ring hetero atoms, e.g. erythromycin, spiramycin, nystatin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/08Oxygen as only ring hetero atoms containing a hetero ring of at least seven ring members, e.g. zearalenone, macrolide aglycons

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 【課題】 ポリケチドプラテノリドの合成を指揮する多
機能タンパク質をコードする、Streptomyces ambofaci
ensから単離されるDNA分子を提供する。 【解決手段】 配列番号1で表されるDNA分子、およ
びそれらのサブモジュールを含むDNA分子を提供する
ことにより、上記課題を解決することができる。

Description

【発明の詳細な説明】
【0001】本発明は、ポリケチドプラテノリド(plate
nolide)の合成を指揮する多機能タンパク質をコードす
る役目を担う、Streptomyces ambofaciensから単離さ
れるDNAに関する。本発明はまた、具体的には、スピ
ラマイシン並びにスピラマイシンのアナログおよび誘導
体を含め、プラテノリド構造に基づいた抗生物質活性を
示す化合物を製造するための該DNAの使用にも関す
る。
【0002】スピラマイシンは、Streptomyces ambofa
ciens(ATCC 15154)により産生される、獣医学
およびヒト医学の両方において有用なマクロライド抗生
物質である。スピラマイシンは、糖残基が3つ結合した
16員の環状ラクトン、プラテノリドである。スピラマ
イシンの抗生物質活性は、抗生物質のリボソームへの結
合に伴う機構による、そのタンパク質合成阻害によるも
のであると考えられている。スピラマイシンは、構造的
には、別の抗生物質、チロシン(tylosin)に類似してお
り、また両方の生合成経路は類似していることが知られ
ている。
【0003】チロシンの生合成は、完全に研究されてい
る(Baltzら、Antimicrobial Agents and Chemother
apy、20(2):214−225(1981);Beck
mannら、Genetics and Molecular Biology of Indu
strial Microorganisms、(1989):176−18
6)。ポリケチドは、脂肪酸合成に関係あると考えられ
る一般的な機構的スキームによって合成される。環状ラ
クトンのフレーム構造は、小さなカルボン酸残基を伴う
一連の縮合により製造される。ケト還元、脱水およびエ
ノリル還元といったような、構造修飾もまたプロセシン
グ中に起こる。その合成は、ポリケチドシンターゼと呼
ばれる、1組の大きな多機能タンパク質により行われ
る。
【0004】PCT公開公報 WO 93/13663
は、Saccharapolyspora erythraeaのポリケチドシンタ
ーゼをコードする遺伝子の構築を記載している。その遺
伝子はモジュールに構築され、各々のモジュールは1つ
の縮合段階を達成する。鎖伸長の正確な配列および伸長
鎖のプロセシングは、各々のモジュールにおける遺伝情
報により決定される。このPCT出願は、環状ラクトン
フレーム構造の生合成を支配するDNAを幾つかの方法
で操作することにより、新規ポリケチド構造物を合成す
る方法を記載している。しかし、この方法論を他のポリ
ケチドに適応させるためには、まず最初に、生合成プロ
セシングを指揮するDNA分子を単離しなければならな
い。
【0005】本発明は、プラテノリドシンターゼをコー
ドする役目を担う遺伝子クラスターのDNA配列、スピ
ラマイシンの基本的な構造ブロックであるプラテノリド
の構築機構に関する。その結果、本発明は、伸長ポリケ
チド鎖に組み込まれるカルボン酸の数および種類を変え
るため、および行われる縮合後プロセシングの種類を変
えるため設計された、このDNA配列の修飾から生ず
る、プラテノリドをベースとした新規スピラマイシン関
連ポリケチドを合成するのに必要とされる情報を提供す
る。
【0006】本発明は、プラテノリドシンターゼドメイ
ンをコードする、単離されたDNA配列を含んでなるD
NA分子を提供する。従って、本発明は、配列番号1の
DNA分子、およびそれらのサブモジュールを含むDN
A分子を提供する。本発明はまた、該DNA分子により
コードされる産物、組換えDNA発現ベクター、および
トランスフォームされた微生物宿主細胞も提供する。本
発明はさらに、プラテノリド構造をベースとした新規抗
生物質のスクリーニング方法に関する。
【0007】図1は、S.ambofaciens DNAのsrmG領
域のマップを示す。距離(単位 kb)をsrmGの最初を基準
として示す。オープンリーディングフレーム(ORF)を
矢印(block arrows)で示す。srmG DNA(0−42kb)
は、プラテノリドPKS領域である。Ap、G、E、
K、P、およびXという印は各々、Apal、BglII、Ec
oRI、KpnI、PstIおよびXhoI制限部位を示す。s
rmG DNAに関して予想されるドメインを、示したよ
うに標識化する。ACPは、アシルキャリアータンパク
質を表す;ATは、アシルトランスフェラーゼを表す;
DHは、デヒドラターゼを表す;ERは、エノイルレダ
クターゼを表す;KRは、ケトレダクターゼを表す;K
Sは、ケトシンターゼを表す;またKS'は、通常のケ
トシンターゼにおいて、活性部位システインにより占め
られる位置にグルタミン残基が存在する、ケトシンター
ゼ様ドメインを表す。KR'は、ケトレダクターゼに似
ているが、不活性であると予想されるドメインである。
【0008】図2は、プラテノリド合成に関する生合成
経路を説明する。Aは、マロニル−CoAを示す;B
は、エチルマロニル−CoAを示す;Pは、メチルマロ
ニル−CoAを示す;C2は、マロニル−CoAに関係あ
るが、未知の構造のCoA誘導体を示す。
【0009】図3は、srmG DNAの全領域に及ぶ2つ
のクローンのマップを示す。
【0010】ポリケチドという用語は、小さなカルボン
酸の逐次縮合によって生成される、一群の分子を定義す
る。この多様なグループには、植物フラボノイド、真菌
アフラトキシン、並びに抗菌性、抗真菌性、抗腫瘍性、
および駆虫性を示す、何百もの様々な構造の化合物が含
まれる。真菌および細菌により産生される幾つかのポリ
ケチドは、胞子形成または他の発生経路と関連がある;
他のものは、帰する機能をまだ有していない。幾つかの
ポリケチドは、1以上の薬理作用を有する。ポリケチド
構造の多様性は、それらの広範囲にわたる種々の生物学
的特性を反映する。多くの環化ポリケチドは、1または
それ以上の部位でグリコシド化を受け、また事実上全て
が、それらの合成中に、ヒドロキシル化、還元、エポキ
シ化等によって修飾される。
【0011】この種の化合物の一般的な特徴は、その合
成が「ポリケチドシンターゼ」と呼ばれる、多機能ペプ
チドの複合体により指揮されるということである。ポリ
ケチドシンターゼ遺伝子の分子遺伝分析により、様々な
ポリケチドに作用する、2つの異なった種類の酵素が明
らかとなっている:(a)本質的には、反復プロセスに
よって製造される芳香族化合物;(b)僅かな、非常に
大きなポリペプチドにおいて並べられる、同じ活性の幾
つかの繰返しを含んでなる複合ポリケチド。複合ポリケ
チドシンターゼ遺伝子の間での一般的な特徴は、それら
が、通例、幾つかのオープンリーディングフレーム(O
RFs)に並べられ、この各々が、モジュールと呼ばれ
る、1またはそれ以上の繰返し単位を含むことである。
各々のモジュールは、1つの縮合段階をプロセスし、ま
た典型的には、アシルキャリアータンパク質(ACP)、
β−ケトシンターゼ(KS)、およびアシルトランスフェ
ラーゼ(AT)を含め、幾つかの酵素により成し遂げられ
る幾つかの活性を必要とする。
【0012】従って、「モジュール」は、一巡の合成、
すなわち、1つの縮合段階およびそれらと関連する全て
のβ−カルボニルプロセシング段階において必要とされ
る異なった活性を全て担う、多機能タンパク質セグメン
トをコードする遺伝要素と定義される。各々のモジュー
ルは、合成の縮合部分を成し遂げるためのACP、K
S、およびAT活性、並びにβ−カルボニルプロセシン
グを行うための選択された縮合後活性をコードする。従
って、各々のモジュールはさらに、複合ポリケチドシン
ターゼの異なった活性をコードする役目を担うサブモジ
ュールの包含により特徴付けられる。従って、「サブモ
ジュール」は、異なった活性または「ドメイン」をコー
ドする、ポリケチドシンターゼDNA配列の一部と定義
される。異なった活性またはドメインは、一般的には、
ある異なった活性に必要なポリケチドシンターゼポリタ
ンパク質の部分を意味すると考えられる。
【0013】各々のモジュールに対応するタンパク質セ
グメントは、シンターゼ単位(SUs)と呼ばれる。各々
のSUは、ポリケチドを完成させるのに必要な脂肪酸様
サイクルの1つを担う;それは、縮合工程に、組み込ま
れるべき特定のエキステンダー単位(ジカルボキシレー
トの補酵素Aチオエステル)を選択するのに、またβ−
炭素が受けるであろうプロセシングの範囲に必要とされ
る要素を有する。サイクル完了後、新生ポリケチドは、
それが占めるACPから、利用される次のSUのKSに
転移され、ここで、適当なエキステンダー単位およびプ
ロセシングレベルが取り入れられる。このプロセスは、
プログラムされた長さに達するまで、新たなSUを各々
の伸長サイクルに使用して、繰返される。長鎖脂肪酸の
合成でのように、伸長サイクルの数が分子の長さを決定
する。しかし、脂肪酸合成は、反復して使用される1つ
のSUを伴うが、複合ポリケチドの形成は、各々のサイ
クルに対して様々なSUの参入を必要とし、それによっ
て、正確な分子構造が作り出されることを確実なものと
する。ポリケチドシンターゼ遺伝子モジュールの組成は
変更可能である。β−ケトレダクターゼ(KR)、デヒド
ラターゼ(DH)、およびエノイルレダクターゼ(ER)ド
メインの完全なコンプリメントをもたらすものもあれ
ば、配列のほとんどが保存されているけれども、ある特
定のドメインのみをコードするもの、または機能ドメイ
ンを欠くものもある。
【0014】ポリケチド前駆体の合成における非対称性
(asymmetry)と関連がある、この変更可能なモジュール
の組成により、ある特定の段階を各々のモジュールにあ
てがうことが可能となる。各々の酵素活性は、その経路
中の1つの生化学的段階に関与するので、いずれか1つ
活性が欠けると、その合成における1つの段階のみに影
響を与えるであろう。ポリケチドの構造とポリケチドシ
ンターゼ遺伝子の構築との間の相互関係に関する知識に
より、予想される構造を有するポリケチド誘導体を製造
する、変化した遺伝子を選択的に作り出すことが可能と
なる。
【0015】プロセシングの程度は、ある特定のSUに
おける機能ドメインの存在に依存するらしいので、この
ように製造された、変化した鎖を、後の合成段階の基質
として利用することができる場合にのみではあるが、K
R、DH、またはERの不活性化は、1つの部位があま
りプロセシングされていないポリケチドを結果として生
ずるであろう。従って、これらのドメインの1つの不活
性化は、ケトン、ヒドロキシル、または対応する位置に
不飽和部位を保有するポリケチドの形成を結果として起
こすであろう。この原理が、KRまたはERドメインが
不活性化されてしまった菌株からの、変化したエリスロ
マイシン誘導体の首尾よい製造を導いた。
【0016】従って、ポリケチドシンターゼの遺伝的な
介入により、また修飾段階を加える、または排除するこ
とより、ポリケチド経路を操作することができる。後ポ
リケチド修飾に関与する酵素の多くは、ある特定の構造
に対する絶対特異性を有していないらしい。加えて、ポ
リケチドおよび後ポリケチド生合成の遺伝子のライブラ
リーから所望の成分を選択し、それらを合わせて、新規
構造物を作り出すこともまたできる。
【0017】本発明は、特に、プラテノリドの生合成を
担うポリケチドシンターゼ、すなわち、プラテノリドシ
ンターゼをコードするDNA配列を提供する。プラテノ
リド自体は、スピラマイシン関連ポリケチドの基礎であ
る。プラテノリドシンターゼ遺伝子クラスターを規定す
るプラテノリドシンターゼDNA配列は、プラテノリド
シンターゼの種々の異なった活性をコードすることによ
り、プラテノリドポリケチドの生合成を指揮する。
【0018】プラテノリドシンターゼの遺伝子クラスタ
ーは、その構築が明らかにされている他のポリケチド生
合成遺伝子のように、各々が、先に定義したような、モ
ジュールと呼ばれる、1またはそれ以上の繰返し単位を
含む、幾つかのORFの存在により特徴付けられる。各
々のモジュールにはさらに、先に定義したような、サブ
モジュールもまた含まれる。Streptomyces ambofacien
sから誘導されるプラテノリドシンターゼ遺伝子クラス
ターの構築を図1に示す。それに伴う合成経路、および
各々の縮合反応に使用される特異的カルボン酸基質、お
よびプラテノリド合成の縮合後活性を図2に示す。
【0019】Streptomyces ambofaciensから単離され
たプラテノリドシンターゼ遺伝子クラスターを含んでな
る好ましいDNA分子は、配列番号1で表される。本発
明の他の好ましいDNA分子には、個々の多機能ポリペ
プチドをコードする、配列番号1の種々のORFが含ま
れる。これらは、全て配列番号1において、ORF1、
350〜14002、ORF2、14046〜2003
6、ORF3、20110〜31284、ORF4、3
1329〜36071、およびORF5、36155〜
41830で表される。これらの配列によりコードされ
る種々のペプチドの、予想されるアミノ酸配列を、配列
番号2、3、4、5、および6に示す。
【0020】本発明のさらなる他の好ましいDNA分子
には、一巡の合成に必要な活性を全てコードするモジュ
ールが含まれる。これらは、全て配列番号1において、
スターターモジュール、392〜3424、モジュール
1、3527〜8197、モジュール2、8270〜1
3720、モジュール3、14148〜19730、モ
ジュール4、20215〜24678、モジュール5、
24742〜31002、モジュール6、31428〜
35837、およびモジュール7、36257〜413
95で表される。これらのモジュールによりコードされ
る種々のシンターゼ単位の、予想されるアミノ酸配列
は、配列番号2において、スターターSU、15〜10
25、SU1、1060〜2616、およびSU2、2
641〜4457;配列番号3において、SU3、35
〜1895;配列番号4において、SU4、36〜15
23、およびSU5、1545〜3631;配列番号5
において、SU6、34〜1503;全て配列番号6に
おいて、SU7、35〜1747で表される。
【0021】さらなる他の好ましいDNA分子には、プ
ラテノリドシンターゼの種々のドメインをコードする種
々のサブモジュールが含まれる。これらのサブモジュー
ルは、配列番号1におけるスターターモジュールの、K
S'(s)、392〜1603、AT(s)、1922〜2
995、およびACP(s)、3173〜3424;配列
番号1におけるモジュール1の、KS1、3527〜4
798、AT1、5135〜6208、KR1、704
3〜7597、およびACP1、7946〜8197;
配列番号1におけるモジュール2の、KS2、8270
〜9541、AT2、9899〜10909、DH2、
10985〜11530、KR2、12596〜131
53、およびACP2、13469〜13720;配列
番号1におけるモジュール3の、KS3、14148〜
15422、AT3、15789〜16844、DH
3、16914〜17510、KR3、18612〜1
9166、およびACP3、19479〜19730;
配列番号1におけるモジュール4の、KS4、2021
5〜21486、AT4、21889〜22872、K
R'4、23638〜24159、およびACP4、2
4484〜24678;配列番号1におけるモジュール
5の、KS5、24742〜26016、AT5、26
371〜27381、DH5、27442〜2796
6、ER5、28843〜29892、KR5、299
05〜30462、およびACP5、30760〜31
002;配列番号1におけるモジュール6の、KS6、
31428〜32696、AT6、33024〜340
22、KR6、34770〜35327、およびACP
6、35586〜35837;配列番号1におけるモジ
ュール7の、KS7、36257〜37528、AT
7、37898〜38905、KR7、39851〜4
0408、ACP7、40658〜40909、および
TE、41297〜41395で表される。これらのサ
ブモジュールによりコードされる種々のドメインの、予
想されるアミノ酸配列は、配列番号2におけるスタータ
ーSUの、KS'(s)、15〜418、AT(s)、52
5〜882、およびACP(s)、942〜1025;配
列番号2におけるSU1の、KS1、1060〜148
3、AT1、1596〜1953、KR1、2232〜
2416、およびACP1、2533〜2616;配列
番号2におけるSU2の、KS2、2641〜306
4、AT2、3184〜3520、DH2、3546〜
3727、KR2、4083〜4268、およびACP
2、4374〜4457;配列番号3におけるSU3
の、KS3、35〜459、AT3、582〜933、
DH3、957〜1155、KR3、1523〜170
7、およびACP3、1812〜1895;配列番号4
におけるSU4の、KS4、36〜459、AT4、5
94〜921、KS04、1177〜1350、および
ACP4、1459〜1523;配列番号4におけるS
U5の、KS5、1545〜1969、AT5、208
8〜2424、DH5、2445〜2619、ER5、
2912〜3261、KR5、3266〜3451、お
よびACP5、3551〜3631;配列番号5におけ
るSU6の、KS6、34〜456、AT6、566〜
898、KR6、1148〜1333、およびACP
6、1420〜1503;配列番号6におけるSU7
の、KS7、35〜458、AT7、582〜917、
KR7、1233〜1418、ACP7、1502〜1
585、およびTE、1715〜1747で表される。
【0022】如何なる特定の技術説明にも拘束されるこ
とを望むものではないが、配列の類似性が、種々のポリ
ケチドシンターゼ遺伝子におけるドメイン境界の間に存
在する。従って、当業者は、既知のポリケチドシンター
ゼ遺伝子の配列情報に基づいて、新たに発見されたポリ
ケチドシンターゼ遺伝子のドメイン境界を予想すること
ができる。特に、本出願におけるサブモジュール、ドメ
イン、およびオープンリーディングフレームの境界は、
本出願で開示する配列情報、およびエリスロマイシンポ
リケチドシンターゼのドメイン境界の位置に基づいて予
想される(Donadioら、GENE、111 51−60
(1992))。さらに、プラテノリドシンターゼ遺伝
子クラスターの遺伝子構築は、プラテノリドの合成を完
成するのに必要とされる反応の順序に対応するらしい。
これは、ポリケチドシンターゼDNA配列を操作して、
予想される変化を最終的なプラテノリド産物において起
こすことができることを意味する。
【0023】プラテノリドシンターゼ遺伝子のDNA配
列は、Streptomyces ambofaciens、特に菌株 ATCC
15154のDNAより製造された組換えDNAクロ
ーンから決定することができる。プラテノリドシンター
ゼ遺伝子は、組換えDNAベクター pKC1080およ
びpKC1306に含まれ(図1)、これらは、pKC10
80の場合にはB−21500(1995年9月21日
に寄託された)、またpKC1306の場合にはB−21
499(1995年9月21日に寄託された)という寄託
番号の下、各々、E.coli DH10Bにおいて、Natio
nal Center for Agricultural Utilization Resear
ch、1815 North University Street、Peoria、
Illinois 61604−3999から入手することがで
きる。
【0024】細菌DNAを単離する技術は、容易に利用
することができ、また当業界で周知である。そのような
技術はいずれも、本発明において利用することができ
る。これらの寄託された培養物に由来するDNAは特
に、次のように単離することができる。E.coli DH1
0B/pKC1080またはE.coli DH10B/pKC
1306の親液性物質(lyophils)を、100μg/mlの
アプラマイシンを含むL−アガー(1リットルにつき、
トリプトン10g、NaCl 10g、酵母エキス5g、
およびアガー15g)プレート上にプレートして、菌株
の単一コロニー単離を得る。このコロニーを使用して、
100μg/mlのアプラマイシンを含むL−ブロス(1リ
ットルにつき、トリプトン10g、NaCl 10g、酵
母エキス5g)約500mlに播種して、その結果生ずる
培養を、細胞が定常期に達するまで、通気しながら37
℃でインキュベートする。当業界で既知の方法に従っ
て、コスミドDNAを、それらの細胞から得ることがで
きる(例えば、Raoら、1987、Methods in Enzymo
logy、153:166を参照)。
【0025】本発明のDNAを、放射性同位体標識また
は蛍光標識のいずれかを用いての、ジデオキシヌクレオ
チド連鎖停止法(Sangerら、Proc.Natl.Acad.Sci.
74:5463(1977))のような、当業界で知ら
れている、いずれかの技術を利用して配列決定すること
ができる。二本鎖スーパーコイルDNAを、配列に特異
的なオリゴヌクレオチドプライマーを用いての、配列決
定反応における鋳型に直接使用することができる。ある
いはまた、フラグメントを使用して、バクテリオファー
ジ M13におけるランダム、オーバーラップ配列、ま
たはプラスミドベクターにおけるネスティッド(neste
d)、オーバーラップ欠失のいずれかのライブラリーを製
造することができる。次いで、個々の組換えDNAサブ
クローンを、ベクターに特異的なオリゴヌクレオチドプ
ライマーを用いて配列決定することができる。放射性反
応生成物を変性ポリアクリルアミドゲル上で電気泳動し
て、オートラジオグラフィーにより分析する。蛍光標識
化反応生成物を電気泳動して、Applied Biosystems
(ABI Division、Perkin Elmer、Foster City、
CA 94404) モデル 370Aおよび373Aまた
はDupont(Wilmington、DE) Genesis DNAシーク
エンサーで分析する。配列データを集め、Genetic Ce
nter Group(GCG、Madison、WI) プログラム Ge
lAssembleおよびSeqedまたはABI モデル 670
Inherit Sequence Analysisシステム並びにAutoAs
semblerおよびSeqEd プログラムを用いて、編集す
る。
【0026】ドメイン、サブモジュール、モジュール、
合成単位(SU)、またはオープンリーディングフレーム
に対応するポリペプチドは、組換えDNAベクター中の
cDNA配列で、細菌、酵母、または真核細胞発現シス
テムといったような宿主細胞をトランスフォームするこ
とにより製造することができる。本発明を実施するため
に、宿主細胞および多数の組換えDNA発現ベクターの
中から選択することは、十分、当業者の範囲内である。
ポリケチドプラテノリドシンターゼの多機能ポリペプチ
ドを、Streptomyces ambofaciensのようなプラテノリ
ド産生細菌から抽出し、または無細胞インビトロ翻訳系
で翻訳することができる。加えて、合成化学の技術を利
用して、先に挙げた幾つかのポリペプチドを合成するこ
とができる。
【0027】組換え宿主細胞中で生成されたタンパク質
を単離および精製するための方法および技術は、当業界
で知られている。例えば、細菌におけるポリケチドシン
ターゼの精製に関する詳細な記述としては、Roberts
ら、Eur.J.Biochem. 214、305−311(19
93)およびCaffreyら、FEBS 304、225−
228(1992)を参照。ポリペプチドの均質な製造
を達成するために、粗製の細胞抽出物中のタンパク質
を、当業界で周知の様々なカラムによって、一回または
数回、サイズおよび/または電荷により分離することが
できる。特に、粗製の細胞抽出物は、DEAE−セルロ
ースカラムのような、市販されている種々のセルロース
カラムに適用することができる。続いて、結合したタン
パク質を溶離することができ、またその画分をポリケチ
ドプラテノリドシンターゼまたは操作された誘導体タン
パク質の存在に関して試験することができる。標的タン
パク質を検出する技術は、当業界において容易に利用す
ることができる。そのような技術はいずれも、本発明に
利用することができる。特に、その画分は、そのような
ポリケチドプラテノリドシンターゼタンパク質の一部ま
たは部分に対して生じた抗体を用いての、Westernブロ
ットで分析することができる。ポリケチドプラテノリド
シンターゼタンパク質を含む画分をプールして、当業界
で周知の、さらなるカラムを通すことにより、例えば、
プールした画分をゲル濾過カラムに適用することによ
り、さらに精製することができる。SDS−PAGEゲ
ルで視覚化すると、均質な製造物はシングルバンドを含
み、また実質的には、他のタンパク質は存在しない。
【0028】プラテノリドシンターゼDNA配列、その
遺伝子構築、および遺伝子の個々のオープンリーディン
グフレーム、モジュール、およびサブモジュールと関連
する活性に関する知識は、さもないと入手できない予想
される構造を有する新規ポリケチドの製造を可能とす
る。使用される最初のカルボン酸構造ブロックを変える
か、またはいずれかの縮合段階で加えられる構造ブロッ
クを変えるDNA配列に対する修飾を行ってもよい。プ
ラテノリドシンターゼ遺伝子をまた、行われる縮合段階
の実際の数を変え、それによって、炭素骨格の大きさを
変えるために、修飾してもよい。本発明の一部であるサ
ブモジュールを選択的に不活性化し、それによって、予
想される新規ポリケチド構造を生ぜしめてもよい。縮合
後プロセシング活性をコードするDNA配列の部分に対
する修飾は、炭素鎖骨格における種々の縮合部位に生ず
る官能基を変えるであろう。
【0029】当業者は、遺伝コードの縮退を十分よく知
っている。その結果、当業者は、この開示により与えら
れる具体的なDNA配列を修飾して、本明細書中で具体
的に提供されるポリペプチドと比べて、同じ、または改
良された特性を有するタンパク質を提供することができ
る。また、当業者は、DNA配列を修飾して、より高い
レベルで発現するが、与えらたタンパク質と同じタンパ
ク質を発現させることができる。さらに、当業者は、本
発明に包含される組換えDNAベクターまたはコード配
列を製造するのに有用であろうDNA配列を、部分的
に、または全体として、合成的に製造する方法をよく知
っている。加えて、与えられたDNA配列を修飾するた
めの組換え方法には、例えば、部位特異的欠失または部
位特異的変異が含まれる。これらの技術は、当業者に周
知であり、またここで、さらなる詳細を必要としない。
その結果、本明細書中で使用するように、天然源から単
離され、合成により、もしくは半合成により製造される
DNA、または組換えDNA法により修飾されるDNA
は、本発明の範囲内である。
【0030】同様に、当業者は、本発明のポリペプチド
が組換えにより発現され得ることを認識するであろう。
あるいはまた、これらのポリペプチドは、従来の既知の
非組換え技術;例えば、固相合成によってもまた、部分
的に、または全体的に合成され得る。従って、本発明
は、幾つかの具体的なベクター構築、または例示される
具体的なポリケチドシンターゼ分子の製造方法に必ず限
定されるものと解釈されるべきではない。本発明のポリ
ペプチドを製造するための、これらの変更方法が、本発
明に包含されることを意味する。
【0031】多くの環化ポリケチドは、1またはそれ以
上の部位でグリコシド化を受ける。スピラマイシンは、
糖残基が3つ結合した16員の環状ラクトン、プラテノ
リドである。プラテノリドをスピラマイシンに転換する
方法は、当業界で周知である。本発明はまた、プラテノ
リドをベースとした、新規スピラマイシン関連ポリケチ
ドを合成するのに必要とされる情報も提供する。その原
理は、既に上記されている。加えて、ここで開示された
DNA配列情報に基づいた、インビボまたはインビトロ
における転写後または翻訳後修飾から生ずる生成物はい
ずれも、本発明に包含されることを意味する。
【0032】以下の実施例は、例示目的のためだけ提供
するものであって、先に広い用語で記載されている本発
明の範囲を限定しようと意図するものではない。
【0033】
【実施例】実施例 1 具体的な実験の詳細およびプラテノリドシンターゼの配
列決定から得られた結果 図3で示した領域の、隣接す
る、またはオーバーラップするDNAセグメントを含
む、組換えDNAサブクローンの挿入断片を配列決定す
ることにより、S.ambofaciens プラテノリドシンター
ゼ(srmG)遺伝子のDNA配列を得ることができる。srm
Gを表す配列は全て、オーバーラップするコスミドクロ
ーン pKC1080およびpKC1306に完全に含ま
れている(図3)。0.3kb、8.2kb、14.1kb、20.
2kb、29.5kb、31.4kb、41.1kbおよび42.0
kbの位置1でNruI部位により結合したフラグメントを
サブクローンして、配列決定することにより、その配列
を得ることができる。1つのフラグメント上でsrmG領
域を得るために、位置1でNruI部位および25.0kb
でSfuI部位により結合した25.0kbのフラグメント
を、制限酵素 NruIおよびSfuIを用いて、pKC10
80の部分消化から単離すべきである。25.0kbおよ
び42.8kbでSfuI部位により結合した17.8kbのD
NAフラグメントを、制限酵素 SfuIを用いて、pKC
1306の消化から単離すべきである。その結果生ずる
フラグメントをライゲートして、適当な組換えDNAベ
クター中でクローン化すべきである。2つのライゲート
されたフラグメントのうち、正しい方向のものを含むク
ローンを、制限酵素部位マッピングにより同定すること
ができる。
【0034】本発明の原理、好ましい態様および操作の
方法を、前述の明細書中に記載している。しかし、保護
されることを意図する発明は、開示された特定の形態に
限定されるものとして解釈されるべきではない。何故な
ら、それらは、限定的なものというよりはむしろ説明的
なものとして見なされるべきだからである。本発明の精
神から逸脱することなく、変化および変更が当業者によ
り行われ得る。
【0035】
【配列表】
【0036】配列番号:1 配列の長さ:44377 配列の型:核酸 鎖の数:一本鎖 トポロジー:直鎖状 配列の種類:DNA(ゲノム) 配列の特徴 特徴を表す記号:CDS 存在位置:350..14002 配列の特徴 特徴を表す記号:CDS 存在位置:14046..20036 配列の特徴 特徴を表す記号:CDS 存在位置:20110..31284 配列の特徴 特徴を表す記号:CDS 存在位置:31329..36071 配列の特徴 特徴を表す記号:CDS 存在位置:36155..41830 配列 GACCGCTCGG GGAGACCTGA CATATTCGTC GCGAAGTGGT TGTCCGCGCC GCGAGGTACT 60 GAAATCTTCT CCGCTCGCCC AGGACTCCGC GTGCAGGTCA CCGGAGTGCG CGACCGGCCG 120 GGACGTCGGA GCGCCGACCC TGCGGACCTG GTGCGATGCC GTGTGGTCCC GCATGATCCC 180 GCGCCGTCTC CGGTGACGAG AATCGGTGGA CAATCTCCGA ACTTGACACA ATTGATTGTC 240 GTTCACCGGC CGTTCCTGTC GCCCGGCAGT TCGCCCGCTG TACGCTCGGG AAGATCAAGA 300 AAAGGCAGAA AAGCCACGGC GTGGTACGGC GAACATATGA GGGATGCAGG TGTCTGGAGA 360 ACTCGCGATT TCCCGCAGTG ACGACCGGTC CGACGCCGTT GCCGTGGTCG GAATGGCGTG 420 CCGGTTTCCC GGCGCCCCGG GAATTGCCGA ATTCTGGAAA CTGCTGACCG ACGGAAGGGA 480 CGCGATCGGC CGGGACGCCG ACGGCCGCCG GCGCGGCATG ATCGAGGCGC CCGGCGACTT 540 CGACGCCGCC TTCTTCGGCA TGTCACCCCG CGAGGCCGCC GAGACCGACC CCCAGCAGCG 600 CCTGATGCTC GAACTCGGCT GGGAGGCTCT GGAGGACGCC GGCATCGTCC CCGGCTCCCT 660 GCGCGGCGAG GCGGTCGGCG TCTTCGTCGG GGCCATGCAC GACGACTACG CCACCCTGCT 720 CCACCGCGCC GGCGCGCCGG TCGGCCCCCA CACCGCCACC GGCCTCCAGC GCGCCATGCT 780 CGCCAACCGG CTCTCCTACG TCCTGGGGAC GCGCGGCCCC AGCCTCGCGG TCGACACCGC 840 CCAGTCGTCC TCCCTGGTCG CCGTGGCCCT CGCCGTCGAG AGCCTGCGGG CCGGCACCTC 900 CCGCGTCGCC GTCGCCGGGG GCGTCAACCT GGTCCTCGCC GACGAGGGAA CGGCCGCCAT 960 GGAACGCCTC GGCGCGCTGT CACCCGACGG CCGCTGCCAC ACCTTCGACG CCCGTGCCAA 1020 CGGCTATGTC CGCGGTGAGG GCGGCGCCGC CGTCGTCCTG AAGCCCCTCG CCGACGCCCT 1080 GGCCGACGGG GACCCCGTGT ACTGCGTGGT GCGTGGCGTC GCCGTCGGCA ACGACGGCGG 1140 CGGCCCCGGG CTGACCGCTC CCGACCGCGA GGGACAGGAG GCGGTGCTCC GGGCCGCCTG 1200 CGCCCAGGCC CGGGTCGACC CCGCCGAGGT GCGTTTCGTC GAACTGCACG GCACGGGAAC 1260 CCCGGTGGGC GACCCGGTCG AGGCACACGC CCTCGGCGCG GTGCACGGCT CCGGTCGGCC 1320 GGCCGACGAC CCCCTGCTGG TGGGGTCGGT GAAGACCAAC ATCGGCCACC TGGAGGGCGC 1380 CGCCGGCATC GCGGGCCTGG TCAAGGCCGC ACTGTGCCTG CGGGAACGCA CCCTTCCCGG 1440 CTCGCTGAAC TTCGCCACCC CCTCTCCGGC CATCCCGCTG GACCAGCTCC GGCTGAAGGT 1500 GCAGACCGCT GCCGCCGAGC TGCCGCTCGC CCCGGGCGGC GCACCCCTGC TGGCGGGTGT 1560 CAGTTCGTTC GGCATCGGTG GCACCAACTG CCATGTGGTC CTGGAACACC TGCCCTCCCG 1620 GCCCACCCCG GCCGTCTCCG TCGCCGCCTC GCTTCCGGAC GTCCCGCCGC TGTTGTTGTC 1680 CGCGCGGTCG GAGGGGGCGT TGCGGGCGCA GGCGGTGCGG TTGGGTGAGT ACGTGGAGCG 1740 GGTGGGCGCG GATCCGCGGG ATGTGGCTTA TTCGCTGGCT TCGACGCGGA CTCTTTTCGA 1800 GCACCGTGCG GTGGTGCCGT GTGGTGGGCG TGGGGAGCTC GTCGCTGCTC TTGGTGGGTT 1860 TGCTGCCGGG AGGGTGTCTG GGGGTGTGCG GTCCGGGCGG GCTGTGCCGG GTGGGGTGGG 1920 GGTGTTGTTC ACGGGTCAGG GTGCGCAGTG GGTTGGTATG GGGCGTGGGT TGTATGCGGG 1980 GGGTGGGGTG TTTGCGGAGG TGCTGGATGA GGTGTTGTCG ATGGTGGGGG AGGTGGATGG 2040 TCGGTCGTTG CGGGATGTGA TGTTCGGCGA CGTCGACGTG GACGCGGGTG CCGGGGCTGA 2100 TGCGGGTGCC GGTGCGGGTG CTGGGGTCGG TTCTGGTTCC GGTTCTGTGG GTGGGTTGTT 2160 GGGTCGGACG GAGTTTGCTC AGCCTGCGTT GTTTGCGTTG GAGGTGGCGT TGTTCCGGGC 2220 GTTGGAGGCT CGGGGTGTGG AGGTGTCGGT GGTGTTGGGT CATTCGGTGG GGGAGGTGGC 2280 TGCTGCGTAT GTGGCGGGGG TGTTGTCGTT GGGTGATGCG GTGCGGTTGG TGGTGGCGCG 2340 GGGTGGGTTG ATGGGTGGGT TGCCGGTGGG TGGGGGGATG TGGTCGGTGG GGGCGTCGGA 2400 GTCGGTGGTG CGGGGGGTTG TTGAGGGGTT GGGGGAGTGG GTGTCGGTTG CGGCGGTGAA 2460 TGGGCCGCGG TCGGTGGTGT TGTCGGGTGA TGTGGGTGTG CTGGAGTCGG TGGTTGCCTC 2520 GCTGATGGGG GATGGGGTGG AGTGCCGGCG GTTGGATGTG TCGCATGGGT TTCATTCGGT 2580 GTTGATGGAG CCGGTGTTGG GGGAGTTCCG GGGGGTTGTG GAGTCGTTGG AGTTCGGTCG 2640 GGTGCGGCCG GGTGTGGTGG TGGTGTCGGG TGTGTCGGGT GGGGTGGTGG GTTCGGGGGA 2700 GTTGGGGGAT CCGGGGTATT GGGTGCGTCA TGCGCGGGAG GCGGTGCGTT TCGCGGATGG 2760 GGTGGGGGTG GTGCGTGGTC TGGGTGTGGG GACGTTGGTG GAGGTGGGTC CGCATGGGGT 2820 GCTGACGGGG ATGGCGGGTG AGTGCCTGGG GGCCGGTGAT GATGTGGTGG TGGTGCCGGC 2880 GATGCGGCGG GGCCGTGCGG AGCGGGAGGT GTTCGAGGCG GCGCTGGCGA CGGTGTTCAC 2940 CCGGGACGCC GGCCTGGACG CCACGGCACT CCACACCGGG AGCACCGGCC GGCGCATCGA 3000 CCTCCCCACC TACCCCTTCC AACGCCGTAC CCACTGGTCG CCCGCGCTGA GCCGGCCGGT 3060 CACGGCCGAC GCCGGGGCGG GTGTGACCGC CACCGATGCC GTGGGGCACA GCGTCTCCCC 3120 GGACCCGGAG AGCACCGAGG GGACGTCCCA CAGGGACACG GACGACGAGG CGGACTCGGC 3180 GTCACCGGAG CCGATGTCCC CCGAGGATGC CGTCCGCCTG GTCCGCGAGA GCACCGCGGC 3240 CGTCCTGGGC CACGACGATC CCGGCGAGGT CGCGCTCGAC CGCACCTTCA CCTCCCAGGG 3300 CATGGACTCG GTGACCGCGG TCGAGCTGTG CGACCTGCTG AAGGGCGCCT CGGGGCTCCC 3360 CCTCGCCGCC ACGCTGGTCT ACGACCTGCC CACCCCGCGT GCCGTCGCCG AGCACATCGT 3420 GGAAGCCGCG GGCGGGCCGA AGGACTCGGT TGCCGGTGGG CCCGGAGTGC TCTCGTCGGC 3480 CGCGGTAGGG GTGTCGGACG CCCGGGGCGG CAGCCGGGAC GACGACGACC CGATCGCCAT 3540 CGTGGGTGTC GGCTGCCGGC TCCCCGGCGG CGTCGACTCG CGCGCCGCTC TCTGGGAGCT 3600 GCTGGAGTCC GGCGCCGACG CCATCTCGTC CTTCCCCACC GACCGCGGCT GGGACCTCGA 3660 CGGGCTGTAC GACCCCGAGC CCGGGACGCC CGGCAAGACC TATGTGCGGG AGGGCGGGTT 3720 CCTGCACTCG GCGGCCGAGT TCGACGCGGA GTTCTTCGGG ATATCGCCGC GCGAGGCCAC 3780 GGCCATGGAC CCGCAGCAGC GCTTGCTGCT GGAAGCGTCG TGGGAGGCCC TCGAGGACGC 3840 CGGAGTGCTC CCCGAGTCAC TGCGCGGCGG CGACGCCGGA GTGTTCGTCG GCGCCACCGC 3900 ACCGGAGTAC GGGCCGAGGC TTCACGAGGG AGCGGACGGA TACGAGGGGT ACCTGCTCAC 3960 CGGCACCACC GCGAGCGTGG CCTCCGGCCG GATCGCCTAC ACCCTCGGCA CCGGCGGACC 4020 GGCGCTCACC GTCGACACCG CGTGCTCCTC GTCCCTGGTG GCGCTGCACC TGGCCGTGCA 4080 GGCGCTGCGC CGGGGCGAGT GCGGGCTGGC TCTGGCGGGC GGCGCCACGG TGATGTCGGG 4140 GCCCGGCATG TTCGTGGAGT TCTCGCGGCA GCGCGGGCTC GCCCCCGACG GCCGCTGCAT 4200 GCCGTTCTCC GCCGATGCCG ACGGTACGGC CTGGTCCGAG GGTGTCGCCG TACTGGCACT 4260 GGAGCGGCTC TCCGACGCCC GGCGTGCGGG ACACCGGGTG CTGGGCGTGG TGCGGGGCAG 4320 TGCGGTCAAC CAGGACGGTG CCAGCAACGG CCTGACCGCT CCCAACCGCT CCGCGCAGGA 4380 GGGCGTCATC CGAGCTGCCC TGGCCGACGC CGGCCTCGCG CCGGGTGACG TGGACGCGGT 4440 GGAGGCGCAC GGTACGGGGA CGGCGCTGGG CGATCCGATC GAGGCGAGCG CGCTGCTGGC 4500 CACGTACGGG CGTGAGCGGG TGGGCGACCC CTTGTGGCTC GGGTCGCTGA AGTCCAACGT 4560 CGGTCACACC CAGGCCGCCG CGGGGGCCGC GGGTGTGGTC AAGATGCTGC TTGCCCTGGA 4620 GCACGGCACG CTGCCGCGGA CACTTCACGC GGACCGGCCC AGCACGCACG TCGACTGGTC 4680 GTCGGGCACC GTCGCCCTGC TGGCAGAGGC GCGCCGGTGG CCCCGGCGGT CGGACCGCCC 4740 GCGCCGGGCG GCTGTGTCGT CGTTCGGGAT CAGTGGGACG AACGCGCATC TGATCATCGA 4800 GGAGGCGCCG GAGTGGGTCG AGGACATCGA CGGCGTCGCT GCTCCTGACC GCGGTACCGC 4860 GGACGCGGCT GCTCCGTCGC CGCTGTTGTT GTCCGCGCGG TCGGAGGGGG CGTTGCGGGC 4920 GCAGGCGGTG CGGTTGGGTG AGTACGTGGA GCGGGTGGGT GCGGATCCGC GGGATGTGGC 4980 TTATTCGCTG GCTTCGACGC GGACTCTTTT CGAGCACCGT GCGGTGGTGC CGTGTGGTGG 5040 GCGTGGGGAG CTCGTCGCTG CTCTTGGTGG GTTTGCTGCC GGGAGGGTGT CTGGGGGTGT 5100 GCGGTCCGGG CGGGCTGTGC CGGGTGGGGT GGGGGTGTTG TTCACGGGTC AGGGTGCGCA 5160 GTGGGTTGGT ATGGGGCGTG GGTTGTATGC GGGGGGTGGG GTGTTTGCGG AGGTGCTGGA 5220 TGAGGTGTTG TCGATGGTGG GGGAGGTGGA TGGTCGGTCG TTGCGGGATG TGATGTTCGG 5280 CGACGTCGAC GTGGACGCGG GTGCCGGGGC TGATGCGGGT GCCGGTGCGG GTGCTGGGGT 5340 CGGTTCTGGT TCCGGTTCTG TGGGTGGGTT GTTGGGTCGG ACGGAGTTTG CTCAGCCTGC 5400 GCTGTTTGCG TTGGAGGTGG CGTTGTTCCG GGCGTTGGAG GCTCGGGGTG TGGAGGTGTC 5460 GGTGGTGTTG GGTCATTCGG TGGGGGAGGT GGCTGCTGCG TATGTGGCGG GGGTGTTGTC 5520 GTTGGGTGAT GCGGTGCGGT TGGTGGTGGC GCGGGGTGGG TTGATGGGTG GGTTGCCGGT 5580 GGGTGGGGGG ATGTGGTCGG TGGGGGCGTC GGAGTCGGTG GTGCGGGGGG TTGTTGAGGG 5640 GTTGGGGGAG TGGGTGTCGG TTGCGGCGGT GAATGGGCCG CGGTCGGTGG TGTTGTCGGG 5700 TGATGTGGGT GTGCTGGAGT CGGTGGTTGC CTCGCTGATG GGGGATGGGG TGGAGTGCCG 5760 GCGGTTGGAT GTGTCGCATG GGTTTCATTC GGTGTTGATG GAGCCGGTGT TGGGGGAGTT 5820 CCGGGGGGTT GTGGAGTCGT TGGAGTTCGG TCGGGTGCGG CCGGGTGTGG TGGTGGTGTC 5880 GGGTGTGTCG GGTGGGGTGG TGGGTTCGGG GGAGTTGGGG GATCCGGGGT ATTGGGTGCG 5940 TCATGCGCGG GAGGCGGTGC GTTTCGCGGA TGGGGTGGGG GTGGTGCGTG GTCTGGGTGT 6000 GGGGACGTTG GTGGAGGTGG GTCCGCATGG GGTGCTGACG GGGATGGCGG GTGAGTGCCT 6060 GGGGGCCGGT GATGATGTGG TGGTGGTGCC GGCGATGCGG CGGGGCCGTG CGGAGCGGGA 6120 GGTGTTCGAG GCGGCGCTGG CGACGGTGTT CACCCGGGAC GCCGGCCTGG ACGCCACGGC 6180 ACTCCACACC GGGAGCACCG GCCGGCGCAT CGACCTCCCC ACCTACCCCT TCCAACGCGA 6240 CCGCTACTGG CTGGACCCCG TTCGCACCGC CGTGACCGGC GTCGAGCCCG CCGGCTCGCC 6300 GGCGGACGCT CGGGCCACTG AGCGGGGACG GTCGACGACG GCCGGGATCC GCTACCGCGT 6360 CGCTTGGCAG CCGGCCGTCG TCGACCGCGG CAACCCCGGG CCTGCCGGTC ATGTGCTGCT 6420 TCTGGCCCCG GACGAGGACA CGGCCGACTC CGGACTCGCC CCCGCGATCG CACGTGAACT 6480 CGCCGTGCGC GGGGCCGAGG TCCACACCGT CGCCGTGCCG GTCGGTACAG GCCGGGAGGC 6540 AGCCGGGGAC CTGTTGCGGG CCGCCGGTGA CGGTGCCGCC CGCAGCACCC GAGTTCTGTG 6600 GCTCGCCCCG GCCGAGCCGG ACGCGGCCGA CGCCGTCGCC CTCGTCCAGG CGCTGGGCGA 6660 GGCGGTACCC GAAGCCCCGC TCTGGATCAC CACCCGTGAG GCGGCGGCCG TGCGGCCGGA 6720 CGAGACCCCT TCCGTCGGGG GCGCTCAGCT GTGGGGACTC GGACAGGTCG CCGCGCTCGA 6780 ACTGGGGCGG CGCTGGGGCG GCTTGGCGGA CCTGCCCGGG AGTGCGTCGC CCGCGGTGCT 6840 CCGTACGTTC GTCGGGGCGC TGCTCGCCGG GGGAGAGAAC CAGTTCGCGG TACGGCCCTC 6900 CGGCGTCCAT GTCCGCCGTG TGGTTCCCGC GCCCGTCCCC GTCCCGGCCT CCGCTCGCAC 6960 CGTCACCACG GCCCCCGCCA CCGCCGTCGG CGAGGACGCA CGGAACGACA CCTCGGACGT 7020 GGTCGTGCCG GACGACCGGT GGTCCTCCGG CACCGTACTG ATCACCGGGG GCACCGGTGC 7080 CCTGGGTGCG CAGGTCGCCC GCAGGCTCGC CCGGTCGGGC GCCGCGCGTC TGCTCCTGGT 7140 GGGCCGGCGC GGCGCGGCCG GCCCCGGAGT GGGCGAACTC GTCGAGGAGC TGACGGCGCT 7200 CGGTTCCGAA GTGGCCGTCG AGGCCTGCGA CGTCGCCGAC CGGGACGCAC TGGCCGCGCT 7260 CCTCGCGGGC CTCCCCGAGG AGCGGCCCCT CGTCGCCGTA CTGCACGCGG CAGGTGTGCT 7320 CGACGACGGT GTGCTCGACT CGCTCACCTC CGACCGGGTG GACGCCGTAC TGCGGGACAA 7380 GGTCACCGCC GCCCGTCACC TGGACGAGCT GACCGCGGAC CTTCCGCTCG ACGCCTTCGT 7440 GCTCTTCTCC TCCATCGTCG GCGTGTGGGG CAACGGAGGG CAGGCCGTCT ACGCGGCCGC 7500 CAACGCCGCG CTCGACGCCC TGGCGCAGCG GCGCCGGGCC AGGGGAGCCC GTGCCGCCTC 7560 GATCGCCTGG GGGCCGTGGG CCGGTGCCGG AATGGCCTCC GGAACGGCGG CGAAGTCCTT 7620 CGAACGGGAC GGCGTCACGG CCCTGGACCC CGAGCGCGCG CTCGACGTCC TCGACGACGT 7680 GGTGGGCGCC GGCGGGACCT CTGCCGCAGG GACGCACGCG GCCGGCGAGA GCTCCCTGCT 7740 CGTCGCCGAC GTGGACTGGG AGACCTTCGT CGGGCGTTCG GTCACCCGCC GTACCTGGTC 7800 GCTCTTCGAC GGCGTCTCCG CCGCCCGTTC GGCGCGTGCC GGCCATGCCG CGGACGACCG 7860 TGCCGCTCTC ACCCCAGGGA CGCGGCCGGG CGACGGCGCA CCGGGCGGGA GCGGACAGGA 7920 CGGGGGCGAG GGCCGGCCGT GGCTCTCCGT CGGCCCCTCG CCGGCGGAAC GCCGTCGTGC 7980 TCTGCTCACG CTTGTGCGCT CGGAGGCCGC CGGGATCCTG CGCCACGCCT CGGCCGACGC 8040 GGTCGACCCG GAGCTGGCCT TCCGGTCCGC CGGGTTCGAC TCCCTCACCG TTCTCGAACT 8100 GCGTAACCGC CTGACCGCTG CCACCGGCCT GAACCTGCCG AACACGCTGC TCTTCGACCA 8160 CCCGACCCCC CTCTCGCTCG CCTCCCACCT GCACGACGAA CTGTTCGGTC CCGACAGCGA 8220 GGCGGAGCCG GCAGCGGCCG CCCCCACGCC GGTCATGGCC GACGAGCGTG AGCCGATCGC 8280 GATCGTGGGC ATGGCGTGCC GTTACCCGGG CGGTGTGGCG TCGCCGGACG ACCTGTGGGA 8340 CCTGGTGGCC GGTGACGGGC ACACGCTCTC CCCGTTCCCG GCCGACCGTG GCTGGGACGT 8400 CGAGGGGCTG TACGACCCGG AGCCGGGGGT GCCGGGCAAG AGCTATGTAC GGGAAGGCGG 8460 GTTCCTGCGT TCCGCGGCCG AGTTCGACGC GGAGTTCTTC GGGATATCGC CGCGCGAGGC 8520 CACGGCCATG GACCCGCAGC AGCGGTTGCT GCTGGAGACG TCGTGGGAGG CGCTGGAGCG 8580 GGCCGGCATC GTTCCGGACT CGCTGCGCGG CACCCGGACC GGTGTCTTCA GCGGCATCTC 8640 CCAGCAGGAC TACGCGACCC AGCTGGGGGA CGCCGCCGAC ACCTACGGCG GGCATGTGCT 8700 CACGGGGACC CTCGGCAGTG TGATCTCCGG TCGGGTTGCC TATGCGTTGG GGTTGGAGGG 8760 GCCGGCGCTG ACGGTGGACA CGGCGTGTTC GTCGTCGTTG GTGGCGTTGC ATCTGGCGGT 8820 GCAGTCGTTG CGGCGGGGTG AGTGTGATCT GGCGTTGGCC GGTGGGGTGA CGGTGATGGC 8880 GACGCCGACG GTGTTCGTGG AGTTCTCGCG GCAGCGGGGG CTGGCGGCGG ACGGGCGGTG 8940 CAAGGCGTTC GCGGAGGGTG CGGACGGGAC GGCGTGGGCG GAGGGTGTGG GTGTGCTGCT 9000 GGTGGAGCGG CTTTCCGACG CGCGCCGCAA CGGTCATCGG GTGCTGGCGG TGGTGCGGGG 9060 CAGTGCGGTC AATCAGGACG GTGCGAGCAA TGGGCTGACG GCGCCGAGTG GTCCGGCGCA 9120 GCAGCGGGTG ATCCGTGAGG CGCTGGCTGA TGCGGGGCTG GTGCCCGCCG ACGTGGATGT 9180 GGTGGAGGCG CACGGTACGG GGACGGCGCT GGGTGATCCG ATCGAGGCGG GTGCGCTGCT 9240 GGCCACGTAC GGGCGGGAGC GGGTCGGCGA TCCGTTGTGG CTCGGGTCGT TGAAGTCGAA 9300 CATCGGGCAT GCGCAGGCGG CTGCGGGTGT GGGTGGTGTG ATCAAGGTGG TGCAGGGGAT 9360 GCGGCATGGG TCGTTGCCGC GGACGCTGCA TGTGGATGCG CCGTCGTCGA AGGTGGAGTG 9420 GGCTTCGGGT GCGGTGGAGC TGCTGACCGA GACCCGGTCG TGGCCGCGGC GGGTGGAGCG 9480 GGTGCGGCGG GCCGCGGTGT CGGCGTTCGG GGTGAGCGGG ACCAACGCCC ATGTGGTCCT 9540 GGAGGAAGCG CCGGCGGAGG CCGGGAGCGA GCACGGGGAC GGCCCTGAAC CTGAGCGGCC 9600 CGACGCGGTG ACGGGTCCGT TGTCGTGGGT GCTTTCTGCG CGGTCGGAGG GGGCGTTGCG 9660 GGCGCAGGCG GTGCGGTTGC GTGAGTGTGT GGAGCGGGTG GGTGCGGATC CGCGGGATGT 9720 GGCGGGGTCG TTGGTGGTGT CGCGTGCGTC GTTCGGTGAG CGTGCGGTGG TGGTGGGCCG 9780 GGGGCGTGAG GAGTTGCTGG CGGGTCTGGA TGTGGTGGCT GCCGGGGCTC CTGTGGGTGT 9840 GTCTTCGGGG GCCGGTGCTG TGGTGCGGGG GAGTGCGGTG CGGGGTCGTG GGGTGGGGGT 9900 GTTGTTCACG GGTCAGGGTG CGCAGTGGGT TGGTATGGGG CGTGGGTTGT ATGCGGGGGG 9960 TGGGGTGTTT GCGGAGGTGC TGGATGAGGT GTTGTCGGTG GTGGGGGAGG TGGATGGTCG 10020 GTCGTTGCGG GATGTGATGT TCGCGGATGC TGACTCGGTT TTGGGTGGGT TGTTGGGTCG 10080 GACGGAGTTT GCTCAGCCTG CGTTGTTTGC GTTGGAGGTG GCGTTGTTCC GGGCGTTGGA 10140 GGCTCGGGGT GTGGAGGTGT CGGTGGTGTT GGGTCATTCG GTGGGGGAGG TGGCTGCTGC 10200 GTATGTGGCG GGGGTGTTGT CGTTGGGTGA TGCGGTGCGG TTGGTGGTGG CGCGGGGTGG 10260 GTTGATGGGT GGGTTGCCGG TGGGTGGGGG GATGTGGTCG GTGGGGGCGT CGGAGTCGGT 10320 GGTGCGGGGG GTTGTTGAGG GGTTGGGGGA GTGGGTGTCG GTTGCGGCGG TGAATGGGCC 10380 GCGGTCGGTG GTGTTGTCGG GTGATGTGGG TGTGCTGGAG TCGGTGGTTG TCACGCTGAT 10440 GGGGGATGGG GTGGAGTGCC GGCGGTTGGA TGTGTCGCAT GGGTTTCATT CGGTGTTGAT 10500 GGAGCCGGTG TTGGGGGAGT TCCGGGGGGT TGTGGAGTCG TTGGAGTTCG GTCGGGTGCG 10560 GCCGGGTGTG GTGGTGGTGT CGGGTGTGTC GGGTGGGGTG GTGGGTTCGG GGGAGTTGGG 10620 GGATCCGGGG TATTGGGTGC GTCATGCGCG GGAGGCGGTG CGTTTCGCGG ATGGGGTGGG 10680 GGTGGTGCGT GGTCTGGGTG TGGGGACGTT GGTGGAGGTG GGTCCGCATG GGGTGCTGAC 10740 GGGGATGGCG GGTCAGTGCC TGGAGGCCGG TGATGATGTG GTGGTGGTGC CGGCGATGCG 10800 GCGGGGCCGT CCGGAGCGGG AGGTGTTCGA GGCGGCGCTG GCGACGGTGT TCACCCGGGA 10860 CGCCGGCCTC GACGCCACGA CACTCCACAC CGGGAGCACC GGCCGACGCA TCGACCTCCC 10920 CACCTACCCC TTCCAACACA ACCGCTACTG GGCAACCGGC TCAGTGACCG GTGCGACCGG 10980 CACCTCGGCA GCCGCGCGCT TCGGCCTGGA GTGGAAGGAC CACCCCTTCC TCAGCGGCGC 11040 CACGCCGATA GCCGGCTCCG GCGCGCTGCT CCTCACCGGC AGGGTGGGGC TCGCTGCCCA 11100 CCCGTGGCTG GCCGACCACG CCATCTCCGG CACGGTGCTG CTCCCCGGAA CGGCGATCGC 11160 CGACCTGCTG CTGCGGGCGG TCGAGGAGGT CGGCGCCGGA GGGGTCGAGG AACTGACGCT 11220 CCATGAGCCC CTGCTCCTCC CCGAGCGAGG CGGCCTGCAC GTCCAGGTGC TGGTCGAGGC 11280 GGCCGACGAG CAGGGACGGC GTGCCGTGGC AGTCGCCGCA CGCCCGGAGG GCCCTGGGCG 11340 GGACGGTGAG GAACAGGAGT GGACCCGGCA CGCGGAAGGC GTGCTCACCT CCACCGAGAC 11400 GGCCGTTCCG GACATGGGCT GGGCCGCCGG GGCCTGGCCG CCGCCCGGTG CCGAGCCGAT 11460 CGACGTCGAG GAGCTGTACG ACGCGTTCGC CGCGGACGGC TACGGCTACG GCCCGGCCTT 11520 CACCGCACTG TCCGGCGTGT GGCGTCTCGG CGACGAACTC TTCGCCGAGG TGCGGCGGCC 11580 CGCGGGGGGC GCGGGCACGA CCGGTGACGG TTTCGGCGTC CACCCCGCAC TCTTCGATGC 11640 GGCCCTCCAC CCGTGGCGCG CCGGCGGGCT GCTGCCCGAC ACGGGCGGCA CCACCTGGGC 11700 GCCGTTCTCC TGGCAGGGCA TCGCGCTCCA CACCACCGGA GCCGAGACGC TCCGCGTCAG 11760 ACTGGCCCCT GCGGCCGGCG GCACCGAGTC GGCCTTCTCC GTACAGGCCG CCGACCCGGC 11820 GGGCACCCCG GTCCTCACCC TCGACGCACT GCTGCTCCGC CCGGTGACCC TGGGGAGGGC 11880 CGACGCGCCG CAACCGCTGT ACCGCGTCGA CTGGCAGCCG GTCGGCCAGG GGACCGAGGC 11940 CTCCGGCGCC CAGGGCTGGA CGGTGCTCGG GCAGGCCGCG GCCGAGACGG TCGCGCAGCC 12000 CGCCGCCCAT GCGGACCTCA CCGCCCTGCG TACGGCTGTG GCCGCGGCGG GAACACCCGT 12060 GCCCCGGCTG GTGGTCGTGT CGCCGGTGGA CACCCGGCTG GACGAGGGGC CGGTGCTGGC 12120 GGACGCCGAG GCTCGGGCCC GTGCGGGTGA CGGCTGGGAC GACGATCCCC TACGTGTCGC 12180 CCTCGGGCGC GGCCTGACCC TGGTCCGGGA GTGGGTCGAG GACGAACGGT TGGCGGACTC 12240 CCGGCTCGTC GTCCTCACCC GTGGCGCGGT GGCGGCCGGT CCCGGCGATG TGCCGGACCT 12300 GACAGGTGCG GCCCTGTGGG GGCTGCTCCG CTCCGCGCAG TCGGAGTATC CGGACCGCTT 12360 CACCCTCATC GACGTGGACG ATTCCCCCGA GTCCCGTGCG GCTCTGCCCC GGGCTCTGGG 12420 ATCGGCCGAG CGACAACTCG CCCTGCGGAC GGGCGACGTG CTGGCGCCGG CCCTGGTCCC 12480 GATGGCCACC CGGCCGGCGG AGACCACTCC AGCGACGGCG GTCGCCTCGG CGACAACACA 12540 GACACAGGTC ACCGCGCCCG CTCCCGACGA CCCGGCTGCG GATGCCGTGT TCGACCCGGC 12600 GGGCACCGTA CTGATCACCG GCGGCACCGG CGCCCTGGGA CGGCGTGTCG CCTCGCACCT 12660 CGCGCGCCGG TACGGCGTAC GCCACATGCT TCTGGTCAGC AGGCGTGGAC CGGACGCCCC 12720 CGAGGCCGGT CCCCTGGAAC GGGAACTCGC CGGTCTCGGA GTCACCGCCA CCTTCCTGGC 12780 ATGCGACCTC ACCGACATCG AGGCCGTACG GAAGGCCGTC GCCGCGGTGC CGTCGGACCA 12840 CCCGCTGACC GGTGTGGTGC ACACCGCCGG CGTGCTGGAC GACGGCGCCC TGACCGGCCT 12900 GACCCGGCAA CGCCTCGACA CCGTGCTGCG GCCCAAGGCC GACGCCGTGC GGAACCTCCA 12960 CGAGGCGACC CTCGACCGGC CGCTGCGCGC GTTCGTCCTG TTCTCCGCCG CCGCCGGACT 13020 CCTGGGCCGC CCCGGGCAGG CCTCCTACGC CGCCGCCAAC GCGGTCCTCG ACGCGCTCGC 13080 GGGAGCCCGC CGCGCGGCCG GACTGCCCGC AGTGTCCCTG GCGTGGGGCC TGTGGGACGA 13140 GCAGACGGGC ATGGCAGGAG GCCTCGACGA GATGGCCCTG CGCGTGCTGC GCCGGGACGG 13200 CATCGCCGCG ATGCCTCCGG AGCAGGGGCT CGAACTGCTC GACCTGGCCC TGACCGGACA 13260 CCGGGACGGA CCCGCCGTCC TCGTCCCCCT CCTCCTCGAC GGCGCGGCCC TGCGCCGCAC 13320 GGCGAAGGAG CGCGGCGCGG CCACGATGTC CCCCTTGCTG CGCGCCCTGC TGCCCGCCGC 13380 CCTGCGCCGC AGCGGTGGAG CCGGCGCCCC CGCGGCGGCC GACCGGCACG GCAAGGAGGC 13440 GGACCCCGGT GCGGGACGCC TCGCAGGGAT GGTGGCACTC GAAGCGGCGG AGCGTTCCGC 13500 GGCCGTCCTT GAGCTGGTCA CCGAACAGGT CGCCGAGGTC CTCGGCTACG CGTCGGCCGC 13560 GGAGATCGAG CCCGAACGAC CCTTCCGGGA GATCGGCGTC GACTCCCTGG CGGCGGTGGA 13620 GCTGCGCAAC CGGCTCAGCC GTCTGGTCGG CCTGCGGTTG CCGACCACGC TGTCCTTCGA 13680 CCACCCCACG CCGAAGGACA TGGCGCAGCA CATCGACGGG CAGCTCCCCC GCCCGGCCGG 13740 AGCCTCGCCC GCGGACGCAG CGCTGGAAGG GATCGGCGAC CTCGCGCGGG CGGTCGCCCT 13800 GCTGGGCACG GGCGACGCCC GCCGGGCCGA GGTACGAGAG CAGCTCGTCG GACTGCTGGC 13860 CGCGCTCGAC CCACCTGGGC GGACGGGCAC CGCCGCACCC GGCGTCCCCT CCGGTGCCGA 13920 TGGCGCGGAA CCGACCGTGA CGGACCGGCT CGACGAGGCG ACCGACGACG AGATCTTCGC 13980 CTTCCTGGAC GAGCAGCTGT GACCACACCG TGGACCGACC GCATGCCGAG GAGTTGGTGG 14040 CAGCAATGAC CGCCGAGAAC GACAAGATCC GCAGCTACCT GAAGCGTGCC ACCGCCGAAC 14100 TGCACCGGAC CAAGTCCCGC CTGGCCGAGG TCGAGTCGGC GAGCCGCGAG CCGATCGCGA 14160 TCGTGGGCAT GGCGTGCCGT TACCCGGGCG GTGTGGCGTC GCCGGACGAC CTGTGGGACC 14220 TGGTGGCAGC CGGTACGGAC GCGGTCTCCG CGTTCCCCGT CGACCGTGGC TGGGACGTCG 14280 AGGGGCTGTA CGACCCCGAT CCGGAGGCGG TGGGGCGTAG TTACGTGCGG GAGGGCGGGT 14340 TCCTGCACTC GGCGGCCGAG TTCGACGCGG AGTTCTTCGG GATCTCGCCC CGTGAGGCGG 14400 CGGCGATGGA TCCGCAGCAG CGGTTGCTGC TGGAGACGTC GTGGGAGGCG CTGGAGCGGG 14460 CGGGGATCGT CCCCGCGTCG CTGCGCGGCA CCCGTACCGG CGTCTTCACC GGCGTCATGT 14520 ACGACGACTA CGGGTCGCGG TTCGACTCGG CTCCGCCGGA GTACGAGGGC TACCTCGTGA 14580 ACGGCAGCGC CGGCAGCATC GCGTCCGGTC GGGTTGCCTA TGCGTTGGGG TTGGAGGGGC 14640 CGGCGCTGAC GGTGGACACG GCGTGTTCGT CGTCGTTGGT GGCGTTGCAT CTGGCGGTGC 14700 AGTCGTTGCG GCGGGGTGAG TGTGATCTGG CGTTGGCCGG TGGGGTGACG GTGATGGCGA 14760 CGCCGACGGT GCTCGTGGAG TTCTCGCGGC AGCGGGGGCT GGCGGCGGAC GGGCGGTGCA 14820 AGGCGTTCGC GGAGGGTGCG GACGGGACGG CGTGGGCCGA GGGTGTGGGC GTGCTGCTGG 14880 TGGAGCGGCT CTCCGACGCC CGCCGCAATG GCCATCGGGT GCTGGCGGTG GTGCGGGGCA 14940 GTGCGGTCAA TCAGGACGGT GCGAGCAACG GGCTGACGGC GCCGAGTGGT CCTGCGCAGC 15000 AGCGGGTGAT CCGTGAGGCG CTGGCCGACG CGGGGCTGAC GCCCGCCGAC GTCGACGCGG 15060 TCGAGGCGCA CGGCACCGGC ACACCCCTGG GCGACCCCAT CGAGGCGGGT GCGTTGCTGG 15120 CCACCTATGG CAGTGAGCGC CAGGGCCAAG GTCCGTTGTG GTTGGGGTCG TTGAAGTCGA 15180 ACATCGGGCA TGCGCAGGCG GCTGCGGGTG TGGGTGGCGT GATCAAGGTG GTGCAGGCGA 15240 TGCGGCATGG GTCGTTGCCG CGGACGCTGC ATGTGGATGC GCCGTCGTCG AAGGTGGAGT 15300 GGGCTTCGGG TGCGGTGGAG CTGCTGACCG AGACCCGGTC GTGGCCGCGG CGGGTGGAGC 15360 GGGTGCGGCG GGCCGCGGTG TCGGCGTTCG GGGTGAGCGG GACCAACGCC CATGTGGTCC 15420 TGGAGGAAGC GCCGGCGGAG GCCGGGAGCG AGCACGGGGA CGGCCCTGAA CCCGAGCGGC 15480 CCGACGCGGT GACGGGTCCG TTGTCGTGGG TGCTTTCTGC GCGGTCGGAG GGGGCGTTGC 15540 GGGCGCAGGC GGTGCGGTTG CGTGAGTGTG TGGAGCGGGT GGGTGCGGAT CCGCGGGATG 15600 TGGCGGGGTC GTTGGTGGTG TCGCGTGCGT CGTTCGGTGA GCGTGCGGTG GTGGTGGGCC 15660 GGGGGCGTGA GGAGTTGCTG GCGGGTCTGG ATGTGGTGGC TGCCGGGGCT CCTGTGGGTG 15720 TGTCCGGGGG CGTGTCTTCG GGGGCCGGTG CTGTGGTGCG GGGGAGTGCG GTGCGGGGTC 15780 GTGGGGTGGG GGTGTTGTTC ACGGGTCAGG GTGCGCAGTG GGTTGGTATG GGGCGTGGGT 15840 TGTATGCGGG GGGTGGGGTG TTTGCGGAGG TGCTGGATGA GGTGTTGTCG GTGGTGGGGG 15900 AGGTGGGGGG TTGGTCGTTG CGGGATGTGA TGTTCGGCGA CGTCGACGTG GACGCGGGTG 15960 CCGGGGCTGA TGCGGGTGTC GGTTCGGGTG TTGGTGTGGG TGGGTTGTTG GGTCGGACGG 16020 AGTTTGCTCA GCCTGCGTTG TTTGCGTTGG AGGTGGCGTT GTTCCGGGCG TTGGAGGCTC 16080 GGGGTGTGGA GGTGTCGGTG GTGTTGGGTC ATTCGGTGGG GGAGGTGGCT GCTGCGTATG 16140 TGGCGGGGGT GTTGTCGTTG GGTGATGCGG TGCGGTTGGT GGTGGCGCGG GGTGGGTTGA 16200 TGGGTGGGTT GCCGGTGGGT GGGGGGATGT GGTCGGTGGG GGCGTCGGAG TCGGTGGTGC 16260 GGGGGGTTGT TGAGGGGTTG GGGGAGTGGG TGTCGGTTGC GGCGGTGAAT GGGCCGCGGT 16320 CGGTGGTGTT GTCGGGTGAT GTGGGTGTGC TGGAGTCGGT GGTTGCCTCG CTGATGGGGG 16380 ATGGGGTGGA GTGCCGGCGG TTGGATGTGT CGCATGGGTT TCATTCGGTG TTGATGGAGC 16440 CGGTGTTGGG GGAGTTCCGG GGGGTTGTGG AGTCGTTGGA GTTCGGTCGG GTGCGGCCGG 16500 GTGTGGTGGT GGTGTCGAGT GTGTCGGGTG GGGTGGTGGG TTCGGGGGAG TTGGGGGATC 16560 CGGGGTATTG GGTGCGTCAT GCGCGGGAGG CGGTGCGTTT CGCGGATGGG GTGGGGGTGG 16620 TGCGTGGTCT GGGTGTGGGG ACGTTGGTGG AGGTGGGTCC GCATGGGGTG CTGACGGGGA 16680 TGGCGGGTGA GTGCCTGGGG GCCGGTGATG ATGTGGTGGT GGTGCCGGCG ATGCGGCGGG 16740 GCCGTGCGGA GCGGGAGGTG TTCGAGGCGG CGCTGGCGAC GGTGTTCACC CGGGACGCCG 16800 GCCTGGACGC CACGACACTC CACACCGGGA GCACCGGCCG ACGCATCGAC CTCCCCACCT 16860 ACCCCTTCCA ACACGACCGC TACTGGCTGG CCGCCCCGTC CCGGCCCAGG ACGGACGGGC 16920 TGTCGGCGGC GGGTCTGCGC GAGGTGGAGC ACCCCCTGCT CACCGCCGCC GTGGAACTGC 16980 CCGGCACCGA CACCGAGGTG TGGACCGGCC GCATATCCGC TGCCGACCTG CCCTGGCTCG 17040 CCGACCACCT GGTGTGGGAC CGAGGCGTGG TGCCGGGGAC CGCGCTGCTG GAGACGGTGC 17100 TCCAGGTGGG AAGCCGGATC GGTCTGCCGC GCGTCGCCGA ACTGGTCCTG GAGACGCCGC 17160 TGACCTGGAC GTCGGACCGC CCGCTCCAGG TCCGGATCGT CGTGACCGCT GCCGCCACCG 17220 CCCCCGGGGG CGCGCGTGAG CTGACCCTCC ACTCGCGGCC CGAGCCCGTG GCCGCCTCCT 17280 CGTCCTCCCC GAGTCCCGCC TCTCCCCGGC ACCTCACGGC GCAGGAGAGC GACGACGACT 17340 GGACCCGGCA TGCCTCAGGG CTGCTCGCCC CGGCTGCCGG CCTCGCCGAC GACTTCGCCG 17400 AGCTCACCGG CGCCTGGCCC CCCGTCGGCG CCGAGCCCCT CGACCTCGCC GGTCAGTACC 17460 CGCTCTTCGC AGCCGCCGGA GTGCGCTACG AAGGCGCCTT CCGAGGGCTG CGCGCGGCAT 17520 GGCGTCGAGG CGACGAGGTC TTCGCCGACG TACGGCTGCC CGACGCGCAC GCGGTCGACG 17580 CTGATCGTTA CGGGGTGCAC CCCGCCCTGC TCGACGCGGT GCTCCACCCG ATCGCGTCGC 17640 TGGACCCGCT GGGCGACGGC GGGCACGGTC TGCTGCCGTT CTCCTGGACC GACGTACAGG 17700 GACACGGCGC CGGCGGACAC GCCCTCCGGG TACGGGTGGC GGCCGTCGAC GGCGGCGCGG 17760 TGTCGGTCAC CGCGGCCGAC CACGCGGGCA ACCCGGTGTT ATCCGCCCGG TCCCTGGCAC 17820 TGCGTCGTAT CACCGCGGAC CGGCTTCCCG CCGCGCCCGT CGCCCCTCTC TACCGCGTGG 17880 ACTGGCTGCC GTTCCCGGGT CCGGTGCCCG TATCCGCGGG CGGCCGCTGG GCGGTCGTCG 17940 GACCCGAGGC CGAAGCCACG GCTGCCGGAC TGCGTGCGGT GGGCCTCGAC GTGCGTACCC 18000 ATGCGCTCCC CCTCGGAGAG CCCCTGCCTC CGCAGGCCGG TACCGACGCG GAGGTGATCA 18060 TCCTCGACCT GACCACCACC GCAGCCGGCC GTACGGCGTC GGACGGGGGG CGGCTCAGTC 18120 TCCTCGACGA GGTGCGTGCG ACGGTGCGCC GGACCCTCGA AGCCGTACAG GCCCGCCTCG 18180 CCGACACCGA AACGGCCCCC GACGTCGACG TCCGTACGGC CGCGCGCCCC CGCACAGCCG 18240 CCCGTACAAG CCCCCGCGTG GACACCCGCA CGGGAGCCCG CACCGCTGAC GGCCCCCGGC 18300 TCGTCGTCCT GACCCGGGGC GCGGCCGGAC CCGAGGGAGG CGCGGCCGAT CCCGCGGGTG 18360 CCGCTGTCTG GGGGCTCGTC CGGGTCGCCC AGGCCGAACA GCCCGGCCGC TTCACCCTGG 18420 TGGACGTCGA CGGCACCCAG GCGTCGCTGC GGGCCCTGCC CGGTCTGCTG GCCACGGATG 18480 CCGGCCAGTC GGCCGTGCGC GACGGACGTG TCACCGTCCC GCGCCTCGTC CCGGTGGCCG 18540 ACCCCGTCCC CCACGGCGGC GGCACGGCGG CCGACGGGAC GGGTGCCGGC GAGCCGTCCG 18600 CGACCCTGGA CCCCGAAGGC ACCGTGCTGA TCACCGGCGG CACCGGAGCA CTGGCCGCGG 18660 3AAACCGCCCG GCACCTGGTC GACCGGCACA AGGTGCGCCA TCTCCTGCTG GTGGGCAGGC 18720 GCGGTCCCGA CGCACCCGGC GTCGATCGAC TGGTCGCCGA GTTGACCGAG TCGGGTGCCG 18780 AGGTCGCCGT ACGGGCCTGT GACGTCACGG ACCGCGACGC CCTGCGCCGC CTGCTCGACG 18840 CACTCCCCGA CGAACACCCG CTGACCTGCG TGGTGCACAC CGCCGGGGTG CTCGACGACG 18900 GCGTGCTCTC CGCCCAGACG GCCGAGCGGA TCGACACGGT GCTCCGGCCC AAGGCCGACG 18960 CCGCCGTCCA CCTGGACGAG CTGACCCGGG AGATCGGACG GGTGCCCCTG GTGCTGTACT 19020 CCTCGGTCTC GGCCACCCTG GGCAGCGCGG GGCAGGCCGG GTACGCGGCG GCCAACGCCT 19080 TCATGGACGC GCTGGCCGCC CGGCGGTGCG CCGCCGGGCA CCCCGCGCTG TCGCTCGGCT 19140 GGGGCTGGTG GTCCGGGGTG GGTCTCGCCA CCGGACTGGA CGGAGCGGAC GCGGCGCGGG 19200 TCAGGCGCTC GGGTCTCGCC CCGCTCGACG CCGGCGCCGC ACTGGACCTG CTCGACCGGG 19260 CGCTGACCCG GCCCGAGCCG GCCCTGCTGC CCGTGCGGCT CGACCTGCGC GCCGCGGCCG 19320 GTGCCACCGC TCTCCCGGAG GTCCTGCGTG ACCTGGCCGG CGTACCGGCG GACGCCCGCA 19380 GCACGCCCGG GGCCGCGGCG GGCACCGGGG ACGAGGACGG TGCCGTGCGC CCTGCCCCCG 19440 CCCCGGCCGA CGCCGCCGGG ACGCTGGCCG CGCGGCTCGC GGGACGTTCC GCACCCGAGC 19500 GTACGGCTCT CCTGCTCGAC CTGGTGCGGA CCGAGGTCGC GGCGGTGCTC GGACACGGCG 19560 ACCCCGCCGC GATCGGCGCC GCCCGCACCT TCAAGGACGC CGGATTCGAC TCCCTCACCG 19620 CTGTCGACCT CCGCAACCGG CTGAACACAC GCACCGGACT GCGGCTGCCC GCGACCCTCG 19680 TCTTCGACCA CCCCACACCG CTCGCCCTCG CCGAACTCCT GCTCGACGGG CTGGAGGCGG 19740 CCGGTCCAGC GGAACCGGCC GCTGAGGTCC CGGACGAAGC GGCCGGTGCC GAGACCCTGT 19800 CCGGCGTGAT CGACCGGCTG GAACGCAGCC TCGCCGCGAC CGACGACGGC GACGCCCGGG 19860 TCCGCGCGGC ACGGCGGCTG CGCGGCCTGC TGGACGCGCT CCCCGCCGGT CCCGGTGCCG 19920 CGTCCGGTCC GGATGCCGGA GAGCACGCCC CCGGTCGCGG CGACGTGGTG ATCGACCGGC 19980 TCAGGTCGGC CTCCGACGAC GACTTGTTCG ACCTGCTCGA CAGCGACTTC CAGTGAGCCG 20040 GACCGCGCCG CGCGCCGACC GCTGAACCGC TCTTCACCCA GACCCACGAG ACCACGCCTG 20100 AGGAGAACCG TGTCTGCGAC CAACGAGGAG AAGTTGCGGG AGTACCTGCG GCGCGCGATG 20160 GCCGACCTGC ACAGCGCACG AGAGCGGTTG CGCGAGGTCG AGTCGGCGAG CCGTGAGCCG 20220 ATCGCGATCG TGGGCATGGC GTGCCGTTAC CCGGGCGGTG TGGCGTCGCC GGAGGAGCTG 20280 TGGGACCTGG TGGCCGCCGG TACGGACGCG ATCTCCCCGT TCCCCGTCGA CCGCGGCTGG 20340 GACGCCGAGG GTCTGTACGA CCCGGAGCCG GGGGTGCCGG GCAAGAGCTA CGTGCGCGAG 20400 GGCGGGTTCC TGCACTCGGC GGCCGAGTTC GACGCGGAGT TCTTCGGGAT CTCGCCGCGT 20460 GAGGCGGCGG CGATGGATCC GCAGCAGCGG TTGCTGCTGG AGACGTCGTG GGAGGCGCTG 20520 GAGCGGGCCG GGATCGTCCC CGCGTCGCTG CGCGGCACCC GTACCGGCGT CTTCACCGGC 20580 GTCATGTACC ACGACTACGG CAGCCACCAG GTCGGCACCG CCGCCGATCC CAGTGGACAG 20640 CTCGGCCTCG GCACCGCGGG GAGCGTCGCC TCGGGCCGGG TGGCGTACAC CCTCGGTCTA 20700 CAGGGGCCGG CCGTGACCAT GGACACGGCA TGCTCGTCCT CGCTGGTGGC GTTGCACCTG 20760 GCGGTGCAGT CGTTGCGGCG GGGCGAGTGC GATCTCGCGT TGGCCGGCGG GGCGACGGTC 20820 TTGGCGACGC CCACGGTGTT CGTGGAGTTC TCGCGGCAAC GGGGGCTGGC GGCGGACGGA 20880 CGGTGCAAGG CGTTCGCGGA GGGCGCCGAC GGCACGGCGT GGGCCGAGGG CGCCGGTGTG 20940 CTGCTGGTGG AGCGGCTCTC CGACGCCCGC CGCAACGGCC ATCGGGTGCT CGCGGTGGTG 21000 CGGGGCAGCG CGGTCAACCA GGACGGTGCC AGCAACGGCC TCACCGCACC CAGCGGGCCC 21060 GCCCAGCAGC GGGTGATCCG TGACGCGCTG GCCGACGCGG GGCTGACGCC CGCCGACGTG 21120 GACGCGGTCG AGGCGCACGG CACCGGCACA CCGCTCGGCG ACCCGATCGA GGCCGGCGCG 21180 CTGATGGCCA CCTACGGCAG TGAACGGGTG GGCGACCCGC TGTGGCTGGG TTCGCTGAAG 21240 TCGAACATCG GACACACCCA GGCCGCCGCC GGAGCCGCCG GCGTCATCAA GATGGTGCAG 21300 GCGTTACGGC AGTCCGAGCT GCCGCGCACC CTGCACGTCG ACGCGCCCTC GGCCAAGGTC 21360 GAATGGGACG CGGGCGCCGT GCAACTGCTC ACCGGCGTCC GGCCATGGCC CCGGCGCGAG 21420 CACAGGCCCC GGCGGGCCGC GGTCTCCGCC TTCGGCGTCA GCGGCACCAA CGCCCACGTC 21480 ATCATCGAGG AACCGCCCGC GGCCGGTGAC ACCTCGCCCG CCGGCGACAC CCCTGAGCCG 21540 GGCGAGGCGA CCGCGTCCCC CTCCACCGCG GCCGGGCCGT CGTCCCCCTC CGCGGTGGCC 21600 GGGCCGCTGT CCCCCTCCTC CCCGGCCGTG GTCTGGCCCC TGTCCGCCGA GACCGCCCCC 21660 GCCCTGCGCG CCCAGGCCGC CCGCCTGCGG GCGCACCTCG AACGCCTCCC CGGCACCTCG 21720 CCGACCGACA TCGGCCACGC CCTGGCCGCC GAACGCGCCG CCCTCACCCG ACGCGTCGTG 21780 CTGCTCGGCG ACGACGGAGC CCCGGTCGAC GCACTCGCCG CCCTCGCCGC CGGCGAGACC 21840 ACCCCCGACG CCGTCCACGG CACCGCGGCG GACATCCGCC GGGTCGCCTT CGTGTTCCCC 21900 GGCCAGGGTT CCCAGTGGGC CGGGATGGGC GCCGAACTGC TGGACACGGC CCCGGCCTTC 21960 GCCGCCGAAC TGGACCGCTG CCAGGGCGCG CTCTCCCCGT ACGTGGACTG GAACCTCGCG 22020 GACGTGCTGC GCGGCGCGCC CGCGGCGCCC GGCCTCGACC GGGTCGACGT CGTCCAGCCG 22080 GCCACCTTCG CCGTCATGGT GGGACTCGCC GCGCTGTGGC GCTCCCTCGG GGTCGAACCC 22140 GCCGCCGTCA TCGGCCACTC CCAGGGCGAG ATCGCCGCGG CCTGCGTGGC GGGCGCGCTC 22200 TCCCTGGAGG ACGCCGCCCG GATCGTGGCC CTGCGCTCCC AGGTCATCGC CCGCGAACTG 22260 GCCGGGCGGG GCGGCATGGC CTCGGTGGCC CTGCCCGCGG CGGAGGTCGA GGCCCGCCTG 22320 GCCGGCGGCG TCGAGATCGC CGCCGTCAAC GGCCCCGGCT CGACCGTCGT CTGCGGAGAG 22380 CCCGGCGCCC TGGAGGCGTT GCTCGTCACG CTGGAGAGCG AAGGCACCCG GGTCCGCCGC 22440 ATCGACGTCG ACTACGCGTC CCACTCCCAC TACGTCGAGA GCATCCGGGC GGAACTCGCC 22500 ACCGTCCTCG GCCCCGTCCG GCCGCGGAGG GGCGACGTGC CCTTCTACTC CACCGTCGAG 22560 GCGGCGCTCC TCGACACCGC CACCCTGGAC GCCGACTACT GGTACCGCAA CCTGCGCCTC 22620 CCGGTGCGCT TCGAGCCGAC CGTACGCGCC ATGCTCGACG ACGGCGTCGA CGCGTTCGTG 22680 GAGTGCTCCG CGCATCCCGT CCTGACCGTC GGCGTGCGCC AGACCGTGGA GAGCGCCGGC 22740 GGCGCGGTCC CGGCCCTCGC TTCGCTGCGC CGCGACGAGG GCGGGCTGCG GCGCTTCCTC 22800 ACCTCCGCCG CCGAGGCCCA GGTCGTCGGC GTCCCCGTGG ACTGGGCGAC GCTCCGCCCA 22860 GGCGCCGGCC GGGTGGACCT GCCGACCTAC GCCTTCCAGC GCGAACGCCA CTGGGTCGGC 22920 CCCGCCCGGC CCGACTCCGC GGCGACGGCC GCCACGACCG GTGACGACGC CCCGGAGCCC 22980 GGAGACCGGC TCGGCTACCA CGTCGCGTGG AAGGGACTGC GCTCCACCAC CGGCGGCTGG 23040 CGCCCCGGCC TGCGCCTGCT GATCGTGCCC ACCGGGGACC AGTACACCGC CCTCGCCGAC 23100 ACCCTGGAAC AGGCGGTCGC CTCCTTCGGC GGAACGGTCC GCCGCGTCGC CTTCGACCCG 23160 GCACGCACCG GACGCGCCGA GCTGTTCGGC CTGCTCGAGA CGGAGATCAA CGGCGACACC 23220 GCCGTCACCG GCGTCGTCTC GCTGCTCGGA CTGTGCACCG ACGGCAGGCC GGACCACCCC 23280 GCCGTGCCCG TCGCCGTCAC CGCCACCCTC GCCCTCGTCC AGGCCCTGGC CGACCTCGGC 23340 AGCACCGCAC CGCTGTGGAC CGTCACCTGC GGCGCGGTCG CCACCGCCCC CGACGAACTG 23400 CCGTGCACCG CCGGTGCCCA GCTGTGGGGC CTGGGCCGGG TGGCCGCGCT GGAGCTGCCC 23460 GAGGTGTGGG GCGGCCTCAT CGACCTTCCC GCGCGGCCCG ACGCCCGGGT CCTGGACCGT 23520 CTCGCCGGCG TCCTCGCCGA ACCCGGCGGC GAGGACCAGA TCGCCGTACG GATGGCGGGC 23580 GTCTTCGGCC GCCGGGTCCT GCGGAACCCG GCCGACTCCC GGCCCCCGGC CTGGCGCGCC 23640 CGGGGCACCG TCCTCATCGC CGGCGACCTC ACGACGGTGC CCGGCCGACT GGTCCGGTCC 23700 CTCCTCGAGG ACGGCGCGGA CCGCGTGGTG CTGGCCGGAC CCGACGCCCC CGCACAGGCC 23760 GCCGCCGCCG GACTGACCGG CGTCTCCCTC GTCCCCGTGC GCTGCGACGT CACCGACCGC 23820 GCCGCACTGG CCGCGCTGCT CGACGAGCAC GCGCCCACCG TCGCCGTGCA CGCCCCGCCC 23880 CTGGTGCCCC TGGCGCCGCT GCGGGAGACG GCACCCGGCG ACATCGCCGC CGCCCTCGCC 23940 GCCAAGACCA CGGCCGCCGG CCACCTGGTC GACCTGGCGC CGGCCGCGGG CCTCGACGCG 24000 CTGGTGCTGT TCTCCTCGGT CTCCGGAGTG TGGGGCGGCG CGGCCCAGGG CGGCTACGCG 24060 GCCGCCAGCG CGCACCTCGA CGCGCTGGCC GAACGCGCCC GCGCCGCGGG GGTGCCCGCG 24120 TTCTCCGTGG CCTGGAGCCC CTGGGCCGGA GGCACGCCCG CCGACGGTGC CGAGGCGGAG 24180 TTCCTCAGCC GGCGCGGGCT GGCTCCCCTC GACCCCGACC AGGCGGTGCG GACCCTGCGC 24240 CGCATGCTGG AGCGCGGCAG CGCCTGCGGT GCGGTCGCCG ACGTCGAGTG GAGCCGGTTC 24300 GCCGCCTCCT ACACCTGGGT GCGTCCCGCC GTACTCTTCG ACGACATCCC GGACGTGCAG 24360 CGGCTGCGCG CGGCCGAACT CGCCCCGAGC ACCGGAGACT CGACCACCTC CGAACTCGTC 24420 CGCGAGCTGA CCGCGCAGTC CGGCCACAAG CGGCACGCCA CCCTGCTGCG GCTGGTGCGC 24480 GCACACGCCG CCGCCGTCCT CGGACAGTCC TCCGGCGACG CGGTGAGCAG CGCCCGCGCC 24540 TTCCGCGACC TCGGCTTCGA CTCGCTGACC GCCCTCGAAC TGCGCGACCG GCTCAGCACC 24600 AGCACCGGGC TCAAACTGCC CACCTCCCTG GTCTTCGACC ACTCCAGCCC GGCCGCGCTC 24660 GCCCGGCACC TCGGTGAGGA ACTCCTCGGC CGGAACGACA CCGCCGACCG GGCCGGCCCC 24720 GACACCCCGG TACGGACGGA CGAGCCCATC GCCATCATCG GCATGGCCTG CCGGCTGCCC 24780 GGCGGGGTGC AGTCCCCCGA GGACCTGTGG GACCTGCTGA CCGGTGGGAC CGACGCCATC 24840 ACCCCCTTCC CGACCAACCG GGGATGGGAC AACGAGACCC TCTACGACCC CGACCCCGAC 24900 TCGCCCGGGC ACCACACCTA CGTGCGCGAG GGCGGGTTCC TGCACGACGC GGCCGAGTTC 24960 GACCCCGGCT TCTTCGGCAT CAGCCCCCGC GAGGCCCTGG CCATGGACCC GCAGCAGCGG 25020 CTGATCCTGG AGACGTCCTG GGAGTCCTTC GAACGGGCCG GCATCGACCC GGTCGAACTG 25080 CGCGGCAGCC GCACCGGGGT CTTCGTCGGC ACCAACGGAC AGCACTACGT GCCGCTCCTC 25140 CAGGACGGCG ACGAGAACTT CGACGGCTAC ATCGCCACCG GCAACTCCGC CAGCGTGATG 25200 TCCGGCCGGC TCTCCTACGT CTTCGGACTG GAGGGCCCCG CCGTCACCGT CGACACCGCC 25260 TGCTCGGCCT CCCTGGCCGC ACTGCACCTG GCGGTGCAGT CACTGCGCCG CGGCGAATGC 25320 GACTACGCCC TCGCCGGCGG GGCCACGGTG ATGTCCACCC CCGAGATGCT GGTGGAGTTC 25380 GCCCGTCAGC GAGCGGTGTC GCCGGACGGC CGCAGCAAGG CGTTCGCGGA GGCGGCCGAC 25440 GGGGTCGGTC TCGCCGAGGG AGCCGGGATG CTGCTCGTGG AGCGGCTGTC GGAGGCGCAG 25500 AAGAAGGGCC ATCCGGTACT GGCGGTGGTG CGGGGCAGTG CCGTCAACCA GGACGGTGCC 25560 AGCAACGGCC TCACCGCACC CAGCGGGCCC GCCCAGCAGC GGGTGATACG GGAGGCGCTG 25620 GCCGACGCGG GGCTGACGCC CGCCGACGTG GACGCGGTCG AGGCGCACGG CACCGGCACG 25680 CCGCTCGGCG ACCCCATCGA GGCCGGCGCG CTGCTCGCCA CGTACGGCCG GGACCGGCGC 25740 GACGGCCCGC TGTGGCTGGG TTCGCTGAAG TCGAACATCG GGCACACCCA GGCCGCCGCC 25800 GGCGTGGCCG GGGTGATCAA GATGGTGCTG GCGCTGCGCC ACGGCGAGCT GCCGCGCACC 25860 CTGCACGCGT CGACGGCGTC GTCCAGGATC GATTGGGACG CGGGCGCCGT GGAGTTGCTG 25920 GACGAGGCCA GGCCCTGGCT CCAGCGGGCC GAGGGGCCGC GCCGGGCGGG CATCTCCTCG 25980 TTCGGCATCA GCGGCACCAA CGCGCACCTC GTCATCGAGG AGCCGCCGGA GCCCACCGCG 26040 CCCGAACTGC TCGCGCCCGA ACCGGCCGCC GACGGCGACG TCTGGTCCGA GGAGTGGTGG 26100 CACGAGGTGA CCGTGCCCCT GATGATGTCC GCGCACAACG AAGCCGCCCT GCGCGACCAG 26160 GCGCGGCGCC TGCGCGCCGA CCTGCTCGCC CACCCCGAGC TGCACCCGGC CGACGTCGGC 26220 TACACCCTCA TCACCACCCG CACCCGGTTC GAGCAGCGGG CCGCCGTCGT CGGCGAGAAC 26280 TTCACGGAGC TGATCGCGGC CCTCGACGAC CTCGTCGAAG GCCGACCGCA CCCGCTCGTG 26340 CTGCGGGGCA CCGCCGGCAC CTCCGACCAG GTCGTGTTCG TCTTCCCCGG CCAGGGCTCG 26400 CAGTGGCCCG AGATGGCCGA CGGGCTGCTG GCCCGCTCCA GCGGCTCCGG CTCCTTCCTG 26460 GAGACCGCCC GCGCCTGCGA CCTCGCGCTC CGGCCCCACC TCGGCTGGTC CGTCCTGGAC 26520 GTACTGCGCC GGGAACCCGG CGCGCCCTCG CTCGACCGGG TCGACGTGGT GCAGCCCGTG 26580 CTGTTCACCA TGATGGTCTC GCTCGCCGAG ACGTGGCGTT CGCTGGGCGT CGAACCGGCC 26640 GCGGTCGTCG GTCACTCCCA GGGCGAGATC GCCGCCGCCT ACGTCGCCGG CGCCCTGACG 26700 CTGGACGACG CGGCGCGCAT CGTCGCCCTG CGCAGCCAGG CGTGGCTGCG GCTGGCCGGC 26760 AAGGGCGGCA TGGTCGCCGT GACCCTGTCC GAACGCGACC TGCGTCCCCG CCTGGAGCCC 26820 TGGAGCGACC GGCTCGCCGT CGCCGCCGTC AACGGCCCCG AGACCTGCGC CGTCTCCGGG 26880 GACCCGGACG CCCTGGCGGA GCTGGTCGCC GAACTCGGTG CGGAGGGCGT GCACGCCCGC 26940 CCCATCCCCG GCGTCGACAC CGCCGGGCAC TCGCCGCAGG TCGACACGCT GGAGGCCCAC 27000 CTGCGGAAGG TGCTCGCGCC CGTCGCGCCC CGCACCTCCG ACATCCCGTT CTACTCGACG 27060 GTCACCGGAG GACTGATCGA CACCGCCGAG CTGGACGCCG ACTACTGGTA CCGCAACATG 27120 CGCGAGCCGG TGGAGTTCGA GCAGGCCACC CGCGCCCTGA TCGCCGACGG CCACGACGTG 27180 TTCCTGGAGT CGAGCCCGCA CCCCATGCTG GCCGTCTCCC TCCAGGAGAC GATCAGCGAC 27240 GCCGGTTCCC CGGCGGCCGT CCTCGGCACC CTGCGGCGCG GCCAGGGCGG CCCCCGCTGG 27300 CTGGGCGTCG CCCTCTGCCG CGCCTACACC CACGGCCTGG AGATCGACGC CGAGGCCATC 27360 TTCGGCCCCG ACTCACGCCA GGTGGAACTG CCCACGTACC CCTTCCAGCG CGAGCGCTAC 27420 TGGTACAGCC CCGGCCACCG CGGTGACGAC CCCGCCTCCC TCGGTCTGGA CGCCGTCGAC 27480 CACCCGCTGC TGGGCAGCGG CGTCGAACTG CCGGAGTCCG GTGACCGGAT GTACACCGCA 27540 CGGCTGGGCG CCGACACCAC CCCGTGGCTG GCCGACCACG CGCTGCTGGG GTCGCCGCTG 27600 CTGCCCGGCG CCGCCTTCGC CGACCTGGCG CTCTGGGCCG GCCGCCAGGC CGGCACCGGC 27660 CGCGTCGAGG AGCTCACCCT GGCCGCGCCC CTGGTGCTGC CCGGCTCCGG GGGTGTCCGG 27720 CTGCGGCTGA ACGTCGGCGC CCCGGGCACC GACGACGCCC GCCGCTTCGC CGTGCACGCC 27780 CGCGCCGAGG GCGCCACGGA CTGGACCCTG CACGCCGAGG GGCTGCTCAC CGCGCAGGAC 27840 ACGGCCGACG CGCCGGACGC CTCGGCGGCC ACCCCGCCCC CCGGCGCCGA ACAACTGGAC 27900 ATCGGCGACT TCTACCAGCG CTTCTCCGAA CTCGGTTACG GCTACGGCCC GTTCTTCCGG 27960 GGACTGGTGA GCGCCCACCG CTGCGGCCCC GACATCCACG CGGAGGTCGC GCTGCCCGTC 28020 CAGGCGCAGG GCGACGCGGC CCGCTTCGGC ATCCATCCCG CGCTGCTGGA CGCGGCGCTG 28080 CAGACCATGA GCCTCGGGGG CTTCTTCCCC GAGGACGGCC GCGTCCGCAT GCCGTTCGCC 28140 CTGCGCGGCG TTCGGCTGTA CCGCGCCGGA GCCGACCGGC TGCACGTGCG CGTCTCGCCC 28200 GTCTCCGAGG ACGCGGTCCG CATCAGGTGC GCCGACGGCG AGGGACGGCC GGTCGCCGAG 28260 ATCGAGTCCT TCATCATGCG GCCGGTCGAC CCGGGACAGC TCCTGGGCGG CCGCCCGGTC 28320 GGCGCCGACG CGCTCTTCCG CATCGCCTGG CGGGAACTCG CCGCCGGCCC GGGCACCCGT 28380 ACCGGCGACG GCACCCCTCC CCCGGTGCGC TGGGTGCTGG CGGGACCCGA CGCGCTGGGC 28440 CTGGCCGAGG CGGCCGACGC CCACCTGCCC GCCGTTCCCG GCCCGGACGG CGCACTGCCG 28500 TCCCCGACGG GACGCCCGGC GCCGGACGCC GTCGTGTTCG CGGTCCGTGC CGGGACCGGC 28560 GACGTCGCCG CCGACGCGCA CACCGTGGCC TGCCGGGTGC TGGACCTCGT CCAGCGCCGG 28620 CTCGCGGCCC CGGAGGGCCC GGACGGCGCC CGCCTGGTGG TGGCCACCCG CGGCGCGGTC 28680 GCCGTACGCG ACGACGCCGA GGTGGACGAC CCGGCCGCGG CCGCCGCGTG GGGCCTGCTG 28740 CGCTCCGCGC AGGCCGAGGA GCCCGGCCGG TTCCTGCTCG TGGACCTGGA CGACGACCCG 28800 GCGTCCGCCC GGGCGCTGAC CGACGCCCTC GCCTCCGGCG AACCGCAGAC CGCGGTCCGG 28860 GCCGGGACGG TGTACGTGCC CCGGCTGGAG CGGGCCGCCG ACCGCACGGA CGGGCCGCTC 28920 ACCCCGCCCG ACGACGGTGC CTGGCGGCTG GGCCGGGGCA CCGACCTCAC CCTCGACGGC 28980 CTCGCCCTGG TGCCCGCCCC GGACGCCGAG GCGCCGCTGG AGCCCGGCCA GGTGCGCGTC 29040 GCCGTACGCG CCGCGGGCGT CAACTTCCGC GACGCCCTCA TCGCCCTCGG CATGTACCCG 29100 GGCGAGGCGG AGATGGGAAC GGAGGGCGCC GGCACCGTCG TCGAGGTCGG CCCCGGCGTC 29160 ACCGGTGTCG CCGTCGGCGA CCGCGTGCTC GGCCTGTGGG ACGGCGGCCT GGGCCCGCTG 29220 TGCGTGGCCG ACCACCGGCT GCTCGCCCCC GTCCCGGACG GCTGGTCCTA CGCCCAGGCC 29280 GCCTCGGTCC CCGCGGTGTT CCTCAGCGCC TACTACGGTC TGGTCACCCT GGCCGGCCTC 29340 AGGCCGGGGG AGCGGGTGCT CGTGCACGCC GCCGCCGGGG GCGTCGGCAT GGCCGCGGTG 29400 CAGATCGCCC GCCACCTCGG CGCGGAGGTG CTGGCCACCG CGAGCCCCGG CAAGTGGGAC 29460 GCCCTGCGCG CCATGGGCAT CACCGACGAC CACCTCGCCT CCTCCCGCAC CCTCGACTTC 29520 GCGACCGCCT TCACCGGAGC GGACGGCACG TCCCGCGCGG ACGTCGTCCT GAACTCGCTC 29580 ACCAAGGAGT TCGTGGACGC CTCCCTCGGG CTGCTCCGTC CGGGCGGCCG GTTCCTGGAG 29640 CTGGGCAAGA CCGACGTCCG GGACCCCGAG CGGATCGCCG CCGAACACCC CGGGGTGCGC 29700 TACCGGGCGT TCGACCTCAA CGAGGCCGGA CCCGACGCAC TCGGCCGGCT GCTGCGGGAA 29760 CTGATGGACC TGTTCGCCGC CGGCGTGCTG CACCCGCTGC CCGTCGTCAC CCACGACGTG 29820 CGCCGGGCCG CGGACGCCCT GCGCACCATC AGCCAGGCCC GGCACACCGG AAAGCTCGTC 29880 CTGACCATGC CGCCCGCCTG GCACCCGTAC GGCACGGTCC TGGTCACCGG TGGCACCGGC 29940 GCCCTCGGCA GCCGCATCGC CCGCCACCTG GCGAGCCGGC ACGGCGTCCG CCGGCTGCTG 30000 ATCGCCGCCC GCCGGGGCCC GGACGGCGAG GGCGCCGCGG AGCTGGTCGC CGACCTCGCC 30060 GCCCTGGGCG CGTCGGCCAC CGTGGTCGCC TGCGACGTCT CCGACGCGGA CGCCGTCCGC 30120 GGACTGCTCG CCGGCATACC GGCCGATCAC CCGCTGACGG CGGTGGTGCA CAGCACCGGC 30180 GTCCTCGACG ACGGCGTGCT GCCCGGGCTC ACCCCCGAGC GGATGCGGCG CGTGCTGCGG 30240 CCCAAGGTGG AGGCCGCCGT CCACCTGGAC GAACTCACCC GCGACCTCGA CCTGTCGGCG 30300 TTCGTCCTCT TCTCCTCCAG CGCCGGTCTG CTGGGCAGCC CGGCCCAGGG CAACTACGCG 30360 GCGGCCAACG CCACCCTCGA CGCCCTCGCC GCCCGGCGCC GGTCCCTCGG CCTCCCGTCG 30420 GTGTCACTCG CCTGGGGTCT GTGGTCCGAC ACCAGCCGGA TGGCACACGC ACTGGACCAG 30480 GAGAGCCTCC AGCGGCGCTT CGCCCGCAGC GGCTTCCCGC CCCTGTCCGC CACGCTGGGC 30540 GCCGCGCTGT TCGACGCCGC CCTGCGGGTC GACGAGGCCG TGCAGGTCCC CATGCGGTTC 30600 GACCCGGCCG CGCTGCGCGC CACCGGAAGC GTCCCCGCCC TGCTGTCGGA CCTCGTCGGG 30660 TCCGCCCCGG CGACCGGGTC CGCGGCCCCG GCGTCCGGCC CCCTTCCGGC TCCGGACGCC 30720 GGGACCGTCG GCGAGCCGCT CGCCGAGCGG TTGGCCGGAC TCTCCGCCGA GGAACGCCAC 30780 GACCGGCTGC TCGGCCTGGT CGGCGAACAC GTGGCCGCGG TACTGGGCCA CGGCTCCGCC 30840 GCCGAGGTCC GGCCCGACCG GCCGTTCCGC GAGGTCGGGT TCGACTCGCT CACGGCCGTG 30900 GAACTGCGCA ACCGGATGGC GGCGGTCACC GGGGTCAGGC TCCCCGCCAC CCTGGTCTTC 30960 GACCACCCCA CCCCCGCCGC GCTGTCCTCG CACCTCGACG GCCTGCTGGC CCCGGCACAG 31020 CCGGTCACCA CCACACCGCT GCTGTCCGAA CTGGACCGCA TCGAGGAGGC CCTGGCCGCC 31080 CTCACCCCCG AGCACCTCGC GGAGCTCGCC CCCGCCCCCG ACGACCGGGC CGAGGTCGCC 31140 CTGCGCCTGG ACGCCCTGGC CGACCGCTGG CGCGCCCTGC ACGACGGCGC GCCCGGCGCC 31200 GACGACGACA TCACCGACGT GCTGAGCAGC GCCGACGACG ACGAGATCTT CGCGTTCATC 31260 GACGAGCGGT ACGGCACGTC GTGACCGCCG GCCCGGAGCC CCGCCCGTCA TCGAAAGGAA 31320 GCACCACCAT GGCGAACGAA GAGAAGCTGC GCGCCTACCT CAAGCGCGTG ACGGGTGAGC 31380 TGCACCGGGC CACCGAGCAG CTGCGTGCCC TGGACCGGCG GGCCCACGAG CCGATCGCGA 31440 TCGTCGGGGC GGCCTGCCGA CTCCCCGGCG GCGTCGAGAG TCCGGACGAC CTGTGGGAGC 31500 TGCTGCACGC CGGTGCCGAC GCGGTCGGCC CGGCCCCCGC CGACCGCGGC TGGGACGTGG 31560 AGGGAAGGTA CTCGCCCGAC CCCGACACGC CCGGCACCTC GTACTGCCGC GAGGGCGGCT 31620 TCGTGCAGGG GGCCGACCGG TTCGACCCCG CCCTCTTCGG CATCTCGCCC AACGAGGCGC 31680 TCACCATGGA CCCCCAGCAG CGGCTGCTGC TGGAGACCTC CTGGGAGGCG CTGGAGCGAG 31740 CCGGTCTGGA CCCCCAGTCC CTGGCGGGCA GCCGGACCGG CGTGTTCGCC GGGGCGTGGG 31800 AGAGCGGCTA CCAGAAGGGC GTCGAAGGGC TCGAAGCCGA TCTGGAGGCC CAACTCCTGG 31860 CCGGCATCGT CAGCTTCACC GCCGGCCGCG TCGCCTACGC CCTGGGCCTG GAGGGCCCGG 31920 CGCTGACGAT CGACACGGCC TGCTCCTCGT CGCTGGTGGC ACTGCACCTG GCGGTGCAGT 31980 CACTGCGCCG GGGCGAGTGC GACCTCGCAC TGGCGGGCGG CGCCACGGTC ATCGCCGACT 32040 TCGCGCTCTT CACCCAGTTC TCCCGGCAGC GCGGGCTCGC CCCCGACGGG CGGTGCAAGG 32100 CCTTCGGTGA GACGGCCGAC GGCTTCGGCC CCGCCGAGGG CGCGGGGATG CTGCTGGTCG 32160 AGCGGCTGTC GGACGCCCGC CGCAACGGGC ACCCGGTGCT GGCGGTGGTG CGGGGCAGTG 32220 CCGTCAACCA GGACGGTGCG AGCAATGGGC TGACGGCGCC GAGTGGTCCT GCGCAGCAGC 32280 GGGTGATCCG TGAGGCGCTG GCCGACGCGG GGCTGACGCC CGCCGACGTG GACGCGGTCG 32340 AGGCGCACGG CACCGGCACG CCGCTCGGCG ACCCCATCGA GGCCGGCGCG CTCATGGCGA 32400 CGTACGGGCA CGAACGGACG GGCGACCCGC TGTGGCTGGG TTCGCTGAAG TCGAACATCG 32460 GGCACACCCA GGCCGCCGCC GGCGTGGCCG GGGTGATCAA GATGGTGCTG GCGCTGCGCC 32520 ACGGTGAGCT GCCGCGCACC CTGCACGCGT CGACGGCGTC CTCCAGGATC GAATGGGACG 32580 CGGGCGCCGT GGAGTTGCTG GACGAGGCCA GGCCCTGGCC CCGGCGTGCC GAGGGGCCGC 32640 GCCGGGCGGG CATCTCCTCG TTCGGCATCA GCGGCACCAA CGCGCACCTC GTCATCGAGG 32700 AGGAGCCGCC CGCCCGGCCG GAGCCCGAGG AGGCCGCGCA GCCGCCCGCC CCGGCCACCA 32760 CCGTCCTCCC GCTGTCGGCC GCCGGCGCGC GATCCCTGCG CGAGCAGGCC CGCAGGCTCG 32820 CCGCGCACCT GGCCGGCCAC GAGGAGATCA CCGCCGCCGA CGCCGCCCGC TCCGCCGCCA 32880 CCACCCGTGC CGCGCTCTCG CACCGGGCCT CGGTCCTGGC CGACGACCGG CGGGCGCTGA 32940 TCGACAGGCT GACCGCGCTG GCGGAGGACA GGAAGGACCC CGGCGTCACC GTCGGCGAGG 33000 CGGGCAGCGG CCGGCCCCCC GTCTTCGTCT TCCCGGGACA GGGCTCCCAG TGGACGGGCA 33060 TGGGCGCCGA ACTCCTGGAC AGGGCACCGG TCTTCCGCGC CAAGGCCGAG GAGTGCGCGC 33120 GGGCCCTCGC GGCCCACCTC GACTGGTCGG TGCTCGACGT CCTGCGCGAC GCGCCCGGCG 33180 CCCCGCCGAT CGACCGCGCG GACGTCGTCC AGCCGACCCT GTTCACCATG ATGGTCTCCC 33240 TCGCGGCGCT GTGGGAGTCC CACGGTGTAC GGCCCGCCGC CGTGGTCGGC CACTCCCAAG 33300 GCGAGATCGC CGCCGCCCAC GCGGCCGGTG CCCTGTCCCT CGACGACGCG GCCCGCGTGA 33360 TCGCCGAGCG CAGCAGGCTC TGGAAGCGGC TGGCCGGAAA CGGCGGCATG CTCTCCGTGA 33420 TGGCCCCGGC CGACCGGGTC CGCGAACTGA TGGAGCCCTG GGCGGAGCGG ATGTCCGTGG 33480 CCGCCGTCAA CGGCCCCGCC TCGGTCACCG TGGCCGGTGA CGCGCGGGCG CTGGAGGAGT 33540 TCGGCGGCCG GCTCTCCGCC GCCGGGGTGC TGCGCTGGCC CCTCGCCGGC GTCGACTTCG 33600 CCGGACACTC ACCCCAGGTG GAGCAGTTCC GCGCCGAGCT CCTCGACACG CTGGGCACCG 33660 TCCGCCCGAC CGCCGCCCGG CTGCCCTTCT TCTCCACCGT GACCGCCGCG GCGCACGAGC 33720 CCGAAGGCCT GGACGCCGCG TACTGGTACC GGAACATGCG CGAACCCGTG GAGTTCGCGT 33780 CCACCCTGCG GACGCTGCTG CGCGAGGGCC ACCGCACCTT CGTCGAGATG GGCCCGCACC 33840 CCCTGCTGGG CGCCGCGATC GACGAGGTCG CCGAGGCCGA GGGCGTGCAC GCCACCGCCC 33900 TCGCCACCCT CCACCGCGGC TCCGGCGGCC TGGACCGGTT CCGCTCCTCG GTGGGCGCCG 33960 CGTTCGCCCA CGGAGTACGG GTCGACTGGG ACGCCCTCTT CGAGGGCTCC GGCGCCCGCC 34020 GGGTCCCGCT GCCCACCTAC GCCTTCAGCC GGGACCGGTA CTGGCTGCCC ACCGCCATCG 34080 GCCGGCGCGC CGTCGAGGCG GCCCCCGTCG ACGCGTCCGC CCCCGGGCGC TACCGCGTCA 34140 CCTGGACACC CGTGGCATCC GACGACTCCG GCCGGCCCTC CGGGCGCTGG CTGCTGGTGC 34200 AGACCCCCGG CACCGCGCCG GACGAGGCGG ACACCGCGGC GTCGGCCCTC GGTGCGGCCG 34260 GGGTGGTCGT GGAGCGCTGC CTGCTGGATC CCACCGAGGC CGCGCGCGTC ACGCTCACCG 34320 AGCGACTGGC CGAACTGGAC GCGCAGCCGG AGGGCCTGGC CGGCGTGCTG GTGCTGCCCG 34380 GCCGTCCGCA GAGCACCGCA CCGGCCGACG CCTCCCCGCT CGACCCGGGG ACGGCCGCCG 34440 TCCTGCTCGT GGTCCAGGCC GTGCCGGACG CCGCTCCGAA GGCCCGGATC TGGGTGGTGA 34500 CGCGGGGTGC GGTGGCGGTG GGGTCGGGTG AGGTGCCGTG TGCGGTGGGT GCGCGGGTGT 34560 GGGGTCTGGG GCGGGTGGCT GCGTTGGAGG TGCCGGTGCA GTGGGGTGGG TTGGTGGATG 34620 TGGCGGTGGG GGCGGGTGTG CGTGAGTGGC GTCGTGTGGT GGGTGTGGTT GCGGGGGGTG 34680 GTGAGGATCA GGTGGCGGTG CGTGGTGGGG GTGTGTTCGG TCGTCGTCTG GTGGGTGTGG 34740 GGGTGCGGGG TGGTTCGGGG GTGTGGCGTG CGCGGGGGTG TGTGGTGGTG ACGGGTGGGT 34800 TGGGTGGTGT GGGGGGTCAT GTGGCGCGGT GGTTGGCGCG TTCGGGTGCG GAGCATGTGG 34860 TGTTGGCGGG GCGTCGGGGT GGTGGGGTTG TGGGGGCGGT GGAGTTGGAG CGGGAGTTGG 34920 TGGGGTTGGG GGCGAAGGTG ACGTTCGTTT CGTGTGATGT GGGGGATCGG GCGTCGATGG 34980 TGGGGTTGTT GGGTGTGGTG GAGGGGTTGG GGGTGCCGTT GCGTGGTGTG TTTCATGCGG 35040 CGGGGGTGGC TCAGGTGTCG GGGTTGGGTG AGGTGTCGTT GGCGGAGGCG GGTGGTGTGT 35100 TGGGGGGTAA GGCGGTGGGG GCTGAGTTGT TGGACGAGTT GACGGCGGGT GTGGAGCTGG 35160 ATGCGTTCGT GTTGTTCTCG TCGGGTGCTG GGGTGTGGGG GAGTGGGGGG CAGTCGGTGT 35220 ATGCGGCGGC CAATGCGCAT CTGGATGCGT TGGCGGAGCG TCGTCGTGCG CAGGGGCGTC 35280 CCGCGACCTC CGTCGCCTGG GGCCTGTGGG GCGGCGAGGG CATGGGAGCG GACGAAGGCG 35340 TCACGGAGTT CTACGCCGAG CGCGGCCTCG CCCCCATGCG GCCCGAGTCG GGCATCGAGG 35400 CACTGCACAC GGCACTGAAC GAGGGCGACA CCTGCGTCAC GGTCGCCGAC ATCGACTGGG 35460 AACACTTCGT CACCGGGTTC ACCGCCTACC GGCCCAGCCC GCTGATCTCC GACATCCCCC 35520 AGGTCCGCGC GTTGCGCACG CCCGAACCCA CCGTGGACGC CTCGGACGGA CTGCGCCGGC 35580 GCGTCGACGC CGCCCTCACC CCGCGCGAGC GCACCAAGGT CCTGGTCGAC CTGGTCCGCA 35640 CGGTGGCGGC GGAGGTCCTC GGTCACGACG GGATCGGCGG CATCGGCCAC GACGTGGCCT 35700 TCCGGGACCT CGGCTTCGAC TCGCTGGCCG CGGTGCGGAT GCGCGGCCGG CTGGCCGAGG 35760 CGACCGGACT CGTACTGCCC GCGACGGTCA TCTTCGACCA CCCCACCGTG GACCGGCTCG 35820 GCGGCGCGCT GCTGGAGCGG CTGTCCGCGG ACGAACCCGC GCCCGGCGGG GCGCCGGAGC 35880 CCGCCGGGGG GAGGCCCGCG ACCCCACCGC CCGCACCGGA GCCGGCCGTC CACGACGCCG 35940 ACATCGACGA ACTCGACGCG GACGCCCTGA TCCGGCTGGC CACGGGAACC GCCGGACCGG 36000 CCGACGGCAC GCCGGCCGAC GGCGGGCCCG ACGCGGCGGC GACCGCCCCC GACGGAGCAC 36060 CGGAGCAGTA GCGCGCCCTC ACCGGCGCGC CGACCGGCGG AGCGCCGTAC CGCCGACGCC 36120 CCCCACAGCC AGCGAGCAGA CGAGGAAGCC GAAGATGTCA CCGTCCATGG ACGAAGTGCT 36180 GGGTGCGCTG CGCACCTCCG TCAAGGAGAC CGAGCGGCTG CGCCGGCACA ACCGGGAGCT 36240 CCTGGCCGGC GCGCACGAGC CGGTCGCCAT CGTGGGCATG GCCTGCCGCT ACCCCGGTGG 36300 CGTGAGCACC CCGGACGACC TGTGGGAGCT CGCCGCGGAC GGCGTCGACG CGATCACCCC 36360 CTTCCCGGCC GACCGGGGCT GGGACGAGGA CGCCGTCTAC TCGCCCGACC CCGACACCCC 36420 CGGCACCACC TACTGCCGTG AGGGCGGCTT CCTCACCGGC GCCGGGGACT TCGACGCGGC 36480 CTTCTTCGGC ATCTCGCCGA ACGAGGCGCT GGTGATGGAC CCGCAGCAGC GGCTGTTGCT 36540 GGAGACGTCG TGGGAGACGT TGGAGCGGGC CGGCATCGTC CCCGCGTCGC TGCGCGGCAG 36600 CCGTACCGGT GTCTTCGTCG GAGCCGCGCA CACGGGATAC GTCACCGACA CCGCGCGAGC 36660 GCCCGAGGGC ACCGAGGGCT ATCTGCTGAC GGGCAACGCC GATGCCGTCA TGTCCGGCCG 36720 GATCGCCTAC TCCCTGGGTC TGGAGGGGCC GGCGCTGACG ATCGGGACGG CCTGCTCGTC 36780 GTCGTTGGTG GCGTTGCATC TGGCGGTGCA GTCGTTGCGG CGGGGCGAGT GCGACCTGGC 36840 GTTGGCCGGC GGCGTCGCGG TCATGCCCGA CCCGACGGTG TTCGTGGAGT TCTCGCGGCA 36900 GCGGGGGCTG GCGGTGGACG GGCGGTGCAA GGCGTTCGCG GAGGGTGCGG ACGGGACGGC 36960 GTGGGCGGAG GGAGTGGGTG TGCTGCTGGT GGAGCGGCTT TCCGACGCGC GCCGCAATGG 37020 CCATCGGGTG CTGGCGGTGG TGCGGGGCAG TGCGGTCAAT CAGGACGGGG CGAGCAATGG 37080 GCTGACGGCG CCGAGTGGTC CTGCGCAGCA GCGGGTGATC CGTGAGGCGC TGGCTGATGC 37140 GGGGCTGACG CCCGCCGACG TGGATGTGGT GGAGGCGCAC GGTACGGGGA CGGCGTTGGG 37200 TGATCCGATC GAGGCGGGTG CGTTGCTGGC CACGTACGGG CGGGAGCGGG TCGGTGATCC 37260 TTTGTGGTTG GGGTCGTTGA AGTCGAACAT CGGGCATGCG CAGGCGGCTG CGGGTGTGGG 37320 TGGTGTGATC AAGGTGGTGC AGGCGATGCG GCATGGGTCG TTGCCGCGGA CGCTGCATGT 37380 GGATGCGCCG TCGTCGAAGG TGGAGTGGGC TTCGGGTGCG GTGGAGCTGC TGACCGAGGG 37440 CCGGTCGTGG CCGCGGCGGG TGGAGCGGGT GCGGCGGGCC GCGGTGTCGG CGTTCGGGGT 37500 GAGCGGGACC AACGCCCATG TGGTCCTGGA GGAAGCACCG GTCGAGGCCG GGAGCGAGCA 37560 CGGGGACGGC CCCGGACCCG ACCGGCCCGA CGCCGTGACG GGTCCGCTCC CCTGGGTGCT 37620 CTCGGCACGC TCGCGGGAGG CGCTGCGCGG CCAGGCCGGA CGACTCGCCG CTCTCGCCCG 37680 CCAGGGGCGC ACGGAGGGCA CCGGCGGCGG CAGCGGACTC GTCGTCCCCG CGGCCGACAT 37740 CGGATACTCC CTGGCCACCA CCAGGGAGAC CCTGGAGCAC CGGGCGGTGG CGCTGGTGCA 37800 GGAGAACCGG ACGGCCGGGG AGGACCTCGC CGCGCTGGCC GCCGGCCGCA CACCGGAGAG 37860 CGTGGTCACG GGTGTCGCGC GACGTGGCCG CGGGATCGCC TTCCTCTGCT CGGGGCAGGG 37920 CGCCCAGCGG CTCGGCGCCG GTCGGGAGCT CCGCGGCAGG TTCCCCGTCT TCGCCGACGC 37980 CCTCGACGAG ATCGCGGCGG AGTTCGACGC CCACCTCGAA CGCCCTCTCC TGTCGGTGAT 38040 GTTCGCCGAG CCCGCCACGC CGGACGCCGC ACTCCTCGAC CGCACCGACT ACACCCAGCC 38100 GGCCCTCTTC GCGGTGGAGA CCGCGCTCTT CCGGCTCCTG GAGAGCTGGG GCCTGGTCCC 38160 GGACGTCCTC GTGGGCCACT CGATCGGCGG TCTGGTGGCG GCTCACGTGG CGGGCGTCTT 38220 CTCTGCGGCC GACGCGGCCC GGCTGGTCTC CGCACGCGGC CGGCTCATGC GGGCCCTGCC 38280 CGAGGGCGGC GCGATGGCGG CCGTGCAGGC CACCGAGCGG GAGGCCGCCG CGCTGGAGCC 38340 CGTCGCCGCC GGCGGCGCGG TGGTCGCCGC GGTCAACGGC CCGCAGGCCC TCGTGCTCTC 38400 CGGGGACGAG GCGGCCGTAC TGGCGGCGGC CGGTGAACTG GCCGCCCGCG GACGCCGCAC 38460 CAAGCGCCTG AGGGTGAGCC ACGCCTTCCA CTCACCCCGT ATGGACGCCA TGCTCGCCGA 38520 CTTCCGCGCG GTGGCGGACA CGGTCGACTA CCACGCCCCC CGGCTGCCGG TCGTCTCCGA 38580 AGTGACCGGC GACCTCGCCG ACGCCGCCCA GCTGACCGAC CCCGGCTACT GGACCCGCCA 38640 GGTGCGGCAG CCGGTGCGCT TCGCCGACGC CGTGCGCACC GCGAGCGCCC GGGACGCCGC 38700 GACCTTCATC GAGCTCGGGC CCGACGCCGT CCTGTGCGGC ATGGCGGAGG AGTCCCTGGC 38760 CGCGGAGGCC GACGTCGTGT TCGCCCCGGC ACTGCGCCGC GGGCGCCCGG AGGGCGACAC 38820 CGTGCTCCGG GCCGCCGCGA GCGCGTACGT CCGCGGCGCG GGCCTCGACT GGGCCGCGCT 38880 CTACGGCGGC ACGGGAGCCC GCCGCACCGA CCTGCCCACC TACGCCTTCC AGCACAGCCG 38940 CTACTGGCTC GCCCCCGCCT CGGCCGCGGT CGCCCCCGCG ACGGCCGCCC CCTCCGTCCG 39000 ATCCGTGCCG GAAGCCGAGC AGGACGGGGC GCTGTGGGCC GCCGTGCACG CCGGTGACGT 39060 CGCCTCGGCC GCGGCGCGAC TGGGCGCCGA CGACGCCGGT ATCGAACACG AACTGCGCGC 39120 GGTCCTGCCG CACCTGGCCG CCTGGCACGA CCGCGACCGC GCGACCGCGC GGACCGCGGG 39180 CCTGCACTAC CGCGTCACCT GGCAGGCGAT CGAGGCAGAC GCTGTCAGGT TCAGCCCCTC 39240 GGATCGCTGG CTGATGGTCG AGCATGGGCA GCACACGGAA TGCGCGGACG CCGCGGAACG 39300 GGCGCTGCGC GCGGCCGGCG CGGAGGTCAC CCGCCTGGTG TGGCCGCTGG AGCAGCACAC 39360 CGGATCACCG CGGACGGAGA CCCCGGACCG CGGCACCCTG GCGGCCCGGC TGGCCGAGCT 39420 CGCACGGAGC CCGGAGGGCC TGGCCGGCGT GCTGCTGCTC CCCGACTCGG GCGGTGCCGC 39480 GGTCGCCGGG CACCCCGGGC TGGACCAGGG AACGGCGGCG GTGCTGCTGA CGATCCAGGC 39540 ACTGACCGAC GCCGCGGTGC GGGCACCGCT GTGGGTGGTG ACGCGGGGTG CGGTGGCGGT 39600 GGGGTCGGGT GAGGTGCCGT GTGCGGTGGG TGCGCGGGTG TGGGGTCTGG GGCGGGTGGC 39660 TGCGTTGGAG GTGCCGGTGC AGTGGGGTGG GTTGGTGGAT GTGGCGGTGG GGGCGGGTGT 39720 GCGTGAGTGG CGTCGTGTGG TGGGTGTGGT TGCGGGGGGT GGTGAGGATC AGGTGGCGGT 39780 GCGTGGTGGG GGTGTGTTCG GTCGTCGTCT GGTGGGTGTG GGGGTGCGGG GTGGTTCGGG 39840 GGTGTGGCGT GCGCGGGGGT GTGTGGTGGT GACGGGTGGG TTGGGTGGTG TGGGGGGTCA 39900 TGTGGCGCGG TGGTTGGCGC GTTCGGGTGC GGAGCATGTG GTGTTGGCGG GGCGTCGGGG 39960 TGGTGGGGTT GTGGGGGCGG TGGAGTTGGA GCGGGAGTTG GTGGGGTTGG GGGCGAAGGT 40020 GACGTTCGTT TCGTGTGATG TGGGGGATCG GGCGTCGGTG GTGGGGTTGT TGGGTGTGGT 40080 GGAGGGGTTG GGGGTGCCGT TGCGTGGTGT GTTTCATGCG GCGGGGGTGG CTCAGGTGTC 40140 GGGGTTGGGT GAGGTGTCGT TGGCGGAGGC GGGTGGTGTG TTGGGGGGTA AGGCGGTGGG 40200 GGCTGAGTTG TTGGACGAGT TGACGGCGGG TGTGGAGCTG GATGCGTTCG TGTTGTTCTC 40260 GTCGGGTGCT GGGGTGTGGG GGAGTGGGGG GCAGTCGGTG TATGCGGCGG CCAATGCGCA 40320 TCTGGATGCG TTGGCGGAGC GTCGTCGTGC GCAGGGGCGT CCCGCGACCT CCGTCGCCTG 40380 GGGCCCGTGG GACGGCGACG GCATGGGCGA GATGGCGCCC GAGGGCTACT TCGCCCGCCA 40440 CGGCGTGGCC CCGCTCCACC CCGAGACGGC GCTCACCGCC CTGCACCAGG CCATCGACGG 40500 CGGCGAAGCC ACGGTCACCG TGGCGGACAT CGACTGGGAA CGGTTCGCCC CCGGCTTCAC 40560 CGCCTTCCGT CCCAGCCCCC TGATCGCCGG CATCCCCGCG GCCCGTACGG CGCCCGCCGC 40620 CGGCCGGCCC GCCGAGGACA CCCCCACCGC CCCCGGCCTC CTGCGGGCGC GGCCCGAGGA 40680 CCGGCCGCGG CTCGCCCTGG ACCTGGTGCT CCGCCACGTC GCGGCGGTCC TCGGCCACTC 40740 CGAGGACGCC CGGGTCGACG CCCGGGCCCC CTTCCGGGAC CTCGGCTTCG ACTCGCTCGC 40800 CGCGGTGCGG CTGCGCCGCC GGCTGGCCGA GGACACCGGG CTCGACCTGC CCGGCACCCT 40860 CGTCTTCGAC CACGAGGACC CCACCGCGCT GGCCCACCAC CTGGCCGGCC TCGCCGACGC 40920 GGGGACCCCC GGCCCCCAGG AGGGCACGGC TCGGGCCGAG AGCGGGCTGT TCGCCTCCTT 40980 CCGCGCCGCC GTCGAACAGC GCAGGTCGAG CGAGGTCGTG GAGCTGATGG CCGACCTGGC 41040 GGCGTTCCGG CCCGCCTACT CCCGGCAGCA CCCCGGCTCC GGCCGCCCCG CGCCCGTACC 41100 CCTCGCGACC GGACCGGCGA CGCGTCCCAC GCTGTACTGC TGCGCCGGCA CCGCGGTCGG 41160 CTCCGGGCCC GCCGAGTACG TCCCGTTCGC CGAAGGACTG CGCGGCGTCC GGGAGACGGT 41220 CGCCCTTCCC CTGTCCGGCT TCGGCGACCC CGCGGAACCG ATGCCCGCAT CGCTCGACGC 41280 GCTGATCGAG GTCCAGGCCG ACGTCCTCCT GGAGCACACC GCGGGCAAGC CCTTCGCCCT 41340 CGCCGGCCAC TCCGCCGGCG CGAACATCGC CCACGCCCTG GCCGCCCGGC TGGAGGAACG 41400 CGGCTCGGGC CCCGCAGCCG TCGTACTGAT GGACGTCTAC CGTCCCGAGG ACCCCGGTGC 41460 GATGGGCGAG TGGCGCGACG ACCTGCTCAG CTGGGCGCTC GAACGCAGCA CGGTGCCCCT 41520 GGAGGACCAC CGGCTCACCG CCATGGCCGG CTATCAGCGG CTGGTGCTCG GAACCCGGCT 41580 CACCGCCCTC GAAGCCCCCG TCCTGCTGGC CCGGGCGTCC GAACCCCTGT GCGCGTGGCC 41640 GCCCGCGGGC GGGGCGCGGG GCGACTGGCG GTCCCAGGTC CCGTTCGCAC GGACCGTCGC 41700 CGACGTGCCC GGCAACCACT TCACCATGCT CACCGAACAC GCCCGGCACA CCGCGTCCCT 41760 GGTGCACGAA TGGCTGGACA GCCTCCCGCA CCAGCCCGGT CCCGCCCCGC TCACCGGAGG 41820 GAAACACTGA TGTACGCCGA CGACATCGCG GCCGTCTACG ACCTGGTCCA CGAGGGGAAG 41880 GGGAAGGACT ACCGGCAGGA GGCCGAGGAG ATCGCCGCAC TCGTGCGCGT CCACCGGCCG 41940 GGCGCCCGGA CCCTGCTCGA CGTGGCCTGC GGCACCGGCC AGCACCTGCA CCACCTGGAC 42000 GGCCTCTTCG ACCACGTCGA GGGCCTGGAA CTCTCCGCCG ACATGCTGGC CCTCGCGACC 42060 GGCCGGAACC CCGGTGTCAC CTTCCACCAA GGGGACATGC GCTCGTTCTC CCTGGGACGC 42120 CGGTTCGACG CGGTGACCTG CATGTTCAGC TCCATAGGCC ACCTGCGGAC CACCGACGAA 42180 CTCGACAGCA CGCTGCGGGC CTTCACCGAC CACCTCGAAC CGTCCGGCGT CATCGTCGTC 42240 GAACCCTGGT GGTTCCCCGA GTCCTTCACC CCCGGTTACG TCGGCGCCAG CATCACGGAG 42300 GCGGGCGAGC GCACCGTCTG CCGGGTCTCG CACTCCGTAC GGGAGGGGAA CGCCACCCGC 42360 ATCGAGGTGC ACTACCTCCT CGCCGGACCC GGCGGCGTCC GTCACCTGAC CGAGGACCAC 42420 ACCATCACCC TGTTCCCGCG CGCCGACTAC GAGGCGGCCT TCGAGCGCGC CGGCTGCGAC 42480 GTGGTCTACC AGGAAGGCGG CCCGTCCGGT CGCGGGCTGT TCATCGGCAC CCGCCGCTGA 42540 CCCGGTGCCG ACGCGGACCG CCGCGGCCCG GAGGCGGGTT GCCCCGACCC ACCCGGCACA 42600 CCCGGGTCCC CCGATCGTGC GAGCGCCCCC ATCGACCCGA GAAGAAAGGC AGGGCAGCCA 42660 TGCCCACCCT TGCCACGGAA ACGGCCCCCG CGAGCACGAG CACGAGCGCG GGCACGAGCA 42720 CGGGCGTCCG TGCGCTCGGC CGTCGGCTCC AGCTGACCCG GGCCGCACAC TGGTGCGCCG 42780 GCAACCAGGG CGACCCGTAC GCGCTGATCC TGCGCGCCGT CGCCGACCCC GAGCCGTTCG 42840 AACGGGAGAT CCGGGCCCGC GGACCGTGGT TCCGCAGCGA ACAGCTGGAC GCCTGGGTGA 42900 CCGCGGACCC CGAGGTGGCG GCGGCCGTCC TGGCCGACCC GCGCTTCGGC ACGCTGGACC 42960 GGGCCGGACG CCGCCCGGAC GAGGAACTGC TGCCCCTCGC CGAGGCGTTC CCCCACCACG 43020 AACGCGCGGA GCTCGTACGC CTGCGGGCGC TGGCCGCCCC GGTGCTCAGC CGGTACGCCC 43080 CGGCCCAGGC GCCCTGCGCG GCGCGCACCA CCGCCCGCAG AGTGCTCGGC CGCCTGCTGC 43140 CCACCGGTGA CGCCGGGTTC GACCTTGTCG GCGAGGTCGC CCGGCCCTAC GCCGTCGAGC 43200 TGATGCTCAG GCTCCTCGGA GTGCCGGGCC GCGACCGCGC CACCGCCGCG CGGGCACTCG 43260 CCGCCTGCGG CCCCCAGCTC GACGCCCGGA TGGCCCCGCA ACTGCTGACC GTGGCCCGGG 43320 AGTCCGCCGA CGCCGTCCGC ACACTGGCCG ACCTGGTCCC CGAGCTCGTC GCGGAGAAGT 43380 CCCGGGGCCT CGGGAACGCC GAGCCCCGGC CCGACGACGT GCTCGCCCTC CTCCTGCACG 43440 ACGGCGTCGC CCCCGGCGAC GTCGAGCGCA TCGCGCTGCT CCTCGCGGTC GGCGCACCCG 43500 AACCCGTCGT CACCGCCGTC GCGCACACGG TCCACCGGCT GCTCGGCCGG CCGGGGGAGT 43560 GGGAGAGGGC CCGCCGGACG CCGGCCGCGG CGAACGCCGT CGACCAGGTG CTGCGCGAGC 43620 GCCCCCCGGC CCGGCTGGAG AACCGGGTCG CGCACACCGG CCTCGAACTC GGCGGCCGCC 43680 GGATCACCGC CGACGAGCAC GTCGTGGTGC TGGCCGCCGC CGGACGGGAG ATCCCCGGGC 43740 CGGAGCCGCT CGGGGGCGCC GACGGACCGC ACCTGGCGCT CGCCCTCCCG CTGATCCGCC 43800 TGGCCGCCAC CACCGCGGTC CAGGTCACGG CCGGCCGCCT GCCCGGCCTG CGGGCCGAGG 43860 GACCGCCCCT GACCCGGCCG CGGTCACCGG TCCTGGGCGC CTGCGCCCGC CTCCGGGTCC 43920 ACCCGGGATG ACCCCGCCGT CCGTACGCCC CCTCCCAGAC CGGAGCCGCT GTGCGCGTCC 43980 TGCTGACATC CCTCGCCCAC AACACCCACT ACTACAGTCT GGTGCCCCTC GCCTGGGCGC 44040 TGCGCGCCGC CGGGCACGAG GTACGGGTGG CGAGCCCGCC CTCCCTCACC GACGTCATCA 44100 CCTCCACCGG TCTGACCGCC GTACCGGTGG GCGACGACCG ACCGGCCGCG GAGCTGCTCG 44160 CCGAGATGGG CAGAGACCTC GTCCCCTACC AGAGGGGCTT CGAGTTCGGT GAGGTGGAGA 44220 3GCGAGGAGGA GACCACCTGG GAGTACCTGC TCGGCCAGCA GAGCATGATG GCCGCCCTGT 44280 GCTTCGCCCC GTTCAACGGC GCCGCCACGA TGGACGAGAT CGTCGACTTC GCCCGTGGCT 44340 GGCGGCCCGA CCTGGTCGTG TGGGAACCCT GGACCTA 44377
【0037】配列番号:2 配列の長さ:4550 配列の型:アミノ酸 トポロジー:不明 配列の種類:ペプチド 配列 Met Ser Gly Glu Leu Ala Ile Ser Arg Ser Asp Asp Arg Ser Asp Ala 1 5 10 15 Val Ala Val Val Gly Met Ala Cys Arg Phe Pro Gly Ala Pro Gly Ile 20 25 30 Ala Glu Phe Trp Lys Leu Leu Thr Asp Gly Arg Asp Ala Ile Gly Arg 35 40 45 Asp Ala Asp Gly Arg Arg Arg Gly Met Ile Glu Ala Pro Gly Asp Phe 50 55 60 Asp Ala Ala Phe Phe Gly Met Ser Pro Arg Glu Ala Ala Glu Thr Asp 65 70 75 80 Pro Gln Gln Arg Leu Met Leu Glu Leu Gly Trp Glu Ala Leu Glu Asp 85 90 95 Ala Gly Ile Val Pro Gly Ser Leu Arg Gly Glu Ala Val Gly Val Phe 100 105 110 Val Gly Ala Met His Asp Asp Tyr Ala Thr Leu Leu His Arg Ala Gly 115 120 125 Ala Pro Val Gly Pro His Thr Ala Thr Gly Leu Gln Arg Ala Met Leu 130 135 140 Ala Asn Arg Leu Ser Tyr Val Leu Gly Thr Arg Gly Pro Ser Leu Ala 145 150 155 160 Val Asp Thr Ala Gln Ser Ser Ser Leu Val Ala Val Ala Leu Ala Val 165 170 175 Glu Ser Leu Arg Ala Gly Thr Ser Arg Val Ala Val Ala Gly Gly Val 180 185 190 Asn Leu Val Leu Ala Asp Glu Gly Thr Ala Ala Met Glu Arg Leu Gly 195 200 205 Ala Leu Ser Pro Asp Gly Arg Cys His Thr Phe Asp Ala Arg Ala Asn 210 215 220 Gly Tyr Val Arg Gly Glu Gly Gly Ala Ala Val Val Leu Lys Pro Leu 225 230 235 240 Ala Asp Ala Leu Ala Asp Gly Asp Pro Val Tyr Cys Val Val Arg Gly 245 250 255 Val Ala Val Gly Asn Asp Gly Gly Gly Pro Gly Leu Thr Ala Pro Asp 260 265 270 Arg Glu Gly Gln Glu Ala Val Leu Arg Ala Ala Cys Ala Gln Ala Arg 275 280 285 Val Asp Pro Ala Glu Val Arg Phe Val Glu Leu His Gly Thr Gly Thr 290 295 300 Pro Val Gly Asp Pro Val Glu Ala His Ala Leu Gly Ala Val His Gly 305 310 315 320 Ser Gly Arg Pro Ala Asp Asp Pro Leu Leu Val Gly Ser Val Lys Thr 325 330 335 Asn Ile Gly His Leu Glu Gly Ala Ala Gly Ile Ala Gly Leu Val Lys 340 345 350 Ala Ala Leu Cys Leu Arg Glu Arg Thr Leu Pro Gly Ser Leu Asn Phe 355 360 365 Ala Thr Pro Ser Pro Ala Ile Pro Leu Asp Gln Leu Arg Leu Lys Val 370 375 380 Gln Thr Ala Ala Ala Glu Leu Pro Leu Ala Pro Gly Gly Ala Pro Leu 385 390 395 400 Leu Ala Gly Val Ser Ser Phe Gly Ile Gly Gly Thr Asn Cys His Val 405 410 415 Val Leu Glu His Leu Pro Ser Arg Pro Thr Pro Ala Val Ser Val Ala 420 425 430 Ala Ser Leu Pro Asp Val Pro Pro Leu Leu Leu Ser Ala Arg Ser Glu 435 440 445 Gly Ala Leu Arg Ala Gln Ala Val Arg Leu Gly Glu Tyr Val Glu Arg 450 455 460 Val Gly Ala Asp Pro Arg Asp Val Ala Tyr Ser Leu Ala Ser Thr Arg 465 470 475 480 Thr Leu Phe Glu His Arg Ala Val Val Pro Cys Gly Gly Arg Gly Glu 485 490 495 Leu Val Ala Ala Leu Gly Gly Phe Ala Ala Gly Arg Val Ser Gly Gly 500 505 510 Val Arg Ser Gly Arg Ala Val Pro Gly Gly Val Gly Val Leu Phe Thr 515 520 525 Gly Gln Gly Ala Gln Trp Val Gly Met Gly Arg Gly Leu Tyr Ala Gly 530 535 540 Gly Gly Val Phe Ala Glu Val Leu Asp Glu Val Leu Ser Met Val Gly 545 550 555 560 Glu Val Asp Gly Arg Ser Leu Arg Asp Val Met Phe Gly Asp Val Asp 565 570 575 Val Asp Ala Gly Ala Gly Ala Asp Ala Gly Ala Gly Ala Gly Ala Gly 580 585 590 Val Gly Ser Gly Ser Gly Ser Val Gly Gly Leu Leu Gly Arg Thr Glu 595 600 605 Phe Ala Gln Pro Ala Leu Phe Ala Leu Glu Val Ala Leu Phe Arg Ala 610 615 620 Leu Glu Ala Arg Gly Val Glu Val Ser Val Val Leu Gly His Ser Val 625 630 635 640 Gly Glu Val Ala Ala Ala Tyr Val Ala Gly Val Leu Ser Leu Gly Asp 645 650 655 Ala Val Arg Leu Val Val Ala Arg Gly Gly Leu Met Gly Gly Leu Pro 660 665 670 Val Gly Gly Gly Met Trp Ser Val Gly Ala Ser Glu Ser Val Val Arg 675 680 685 Gly Val Val Glu Gly Leu Gly Glu Trp Val Ser Val Ala Ala Val Asn 690 695 700 Gly Pro Arg Ser Val Val Leu Ser Gly Asp Val Gly Val Leu Glu Ser 705 710 715 720 Val Val Ala Ser Leu Met Gly Asp Gly Val Glu Cys Arg Arg Leu Asp 725 730 735 Val Ser His Gly Phe His Ser Val Leu Met Glu Pro Val Leu Gly Glu 740 745 750 Phe Arg Gly Val Val Glu Ser Leu Glu Phe Gly Arg Val Arg Pro Gly 755 760 765 Val Val Val Val Ser Gly Val Ser Gly Gly Val Val Gly Ser Gly Glu 770 775 780 Leu Gly Asp Pro Gly Tyr Trp Val Arg His Ala Arg Glu Ala Val Arg 785 790 795 800 Phe Ala Asp Gly Val Gly Val Val Arg Gly Leu Gly Val Gly Thr Leu 805 810 815 Val Glu Val Gly Pro His Gly Val Leu Thr Gly Met Ala Gly Glu Cys 820 825 830 Leu Gly Ala Gly Asp Asp Val Val Val Val Pro Ala Met Arg Arg Gly 835 840 845 Arg Ala Glu Arg Glu Val Phe Glu Ala Ala Leu Ala Thr Val Phe Thr 850 855 860 Arg Asp Ala Gly Leu Asp Ala Thr Ala Leu His Thr Gly Ser Thr Gly 865 870 875 880 Arg Arg Ile Asp Leu Pro Thr Tyr Pro Phe Gln Arg Arg Thr His Trp 885 890 895 Ser Pro Ala Leu Ser Arg Pro Val Thr Ala Asp Ala Gly Ala Gly Val 900 905 910 Thr Ala Thr Asp Ala Val Gly His Ser Val Ser Pro Asp Pro Glu Ser 915 920 925 Thr Glu Gly Thr Ser His Arg Asp Thr Asp Asp Glu Ala Asp Ser Ala 930 935 940 Ser Pro Glu Pro Met Ser Pro Glu Asp Ala Val Arg Leu Val Arg Glu 945 950 955 960 Ser Thr Ala Ala Val Leu Gly His Asp Asp Pro Gly Glu Val Ala Leu 965 970 975 Asp Arg Thr Phe Thr Ser Gln Gly Met Asp Ser Val Thr Ala Val Glu 980 985 990 Leu Cys Asp Leu Leu Lys Gly Ala Ser Gly Leu Pro Leu Ala Ala Thr 995 1000 1005 Leu Val Tyr Asp Leu Pro Thr Pro Arg Ala Val Ala Glu His Ile Val 1010 1015 1020 Glu Ala Ala Gly Gly Pro Lys Asp Ser Val Ala Gly Gly Pro Gly Val 1025 1030 1035 1040 Leu Ser Ser Ala Ala Val Gly Val Ser Asp Ala Arg Gly Gly Ser Arg 1045 1050 1055 Asp Asp Asp Asp Pro Ile Ala Ile Val Gly Val Gly Cys Arg Leu Pro 1060 1065 1070 Gly Gly Val Asp Ser Arg Ala Ala Leu Trp Glu Leu Leu Glu Ser Gly 1075 1080 1085 Ala Asp Ala Ile Ser Ser Phe Pro Thr Asp Arg Gly Trp Asp Leu Asp 1090 1095 1100 Gly Leu Tyr Asp Pro Glu Pro Gly Thr Pro Gly Lys Thr Tyr Val Arg 1105 1110 1115 1120 Glu Gly Gly Phe Leu His Ser Ala Ala Glu Phe Asp Ala Glu Phe Phe 1125 1130 1135 Gly Ile Ser Pro Arg Glu Ala Thr Ala Met Asp Pro Gln Gln Arg Leu 1140 1145 1150 Leu Leu Glu Ala Ser Trp Glu Ala Leu Glu Asp Ala Gly Val Leu Pro 1155 1160 1165 Glu Ser Leu Arg Gly Gly Asp Ala Gly Val Phe Val Gly Ala Thr Ala 1170 1175 1180 Pro Glu Tyr Gly Pro Arg Leu His Glu Gly Ala Asp Gly Tyr Glu Gly 1185 1190 1195 1200 Tyr Leu Leu Thr Gly Thr Thr Ala Ser Val Ala Ser Gly Arg Ile Ala 1205 1210 1215 Tyr Thr Leu Gly Thr Gly Gly Pro Ala Leu Thr Val Asp Thr Ala Cys 1220 1225 1230 Ser Ser Ser Leu Val Ala Leu His Leu Ala Val Gln Ala Leu Arg Arg 1235 1240 1245 Gly Glu Cys Gly Leu Ala Leu Ala Gly Gly Ala Thr Val Met Ser Gly 1250 1255 1260 Pro Gly Met Phe Val Glu Phe Ser Arg Gln Arg Gly Leu Ala Pro Asp 1265 1270 1275 1280 Gly Arg Cys Met Pro Phe Ser Ala Asp Ala Asp Gly Thr Ala Trp Ser 1285 1290 1295 Glu Gly Val Ala Val Leu Ala Leu Glu Arg Leu Ser Asp Ala Arg Arg 1300 1305 1310 Ala Gly His Arg Val Leu Gly Val Val Arg Gly Ser Ala Val Asn Gln 1315 1320 1325 Asp Gly Ala Ser Asn Gly Leu Thr Ala Pro Asn Arg Ser Ala Gln Glu 1330 1335 1340 Gly Val Ile Arg Ala Ala Leu Ala Asp Ala Gly Leu Ala Pro Gly Asp 1345 1350 1355 1360 Val Asp Ala Val Glu Ala His Gly Thr Gly Thr Ala Leu Gly Asp Pro 1365 1370 1375 Ile Glu Ala Ser Ala Leu Leu Ala Thr Tyr Gly Arg Glu Arg Val Gly 1380 1385 1390 Asp Pro Leu Trp Leu Gly Ser Leu Lys Ser Asn Val Gly His Thr Gln 1395 1400 1405 Ala Ala Ala Gly Ala Ala Gly Val Val Lys Met Leu Leu Ala Leu Glu 1410 1415 1420 His Gly Thr Leu Pro Arg Thr Leu His Ala Asp Arg Pro Ser Thr His 1425 1430 1435 1440 Val Asp Trp Ser Ser Gly Thr Val Ala Leu Leu Ala Glu Ala Arg Arg 1445 1450 1455 Trp Pro Arg Arg Ser Asp Arg Pro Arg Arg Ala Ala Val Ser Ser Phe 1460 1465 1470 Gly Ile Ser Gly Thr Asn Ala His Leu Ile Ile Glu Glu Ala Pro Glu 1475 1480 1485 Trp Val Glu Asp Ile Asp Gly Val Ala Ala Pro Asp Arg Gly Thr Ala 1490 1495 1500 Asp Ala Ala Ala Pro Ser Pro Leu Leu Leu Ser Ala Arg Ser Glu Gly 1505 1510 1515 1520 Ala Leu Arg Ala Gln Ala Val Arg Leu Gly Glu Tyr Val Glu Arg Val 1525 1530 1535 Gly Ala Asp Pro Arg Asp Val Ala Tyr Ser Leu Ala Ser Thr Arg Thr 1540 1545 1550 Leu Phe Glu His Arg Ala Val Val Pro Cys Gly Gly Arg Gly Glu Leu 1555 1560 1565 Val Ala Ala Leu Gly Gly Phe Ala Ala Gly Arg Val Ser Gly Gly Val 1570 1575 1580 Arg Ser Gly Arg Ala Val Pro Gly Gly Val Gly Val Leu Phe Thr Gly 1585 1590 1595 1600 Gln Gly Ala Gln Trp Val Gly Met Gly Arg Gly Leu Tyr Ala Gly Gly 1605 1610 1615 Gly Val Phe Ala Glu Val Leu Asp Glu Val Leu Ser Met Val Gly Glu 1620 1625 1630 Val Asp Gly Arg Ser Leu Arg Asp Val Met Phe Gly Asp Val Asp Val 1635 1640 1645 Asp Ala Gly Ala Gly Ala Asp Ala Gly Ala Gly Ala Gly Ala Gly Val 1650 1655 1660 Gly Ser Gly Ser Gly Ser Val Gly Gly Leu Leu Gly Arg Thr Glu Phe 1665 1670 1675 1680 Ala Gln Pro Ala Leu Phe Ala Leu Glu Val Ala Leu Phe Arg Ala Leu 1685 1690 1695 Glu Ala Arg Gly Val Glu Val Ser Val Val Leu Gly His Ser Val Gly 1700 1705 1710 Glu Val Ala Ala Ala Tyr Val Ala Gly Val Leu Ser Leu Gly Asp Ala 1715 1720 1725 Val Arg Leu Val Val Ala Arg Gly Gly Leu Met Gly Gly Leu Pro Val 1730 1735 1740 Gly Gly Gly Met Trp Ser Val Gly Ala Ser Glu Ser Val Val Arg Gly 1745 1750 1755 1760 Val Val Glu Gly Leu Gly Glu Trp Val Ser Val Ala Ala Val Asn Gly 1765 1770 1775 Pro Arg Ser Val Val Leu Ser Gly Asp Val Gly Val Leu Glu Ser Val 1780 1785 1790 Val Ala Ser Leu Met Gly Asp Gly Val Glu Cys Arg Arg Leu Asp Val 1795 1800 1805 Ser His Gly Phe His Ser Val Leu Met Glu Pro Val Leu Gly Glu Phe 1810 1815 1820 Arg Gly Val Val Glu Ser Leu Glu Phe Gly Arg Val Arg Pro Gly Val 1825 1830 1835 1840 Val Val Val Ser Gly Val Ser Gly Gly Val Val Gly Ser Gly Glu Leu 1845 1850 1855 Gly Asp Pro Gly Tyr Trp Val Arg His Ala Arg Glu Ala Val Arg Phe 1860 1865 1870 Ala Asp Gly Val Gly Val Val Arg Gly Leu Gly Val Gly Thr Leu Val 1875 1880 1885 Glu Val Gly Pro His Gly Val Leu Thr Gly Met Ala Gly Glu Cys Leu 1890 1895 1900 Gly Ala Gly Asp Asp Val Val Val Val Pro Ala Met Arg Arg Gly Arg 1905 1910 1915 1920 Ala Glu Arg Glu Val Phe Glu Ala Ala Leu Ala Thr Val Phe Thr Arg 1925 1930 1935 Asp Ala Gly Leu Asp Ala Thr Ala Leu His Thr Gly Ser Thr Gly Arg 1940 1945 1950 Arg Ile Asp Leu Pro Thr Tyr Pro Phe Gln Arg Asp Arg Tyr Trp Leu 1955 1960 1965 Asp Pro Val Arg Thr Ala Val Thr Gly Val Glu Pro Ala Gly Ser Pro 1970 1975 1980 Ala Asp Ala Arg Ala Thr Glu Arg Gly Arg Ser Thr Thr Ala Gly Ile 1985 1990 1995 2000 Arg Tyr Arg Val Ala Trp Gln Pro Ala Val Val Asp Arg Gly Asn Pro 2005 2010 2015 Gly Pro Ala Gly His Val Leu Leu Leu Ala Pro Asp Glu Asp Thr Ala 2020 2025 2030 Asp Ser Gly Leu Ala Pro Ala Ile Ala Arg Glu Leu Ala Val Arg Gly 2035 2040 2045 Ala Glu Val His Thr Val Ala Val Pro Val Gly Thr Gly Arg Glu Ala 2050 2055 2060 Ala Gly Asp Leu Leu Arg Ala Ala Gly Asp Gly Ala Ala Arg Ser Thr 2065 2070 2075 2080 Arg Val Leu Trp Leu Ala Pro Ala Glu Pro Asp Ala Ala Asp Ala Val 2085 2090 2095 Ala Leu Val Gln Ala Leu Gly Glu Ala Val Pro Glu Ala Pro Leu Trp 2100 2105 2110 Ile Thr Thr Arg Glu Ala Ala Ala Val Arg Pro Asp Glu Thr Pro Ser 2115 2120 2125 Val Gly Gly Ala Gln Leu Trp Gly Leu Gly Gln Val Ala Ala Leu Glu 2130 2135 2140 Leu Gly Arg Arg Trp Gly Gly Leu Ala Asp Leu Pro Gly Ser Ala Ser 2145 2150 2155 2160 Pro Ala Val Leu Arg Thr Phe Val Gly Ala Leu Leu Ala Gly Gly Glu 2165 2170 2175 Asn Gln Phe Ala Val Arg Pro Ser Gly Val His Val Arg Arg Val Val 2180 2185 2190 Pro Ala Pro Val Pro Val Pro Ala Ser Ala Arg Thr Val Thr Thr Ala 2195 2200 2205 Pro Ala Thr Ala Val Gly Glu Asp Ala Arg Asn Asp Thr Ser Asp Val 2210 2215 2220 Val Val Pro Asp Asp Arg Trp Ser Ser Gly Thr Val Leu Ile Thr Gly 2225 2230 2235 2240 Gly Thr Gly Ala Leu Gly Ala Gln Val Ala Arg Arg Leu Ala Arg Ser 2245 2250 2255 Gly Ala Ala Arg Leu Leu Leu Val Gly Arg Arg Gly Ala Ala Gly Pro 2260 2265 2270 Gly Val Gly Glu Leu Val Glu Glu Leu Thr Ala Leu Gly Ser Glu Val 2275 2280 2285 Ala Val Glu Ala Cys Asp Val Ala Asp Arg Asp Ala Leu Ala Ala Leu 2290 2295 2300 Leu Ala Gly Leu Pro Glu Glu Arg Pro Leu Val Ala Val Leu His Ala 2305 2310 2315 2320 Ala Gly Val Leu Asp Asp Gly Val Leu Asp Ser Leu Thr Ser Asp Arg 2325 2330 2335 Val Asp Ala Val Leu Arg Asp Lys Val Thr Ala Ala Arg His Leu Asp 2340 2345 2350 Glu Leu Thr Ala Asp Leu Pro Leu Asp Ala Phe Val Leu Phe Ser Ser 2355 2360 2365 Ile Val Gly Val Trp Gly Asn Gly Gly Gln Ala Val Tyr Ala Ala Ala 2370 2375 2380 Asn Ala Ala Leu Asp Ala Leu Ala Gln Arg Arg Arg Ala Arg Gly Ala 2385 2390 2395 2400 Arg Ala Ala Ser Ile Ala Trp Gly Pro Trp Ala Gly Ala Gly Met Ala 2405 2410 2415 Ser Gly Thr Ala Ala Lys Ser Phe Glu Arg Asp Gly Val Thr Ala Leu 2420 2425 2430 Asp Pro Glu Arg Ala Leu Asp Val Leu Asp Asp Val Val Gly Ala Gly 2435 2440 2445 Gly Thr Ser Ala Ala Gly Thr His Ala Ala Gly Glu Ser Ser Leu Leu 2450 2455 2460 Val Ala Asp Val Asp Trp Glu Thr Phe Val Gly Arg Ser Val Thr Arg 2465 2470 2475 2480 Arg Thr Trp Ser Leu Phe Asp Gly Val Ser Ala Ala Arg Ser Ala Arg 2485 2490 2495 Ala Gly His Ala Ala Asp Asp Arg Ala Ala Leu Thr Pro Gly Thr Arg 2500 2505 2510 Pro Gly Asp Gly Ala Pro Gly Gly Ser Gly Gln Asp Gly Gly Glu Gly 2515 2520 2525 Arg Pro Trp Leu Ser Val Gly Pro Ser Pro Ala Glu Arg Arg Arg Ala 2530 2535 2540 Leu Leu Thr Leu Val Arg Ser Glu Ala Ala Gly Ile Leu Arg His Ala 2545 2550 2555 2560 Ser Ala Asp Ala Val Asp Pro Glu Leu Ala Phe Arg Ser Ala Gly Phe 2565 2570 2575 Asp Ser Leu Thr Val Leu Glu Leu Arg Asn Arg Leu Thr Ala Ala Thr 2580 2585 2590 Gly Leu Asn Leu Pro Asn Thr Leu Leu Phe Asp His Pro Thr Pro Leu 2595 2600 2605 Ser Leu Ala Ser His Leu His Asp Glu Leu Phe Gly Pro Asp Ser Glu 2610 2615 2620 Ala Glu Pro Ala Ala Ala Ala Pro Thr Pro Val Met Ala Asp Glu Arg 2625 2630 2635 2640 Glu Pro Ile Ala Ile Val Gly Met Ala Cys Arg Tyr Pro Gly Gly Val 2645 2650 2655 Ala Ser Pro Asp Asp Leu Trp Asp Leu Val Ala Gly Asp Gly His Thr 2660 2665 2670 Leu Ser Pro Phe Pro Ala Asp Arg Gly Trp Asp Val Glu Gly Leu Tyr 2675 2680 2685 Asp Pro Glu Pro Gly Val Pro Gly Lys Ser Tyr Val Arg Glu Gly Gly 2690 2695 2700 Phe Leu Arg Ser Ala Ala Glu Phe Asp Ala Glu Phe Phe Gly Ile Ser 2705 2710 2715 2720 Pro Arg Glu Ala Thr Ala Met Asp Pro Gln Gln Arg Leu Leu Leu Glu 2725 2730 2735 Thr Ser Trp Glu Ala Leu Glu Arg Ala Gly Ile Val Pro Asp Ser Leu 2740 2745 2750 Arg Gly Thr Arg Thr Gly Val Phe Ser Gly Ile Ser Gln Gln Asp Tyr 2755 2760 2765 Ala Thr Gln Leu Gly Asp Ala Ala Asp Thr Tyr Gly Gly His Val Leu 2770 2775 2780 Thr Gly Thr Leu Gly Ser Val Ile Ser Gly Arg Val Ala Tyr Ala Leu 2785 2790 2795 2800 Gly Leu Glu Gly Pro Ala Leu Thr Val Asp Thr Ala Cys Ser Ser Ser 2805 2810 2815 Leu Val Ala Leu His Leu Ala Val Gln Ser Leu Arg Arg Gly Glu Cys 2820 2825 2830 Asp Leu Ala Leu Ala Gly Gly Val Thr Val Met Ala Thr Pro Thr Val 2835 2840 2845 Phe Val Glu Phe Ser Arg Gln Arg Gly Leu Ala Ala Asp Gly Arg Cys 2850 2855 2860 Lys Ala Phe Ala Glu Gly Ala Asp Gly Thr Ala Trp Ala Glu Gly Val 2865 2870 2875 2880 Gly Val Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg Asn Gly His 2885 2890 2895 Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala 2900 2905 2910 Ser Asn Gly Leu Thr Ala Pro Ser Gly Pro Ala Gln Gln Arg Val Ile 2915 2920 2925 Arg Glu Ala Leu Ala Asp Ala Gly Leu Val Pro Ala Asp Val Asp Val 2930 2935 2940 Val Glu Ala His Gly Thr Gly Thr Ala Leu Gly Asp Pro Ile Glu Ala 2945 2950 2955 2960 Gly Ala Leu Leu Ala Thr Tyr Gly Arg Glu Arg Val Gly Asp Pro Leu 2965 2970 2975 Trp Leu Gly Ser Leu Lys Ser Asn Ile Gly His Ala Gln Ala Ala Ala 2980 2985 2990 Gly Val Gly Gly Val Ile Lys Val Val Gln Gly Met Arg His Gly Ser 2995 3000 3005 Leu Pro Arg Thr Leu His Val Asp Ala Pro Ser Ser Lys Val Glu Trp 3010 3015 3020 Ala Ser Gly Ala Val Glu Leu Leu Thr Glu Thr Arg Ser Trp Pro Arg 3025 3030 3035 3040 Arg Val Glu Arg Val Arg Arg Ala Ala Val Ser Ala Phe Gly Val Ser 3045 3050 3055 Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro Ala Glu Ala Gly 3060 3065 3070 Ser Glu His Gly Asp Gly Pro Glu Pro Glu Arg Pro Asp Ala Val Thr 3075 3080 3085 Gly Pro Leu Ser Trp Val Leu Ser Ala Arg Ser Glu Gly Ala Leu Arg 3090 3095 3100 Ala Gln Ala Val Arg Leu Arg Glu Cys Val Glu Arg Val Gly Ala Asp 3105 3110 3115 3120 Pro Arg Asp Val Ala Gly Ser Leu Val Val Ser Arg Ala Ser Phe Gly 3125 3130 3135 Glu Arg Ala Val Val Val Gly Arg Gly Arg Glu Glu Leu Leu Ala Gly 3140 3145 3150 Leu Asp Val Val Ala Ala Gly Ala Pro Val Gly Val Ser Ser Gly Ala 3155 3160 3165 Gly Ala Val Val Arg Gly Ser Ala Val Arg Gly Arg Gly Val Gly Val 3170 3175 3180 Leu Phe Thr Gly Gln Gly Ala Gln Trp Val Gly Met Gly Arg Gly Leu 3185 3190 3195 3200 Tyr Ala Gly Gly Gly Val Phe Ala Glu Val Leu Asp Glu Val Leu Ser 3205 3210 3215 Val Val Gly Glu Val Asp Gly Arg Ser Leu Arg Asp Val Met Phe Ala 3220 3225 3230 Asp Ala Asp Ser Val Leu Gly Gly Leu Leu Gly Arg Thr Glu Phe Ala 3235 3240 3245 Gln Pro Ala Leu Phe Ala Leu Glu Val Ala Leu Phe Arg Ala Leu Glu 3250 3255 3260 Ala Arg Gly Val Glu Val Ser Val Val Leu Gly His Ser Val Gly Glu 3265 3270 3275 3280 Val Ala Ala Ala Tyr Val Ala Gly Val Leu Ser Leu Gly Asp Ala Val 3285 3290 3295 Arg Leu Val Val Ala Arg Gly Gly Leu Met Gly Gly Leu Pro Val Gly 3300 3305 3310 Gly Gly Met Trp Ser Val Gly Ala Ser Glu Ser Val Val Arg Gly Val 3315 3320 3325 Val Glu Gly Leu Gly Glu Trp Val Ser Val Ala Ala Val Asn Gly Pro 3330 3335 3340 Arg Ser Val Val Leu Ser Gly Asp Val Gly Val Leu Glu Ser Val Val 3345 3350 3355 3360 Val Thr Leu Met Gly Asp Gly Val Glu Cys Arg Arg Leu Asp Val Ser 3365 3370 3375 His Gly Phe His Ser Val Leu Met Glu Pro Val Leu Gly Glu Phe Arg 3380 3385 3390 Gly Val Val Glu Ser Leu Glu Phe Gly Arg Val Arg Pro Gly Val Val 3395 3400 3405 Val Val Ser Gly Val Ser Gly Gly Val Val Gly Ser Gly Glu Leu Gly 3410 3415 3420 Asp Pro Gly Tyr Trp Val Arg His Ala Arg Glu Ala Val Arg Phe Ala 3425 3430 3435 3440 Asp Gly Val Gly Val Val Arg Gly Leu Gly Val Gly Thr Leu Val Glu 3445 3450 3455 Val Gly Pro His Gly Val Leu Thr Gly Met Ala Gly Gln Cys Leu Glu 3460 3465 3470 Ala Gly Asp Asp Val Val Val Val Pro Ala Met Arg Arg Gly Arg Pro 3475 3480 3485 Glu Arg Glu Val Phe Glu Ala Ala Leu Ala Thr Val Phe Thr Arg Asp 3490 3495 3500 Ala Gly Leu Asp Ala Thr Thr Leu His Thr Gly Ser Thr Gly Arg Arg 3505 3510 3515 3520 Ile Asp Leu Pro Thr Tyr Pro Phe Gln His Asn Arg Tyr Trp Ala Thr 3525 3530 3535 Gly Ser Val Thr Gly Ala Thr Gly Thr Ser Ala Ala Ala Arg Phe Gly 3540 3545 3550 Leu Glu Trp Lys Asp His Pro Phe Leu Ser Gly Ala Thr Pro Ile Ala 3555 3560 3565 Gly Ser Gly Ala Leu Leu Leu Thr Gly Arg Val Gly Leu Ala Ala His 3570 3575 3580 Pro Trp Leu Ala Asp His Ala Ile Ser Gly Thr Val Leu Leu Pro Gly 3585 3590 3595 3600 Thr Ala Ile Ala Asp Leu Leu Leu Arg Ala Val Glu Glu Val Gly Ala 3605 3610 3615 Gly Gly Val Glu Glu Leu Thr Leu His Glu Pro Leu Leu Leu Pro Glu 3620 3625 3630 Arg Gly Gly Leu His Val Gln Val Leu Val Glu Ala Ala Asp Glu Gln 3635 3640 3645 Gly Arg Arg Ala Val Ala Val Ala Ala Arg Pro Glu Gly Pro Gly Arg 3650 3655 3660 Asp Gly Glu Glu Gln Glu Trp Thr Arg His Ala Glu Gly Val Leu Thr 3665 3670 3675 3680 Ser Thr Glu Thr Ala Val Pro Asp Met Gly Trp Ala Ala Gly Ala Trp 3685 3690 3695 Pro Pro Pro Gly Ala Glu Pro Ile Asp Val Glu Glu Leu Tyr Asp Ala 3700 3705 3710 Phe Ala Ala Asp Gly Tyr Gly Tyr Gly Pro Ala Phe Thr Ala Leu Ser 3715 3720 3725 Gly Val Trp Arg Leu Gly Asp Glu Leu Phe Ala Glu Val Arg Arg Pro 3730 3735 3740 Ala Gly Gly Ala Gly Thr Thr Gly Asp Gly Phe Gly Val His Pro Ala 3745 3750 3755 3760 Leu Phe Asp Ala Ala Leu His Pro Trp Arg Ala Gly Gly Leu Leu Pro 3765 3770 3775 Asp Thr Gly Gly Thr Thr Trp Ala Pro Phe Ser Trp Gln Gly Ile Ala 3780 3785 3790 Leu His Thr Thr Gly Ala Glu Thr Leu Arg Val Arg Leu Ala Pro Ala 3795 3800 3805 Ala Gly Gly Thr Glu Ser Ala Phe Ser Val Gln Ala Ala Asp Pro Ala 3810 3815 3820 Gly Thr Pro Val Leu Thr Leu Asp Ala Leu Leu Leu Arg Pro Val Thr 3825 3830 3835 3840 Leu Gly Arg Ala Asp Ala Pro Gln Pro Leu Tyr Arg Val Asp Trp Gln 3845 3850 3855 Pro Val Gly Gln Gly Thr Glu Ala Ser Gly Ala Gln Gly Trp Thr Val 3860 3865 3870 Leu Gly Gln Ala Ala Ala Glu Thr Val Ala Gln Pro Ala Ala His Ala 3875 3880 3885 Asp Leu Thr Ala Leu Arg Thr Ala Val Ala Ala Ala Gly Thr Pro Val 3890 3895 3900 Pro Arg Leu Val Val Val Ser Pro Val Asp Thr Arg Leu Asp Glu Gly 3905 3910 3915 3920 Pro Val Leu Ala Asp Ala Glu Ala Arg Ala Arg Ala Gly Asp Gly Trp 3925 3930 3935 Asp Asp Asp Pro Leu Arg Val Ala Leu Gly Arg Gly Leu Thr Leu Val 3940 3945 3950 Arg Glu Trp Val Glu Asp Glu Arg Leu Ala Asp Ser Arg Leu Val Val 3955 3960 3965 Leu Thr Arg Gly Ala Val Ala Ala Gly Pro Gly Asp Val Pro Asp Leu 3970 3975 3980 Thr Gly Ala Ala Leu Trp Gly Leu Leu Arg Ser Ala Gln Ser Glu Tyr 3985 3990 3995 4000 Pro Asp Arg Phe Thr Leu Ile Asp Val Asp Asp Ser Pro Glu Ser Arg 4005 4010 4015 Ala Ala Leu Pro Arg Ala Leu Gly Ser Ala Glu Arg Gln Leu Ala Leu 4020 4025 4030 Arg Thr Gly Asp Val Leu Ala Pro Ala Leu Val Pro Met Ala Thr Arg 4035 4040 4045 Pro Ala Glu Thr Thr Pro Ala Thr Ala Val Ala Ser Ala Thr Thr Gln 4050 4055 4060 Thr Gln Val Thr Ala Pro Ala Pro Asp Asp Pro Ala Ala Asp Ala Val 4065 4070 4075 4080 Phe Asp Pro Ala Gly Thr Val Leu Ile Thr Gly Gly Thr Gly Ala Leu 4085 4090 4095 Gly Arg Arg Val Ala Ser His Leu Ala Arg Arg Tyr Gly Val Arg His 4100 4105 4110 Met Leu Leu Val Ser Arg Arg Gly Pro Asp Ala Pro Glu Ala Gly Pro 4115 4120 4125 Leu Glu Arg Glu Leu Ala Gly Leu Gly Val Thr Ala Thr Phe Leu Ala 4130 4135 4140 Cys Asp Leu Thr Asp Ile Glu Ala Val Arg Lys Ala Val Ala Ala Val 4145 4150 4155 4160 Pro Ser Asp His Pro Leu Thr Gly Val Val His Thr Ala Gly Val Leu 4165 4170 4175 Asp Asp Gly Ala Leu Thr Gly Leu Thr Arg Gln Arg Leu Asp Thr Val 4180 4185 4190 Leu Arg Pro Lys Ala Asp Ala Val Arg Asn Leu His Glu Ala Thr Leu 4195 4200 4205 Asp Arg Pro Leu Arg Ala Phe Val Leu Phe Ser Ala Ala Ala Gly Leu 4210 4215 4220 Leu Gly Arg Pro Gly Gln Ala Ser Tyr Ala Ala Ala Asn Ala Val Leu 4225 4230 4235 4240 Asp Ala Leu Ala Gly Ala Arg Arg Ala Ala Gly Leu Pro Ala Val Ser 4245 4250 4255 Leu Ala Trp Gly Leu Trp Asp Glu Gln Thr Gly Met Ala Gly Gly Leu 4260 4265 4270 Asp Glu Met Ala Leu Arg Val Leu Arg Arg Asp Gly Ile Ala Ala Met 4275 4280 4285 Pro Pro Glu Gln Gly Leu Glu Leu Leu Asp Leu Ala Leu Thr Gly His 4290 4295 4300 Arg Asp Gly Pro Ala Val Leu Val Pro Leu Leu Leu Asp Gly Ala Ala 4305 4310 4315 4320 Leu Arg Arg Thr Ala Lys Glu Arg Gly Ala Ala Thr Met Ser Pro Leu 4325 4330 4335 Leu Arg Ala Leu Leu Pro Ala Ala Leu Arg Arg Ser Gly Gly Ala Gly 4340 4345 4350 Ala Pro Ala Ala Ala Asp Arg His Gly Lys Glu Ala Asp Pro Gly Ala 4355 4360 4365 Gly Arg Leu Ala Gly Met Val Ala Leu Glu Ala Ala Glu Arg Ser Ala 4370 4375 4380 Ala Val Leu Glu Leu Val Thr Glu Gln Val Ala Glu Val Leu Gly Tyr 4385 4390 4395 4400 Ala Ser Ala Ala Glu Ile Glu Pro Glu Arg Pro Phe Arg Glu Ile Gly 4405 4410 4415 Val Asp Ser Leu Ala Ala Val Glu Leu Arg Asn Arg Leu Ser Arg Leu 4420 4425 4430 Val Gly Leu Arg Leu Pro Thr Thr Leu Ser Phe Asp His Pro Thr Pro 4435 4440 4445 Lys Asp Met Ala Gln His Ile Asp Gly Gln Leu Pro Arg Pro Ala Gly 4450 4455 4460 Ala Ser Pro Ala Asp Ala Ala Leu Glu Gly Ile Gly Asp Leu Ala Arg 4465 4470 4475 4480 Ala Val Ala Leu Leu Gly Thr Gly Asp Ala Arg Arg Ala Glu Val Arg 4485 4490 4495 Glu Gln Leu Val Gly Leu Leu Ala Ala Leu Asp Pro Pro Gly Arg Thr 4500 4505 4510 Gly Thr Ala Ala Pro Gly Val Pro Ser Gly Ala Asp Gly Ala Glu Pro 4515 4520 4525 Thr Val Thr Asp Arg Leu Asp Glu Ala Thr Asp Asp Glu Ile Phe Ala 4530 4535 4540 Phe Leu Asp Glu Gln Leu 4545 4550
【0038】配列番号:3 配列の長さ:1996 配列の型:アミノ酸 トポロジー:不明 配列の種類:ペプチド 配列 Met Thr Ala Glu Asn Asp Lys Ile Arg Ser Tyr Leu Lys Arg Ala Thr 1 5 10 15 Ala Glu Leu His Arg Thr Lys Ser Arg Leu Ala Glu Val Glu Ser Ala 20 25 30 Ser Arg Glu Pro Ile Ala Ile Val Gly Met Ala Cys Arg Tyr Pro Gly 35 40 45 Gly Val Ala Ser Pro Asp Asp Leu Trp Asp Leu Val Ala Ala Gly Thr 50 55 60 Asp Ala Val Ser Ala Phe Pro Val Asp Arg Gly Trp Asp Val Glu Gly 65 70 75 80 Leu Tyr Asp Pro Asp Pro Glu Ala Val Gly Arg Ser Tyr Val Arg Glu 85 90 95 Gly Gly Phe Leu His Ser Ala Ala Glu Phe Asp Ala Glu Phe Phe Gly 100 105 110 Ile Ser Pro Arg Glu Ala Ala Ala Met Asp Pro Gln Gln Arg Leu Leu 115 120 125 Leu Glu Thr Ser Trp Glu Ala Leu Glu Arg Ala Gly Ile Val Pro Ala 130 135 140 Ser Leu Arg Gly Thr Arg Thr Gly Val Phe Thr Gly Val Met Tyr Asp 145 150 155 160 Asp Tyr Gly Ser Arg Phe Asp Ser Ala Pro Pro Glu Tyr Glu Gly Tyr 165 170 175 Leu Val Asn Gly Ser Ala Gly Ser Ile Ala Ser Gly Arg Val Ala Tyr 180 185 190 Ala Leu Gly Leu Glu Gly Pro Ala Leu Thr Val Asp Thr Ala Cys Ser 195 200 205 Ser Ser Leu Val Ala Leu His Leu Ala Val Gln Ser Leu Arg Arg Gly 210 215 220 Glu Cys Asp Leu Ala Leu Ala Gly Gly Val Thr Val Met Ala Thr Pro 225 230 235 240 Thr Val Leu Val Glu Phe Ser Arg Gln Arg Gly Leu Ala Ala Asp Gly 245 250 255 Arg Cys Lys Ala Phe Ala Glu Gly Ala Asp Gly Thr Ala Trp Ala Glu 260 265 270 Gly Val Gly Val Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg Asn 275 280 285 Gly His Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp 290 295 300 Gly Ala Ser Asn Gly Leu Thr Ala Pro Ser Gly Pro Ala Gln Gln Arg 305 310 315 320 Val Ile Arg Glu Ala Leu Ala Asp Ala Gly Leu Thr Pro Ala Asp Val 325 330 335 Asp Ala Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile 340 345 350 Glu Ala Gly Ala Leu Leu Ala Thr Tyr Gly Ser Glu Arg Gln Gly Gln 355 360 365 Gly Pro Leu Trp Leu Gly Ser Leu Lys Ser Asn Ile Gly His Ala Gln 370 375 380 Ala Ala Ala Gly Val Gly Gly Val Ile Lys Val Val Gln Ala Met Arg 385 390 395 400 His Gly Ser Leu Pro Arg Thr Leu His Val Asp Ala Pro Ser Ser Lys 405 410 415 Val Glu Trp Ala Ser Gly Ala Val Glu Leu Leu Thr Glu Thr Arg Ser 420 425 430 Trp Pro Arg Arg Val Glu Arg Val Arg Arg Ala Ala Val Ser Ala Phe 435 440 445 Gly Val Ser Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro Ala 450 455 460 Glu Ala Gly Ser Glu His Gly Asp Gly Pro Glu Pro Glu Arg Pro Asp 465 470 475 480 Ala Val Thr Gly Pro Leu Ser Trp Val Leu Ser Ala Arg Ser Glu Gly 485 490 495 Ala Leu Arg Ala Gln Ala Val Arg Leu Arg Glu Cys Val Glu Arg Val 500 505 510 Gly Ala Asp Pro Arg Asp Val Ala Gly Ser Leu Val Val Ser Arg Ala 515 520 525 Ser Phe Gly Glu Arg Ala Val Val Val Gly Arg Gly Arg Glu Glu Leu 530 535 540 Leu Ala Gly Leu Asp Val Val Ala Ala Gly Ala Pro Val Gly Val Ser 545 550 555 560 Gly Gly Val Ser Ser Gly Ala Gly Ala Val Val Arg Gly Ser Ala Val 565 570 575 Arg Gly Arg Gly Val Gly Val Leu Phe Thr Gly Gln Gly Ala Gln Trp 580 585 590 Val Gly Met Gly Arg Gly Leu Tyr Ala Gly Gly Gly Val Phe Ala Glu 595 600 605 Val Leu Asp Glu Val Leu Ser Val Val Gly Glu Val Gly Gly Trp Ser 610 615 620 Leu Arg Asp Val Met Phe Gly Asp Val Asp Val Asp Ala Gly Ala Gly 625 630 635 640 Ala Asp Ala Gly Val Gly Ser Gly Val Gly Val Gly Gly Leu Leu Gly 645 650 655 Arg Thr Glu Phe Ala Gln Pro Ala Leu Phe Ala Leu Glu Val Ala Leu 660 665 670 Phe Arg Ala Leu Glu Ala Arg Gly Val Glu Val Ser Val Val Leu Gly 675 680 685 His Ser Val Gly Glu Val Ala Ala Ala Tyr Val Ala Gly Val Leu Ser 690 695 700 Leu Gly Asp Ala Val Arg Leu Val Val Ala Arg Gly Gly Leu Met Gly 705 710 715 720 Gly Leu Pro Val Gly Gly Gly Met Trp Ser Val Gly Ala Ser Glu Ser 725 730 735 Val Val Arg Gly Val Val Glu Gly Leu Gly Glu Trp Val Ser Val Ala 740 745 750 Ala Val Asn Gly Pro Arg Ser Val Val Leu Ser Gly Asp Val Gly Val 755 760 765 Leu Glu Ser Val Val Ala Ser Leu Met Gly Asp Gly Val Glu Cys Arg 770 775 780 Arg Leu Asp Val Ser His Gly Phe His Ser Val Leu Met Glu Pro Val 785 790 795 800 Leu Gly Glu Phe Arg Gly Val Val Glu Ser Leu Glu Phe Gly Arg Val 805 810 815 Arg Pro Gly Val Val Val Val Ser Ser Val Ser Gly Gly Val Val Gly 820 825 830 Ser Gly Glu Leu Gly Asp Pro Gly Tyr Trp Val Arg His Ala Arg Glu 835 840 845 Ala Val Arg Phe Ala Asp Gly Val Gly Val Val Arg Gly Leu Gly Val 850 855 860 Gly Thr Leu Val Glu Val Gly Pro His Gly Val Leu Thr Gly Met Ala 865 870 875 880 Gly Glu Cys Leu Gly Ala Gly Asp Asp Val Val Val Val Pro Ala Met 885 890 895 Arg Arg Gly Arg Ala Glu Arg Glu Val Phe Glu Ala Ala Leu Ala Thr 900 905 910 Val Phe Thr Arg Asp Ala Gly Leu Asp Ala Thr Thr Leu His Thr Gly 915 920 925 Ser Thr Gly Arg Arg Ile Asp Leu Pro Thr Tyr Pro Phe Gln His Asp 930 935 940 Arg Tyr Trp Leu Ala Ala Pro Ser Arg Pro Arg Thr Asp Gly Leu Ser 945 950 955 960 Ala Ala Gly Leu Arg Glu Val Glu His Pro Leu Leu Thr Ala Ala Val 965 970 975 Glu Leu Pro Gly Thr Asp Thr Glu Val Trp Thr Gly Arg Ile Ser Ala 980 985 990 Ala Asp Leu Pro Trp Leu Ala Asp His Leu Val Trp Asp Arg Gly Val 995 1000 1005 Val Pro Gly Thr Ala Leu Leu Glu Thr Val Leu Gln Val Gly Ser Arg 1010 1015 1020 Ile Gly Leu Pro Arg Val Ala Glu Leu Val Leu Glu Thr Pro Leu Thr 1025 1030 1035 1040 Trp Thr Ser Asp Arg Pro Leu Gln Val Arg Ile Val Val Thr Ala Ala 1045 1050 1055 Ala Thr Ala Pro Gly Gly Ala Arg Glu Leu Thr Leu His Ser Arg Pro 1060 1065 1070 Glu Pro Val Ala Ala Ser Ser Ser Ser Pro Ser Pro Ala Ser Pro Arg 1075 1080 1085 His Leu Thr Ala Gln Glu Ser Asp Asp Asp Trp Thr Arg His Ala Ser 1090 1095 1100 Gly Leu Leu Ala Pro Ala Ala Gly Leu Ala Asp Asp Phe Ala Glu Leu 1105 1110 1115 1120 Thr Gly Ala Trp Pro Pro Val Gly Ala Glu Pro Leu Asp Leu Ala Gly 1125 1130 1135 Gln Tyr Pro Leu Phe Ala Ala Ala Gly Val Arg Tyr Glu Gly Ala Phe 1140 1145 1150 Arg Gly Leu Arg Ala Ala Trp Arg Arg Gly Asp Glu Val Phe Ala Asp 1155 1160 1165 Val Arg Leu Pro Asp Ala His Ala Val Asp Ala Asp Arg Tyr Gly Val 1170 1175 1180 His Pro Ala Leu Leu Asp Ala Val Leu His Pro Ile Ala Ser Leu Asp 1185 1190 1195 1200 Pro Leu Gly Asp Gly Gly His Gly Leu Leu Pro Phe Ser Trp Thr Asp 1205 1210 1215 Val Gln Gly His Gly Ala Gly Gly His Ala Leu Arg Val Arg Val Ala 1220 1225 1230 Ala Val Asp Gly Gly Ala Val Ser Val Thr Ala Ala Asp His Ala Gly 1235 1240 1245 Asn Pro Val Leu Ser Ala Arg Ser Leu Ala Leu Arg Arg Ile Thr Ala 1250 1255 1260 Asp Arg Leu Pro Ala Ala Pro Val Ala Pro Leu Tyr Arg Val Asp Trp 1265 1270 1275 1280 Leu Pro Phe Pro Gly Pro Val Pro Val Ser Ala Gly Gly Arg Trp Ala 1285 1290 1295 Val Val Gly Pro Glu Ala Glu Ala Thr Ala Ala Gly Leu Arg Ala Val 1300 1305 1310 Gly Leu Asp Val Arg Thr His Ala Leu Pro Leu Gly Glu Pro Leu Pro 1315 1320 1325 Pro Gln Ala Gly Thr Asp Ala Glu Val Ile Ile Leu Asp Leu Thr Thr 1330 1335 1340 Thr Ala Ala Gly Arg Thr Ala Ser Asp Gly Gly Arg Leu Ser Leu Leu 1345 1350 1355 1360 Asp Glu Val Arg Ala Thr Val Arg Arg Thr Leu Glu Ala Val Gln Ala 1365 1370 1375 Arg Leu Ala Asp Thr Glu Thr Ala Pro Asp Val Asp Val Arg Thr Ala 1380 1385 1390 Ala Arg Pro Arg Thr Ala Ala Arg Thr Ser Pro Arg Val Asp Thr Arg 1395 1400 1405 Thr Gly Ala Arg Thr Ala Asp Gly Pro Arg Leu Val Val Leu Thr Arg 1410 1415 1420 Gly Ala Ala Gly Pro Glu Gly Gly Ala Ala Asp Pro Ala Gly Ala Ala 1425 1430 1435 1440 Val Trp Gly Leu Val Arg Val Ala Gln Ala Glu Gln Pro Gly Arg Phe 1445 1450 1455 Thr Leu Val Asp Val Asp Gly Thr Gln Ala Ser Leu Arg Ala Leu Pro 1460 1465 1470 Gly Leu Leu Ala Thr Asp Ala Gly Gln Ser Ala Val Arg Asp Gly Arg 1475 1480 1485 Val Thr Val Pro Arg Leu Val Pro Val Ala Asp Pro Val Pro His Gly 1490 1495 1500 Gly Gly Thr Ala Ala Asp Gly Thr Gly Ala Gly Glu Pro Ser Ala Thr 1505 1510 1515 1520 Leu Asp Pro Glu Gly Thr Val Leu Ile Thr Gly Gly Thr Gly Ala Leu 1525 1530 1535 Ala Ala Glu Thr Ala Arg His Leu Val Asp Arg His Lys Val Arg His 1540 1545 1550 Leu Leu Leu Val Gly Arg Arg Gly Pro Asp Ala Pro Gly Val Asp Arg 1555 1560 1565 Leu Val Ala Glu Leu Thr Glu Ser Gly Ala Glu Val Ala Val Arg Ala 1570 1575 1580 Cys Asp Val Thr Asp Arg Asp Ala Leu Arg Arg Leu Leu Asp Ala Leu 1585 1590 1595 1600 Pro Asp Glu His Pro Leu Thr Cys Val Val His Thr Ala Gly Val Leu 1605 1610 1615 Asp Asp Gly Val Leu Ser Ala Gln Thr Ala Glu Arg Ile Asp Thr Val 1620 1625 1630 Leu Arg Pro Lys Ala Asp Ala Ala Val His Leu Asp Glu Leu Thr Arg 1635 1640 1645 Glu Ile Gly Arg Val Pro Leu Val Leu Tyr Ser Ser Val Ser Ala Thr 1650 1655 1660 Leu Gly Ser Ala Gly Gln Ala Gly Tyr Ala Ala Ala Asn Ala Phe Met 1665 1670 1675 1680 Asp Ala Leu Ala Ala Arg Arg Cys Ala Ala Gly His Pro Ala Leu Ser 1685 1690 1695 Leu Gly Trp Gly Trp Trp Ser Gly Val Gly Leu Ala Thr Gly Leu Asp 1700 1705 1710 Gly Ala Asp Ala Ala Arg Val Arg Arg Ser Gly Leu Ala Pro Leu Asp 1715 1720 1725 Ala Gly Ala Ala Leu Asp Leu Leu Asp Arg Ala Leu Thr Arg Pro Glu 1730 1735 1740 Pro Ala Leu Leu Pro Val Arg Leu Asp Leu Arg Ala Ala Ala Gly Ala 1745 1750 1755 1760 Thr Ala Leu Pro Glu Val Leu Arg Asp Leu Ala Gly Val Pro Ala Asp 1765 1770 1775 Ala Arg Ser Thr Pro Gly Ala Ala Ala Gly Thr Gly Asp Glu Asp Gly 1780 1785 1790 Ala Val Arg Pro Ala Pro Ala Pro Ala Asp Ala Ala Gly Thr Leu Ala 1795 1800 1805 Ala Arg Leu Ala Gly Arg Ser Ala Pro Glu Arg Thr Ala Leu Leu Leu 1810 1815 1820 Asp Leu Val Arg Thr Glu Val Ala Ala Val Leu Gly His Gly Asp Pro 1825 1830 1835 1840 Ala Ala Ile Gly Ala Ala Arg Thr Phe Lys Asp Ala Gly Phe Asp Ser 1845 1850 1855 Leu Thr Ala Val Asp Leu Arg Asn Arg Leu Asn Thr Arg Thr Gly Leu 1860 1865 1870 Arg Leu Pro Ala Thr Leu Val Phe Asp His Pro Thr Pro Leu Ala Leu 1875 1880 1885 Ala Glu Leu Leu Leu Asp Gly Leu Glu Ala Ala Gly Pro Ala Glu Pro 1890 1895 1900 Ala Ala Glu Val Pro Asp Glu Ala Ala Gly Ala Glu Thr Leu Ser Gly 1905 1910 1915 1920 Val Ile Asp Arg Leu Glu Arg Ser Leu Ala Ala Thr Asp Asp Gly Asp 1925 1930 1935 Ala Arg Val Arg Ala Ala Arg Arg Leu Arg Gly Leu Leu Asp Ala Leu 1940 1945 1950 Pro Ala Gly Pro Gly Ala Ala Ser Gly Pro Asp Ala Gly Glu His Ala 1955 1960 1965 Pro Gly Arg Gly Asp Val Val Ile Asp Arg Leu Arg Ser Ala Ser Asp 1970 1975 1980 Asp Asp Leu Phe Asp Leu Leu Asp Ser Asp Phe Gln 1985 1990 1995
【0039】配列番号:4 配列の長さ:3724 配列の型:アミノ酸 トポロジー:不明 配列の種類:ペプチド 配列 Met Ser Ala Thr Asn Glu Glu Lys Leu Arg Glu Tyr Leu Arg Arg Ala 1 5 10 15 Met Ala Asp Leu His Ser Ala Arg Glu Arg Leu Arg Glu Val Glu Ser 20 25 30 Ala Ser Arg Glu Pro Ile Ala Ile Val Gly Met Ala Cys Arg Tyr Pro 35 40 45 Gly Gly Val Ala Ser Pro Glu Glu Leu Trp Asp Leu Val Ala Ala Gly 50 55 60 Thr Asp Ala Ile Ser Pro Phe Pro Val Asp Arg Gly Trp Asp Ala Glu 65 70 75 80 Gly Leu Tyr Asp Pro Glu Pro Gly Val Pro Gly Lys Ser Tyr Val Arg 85 90 95 Glu Gly Gly Phe Leu His Ser Ala Ala Glu Phe Asp Ala Glu Phe Phe 100 105 110 Gly Ile Ser Pro Arg Glu Ala Ala Ala Met Asp Pro Gln Gln Arg Leu 115 120 125 Leu Leu Glu Thr Ser Trp Glu Ala Leu Glu Arg Ala Gly Ile Val Pro 130 135 140 Ala Ser Leu Arg Gly Thr Arg Thr Gly Val Phe Thr Gly Val Met Tyr 145 150 155 160 His Asp Tyr Gly Ser His Gln Val Gly Thr Ala Ala Asp Pro Ser Gly 165 170 175 Gln Leu Gly Leu Gly Thr Ala Gly Ser Val Ala Ser Gly Arg Val Ala 180 185 190 Tyr Thr Leu Gly Leu Gln Gly Pro Ala Val Thr Met Asp Thr Ala Cys 195 200 205 Ser Ser Ser Leu Val Ala Leu His Leu Ala Val Gln Ser Leu Arg Arg 210 215 220 Gly Glu Cys Asp Leu Ala Leu Ala Gly Gly Ala Thr Val Leu Ala Thr 225 230 235 240 Pro Thr Val Phe Val Glu Phe Ser Arg Gln Arg Gly Leu Ala Ala Asp 245 250 255 Gly Arg Cys Lys Ala Phe Ala Glu Gly Ala Asp Gly Thr Ala Trp Ala 260 265 270 Glu Gly Ala Gly Val Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg 275 280 285 Asn Gly His Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln 290 295 300 Asp Gly Ala Ser Asn Gly Leu Thr Ala Pro Ser Gly Pro Ala Gln Gln 305 310 315 320 Arg Val Ile Arg Asp Ala Leu Ala Asp Ala Gly Leu Thr Pro Ala Asp 325 330 335 Val Asp Ala Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro 340 345 350 Ile Glu Ala Gly Ala Leu Met Ala Thr Tyr Gly Ser Glu Arg Val Gly 355 360 365 Asp Pro Leu Trp Leu Gly Ser Leu Lys Ser Asn Ile Gly His Thr Gln 370 375 380 Ala Ala Ala Gly Ala Ala Gly Val Ile Lys Met Val Gln Ala Leu Arg 385 390 395 400 Gln Ser Glu Leu Pro Arg Thr Leu His Val Asp Ala Pro Ser Ala Lys 405 410 415 Val Glu Trp Asp Ala Gly Ala Val Gln Leu Leu Thr Gly Val Arg Pro 420 425 430 Trp Pro Arg Arg Glu His Arg Pro Arg Arg Ala Ala Val Ser Ala Phe 435 440 445 Gly Val Ser Gly Thr Asn Ala His Val Ile Ile Glu Glu Pro Pro Ala 450 455 460 Ala Gly Asp Thr Ser Pro Ala Gly Asp Thr Pro Glu Pro Gly Glu Ala 465 470 475 480 Thr Ala Ser Pro Ser Thr Ala Ala Gly Pro Ser Ser Pro Ser Ala Val 485 490 495 Ala Gly Pro Leu Ser Pro Ser Ser Pro Ala Val Val Trp Pro Leu Ser 500 505 510 Ala Glu Thr Ala Pro Ala Leu Arg Ala Gln Ala Ala Arg Leu Arg Ala 515 520 525 His Leu Glu Arg Leu Pro Gly Thr Ser Pro Thr Asp Ile Gly His Ala 530 535 540 Leu Ala Ala Glu Arg Ala Ala Leu Thr Arg Arg Val Val Leu Leu Gly 545 550 555 560 Asp Asp Gly Ala Pro Val Asp Ala Leu Ala Ala Leu Ala Ala Gly Glu 565 570 575 Thr Thr Pro Asp Ala Val His Gly Thr Ala Ala Asp Ile Arg Arg Val 580 585 590 Ala Phe Val Phe Pro Gly Gln Gly Ser Gln Trp Ala Gly Met Gly Ala 595 600 605 Glu Leu Leu Asp Thr Ala Pro Ala Phe Ala Ala Glu Leu Asp Arg Cys 610 615 620 Gln Gly Ala Leu Ser Pro Tyr Val Asp Trp Asn Leu Ala Asp Val Leu 625 630 635 640 Arg Gly Ala Pro Ala Ala Pro Gly Leu Asp Arg Val Asp Val Val Gln 645 650 655 Pro Ala Thr Phe Ala Val Met Val Gly Leu Ala Ala Leu Trp Arg Ser 660 665 670 Leu Gly Val Glu Pro Ala Ala Val Ile Gly His Ser Gln Gly Glu Ile 675 680 685 Ala Ala Ala Cys Val Ala Gly Ala Leu Ser Leu Glu Asp Ala Ala Arg 690 695 700 Ile Val Ala Leu Arg Ser Gln Val Ile Ala Arg Glu Leu Ala Gly Arg 705 710 715 720 Gly Gly Met Ala Ser Val Ala Leu Pro Ala Ala Glu Val Glu Ala Arg 725 730 735 Leu Ala Gly Gly Val Glu Ile Ala Ala Val Asn Gly Pro Gly Ser Thr 740 745 750 Val Val Cys Gly Glu Pro Gly Ala Leu Glu Ala Leu Leu Val Thr Leu 755 760 765 Glu Ser Glu Gly Thr Arg Val Arg Arg Ile Asp Val Asp Tyr Ala Ser 770 775 780 His Ser His Tyr Val Glu Ser Ile Arg Ala Glu Leu Ala Thr Val Leu 785 790 795 800 Gly Pro Val Arg Pro Arg Arg Gly Asp Val Pro Phe Tyr Ser Thr Val 805 810 815 Glu Ala Ala Leu Leu Asp Thr Ala Thr Leu Asp Ala Asp Tyr Trp Tyr 820 825 830 Arg Asn Leu Arg Leu Pro Val Arg Phe Glu Pro Thr Val Arg Ala Met 835 840 845 Leu Asp Asp Gly Val Asp Ala Phe Val Glu Cys Ser Ala His Pro Val 850 855 860 Leu Thr Val Gly Val Arg Gln Thr Val Glu Ser Ala Gly Gly Ala Val 865 870 875 880 Pro Ala Leu Ala Ser Leu Arg Arg Asp Glu Gly Gly Leu Arg Arg Phe 885 890 895 Leu Thr Ser Ala Ala Glu Ala Gln Val Val Gly Val Pro Val Asp Trp 900 905 910 Ala Thr Leu Arg Pro Gly Ala Gly Arg Val Asp Leu Pro Thr Tyr Ala 915 920 925 Phe Gln Arg Glu Arg His Trp Val Gly Pro Ala Arg Pro Asp Ser Ala 930 935 940 Ala Thr Ala Ala Thr Thr Gly Asp Asp Ala Pro Glu Pro Gly Asp Arg 945 950 955 960 Leu Gly Tyr His Val Ala Trp Lys Gly Leu Arg Ser Thr Thr Gly Gly 965 970 975 Trp Arg Pro Gly Leu Arg Leu Leu Ile Val Pro Thr Gly Asp Gln Tyr 980 985 990 Thr Ala Leu Ala Asp Thr Leu Glu Gln Ala Val Ala Ser Phe Gly Gly 995 1000 1005 Thr Val Arg Arg Val Ala Phe Asp Pro Ala Arg Thr Gly Arg Ala Glu 1010 1015 1020 Leu Phe Gly Leu Leu Glu Thr Glu Ile Asn Gly Asp Thr Ala Val Thr 1025 1030 1035 1040 Gly Val Val Ser Leu Leu Gly Leu Cys Thr Asp Gly Arg Pro Asp His 1045 1050 1055 Pro Ala Val Pro Val Ala Val Thr Ala Thr Leu Ala Leu Val Gln Ala 1060 1065 1070 Leu Ala Asp Leu Gly Ser Thr Ala Pro Leu Trp Thr Val Thr Cys Gly 1075 1080 1085 Ala Val Ala Thr Ala Pro Asp Glu Leu Pro Cys Thr Ala Gly Ala Gln 1090 1095 1100 Leu Trp Gly Leu Gly Arg Val Ala Ala Leu Glu Leu Pro Glu Val Trp 1105 1110 1115 1120 Gly Gly Leu Ile Asp Leu Pro Ala Arg Pro Asp Ala Arg Val Leu Asp 1125 1130 1135 Arg Leu Ala Gly Val Leu Ala Glu Pro Gly Gly Glu Asp Gln Ile Ala 1140 1145 1150 Val Arg Met Ala Gly Val Phe Gly Arg Arg Val Leu Arg Asn Pro Ala 1155 1160 1165 Asp Ser Arg Pro Pro Ala Trp Arg Ala Arg Gly Thr Val Leu Ile Ala 1170 1175 1180 Gly Asp Leu Thr Thr Val Pro Gly Arg Leu Val Arg Ser Leu Leu Glu 1185 1190 1195 1200 Asp Gly Ala Asp Arg Val Val Leu Ala Gly Pro Asp Ala Pro Ala Gln 1205 1210 1215 Ala Ala Ala Ala Gly Leu Thr Gly Val Ser Leu Val Pro Val Arg Cys 1220 1225 1230 Asp Val Thr Asp Arg Ala Ala Leu Ala Ala Leu Leu Asp Glu His Ala 1235 1240 1245 Pro Thr Val Ala Val His Ala Pro Pro Leu Val Pro Leu Ala Pro Leu 1250 1255 1260 Arg Glu Thr Ala Pro Gly Asp Ile Ala Ala Ala Leu Ala Ala Lys Thr 1265 1270 1275 1280 Thr Ala Ala Gly His Leu Val Asp Leu Ala Pro Ala Ala Gly Leu Asp 1285 1290 1295 Ala Leu Val Leu Phe Ser Ser Val Ser Gly Val Trp Gly Gly Ala Ala 1300 1305 1310 Gln Gly Gly Tyr Ala Ala Ala Ser Ala His Leu Asp Ala Leu Ala Glu 1315 1320 1325 Arg Ala Arg Ala Ala Gly Val Pro Ala Phe Ser Val Ala Trp Ser Pro 1330 1335 1340 Trp Ala Gly Gly Thr Pro Ala Asp Gly Ala Glu Ala Glu Phe Leu Ser 1345 1350 1355 1360 Arg Arg Gly Leu Ala Pro Leu Asp Pro Asp Gln Ala Val Arg Thr Leu 1365 1370 1375 Arg Arg Met Leu Glu Arg Gly Ser Ala Cys Gly Ala Val Ala Asp Val 1380 1385 1390 Glu Trp Ser Arg Phe Ala Ala Ser Tyr Thr Trp Val Arg Pro Ala Val 1395 1400 1405 Leu Phe Asp Asp Ile Pro Asp Val Gln Arg Leu Arg Ala Ala Glu Leu 1410 1415 1420 Ala Pro Ser Thr Gly Asp Ser Thr Thr Ser Glu Leu Val Arg Glu Leu 1425 1430 1435 1440 Thr Ala Gln Ser Gly His Lys Arg His Ala Thr Leu Leu Arg Leu Val 1445 1450 1455 Arg Ala His Ala Ala Ala Val Leu Gly Gln Ser Ser Gly Asp Ala Val 1460 1465 1470 Ser Ser Ala Arg Ala Phe Arg Asp Leu Gly Phe Asp Ser Leu Thr Ala 1475 1480 1485 Leu Glu Leu Arg Asp Arg Leu Ser Thr Ser Thr Gly Leu Lys Leu Pro 1490 1495 1500 Thr Ser Leu Val Phe Asp His Ser Ser Pro Ala Ala Leu Ala Arg His 1505 1510 1515 1520 Leu Gly Glu Glu Leu Leu Gly Arg Asn Asp Thr Ala Asp Arg Ala Gly 1525 1530 1535 Pro Asp Thr Pro Val Arg Thr Asp Glu Pro Ile Ala Ile Ile Gly Met 1540 1545 1550 Ala Cys Arg Leu Pro Gly Gly Val Gln Ser Pro Glu Asp Leu Trp Asp 1555 1560 1565 Leu Leu Thr Gly Gly Thr Asp Ala Ile Thr Pro Phe Pro Thr Asn Arg 1570 1575 1580 Gly Trp Asp Asn Glu Thr Leu Tyr Asp Pro Asp Pro Asp Ser Pro Gly 1585 1590 1595 1600 His His Thr Tyr Val Arg Glu Gly Gly Phe Leu His Asp Ala Ala Glu 1605 1610 1615 Phe Asp Pro Gly Phe Phe Gly Ile Ser Pro Arg Glu Ala Leu Ala Met 1620 1625 1630 Asp Pro Gln Gln Arg Leu Ile Leu Glu Thr Ser Trp Glu Ser Phe Glu 1635 1640 1645 Arg Ala Gly Ile Asp Pro Val Glu Leu Arg Gly Ser Arg Thr Gly Val 1650 1655 1660 Phe Val Gly Thr Asn Gly Gln His Tyr Val Pro Leu Leu Gln Asp Gly 1665 1670 1675 1680 Asp Glu Asn Phe Asp Gly Tyr Ile Ala Thr Gly Asn Ser Ala Ser Val 1685 1690 1695 Met Ser Gly Arg Leu Ser Tyr Val Phe Gly Leu Glu Gly Pro Ala Val 1700 1705 1710 Thr Val Asp Thr Ala Cys Ser Ala Ser Leu Ala Ala Leu His Leu Ala 1715 1720 1725 Val Gln Ser Leu Arg Arg Gly Glu Cys Asp Tyr Ala Leu Ala Gly Gly 1730 1735 1740 Ala Thr Val Met Ser Thr Pro Glu Met Leu Val Glu Phe Ala Arg Gln 1745 1750 1755 1760 Arg Ala Val Ser Pro Asp Gly Arg Ser Lys Ala Phe Ala Glu Ala Ala 1765 1770 1775 Asp Gly Val Gly Leu Ala Glu Gly Ala Gly Met Leu Leu Val Glu Arg 1780 1785 1790 Leu Ser Glu Ala Gln Lys Lys Gly His Pro Val Leu Ala Val Val Arg 1795 1800 1805 Gly Ser Ala Val Asn Gln Asp Gly Ala Ser Asn Gly Leu Thr Ala Pro 1810 1815 1820 Ser Gly Pro Ala Gln Gln Arg Val Ile Arg Glu Ala Leu Ala Asp Ala 1825 1830 1835 1840 Gly Leu Thr Pro Ala Asp Val Asp Ala Val Glu Ala His Gly Thr Gly 1845 1850 1855 Thr Pro Leu Gly Asp Pro Ile Glu Ala Gly Ala Leu Leu Ala Thr Tyr 1860 1865 1870 Gly Arg Asp Arg Arg Asp Gly Pro Leu Trp Leu Gly Ser Leu Lys Ser 1875 1880 1885 Asn Ile Gly His Thr Gln Ala Ala Ala Gly Val Ala Gly Val Ile Lys 1890 1895 1900 Met Val Leu Ala Leu Arg His Gly Glu Leu Pro Arg Thr Leu His Ala 1905 1910 1915 1920 Ser Thr Ala Ser Ser Arg Ile Asp Trp Asp Ala Gly Ala Val Glu Leu 1925 1930 1935 Leu Asp Glu Ala Arg Pro Trp Leu Gln Arg Ala Glu Gly Pro Arg Arg 1940 1945 1950 Ala Gly Ile Ser Ser Phe Gly Ile Ser Gly Thr Asn Ala His Leu Val 1955 1960 1965 Ile Glu Glu Pro Pro Glu Pro Thr Ala Pro Glu Leu Leu Ala Pro Glu 1970 1975 1980 Pro Ala Ala Asp Gly Asp Val Trp Ser Glu Glu Trp Trp His Glu Val 1985 1990 1995 2000 Thr Val Pro Leu Met Met Ser Ala His Asn Glu Ala Ala Leu Arg Asp 2005 2010 2015 Gln Ala Arg Arg Leu Arg Ala Asp Leu Leu Ala His Pro Glu Leu His 2020 2025 2030 Pro Ala Asp Val Gly Tyr Thr Leu Ile Thr Thr Arg Thr Arg Phe Glu 2035 2040 2045 Gln Arg Ala Ala Val Val Gly Glu Asn Phe Thr Glu Leu Ile Ala Ala 2050 2055 2060 Leu Asp Asp Leu Val Glu Gly Arg Pro His Pro Leu Val Leu Arg Gly 2065 2070 2075 2080 Thr Ala Gly Thr Ser Asp Gln Val Val Phe Val Phe Pro Gly Gln Gly 2085 2090 2095 Ser Gln Trp Pro Glu Met Ala Asp Gly Leu Leu Ala Arg Ser Ser Gly 2100 2105 2110 Ser Gly Ser Phe Leu Glu Thr Ala Arg Ala Cys Asp Leu Ala Leu Arg 2115 2120 2125 Pro His Leu Gly Trp Ser Val Leu Asp Val Leu Arg Arg Glu Pro Gly 2130 2135 2140 Ala Pro Ser Leu Asp Arg Val Asp Val Val Gln Pro Val Leu Phe Thr 2145 2150 2155 2160 Met Met Val Ser Leu Ala Glu Thr Trp Arg Ser Leu Gly Val Glu Pro 2165 2170 2175 Ala Ala Val Val Gly His Ser Gln Gly Glu Ile Ala Ala Ala Tyr Val 2180 2185 2190 Ala Gly Ala Leu Thr Leu Asp Asp Ala Ala Arg Ile Val Ala Leu Arg 2195 2200 2205 Ser Gln Ala Trp Leu Arg Leu Ala Gly Lys Gly Gly Met Val Ala Val 2210 2215 2220 Thr Leu Ser Glu Arg Asp Leu Arg Pro Arg Leu Glu Pro Trp Ser Asp 2225 2230 2235 2240 Arg Leu Ala Val Ala Ala Val Asn Gly Pro Glu Thr Cys Ala Val Ser 2245 2250 2255 Gly Asp Pro Asp Ala Leu Ala Glu Leu Val Ala Glu Leu Gly Ala Glu 2260 2265 2270 Gly Val His Ala Arg Pro Ile Pro Gly Val Asp Thr Ala Gly His Ser 2275 2280 2285 Pro Gln Val Asp Thr Leu Glu Ala His Leu Arg Lys Val Leu Ala Pro 2290 2295 2300 Val Ala Pro Arg Thr Ser Asp Ile Pro Phe Tyr Ser Thr Val Thr Gly 2305 2310 2315 2320 Gly Leu Ile Asp Thr Ala Glu Leu Asp Ala Asp Tyr Trp Tyr Arg Asn 2325 2330 2335 Met Arg Glu Pro Val Glu Phe Glu Gln Ala Thr Arg Ala Leu Ile Ala 2340 2345 2350 Asp Gly His Asp Val Phe Leu Glu Ser Ser Pro His Pro Met Leu Ala 2355 2360 2365 Val Ser Leu Gln Glu Thr Ile Ser Asp Ala Gly Ser Pro Ala Ala Val 2370 2375 2380 Leu Gly Thr Leu Arg Arg Gly Gln Gly Gly Pro Arg Trp Leu Gly Val 2385 2390 2395 2400 Ala Leu Cys Arg Ala Tyr Thr His Gly Leu Glu Ile Asp Ala Glu Ala 2405 2410 2415 Ile Phe Gly Pro Asp Ser Arg Gln Val Glu Leu Pro Thr Tyr Pro Phe 2420 2425 2430 Gln Arg Glu Arg Tyr Trp Tyr Ser Pro Gly His Arg Gly Asp Asp Pro 2435 2440 2445 Ala Ser Leu Gly Leu Asp Ala Val Asp His Pro Leu Leu Gly Ser Gly 2450 2455 2460 Val Glu Leu Pro Glu Ser Gly Asp Arg Met Tyr Thr Ala Arg Leu Gly 2465 2470 2475 2480 Ala Asp Thr Thr Pro Trp Leu Ala Asp His Ala Leu Leu Gly Ser Pro 2485 2490 2495 Leu Leu Pro Gly Ala Ala Phe Ala Asp Leu Ala Leu Trp Ala Gly Arg 2500 2505 2510 Gln Ala Gly Thr Gly Arg Val Glu Glu Leu Thr Leu Ala Ala Pro Leu 2515 2520 2525 Val Leu Pro Gly Ser Gly Gly Val Arg Leu Arg Leu Asn Val Gly Ala 2530 2535 2540 Pro Gly Thr Asp Asp Ala Arg Arg Phe Ala Val His Ala Arg Ala Glu 2545 2550 2555 2560 Gly Ala Thr Asp Trp Thr Leu His Ala Glu Gly Leu Leu Thr Ala Gln 2565 2570 2575 Asp Thr Ala Asp Ala Pro Asp Ala Ser Ala Ala Thr Pro Pro Pro Gly 2580 2585 2590 Ala Glu Gln Leu Asp Ile Gly Asp Phe Tyr Gln Arg Phe Ser Glu Leu 2595 2600 2605 Gly Tyr Gly Tyr Gly Pro Phe Phe Arg Gly Leu Val Ser Ala His Arg 2610 2615 2620 Cys Gly Pro Asp Ile His Ala Glu Val Ala Leu Pro Val Gln Ala Gln 2625 2630 2635 2640 Gly Asp Ala Ala Arg Phe Gly Ile His Pro Ala Leu Leu Asp Ala Ala 2645 2650 2655 Leu Gln Thr Met Ser Leu Gly Gly Phe Phe Pro Glu Asp Gly Arg Val 2660 2665 2670 Arg Met Pro Phe Ala Leu Arg Gly Val Arg Leu Tyr Arg Ala Gly Ala 2675 2680 2685 Asp Arg Leu His Val Arg Val Ser Pro Val Ser Glu Asp Ala Val Arg 2690 2695 2700 Ile Arg Cys Ala Asp Gly Glu Gly Arg Pro Val Ala Glu Ile Glu Ser 2705 2710 2715 2720 Phe Ile Met Arg Pro Val Asp Pro Gly Gln Leu Leu Gly Gly Arg Pro 2725 2730 2735 Val Gly Ala Asp Ala Leu Phe Arg Ile Ala Trp Arg Glu Leu Ala Ala 2740 2745 2750 Gly Pro Gly Thr Arg Thr Gly Asp Gly Thr Pro Pro Pro Val Arg Trp 2755 2760 2765 Val Leu Ala Gly Pro Asp Ala Leu Gly Leu Ala Glu Ala Ala Asp Ala 2770 2775 2780 His Leu Pro Ala Val Pro Gly Pro Asp Gly Ala Leu Pro Ser Pro Thr 2785 2790 2795 2800 Gly Arg Pro Ala Pro Asp Ala Val Val Phe Ala Val Arg Ala Gly Thr 2805 2810 2815 Gly Asp Val Ala Ala Asp Ala His Thr Val Ala Cys Arg Val Leu Asp 2820 2825 2830 Leu Val Gln Arg Arg Leu Ala Ala Pro Glu Gly Pro Asp Gly Ala Arg 2835 2840 2845 Leu Val Val Ala Thr Arg Gly Ala Val Ala Val Arg Asp Asp Ala Glu 2850 2855 2860 Val Asp Asp Pro Ala Ala Ala Ala Ala Trp Gly Leu Leu Arg Ser Ala 2865 2870 2875 2880 Gln Ala Glu Glu Pro Gly Arg Phe Leu Leu Val Asp Leu Asp Asp Asp 2885 2890 2895 Pro Ala Ser Ala Arg Ala Leu Thr Asp Ala Leu Ala Ser Gly Glu Pro 2900 2905 2910 Gln Thr Ala Val Arg Ala Gly Thr Val Tyr Val Pro Arg Leu Glu Arg 2915 2920 2925 Ala Ala Asp Arg Thr Asp Gly Pro Leu Thr Pro Pro Asp Asp Gly Ala 2930 2935 2940 Trp Arg Leu Gly Arg Gly Thr Asp Leu Thr Leu Asp Gly Leu Ala Leu 2945 2950 2955 2960 Val Pro Ala Pro Asp Ala Glu Ala Pro Leu Glu Pro Gly Gln Val Arg 2965 2970 2975 Val Ala Val Arg Ala Ala Gly Val Asn Phe Arg Asp Ala Leu Ile Ala 2980 2985 2990 Leu Gly Met Tyr Pro Gly Glu Ala Glu Met Gly Thr Glu Gly Ala Gly 2995 3000 3005 Thr Val Val Glu Val Gly Pro Gly Val Thr Gly Val Ala Val Gly Asp 3010 3015 3020 Arg Val Leu Gly Leu Trp Asp Gly Gly Leu Gly Pro Leu Cys Val Ala 3025 3030 3035 3040 Asp His Arg Leu Leu Ala Pro Val Pro Asp Gly Trp Ser Tyr Ala Gln 3045 3050 3055 Ala Ala Ser Val Pro Ala Val Phe Leu Ser Ala Tyr Tyr Gly Leu Val 3060 3065 3070 Thr Leu Ala Gly Leu Arg Pro Gly Glu Arg Val Leu Val His Ala Ala 3075 3080 3085 Ala Gly Gly Val Gly Met Ala Ala Val Gln Ile Ala Arg His Leu Gly 3090 3095 3100 Ala Glu Val Leu Ala Thr Ala Ser Pro Gly Lys Trp Asp Ala Leu Arg 3105 3110 3115 3120 Ala Met Gly Ile Thr Asp Asp His Leu Ala Ser Ser Arg Thr Leu Asp 3125 3130 3135 Phe Ala Thr Ala Phe Thr Gly Ala Asp Gly Thr Ser Arg Ala Asp Val 3140 3145 3150 Val Leu Asn Ser Leu Thr Lys Glu Phe Val Asp Ala Ser Leu Gly Leu 3155 3160 3165 Leu Arg Pro Gly Gly Arg Phe Leu Glu Leu Gly Lys Thr Asp Val Arg 3170 3175 3180 Asp Pro Glu Arg Ile Ala Ala Glu His Pro Gly Val Arg Tyr Arg Ala 3185 3190 3195 3200 Phe Asp Leu Asn Glu Ala Gly Pro Asp Ala Leu Gly Arg Leu Leu Arg 3205 3210 3215 Glu Leu Met Asp Leu Phe Ala Ala Gly Val Leu His Pro Leu Pro Val 3220 3225 3230 Val Thr His Asp Val Arg Arg Ala Ala Asp Ala Leu Arg Thr Ile Ser 3235 3240 3245 Gln Ala Arg His Thr Gly Lys Leu Val Leu Thr Met Pro Pro Ala Trp 3250 3255 3260 His Pro Tyr Gly Thr Val Leu Val Thr Gly Gly Thr Gly Ala Leu Gly 3265 3270 3275 3280 Ser Arg Ile Ala Arg His Leu Ala Ser Arg His Gly Val Arg Arg Leu 3285 3290 3295 Leu Ile Ala Ala Arg Arg Gly Pro Asp Gly Glu Gly Ala Ala Glu Leu 3300 3305 3310 Val Ala Asp Leu Ala Ala Leu Gly Ala Ser Ala Thr Val Val Ala Cys 3315 3320 3325 Asp Val Ser Asp Ala Asp Ala Val Arg Gly Leu Leu Ala Gly Ile Pro 3330 3335 3340 Ala Asp His Pro Leu Thr Ala Val Val His Ser Thr Gly Val Leu Asp 3345 3350 3355 3360 Asp Gly Val Leu Pro Gly Leu Thr Pro Glu Arg Met Arg Arg Val Leu 3365 3370 3375 Arg Pro Lys Val Glu Ala Ala Val His Leu Asp Glu Leu Thr Arg Asp 3380 3385 3390 Leu Asp Leu Ser Ala Phe Val Leu Phe Ser Ser Ser Ala Gly Leu Leu 3395 3400 3405 Gly Ser Pro Ala Gln Gly Asn Tyr Ala Ala Ala Asn Ala Thr Leu Asp 3410 3415 3420 Ala Leu Ala Ala Arg Arg Arg Ser Leu Gly Leu Pro Ser Val Ser Leu 3425 3430 3435 3440 Ala Trp Gly Leu Trp Ser Asp Thr Ser Arg Met Ala His Ala Leu Asp 3445 3450 3455 Gln Glu Ser Leu Gln Arg Arg Phe Ala Arg Ser Gly Phe Pro Pro Leu 3460 3465 3470 Ser Ala Thr Leu Gly Ala Ala Leu Phe Asp Ala Ala Leu Arg Val Asp 3475 3480 3485 Glu Ala Val Gln Val Pro Met Arg Phe Asp Pro Ala Ala Leu Arg Ala 3490 3495 3500 Thr Gly Ser Val Pro Ala Leu Leu Ser Asp Leu Val Gly Ser Ala Pro 3505 3510 3515 3520 Ala Thr Gly Ser Ala Ala Pro Ala Ser Gly Pro Leu Pro Ala Pro Asp 3525 3530 3535 Ala Gly Thr Val Gly Glu Pro Leu Ala Glu Arg Leu Ala Gly Leu Ser 3540 3545 3550 Ala Glu Glu Arg His Asp Arg Leu Leu Gly Leu Val Gly Glu His Val 3555 3560 3565 Ala Ala Val Leu Gly His Gly Ser Ala Ala Glu Val Arg Pro Asp Arg 3570 3575 3580 Pro Phe Arg Glu Val Gly Phe Asp Ser Leu Thr Ala Val Glu Leu Arg 3585 3590 3595 3600 Asn Arg Met Ala Ala Val Thr Gly Val Arg Leu Pro Ala Thr Leu Val 3605 3610 3615 Phe Asp His Pro Thr Pro Ala Ala Leu Ser Ser His Leu Asp Gly Leu 3620 3625 3630 Leu Ala Pro Ala Gln Pro Val Thr Thr Thr Pro Leu Leu Ser Glu Leu 3635 3640 3645 Asp Arg Ile Glu Glu Ala Leu Ala Ala Leu Thr Pro Glu His Leu Ala 3650 3655 3660 Glu Leu Ala Pro Ala Pro Asp Asp Arg Ala Glu Val Ala Leu Arg Leu 3665 3670 3675 3680 Asp Ala Leu Ala Asp Arg Trp Arg Ala Leu His Asp Gly Ala Pro Gly 3685 3690 3695 Ala Asp Asp Asp Ile Thr Asp Val Leu Ser Ser Ala Asp Asp Asp Glu 3700 3705 3710 Ile Phe Ala Phe Ile Asp Glu Arg Tyr Gly Thr Ser 3715 3720
【0040】配列番号:5 配列の長さ:1580 配列の型:アミノ酸 トポロジー:不明 配列の種類:ペプチド 配列 Met Ala Asn Glu Glu Lys Leu Arg Ala Tyr Leu Lys Arg Val Thr Gly 1 5 10 15 Glu Leu His Arg Ala Thr Glu Gln Leu Arg Ala Leu Asp Arg Arg Ala 20 25 30 His Glu Pro Ile Ala Ile Val Gly Ala Ala Cys Arg Leu Pro Gly Gly 35 40 45 Val Glu Ser Pro Asp Asp Leu Trp Glu Leu Leu His Ala Gly Ala Asp 50 55 60 Ala Val Gly Pro Ala Pro Ala Asp Arg Gly Trp Asp Val Glu Gly Arg 65 70 75 80 Tyr Ser Pro Asp Pro Asp Thr Pro Gly Thr Ser Tyr Cys Arg Glu Gly 85 90 95 Gly Phe Val Gln Gly Ala Asp Arg Phe Asp Pro Ala Leu Phe Gly Ile 100 105 110 Ser Pro Asn Glu Ala Leu Thr Met Asp Pro Gln Gln Arg Leu Leu Leu 115 120 125 Glu Thr Ser Trp Glu Ala Leu Glu Arg Ala Gly Leu Asp Pro Gln Ser 130 135 140 Leu Ala Gly Ser Arg Thr Gly Val Phe Ala Gly Ala Trp Glu Ser Gly 145 150 155 160 Tyr Gln Lys Gly Val Glu Gly Leu Glu Ala Asp Leu Glu Ala Gln Leu 165 170 175 Leu Ala Gly Ile Val Ser Phe Thr Ala Gly Arg Val Ala Tyr Ala Leu 180 185 190 Gly Leu Glu Gly Pro Ala Leu Thr Ile Asp Thr Ala Cys Ser Ser Ser 195 200 205 Leu Val Ala Leu His Leu Ala Val Gln Ser Leu Arg Arg Gly Glu Cys 210 215 220 Asp Leu Ala Leu Ala Gly Gly Ala Thr Val Ile Ala Asp Phe Ala Leu 225 230 235 240 Phe Thr Gln Phe Ser Arg Gln Arg Gly Leu Ala Pro Asp Gly Arg Cys 245 250 255 Lys Ala Phe Gly Glu Thr Ala Asp Gly Phe Gly Pro Ala Glu Gly Ala 260 265 270 Gly Met Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg Asn Gly His 275 280 285 Pro Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp Gly Ala 290 295 300 Ser Asn Gly Leu Thr Ala Pro Ser Gly Pro Ala Gln Gln Arg Val Ile 305 310 315 320 Arg Glu Ala Leu Ala Asp Ala Gly Leu Thr Pro Ala Asp Val Asp Ala 325 330 335 Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile Glu Ala 340 345 350 Gly Ala Leu Met Ala Thr Tyr Gly His Glu Arg Thr Gly Asp Pro Leu 355 360 365 Trp Leu Gly Ser Leu Lys Ser Asn Ile Gly His Thr Gln Ala Ala Ala 370 375 380 Gly Val Ala Gly Val Ile Lys Met Val Leu Ala Leu Arg His Gly Glu 385 390 395 400 Leu Pro Arg Thr Leu His Ala Ser Thr Ala Ser Ser Arg Ile Glu Trp 405 410 415 Asp Ala Gly Ala Val Glu Leu Leu Asp Glu Ala Arg Pro Trp Pro Arg 420 425 430 Arg Ala Glu Gly Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Ile Ser 435 440 445 Gly Thr Asn Ala His Leu Val Ile Glu Glu Glu Pro Pro Ala Arg Pro 450 455 460 Glu Pro Glu Glu Ala Ala Gln Pro Pro Ala Pro Ala Thr Thr Val Leu 465 470 475 480 Pro Leu Ser Ala Ala Gly Ala Arg Ser Leu Arg Glu Gln Ala Arg Arg 485 490 495 Leu Ala Ala His Leu Ala Gly His Glu Glu Ile Thr Ala Ala Asp Ala 500 505 510 Ala Arg Ser Ala Ala Thr Thr Arg Ala Ala Leu Ser His Arg Ala Ser 515 520 525 Val Leu Ala Asp Asp Arg Arg Ala Leu Ile Asp Arg Leu Thr Ala Leu 530 535 540 Ala Glu Asp Arg Lys Asp Pro Gly Val Thr Val Gly Glu Ala Gly Ser 545 550 555 560 Gly Arg Pro Pro Val Phe Val Phe Pro Gly Gln Gly Ser Gln Trp Thr 565 570 575 Gly Met Gly Ala Glu Leu Leu Asp Arg Ala Pro Val Phe Arg Ala Lys 580 585 590 Ala Glu Glu Cys Ala Arg Ala Leu Ala Ala His Leu Asp Trp Ser Val 595 600 605 Leu Asp Val Leu Arg Asp Ala Pro Gly Ala Pro Pro Ile Asp Arg Ala 610 615 620 Asp Val Val Gln Pro Thr Leu Phe Thr Met Met Val Ser Leu Ala Ala 625 630 635 640 Leu Trp Glu Ser His Gly Val Arg Pro Ala Ala Val Val Gly His Ser 645 650 655 Gln Gly Glu Ile Ala Ala Ala His Ala Ala Gly Ala Leu Ser Leu Asp 660 665 670 Asp Ala Ala Arg Val Ile Ala Glu Arg Ser Arg Leu Trp Lys Arg Leu 675 680 685 Ala Gly Asn Gly Gly Met Leu Ser Val Met Ala Pro Ala Asp Arg Val 690 695 700 Arg Glu Leu Met Glu Pro Trp Ala Glu Arg Met Ser Val Ala Ala Val 705 710 715 720 Asn Gly Pro Ala Ser Val Thr Val Ala Gly Asp Ala Arg Ala Leu Glu 725 730 735 Glu Phe Gly Gly Arg Leu Ser Ala Ala Gly Val Leu Arg Trp Pro Leu 740 745 750 Ala Gly Val Asp Phe Ala Gly His Ser Pro Gln Val Glu Gln Phe Arg 755 760 765 Ala Glu Leu Leu Asp Thr Leu Gly Thr Val Arg Pro Thr Ala Ala Arg 770 775 780 Leu Pro Phe Phe Ser Thr Val Thr Ala Ala Ala His Glu Pro Glu Gly 785 790 795 800 Leu Asp Ala Ala Tyr Trp Tyr Arg Asn Met Arg Glu Pro Val Glu Phe 805 810 815 Ala Ser Thr Leu Arg Thr Leu Leu Arg Glu Gly His Arg Thr Phe Val 820 825 830 Glu Met Gly Pro His Pro Leu Leu Gly Ala Ala Ile Asp Glu Val Ala 835 840 845 Glu Ala Glu Gly Val His Ala Thr Ala Leu Ala Thr Leu His Arg Gly 850 855 860 Ser Gly Gly Leu Asp Arg Phe Arg Ser Ser Val Gly Ala Ala Phe Ala 865 870 875 880 His Gly Val Arg Val Asp Trp Asp Ala Leu Phe Glu Gly Ser Gly Ala 885 890 895 Arg Arg Val Pro Leu Pro Thr Tyr Ala Phe Ser Arg Asp Arg Tyr Trp 900 905 910 Leu Pro Thr Ala Ile Gly Arg Arg Ala Val Glu Ala Ala Pro Val Asp 915 920 925 Ala Ser Ala Pro Gly Arg Tyr Arg Val Thr Trp Thr Pro Val Ala Ser 930 935 940 Asp Asp Ser Gly Arg Pro Ser Gly Arg Trp Leu Leu Val Gln Thr Pro 945 950 955 960 Gly Thr Ala Pro Asp Glu Ala Asp Thr Ala Ala Ser Ala Leu Gly Ala 965 970 975 Ala Gly Val Val Val Glu Arg Cys Leu Leu Asp Pro Thr Glu Ala Ala 980 985 990 Arg Val Thr Leu Thr Glu Arg Leu Ala Glu Leu Asp Ala Gln Pro Glu 995 1000 1005 Gly Leu Ala Gly Val Leu Val Leu Pro Gly Arg Pro Gln Ser Thr Ala 1010 1015 1020 Pro Ala Asp Ala Ser Pro Leu Asp Pro Gly Thr Ala Ala Val Leu Leu 1025 1030 1035 1040 Val Val Gln Ala Val Pro Asp Ala Ala Pro Lys Ala Arg Ile Trp Val 1045 1050 1055 Val Thr Arg Gly Ala Val Ala Val Gly Ser Gly Glu Val Pro Cys Ala 1060 1065 1070 Val Gly Ala Arg Val Trp Gly Leu Gly Arg Val Ala Ala Leu Glu Val 1075 1080 1085 Pro Val Gln Trp Gly Gly Leu Val Asp Val Ala Val Gly Ala Gly Val 1090 1095 1100 Arg Glu Trp Arg Arg Val Val Gly Val Val Ala Gly Gly Gly Glu Asp 1105 1110 1115 1120 Gln Val Ala Val Arg Gly Gly Gly Val Phe Gly Arg Arg Leu Val Gly 1125 1130 1135 Val Gly Val Arg Gly Gly Ser Gly Val Trp Arg Ala Arg Gly Cys Val 1140 1145 1150 Val Val Thr Gly Gly Leu Gly Gly Val Gly Gly His Val Ala Arg Trp 1155 1160 1165 Leu Ala Arg Ser Gly Ala Glu His Val Val Leu Ala Gly Arg Arg Gly 1170 1175 1180 Gly Gly Val Val Gly Ala Val Glu Leu Glu Arg Glu Leu Val Gly Leu 1185 1190 1195 1200 Gly Ala Lys Val Thr Phe Val Ser Cys Asp Val Gly Asp Arg Ala Ser 1205 1210 1215 Met Val Gly Leu Leu Gly Val Val Glu Gly Leu Gly Val Pro Leu Arg 1220 1225 1230 Gly Val Phe His Ala Ala Gly Val Ala Gln Val Ser Gly Leu Gly Glu 1235 1240 1245 Val Ser Leu Ala Glu Ala Gly Gly Val Leu Gly Gly Lys Ala Val Gly 1250 1255 1260 Ala Glu Leu Leu Asp Glu Leu Thr Ala Gly Val Glu Leu Asp Ala Phe 1265 1270 1275 1280 Val Leu Phe Ser Ser Gly Ala Gly Val Trp Gly Ser Gly Gly Gln Ser 1285 1290 1295 Val Tyr Ala Ala Ala Asn Ala His Leu Asp Ala Leu Ala Glu Arg Arg 1300 1305 1310 Arg Ala Gln Gly Arg Pro Ala Thr Ser Val Ala Trp Gly Leu Trp Gly 1315 1320 1325 Gly Glu Gly Met Gly Ala Asp Glu Gly Val Thr Glu Phe Tyr Ala Glu 1330 1335 1340 Arg Gly Leu Ala Pro Met Arg Pro Glu Ser Gly Ile Glu Ala Leu His 1345 1350 1355 1360 Thr Ala Leu Asn Glu Gly Asp Thr Cys Val Thr Val Ala Asp Ile Asp 1365 1370 1375 Trp Glu His Phe Val Thr Gly Phe Thr Ala Tyr Arg Pro Ser Pro Leu 1380 1385 1390 Ile Ser Asp Ile Pro Gln Val Arg Ala Leu Arg Thr Pro Glu Pro Thr 1395 1400 1405 Val Asp Ala Ser Asp Gly Leu Arg Arg Arg Val Asp Ala Ala Leu Thr 1410 1415 1420 Pro Arg Glu Arg Thr Lys Val Leu Val Asp Leu Val Arg Thr Val Ala 1425 1430 1435 1440 Ala Glu Val Leu Gly His Asp Gly Ile Gly Gly Ile Gly His Asp Val 1445 1450 1455 Ala Phe Arg Asp Leu Gly Phe Asp Ser Leu Ala Ala Val Arg Met Arg 1460 1465 1470 Gly Arg Leu Ala Glu Ala Thr Gly Leu Val Leu Pro Ala Thr Val Ile 1475 1480 1485 Phe Asp His Pro Thr Val Asp Arg Leu Gly Gly Ala Leu Leu Glu Arg 1490 1495 1500 Leu Ser Ala Asp Glu Pro Ala Pro Gly Gly Ala Pro Glu Pro Ala Gly 1505 1510 1515 1520 Gly Arg Pro Ala Thr Pro Pro Pro Ala Pro Glu Pro Ala Val His Asp 1525 1530 1535 Ala Asp Ile Asp Glu Leu Asp Ala Asp Ala Leu Ile Arg Leu Ala Thr 1540 1545 1550 Gly Thr Ala Gly Pro Ala Asp Gly Thr Pro Ala Asp Gly Gly Pro Asp 1555 1560 1565 Ala Ala Ala Thr Ala Pro Asp Gly Ala Pro Glu Gln 1570 1575 1580
【0041】配列番号:6 配列の長さ:1891 配列の型:アミノ酸 トポロジー:不明 配列の種類:ペプチド 配列 Met Ser Pro Ser Met Asp Glu Val Leu Gly Ala Leu Arg Thr Ser Val 1 5 10 15 Lys Glu Thr Glu Arg Leu Arg Arg His Asn Arg Glu Leu Leu Ala Gly 20 25 30 Ala His Glu Pro Val Ala Ile Val Gly Met Ala Cys Arg Tyr Pro Gly 35 40 45 Gly Val Ser Thr Pro Asp Asp Leu Trp Glu Leu Ala Ala Asp Gly Val 50 55 60 Asp Ala Ile Thr Pro Phe Pro Ala Asp Arg Gly Trp Asp Glu Asp Ala 65 70 75 80 Val Tyr Ser Pro Asp Pro Asp Thr Pro Gly Thr Thr Tyr Cys Arg Glu 85 90 95 Gly Gly Phe Leu Thr Gly Ala Gly Asp Phe Asp Ala Ala Phe Phe Gly 100 105 110 Ile Ser Pro Asn Glu Ala Leu Val Met Asp Pro Gln Gln Arg Leu Leu 115 120 125 Leu Glu Thr Ser Trp Glu Thr Leu Glu Arg Ala Gly Ile Val Pro Ala 130 135 140 Ser Leu Arg Gly Ser Arg Thr Gly Val Phe Val Gly Ala Ala His Thr 145 150 155 160 Gly Tyr Val Thr Asp Thr Ala Arg Ala Pro Glu Gly Thr Glu Gly Tyr 165 170 175 Leu Leu Thr Gly Asn Ala Asp Ala Val Met Ser Gly Arg Ile Ala Tyr 180 185 190 Ser Leu Gly Leu Glu Gly Pro Ala Leu Thr Ile Gly Thr Ala Cys Ser 195 200 205 Ser Ser Leu Val Ala Leu His Leu Ala Val Gln Ser Leu Arg Arg Gly 210 215 220 Glu Cys Asp Leu Ala Leu Ala Gly Gly Val Ala Val Met Pro Asp Pro 225 230 235 240 Thr Val Phe Val Glu Phe Ser Arg Gln Arg Gly Leu Ala Val Asp Gly 245 250 255 Arg Cys Lys Ala Phe Ala Glu Gly Ala Asp Gly Thr Ala Trp Ala Glu 260 265 270 Gly Val Gly Val Leu Leu Val Glu Arg Leu Ser Asp Ala Arg Arg Asn 275 280 285 Gly His Arg Val Leu Ala Val Val Arg Gly Ser Ala Val Asn Gln Asp 290 295 300 Gly Ala Ser Asn Gly Leu Thr Ala Pro Ser Gly Pro Ala Gln Gln Arg 305 310 315 320 Val Ile Arg Glu Ala Leu Ala Asp Ala Gly Leu Thr Pro Ala Asp Val 325 330 335 Asp Val Val Glu Ala His Gly Thr Gly Thr Ala Leu Gly Asp Pro Ile 340 345 350 Glu Ala Gly Ala Leu Leu Ala Thr Tyr Gly Arg Glu Arg Val Gly Asp 355 360 365 Pro Leu Trp Leu Gly Ser Leu Lys Ser Asn Ile Gly His Ala Gln Ala 370 375 380 Ala Ala Gly Val Gly Gly Val Ile Lys Val Val Gln Ala Met Arg His 385 390 395 400 Gly Ser Leu Pro Arg Thr Leu His Val Asp Ala Pro Ser Ser Lys Val 405 410 415 Glu Trp Ala Ser Gly Ala Val Glu Leu Leu Thr Glu Gly Arg Ser Trp 420 425 430 Pro Arg Arg Val Glu Arg Val Arg Arg Ala Ala Val Ser Ala Phe Gly 435 440 445 Val Ser Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro Val Glu 450 455 460 Ala Gly Ser Glu His Gly Asp Gly Pro Gly Pro Asp Arg Pro Asp Ala 465 470 475 480 Val Thr Gly Pro Leu Pro Trp Val Leu Ser Ala Arg Ser Arg Glu Ala 485 490 495 Leu Arg Gly Gln Ala Gly Arg Leu Ala Ala Leu Ala Arg Gln Gly Arg 500 505 510 Thr Glu Gly Thr Gly Gly Gly Ser Gly Leu Val Val Pro Ala Ala Asp 515 520 525 Ile Gly Tyr Ser Leu Ala Thr Thr Arg Glu Thr Leu Glu His Arg Ala 530 535 540 Val Ala Leu Val Gln Glu Asn Arg Thr Ala Gly Glu Asp Leu Ala Ala 545 550 555 560 Leu Ala Ala Gly Arg Thr Pro Glu Ser Val Val Thr Gly Val Ala Arg 565 570 575 Arg Gly Arg Gly Ile Ala Phe Leu Cys Ser Gly Gln Gly Ala Gln Arg 580 585 590 Leu Gly Ala Gly Arg Glu Leu Arg Gly Arg Phe Pro Val Phe Ala Asp 595 600 605 Ala Leu Asp Glu Ile Ala Ala Glu Phe Asp Ala His Leu Glu Arg Pro 610 615 620 Leu Leu Ser Val Met Phe Ala Glu Pro Ala Thr Pro Asp Ala Ala Leu 625 630 635 640 Leu Asp Arg Thr Asp Tyr Thr Gln Pro Ala Leu Phe Ala Val Glu Thr 645 650 655 Ala Leu Phe Arg Leu Leu Glu Ser Trp Gly Leu Val Pro Asp Val Leu 660 665 670 Val Gly His Ser Ile Gly Gly Leu Val Ala Ala His Val Ala Gly Val 675 680 685 Phe Ser Ala Ala Asp Ala Ala Arg Leu Val Ser Ala Arg Gly Arg Leu 690 695 700 Met Arg Ala Leu Pro Glu Gly Gly Ala Met Ala Ala Val Gln Ala Thr 705 710 715 720 Glu Arg Glu Ala Ala Ala Leu Glu Pro Val Ala Ala Gly Gly Ala Val 725 730 735 Val Ala Ala Val Asn Gly Pro Gln Ala Leu Val Leu Ser Gly Asp Glu 740 745 750 Ala Ala Val Leu Ala Ala Ala Gly Glu Leu Ala Ala Arg Gly Arg Arg 755 760 765 Thr Lys Arg Leu Arg Val Ser His Ala Phe His Ser Pro Arg Met Asp 770 775 780 Ala Met Leu Ala Asp Phe Arg Ala Val Ala Asp Thr Val Asp Tyr His 785 790 795 800 Ala Pro Arg Leu Pro Val Val Ser Glu Val Thr Gly Asp Leu Ala Asp 805 810 815 Ala Ala Gln Leu Thr Asp Pro Gly Tyr Trp Thr Arg Gln Val Arg Gln 820 825 830 Pro Val Arg Phe Ala Asp Ala Val Arg Thr Ala Ser Ala Arg Asp Ala 835 840 845 Ala Thr Phe Ile Glu Leu Gly Pro Asp Ala Val Leu Cys Gly Met Ala 850 855 860 Glu Glu Ser Leu Ala Ala Glu Ala Asp Val Val Phe Ala Pro Ala Leu 865 870 875 880 Arg Arg Gly Arg Pro Glu Gly Asp Thr Val Leu Arg Ala Ala Ala Ser 885 890 895 Ala Tyr Val Arg Gly Ala Gly Leu Asp Trp Ala Ala Leu Tyr Gly Gly 900 905 910 Thr Gly Ala Arg Arg Thr Asp Leu Pro Thr Tyr Ala Phe Gln His Ser 915 920 925 Arg Tyr Trp Leu Ala Pro Ala Ser Ala Ala Val Ala Pro Ala Thr Ala 930 935 940 Ala Pro Ser Val Arg Ser Val Pro Glu Ala Glu Gln Asp Gly Ala Leu 945 950 955 960 Trp Ala Ala Val His Ala Gly Asp Val Ala Ser Ala Ala Ala Arg Leu 965 970 975 Gly Ala Asp Asp Ala Gly Ile Glu His Glu Leu Arg Ala Val Leu Pro 980 985 990 His Leu Ala Ala Trp His Asp Arg Asp Arg Ala Thr Ala Arg Thr Ala 995 1000 1005 Gly Leu His Tyr Arg Val Thr Trp Gln Ala Ile Glu Ala Asp Ala Val 1010 1015 1020 Arg Phe Ser Pro Ser Asp Arg Trp Leu Met Val Glu His Gly Gln His 1025 1030 1035 1040 Thr Glu Cys Ala Asp Ala Ala Glu Arg Ala Leu Arg Ala Ala Gly Ala 1045 1050 1055 Glu Val Thr Arg Leu Val Trp Pro Leu Glu Gln His Thr Gly Ser Pro 1060 1065 1070 Arg Thr Glu Thr Pro Asp Arg Gly Thr Leu Ala Ala Arg Leu Ala Glu 1075 1080 1085 Leu Ala Arg Ser Pro Glu Gly Leu Ala Gly Val Leu Leu Leu Pro Asp 1090 1095 1100 Ser Gly Gly Ala Ala Val Ala Gly His Pro Gly Leu Asp Gln Gly Thr 1105 1110 1115 1120 Ala Ala Val Leu Leu Thr Ile Gln Ala Leu Thr Asp Ala Ala Val Arg 1125 1130 1135 Ala Pro Leu Trp Val Val Thr Arg Gly Ala Val Ala Val Gly Ser Gly 1140 1145 1150 Glu Val Pro Cys Ala Val Gly Ala Arg Val Trp Gly Leu Gly Arg Val 1155 1160 1165 Ala Ala Leu Glu Val Pro Val Gln Trp Gly Gly Leu Val Asp Val Ala 1170 1175 1180 Val Gly Ala Gly Val Arg Glu Trp Arg Arg Val Val Gly Val Val Ala 1185 1190 1195 1200 Gly Gly Gly Glu Asp Gln Val Ala Val Arg Gly Gly Gly Val Phe Gly 1205 1210 1215 Arg Arg Leu Val Gly Val Gly Val Arg Gly Gly Ser Gly Val Trp Arg 1220 1225 1230 Ala Arg Gly Cys Val Val Val Thr Gly Gly Leu Gly Gly Val Gly Gly 1235 1240 1245 His Val Ala Arg Trp Leu Ala Arg Ser Gly Ala Glu His Val Val Leu 1250 1255 1260 Ala Gly Arg Arg Gly Gly Gly Val Val Gly Ala Val Glu Leu Glu Arg 1265 1270 1275 1280 Glu Leu Val Gly Leu Gly Ala Lys Val Thr Phe Val Ser Cys Asp Val 1285 1290 1295 Gly Asp Arg Ala Ser Val Val Gly Leu Leu Gly Val Val Glu Gly Leu 1300 1305 1310 Gly Val Pro Leu Arg Gly Val Phe His Ala Ala Gly Val Ala Gln Val 1315 1320 1325 Ser Gly Leu Gly Glu Val Ser Leu Ala Glu Ala Gly Gly Val Leu Gly 1330 1335 1340 Gly Lys Ala Val Gly Ala Glu Leu Leu Asp Glu Leu Thr Ala Gly Val 1345 1350 1355 1360 Glu Leu Asp Ala Phe Val Leu Phe Ser Ser Gly Ala Gly Val Trp Gly 1365 1370 1375 Ser Gly Gly Gln Ser Val Tyr Ala Ala Ala Asn Ala His Leu Asp Ala 1380 1385 1390 Leu Ala Glu Arg Arg Arg Ala Gln Gly Arg Pro Ala Thr Ser Val Ala 1395 1400 1405 Trp Gly Pro Trp Asp Gly Asp Gly Met Gly Glu Met Ala Pro Glu Gly 1410 1415 1420 Tyr Phe Ala Arg His Gly Val Ala Pro Leu His Pro Glu Thr Ala Leu 1425 1430 1435 1440 Thr Ala Leu His Gln Ala Ile Asp Gly Gly Glu Ala Thr Val Thr Val 1445 1450 1455 Ala Asp Ile Asp Trp Glu Arg Phe Ala Pro Gly Phe Thr Ala Phe Arg 1460 1465 1470 Pro Ser Pro Leu Ile Ala Gly Ile Pro Ala Ala Arg Thr Ala Pro Ala 1475 1480 1485 Ala Gly Arg Pro Ala Glu Asp Thr Pro Thr Ala Pro Gly Leu Leu Arg 1490 1495 1500 Ala Arg Pro Glu Asp Arg Pro Arg Leu Ala Leu Asp Leu Val Leu Arg 1505 1510 1515 1520 His Val Ala Ala Val Leu Gly His Ser Glu Asp Ala Arg Val Asp Ala 1525 1530 1535 Arg Ala Pro Phe Arg Asp Leu Gly Phe Asp Ser Leu Ala Ala Val Arg 1540 1545 1550 Leu Arg Arg Arg Leu Ala Glu Asp Thr Gly Leu Asp Leu Pro Gly Thr 1555 1560 1565 Leu Val Phe Asp His Glu Asp Pro Thr Ala Leu Ala His His Leu Ala 1570 1575 1580 Gly Leu Ala Asp Ala Gly Thr Pro Gly Pro Gln Glu Gly Thr Ala Arg 1585 1590 1595 1600 Ala Glu Ser Gly Leu Phe Ala Ser Phe Arg Ala Ala Val Glu Gln Arg 1605 1610 1615 Arg Ser Ser Glu Val Val Glu Leu Met Ala Asp Leu Ala Ala Phe Arg 1620 1625 1630 Pro Ala Tyr Ser Arg Gln His Pro Gly Ser Gly Arg Pro Ala Pro Val 1635 1640 1645 Pro Leu Ala Thr Gly Pro Ala Thr Arg Pro Thr Leu Tyr Cys Cys Ala 1650 1655 1660 Gly Thr Ala Val Gly Ser Gly Pro Ala Glu Tyr Val Pro Phe Ala Glu 1665 1670 1675 1680 Gly Leu Arg Gly Val Arg Glu Thr Val Ala Leu Pro Leu Ser Gly Phe 1685 1690 1695 Gly Asp Pro Ala Glu Pro Met Pro Ala Ser Leu Asp Ala Leu Ile Glu 1700 1705 1710 Val Gln Ala Asp Val Leu Leu Glu His Thr Ala Gly Lys Pro Phe Ala 1715 1720 1725 Leu Ala Gly His Ser Ala Gly Ala Asn Ile Ala His Ala Leu Ala Ala 1730 1735 1740 Arg Leu Glu Glu Arg Gly Ser Gly Pro Ala Ala Val Val Leu Met Asp 1745 1750 1755 1760 Val Tyr Arg Pro Glu Asp Pro Gly Ala Met Gly Glu Trp Arg Asp Asp 1765 1770 1775 Leu Leu Ser Trp Ala Leu Glu Arg Ser Thr Val Pro Leu Glu Asp His 1780 1785 1790 Arg Leu Thr Ala Met Ala Gly Tyr Gln Arg Leu Val Leu Gly Thr Arg 1795 1800 1805 Leu Thr Ala Leu Glu Ala Pro Val Leu Leu Ala Arg Ala Ser Glu Pro 1810 1815 1820 Leu Cys Ala Trp Pro Pro Ala Gly Gly Ala Arg Gly Asp Trp Arg Ser 1825 1830 1835 1840 Gln Val Pro Phe Ala Arg Thr Val Ala Asp Val Pro Gly Asn His Phe 1845 1850 1855 Thr Met Leu Thr Glu His Ala Arg His Thr Ala Ser Leu Val His Glu 1860 1865 1870 Trp Leu Asp Ser Leu Pro His Gln Pro Gly Pro Ala Pro Leu Thr Gly 1875 1880 1885 Gly Lys His 1890
【図面の簡単な説明】
【図1】 S.ambofaciens DNAのsrmG領域のマップ
を示す。
【図2】 プラテノリド合成に関する生合成経路を説明
する。
【図3】 srmG DNAの全領域に及ぶ2つのクローン
のマップを示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スチュアート・アラン・クストス アメリカ合衆国46256インディアナ州イン ディアナポリス、ナラガンセット・コート 8206番 (72)発明者 ラマチャンドラ・ナガラジャ・ラオ アメリカ合衆国46260インディアナ州イン ディアナポリス、ミスティ・レイク・サー クル9110番 (72)発明者 マーク・アラン・リチャードソン アメリカ合衆国47408インディアナ州ブル ーミングトン、ノース・テムズ・ドライブ 7811番 (72)発明者 ポール・ロバート・ロステック・ジュニア アメリカ合衆国46237インディアナ州イン ディアナポリス、サフラン・ドライブ4247 番

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 プラテノリドシンターゼドメインよりな
    るポリペプチドをコードするヌクレオチド配列よりな
    る、単離されたDNA分子。
  2. 【請求項2】 ヌクレオチド配列が、 全て配列番号1におけるヌクレオチド 392〜160
    3、1922〜2995、3173〜3424、352
    7〜4798、5135〜6208、7043〜759
    7、7946〜8197、8270〜9541、989
    9〜10909、10985〜11530、12596
    〜13153、13469〜13720、14148〜
    15422、15789〜16844、16914〜1
    7510、18612〜19166、19479〜19
    730、20215〜21486、21889〜228
    72、23638〜24159、24484〜2467
    8、24742〜26016、26371〜2738
    1、27442〜27966、28843〜2989
    2、29905〜30462、30760〜3100
    2、31428〜32696、33024〜3402
    2、34770〜35327、35586〜3583
    7、36257〜37528、37898〜3890
    5、39851〜40408、40658〜4090
    9、および41297〜41395よりなる群から選択
    される、請求項1に記載の単離されたDNA分子。
  3. 【請求項3】 アミノ酸配列よりなるポリペプチドであ
    って、プラテノリドシンターゼドメインよりなるポリペ
    プチド。
  4. 【請求項4】 アミノ酸配列が、 (a)全て配列番号2におけるアミノ酸 15〜41
    8、525〜882、942〜1025、1060〜1
    483、1596〜1953、2232〜2416、2
    533〜2616、2641〜3064、3184〜3
    520、3546〜3727、4083〜4268、お
    よび4374〜4457; (b)全て配列番号3におけるアミノ酸 35〜45
    9、582〜933、957〜1155、1523〜1
    707、および1812〜1895; (c)全て配列番号4におけるアミノ酸 36〜45
    9、594〜921、1177〜1350、1459〜
    1523、1545〜1969、2088〜2424、
    2445〜2619、2912〜3261、3266〜
    3451、および3551〜3631; (d)全て配列番号5におけるアミノ酸 34〜45
    6、566〜898、1148〜1333、および14
    20〜1503;並びに (e)全て配列番号6におけるアミノ酸 35〜45
    8、582〜917、1233〜1418、1502〜
    1585、および1715〜1747よりなる群から選
    択される、請求項3に記載のポリペプチド。
  5. 【請求項5】 配列番号2、3、4、5、および6より
    なる群から選択されるアミノ酸配列を有するポリペプチ
    ドの均質な製造。
  6. 【請求項6】 配列番号1のヌクレオチド配列よりなる
    単離されたDNA分子。
  7. 【請求項7】 請求項1に記載のDNA分子を含んでな
    る組換えDNAベクター。
  8. 【請求項8】 請求項7に記載の組換えDNAベクター
    でトランスフォームされた宿主細胞。
  9. 【請求項9】 寄託番号 NRRL B−21500の下
    に寄託された組換えDNAベクター。
  10. 【請求項10】 寄託番号 NRRL B−21499の
    下に寄託された組換えDNAベクター。
JP9034678A 1996-02-22 1997-02-19 プラテノリドシンターゼ遺伝子 Pending JPH09224686A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US1205096P 1996-02-22 1996-02-22
US60/012050 1996-02-22

Publications (1)

Publication Number Publication Date
JPH09224686A true JPH09224686A (ja) 1997-09-02

Family

ID=21753136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9034678A Pending JPH09224686A (ja) 1996-02-22 1997-02-19 プラテノリドシンターゼ遺伝子

Country Status (4)

Country Link
US (1) US5945320A (ja)
EP (1) EP0791656A3 (ja)
JP (1) JPH09224686A (ja)
CA (1) CA2197160C (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6060234A (en) * 1991-01-17 2000-05-09 Abbott Laboratories Polyketide derivatives and recombinant methods for making same
US20030170725A1 (en) * 1993-09-20 2003-09-11 Chaitan Khosla Combinatorial polyketide libraries produced using a modular PKS gene cluster as scaffold
US6066721A (en) * 1995-07-06 2000-05-23 Stanford University Method to produce novel polyketides
US6558942B1 (en) 1994-05-06 2003-05-06 The Leland Stanford Junior University Combinatorial polyketide libraries produced using a modular PKS gene cluster as scaffold
US6927057B2 (en) 1993-09-20 2005-08-09 Kosan Biosciences Macrolide analogs
US5712146A (en) * 1993-09-20 1998-01-27 The Leland Stanford Junior University Recombinant combinatorial genetic library for the production of novel polyketides
US6500960B1 (en) 1995-07-06 2002-12-31 Stanford University (Board Of Trustees Of The Leland Stanford Junior University) Method to produce novel polyketides
US6495348B1 (en) 1993-10-07 2002-12-17 Regents Of The University Of Minnesota Mitomycin biosynthetic gene cluster
ATE286133T1 (de) 1995-07-06 2005-01-15 Univ Leland Stanford Junior Zellfreie synthese von polyketiden
US6600029B1 (en) 1995-12-19 2003-07-29 Regents Of The University Of Minnesota Metabolic engineering of polyhydroxyalkanoate monomer synthases
US6503741B1 (en) 1998-05-28 2003-01-07 Kosan Biosciences, Inc. Polyketide synthase genes from Streptomyces venezuelae
US6117659A (en) * 1997-04-30 2000-09-12 Kosan Biosciences, Inc. Recombinant narbonolide polyketide synthase
US20040209322A1 (en) * 1997-04-30 2004-10-21 Chaitan Khosla Combinatorial polyketide libraries produced using a modular PKS gene cluster as scaffold
US6902913B2 (en) * 1997-04-30 2005-06-07 Kosan Biosciences, Inc. Recombinant narbonolide polyketide synthase
US20080003648A1 (en) * 1997-04-30 2008-01-03 Chaitan Khosla Method to prepare macrolide analogs
EP1027435A2 (en) * 1997-10-02 2000-08-16 Max-Planck-Gesellschaft Zur Förderung Der Wissenschaften E.V. Nucleic acid molecule encoding a (poly)peptide co-segregating in mutated form with autoimmune polyendocrinopathy candidiasis ectodermal dystrophy (apeced)
US6265202B1 (en) 1998-06-26 2001-07-24 Regents Of The University Of Minnesota DNA encoding methymycin and pikromycin
AU1447700A (en) 1998-10-28 2000-05-15 Kosan Biosciences, Inc. Library of novel "unnatural" natural products
US6303767B1 (en) * 1998-11-05 2001-10-16 Kosan Biosciences, Inc. Nucleic acids encoding narbonolide polyketide synthase enzymes from streptomyces narbonensis
US20040005673A1 (en) 2001-06-29 2004-01-08 Kevin Jarrell System for manipulating nucleic acids
CA2360011A1 (en) 1999-01-05 2000-07-13 Trustees Of Boston University Ordered gene assembly
JP2000245457A (ja) 1999-02-24 2000-09-12 Kitasato Inst:The エバーメクチンアグリコン合成酵素遺伝子
US7427493B2 (en) 2002-06-28 2008-09-23 Kosan Biosciences Incorporated Recombinant genes for polyketide modifying enzymes
US7579167B2 (en) 2002-10-08 2009-08-25 Aventis Pharma S. Polypeptides involved in the biosynthesis of spiramycins, nucleotide sequences encoding these polypeptides and applications thereof
FR2851773A1 (fr) * 2003-02-27 2004-09-03 Aventis Pharma Sa Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications
FR2845394A1 (fr) * 2002-10-08 2004-04-09 Aventis Pharma Sa Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications
EP1905833B1 (fr) 2002-10-08 2015-08-12 Aventis Pharma S.A. Polypeptides impliqués dans la biosynthèse des spiramycines, séquences nucléotidiques codant ces polypeptides et leurs applications
JP5042497B2 (ja) * 2002-10-08 2012-10-03 アベンティス・ファーマ・ソシエテ・アノニム スピラマイシンの生合成に関与するポリペプチド、これらポリペプチドをコードするヌクレオチド配列、および、その使用
DK2142638T3 (en) 2007-04-02 2016-12-12 Newsouth Innovations Pty Ltd Process for the production of secondary metabolites
DK2668284T3 (en) 2011-01-28 2014-12-15 Amyris Inc Screening of colony micro encapsulated in gel
CA2834783A1 (en) 2011-05-13 2012-11-22 Amyris, Inc. Methods and compositions for detecting microbial production of water-immiscible compounds
AU2013299608B2 (en) 2012-08-07 2019-02-21 Amyris, Inc. Methods for stabilizing production of acetyl-coenzyme a derived compounds
JP6595449B2 (ja) 2013-03-15 2019-10-23 アミリス, インコーポレイテッド アセチル補酵素a由来化合物を生産するためのホスホケトラーゼおよびホスホトランスアセチラーゼの使用
BR112016002526B1 (pt) 2013-08-07 2021-11-23 Total Marketing Services Método para produção de um composto heterólogo não catabólico, e, composição de fermentação
US10808015B2 (en) 2015-06-25 2020-10-20 Amyris, Inc. Maltose dependent degrons, maltose-responsive promoters, stabilization constructs, and their use in production of non-catabolic compounds
CN105505954B (zh) 2015-12-31 2019-01-22 沈阳福洋医药科技有限公司 可利霉素生物合成基因簇

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0463707A1 (en) * 1985-12-17 1992-01-02 Lubrizol Genetics Inc. Production of polyketide antibiotics
US5098837A (en) * 1988-06-07 1992-03-24 Eli Lilly And Company Macrolide biosynthetic genes for use in streptomyces and other organisms
US5252474A (en) * 1989-03-31 1993-10-12 Merck & Co., Inc. Cloning genes from Streptomyces avermitilis for avermectin biosynthesis and the methods for their use
US5639949A (en) * 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
US5662898A (en) * 1990-08-20 1997-09-02 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
WO1993013663A1 (en) * 1992-01-17 1993-07-22 Abbott Laboratories Method of directing biosynthesis of specific polyketides
CA2119379A1 (en) * 1991-09-18 1993-04-01 Wolfgang Piepersberg Secondary-metabolite biosynthesis genes from actinomycetes, method of isolating them and their use

Also Published As

Publication number Publication date
CA2197160C (en) 2007-05-01
US5945320A (en) 1999-08-31
EP0791656A3 (en) 2000-10-18
EP0791656A2 (en) 1997-08-27
CA2197160A1 (en) 1997-08-22

Similar Documents

Publication Publication Date Title
JPH09224686A (ja) プラテノリドシンターゼ遺伝子
JPH09224687A (ja) ポリケチドシンターゼ遺伝子
US6251636B1 (en) Recombinant oleandolide polyketide synthase
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
US6265202B1 (en) DNA encoding methymycin and pikromycin
KR102776146B1 (ko) 켈리마이신 생합성 유전자 클러스터
CA2399689A1 (en) Gene cluster encoding a nystatin polyketide synthase and its manipulation and utility
CN107794286A (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
KR100882692B1 (ko) 부테닐-스피노신 살충제 생산을 위한 생합성 유전자
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
KR20100034055A (ko) 유전자 클러스터 또는 그의 일부를 클로닝하기 위한 벡터 및 방법
CN110857447B (zh) 提高米尔贝霉素a3/a4或其衍生物产量的方法
US20030171562A1 (en) Genes and proteins for the biosynthesis of polyketides
CN114517175B (zh) 基因工程菌及其应用
US20030113874A1 (en) Genes and proteins for the biosynthesis of rosaramicin
US20040091975A1 (en) Midecamycin biosynthetic genes
US20040219645A1 (en) Polyketides and their synthesis
KR100549690B1 (ko) 에프알-008 폴리케타이드 합성에 관여하는 유전자
US20040161828A1 (en) Gene cluster for production of the enediyne antitumor antibiotic C-1027
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
US20030073824A1 (en) DNA encoding methymycin and pikromycin
US20030157654A1 (en) Biosynthesis of enediyne compounds by manipulation of C-1027 gene pathway
US20030194784A1 (en) DNA encoding methymycin and pikromycin
JPH1094395A (ja) フレノリシン遺伝子クラスター
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20031209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070423

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070426

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070523

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070528

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070828