JP2003116558A - 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 - Google Patents

成人t細胞白血病(atl)関連遺伝子とその発現タンパク質

Info

Publication number
JP2003116558A
JP2003116558A JP2001313067A JP2001313067A JP2003116558A JP 2003116558 A JP2003116558 A JP 2003116558A JP 2001313067 A JP2001313067 A JP 2001313067A JP 2001313067 A JP2001313067 A JP 2001313067A JP 2003116558 A JP2003116558 A JP 2003116558A
Authority
JP
Japan
Prior art keywords
gly
pro
leu
ser
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001313067A
Other languages
English (en)
Inventor
Masaharu Isobe
正治 磯部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Corp filed Critical Japan Science and Technology Corp
Priority to JP2001313067A priority Critical patent/JP2003116558A/ja
Publication of JP2003116558A publication Critical patent/JP2003116558A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 成人T細胞白血病(ATL)発症に関係する細
胞内遺伝子と、この遺伝子から発現される各タンパク
質、およびこれらタンパク質を認識する抗体を提供す
る。 【解決手段】 ヒト14番染色体q32領域に存在し、特定
のアミノ酸配列からなるタンパク質をコードする成人T
細胞白血病(ATL)関連遺伝子、この遺伝子由来のポリ
ヌクレオチド、この遺伝子の発現産物であるATL関連の
各タンパク質、ならびにATL関連タンパク質を認識する
抗体。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この出願の発明は、成人T細
胞白血病(Adult T cell Leukemia: ATL)関連遺伝子と
その発現タンパク質に関するものである。さらに詳しく
は、この出願は、ATLの診断や治療に有用なATL関連遺伝
子とその発現タンパク質、タンパク質に対する抗体に関
するものである。
【0002】
【従来の技術とその課題】成人T細胞白血病(ATL)は、
HTLV-Iウイルス感染を原因の一つとする白血病であり、
日本では九州等を中心として多発している。一方で、発
症までの長い潜伏期間ならびにウイルス感染者の低い発
症率、さらには白血病細胞中に全くHTLV-Iウイルス由来
の遺伝子発現が認められないケースが存在するという事
実は、ウイルス以外の内在性遺伝子の変化がATL発症に
深く関与していることを強く示唆する。しかしながら、
現在までATLの発症機構を説明する細胞内遺伝子の変化
についてはほとんど解明されていない。
【0003】従来、多くの白血病では特異的な染色体転
座に着目し、その転座切断点近傍から多数の癌関連遺伝
子が単離されている。しかしながら、ATLにおける染色
体異常は非常に複雑で、僅かな症例数について解析を行
っただけではその共通性を抽出することができず、これ
までにこの手法によってATL関連遺伝子を単離すること
は成功していなかった。
【0004】この出願の発明は、以上のとおりの事情に
鑑みてなされたものであって、ATL発症に関係する細胞
内遺伝子と、その遺伝子から発現される複数のタンパク
質、およびこれらタンパク質を認識する抗体を提供する
ことを課題としている。
【0005】
【課題を解決するための手段】この出願は、前記の課題
を解決するものとして、以下の(1)〜(11)の発明を提供
する。 (1) ヒト14番染色体q32領域に存在し、配列番号2、4、
6または8のアミノ酸配列を有するタンパク質をコードす
る成人T細胞白血病(ATL)関連遺伝子。 (2) 配列番号9-12の塩基配列を含み、各塩基配列にお
いて指定したエクソン(exon)領域が、それぞれエクソ
ン1、2、3および4である前記発明(1)のATL関連遺伝子。 (3) 転写されたmRNAから合成されるcDNAが、配列番号
1、3、5または7の塩基配列を有する前記発明(1)のATL関
連遺伝子。 (4) 前記発明(1)のATL関連遺伝子のゲノムDNA、mRNA、
cDNAまたはそれらの相補配列から精製されたポリヌクレ
オチド。 (5) 前記発明(1)のATL関連遺伝子または前記発明(4)の
ポリヌクレオチドにハイブリダイズする、10塩基対以上
の塩基配列からなるオリゴヌクレオチド。 (6) 前記発明(4)のポリヌクレオチドを保有する組換え
ベクター。 (7) 前記発明(6)の組換えベクターによる形質転換体細
胞。 (8) 前記発明(1)のATL関連遺伝子の発現産物であっ
て、配列番号2、4、6または8のアミノ酸配列を有するこ
とを特徴とするATL関連タンパク質。 (9) 前記発明(7)の形質転換体細胞によって産生される
前記発明(8)のATL関連タンパク質。 (10) 配列番号2、4、6または8の連続5アミノ酸残基以
上のアミノ配列からなるATL関連ペプチド。 (11) 前記発明(8)のATL関連タンパク質を認識する抗
体。
【0006】すなわち、この出願の発明者らは、50症例
におよぶATL患者試料の詳細な解析を行い、ATL患者全体
の約10%に異常が認められることが知られていたヒト14
番染色体q32領域(以下、14q32と記載することがある)
に存在する特定の約100kbの領域に限局して染色体転座
が生じていることを見出した。さらに、この領域に存在
する遺伝子の探索を行い、ATLとの関連性について解析
を行った結果、正常組織では主としてT細胞で高い発現
を示す新規遺伝子を見出した。ATLでは、しばしばプロ
モーター領域を含めたこの遺伝子内で染色体転座が生
じ、遺伝子の破壊が引き起こされているいことから、こ
の遺伝子はATLの発症に関与する癌抑制遺伝子であるこ
とが示唆された。そして、この遺伝子(ATL1)は、その
エクソン1-4(それぞれ配列番号9-12の塩基配列に示さ
れたエクソン領域)が関与する選択的スプライシングに
よって、それぞれ約8.6kbと6.6kbからなる4種類のタン
パク質(以下、それぞれをATLα、ATL1β、ATL1γ、ATL
1δと記載することがある)を発現することが確認され
た。
【0007】この出願の発明は、以上のとおりの新規ヒ
ト遺伝子およびその発現タンパク質を基礎とするもので
ある。以下、この出願の発明について、実施形態を詳し
く説明する。
【0008】
【発明の実施の形態】発明(1)のATL関連遺伝子ATL1は、
前記のとおりATL患者の多くに共通する14q32領域の染色
体転座部位から単離された遺伝子であって、配列番号
2、4、6または8のアミン酸配列を有するATL関連タンパ
ク質(すなわち、配列番号2:ATLα、配列番号4:ATL1
β、配列番号6:ATL1γ、配列番号8:ATL1δ)をコード
するヒトゲノム遺伝子である。さらに詳しくは、この遺
伝子ATL1は、mRNAから合成されたcDNAが、配列番号1、
3、5または7の塩基配列を有している。またこのATL1遺
伝子は、配列番号9-12のいずれか1以上の塩基配列を含
んでおり、これら配列番号9-12の各塩基配列において指
定したエクソン(exon)領域が、それぞれエクソン1、
2、3および4を構成している。
【0009】この遺伝子ATL1は、配列番号2のアミノ酸
配列からなるタンパク質ATL1αを発現するとともに、ス
プライスの様式の違いにより3種類のアイソフォーム
(ATL1β、ATL1γ、ATL1δ)を発現する。
【0010】このATL1遺伝子の発現レベルの変化や構造
破壊は、後記実施例で詳しく説明するとおり、ATLの発
症に密接に関係している。従って、この遺伝子ATL1の構
造異常の検出や、あるいはそれが発現するタンパク質の
構造異常や発現レベルの解析、あるいはタンパク質に対
する抗体は、ATLの悪性度や予後の予測、さらには正常
細胞とATL等の白血病細胞とを区別するために利用する
ことができる。
【0011】なお、この発明(1)の遺伝子ATL1には、そ
れがコードするタンパク質の発現に対する制御領域(プ
ロモーター/エンハンサー、サプレッサー等)も含まれ
る。これらの発現制御領域は、ATL関連タンパク質の機
能やATL関連遺伝子の欠失変異等のメカニズムを解明す
るためにも有用である。
【0012】この発明(1)のATL1遺伝子は、例えば、配
列番号1、9-12の塩基配列またはその一部配列からなる
ヌクレオチドプローブを用いてヒトゲノムDNAライブラ
リーをスクリーニングすることによって単離するするこ
とができる。また、プロモーター領域やエクソン3が染
色体転座によって欠失した遺伝子は、ATL患者のゲノムD
NAに存在しており、前記と同様のプローブハイブリダイ
ゼーションを用いたスクリーニングによって単離するこ
とができる。そして、前記のヌクレオチドプローブを用
いて遺伝子配列を調べることで、遺伝子の構造異常箇所
を特定することができる。
【0013】発明(4)は、前記発明(1)のATL1遺伝子のゲ
ノムDNA、mRNA、cDNAまたはこれらの相補配列から精製
されたポリヌクレオチドである。このようなポリヌクレ
オチドは、オリゴヌクレオチドの調製や、ATL関連タン
パク質の遺伝子工学的作成のための材料として有用であ
る。
【0014】これらのポリヌクレオチドは、ヒト細胞か
ら単離したゲノムDNAやmRNAから公知の方法により精製
することによってDNA断片やRNA断片として得ることがで
きる。また、cDNAはヒト細胞から抽出したポリ(A)+RNA
を鋳型として合成することができる。ヒト細胞として
は、人体から手術などによって摘出されたものでも培養
細胞でも良い。cDNAは、公知の方法(Mol. Cell Biol.
2, 161-170, 1982; J.Gene 25, 263-269, 1983; Gen
e, 150, 243-250, 1994)を用いて合成することができ
る。あるいは、オリゴヌクレオチドをプライマ−とし
て、ヒト細胞から単離したmRNAを鋳型とするRT-PCR法を
用いて、目的cDNAを合成することもできる。このように
して調製されるcDNAは、例えばATL1αをコードするcDNA
の場合には配列番号1の塩基配列を有している。この配
列番号1において、位置1-1033はエクソン1、位置1034-1
402はエクソン2、位置1403-1615はエクソン3、そして位
置1616-8433はエクソン4に由来する。また、ATL1β、AT
L1γ、ATL1δをそれぞれ発現するATL1遺伝子からは、配
列番号3、5および7のそれぞれの塩基配列からなるcDNA
が合成される。
【0015】発明(5)は、前記発明(1)のATL1遺伝子また
は前記発明(4)のポリヌクレオチドにハイブリダイズす
る、10塩基対以上の塩基配列からなるオリゴヌクレオチ
ドである。これらのオリゴヌクレオチド(DNA断片また
はRNA断片、若しくはそれらのアンチセンス鎖)は、例
えば、ATL1遺伝子やその変異を検出するためのプロー
ブ、あるいはポリヌクレオチドを合成するためのPCRプ
ライマーとして有用である。また、ATL診断用のマイク
ロアレイのためのプローブとして使用することもでき
る。
【0016】発明(6)は、発明(4)のポリヌクレオチドを
保有する組換えベクターである。ベクターはクローニン
グベクターまたは発現ベクターであり、インサートして
のポリヌクレオチドの種類や、その使用目的等に応じて
適宜のものを使用する。例えば、cDNAまたはそのORF領
域をインサートとして各ATL関連タンパク質を生産する
場合には、インビトロ転写用の発現ベクターや、大腸
菌、枯草菌等の原核細胞や、酵母、昆虫細胞、哺乳動物
細胞等の真核細胞のそれぞれに適した発現ベクターを使
用することができる。また、各ATL1遺伝子のゲノムDNA
をインサートとする場合には、BAC(Bacterial Artific
ial Chromosome)ベクターやコスミドベクター等を使用
することもでき、こられらの組換えベクターは、例えば
蛍光in situハイブリダイゼーション(FISH)による染
色体異常を診断するためのプローブとして有用である。
さらには、正常なATL1遺伝子由来のポリヌクレオチドを
ウイルスベクター等に組換え、これを遺伝子治療に用い
ることもできる。
【0017】発明(7)は、発明(6)の組換えベクターによ
る形質転換体細胞である。これらの細胞は、例えば、各
ATL関連タンパク質を製造する場合には、大腸菌、枯草
菌等の原核細胞や、酵母、昆虫細胞、哺乳動物細胞等の
真核細胞等を使用することができる。また、正常なATL1
遺伝子由来のポリヌクレオチドを組み換えたウイルスベ
クターによって形質転換したATL患者由来のT細胞は、遺
伝子治療に用いることもできる。こららの形質転換体細
胞は、電気穿孔法、リン酸カルシウム法、リポソーム
法、DEAEデキストラン法など公知の方法によって組換え
ベクターを細胞に導入することによって調製することが
できる。
【0018】発明(8)は、前記発明(1)のATL1遺伝子の発
現産物であって、配列番号2、4、6および8のアミノ酸配
列をそれぞれ有することを特徴とするATL関連タンパク
質ATLα、ATL1β、ATL1γ、ATL1δである。これらのタ
ンパク質は、抗体作製のための免疫原として、あるいは
ATL治療薬を開発するための標的分子等として有用であ
る。このタンパク質は、ヒト細胞から単離する方法、配
列番号2、4、6および8のそれぞれのアミノ酸配列に基づ
き化学合成によってペプチドを調製する方法等によって
得ることができるが、好ましくは、発明(7)の形質転換
細胞から単離・精製する方法によって大量に生産せるこ
とができる。すなわち、形質転換体細胞を培養し、その
培養物から、例えば、尿素などの変性剤や界面活性剤に
よる処理、超音波処理、酵素消化、塩析や溶媒沈殿法、
透析、遠心分離、限外濾過、ゲル濾過、SDS-PAGE、等電
点電気泳動、イオン交換クロマトグラフィー、疎水性ク
ロマトグラフィー、アフィニティークロマトグラフィ
ー、逆相クロマトグラフィー等によって単離、精製する
ことによって各ATL関連タンパク質(発明(9))を大量に
得ることができる。なお、発明(9)のタンパク質には、
他の任意の蛋白質との融合蛋白質も含まれる。例えば、
ヒスチジンタグ、グルタチン−S−トランスフェラ−ゼ
(GST)や緑色蛍光蛋白質(GFP)との融合蛋白質などが
例示できる。さらに、細胞で発現したタンパク質は、翻
訳された後、細胞内で各種修飾を受ける場合がある。し
たがって、修飾されたタンパク質も発明(9)のタンパク
質の範囲に含まれる。このような翻訳後修飾としては、
N末端メチオニンの脱離、N末端アセチル化、糖鎖付
加、細胞内プロテア−ゼによる限定分解、ミリストイル
化、イソプレニル化、リン酸化などである。
【0019】発明(10)は、配列番号2、4、6または8の連
続5アミノ酸残基以上のアミノ酸配列からなるオリゴペ
プチドである。このオリゴペプチドは、例えば抗体作製
のための抗原として使用することができ、例えば、各ア
ミノ酸配列に基づき、公知のペプチド合成法等により作
成することができる。
【0020】発明(11)は、発明(8)のATL関連タンパク質
を認識するポリクローナル抗体またはモノクローナル抗
体である。例えば、ATLα、ATL1β、ATL1γおよびATL1
δのそれぞれの欠失アミノ酸残基の領域をカバーするオ
リゴペプチドを抗原とすることによって、これらの各AT
L関連タンパク質を個別に認識する抗体を得ることがで
きる。この抗体は、細胞での各ATL関連タンパク質の発
現を調べることによってATL診断を行うための材料等と
して有用である。この抗体には、ATL関連タンパク質の
エピトープに結合することができる全体分子、およびFa
b、F(ab')2、Fv断片等が全て含まれる。このような抗体
は、前記のATLタンパク質やペプチドを抗原として用い
て動物を免役した後、血清から得ることが出きる。ある
いは、上記の真核細胞用発現ベクターを注射や遺伝子銃
によって、動物の筋肉や皮膚に導入した後、血清を採取
することによって作製することができる。動物として
は、マウス、ラット、ウサギ、ヤギ、ニワトリなどが用
いられる。免疫した動物の脾臓から採取したB細胞をミ
エロ−マと融合させてハイブリド−マを作製すれば、モ
ノクロ−ナル抗体を産生することができる。
【0021】以下、実施例を示してこの出願の発明につ
いてさらに詳細かつ具体的に説明するが、この出願の発
明は以下の例によって限定されるものではない。
【0022】
【実施例】実施例1:ATL関連遺伝子(ATL1)の同定 50症例の成人T細胞白血病患者について14番染色体q32領
域における染色体異常の好発領域を検索した結果、4症
例における染色体転座が約100kbの領域に集積している
ことを見いだした。そこでこの領域を網羅するヒトゲノ
ムクローンをバクテリア人工染色体(BAC)ライブラリー
ならびにコスミドライブラリーのスクリーニングにより
単離した。さらにこの領域に染色体異常を示す3症例に
ついて染色体転座の切断点をクローン化し、その周辺に
存在する遺伝子を探索した。その結果、図1に示すよう
な構造を持つ新規遺伝子を同定しATL1遺伝子と命名し
た。 実施例2:ATL関連遺伝子cDNAのクローニング ATL1遺伝子に対応するcDNAを、ヒト胸腺由来cDNAライブ
ラリーのスクリーニング、胸腺由来mRNAを用いた5'RACE
法ならびに3'RACE法によって単離した。得られたcDNAク
ローンとゲノムクローンとの構造を比較し、エクソン−
イントロン構造を決定した。
【0023】図2に示すように、ATL1遺伝子は基本的に
4つのエクソンから構成されるが、エクソン2の5'側のス
プライシングの差異による1アミノ酸の有無、ならびに
エクソン3の有無によってATL1遺伝子は、ATL1α、ATL1
β、ATL1γ、ATL1δの少なくとも4種類のタンパク質を
コードする。さらにエクソン4の非翻訳領域に存在する2
種類のポリA付加シグナルの違いにより8.6kbと6.6kbの
転写産物を生じる。このATL1タンパク質のエクソン4に
よってコードされる領域には、図3に示すようにDNAや
タンパク質との相互作用に関わる6箇所のC2H2型のZnフ
ィンガードメインならびに1箇所のプロリンに富むドメ
インが存在し、これらのモチーフは、ATL1α、ATL1β、
ATL1γ、ATL1δの全てのアイソフォームに共通して存在
する。 実施例3:ノザン法およびRT-PCR法を用いた正常組織に
おける発現様式の解析 ATL1 cDNAをプローブとして各種組織由来のmRNAに対し
てノザン法による発現量の解析を行った。図4に示すよ
うに、成人正常組織ではATL1遺伝子由来の転写産物は、
主として胸腺ならびに末梢血白血球において、8.6と6.6
kbの位置に強いシグナルが検出された。
【0024】RT-PCR法を用いて、より高感度に正常組織
における発現を調べると、ATL1遺伝子は、図5に示すよ
うに、上述の組織以外に、脾臓、リンパ節、骨髄、膵
臓、腎臓においても発現が検出された。末梢血白血球の
中では、主としてCD4陽性/CD8陰性のヘルパーT細胞な
らびに、CD4陰性/CD8陽性の細胞障害性T細胞においてA
TL1遺伝子の高い発現が検出され、CD14陽性の単球に
は、全く発現が検出されず、CD19陽性のB細胞で、弱い
発現が認められた。有糸分裂促進因子を用いて細胞増殖
の刺激を行うと、ヘルパーT細胞ならびに細胞障害性T細
胞におけるATL1遺伝子の発現は有意に減少した(図6参
照)。これらの結果は、ATL1遺伝子が正常組織では主と
してT細胞で発現し、増殖刺激によって発現が減少する
ことが明らかとなった。 実施例4:ATL患者におけるATL1遺伝子の発現 ATL由来細胞株における発現量をノザン法によって解析
すると、ATL1遺伝子は正常組織では主として胸腺細胞あ
るいは末梢血T細胞で発現しているにもかかわらず、AT
L由来細胞株ST-1、RST-1、KKI、ならびにHTLV-1ウイル
スによって形質転換されたT細胞株MT-1ならびにMT-2で
はATL1遺伝子の発現がほとんど検出されなかった。ATL
由来細胞株のうち、OMOTO細胞株とATN1細胞株では弱い
発現が観察されたが、それらの発現量は胸腺の、いずれ
もそれぞれ25%、あるいは、10%以下であった。(図
7) 実施例5:ATL患者における遺伝子変異の解析 ATL1遺伝子座周辺のゲノムクローンをプローブとしてFI
SH法を行い、ATL症例1ならびに2における染色体転座切
断点の位置を絞り込み、次に切断点周辺のゲノムDNA断
片をプローブとするサザン法によって切断点を限局化し
た。次にこれらの切断点をクローン化し、その切断点の
塩基配列を決定し、ATL1遺伝子との関連を解析した。そ
の結果、図8に示すように症例1ならびに2の染色体切断
点は、ATL1遺伝子のプロモーター領域に存在し、それぞ
れ17番あるいは、2番染色体との間で染色体転座を引き
起こしていた。症例3では、両対立遺伝子がATL1遺伝子
の3'非翻訳領域で染色体転座あるいは染色体逆位を伴う
染色体挿入を引き起こしていた。片方の対立遺伝子は、
6番染色体との染色体転座を引き起こし、もう一方の対
立遺伝子では、14番染色体のより動原体よりの領域との
染色体逆位ならびに染色体挿入を生じていた。その結
果、症例3では、全てのATL1対立遺伝子に染色体異常に
よる遺伝子破壊が引き起こされていた。
【0025】ATL1遺伝子のプロモーターに染色体転座を
持つATL症例1あるいは3'非翻訳領域に染色体異常を持つ
ATL症例3由来のRNAを用いて、RT-PCR法による解析を行
った。いずれの症例もATLに典型的なCD4陽性/CD8陰性
の表現型を示すT細胞性の腫瘍であるにもかかわらず、
図6に示すように、ATL1遺伝子の発現は全く検出されな
かった。症例1では、片方の染色体のATL1遺伝子に破壊
が生じ、もう一方の染色体のATL1遺伝子は、正常である
にもかかわらずATL1遺伝子の発現が検出されなかった。
これは残された正常対立遺伝子のプロモーターがメチル
化による修飾によって不活化されたためであると考えら
れた。実際、ATL1遺伝子内で染色体異常が認められる頻
度は、全ATL患者の約10%であるにもかかわらず、大半
のATL症例でもATL1遺伝子の発現減少が観察された。こ
れらの発現減少もプロモーターのメチル化による不活化
機構によって説明される。ATL1遺伝子に構造的異常を持
つATL症例では物理的にATL1遺伝子が破壊されることに
よって発現が消失し、ATL1遺伝子に構造的異常を認めな
い場合でもプロモーターのメチル化などを介してATL1遺
伝子の発現低下が引き起こされていると考えられる。細
胞増殖刺激を受けたT細胞においてもATL1遺伝子発現の
減少が引き起こされることを考え合わせるとATL1遺伝子
が、細胞増殖を抑制的に制御する癌抑制遺伝子である可
能性が強く示唆される。ATL1遺伝子に構造異常を持つ症
例は、全て悪性度の高い急性型のATLであり、慢性型のA
TL症例には、全くこのような構造異常を見いだせなかっ
た。したがってATL1遺伝子の構造異常の検出あるいは、
発現レベルの測定は、癌の悪性度や予後の予測に応用可
能であると考えられる。 実施例6:ATL1抗体の作製ならびにATL1タンパク質の細
胞内局在 ATL1タンパク質由来の抗体を作製するためATL1タンパク
質の510番目から527番目にいたる領域のペプチド配列の
N端にKLHと結合するためのシステイン残基を付加したペ
プチド(NH2-CLKAADGDFRHHESDPSLG-COOH:配列番号13)を
合成し、このペプチドとキャリアータンパク質であるKL
HをMBSと呼ばれるリンカーを介して共有結合させ、ウサ
ギに対してアジュバントとともに4回の免疫を行い、抗
血清を作製した。得られた抗血清を、免疫に使用したペ
プチドが固定化された樹脂を用いてアフィニティークロ
マトグラフィーを行い、抗体を精製した。
【0026】この抗体は、用いたペプチドを抗原とする
ELISA法による測定で、64,000倍以上のタイターを示し
た。また発現ベクターに組み込んだATL1遺伝子をサルの
腎臓由来細胞株(COS7細胞)で強制発現させた後、この抗
体を用いて免疫組織化学的染色により細胞内局在を調べ
ると、図9に示すように核内にドット状の特徴的分布を
示すATL1タンパク質が検出された。ATL1タンパク質がC2
H2タイプのZnフィンガードメインを有すること、ならび
に核内で発現していることを考慮するとATL1タンパク質
は核内で遺伝子転写因子として働いている可能性が強く
示唆される。
【0027】またATL1遺伝子をCOS7細胞株中で強制発現
させた後、抗ATL1抗体を用いたウエスタン法によってAT
L1タンパク質を検出したところ、図10に示すようにアミ
ノ酸の1次構造から予測される約96kDaの位置に単一のバ
ンドが観察された。
【0028】多くのATL症例ではATL1遺伝子の発現が減
少していることから、ATL1タンパク質あるいは、それに
対する抗体は、正常細胞とATL等の白血病細胞とを区別
する、道具としての応用が期待される。
【0029】
【発明の効果】以上詳しく説明したとおり、この出願の
発明によって、ATL発症に関係する細胞内遺伝子と、そ
の変異体遺伝子、それぞれの遺伝子の発現タンパク質、
およびこれらタンパク質を認識する抗体が提供される。
これらの発明によって、ATL発症の機構解明や、ATLの診
断および治療法の開発が可能となる。
【0030】
【配列表】 SEQUENCE LISTING <110> Japan Science and Technology Corporation <120> ATL-relating gene and proteins expressed from the gene <130> NP00290-YS <140> <141> <160> 13 <170> PatentIn Ver. 2.1 <210> 1 <211> 8533 <212> DNA <213> Homo sapiens <220> <221> 5'UTR <222> (1)..(975) <220> <221> CDS <222> (976)..(3660) <220> <221> 3'UTR <222> (3661)..(8533) <220> <221> polyA#signal <222> (6375)..(6380) <220> <221> polyA#signal <222> (8494)..(8499) <400> 1 atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60 agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120 ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180 ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240 cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300 ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360 gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420 ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480 tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540 taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600 ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660 gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720 ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780 ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840 cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900 ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960 atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu 1 5 10 tcc cag agg gag ctc atc acc cca gag gct gac cat gtg gag gcc gcc 1059 Ser Gln Arg Glu Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala 15 20 25 atc ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg 1107 Ile Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu 30 35 40 ggg ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag 1155 Gly Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln 45 50 55 60 tgt caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac 1203 Cys Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His 65 70 75 aaa agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc 1251 Lys Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala 80 85 90 ctg gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa 1299 Leu Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys 95 100 105 gtg tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat 1347 Val Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp 110 115 120 gac cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac 1395 Asp His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn 125 130 135 140 att gca ggg ccg tgc agg cct gcc cag ctg cca gcg gtg gcc ccc ata 1443 Ile Ala Gly Pro Cys Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile 145 150 155 gct gcc tcc tcc cac cct cac tca tcc gtg atc act tca cct ctg cgt 1491 Ala Ala Ser Ser His Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg 160 165 170 gcc ctg ggc gct ctc ccg ccc tgc ctc ccc ctg ccg tgc tgc agc gcg 1539 Ala Leu Gly Ala Leu Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala 175 180 185 cgc ccg gtc tcg ggt gac ggg act cag ggt gag ggt cag acg gag gct 1587 Arg Pro Val Ser Gly Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala 190 195 200 ccc ttt gga tgc cag tgt cag ttg tca ggt aaa gat gag cct tcc agc 1635 Pro Phe Gly Cys Gln Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser 205 210 215 220 tac att tgc aca aca tgc aag cag ccc ttc aac agc gcg tgg ttc ctg 1683 Tyr Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu 225 230 235 ctg cag cac gcg cag aac acg cac ggc ttc cgc atc tac ctg gag ccc 1731 Leu Gln His Ala Gln Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro 240 245 250 ggg ccg gcc agc agc tcg ctc acg ccg cgg ctc acc atc ccg ccg ccg 1779 Gly Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro 255 260 265 ctc ggg ccc gag gcc gtg gcg cag tcc ccg ctc atg aat ttc ctg ggc 1827 Leu Gly Pro Glu Ala Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly 270 275 280 gac agc aac ccc ttc aac ctg ctg cgc atg acg ggc ccc atc ctg cgg 1875 Asp Ser Asn Pro Phe Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg 285 290 295 300 gac cac ccg ggc ttc ggc gag ggc cgc ctg ccg ggc acg ccg cct ctc 1923 Asp His Pro Gly Phe Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu 305 310 315 ttc agt ccc ccg ccg cgc cac cac ctg gac ccg cac cgc ctc agt gcc 1971 Phe Ser Pro Pro Pro Arg His His Leu Asp Pro His Arg Leu Ser Ala 320 325 330 gag gag atg ggg ctc gtc gcc cag cac ccc agt gcc ttc gac cga gtc 2019 Glu Glu Met Gly Leu Val Ala Gln His Pro Ser Ala Phe Asp Arg Val 335 340 345 atg cgc ctg aac ccc atg gcc atc gac tcg ccc gcc atg gac ttc tcg 2067 Met Arg Leu Asn Pro Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser 350 355 360 cgg cgg ctc cgc gag ctg gcg ggc aac agc tcc acg ccg ccg ccc gtg 2115 Arg Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val 365 370 375 380 tcc ccg ggc cgc ggc aac cct atg cac cgg ctc ctg aac ccc ttc cag 2163 Ser Pro Gly Arg Gly Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln 385 390 395 ccc agc ccc aag tcc ccg ttc ctg agc acg ccg ccg ctg ccg ccc atg 2211 Pro Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met 400 405 410 ccc cct ggc ggc acg ccg ccc ccg cag ccg cca gcc aag agc aag tcg 2259 Pro Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser 415 420 425 tgc gag ttc tgc ggc aag acc ttc aag ttc cag agc aat ctc atc gtg 2307 Cys Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val 430 435 440 cac cgg cgc agt cac acg ggc gag aag ccc tac aag tgc cag ctg tgc 2355 His Arg Arg Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys 445 450 455 460 gac cac gcg tgc tcg cag gcc agc aag ctc aag cgc cac atg aag acg 2403 Asp His Ala Cys Ser Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr 465 470 475 cac atg cac aag gcc ggc tcg ctg gcc ggc cgc tcc gac gac ggg ctc 2451 His Met His Lys Ala Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu 480 485 490 tcg gcc gcc agc tcc ccc gag ccc ggc acc agc gag ctg gcg ggc gag 2499 Ser Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu 495 500 505 ggc ctc aag gcg gcc gac ggt gac ttc cgc cac cac gag agc gac ccg 2547 Gly Leu Lys Ala Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro 510 515 520 tcg ctg ggc cac gag ccg gag gag gag gac gag gag gag gag gag gag 2595 Ser Leu Gly His Glu Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu 525 530 535 540 gag gag gag ctg cta ctg gag aac gag agc cgg ccc gag tcg agc ttc 2643 Glu Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe 545 550 555 agc atg gac tcg gag ctg agc cgc aac cgc gag aac ggc ggt ggt ggg 2691 Ser Met Asp Ser Glu Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly 560 565 570 gtg ccc ggg gtc ccg ggc gcg ggg ggc ggc gcg gcc aag gcg ctg gct 2739 Val Pro Gly Val Pro Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala 575 580 585 gac gag aag gcg ctg gtg ctg ggc aag gtc atg gag aac gtg ggc cta 2787 Asp Glu Lys Ala Leu Val Leu Gly Lys Val Met Glu Asn Val Gly Leu 590 595 600 ggc gca ctg ccg cag tac ggc gag ctc ctg gcc gac aag cag aag cgc 2835 Gly Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg 605 610 615 620 ggc gcc ttc ctg aag cgt gcg gcg ggc ggc ggg gac gcg ggc gac gac 2883 Gly Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp 625 630 635 gac gac gcg ggc ggc tgc ggg gac gcg ggc gcg ggc ggc gcg gtc aac 2931 Asp Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn 640 645 650 ggg cgc ggg ggc ggc ttc gcg cca ggc acc gag ccc ttc ccc ggg ctc 2979 Gly Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu 655 660 665 ttc ccg cgc aag ccc gcg ccg ctg ccc agc ccc ggg ctc aac agc gcc 3027 Phe Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala 670 675 680 gcc aag cgc atc aag gtg gag aag gac ctg gag ctg ccg ccc gcc gcg 3075 Ala Lys Arg Ile Lys Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala 685 690 695 700 ctc atc ccg tcc gag aac gtg tac tcg cag tgg ctg gtg ggc tac gcg 3123 Leu Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala 705 710 715 gcg tcg cgg cac ttc atg aag gac ccc ttc ctg ggc ttc acg gac gca 3171 Ala Ser Arg His Phe Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala 720 725 730 cga cag tcg ccc ttc gcc acg tcg tcc gag cac tcg tcc gag aac ggc 3219 Arg Gln Ser Pro Phe Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly 735 740 745 agc ctg cgc ttc tcc acg ccg ccc ggg gac ctg ctg gac ggc ggc ctc 3267 Ser Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu 750 755 760 tcg ggc cgc agc ggc acg gcc agc gga ggc agc acc ccg cac ctg ggc 3315 Ser Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly 765 770 775 780 ggc ccg ggc ccc ggg cgg ccc agc tcc aag gag ggc cgc cgc agc gac 3363 Gly Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp 785 790 795 acg tgc gag tac tgc ggc aag gtg ttc aag aac tgc agc aac ttg acg 3411 Thr Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr 800 805 810 gtg cac cgg cgg agc cac acc ggc gag cgg cct tac aag tgc gag ctg 3459 Val His Arg Arg Ser His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu 815 820 825 tgc aac tac gcg tgc gcg cag agc agc aag ctc acg cgc cac atg aag 3507 Cys Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys 830 835 840 acg cac ggg cag atc ggc aag gag gtg tac cgc tgc gac atc tgc cag 3555 Thr His Gly Gln Ile Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln 845 850 855 860 atg ccc ttc agc gtc tac agc acc ctg gag aaa cac atg aaa aag tgg 3603 Met Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp 865 870 875 cac ggc gag cac ttg ctg act aac gac gtc aaa atc gag cag gcc gag 3651 His Gly Glu His Leu Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu 880 885 890 agg agc taa gcgcgcgggc cccggcgccc cgcacctgta cagtggaacc 3700 Arg Ser 895 gttgccaacc gagagaatgc tgacctgact tgcctccgtg tcaccgccac cccgcacccc 3760 gcgtgtcccc ggggcccagg ggaggcggca ctccaaccta acctgtgtct gcgaagtcct 3820 atggaaaccc gagggttgat taaggcagta caaattgtgg agccttttaa ctgtgcaata 3880 atttctgtat ttattgggtt ttgtaatttt tttggcatgt gcaggtactt tttattatta 3940 ttttttctgt ttgaattcct ttaagagatt ttgttgggta tccatccctt ctttgttttt 4000 tttttaaccc ggtagtagcc tgagcaatga ctcgcaagca atgttagagg ggaagcatat 4060 cttttaaatt ataatttggg gggaggggtg gtgctgcttt tttgaaattt aagctaagca 4120 tgtgtaattt cttgtgaaga agccaacact caaatgactt ttaaagttgt ttactttttc 4180 attccttcct tttttttgtc ctgaaataaa aagtggcatg cagttttttt tttaattatt 4240 ttttaatttt tttttttggt ttttgttttt ggggtggggg gtgtggatgt acagcggata 4300 acaatctttc aagtcgtagc actttgtttc agaactggaa tggagatgta gcactcatgt 4360 cgtcccgagt caagcggcct tttctgtgtt gatttcggct ttcatattac ataagggaaa 4420 ccttgagtgg tggtgctggg ggaggcaccc cacagactca gcgccgccag agatagggtt 4480 tttggagggc tcctctggga aatggcccga cagcattctg aggttgtgca tgaccagcag 4540 atactatcct gttggtgtgc cctggggtgc catggctgct attcgctgta gattaggcta 4600 cataaaatgg gctgagggta cctttttggg gagatggggt ggcctgcagt gacacagaaa 4660 ggaagaaact agcggtgttc ttttaggcgt tttctggctt gacggcttct ctcttttttt 4720 aaatcacccc caccacataa atctcaaatc ctatgttgct acaaggggtc atccatcatt 4780 tcccaagcag acgaatgccc taattaattg aagttagtgt tctctcattt aatgcacact 4840 gatgatattg tagggatggg tggggtgggg atcttgcaaa tttctattct cttttactga 4900 aaaagcaggg gatgagttcc atcagaaggt gcccagcgct acttcccagg tttttatttt 4960 ttttttccta tctcattagg ttggaaggta ctaaatattg aactgttaag attagacatt 5020 tgaattctgt tgacccgcac tttaaagctt ttgtttgcat ttaaattaaa tggcttctaa 5080 acaagaaatt gcagcatatt cttctctttg gcccagaggt gggttaaact gtaagggaca 5140 gctgagattg agtgtcagta ttgctaagcg tggcattcac aatactggca ctataaagaa 5200 caaaataaaa taataattta taggacagtt tttctactgc cattcaattt gatgtgagtg 5260 ccttgaaaac tgatcttcct atttgagtct cttgagacaa atgcaaaact ttttttttga 5320 aatgaaaaga ctttttaaaa aagtaaaaca agaaaagtac attctttaga aactaacaaa 5380 gccacattta ctttaagtaa aaaaaaaaaa aattctggtt gaagatagag gatatgaaat 5440 gccataagac ccaatcaaat gaagaaataa acccagcaca accttggaca tccattagct 5500 gaattatcct cagccccttt tgtttttggg acaacgctgc ttagatatgg agtggaggtg 5560 atttactgct gaattaaaac tcaagtgaca caagttacaa gttgatatcg ttgaatgaaa 5620 agcaaaacaa aaacaattca ggaacaacgg ctaatttttt ctaaagttaa atttagtgca 5680 ctctgtctta aaaatacgtt tacagtattg ggtacataca agggtaaaaa aaaaattgtg 5740 tgtatgtgtg ttggagcgat cttttttttt caaagtttgc ttaataggtt atacaaaaat 5800 gccacagtgg ccgcgtgtat attgttttct tttggtgacg gggttttagt atatattata 5860 tatattaaaa tttcttgatt actgtaaaag tggaccagta tttgtaataa tcgagaatgc 5920 ctgggcattt tacaaaacaa gaaaaaaaat acccttttct tttccttgaa aatgttgcag 5980 taaaatttaa atggtgggtc tataaatttg ttcttgttac agtaactgta aagtcggagt 6040 tttagtaaat ttttttctgc cttgggtgtt gaatttttat ttcaaaaaaa atgtatagaa 6100 acttgtattt ggggattcaa aggggattgc tacaccatgt agaaaaagta tgtagaaaaa 6160 aagtgcttaa tattgttatt gctttgcaga aaaaaaaaaa tcacatttct gacctgtact 6220 tatttttctc ttcccgcctc cctctggaat ggatatattg gttggttcat atgatgtagg 6280 cacttgctgt atttttactg gagctcgtaa ttttttaact gtaagcttgt ccttttaaag 6340 ggatttaatg tacctttttg ttagtgaatt tggaaataaa aagaaaaaaa aaacaaaaac 6400 aaacaggctg ccataatata tttttttaat ttggcaggat aaaatattgc aaaaaaaaca 6460 catttgtatg ttaagtccta ttgtacagga gaaaaagggt tgtttgacaa cctttgagaa 6520 aaagaaacaa aaggaagtag ttaaatgctt tggttcacaa atcatttagt tgtatatatt 6580 ttttgtcgga attggcctac acagagaacc gttcgtgttg ggcttctctc tgaacgcccc 6640 gaaccttgca tcaaggctcc ttggtgtggc cacagcagac cagatgggaa attatttgtg 6700 ttgagtggaa aaaaatcagt ttttgtaaag atgtcagtaa cattccacat cgtcctccct 6760 ttctctaaga ggccatctct aagatgtcag atgtagagga gagagagcga gagaacatct 6820 tccttctcta ccatcactcc tgtggcggtc accaccacca cctctcccgc ccttaccagc 6880 agaaagcaat gcaaactgag ctgctttagt ccttgagaaa ttgtgaaaca aacacaaata 6940 tcataaaagg agctggtgat tcagctgggt ccaggtgaag tgacctgctg ttgagaccgg 7000 tacaaattgg atttcaggaa ggagactcca tcacagccag gacctttcgt gccatggaga 7060 gtgttggcct cttgtctttc ttccctgctt tgctgctttg ctctctgaaa cctacattcc 7120 gtcagtttcc gaatgcgagg gcctgggatg aatttggtgc ctttccatat ctcgttctct 7180 ctccttcccc tgcgtttcct ctccatcctt catcctccat tggtcctttt tttttctttc 7240 attttttatt taatttcttt tcttcctgtc tgttcctccc ctaatcctct attttatttt 7300 tattttttgt aaagccaagt agctttaaga taaagtggtg gtcttttgga tgagggaata 7360 atgcattttt aaataaaata ccaatatcag gaagccattt tttatttcag gaaatgtaag 7420 aaaccattat ttcaggttat gaaagtataa ccaagcatcc ttttgggcaa ttccttacca 7480 aatgcagaag cttttctgtt cgatgcactc tttcctcctt gccacttacc tttgcaaagt 7540 taaaaaaaag gggggaggga atgggagaga aagctgagat ttcagtttcc tactgcagtt 7600 tcctacctgc agatccaggg gctgctgttg cctttggatg ccccactgag gtcctagagt 7660 gcctccaggg tggtcttcct gtagtcataa cagctagcca gtgctcacca gcttaccaga 7720 ttgccaggac taagccatcc caaagcacaa gcattgtgtg tctctgtgac tgcagagaag 7780 agagaatttt gcttctgttt tgtgtttaaa aaaccaacac ggaagcagat gatcccgaga 7840 gagaggcctc tagcatgggt gacccagccg acctcaggcc ggtttccgca ctgccacaac 7900 tttgttcaaa gttgccccca attggaacct gccacttggc attagagggt ctttcatggg 7960 gagagaagga gactgaatta ctctaagcaa aatgtgaaaa gtaaggaaat cagcctttca 8020 tcccggtcct aagtaaccgt cagccgaagg tctcgtggaa cacaggcaaa cccgtgattt 8080 tggtgctcct tgtaactcag ccctgcaaag caaagtccca ttgatttaag ttgtttgcat 8140 ttgtactggc aaggcaaaat atttttatta ccttttctat tacttattgt atgagctttt 8200 gttgtttact tggaggtttt gtcttttact acaagtttgg aactatttat tattgcttgg 8260 tatttgtgct ctgtttaaga aacaggcact tttttttatt atggataaaa tgttgagatg 8320 acaggaggtc atttcaatat ggcttagtaa aatatttatt gttcctttat tctctgtaca 8380 agattttggg cctctttttt tccttaatgt cacaatgttg agttcagcat gtgtctgcca 8440 tttcatttgt acgcttgttc aaaaccaagt ttgttctggt ttcaagttat aaaaataaat 8500 tggacattta acttaaaaaa aaaaaaaaaa aaa 8533 <210> 2 <211> 894 <212> PRT <213> Homo sapiens <400> 2 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu 1 5 10 15 Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu 20 25 30 Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val 35 40 45 Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn 50 55 60 Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln 65 70 75 80 Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp 85 90 95 Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro 100 105 110 Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu 115 120 125 Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Pro 130 135 140 Cys Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile Ala Ala Ser Ser 145 150 155 160 His Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg Ala Leu Gly Ala 165 170 175 Leu Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala Arg Pro Val Ser 180 185 190 Gly Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala Pro Phe Gly Cys 195 200 205 Gln Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr 210 215 220 Thr Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala 225 230 235 240 Gln Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser 245 250 255 Ser Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu 260 265 270 Ala Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro 275 280 285 Phe Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly 290 295 300 Phe Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro 305 310 315 320 Pro Arg His His Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly 325 330 335 Leu Val Ala Gln His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn 340 345 350 Pro Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg 355 360 365 Glu Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg 370 375 380 Gly Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys 385 390 395 400 Ser Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly 405 410 415 Thr Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys 420 425 430 Gly Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser 435 440 445 His Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys 450 455 460 Ser Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr His Met His Lys 465 470 475 480 Ala Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser 485 490 495 Ser Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala 500 505 510 Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His 515 520 525 Glu Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu 530 535 540 Leu Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser 545 550 555 560 Glu Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val 565 570 575 Pro Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala 580 585 590 Leu Val Leu Gly Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro 595 600 605 Gln Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu 610 615 620 Lys Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly 625 630 635 640 Gly Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly 645 650 655 Gly Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys 660 665 670 Pro Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile 675 680 685 Lys Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser 690 695 700 Glu Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His 705 710 715 720 Phe Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro 725 730 735 Phe Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe 740 745 750 Ser Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser 755 760 765 Gly Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro 770 775 780 Gly Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr 785 790 795 800 Cys Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg 805 810 815 Ser His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala 820 825 830 Cys Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln 835 840 845 Ile Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser 850 855 860 Val Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp His Gly Glu His 865 870 875 880 Leu Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu Arg Ser 885 890 <210> 3 <211> 8530 <212> DNA <213> Homo sapiens <220> <221> 5'UTR <222> (1)..(975) <220> <221> CDS <222> (976)..(3657) <220> <221> polyA#signal <222> (6372)..(6377) <220> <221> polyA#signal <222> (8494)..(8499) <400> 3 atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60 agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120 ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180 ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240 cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300 ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360 gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420 ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480 tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540 taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600 ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660 gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720 ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780 ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840 cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900 ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960 atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu 1 5 10 tcc cag agg gag ctc atc acc cag gct gac cat gtg gag gcc gcc atc 1059 Ser Gln Arg Glu Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile 15 20 25 ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg ggg 1107 Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly 30 35 40 ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag tgt 1155 Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys 45 50 55 60 caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac aaa 1203 Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys 65 70 75 agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc ctg 1251 Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu 80 85 90 gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa gtg 1299 Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val 95 100 105 tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat gac 1347 Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp 110 115 120 cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac att 1395 His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile 125 130 135 140 gca ggg ccg tgc agg cct gcc cag ctg cca gcg gtg gcc ccc ata gct 1443 Ala Gly Pro Cys Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile Ala 145 150 155 gcc tcc tcc cac cct cac tca tcc gtg atc act tca cct ctg cgt gcc 1491 Ala Ser Ser His Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg Ala 160 165 170 ctg ggc gct ctc ccg ccc tgc ctc ccc ctg ccg tgc tgc agc gcg cgc 1539 Leu Gly Ala Leu Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala Arg 175 180 185 ccg gtc tcg ggt gac ggg act cag ggt gag ggt cag acg gag gct ccc 1587 Pro Val Ser Gly Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala Pro 190 195 200 ttt gga tgc cag tgt cag ttg tca ggt aaa gat gag cct tcc agc tac 1635 Phe Gly Cys Gln Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser Tyr 205 210 215 220 att tgc aca aca tgc aag cag ccc ttc aac agc gcg tgg ttc ctg ctg 1683 Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu 225 230 235 cag cac gcg cag aac acg cac ggc ttc cgc atc tac ctg gag ccc ggg 1731 Gln His Ala Gln Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro Gly 240 245 250 ccg gcc agc agc tcg ctc acg ccg cgg ctc acc atc ccg ccg ccg ctc 1779 Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu 255 260 265 ggg ccc gag gcc gtg gcg cag tcc ccg ctc atg aat ttc ctg ggc gac 1827 Gly Pro Glu Ala Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly Asp 270 275 280 agc aac ccc ttc aac ctg ctg cgc atg acg ggc ccc atc ctg cgg gac 1875 Ser Asn Pro Phe Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg Asp 285 290 295 300 cac ccg ggc ttc ggc gag ggc cgc ctg ccg ggc acg ccg cct ctc ttc 1923 His Pro Gly Phe Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe 305 310 315 agt ccc ccg ccg cgc cac cac ctg gac ccg cac cgc ctc agt gcc gag 1971 Ser Pro Pro Pro Arg His His Leu Asp Pro His Arg Leu Ser Ala Glu 320 325 330 gag atg ggg ctc gtc gcc cag cac ccc agt gcc ttc gac cga gtc atg 2019 Glu Met Gly Leu Val Ala Gln His Pro Ser Ala Phe Asp Arg Val Met 335 340 345 cgc ctg aac ccc atg gcc atc gac tcg ccc gcc atg gac ttc tcg cgg 2067 Arg Leu Asn Pro Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser Arg 350 355 360 cgg ctc cgc gag ctg gcg ggc aac agc tcc acg ccg ccg ccc gtg tcc 2115 Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val Ser 365 370 375 380 ccg ggc cgc ggc aac cct atg cac cgg ctc ctg aac ccc ttc cag ccc 2163 Pro Gly Arg Gly Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln Pro 385 390 395 agc ccc aag tcc ccg ttc ctg agc acg ccg ccg ctg ccg ccc atg ccc 2211 Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met Pro 400 405 410 cct ggc ggc acg ccg ccc ccg cag ccg cca gcc aag agc aag tcg tgc 2259 Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys 415 420 425 gag ttc tgc ggc aag acc ttc aag ttc cag agc aat ctc atc gtg cac 2307 Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val His 430 435 440 cgg cgc agt cac acg ggc gag aag ccc tac aag tgc cag ctg tgc gac 2355 Arg Arg Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp 445 450 455 460 cac gcg tgc tcg cag gcc agc aag ctc aag cgc cac atg aag acg cac 2403 His Ala Cys Ser Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr His 465 470 475 atg cac aag gcc ggc tcg ctg gcc ggc cgc tcc gac gac ggg ctc tcg 2451 Met His Lys Ala Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser 480 485 490 gcc gcc agc tcc ccc gag ccc ggc acc agc gag ctg gcg ggc gag ggc 2499 Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly 495 500 505 ctc aag gcg gcc gac ggt gac ttc cgc cac cac gag agc gac ccg tcg 2547 Leu Lys Ala Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro Ser 510 515 520 ctg ggc cac gag ccg gag gag gag gac gag gag gag gag gag gag gag 2595 Leu Gly His Glu Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu 525 530 535 540 gag gag ctg cta ctg gag aac gag agc cgg ccc gag tcg agc ttc agc 2643 Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser 545 550 555 atg gac tcg gag ctg agc cgc aac cgc gag aac ggc ggt ggt ggg gtg 2691 Met Asp Ser Glu Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly Val 560 565 570 ccc ggg gtc ccg ggc gcg ggg ggc ggc gcg gcc aag gcg ctg gct gac 2739 Pro Gly Val Pro Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp 575 580 585 gag aag gcg ctg gtg ctg ggc aag gtc atg gag aac gtg ggc cta ggc 2787 Glu Lys Ala Leu Val Leu Gly Lys Val Met Glu Asn Val Gly Leu Gly 590 595 600 gca ctg ccg cag tac ggc gag ctc ctg gcc gac aag cag aag cgc ggc 2835 Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly 605 610 615 620 gcc ttc ctg aag cgt gcg gcg ggc ggc ggg gac gcg ggc gac gac gac 2883 Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp 625 630 635 gac gcg ggc ggc tgc ggg gac gcg ggc gcg ggc ggc gcg gtc aac ggg 2931 Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn Gly 640 645 650 cgc ggg ggc ggc ttc gcg cca ggc acc gag ccc ttc ccc ggg ctc ttc 2979 Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe 655 660 665 ccg cgc aag ccc gcg ccg ctg ccc agc ccc ggg ctc aac agc gcc gcc 3027 Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala 670 675 680 aag cgc atc aag gtg gag aag gac ctg gag ctg ccg ccc gcc gcg ctc 3075 Lys Arg Ile Lys Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu 685 690 695 700 atc ccg tcc gag aac gtg tac tcg cag tgg ctg gtg ggc tac gcg gcg 3123 Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala 705 710 715 tcg cgg cac ttc atg aag gac ccc ttc ctg ggc ttc acg gac gca cga 3171 Ser Arg His Phe Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg 720 725 730 cag tcg ccc ttc gcc acg tcg tcc gag cac tcg tcc gag aac ggc agc 3219 Gln Ser Pro Phe Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly Ser 735 740 745 ctg cgc ttc tcc acg ccg ccc ggg gac ctg ctg gac ggc ggc ctc tcg 3267 Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser 750 755 760 ggc cgc agc ggc acg gcc agc gga ggc agc acc ccg cac ctg ggc ggc 3315 Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly Gly 765 770 775 780 ccg ggc ccc ggg cgg ccc agc tcc aag gag ggc cgc cgc agc gac acg 3363 Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr 785 790 795 tgc gag tac tgc ggc aag gtg ttc aag aac tgc agc aac ttg acg gtg 3411 Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr Val 800 805 810 cac cgg cgg agc cac acc ggc gag cgg cct tac aag tgc gag ctg tgc 3459 His Arg Arg Ser His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys 815 820 825 aac tac gcg tgc gcg cag agc agc aag ctc acg cgc cac atg aag acg 3507 Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys Thr 830 835 840 cac ggg cag atc ggc aag gag gtg tac cgc tgc gac atc tgc cag atg 3555 His Gly Gln Ile Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln Met 845 850 855 860 ccc ttc agc gtc tac agc acc ctg gag aaa cac atg aaa aag tgg cac 3603 Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp His 865 870 875 ggc gag cac ttg ctg act aac gac gtc aaa atc gag cag gcc gag agg 3651 Gly Glu His Leu Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu Arg 880 885 890 agc taa gcgcgcgggc cccggcgccc cgcacctgta cagtggaacc gttgccaacc 3707 Ser gagagaatgc tgacctgact tgcctccgtg tcaccgccac cccgcacccc gcgtgtcccc 3767 ggggcccagg ggaggcggca ctccaaccta acctgtgtct gcgaagtcct atggaaaccc 3827 gagggttgat taaggcagta caaattgtgg agccttttaa ctgtgcaata atttctgtat 3887 ttattgggtt ttgtaatttt tttggcatgt gcaggtactt tttattatta ttttttctgt 3947 ttgaattcct ttaagagatt ttgttgggta tccatccctt ctttgttttt tttttaaccc 4007 ggtagtagcc tgagcaatga ctcgcaagca atgttagagg ggaagcatat cttttaaatt 4067 ataatttggg gggaggggtg gtgctgcttt tttgaaattt aagctaagca tgtgtaattt 4127 cttgtgaaga agccaacact caaatgactt ttaaagttgt ttactttttc attccttcct 4187 tttttttgtc ctgaaataaa aagtggcatg cagttttttt tttaattatt ttttaatttt 4247 tttttttggt ttttgttttt ggggtggggg gtgtggatgt acagcggata acaatctttc 4307 aagtcgtagc actttgtttc agaactggaa tggagatgta gcactcatgt cgtcccgagt 4367 caagcggcct tttctgtgtt gatttcggct ttcatattac ataagggaaa ccttgagtgg 4427 tggtgctggg ggaggcaccc cacagactca gcgccgccag agatagggtt tttggagggc 4487 tcctctggga aatggcccga cagcattctg aggttgtgca tgaccagcag atactatcct 4547 gttggtgtgc cctggggtgc catggctgct attcgctgta gattaggcta cataaaatgg 4607 gctgagggta cctttttggg gagatggggt ggcctgcagt gacacagaaa ggaagaaact 4667 agcggtgttc ttttaggcgt tttctggctt gacggcttct ctcttttttt aaatcacccc 4727 caccacataa atctcaaatc ctatgttgct acaaggggtc atccatcatt tcccaagcag 4787 acgaatgccc taattaattg aagttagtgt tctctcattt aatgcacact gatgatattg 4847 tagggatggg tggggtgggg atcttgcaaa tttctattct cttttactga aaaagcaggg 4907 gatgagttcc atcagaaggt gcccagcgct acttcccagg tttttatttt ttttttccta 4967 tctcattagg ttggaaggta ctaaatattg aactgttaag attagacatt tgaattctgt 5027 tgacccgcac tttaaagctt ttgtttgcat ttaaattaaa tggcttctaa acaagaaatt 5087 gcagcatatt cttctctttg gcccagaggt gggttaaact gtaagggaca gctgagattg 5147 agtgtcagta ttgctaagcg tggcattcac aatactggca ctataaagaa caaaataaaa 5207 taataattta taggacagtt tttctactgc cattcaattt gatgtgagtg ccttgaaaac 5267 tgatcttcct atttgagtct cttgagacaa atgcaaaact ttttttttga aatgaaaaga 5327 ctttttaaaa aagtaaaaca agaaaagtac attctttaga aactaacaaa gccacattta 5387 ctttaagtaa aaaaaaaaaa aattctggtt gaagatagag gatatgaaat gccataagac 5447 ccaatcaaat gaagaaataa acccagcaca accttggaca tccattagct gaattatcct 5507 cagccccttt tgtttttggg acaacgctgc ttagatatgg agtggaggtg atttactgct 5567 gaattaaaac tcaagtgaca caagttacaa gttgatatcg ttgaatgaaa agcaaaacaa 5627 aaacaattca ggaacaacgg ctaatttttt ctaaagttaa atttagtgca ctctgtctta 5687 aaaatacgtt tacagtattg ggtacataca agggtaaaaa aaaaattgtg tgtatgtgtg 5747 ttggagcgat cttttttttt caaagtttgc ttaataggtt atacaaaaat gccacagtgg 5807 ccgcgtgtat attgttttct tttggtgacg gggttttagt atatattata tatattaaaa 5867 tttcttgatt actgtaaaag tggaccagta tttgtaataa tcgagaatgc ctgggcattt 5927 tacaaaacaa gaaaaaaaat acccttttct tttccttgaa aatgttgcag taaaatttaa 5987 atggtgggtc tataaatttg ttcttgttac agtaactgta aagtcggagt tttagtaaat 6047 ttttttctgc cttgggtgtt gaatttttat ttcaaaaaaa atgtatagaa acttgtattt 6107 ggggattcaa aggggattgc tacaccatgt agaaaaagta tgtagaaaaa aagtgcttaa 6167 tattgttatt gctttgcaga aaaaaaaaaa tcacatttct gacctgtact tatttttctc 6227 ttcccgcctc cctctggaat ggatatattg gttggttcat atgatgtagg cacttgctgt 6287 atttttactg gagctcgtaa ttttttaact gtaagcttgt ccttttaaag ggatttaatg 6347 tacctttttg ttagtgaatt tggaaataaa aagaaaaaaa aaacaaaaac aaacaggctg 6407 ccataatata tttttttaat ttggcaggat aaaatattgc aaaaaaaaca catttgtatg 6467 ttaagtccta ttgtacagga gaaaaagggt tgtttgacaa cctttgagaa aaagaaacaa 6527 aaggaagtag ttaaatgctt tggttcacaa atcatttagt tgtatatatt ttttgtcgga 6587 attggcctac acagagaacc gttcgtgttg ggcttctctc tgaacgcccc gaaccttgca 6647 tcaaggctcc ttggtgtggc cacagcagac cagatgggaa attatttgtg ttgagtggaa 6707 aaaaatcagt ttttgtaaag atgtcagtaa cattccacat cgtcctccct ttctctaaga 6767 ggccatctct aagatgtcag atgtagagga gagagagcga gagaacatct tccttctcta 6827 ccatcactcc tgtggcggtc accaccacca cctctcccgc ccttaccagc agaaagcaat 6887 gcaaactgag ctgctttagt ccttgagaaa ttgtgaaaca aacacaaata tcataaaagg 6947 agctggtgat tcagctgggt ccaggtgaag tgacctgctg ttgagaccgg tacaaattgg 7007 atttcaggaa ggagactcca tcacagccag gacctttcgt gccatggaga gtgttggcct 7067 cttgtctttc ttccctgctt tgctgctttg ctctctgaaa cctacattcc gtcagtttcc 7127 gaatgcgagg gcctgggatg aatttggtgc ctttccatat ctcgttctct ctccttcccc 7187 tgcgtttcct ctccatcctt catcctccat tggtcctttt tttttctttc attttttatt 7247 taatttcttt tcttcctgtc tgttcctccc ctaatcctct attttatttt tattttttgt 7307 aaagccaagt agctttaaga taaagtggtg gtcttttgga tgagggaata atgcattttt 7367 aaataaaata ccaatatcag gaagccattt tttatttcag gaaatgtaag aaaccattat 7427 ttcaggttat gaaagtataa ccaagcatcc ttttgggcaa ttccttacca aatgcagaag 7487 cttttctgtt cgatgcactc tttcctcctt gccacttacc tttgcaaagt taaaaaaaag 7547 gggggaggga atgggagaga aagctgagat ttcagtttcc tactgcagtt tcctacctgc 7607 agatccaggg gctgctgttg cctttggatg ccccactgag gtcctagagt gcctccaggg 7667 tggtcttcct gtagtcataa cagctagcca gtgctcacca gcttaccaga ttgccaggac 7727 taagccatcc caaagcacaa gcattgtgtg tctctgtgac tgcagagaag agagaatttt 7787 gcttctgttt tgtgtttaaa aaaccaacac ggaagcagat gatcccgaga gagaggcctc 7847 tagcatgggt gacccagccg acctcaggcc ggtttccgca ctgccacaac tttgttcaaa 7907 gttgccccca attggaacct gccacttggc attagagggt ctttcatggg gagagaagga 7967 gactgaatta ctctaagcaa aatgtgaaaa gtaaggaaat cagcctttca tcccggtcct 8027 aagtaaccgt cagccgaagg tctcgtggaa cacaggcaaa cccgtgattt tggtgctcct 8087 tgtaactcag ccctgcaaag caaagtccca ttgatttaag ttgtttgcat ttgtactggc 8147 aaggcaaaat atttttatta ccttttctat tacttattgt atgagctttt gttgtttact 8207 tggaggtttt gtcttttact acaagtttgg aactatttat tattgcttgg tatttgtgct 8267 ctgtttaaga aacaggcact tttttttatt atggataaaa tgttgagatg acaggaggtc 8327 atttcaatat ggcttagtaa aatatttatt gttcctttat tctctgtaca agattttggg 8387 cctctttttt tccttaatgt cacaatgttg agttcagcat gtgtctgcca tttcatttgt 8447 acgcttgttc aaaaccaagt ttgttctggt ttcaagttat aaaaataaat tggacattta 8507 acttaaaaaa aaaaaaaaaa aaa 8530 <210> 4 <211> 893 <212> PRT <213> Homo sapiens <400> 4 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu 1 5 10 15 Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu Asp 20 25 30 Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val Gly 35 40 45 Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn Phe 50 55 60 Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln Cys 65 70 75 80 Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp Ser 85 90 95 Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro Val 100 105 110 Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu Ser 115 120 125 Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Pro Cys 130 135 140 Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile Ala Ala Ser Ser His 145 150 155 160 Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg Ala Leu Gly Ala Leu 165 170 175 Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala Arg Pro Val Ser Gly 180 185 190 Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala Pro Phe Gly Cys Gln 195 200 205 Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr 210 215 220 Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala Gln 225 230 235 240 Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser 245 250 255 Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala 260 265 270 Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro Phe 275 280 285 Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly Phe 290 295 300 Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro 305 310 315 320 Arg His His Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly Leu 325 330 335 Val Ala Gln His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn Pro 340 345 350 Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg Glu 355 360 365 Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg Gly 370 375 380 Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser 385 390 395 400 Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly Thr 405 410 415 Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly 420 425 430 Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser His 435 440 445 Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys Ser 450 455 460 Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr His Met His Lys Ala 465 470 475 480 Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser 485 490 495 Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala 500 505 510 Asp Gly Asp Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His Glu 515 520 525 Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu 530 535 540 Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser Glu 545 550 555 560 Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val Pro 565 570 575 Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu 580 585 590 Val Leu Gly Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro Gln 595 600 605 Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys 610 615 620 Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly 625 630 635 640 Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly Gly 645 650 655 Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro 660 665 670 Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys 675 680 685 Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu 690 695 700 Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His Phe 705 710 715 720 Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe 725 730 735 Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser 740 745 750 Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly 755 760 765 Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro Gly 770 775 780 Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys 785 790 795 800 Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg Ser 805 810 815 His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys 820 825 830 Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln Ile 835 840 845 Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser Val 850 855 860 Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp His Gly Glu His Leu 865 870 875 880 Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu Arg Ser 885 890 <210> 5 <211> 8320 <212> DNA <213> Homo sapiens <220> <221> 5'UTR <222> (1)..(975) <220> <221> CDS <222> (976)..(3447) <220> <221> 3'UTR <222> (3448)..(8320) <220> <221> polyA#signal <222> (6162)..(6167) <220> <221> polyA#signal <222> (8281)..(8286) <400> 5 atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60 agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120 ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180 ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240 cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300 ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360 gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420 ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480 tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540 taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600 ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660 gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720 ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780 ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840 cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900 ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960 atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu 1 5 10 tcc cag agg gag ctc atc acc cca gag gct gac cat gtg gag gcc gcc 1059 Ser Gln Arg Glu Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala 15 20 25 atc ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg 1107 Ile Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu 30 35 40 ggg ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag 1155 Gly Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln 45 50 55 60 tgt caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac 1203 Cys Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His 65 70 75 aaa agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc 1251 Lys Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala 80 85 90 ctg gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa 1299 Leu Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys 95 100 105 gtg tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat 1347 Val Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp 110 115 120 gac cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac 1395 Asp His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn 125 130 135 140 att gca ggt aaa gat gag cct tcc agc tac att tgc aca aca tgc aag 1443 Ile Ala Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys 145 150 155 cag ccc ttc aac agc gcg tgg ttc ctg ctg cag cac gcg cag aac acg 1491 Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr 160 165 170 cac ggc ttc cgc atc tac ctg gag ccc ggg ccg gcc agc agc tcg ctc 1539 His Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu 175 180 185 acg ccg cgg ctc acc atc ccg ccg ccg ctc ggg ccc gag gcc gtg gcg 1587 Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala 190 195 200 cag tcc ccg ctc atg aat ttc ctg ggc gac agc aac ccc ttc aac ctg 1635 Gln Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu 205 210 215 220 ctg cgc atg acg ggc ccc atc ctg cgg gac cac ccg ggc ttc ggc gag 1683 Leu Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu 225 230 235 ggc cgc ctg ccg ggc acg ccg cct ctc ttc agt ccc ccg ccg cgc cac 1731 Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His 240 245 250 cac ctg gac ccg cac cgc ctc agt gcc gag gag atg ggg ctc gtc gcc 1779 His Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala 255 260 265 cag cac ccc agt gcc ttc gac cga gtc atg cgc ctg aac ccc atg gcc 1827 Gln His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala 270 275 280 atc gac tcg ccc gcc atg gac ttc tcg cgg cgg ctc cgc gag ctg gcg 1875 Ile Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala 285 290 295 300 ggc aac agc tcc acg ccg ccg ccc gtg tcc ccg ggc cgc ggc aac cct 1923 Gly Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro 305 310 315 atg cac cgg ctc ctg aac ccc ttc cag ccc agc ccc aag tcc ccg ttc 1971 Met His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe 320 325 330 ctg agc acg ccg ccg ctg ccg ccc atg ccc cct ggc ggc acg ccg ccc 2019 Leu Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro 335 340 345 ccg cag ccg cca gcc aag agc aag tcg tgc gag ttc tgc ggc aag acc 2067 Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr 350 355 360 ttc aag ttc cag agc aat ctc atc gtg cac cgg cgc agt cac acg ggc 2115 Phe Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser His Thr Gly 365 370 375 380 gag aag ccc tac aag tgc cag ctg tgc gac cac gcg tgc tcg cag gcc 2163 Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala 385 390 395 agc aag ctc aag cgc cac atg aag acg cac atg cac aag gcc ggc tcg 2211 Ser Lys Leu Lys Arg His Met Lys Thr His Met His Lys Ala Gly Ser 400 405 410 ctg gcc ggc cgc tcc gac gac ggg ctc tcg gcc gcc agc tcc ccc gag 2259 Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu 415 420 425 ccc ggc acc agc gag ctg gcg ggc gag ggc ctc aag gcg gcc gac ggt 2307 Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly 430 435 440 gac ttc cgc cac cac gag agc gac ccg tcg ctg ggc cac gag ccg gag 2355 Asp Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu 445 450 455 460 gag gag gac gag gag gag gag gag gag gag gag gag ctg cta ctg gag 2403 Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu 465 470 475 aac gag agc cgg ccc gag tcg agc ttc agc atg gac tcg gag ctg agc 2451 Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser 480 485 490 cgc aac cgc gag aac ggc ggt ggt ggg gtg ccc ggg gtc ccg ggc gcg 2499 Arg Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala 495 500 505 ggg ggc ggc gcg gcc aag gcg ctg gct gac gag aag gcg ctg gtg ctg 2547 Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu 510 515 520 ggc aag gtc atg gag aac gtg ggc cta ggc gca ctg ccg cag tac ggc 2595 Gly Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly 525 530 535 540 gag ctc ctg gcc gac aag cag aag cgc ggc gcc ttc ctg aag cgt gcg 2643 Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala 545 550 555 gcg ggc ggc ggg gac gcg ggc gac gac gac gac gcg ggc ggc tgc ggg 2691 Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly 560 565 570 gac gcg ggc gcg ggc ggc gcg gtc aac ggg cgc ggg ggc ggc ttc gcg 2739 Asp Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala 575 580 585 cca ggc acc gag ccc ttc ccc ggg ctc ttc ccg cgc aag ccc gcg ccg 2787 Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro 590 595 600 ctg ccc agc ccc ggg ctc aac agc gcc gcc aag cgc atc aag gtg gag 2835 Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu 605 610 615 620 aag gac ctg gag ctg ccg ccc gcc gcg ctc atc ccg tcc gag aac gtg 2883 Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val 625 630 635 tac tcg cag tgg ctg gtg ggc tac gcg gcg tcg cgg cac ttc atg aag 2931 Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys 640 645 650 gac ccc ttc ctg ggc ttc acg gac gca cga cag tcg ccc ttc gcc acg 2979 Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr 655 660 665 tcg tcc gag cac tcg tcc gag aac ggc agc ctg cgc ttc tcc acg ccg 3027 Ser Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro 670 675 680 ccc ggg gac ctg ctg gac ggc ggc ctc tcg ggc cgc agc ggc acg gcc 3075 Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala 685 690 695 700 agc gga ggc agc acc ccg cac ctg ggc ggc ccg ggc ccc ggg cgg ccc 3123 Ser Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro 705 710 715 agc tcc aag gag ggc cgc cgc agc gac acg tgc gag tac tgc ggc aag 3171 Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys 720 725 730 gtg ttc aag aac tgc agc aac ttg acg gtg cac cgg cgg agc cac acc 3219 Val Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg Ser His Thr 735 740 745 ggc gag cgg cct tac aag tgc gag ctg tgc aac tac gcg tgc gcg cag 3267 Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln 750 755 760 agc agc aag ctc acg cgc cac atg aag acg cac ggg cag atc ggc aag 3315 Ser Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln Ile Gly Lys 765 770 775 780 gag gtg tac cgc tgc gac atc tgc cag atg ccc ttc agc gtc tac agc 3363 Glu Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser 785 790 795 acc ctg gag aaa cac atg aaa aag tgg cac ggc gag cac ttg ctg act 3411 Thr Leu Glu Lys His Met Lys Lys Trp His Gly Glu His Leu Leu Thr 800 805 810 aac gac gtc aaa atc gag cag gcc gag agg agc taa gcgcgcgggc 3457 Asn Asp Val Lys Ile Glu Gln Ala Glu Arg Ser 815 820 cccggcgccc cgcacctgta cagtggaacc gttgccaacc gagagaatgc tgacctgact 3517 tgcctccgtg tcaccgccac cccgcacccc gcgtgtcccc ggggcccagg ggaggcggca 3577 ctccaaccta acctgtgtct gcgaagtcct atggaaaccc gagggttgat taaggcagta 3637 caaattgtgg agccttttaa ctgtgcaata atttctgtat ttattgggtt ttgtaatttt 3697 tttggcatgt gcaggtactt tttattatta ttttttctgt ttgaattcct ttaagagatt 3757 ttgttgggta tccatccctt ctttgttttt tttttaaccc ggtagtagcc tgagcaatga 3817 ctcgcaagca atgttagagg ggaagcatat cttttaaatt ataatttggg gggaggggtg 3877 gtgctgcttt tttgaaattt aagctaagca tgtgtaattt cttgtgaaga agccaacact 3937 caaatgactt ttaaagttgt ttactttttc attccttcct tttttttgtc ctgaaataaa 3997 aagtggcatg cagttttttt tttaattatt ttttaatttt tttttttggt ttttgttttt 4057 ggggtggggg gtgtggatgt acagcggata acaatctttc aagtcgtagc actttgtttc 4117 agaactggaa tggagatgta gcactcatgt cgtcccgagt caagcggcct tttctgtgtt 4177 gatttcggct ttcatattac ataagggaaa ccttgagtgg tggtgctggg ggaggcaccc 4237 cacagactca gcgccgccag agatagggtt tttggagggc tcctctggga aatggcccga 4297 cagcattctg aggttgtgca tgaccagcag atactatcct gttggtgtgc cctggggtgc 4357 catggctgct attcgctgta gattaggcta cataaaatgg gctgagggta cctttttggg 4417 gagatggggt ggcctgcagt gacacagaaa ggaagaaact agcggtgttc ttttaggcgt 4477 tttctggctt gacggcttct ctcttttttt aaatcacccc caccacataa atctcaaatc 4537 ctatgttgct acaaggggtc atccatcatt tcccaagcag acgaatgccc taattaattg 4597 aagttagtgt tctctcattt aatgcacact gatgatattg tagggatggg tggggtgggg 4657 atcttgcaaa tttctattct cttttactga aaaagcaggg gatgagttcc atcagaaggt 4717 gcccagcgct acttcccagg tttttatttt ttttttccta tctcattagg ttggaaggta 4777 ctaaatattg aactgttaag attagacatt tgaattctgt tgacccgcac tttaaagctt 4837 ttgtttgcat ttaaattaaa tggcttctaa acaagaaatt gcagcatatt cttctctttg 4897 gcccagaggt gggttaaact gtaagggaca gctgagattg agtgtcagta ttgctaagcg 4957 tggcattcac aatactggca ctataaagaa caaaataaaa taataattta taggacagtt 5017 tttctactgc cattcaattt gatgtgagtg ccttgaaaac tgatcttcct atttgagtct 5077 cttgagacaa atgcaaaact ttttttttga aatgaaaaga ctttttaaaa aagtaaaaca 5137 agaaaagtac attctttaga aactaacaaa gccacattta ctttaagtaa aaaaaaaaaa 5197 aattctggtt gaagatagag gatatgaaat gccataagac ccaatcaaat gaagaaataa 5257 acccagcaca accttggaca tccattagct gaattatcct cagccccttt tgtttttggg 5317 acaacgctgc ttagatatgg agtggaggtg atttactgct gaattaaaac tcaagtgaca 5377 caagttacaa gttgatatcg ttgaatgaaa agcaaaacaa aaacaattca ggaacaacgg 5437 ctaatttttt ctaaagttaa atttagtgca ctctgtctta aaaatacgtt tacagtattg 5497 ggtacataca agggtaaaaa aaaaattgtg tgtatgtgtg ttggagcgat cttttttttt 5557 caaagtttgc ttaataggtt atacaaaaat gccacagtgg ccgcgtgtat attgttttct 5617 tttggtgacg gggttttagt atatattata tatattaaaa tttcttgatt actgtaaaag 5677 tggaccagta tttgtaataa tcgagaatgc ctgggcattt tacaaaacaa gaaaaaaaat 5737 acccttttct tttccttgaa aatgttgcag taaaatttaa atggtgggtc tataaatttg 5797 ttcttgttac agtaactgta aagtcggagt tttagtaaat ttttttctgc cttgggtgtt 5857 gaatttttat ttcaaaaaaa atgtatagaa acttgtattt ggggattcaa aggggattgc 5917 tacaccatgt agaaaaagta tgtagaaaaa aagtgcttaa tattgttatt gctttgcaga 5977 aaaaaaaaaa tcacatttct gacctgtact tatttttctc ttcccgcctc cctctggaat 6037 ggatatattg gttggttcat atgatgtagg cacttgctgt atttttactg gagctcgtaa 6097 ttttttaact gtaagcttgt ccttttaaag ggatttaatg tacctttttg ttagtgaatt 6157 tggaaataaa aagaaaaaaa aaacaaaaac aaacaggctg ccataatata tttttttaat 6217 ttggcaggat aaaatattgc aaaaaaaaca catttgtatg ttaagtccta ttgtacagga 6277 gaaaaagggt tgtttgacaa cctttgagaa aaagaaacaa aaggaagtag ttaaatgctt 6337 tggttcacaa atcatttagt tgtatatatt ttttgtcgga attggcctac acagagaacc 6397 gttcgtgttg ggcttctctc tgaacgcccc gaaccttgca tcaaggctcc ttggtgtggc 6457 cacagcagac cagatgggaa attatttgtg ttgagtggaa aaaaatcagt ttttgtaaag 6517 atgtcagtaa cattccacat cgtcctccct ttctctaaga ggccatctct aagatgtcag 6577 atgtagagga gagagagcga gagaacatct tccttctcta ccatcactcc tgtggcggtc 6637 accaccacca cctctcccgc ccttaccagc agaaagcaat gcaaactgag ctgctttagt 6697 ccttgagaaa ttgtgaaaca aacacaaata tcataaaagg agctggtgat tcagctgggt 6757 ccaggtgaag tgacctgctg ttgagaccgg tacaaattgg atttcaggaa ggagactcca 6817 tcacagccag gacctttcgt gccatggaga gtgttggcct cttgtctttc ttccctgctt 6877 tgctgctttg ctctctgaaa cctacattcc gtcagtttcc gaatgcgagg gcctgggatg 6937 aatttggtgc ctttccatat ctcgttctct ctccttcccc tgcgtttcct ctccatcctt 6997 catcctccat tggtcctttt tttttctttc attttttatt taatttcttt tcttcctgtc 7057 tgttcctccc ctaatcctct attttatttt tattttttgt aaagccaagt agctttaaga 7117 taaagtggtg gtcttttgga tgagggaata atgcattttt aaataaaata ccaatatcag 7177 gaagccattt tttatttcag gaaatgtaag aaaccattat ttcaggttat gaaagtataa 7237 ccaagcatcc ttttgggcaa ttccttacca aatgcagaag cttttctgtt cgatgcactc 7297 tttcctcctt gccacttacc tttgcaaagt taaaaaaaag gggggaggga atgggagaga 7357 aagctgagat ttcagtttcc tactgcagtt tcctacctgc agatccaggg gctgctgttg 7417 cctttggatg ccccactgag gtcctagagt gcctccaggg tggtcttcct gtagtcataa 7477 cagctagcca gtgctcacca gcttaccaga ttgccaggac taagccatcc caaagcacaa 7537 gcattgtgtg tctctgtgac tgcagagaag agagaatttt gcttctgttt tgtgtttaaa 7597 aaaccaacac ggaagcagat gatcccgaga gagaggcctc tagcatgggt gacccagccg 7657 acctcaggcc ggtttccgca ctgccacaac tttgttcaaa gttgccccca attggaacct 7717 gccacttggc attagagggt ctttcatggg gagagaagga gactgaatta ctctaagcaa 7777 aatgtgaaaa gtaaggaaat cagcctttca tcccggtcct aagtaaccgt cagccgaagg 7837 tctcgtggaa cacaggcaaa cccgtgattt tggtgctcct tgtaactcag ccctgcaaag 7897 caaagtccca ttgatttaag ttgtttgcat ttgtactggc aaggcaaaat atttttatta 7957 ccttttctat tacttattgt atgagctttt gttgtttact tggaggtttt gtcttttact 8017 acaagtttgg aactatttat tattgcttgg tatttgtgct ctgtttaaga aacaggcact 8077 tttttttatt atggataaaa tgttgagatg acaggaggtc atttcaatat ggcttagtaa 8137 aatatttatt gttcctttat tctctgtaca agattttggg cctctttttt tccttaatgt 8197 cacaatgttg agttcagcat gtgtctgcca tttcatttgt acgcttgttc aaaaccaagt 8257 ttgttctggt ttcaagttat aaaaataaat tggacattta acttaaaaaa aaaaaaaaaa 8317 aaa 8320 <210> 6 <211> 823 <212> PRT <213> Homo sapiens <400> 6 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu 1 5 10 15 Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu 20 25 30 Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val 35 40 45 Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn 50 55 60 Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln 65 70 75 80 Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp 85 90 95 Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro 100 105 110 Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu 115 120 125 Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Lys 130 135 140 Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn 145 150 155 160 Ser Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr His Gly Phe Arg 165 170 175 Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu 180 185 190 Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala Gln Ser Pro Leu 195 200 205 Met Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu Leu Arg Met Thr 210 215 220 Gly Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu Gly Arg Leu Pro 225 230 235 240 Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His His Leu Asp Pro 245 250 255 His Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala Gln His Pro Ser 260 265 270 Ala Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala Ile Asp Ser Pro 275 280 285 Ala Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser 290 295 300 Thr Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro Met His Arg Leu 305 310 315 320 Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro 325 330 335 Pro Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro 340 345 350 Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln 355 360 365 Ser Asn Leu Ile Val His Arg Arg Ser His Thr Gly Glu Lys Pro Tyr 370 375 380 Lys Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala Ser Lys Leu Lys 385 390 395 400 Arg His Met Lys Thr His Met His Lys Ala Gly Ser Leu Ala Gly Arg 405 410 415 Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser 420 425 430 Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly Asp Phe Arg His 435 440 445 His Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu Glu Glu Asp Glu 450 455 460 Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg 465 470 475 480 Pro Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser Arg Asn Arg Glu 485 490 495 Asn Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala Gly Gly Gly Ala 500 505 510 Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu Gly Lys Val Met 515 520 525 Glu Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala 530 535 540 Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly 545 550 555 560 Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala 565 570 575 Gly Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu 580 585 590 Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro 595 600 605 Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu Lys Asp Leu Glu 610 615 620 Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp 625 630 635 640 Leu Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys Asp Pro Phe Leu 645 650 655 Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr Ser Ser Glu His 660 665 670 Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu 675 680 685 Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser 690 695 700 Thr Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu 705 710 715 720 Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn 725 730 735 Cys Ser Asn Leu Thr Val His Arg Arg Ser His Thr Gly Glu Arg Pro 740 745 750 Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu 755 760 765 Thr Arg His Met Lys Thr His Gly Gln Ile Gly Lys Glu Val Tyr Arg 770 775 780 Cys Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys 785 790 795 800 His Met Lys Lys Trp His Gly Glu His Leu Leu Thr Asn Asp Val Lys 805 810 815 Ile Glu Gln Ala Glu Arg Ser 820 <210> 7 <211> 8317 <212> DNA <213> Homo sapiens <220> <221> 5'UTR <222> (1)..(975) <220> <221> CDS <222> (976)..(3444) <220> <221> 3'UTR <222> (3445)..(8317) <220> <221> polyA#signal <222> (6159)..(6164) <220> <221> polyA#signal <222> (8278)..(8283) <400> 7 atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60 agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120 ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180 ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240 cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300 ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360 gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420 ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480 tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540 taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600 ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660 gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720 ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780 ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840 cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900 ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960 atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu 1 5 10 tcc cag agg gag ctc atc acc cag gct gac cat gtg gag gcc gcc atc 1059 Ser Gln Arg Glu Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile 15 20 25 ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg ggg 1107 Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly 30 35 40 ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag tgt 1155 Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys 45 50 55 60 caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac aaa 1203 Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys 65 70 75 agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc ctg 1251 Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu 80 85 90 gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa gtg 1299 Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val 95 100 105 tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat gac 1347 Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp 110 115 120 cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac att 1395 His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile 125 130 135 140 gca ggt aaa gat gag cct tcc agc tac att tgc aca aca tgc aag cag 1443 Ala Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys Gln 145 150 155 ccc ttc aac agc gcg tgg ttc ctg ctg cag cac gcg cag aac acg cac 1491 Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr His 160 165 170 ggc ttc cgc atc tac ctg gag ccc ggg ccg gcc agc agc tcg ctc acg 1539 Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu Thr 175 180 185 ccg cgg ctc acc atc ccg ccg ccg ctc ggg ccc gag gcc gtg gcg cag 1587 Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala Gln 190 195 200 tcc ccg ctc atg aat ttc ctg ggc gac agc aac ccc ttc aac ctg ctg 1635 Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu Leu 205 210 215 220 cgc atg acg ggc ccc atc ctg cgg gac cac ccg ggc ttc ggc gag ggc 1683 Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu Gly 225 230 235 cgc ctg ccg ggc acg ccg cct ctc ttc agt ccc ccg ccg cgc cac cac 1731 Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His His 240 245 250 ctg gac ccg cac cgc ctc agt gcc gag gag atg ggg ctc gtc gcc cag 1779 Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala Gln 255 260 265 cac ccc agt gcc ttc gac cga gtc atg cgc ctg aac ccc atg gcc atc 1827 His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala Ile 270 275 280 gac tcg ccc gcc atg gac ttc tcg cgg cgg ctc cgc gag ctg gcg ggc 1875 Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala Gly 285 290 295 300 aac agc tcc acg ccg ccg ccc gtg tcc ccg ggc cgc ggc aac cct atg 1923 Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro Met 305 310 315 cac cgg ctc ctg aac ccc ttc cag ccc agc ccc aag tcc ccg ttc ctg 1971 His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe Leu 320 325 330 agc acg ccg ccg ctg ccg ccc atg ccc cct ggc ggc acg ccg ccc ccg 2019 Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro Pro 335 340 345 cag ccg cca gcc aag agc aag tcg tgc gag ttc tgc ggc aag acc ttc 2067 Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr Phe 350 355 360 aag ttc cag agc aat ctc atc gtg cac cgg cgc agt cac acg ggc gag 2115 Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser His Thr Gly Glu 365 370 375 380 aag ccc tac aag tgc cag ctg tgc gac cac gcg tgc tcg cag gcc agc 2163 Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala Ser 385 390 395 aag ctc aag cgc cac atg aag acg cac atg cac aag gcc ggc tcg ctg 2211 Lys Leu Lys Arg His Met Lys Thr His Met His Lys Ala Gly Ser Leu 400 405 410 gcc ggc cgc tcc gac gac ggg ctc tcg gcc gcc agc tcc ccc gag ccc 2259 Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu Pro 415 420 425 ggc acc agc gag ctg gcg ggc gag ggc ctc aag gcg gcc gac ggt gac 2307 Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly Asp 430 435 440 ttc cgc cac cac gag agc gac ccg tcg ctg ggc cac gag ccg gag gag 2355 Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu Glu 445 450 455 460 gag gac gag gag gag gag gag gag gag gag gag ctg cta ctg gag aac 2403 Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu Asn 465 470 475 gag agc cgg ccc gag tcg agc ttc agc atg gac tcg gag ctg agc cgc 2451 Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser Arg 480 485 490 aac cgc gag aac ggc ggt ggt ggg gtg ccc ggg gtc ccg ggc gcg ggg 2499 Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala Gly 495 500 505 ggc ggc gcg gcc aag gcg ctg gct gac gag aag gcg ctg gtg ctg ggc 2547 Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu Gly 510 515 520 aag gtc atg gag aac gtg ggc cta ggc gca ctg ccg cag tac ggc gag 2595 Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly Glu 525 530 535 540 ctc ctg gcc gac aag cag aag cgc ggc gcc ttc ctg aag cgt gcg gcg 2643 Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala Ala 545 550 555 ggc ggc ggg gac gcg ggc gac gac gac gac gcg ggc ggc tgc ggg gac 2691 Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly Asp 560 565 570 gcg ggc gcg ggc ggc gcg gtc aac ggg cgc ggg ggc ggc ttc gcg cca 2739 Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala Pro 575 580 585 ggc acc gag ccc ttc ccc ggg ctc ttc ccg cgc aag ccc gcg ccg ctg 2787 Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro Leu 590 595 600 ccc agc ccc ggg ctc aac agc gcc gcc aag cgc atc aag gtg gag aag 2835 Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu Lys 605 610 615 620 gac ctg gag ctg ccg ccc gcc gcg ctc atc ccg tcc gag aac gtg tac 2883 Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val Tyr 625 630 635 tcg cag tgg ctg gtg ggc tac gcg gcg tcg cgg cac ttc atg aag gac 2931 Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys Asp 640 645 650 ccc ttc ctg ggc ttc acg gac gca cga cag tcg ccc ttc gcc acg tcg 2979 Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr Ser 655 660 665 tcc gag cac tcg tcc gag aac ggc agc ctg cgc ttc tcc acg ccg ccc 3027 Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro Pro 670 675 680 ggg gac ctg ctg gac ggc ggc ctc tcg ggc cgc agc ggc acg gcc agc 3075 Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala Ser 685 690 695 700 gga ggc agc acc ccg cac ctg ggc ggc ccg ggc ccc ggg cgg ccc agc 3123 Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro Ser 705 710 715 tcc aag gag ggc cgc cgc agc gac acg tgc gag tac tgc ggc aag gtg 3171 Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys Val 720 725 730 ttc aag aac tgc agc aac ttg acg gtg cac cgg cgg agc cac acc ggc 3219 Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg Ser His Thr Gly 735 740 745 gag cgg cct tac aag tgc gag ctg tgc aac tac gcg tgc gcg cag agc 3267 Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln Ser 750 755 760 agc aag ctc acg cgc cac atg aag acg cac ggg cag atc ggc aag gag 3315 Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln Ile Gly Lys Glu 765 770 775 780 gtg tac cgc tgc gac atc tgc cag atg ccc ttc agc gtc tac agc acc 3363 Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser Thr 785 790 795 ctg gag aaa cac atg aaa aag tgg cac ggc gag cac ttg ctg act aac 3411 Leu Glu Lys His Met Lys Lys Trp His Gly Glu His Leu Leu Thr Asn 800 805 810 gac gtc aaa atc gag cag gcc gag agg agc taa gcgcgcgggc cccggcgccc 3464 Asp Val Lys Ile Glu Gln Ala Glu Arg Ser 815 820 cgcacctgta cagtggaacc gttgccaacc gagagaatgc tgacctgact tgcctccgtg 3524 tcaccgccac cccgcacccc gcgtgtcccc ggggcccagg ggaggcggca ctccaaccta 3584 acctgtgtct gcgaagtcct atggaaaccc gagggttgat taaggcagta caaattgtgg 3644 agccttttaa ctgtgcaata atttctgtat ttattgggtt ttgtaatttt tttggcatgt 3704 gcaggtactt tttattatta ttttttctgt ttgaattcct ttaagagatt ttgttgggta 3764 tccatccctt ctttgttttt tttttaaccc ggtagtagcc tgagcaatga ctcgcaagca 3824 atgttagagg ggaagcatat cttttaaatt ataatttggg gggaggggtg gtgctgcttt 3884 tttgaaattt aagctaagca tgtgtaattt cttgtgaaga agccaacact caaatgactt 3944 ttaaagttgt ttactttttc attccttcct tttttttgtc ctgaaataaa aagtggcatg 4004 cagttttttt tttaattatt ttttaatttt tttttttggt ttttgttttt ggggtggggg 4064 gtgtggatgt acagcggata acaatctttc aagtcgtagc actttgtttc agaactggaa 4124 tggagatgta gcactcatgt cgtcccgagt caagcggcct tttctgtgtt gatttcggct 4184 ttcatattac ataagggaaa ccttgagtgg tggtgctggg ggaggcaccc cacagactca 4244 gcgccgccag agatagggtt tttggagggc tcctctggga aatggcccga cagcattctg 4304 aggttgtgca tgaccagcag atactatcct gttggtgtgc cctggggtgc catggctgct 4364 attcgctgta gattaggcta cataaaatgg gctgagggta cctttttggg gagatggggt 4424 ggcctgcagt gacacagaaa ggaagaaact agcggtgttc ttttaggcgt tttctggctt 4484 gacggcttct ctcttttttt aaatcacccc caccacataa atctcaaatc ctatgttgct 4544 acaaggggtc atccatcatt tcccaagcag acgaatgccc taattaattg aagttagtgt 4604 tctctcattt aatgcacact gatgatattg tagggatggg tggggtgggg atcttgcaaa 4664 tttctattct cttttactga aaaagcaggg gatgagttcc atcagaaggt gcccagcgct 4724 acttcccagg tttttatttt ttttttccta tctcattagg ttggaaggta ctaaatattg 4784 aactgttaag attagacatt tgaattctgt tgacccgcac tttaaagctt ttgtttgcat 4844 ttaaattaaa tggcttctaa acaagaaatt gcagcatatt cttctctttg gcccagaggt 4904 gggttaaact gtaagggaca gctgagattg agtgtcagta ttgctaagcg tggcattcac 4964 aatactggca ctataaagaa caaaataaaa taataattta taggacagtt tttctactgc 5024 cattcaattt gatgtgagtg ccttgaaaac tgatcttcct atttgagtct cttgagacaa 5084 atgcaaaact ttttttttga aatgaaaaga ctttttaaaa aagtaaaaca agaaaagtac 5144 attctttaga aactaacaaa gccacattta ctttaagtaa aaaaaaaaaa aattctggtt 5204 gaagatagag gatatgaaat gccataagac ccaatcaaat gaagaaataa acccagcaca 5264 accttggaca tccattagct gaattatcct cagccccttt tgtttttggg acaacgctgc 5324 ttagatatgg agtggaggtg atttactgct gaattaaaac tcaagtgaca caagttacaa 5384 gttgatatcg ttgaatgaaa agcaaaacaa aaacaattca ggaacaacgg ctaatttttt 5444 ctaaagttaa atttagtgca ctctgtctta aaaatacgtt tacagtattg ggtacataca 5504 agggtaaaaa aaaaattgtg tgtatgtgtg ttggagcgat cttttttttt caaagtttgc 5564 ttaataggtt atacaaaaat gccacagtgg ccgcgtgtat attgttttct tttggtgacg 5624 gggttttagt atatattata tatattaaaa tttcttgatt actgtaaaag tggaccagta 5684 tttgtaataa tcgagaatgc ctgggcattt tacaaaacaa gaaaaaaaat acccttttct 5744 tttccttgaa aatgttgcag taaaatttaa atggtgggtc tataaatttg ttcttgttac 5804 agtaactgta aagtcggagt tttagtaaat ttttttctgc cttgggtgtt gaatttttat 5864 ttcaaaaaaa atgtatagaa acttgtattt ggggattcaa aggggattgc tacaccatgt 5924 agaaaaagta tgtagaaaaa aagtgcttaa tattgttatt gctttgcaga aaaaaaaaaa 5984 tcacatttct gacctgtact tatttttctc ttcccgcctc cctctggaat ggatatattg 6044 gttggttcat atgatgtagg cacttgctgt atttttactg gagctcgtaa ttttttaact 6104 gtaagcttgt ccttttaaag ggatttaatg tacctttttg ttagtgaatt tggaaataaa 6164 aagaaaaaaa aaacaaaaac aaacaggctg ccataatata tttttttaat ttggcaggat 6224 aaaatattgc aaaaaaaaca catttgtatg ttaagtccta ttgtacagga gaaaaagggt 6284 tgtttgacaa cctttgagaa aaagaaacaa aaggaagtag ttaaatgctt tggttcacaa 6344 atcatttagt tgtatatatt ttttgtcgga attggcctac acagagaacc gttcgtgttg 6404 ggcttctctc tgaacgcccc gaaccttgca tcaaggctcc ttggtgtggc cacagcagac 6464 cagatgggaa attatttgtg ttgagtggaa aaaaatcagt ttttgtaaag atgtcagtaa 6524 cattccacat cgtcctccct ttctctaaga ggccatctct aagatgtcag atgtagagga 6584 gagagagcga gagaacatct tccttctcta ccatcactcc tgtggcggtc accaccacca 6644 cctctcccgc ccttaccagc agaaagcaat gcaaactgag ctgctttagt ccttgagaaa 6704 ttgtgaaaca aacacaaata tcataaaagg agctggtgat tcagctgggt ccaggtgaag 6764 tgacctgctg ttgagaccgg tacaaattgg atttcaggaa ggagactcca tcacagccag 6824 gacctttcgt gccatggaga gtgttggcct cttgtctttc ttccctgctt tgctgctttg 6884 ctctctgaaa cctacattcc gtcagtttcc gaatgcgagg gcctgggatg aatttggtgc 6944 ctttccatat ctcgttctct ctccttcccc tgcgtttcct ctccatcctt catcctccat 7004 tggtcctttt tttttctttc attttttatt taatttcttt tcttcctgtc tgttcctccc 7064 ctaatcctct attttatttt tattttttgt aaagccaagt agctttaaga taaagtggtg 7124 gtcttttgga tgagggaata atgcattttt aaataaaata ccaatatcag gaagccattt 7184 tttatttcag gaaatgtaag aaaccattat ttcaggttat gaaagtataa ccaagcatcc 7244 ttttgggcaa ttccttacca aatgcagaag cttttctgtt cgatgcactc tttcctcctt 7304 gccacttacc tttgcaaagt taaaaaaaag gggggaggga atgggagaga aagctgagat 7364 ttcagtttcc tactgcagtt tcctacctgc agatccaggg gctgctgttg cctttggatg 7424 ccccactgag gtcctagagt gcctccaggg tggtcttcct gtagtcataa cagctagcca 7484 gtgctcacca gcttaccaga ttgccaggac taagccatcc caaagcacaa gcattgtgtg 7544 tctctgtgac tgcagagaag agagaatttt gcttctgttt tgtgtttaaa aaaccaacac 7604 ggaagcagat gatcccgaga gagaggcctc tagcatgggt gacccagccg acctcaggcc 7664 ggtttccgca ctgccacaac tttgttcaaa gttgccccca attggaacct gccacttggc 7724 attagagggt ctttcatggg gagagaagga gactgaatta ctctaagcaa aatgtgaaaa 7784 gtaaggaaat cagcctttca tcccggtcct aagtaaccgt cagccgaagg tctcgtggaa 7844 cacaggcaaa cccgtgattt tggtgctcct tgtaactcag ccctgcaaag caaagtccca 7904 ttgatttaag ttgtttgcat ttgtactggc aaggcaaaat atttttatta ccttttctat 7964 tacttattgt atgagctttt gttgtttact tggaggtttt gtcttttact acaagtttgg 8024 aactatttat tattgcttgg tatttgtgct ctgtttaaga aacaggcact tttttttatt 8084 atggataaaa tgttgagatg acaggaggtc atttcaatat ggcttagtaa aatatttatt 8144 gttcctttat tctctgtaca agattttggg cctctttttt tccttaatgt cacaatgttg 8204 agttcagcat gtgtctgcca tttcatttgt acgcttgttc aaaaccaagt ttgttctggt 8264 ttcaagttat aaaaataaat tggacattta acttaaaaaa aaaaaaaaaa aaa 8317 <210> 8 <211> 822 <212> PRT <213> Homo sapiens <400> 8 Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu 1 5 10 15 Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu Asp 20 25 30 Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val Gly 35 40 45 Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn Phe 50 55 60 Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln Cys 65 70 75 80 Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp Ser 85 90 95 Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro Val 100 105 110 Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu Ser 115 120 125 Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Lys Asp 130 135 140 Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn Ser 145 150 155 160 Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr His Gly Phe Arg Ile 165 170 175 Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu Thr 180 185 190 Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala Gln Ser Pro Leu Met 195 200 205 Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu Leu Arg Met Thr Gly 210 215 220 Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu Gly Arg Leu Pro Gly 225 230 235 240 Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His His Leu Asp Pro His 245 250 255 Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala Gln His Pro Ser Ala 260 265 270 Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala Ile Asp Ser Pro Ala 275 280 285 Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser Thr 290 295 300 Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro Met His Arg Leu Leu 305 310 315 320 Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro Pro 325 330 335 Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro Ala 340 345 350 Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln Ser 355 360 365 Asn Leu Ile Val His Arg Arg Ser His Thr Gly Glu Lys Pro Tyr Lys 370 375 380 Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala Ser Lys Leu Lys Arg 385 390 395 400 His Met Lys Thr His Met His Lys Ala Gly Ser Leu Ala Gly Arg Ser 405 410 415 Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser Glu 420 425 430 Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly Asp Phe Arg His His 435 440 445 Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu Glu Glu Asp Glu Glu 450 455 460 Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg Pro 465 470 475 480 Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser Arg Asn Arg Glu Asn 485 490 495 Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala Gly Gly Gly Ala Ala 500 505 510 Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu Gly Lys Val Met Glu 515 520 525 Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala Asp 530 535 540 Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly Asp 545 550 555 560 Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala Gly 565 570 575 Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu Pro 580 585 590 Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro Gly 595 600 605 Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu Lys Asp Leu Glu Leu 610 615 620 Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp Leu 625 630 635 640 Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys Asp Pro Phe Leu Gly 645 650 655 Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr Ser Ser Glu His Ser 660 665 670 Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu Leu 675 680 685 Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser Thr 690 695 700 Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu Gly 705 710 715 720 Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn Cys 725 730 735 Ser Asn Leu Thr Val His Arg Arg Ser His Thr Gly Glu Arg Pro Tyr 740 745 750 Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu Thr 755 760 765 Arg His Met Lys Thr His Gly Gln Ile Gly Lys Glu Val Tyr Arg Cys 770 775 780 Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys His 785 790 795 800 Met Lys Lys Trp His Gly Glu His Leu Leu Thr Asn Asp Val Lys Ile 805 810 815 Glu Gln Ala Glu Arg Ser 820 <210> 9 <211> 9578 <212> DNA <213> Homo sapiens <220> <221> exon <222> (5159)..(6223) <400> 9 gaattcaaac tcacggatat gtgtgtgtct tcaaaacaga gctctcagca tcttcaggaa 60 aacggtcttc cttgcagttt cagttacaca atttggagac tcagtgacaa aagagaaagc 120 agcagagaga cccttttgca taacacacac acacacacac acacacacac acaaacacac 180 acgtgcactc acaccacagc cgctcggatc tctgtatatg tgaggggtgg gggtggaatt 240 tggtgcagtc tgatcatctt catgaacgat atttctccca agtcgaccaa ctgggtgatg 300 ccagtcccta ccaaatttga attgatgact caactaaaga attaaaatta gcaagacaag 360 aaaattccaa atgaggtgag aaagctgtag aaatagttcc agatccccta gtactgagcc 420 attcaatatc atttctgatg acagggacag agctaggaac attcaatgtg ggtgtgagtc 480 cttttcatat acggggagct gggtaagtat tttttaagga aaataataca tgaatcagga 540 acagtgaatt ttatttaacc ccttgcaggc tgcagataca aaggcagccg gcaatgatgc 600 ctcagttttc ctacagctta cctatgcctt atacagttaa gcaacggtca gaaatgtact 660 actgtatcaa ggccaggtat tacttgcaga aaaaaataag gtgccaatga tgtcatgttt 720 taacaaaagc aatgttgtta aattcagtac accaaaagaa tcaaccaaac aactgttgaa 780 aggcaagttt tgtggtcctg actctgctat caggtgacaa cgtgaaaaac tcctctaaat 840 ccagcaaagc tttaattgag tgcttatggc tcccagaaat ttgctgtaat tttcagaaat 900 gacataaaat aattctagaa gatacagcag gaagcccaaa aaggcctctt ttgtcttttt 960 atgcctctgg atttgatagc tgctaaagat tctagaactg taaggaaagr gataaggacc 1020 accttgggag ccttattaat atgtacataa atatgatttg cttggtgcct ccactgtggt 1080 ttcctcacaa gttagaataa gtccatccac tgatcagatc ggaacatcgt attcatgttc 1140 atcttctcag tcaataacac ttatagatcc ggaggaatag aaatgaacag acaggggttg 1200 cttctgagtc tgccctatac ctgtgaatat gaaacgattt gccctctctg catggttttc 1260 ttcttcttct tcttcttctt cttctttgtt ttaaagcacc aaaaatgaag cccaaagtaa 1320 tttggtaaga tgtgctgttg aattgctaca aagttgactg cgtttcagag ggtggatctg 1380 tgttaaaaag aaaacaacaa aaacaaatga aatgtcagtt ttctttctgc agaaacatta 1440 ggacttccca tttctactga cacgtcctta tcttgattct ttccaaattt ttgtaaagac 1500 ataagagata aaatataaca gctcagaagg caaagataac attgtaggat ctcgaataga 1560 gtccaacctc agctgagtta agtattgaga atcgttcaaa gaattttaaa caaaaagcct 1620 ggcttggggg tcacgtgtct gtttaatctg cccccactgc atggtgtgtt acacgcagca 1680 cacacaggga attaaagccc cacataaggt taataaaaat gcactctgat ttgatgaaat 1740 gatttctgat ttctgaacta ttcctctata aagaaattta aagtgactga gaatatggag 1800 gattatctgc tggaatgcac tgtgaagcta gaaaaagaat agcagggaaa tatttgtgag 1860 ttcaaaaagc tttttgacat ctgctctgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgta 1920 aagatagtgc agaaaaggtg gcatttattt ccatgtgatt ccagcatgca caaagcccca 1980 gctttgggcc cagcacacag taggtctgca gcaggtgcta gagaaatgaa cctggtttta 2040 agatattagt tcaggaccac atttggaccc acactttttc cttttacatt ttcatatgtg 2100 agccacctgc accctctttt ttgggggtgg ggagggggca ggagtgactt gtattttaaa 2160 caaaggtttg gtgaagaaga ggtggggtgg ggtgcggtgg ggcggtgcag tgaccttctc 2220 aggagagtcc tgaagccccc tctcgcctgc ctggggtgct gaggcagggg tgggtacatg 2280 gctgtgggcc gaggtcgacc acccccctcc cgccccgcct gctgtctggg catctagaga 2340 gtggggaaac attagtacgg gccagctgcg gaagcctggc agggtcgagg gagaggtcaa 2400 ggtcggccga gaggcggcta ttgatccggc ttggaacgtg agacatggag cgcagcaaga 2460 ctaaaggggg agctgtgaga ccagacatta acagctttgc gcgctgatga ggcccgtgcc 2520 agacgggcag agggaaaaag aggagactgg agtggcagct gggatcgctc cctgcctgcg 2580 cccggccgcc tctcgggaga agaggaggag gaggaggagg rgaaggaggg gragaagrag 2640 gaggaggggg aggaagatgc ggaggaaaag ggggaggagg agggcgaagg ggccggctca 2700 aggctgggca ggggcagagc agcctctccc cggctgccgc gaggtggagc gcgccggcgg 2760 gcggcggcgt gtccggccct gcgtccgccc gcccgcgcgt ccctcttccc gccgtcgggg 2820 cagcgcgggg ccaatgagga agtgctcctc gggtccgtgg ggcacgcgcc ggcccacgcc 2880 agctacttcc tgctgggaag tkgggaggsg gtgccccctc cccaggcacg gccccttacc 2940 gcacgcgggg tggcggctgc agctgggact ccgagagccc ttgcgccgct cgcggagggg 3000 ctcccttttc ctgaggggtc ctccccgtcc cgccttgcca ctggcggggt ctgccttcct 3060 tgtaatcaac cccaggaagg tgagggtcgt gggtcgggat ttcgagtccc ggaccgcggc 3120 ggcgctgggc tgcaggcacg ccgcggtgtt ttgggtccag acctgtccct gacgcgctgt 3180 gtgtcctagg gcaaagtgct caccctctct gggcttcaca tcgctagttc tcagaaagag 3240 agcgcgagtt gatctttcaa atttagagtc cgggcgagta gggatggcca gtttatgaat 3300 gtcttaaaga agtttattaa aggtgcgtgt gggcatattt tttttaagcc actttcctgg 3360 aaagattttc ccggtgagag ggatggcaga agagggaggc cctactagac tttggaccac 3420 gtggaggtgg ggtgttgggg gtgggcagcc gggtgcagcc tgcccggcca gggcgaggag 3480 gtgcaagtcc gcgccccgcc cccggtctcc atccgctcgg cctcgcgtcc gcccaccgtg 3540 gagcccacag tttacagaac tgcaagccag ggcacatttt attgttatta ttttttaggg 3600 tatgggactg gaagggatct ctttctgttc tcgctcacgg actctgggcg ctgttaaatt 3660 gttggtgcca tcgccccacc caagaccttc gggacgaaaa caaaaacccc cgtgtgcccc 3720 ccgaggaaaa ggccccgagg gaggcggcgc tgaggcgtca cggcctcgcc atgcgcccgg 3780 gtgaagccgc cggagccagg cctggggcgg agtggggtgg gtgcagctgg actcgcccgc 3840 gaagcctagc cggagccagg ccccgacccg ccctggccgc ctccagagaa accmtgagaa 3900 gggagaggag gccagcccgt ggcgcgccca gccctggagc cagtcatcaa attgacaaag 3960 ttgccacagc ctgggaatgg gggtgtcacg gggccgtggt ctggccttgt ccccgggcca 4020 cggagaggcc ccacaactcc tcttgtcctc gccggttgga gatcaaacgg ctgacaaggc 4080 agctgcgtcc ttcccagtct gacaggcatt tccaagtcct accctgggcm gaggagcgcg 4140 gggggcgggg tgtgacttcc aggttgctgt gattgtcagg ggcgcctcct ggagtcaccc 4200 acccgagtat ctgcggagat ttggccacac ctactcctgg gctggcaagt ccaagtccct 4260 ctcccacgtg gagcgccccg gtccctttac cctctcgctt gccatagacc cagtttagga 4320 ggtggggtcg tgtttgaccc caggagttaa tcggggtaag gtgaggggag gggacaaaga 4380 tttgagtgaa aatccttttc caagtgggac tcaaacaagg tctcaaacac ttctcacccc 4440 ctcacgtgct cttgattctg ttgtcttagt gtcgtttatt ttgtcatcct caccctccca 4500 gagtctgtaa taccaggatt tatatggaga cactttttgg aagttgaact ccaacatcta 4560 ctcccctccc ctcgccgccc gcgaccataa aacaaaagta aaaactacca agcgactttt 4620 ccagggaaac gaagcgattc ttactgtccc cccaactccc atgtcgaccc caaccctttt 4680 ccacagtcca cgcccccacc cccaaagtcc aagtccgaaa gagcttttgg gtgggtggag 4740 acttgcattg attcaattta gttcactcac acagcacccc gccccccttc tcagggggtc 4800 ctgctcccag gatggaggag atataaggac gatttttctt ttattttaaa ataagctgcc 4860 cagtggcccc ccccaacccc ctcccgctgt tgcgcagccg gggctcgggg gagatgagcg 4920 cacaaaaacg cggtttgcac gtgtgtccgg cttgggctgc gggtgtgcgc aactggcgac 4980 tgtgtgtgtg tgtgtgtgag tgtgcgcgcg cgcgcgagtg tgtctctgtg tgtgctttct 5040 tgttctctta cagggtacaa tgttaaaaag ccaccgctag tcgcccccag tgctccgact 5100 ctctgggtct ttttgtctct agtgcagatt aaacgtcacg tccgcacttg aacttgaatt 5160 ttatcccatt gtacagaggc agccccagcc atagagagac cgagagctcc cagagaaccc 5220 ggactccgcc atcttcacgt tgcaatctat agctcccagt ctgcgcccgc accgacccag 5280 gcgcactggg cgagccgccc ctccgccccg ctccccccgg gcccgcggcg ccaggggagc 5340 gctggggagc gctcgcgggg actcggcagc ccctccgwcc ggcgccagcc tgccaggtga 5400 actgggaagg agcctctcct ggtgtccccc cagagcctcg gaagggtcag tctccgagaa 5460 aaaacaaaaa caaaaacaaa aacaggcagc ccgcagaaaa cccagaaaca accgaaccgg 5520 ggcagtttta cattgctttg ggttttttga gggggcgggg tgagggggta cgagacaagt 5580 ccccaagttt tctttgcttt tttttttcct ttgctttttc ttcttttatt tttttatttg 5640 tttgcatttt ttttcccctc ctggtagaag tgcgctttcc acctaccaga ccctgaaaga 5700 aagtgtcagg agccggtgca aaacccagtt taagttcaag aagacatttg caagtgcaag 5760 aggccaagca gtttgaagaa gtgtaagaga ttttttttcc ttcgaaagaa tatattttta 5820 aagaaaccag ccagtccgcg gaaagcaaca gcagtttttt tttttttttg cctctttttc 5880 ttattttaga tcgagaggtt tttcttgctt ttcttccctt ttttttcttt ttgcaaacaa 5940 aacaaaaaac agcatagaag aaagagcaaa ataaagaaga agaagaggag gaagagaggg 6000 aaagagagga agggaaaaaa aacaccaacc cgggcagagg aggaggtgcg gcggcggcgg 6060 cggcggcggc agcggcggca gcggcgcggc ggcggctcgg accccctccc ccggctcccc 6120 ccatcagtgc agctctccgg cgatgccaga atagatgccg gggcaatgtc ccgccgcaaa 6180 cagggcaacc cgcagcactt gtcccagagg gagctcatca cccgtaagtg tctgcggagt 6240 gcgcgcgagg ggccggagat ggggctccgg gcgtctgggg ctggggacac cgagcccgga 6300 acagccgagc ctggccaggc gccggggccg cccgctggct ggcagagtct acggcgtcgg 6360 cctggagcat ggcggggggc gggggccata graaagtttc tttgcagccc ggggagttgg 6420 ggcgccgagc agccggacgc gcctcgggct cgggggcctg cggacgcggc tccgggccgg 6480 ggagggggca tgcaggctgg aggagtgtgt gtgtgtgcgc gccgagcccg gctggacgct 6540 cgcccctccg agcggcgtgt gtggcggcgg cggcgctggt ggcggggttt ggagaggagg 6600 gggagggggc tgggggagcs ggagggggag ggggagccgg gaagtgggga aaagttggcg 6660 agcgcgtggg tccgcgctga cggcgcgggc ggaggagagc ggggtgcgtt ccggctgggg 6720 gagccgtagg ccagggcggc gcaccgcggc cgcggctccg ggtccccggt ccctgcgccc 6780 ggcccagcag ggtgccggcc gcgccagtcc taggattccg cagccgcctt tctctcccct 6840 cctcctgcta tttgcaaaat aatccagctg cgcggctgtt tgccgggctc aagcccccct 6900 ccccaccccc cacttcccca cctccgtctg tctcctggga tgatcttgtc ttctttcccc 6960 cacttcaaaa aaggtggggg gattggggtt ggtgaaaaat ccccgccacg aggaaaaaaa 7020 aaaaggttgt cagttaggag tgggaagaga gtgatgcgct tgtaaaatag taaaagaaaa 7080 aaaagaaaaa aaggagaccc atcaatctcg tatccatctt tctatctcag tatctttcat 7140 ctttcctatc taaataaaca aggcaggtcg cagtggaaat ccaccggctg aaatcgtgtc 7200 gatttcaagc atgtggctgg gcgggcaaag tcaggcagcg gggcaagaca agcagcagct 7260 tccaccgtcc ctgttgggtt tatttagcag aggggaaaag cgagcgcgag cgggccaggt 7320 acggtgtttg caggggaacc cgccccgagt ccccgcacac ttgcaccggg aaggtggctt 7380 tgcggcgctc cccgcccgcc gcagccgcgg ggcggcttcc ttctgcgcgc gaacatttcc 7440 ccgccgttct ttctctcgcg gtgcctgggt cgccgttcct tttttttttt tttttttttt 7500 tttttttttt ttttaactgc aatagaaata aaacatcctc tgggtgccat cgagaccgcg 7560 ggcaggttat atgcttgcaa tccgccgcgc acctcgccgg gctgggwccg ggctgcccgc 7620 gcggagctcg agaggcgtgc gcgcccagtc accgcagagg actggctgcc gggcggccga 7680 gagccgaata tttatgttat attttaaaaa atttaaataa ataaataaat atataaagtg 7740 gttctcccct cccctgaaaa cccagcatag gagccatctg ctcggagcaa ttgctgttgc 7800 catctctcct ttgttacagc agatacatta gtaagaattt gtggatttat tatgattttt 7860 tttggggggg ggggaataga aattaaagtg ggattcgcct tgggagaggg atgcctcttt 7920 ggaggaaggg aagaggactt ctcttttatt tttcgccgtt gtaacaccaa agaagactcg 7980 ccggctgcgt ttaaaacaaa atgttttgca gctagatttg agcttggttt gatcaaggtc 8040 ttttttgcca gttgacattt cgatccttta ccaagccaca gcaatcgctt attctacacc 8100 cttccccctt tagatggggt ggttgttaaa acgtctatac ttgcagaggc ttaatttctc 8160 caggaggcaa tttgccccac gtagcctctg tataattgca agggttgttt ttgaggaggg 8220 ggaattgggg gggtcgggga agggggagtg gatgggggtg cactgccaag ctggcagcag 8280 cggcgagcca ggagtggttg cagttgtgtg taaggggaag aagcaggtag gttcgctttg 8340 ctttggctct ccttctcctg gcattcctgg gacatcaggc gagagcctgg ccagaggact 8400 ggtggcagct gggcatgggg gtgaggggtg cctggtgcag cactttccca tccttcattt 8460 gttccctgtc tcgctcagcc ctgctcagag ccacgctggg gaaagccagc tgacactgga 8520 gcagtggcag ggagggaaaa agagagaggg caaaggagaa gagaggtgga gagaaaaagg 8580 ggaaggagac cagagggcaa aggaaagccg gcctgccttt gaggggcaca cggagcccag 8640 gctatgtgta caggtttaag ctaggagagt ggtccaacca gtttcagaca agctattatk 8700 atccaaagca gctgctttcg tctgtcctgt gtccccggga ggaggtggga gagcaagcag 8760 gggaaaggca ggaatggggt gcactttagc ctctctggcc tctggaagtg cctctccaca 8820 aatgatgcag gagccgtgga ctcagggtgc tttggagccc tggctggcaa agcgggtgct 8880 gtcgcatcct ctacttggag ttcacatttt agattttaaa ttccaaagat accccttaaa 8940 acatggtaca tctttatcag ttgggtggca gctcctgggc ctgtggggca gcaacctcag 9000 gtccttcagg gatgatgcaa ctgcaaataa ctgatggcct gggaaacaag agggcacaca 9060 aatagcacgc atggtctttg tgggtgggtg gcggtgggga ggggagaagg gggagggagc 9120 gtctgagaag ggctccataa tgagctagtt aaatttacag acagggccag ggacaagagg 9180 agtgaggtaa aaaagagtga gagacagctg gtgatggaaa cctgggcttc tggtttgctt 9240 caaaatgttt gacccagatg gatatggctt ttaaaagcag aggacagaca cagctattaa 9300 taaaaaaaca aacacaaaac aacacagtgg caatcgtgcc gaggggaggt taagggggat 9360 cggctgacca cgcagaggaa agggccagag cccgctgtgc cagacagggc cagggtgaag 9420 ggaagagtac ttaaatccaa gaaggagctt gatgctttct gaagagacca aggaaaataa 9480 gatgtccacg gtaaactgcg taaccccagt caaggtgatt ttctcaacaa cccaccaaca 9540 ggtttcctag gaagattagt aattttccgt atgaattc 9578 <210> 10 <211> 4000 <212> DNA <213> Homo sapiens <220> <221> exon <222> (1774)..(2142) <400> 10 tctgtactgc cacatttctg atgcattctg catttaattc atcgagggct ctgtctgctt 60 ttctgtaacc acaggtggga tctcaaattg tagtttctct tctcagcgat acctacgtcg 120 ctacctattc acacatagtt catacgtgcg cgttgtacgt cttacatcgt cgtatattct 180 gtattcagtt tcacacatgg actctcctag gccctgcata ggctcgtgtt cagaaaatag 240 agaacagtga tttatgtgta ggatgggaga tgccacagaa ttttttcctt aaattatctg 300 ttctttggct ctggcacttc aataacttca ctgccacgga atgtattttc ctccctccca 360 ttccttctcg ccgttcctct gtggttttca ttatccttcc ctaaatacca tacaacttaa 420 aatttacctg cctcctcggg tttcagacct ttggctgccc tctggcttcc ctgaagaccc 480 cgccactcgt gtcttctcta cgactactga catttgctct cgaaaaattc cagcccgaat 540 ttgctcagac cccgagggga atatgaaacc tccacactgt ccacttctct ttatttatga 600 cacttttggc tgccgagtct tccaattttc ccttgaggag gttgctgctt tttgaggcat 660 ttattagctt ccaaatattt gggtcctagg ctccctactc tctcccccac aaaaaaaacc 720 caagagaaat ctatcggctg ctaaagaaat ataaaaacat acagtccatt gaaagtgtgg 780 tttgatatct tccaagaaat gcttttggag tctggagaat tttctttctt tcatttttct 840 gggagtgaaa ataaaatcaa caaacagaaa aggacagtgg ggagttgatg agtgtggggg 900 aaatctacag agaaatggaa gtctgaccgg gcctcgggtg cttggcagga gagcctgctt 960 cccgactctg caagccggtt ccagcctccc ttctgctgca gtgctttctc ctaagatatt 1020 tttttggaac ctgacactca cttgttgctt tctgagcatg tgggcttcct tctctcctaa 1080 ggacgggccc ttagacgccc atctgggttt ctgttttcta gtttggtgtg tggccaggtc 1140 ccaggtagag gaatgtgagt tggattcgca tgaatgggga gggcatgaat gaaggtgtaa 1200 gggatgggag gggtggggct ccagcccagc agggggaaag ggctccagct cactggttct 1260 cggccctggc tgcccattgg aatcacctgg ggagtctgaa agactattcc gatgtttgtt 1320 cccagtgtaa ctggtcaggg gtgctgcctg cgccttggga tttttcaaac cctccaggtg 1380 attctcagat actggaaact ttgagagaca catcacgacc tcatgctgtc agcagccagg 1440 gtgtgtgtgt atgcacgtgt gtccgtgtgt gttcttatac tacgttgggg agaaactggc 1500 agaaaataaa ctagaatgca gttagatcgg cactacttac gtggcaatgc ccagggggca 1560 cgacgttgct cctagagcct cagtgtgccc atctgtcctg tgggggatgc tcaccagccc 1620 ccaaccccgg ggaggacctg gtgagctctg gcagccagca gcagaggggg ctgcttcttg 1680 gcggggaagg ggtggaccgg aagttgggtg ctgtgaccgc ctaagcccat ctctatcttc 1740 tctgcccctt ccctttcttc tttctgtctc cagcagaggc tgaccatgtg gaggccgcca 1800 tcctcgaaga agacgagggt ctggagatag aggagccaag tggcctgggg ctgatggtgg 1860 gtggccccga ccctgacctg ctcacctgtg gccagtgtca aatgaacttc cccttggggg 1920 acatcctggt ttttatagag cacaaaagga agcagtgtgg cggcagcttg ggtgcctgct 1980 atgacaaggc cctggacaag gacagcccgc caccctcctc acgctccgag ctcaggaaag 2040 tgtccgagcc ggtggagatc gggatccaag tcacccccga cgaagatgac cacctgctct 2100 cacccacgaa aggcatctgt cccaagcagg agaacattgc aggtatggga tgctgcgctt 2160 gcctggttgc tgtggaagcc acctcctggg tcccatgccc tctgcctgag tgtgctggtg 2220 caggggaagg cccaggggct tccaggatgg cctctgggcc accagccggg gctccccctt 2280 tctgagggtc caccatccag gtgaccttca ggaggagaca ggcctggggc tcggggaggc 2340 ccaaatggct gatggctgct tgcttttggt gaggggactc tgtctcgggg gctaatccag 2400 aggtggtcag aagcacagaa tgaaaatttg gaagtctggt tggccctctc tttgctactg 2460 atcttggctt agtccctgat tttgaagcca gacagttttg ggttagagtt tgtcttcaca 2520 acttggacat gttagtttgc ccatctgtga aatggagcta aggaaaccca cctcattagg 2580 gttgctgtga ggacgaatga gctgttgcat gcggcatgac ctggtaggca cttaggaatg 2640 ggagtgctca ttctctcccc tctcctttct ctctggactc agtttcccat gtgtgaaatg 2700 aggagttagg ccccctgatc tcagaggttg cttctgacat tgcccgaccc caggggccgg 2760 tcccaggcag gggtgtggga acttgttgga gcactgtgcc cgttggggga ggttggatat 2820 gccctttgac atgctcactc atttgaccac tgggacagct ggttttacca ccttgagaac 2880 aggtctaggg cccctctgtc cccaggcgtg ggtctgctca ccacagtgag ttagcatgaa 2940 gtccctccct cttggccagc accatggcat gctggagcct cttccaggga gccgctgctc 3000 tctgtgcaaa ccagagtgtt tgtttctggt ttatacttct gagcccagga ggcctggggg 3060 agaaaggagg gcctggccag cctgggttcc ctaaaaagca gcagcctgtg ctggagcaag 3120 atgggcatca gagtttatgc agacgagtgt tcaaatcctg atggttgact ttggattagc 3180 cacttcatgg gtccgagcct cagtttcccc atctgtcaac agaaagtgat aatagcagca 3240 ggcctggtgt gaggattaga tgagcagggg ctcttaatca gtcttttgcc cgtggcactt 3300 ctctctcaga ggtttcgtct ggctctgcgg tgtgcaagta ggtggctggc tggggaaacg 3360 agtgcattga tcgttaccat gcttccatca tggaaggtag catgggctct ggagggactc 3420 aggctttcga tgcttctagg agggtgagat ggatgggcat gggcactgat caagacccat 3480 cacccaggac gcagtcaggg taatgctgca agcctgtctc ccccacgtct ccaaagcttt 3540 gtgatgctga gcctcacttt gctcacctgc acaaggggct tagtgagccc tctcttttgt 3600 ggggagactg tggtggtatg cagagtcctg cagcctcatg ccaggcactg gggagacatc 3660 agtgaaccag attggcctct gggccttgcc ttctgatggg tgccctagca tgaagtgtct 3720 catacacttt ccaagatgca aggggctttg agacatgtcc aggccaccgg catgtaaaca 3780 ctggcttctc agagtgctat gtgcacctga gcagcgtctc ttcaccgggc tgagccatca 3840 ggcgagagag gtgctgggtc ccttttgtct ttgttggtcc acattccagg gacagtttta 3900 cctgtagtat cgacgcctgg cctcagtgca catcgatctt tcaggggtgg ccttgctagg 3960 gagactcggg ccgcctattt atgtttccat ggaaagattt 4000 <210> 11 <211> 1776 <212> DNA <213> Homo sapiens <220> <221> exon <222> (587)..(799) <400> 11 gaatgggaag gcaggcggga agagagcccc aagctggtgg tctgcaagac aggaggctaa 60 cagagccaag acacctggag cggacccaag gctggaggcg gacccaaggt gtcccgggcc 120 tgtaggaaca gcccatcctg atacagcaaa caggggaggc tgtgagcttc ccagctcttc 180 cagggagggg tagcccgaag ttttggaaac aaatccccaa atggaaccta tttgattgct 240 ccagaggcac ccacgtgggg ggtccttcct gagagtgggt cctcacagcc cccgttcacc 300 cagccccctg caccaggccc ccagaggcgg ggtcctgcct ccccgacagc ccagcctggc 360 agctgtggaa accgggccct ccccagtgcc ccctgcccac ctccccgagc ccattccctc 420 gcctgtgtcc cgattgcctt ccctgcaggg cctggcacmc cgggggcmtm ccacccccga 480 agkgtggcct gagcagagcc ccacgccccg agccccgtcc caccccgtgc ccctcacaca 540 gtccagggcc cgactgacca gtcttttcta ttgttttttt ctccagggcc gtgcaggcct 600 gcccagctgc cagcggtggc ccccatagct gcctcctccc accctcactc atccgtgatc 660 acttcacctc tgcgtgccct gggcgctctc ccgccctgcc tccccctgcc gtgctgcagc 720 gcgcgcccgg tctcgggtga cgggactcag ggtgagggtc agacggaggc tccctttgga 780 tgccagtgtc agttgtcagg taacagacga cgccgcggtg gggggcgggc cccgggatgg 840 cggggtgtgc catgggcagc gctggagcaa ggtggggacc cagggaggaa gggcagctcc 900 cacccagaag gctttttggg gtgccagggg aagtggtaaa gaatgttcgc tgaactatga 960 gccagggccc ggtgcccctc ggtcaggagt cccccacggt gcccccaccc gttctgagag 1020 tcttgctccc agaatgcatt ccccagcctc ccaatcccgc ttctttgggt tgtttagcga 1080 cagcttaatt ggataacact taacatctga ggttttcttc ggcccttgcc actgccaccc 1140 cctcccccac cccagacaat cccctgcccc gccaagacca ggctagggga agattccttg 1200 gttgactgtg tacattgctg gagccgtcca aaatgctgag tttctctttg ggagaatgtg 1260 ttgcccatta gctttgaaaa agaaaaatag tggctcaaaa ggagcctctt aaaaatgctg 1320 tggccacgag agggagtgaa acactgtgag gtgtgtgagg ggtgggggcg ggggctgagt 1380 acctgctgtg cgtccggctc tgggccagac ccagacacag ctgtttgtgc cgactcatcc 1440 tgctctccgg gcgggcggtg tggctgccat tctacagatg gcagatgggc cggtgtggtg 1500 acacaaactg gcctctacct gcctgcttct cccaagtgaa cccaagatct tattctgcct 1560 aggtctctgg gatacttggg tccttggatt cagggcaagg gcctctcaca agtctgtccc 1620 ccgcatctcg cagggctggc gtgaagcact gtggcacgaa acaggatgct gcacagcaca 1680 tgtgtgagca gcgtggctgg ttctgtggac gggacggaag gagagggggt gacggctggg 1740 acgttgttgg tcctctttgt acaggatgtg caggtt 1776 <210> 12 <211> 14401 <212> DNA <213> Homo sapiens <220> <221> exon <222> (7071)..(13969) <400> 12 cctgrctccc tattcttggs aatggtactc tgtagagtta gtgggtctaa mgagtgatgt 60 ggtggtctgc acatgtgggt ctgaacccca agttgagtcm acacccttga attcttctct 120 ctcycagcac yctgaactcc tcytagcgtc actcactawt ytgyattawa taatgkagtg 180 gttactgkgg gttcyctgtn tcycccctgk agtgtgagct gcanncttag ctaccagcat 240 agtacctagc agatgwagkg gcccagatcc tgtttgttca gtgaattaat gaaagtcaga 300 tgtagacawa gttctcagca gaacacacag tgctaccacg ctcattcagc ccaatctatt 360 ttgatcccca catttactgk atttacatct actgagatcc aggaatggca aagaggtgca 420 ggcatgcttt atttggcaat gactgcctgg agcctggggt taaagaggag tccaaggcct 480 ggagggagag tgcggggatg aactggcaat gtctaccgca ggccttggtg tgggggcagt 540 ggctttctta gccagaggct ggctcagcac attaccacca gaggagacca tgtcttattg 600 gtcatagtac cactgctatt accatcagca cttacacccc tcagtgggcc acttgctttg 660 aaaggttttt ctcttctaaa tggcatctat tatttttgcc atkagataat cagcatgatt 720 tcatggagtt actgcaattc tagccaaaag caacacatct tgacattttt gttagtacgt 780 gggctgaaat gaaaggtaaa atactgaggc ccaggtagct agccccatcc ctgcccagag 840 tgtgtctgct gctcttctga cccagcgttt atcagaacag cataacaaga gcacrrgctt 900 tancgtgggc agctgtgcag ccccaggcgg atcccctatc tcttcccgtc ctcagtttct 960 tcatctgtaa aatggtcatc atgacggtgg gtactgcagg ggttgttgga gcagcatgtg 1020 aggtccttgg tgtgcttagc tcatgcctgg cagktggtaa ggatttcata aagctttctt 1080 gttaccactg tgagtgttat ttccccagtt ycgsctttgt cttggagaga gctgaggttt 1140 cacggaatac atttggaaca ggcagggatg gttatcaatt ctssagatgg ctgtgccaga 1200 wtgatataga cacgaamytw aawtagatcc ctgcggtgcc caatggacat ctcctttctg 1260 acgtcatgaa rgagkakwkt wwtkawakga wtwaggaatc tacacatctg agggataaca 1320 ctgataatta cgatcatttt ggaactgtgg agacggcatc tttagcagac ggattctgga 1380 ggcggactga gtggttggcc ggtgaaacag ccatctcctt gggtactggg tacctgaagt 1440 ccagagtggg gaagggagct gccacagggg gccctgggat ctggtttccc atccctggat 1500 ttggccactt cggtgtctac ctcacgaggt ccccagtgac gtgtcatacc ccgcagctcg 1560 cttgctcgct ctgtgaaacg tctccccttc tcctctccag ggtcaaggcc tgtggtggac 1620 ctgaccgggt tccaaccaaa catcatcagw gycytycact gggaggacac tcacagtgtg 1680 gtgggagaac ctcyttcgtg gccatttgca ttgtgaaaca ggccctracg ataaatgcct 1740 caggtggtgc tgtgtgccga ggcggggctg gagccctgct caggggttgg raasctgagg 1800 aggarcgtgg cctgcccctt tctggccgtg ccgctttgct tctctgagcg tcagtttgct 1860 cacgtgccag ctgggatgca gttttcccct ggcccccctt gaggccacag tgagcaaaga 1920 tggtgtgagt gaatgcatgg gaaatgccac gcctagtgta aaatgttttg caacctgtag 1980 aggggcctgt aaagccagaa tccagttctt actttagccc cccaacctca ggatatcacc 2040 ccgggccctg cttgagtcga gagggtgtct ccttgctgct ycttctcgaa cagcagtggg 2100 ccactaaatc tcacccaggc aggaatgccc ttccctttgg tatcacttgg ccttaggagg 2160 acccctatca attatggcct tttcattgga taataatttc aattaaaggt gtgtttttta 2220 ttgaacatct ctgatacctt tattggtatt attagagtag ccagcttaat aaggaggaac 2280 aattatttaa atgctcataa aaaagcctaa tggcagaggg agagtcacat ttcattgcag 2340 gagtccagct gcacgtcgtt cccaagcatc ataataaaaa acgatgtttc ctcaatgttt 2400 gcaagtttct gcttccctag aacctctaat gcatgaggca ggctgcatta aatgtcctcc 2460 agggtttcat tattgctgga gttatactga aagtcatcac tgaaacatcc atgaccaggt 2520 acaaggatgg ataataaaaa aacaaaacgt gcaaacccca tcgtaacgcc tgcatagcca 2580 tgtgcgattt ataggctgtt atagctgtcc acatacagra gctcattkgg tctccccags 2640 cctctctgra gccaggtata ttatycccat tctactgatg agaagtcaag cctcagagag 2700 kttaaatgaa ttgactgaat ycctcytcct gggaacacca aggcagagrg gtatggacgc 2760 actgctgttg tcmrggktct catgacccag ggtattgcat ttgagaaaga tgtcctgggg 2820 ctctgtctag agccagtgga gcaaagaaga tccagtgtgg gtttctgtca gtggatacaa 2880 aaaatgtctg agaaaggaag aaggatggaa agaagcaagg gaagacgagg ccctgggtct 2940 gagttgccaa gcgtgactta gtgagcaaag tgtagctgac gtttctaggt ctgtaggcca 3000 ggtttgatgt tgctgggtaa atcgcttcct aaatagtcta ggccttgacc tatcagtggg 3060 aatctcagca gcctgtctgg gccgctagca taaagttgtc acccctctcc acagtgcagc 3120 ctccagctca cctgtgggca ggtggccctc agttcctgga ggggggtgac agccagraaa 3180 catctggtcc sgggaaggrg agtgggccag cccccagtca gaagcagcct gctcaccagg 3240 ggtcttttgc tgcacttaaa aatgagccgt ctgagactgc gtgcccatgt gtttaaaata 3300 tttagcgagt tttcaaatag aaaaatgttc tgagtggctc ttcaaagact ttctgacatt 3360 gttccatttc tgaaagtgag caagcctcat gctcagggct acttccgggc aagagataac 3420 catggagtga taataaggaa atgaatgttt tattaaaaaa agaagggagt ggggactgga 3480 aagaaagttg tctagggcgg gcctctgagg gctgggtgat ttttaggata tcggaaggct 3540 tcagatcctg cactggaggc catcgcctga agtgaaatct tgccattgtg cagagggaag 3600 tattggaacc aaagcggttc ccggacacgg gtccagtaag agctttccag gcaggacggg 3660 tggccctgaa atccagchtg atgaataaac atcgctcttc tcacctgatg gtgaattatg 3720 gacaggtaat gccctcccta tgttgctcca agttagtttt agaagctttt tttttttttt 3780 tttttttttt ttttaagatg gattctmatt ctgtcgccca ggctggagtg cagtggttcg 3840 atctcagctc actgccactt ccgtctcccg ggttcaagcg attctcctgc ctcagcctcc 3900 tgagtagctg ggattatagg catatgccac cacacccggc taatttttgt atttttagca 3960 gagatggggt ttcatcatgt tggccaggct ggtcttgaac tcctgacctc aagtgatccg 4020 cccgcttcgg cctcccaaag wgctgggatt acaggcgtga gccaccgtgc ccagccagaa 4080 gcatttaaaa caaacaaaca agaagtggaa acacttgagc tctttagcac ttgtagctac 4140 ctgacttcca gtaactwccc ttttvagttg aaaaacctgt sacttrgcca tttcagctgt 4200 agagccgcct tcactgctgg cctgcgtaas gctctgcatt ttcctctgat agccatgttc 4260 tttcctcacc agccacagaa ctttctagaa aatctgtggc cacccagatc aagaaacagg 4320 aagtgctttg gagcacttch cagggaaaca gagatgatga aaaagagatt ggsggaaggg 4380 aggtggcctg acttgaaaac atgagaaact aaagcgacgg aaagctgtga attgattaat 4440 tagagtggct gaagggtggt gcagggtaca ggaacgatct ttaatttgaa gatctataac 4500 cctgcaggaa ggggcacttc atttgtgtta ttagctcctg tgtcagaaaa ggatgtttat 4560 ctagcttctt tttttattac ttatttattc tgccttgttc ccaaaaaggg tgtgaggagt 4620 cgtctaaata tggcttctgg ccagctctcc tatgaggctg tctgagctaa ggcgtgctgt 4680 tccccaagta caatcactaa taagtgtagg acagaaccag ggaagctggg cacttcctct 4740 gttcgctgag agtgcacaga gcaggagggc tgtggtgttg gggtggcctt acagggagaa 4800 tcgcggccac ccagggcctt gggaaggcgt ccctgcccta tcttaggtgg ggaggtttcc 4860 cctcaggggc tctttcatgg gagaactgag ttacctggat gactaagaga gggaaatgac 4920 ccagacaccc tggagaaaga agatagcctc agaggtgctc cttgagctgt ttttaagagg 4980 gatgaggccg aacttcagam ttyctttttc atttctgtyc tccctaccac cgtcttctca 5040 tcaccaaaca cacagaatag gagaggagag ggaaagaatc cctatgtaat gccaaacttg 5100 taacagcctg gctcggtttc tagtgttggt gtcctgggcc aactggttct gaggtcgcgg 5160 ggggagtctc caccctgccc ctcggacagc acgaagcctt ctgtgacgct gcaggcatgc 5220 gatgtcttgg ggaggtcccg gcccctcaga aactggcaag tccagtttca ggcagaggca 5280 caggccacac tcaagacctt ggatggaatt cagggtattt ggtccccgag tcacttgatt 5340 tttaaaagat ggtttccaaa tgaaagttta tgtgcctata aacactgcta agagtgcagc 5400 cttccagaaa cataattagt gggtggaaaa caaaaatgct gtctgcctag gatttcagaa 5460 ggcctgtaat cgattggtgg agagagtgag acaggggact gttttctcca cttcccatgg 5520 caacttaccg atattgggaa gggtcattca tttgcacgtt tgacttcacc agagcttgtg 5580 gcccctgtac tttagcatct gtgttaaaat cttccaggta gatgaaagtt tgagaaaaca 5640 aaagggatct ttcaagatct cgcatgccat gtcttctgct ggatctgagc tgggattctt 5700 gttcctcttg catccccagc tagtgagtgc aatgctgcaa gacgggtcct gtctgcaccg 5760 tctcttttat gcagagcatt aggagaggta catactggaa aagcggcgag cttcaccccc 5820 aggtgcagga gggcacttgc aggatgggtt ccggagaaat gttcagcctc cattttgtga 5880 ttgtctcagt gatggacaca gacgatgacg ttttggctcc ataccacgag tgttcgctac 5940 aatttgctgc ccgtgtcacc agagccagtt gctaacacat cagcatttgc cactgttcat 6000 cctgactgcc ctgtcagatg tgaggatgtt ctttcattgc ttagtattct ggcagaggac 6060 tttgaaagac tcatgtaggc cagtgtgccc ccgccttccc tggggtctgg aggtggaatt 6120 ccaagcggtg tttgggcgtg tgtgtgagga cacggggtgg gggcagctgt cacagtagta 6180 gccggtcttc acagcatgtt aaattttttc tgttcctagg aatccatatt caggtgtaca 6240 gtgctttctg cacagacggt ggtgtaggaa acacgagaat ttcctatagc taaaaatccc 6300 aaatgttgca gaggtattgc agctatttct cttaaaaaaa aaaaagtttg caggatagta 6360 cagtttgatt tgtgtttctg tacaactccc tggaatcaaa tattatcaga attggttgtt 6420 ctcaaagggg tcggtgatct tgcccccctc cctgggaaga ttcggcaagg cctggagaca 6480 tttttggtcc tcgcaaccgg gggaggtgga tgctcctggc atctatctag tgggtgcagg 6540 cagaggatgt tgctaaacat cctgcaatgc gcaggacagc ccccaccgcc caaagaatta 6600 ggatgtaaat gtcagtagtg ccttgactga aaagccctgg cctagatggt ttcgggtgtg 6660 gagcatcctc gagggctggr atttgccagg gctgttacac agtccagcct tgacagaatt 6720 cctactactg gaccgtattc tcacaaacac gatctcccgt ggcctcggag gtaatggaga 6780 tcagaatccc ttttctttgg gggagcaagg cgggtcttac acaattgaag taagtnnctg 6840 gcgcccgggt ggccagggcg gcccgcccac agacctgcgt cttcggcccc ccagccagga 6900 ggagacaagg ccgggcctgc ttgcaagcgg ccctgcagcc cctgtcaggc agggcactgg 6960 gatcccggat cagcccgggc cgcgtccchc aggccagtgg ccctgcggtg cccgcgcccc 7020 gctgccgctt ctcacgctgt ctctgccttt ctgtccgtgt gtttccccag gtaaagatga 7080 gccttccagc tacatttgca caacatgcaa gcagcccttc aacagcgcgt ggttcctgct 7140 gcagcacgcg cagaacacgc acggcttccg catctacctg gagcccgggc cggccagcag 7200 ctcgctcacg ccgcggctca ccatcccgcc gccgctcggg cccgaggccg tggcgcagtc 7260 cccgctcatg aatttcctgg gcgacagcaa ccccttcaac ctgctgcgca tgacgggccc 7320 catcctgcgg gaccacccgg gcttcggcga gggccgcctg ccgggcacgc cgcctctctt 7380 cagtcccccg ccgcgccacc acctggaccc gcaccgcctc agtgccgagg agatggggct 7440 cgtcgcccag caccccagtg ccttcgaccg agtcatgcgc ctgaacccca tggccatcga 7500 ctcgcccgcc atggacttct cgcggcggct ccgcgagctg gcgggcaaca gctccacgcc 7560 gccgcccgtg tccccgggcc gcggcaaccc tatgcaccgg ctcctgaacc ccttccagcc 7620 cagccccaag tccccgttcc tgagcacgcc gccgctgccg cccatgcccc ctggcggcac 7680 gccgcccccg cagccgccag ccaagagcaa gtcgtgcgag ttctgcggca agaccttcaa 7740 gttccagagc aatctcatcg tgcaccggcg cagtcacacg ggcgagaagc cctacaagtg 7800 ccagctgtgc gaccacgcgt gctcgcaggc cagcaagctc aagcgccaca tgaagacgca 7860 catgcacaag gccggctcgc tggccggccg ctccgacgac gggctctcgg ccgccagctc 7920 ccccgagccc ggcaccagcg agctggcggg cgagggcctc aaggcggccg acggtgactt 7980 ccgccaccac gagagcgacc cgtcgctggg ccacgagccg gaggaggagg acgaggagga 8040 ggaggaggag gaggaggagc tgctactgga gaacgagagc cggcccgagt cgagcttcag 8100 catggactcg gagctgagcc gcaaccgcga gaacggcggt ggtggggtgc ccggggtccc 8160 gggcgcgggg ggcggcgcgg ccaaggcgct ggctgacgag aaggcgctgg tgctgggcaa 8220 ggtcatggag aacgtgggcc taggcgcact gccgcagtac ggcgagctcc tggccgacaa 8280 gcagaagcgc ggcgccttcc tgaagcgtgc ggcgggcggc ggggacgcgg gcgacgacga 8340 cgacgcgggc ggctgcgggg acgcgggcgc gggcggcgcg gtcaacgggc gcgggggcgg 8400 cttcgcgcca ggcaccgagc ccttccccgg gctcttcccg cgcaagcccg cgccgctgcc 8460 cagccccggg ctcaacagcg ccgccaagcg catcaaggtg gagaaggacc tggagctgcc 8520 gcccgccgcg ctcatcccgt ccgagaacgt gtactcgcag tggctggtgg gctacgcggc 8580 gtcgcggcac ttcatgaagg accccttcct gggcttcacg gacgcacgac agtcgccctt 8640 cgccacgtcg tccgagcact cgtccgagaa cggcagcctg cgcttctcca cgccgcccgg 8700 ggacctgctg gacggcggcc tctcgggccg cagcggcacg gccagcggag gcagcacccc 8760 gcacctgggc ggcccgggcc ccgggcggcc cagctccaag gagggccgcc gcagcgacac 8820 gtgcgagtac tgcggcaagg tgttcaagaa ctgcagcaac ttgacggtgc accggcggag 8880 ccacaccggc gagcggcctt acaagtgcga gctgtgcaac tacgcgtgcg cgcagagcag 8940 caagctcacg cgccacatga agacgcacgg gcagatcggc aaggaggtgt accgctgcga 9000 catctgccag atgcccttca gcgtctacag caccctggag aaacacatga aaaagtggca 9060 cggcgagcac ttgctgacta acgacgtcaa aatcgagcag gccgagagga gctaagcgcg 9120 cgggccccgg cgccccgcac ctgtacagtg gaaccgttgc caaccgagag aatgctgacc 9180 tgacttgcct ccgtgtcacc gccaccccgc accccgcgtg tccccggggc ccaggggagg 9240 cggcactcca acctaacctg tgtctgcgaa gtcctatgga aacccgaggg ttgattaagg 9300 cagtacaaat tgtggagcct tttaactgtg caataatttc tgtatttatt gggttttgta 9360 atttttttgg catgtgcagg tactttttat tattattttt tctgtttgaa ttcctttaag 9420 agattttgtt gggtatccat cccttctttg tttttttttt aacccggtag tagcctgagc 9480 aatgactcgc aagcaatgtt agaggggaag catatctttt aaattataat ttggggggag 9540 gggtggtgct gcttttttga aatttaagct aagcatgtgt aatttcttgt gaagaagcca 9600 acactcaaat gacttttaaa gttgtttact ttttcattcc ttcctttttt ttgtcctgaa 9660 ataaaaagtg gcatgcagtt ttttttttaa ttatttttta attttttttt ttggtttttg 9720 tttttggggt ggggggtgtg gatgtacagc ggataacaat ctttcaagtc gtagcacttt 9780 gtttcagaac tggaatggag atgtagcact catgtcgtcc cgagtcaagc ggccttttct 9840 gtgttgattt cggctttcat attacataag ggaaaccttg agtggtggtg ctgggggagg 9900 caccccacag actcagcgcc gccagagata gggtttttgg agggctcctc tgggaaatgg 9960 cccgacagca ttctgaggtt gtgcatgacc agcagatact atcctgttgg tgtgccctgg 10020 ggtgccatgg ctgctattcg ctgtagatta ggctacataa aatgggctga gggtaccttt 10080 ttggggagat ggggtggcct gcagtgacac agaaaggaag aaactagcgg tgttctttta 10140 ggcgttttct ggcttgacgg cttctctctt tttttaaatc acccccacca cataaatctc 10200 aaatcctatg ttgctacaag gggtcatcca tcatttccca agcagacgaa tgccctaatt 10260 aattgaagtt agtgttctct catttaatgc acactgatga tattgtaggg atgggtgggg 10320 tggggatctt gcaaatttct attctctttt actgaaaaag caggggatga gttccatcag 10380 aaggtgccca gcgctacttc ccaggttttt attttttttt tcctatctca ttaggttgga 10440 aggtactaaa tattgaactg ttaagattag acatttgaat tctgttgacc cgcactttaa 10500 agcttttgtt tgcatttaaa ttaaatggct tctaaacaag aaattgcagc atattcttct 10560 ctttggccca gaggtgggtt aaactgtaag ggacagctga gattgagtgt cagtattgct 10620 aagcgtggca ttcacaatac tggcactata aagaacaaaa taaaataata atttatagga 10680 cagtttttct actgccattc aatttgatgt gagtgccttg aaaactgatc ttcctatttg 10740 agtctcttga gacaaatgca aaactttttt tttgaaatga aaagactttt taaaaaagta 10800 aaacaagaaa agtacattct ttagaaacta acaaagccac atttacttta agtaaaaaaa 10860 aaaaaaattc tggttgaaga tagaggatat gaaatgccat aagacccaat caaatgaaga 10920 aataaaccca gcacaacctt ggacatccat tagctgaatt atcctcagcc ccttttgttt 10980 ttgggacaac gctgcttaga tatggagtgg aggtgattta ctgctgaatt aaaactcaag 11040 tgacacaagt tacaagttga tatcgttgaa tgaaaagcaa aacaaaaaca attcaggaac 11100 aacggctaat tttttctaaa gttaaattta gtgcactctg tcttaaaaat acgtttacag 11160 tattgggtac atacaagggt aaaaaaaaaa ttgtgtgtat gtgtgttgga gcgatctttt 11220 tttttcaaag tttgcttaat aggttataca aaaatgccac agtggccgcg tgtatattgt 11280 tttcttttgg tgacggggtt ttagtatata ttatatatat taaaatttct tgattactgt 11340 aaaagtggac cagtatttgt aataatcgag aatgcctggg cattttacaa aacaagaaaa 11400 aaaataccct tttcttttcc ttgaaaatgt tgcagtaaaa tttaaatggt gggtctataa 11460 atttgttctt gttacagtaa ctgtaaagtc ggagttttag taaatttttt tctgccttgg 11520 gtgttgaatt tttatttcaa aaaaaatgta tagaaacttg tatttgggga ttcaaagggg 11580 attgctacac catgtagaaa aagtatgtag aaaaaaagtg cttaatattg ttattgcttt 11640 gcagaaaaaa aaaaatcaca tttctgacct gtacttattt ttctcttccc gcctccctct 11700 ggaatggata tattggttgg ttcatatgat gtaggcactt gctgtatttt tactggagct 11760 cgtaattttt taactgtaag cttgtccttt taaagggatt taatgtacct ttttgttagt 11820 gaatttggaa ataaaaagaa aaaaaaaaca aaaacaaaca ggctgccata atatattttt 11880 ttaatttggc aggataaaat attgcaaaaa aaacacattt gtatgttaag tcctattgta 11940 caggagaaaa agggttgttt gacaaccttt gagaaaaaga aacaaaagga agtagttaaa 12000 tgctttggtt cacaaatcat ttagttgtat atattttttg tcggaattgg cctacacaga 12060 gaaccgttcg tgttgggctt ctctctgaac gccccgaacc ttgcatcaag gctccttggt 12120 gtggccacag cagaccagat gggaaattat ttgtgttgag tggaaaaaaa tcagtttttg 12180 taaagatgtc agtaacattc cacatcgtcc tccctttctc taagaggcca tctctaagat 12240 gtcagatgta gaggagagag agcgagagaa catcttcctt ctctaccatc actcctgtgg 12300 cggtcaccac caccacctct cccgccctta ccagcagaaa gcaatgcaaa ctgagctgct 12360 ttagtccttg agaaattgtg aaacaaacac aaatatcata aaaggagctg gtgattcagc 12420 tgggtccagg tgaagtgacc tgctgttgag accggtacaa attggatttc aggaaggaga 12480 ctccatcaca gccaggacct ttcgtgccat ggagagtgtt ggcctcttgt ctttcttccc 12540 tgctttgctg ctttgctctc tgaaacctac attccgtcag tttccgaatg cgagggcctg 12600 ggatgaattt ggtgcctttc catatctcgt tctctctcct tcccctgcgt ttcctctcca 12660 tccttcatcc tccattggtc cttttttttt ctttcatttt ttatttaatt tcttttcttc 12720 ctgtctgttc ctcccctaat cctctatttt atttttattt tttgtaaagc caagtagctt 12780 taagataaag tggtggtctt ttggatgagg gaataatgca tttttaaata aaataccaat 12840 atcaggaagc cattttttat ttcaggaaat gtaagaaacc attatttcag gttatgaaag 12900 tataaccaag catccttttg ggcaattcct taccaaatgc agaagctttt ctgttcgatg 12960 cactctttcc tccttgccac ttacctttgc aaagttaaaa aaaagggggg agggaatggg 13020 agagaaagct gagatttcag tttcctactg cagtttccta cctgcagatc caggggctgc 13080 tgttgccttt ggatgcccca ctgaggtcct agagtgcctc cagggtggtc ttcctgtagt 13140 cataacagct agccagtgct caccagctta ccagattgcc aggactaagc catcccaaag 13200 cacaagcatt gtgtgtctct gtgactgcag agaagagaga attttgcttc tgttttgtgt 13260 ttaaaaaacc aacacggaag cagatgatcc cgagagagag gcctctagca tgggtgaccc 13320 agccgacctc aggccggttt ccgcactgcc acaactttgt tcaaagttgc ccccaattgg 13380 aacctgccac ttggcattag agggtctttc atggggagag aaggagactg aattactcta 13440 agcaaaatgt gaaaagtaag gaaatcagcc tttcatcccg gtcctaagta accgtcagcc 13500 gaaggtctcg tggaacacag gcaaacccgt gattttggtg ctccttgtaa ctcagccctg 13560 caaagcaaag tcccattgat ttaagttgtt tgcatttgta ctggcaaggc aaaatatttt 13620 tattaccttt tctattactt attgtatgag cttttgttgt ttacttggag gttttgtctt 13680 ttactacaag tttggaacta tttattattg cttggtattt gtgctctgtt taagaaacag 13740 gcactttttt ttattatgga taaaatgttg agatgacagg aggtcatttc aatatggctt 13800 agtaaaatat ttattgttcc tttattctct gtacaagatt ttgggcctct ttttttcctt 13860 aatgtcacaa tgttgagttc agcatgtgtc tgccatttca tttgtacgct tgttcaaaac 13920 caagtttgtt ctggtttcaa gttataaaaa taaattggac atttaacttg atctccaaac 13980 cttgtccttt tctgtgtctt ttaaaggtgg gggatggaca gcttatttcc aagggcaaat 14040 tgaaagtctt tctccatttt cttcctgacc caaatcttta agcccatcga gaggatgaca 14100 ggaaatcatg gcacgagagc cctatagttc tcttagctcc tgtgcagcag tgtgatctag 14160 aacagtggtt ctcagcccag ttgcacatgg gaatcttctg ggagctttca aaaatctcag 14220 ggcccgggag acatcccaga ccaattctgt cagaatctct ggaggcaggt cccagtatca 14280 gcatttttga aaatgatcca ggtgattctc ctatccaact gagcttgtga acaagtagtt 14340 gaaaagaaaa tacacttggc taggaatgat tagactcaag ttgagcctaa tacagctccc 14400 a 14401 <210> 13 <211> 19 <212> PRO <213> Artificial Sequence <220> <223> Artificial Sequence: Synthesized oligopeptide <400> 13 Cys Leu Lys Ala Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro 1 5 10 15 Ser Leu Gly
【図面の簡単な説明】
【図1】ATL1遺伝子のゲノム構造と制限酵素地図を示
す。
【図2】ATL1 mRNAとゲノム構造との比較を示す。
【図3】ATL1αのアミノ酸配列と特徴的モチーフを示
す。矢印は各エクソンの境界、下線および二重線は、そ
れぞれC2H2型Znフィンガードメインおよび富プロリン領
域を示す。囲み領域は富酸性アミノ酸領域である。
【図4】正常組織由来mRNAを用いたATL1遺伝子のノザン
ブロットを示す。
【図5】正常組織におけるATL1遺伝子のRT-PCR解析の結
果を示す。
【図6】ヒト抹消血リンパ球におけるATL1遺伝子発現の
RT-PCR解析の結果を示す。
【図7】ATL細胞株由来mRNAを用いたATL1遺伝子のノザ
ンブロットを示す。
【図8】ATL1遺伝子のゲノム構造と、染色体異常によっ
て引き起こされた遺伝子再配列を示す。
【図9】ATL1タンパク質の細胞内局在を示す。抗ATL1抗
体を用いた免疫染色の結果から明かなように、ATL1タン
パク質は核内でドット状に局在している。
【図10】COS7細胞に強制発現させたATL1遺伝子産物の
抗ATL1抗体を用いたウエスタン法による検出結果を示
す。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) C12N 1/21 A61K 45/00 5/10 A61P 35/02 // A61K 45/00 C12N 15/00 ZNAA A61P 35/02 5/00 A Fターム(参考) 4B024 AA01 BA36 CA03 CA04 CA12 GA11 4B065 AA19X AA26X AA72X AA90X AA95Y AB01 AC14 BA02 CA24 CA25 CA44 4C084 AA17 NA14 ZB27 4H045 AA10 AA11 BA10 CA40 DA75 EA20

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 ヒト14番染色体q32領域に存在し、配列
    番号2、4、6または8のアミノ酸配列を有するタンパク質
    をコードする成人T細胞白血病(ATL)関連遺伝子。
  2. 【請求項2】 転写されたmRNAから合成されるcDNAが、
    配列番号1、3、5または7の塩基配列を有する請求項1の
    ATL関連遺伝子。
  3. 【請求項3】 配列番号9-12のいずれか1以上の塩基配
    列を含む請求項1のATL関連遺伝子。
  4. 【請求項4】 請求項1のATL関連遺伝子のゲノムDNA、
    mRNA、cDNAまたはそれらの相補配列から精製されたポリ
    ヌクレオチド。
  5. 【請求項5】 請求項1のATL関連遺伝子または請求項
    4のポリヌクレオチドにハイブリダイズする、10塩基対
    以上の塩基配列からなるオリゴヌクレオチド。
  6. 【請求項6】 請求項4のポリヌクレオチドを保有する
    組換えベクター。
  7. 【請求項7】 請求項6の組換えベクターによる形質転
    換体細胞。
  8. 【請求項8】 請求項1のATL関連遺伝子の発現産物で
    あって、配列番号2、4、6または8のアミノ酸配列を有す
    ることを特徴とするATL関連タンパク質。
  9. 【請求項9】 請求項7の形質転換体細胞によって産生
    される請求項8のATL関連タンパク質。
  10. 【請求項10】 配列番号2、4、6または8の連続5アミ
    ノ酸残基以上のアミノ配列からなるATL関連ペプチド。
  11. 【請求項11】 請求項8のATL関連タンパク質を認識
    する抗体。
JP2001313067A 2001-10-10 2001-10-10 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 Pending JP2003116558A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001313067A JP2003116558A (ja) 2001-10-10 2001-10-10 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001313067A JP2003116558A (ja) 2001-10-10 2001-10-10 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質

Publications (1)

Publication Number Publication Date
JP2003116558A true JP2003116558A (ja) 2003-04-22

Family

ID=19131621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001313067A Pending JP2003116558A (ja) 2001-10-10 2001-10-10 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質

Country Status (1)

Country Link
JP (1) JP2003116558A (ja)

Similar Documents

Publication Publication Date Title
AU2022201329B2 (en) Genetically modified cells, tissues, and organs for treating disease
CN114176043B (zh) 用于治疗疾病的遗传修饰的细胞、组织和器官
KR102507624B1 (ko) C/ebp 알파 짧은 활성화 rna 조성물 및 사용 방법
KR102301464B1 (ko) 종양 세포에 의한 면역 억제를 감소시키기 위한 방법 및 조성물
US11103538B2 (en) Targeting epigenetic regulators using a bacterial delivery system
AU2021202758A1 (en) Terminally modified RNA
KR101840618B1 (ko) 종양 억제 유전자에 대한 천연 안티센스 전사체의 억제에 의해 종양 억제 유전자 관련된 질환의 치료
KR20210138587A (ko) 개선된 면역요법을 위한 조합 유전자 표적
US12473334B2 (en) SWI/SNF family chromatin remodeling complexes and uses thereof
AU2016364667A1 (en) Materials and methods for treatment of Alpha-1 antitrypsin deficiency
AU2016376191A1 (en) Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration
KR20230034198A (ko) 종양 침윤 림프구의 활성화 및 확장 방법
KR20120082906A (ko) 자가포식현상-향상 유전자 생성물의 조절을 통한 자가포식현상의 조절 방법
WO2001012659A2 (en) Human dna sequences
KR20220077916A (ko) 세포를 형질세포양 수지상 세포 또는 인터페론 유형 i-생산 세포로 재프로그래밍하기 위한 조성물, 방법 및 이의 용도
US20030207286A1 (en) Nucleic acid sequences showing enhanced expression in benign neuroblastoma compared with acritical human neuroblastoma
US12478665B2 (en) Cancer vaccine compositions and methods for using same to prevent and/or treat cancer
AU2012337708B2 (en) Marker for diagnosing forelimb-girdle muscular anomaly in mammal individual, and detection method using same
JP2003116558A (ja) 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質
US20030064379A1 (en) Novel polynucleotides and method of use thereof
US20040110194A1 (en) Genes regulated by human cytokines
KR20140083735A (ko) 폐암 진단용 융합유전자

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20031031

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040129