JP2003116558A - 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 - Google Patents
成人t細胞白血病(atl)関連遺伝子とその発現タンパク質Info
- Publication number
- JP2003116558A JP2003116558A JP2001313067A JP2001313067A JP2003116558A JP 2003116558 A JP2003116558 A JP 2003116558A JP 2001313067 A JP2001313067 A JP 2001313067A JP 2001313067 A JP2001313067 A JP 2001313067A JP 2003116558 A JP2003116558 A JP 2003116558A
- Authority
- JP
- Japan
- Prior art keywords
- gly
- pro
- leu
- ser
- glu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
(57)【要約】 (修正有)
【課題】 成人T細胞白血病(ATL)発症に関係する細
胞内遺伝子と、この遺伝子から発現される各タンパク
質、およびこれらタンパク質を認識する抗体を提供す
る。 【解決手段】 ヒト14番染色体q32領域に存在し、特定
のアミノ酸配列からなるタンパク質をコードする成人T
細胞白血病(ATL)関連遺伝子、この遺伝子由来のポリ
ヌクレオチド、この遺伝子の発現産物であるATL関連の
各タンパク質、ならびにATL関連タンパク質を認識する
抗体。
胞内遺伝子と、この遺伝子から発現される各タンパク
質、およびこれらタンパク質を認識する抗体を提供す
る。 【解決手段】 ヒト14番染色体q32領域に存在し、特定
のアミノ酸配列からなるタンパク質をコードする成人T
細胞白血病(ATL)関連遺伝子、この遺伝子由来のポリ
ヌクレオチド、この遺伝子の発現産物であるATL関連の
各タンパク質、ならびにATL関連タンパク質を認識する
抗体。
Description
【0001】
【発明の属する技術分野】この出願の発明は、成人T細
胞白血病(Adult T cell Leukemia: ATL)関連遺伝子と
その発現タンパク質に関するものである。さらに詳しく
は、この出願は、ATLの診断や治療に有用なATL関連遺伝
子とその発現タンパク質、タンパク質に対する抗体に関
するものである。
胞白血病(Adult T cell Leukemia: ATL)関連遺伝子と
その発現タンパク質に関するものである。さらに詳しく
は、この出願は、ATLの診断や治療に有用なATL関連遺伝
子とその発現タンパク質、タンパク質に対する抗体に関
するものである。
【0002】
【従来の技術とその課題】成人T細胞白血病(ATL)は、
HTLV-Iウイルス感染を原因の一つとする白血病であり、
日本では九州等を中心として多発している。一方で、発
症までの長い潜伏期間ならびにウイルス感染者の低い発
症率、さらには白血病細胞中に全くHTLV-Iウイルス由来
の遺伝子発現が認められないケースが存在するという事
実は、ウイルス以外の内在性遺伝子の変化がATL発症に
深く関与していることを強く示唆する。しかしながら、
現在までATLの発症機構を説明する細胞内遺伝子の変化
についてはほとんど解明されていない。
HTLV-Iウイルス感染を原因の一つとする白血病であり、
日本では九州等を中心として多発している。一方で、発
症までの長い潜伏期間ならびにウイルス感染者の低い発
症率、さらには白血病細胞中に全くHTLV-Iウイルス由来
の遺伝子発現が認められないケースが存在するという事
実は、ウイルス以外の内在性遺伝子の変化がATL発症に
深く関与していることを強く示唆する。しかしながら、
現在までATLの発症機構を説明する細胞内遺伝子の変化
についてはほとんど解明されていない。
【0003】従来、多くの白血病では特異的な染色体転
座に着目し、その転座切断点近傍から多数の癌関連遺伝
子が単離されている。しかしながら、ATLにおける染色
体異常は非常に複雑で、僅かな症例数について解析を行
っただけではその共通性を抽出することができず、これ
までにこの手法によってATL関連遺伝子を単離すること
は成功していなかった。
座に着目し、その転座切断点近傍から多数の癌関連遺伝
子が単離されている。しかしながら、ATLにおける染色
体異常は非常に複雑で、僅かな症例数について解析を行
っただけではその共通性を抽出することができず、これ
までにこの手法によってATL関連遺伝子を単離すること
は成功していなかった。
【0004】この出願の発明は、以上のとおりの事情に
鑑みてなされたものであって、ATL発症に関係する細胞
内遺伝子と、その遺伝子から発現される複数のタンパク
質、およびこれらタンパク質を認識する抗体を提供する
ことを課題としている。
鑑みてなされたものであって、ATL発症に関係する細胞
内遺伝子と、その遺伝子から発現される複数のタンパク
質、およびこれらタンパク質を認識する抗体を提供する
ことを課題としている。
【0005】
【課題を解決するための手段】この出願は、前記の課題
を解決するものとして、以下の(1)〜(11)の発明を提供
する。 (1) ヒト14番染色体q32領域に存在し、配列番号2、4、
6または8のアミノ酸配列を有するタンパク質をコードす
る成人T細胞白血病(ATL)関連遺伝子。 (2) 配列番号9-12の塩基配列を含み、各塩基配列にお
いて指定したエクソン(exon)領域が、それぞれエクソ
ン1、2、3および4である前記発明(1)のATL関連遺伝子。 (3) 転写されたmRNAから合成されるcDNAが、配列番号
1、3、5または7の塩基配列を有する前記発明(1)のATL関
連遺伝子。 (4) 前記発明(1)のATL関連遺伝子のゲノムDNA、mRNA、
cDNAまたはそれらの相補配列から精製されたポリヌクレ
オチド。 (5) 前記発明(1)のATL関連遺伝子または前記発明(4)の
ポリヌクレオチドにハイブリダイズする、10塩基対以上
の塩基配列からなるオリゴヌクレオチド。 (6) 前記発明(4)のポリヌクレオチドを保有する組換え
ベクター。 (7) 前記発明(6)の組換えベクターによる形質転換体細
胞。 (8) 前記発明(1)のATL関連遺伝子の発現産物であっ
て、配列番号2、4、6または8のアミノ酸配列を有するこ
とを特徴とするATL関連タンパク質。 (9) 前記発明(7)の形質転換体細胞によって産生される
前記発明(8)のATL関連タンパク質。 (10) 配列番号2、4、6または8の連続5アミノ酸残基以
上のアミノ配列からなるATL関連ペプチド。 (11) 前記発明(8)のATL関連タンパク質を認識する抗
体。
を解決するものとして、以下の(1)〜(11)の発明を提供
する。 (1) ヒト14番染色体q32領域に存在し、配列番号2、4、
6または8のアミノ酸配列を有するタンパク質をコードす
る成人T細胞白血病(ATL)関連遺伝子。 (2) 配列番号9-12の塩基配列を含み、各塩基配列にお
いて指定したエクソン(exon)領域が、それぞれエクソ
ン1、2、3および4である前記発明(1)のATL関連遺伝子。 (3) 転写されたmRNAから合成されるcDNAが、配列番号
1、3、5または7の塩基配列を有する前記発明(1)のATL関
連遺伝子。 (4) 前記発明(1)のATL関連遺伝子のゲノムDNA、mRNA、
cDNAまたはそれらの相補配列から精製されたポリヌクレ
オチド。 (5) 前記発明(1)のATL関連遺伝子または前記発明(4)の
ポリヌクレオチドにハイブリダイズする、10塩基対以上
の塩基配列からなるオリゴヌクレオチド。 (6) 前記発明(4)のポリヌクレオチドを保有する組換え
ベクター。 (7) 前記発明(6)の組換えベクターによる形質転換体細
胞。 (8) 前記発明(1)のATL関連遺伝子の発現産物であっ
て、配列番号2、4、6または8のアミノ酸配列を有するこ
とを特徴とするATL関連タンパク質。 (9) 前記発明(7)の形質転換体細胞によって産生される
前記発明(8)のATL関連タンパク質。 (10) 配列番号2、4、6または8の連続5アミノ酸残基以
上のアミノ配列からなるATL関連ペプチド。 (11) 前記発明(8)のATL関連タンパク質を認識する抗
体。
【0006】すなわち、この出願の発明者らは、50症例
におよぶATL患者試料の詳細な解析を行い、ATL患者全体
の約10%に異常が認められることが知られていたヒト14
番染色体q32領域(以下、14q32と記載することがある)
に存在する特定の約100kbの領域に限局して染色体転座
が生じていることを見出した。さらに、この領域に存在
する遺伝子の探索を行い、ATLとの関連性について解析
を行った結果、正常組織では主としてT細胞で高い発現
を示す新規遺伝子を見出した。ATLでは、しばしばプロ
モーター領域を含めたこの遺伝子内で染色体転座が生
じ、遺伝子の破壊が引き起こされているいことから、こ
の遺伝子はATLの発症に関与する癌抑制遺伝子であるこ
とが示唆された。そして、この遺伝子(ATL1)は、その
エクソン1-4(それぞれ配列番号9-12の塩基配列に示さ
れたエクソン領域)が関与する選択的スプライシングに
よって、それぞれ約8.6kbと6.6kbからなる4種類のタン
パク質(以下、それぞれをATLα、ATL1β、ATL1γ、ATL
1δと記載することがある)を発現することが確認され
た。
におよぶATL患者試料の詳細な解析を行い、ATL患者全体
の約10%に異常が認められることが知られていたヒト14
番染色体q32領域(以下、14q32と記載することがある)
に存在する特定の約100kbの領域に限局して染色体転座
が生じていることを見出した。さらに、この領域に存在
する遺伝子の探索を行い、ATLとの関連性について解析
を行った結果、正常組織では主としてT細胞で高い発現
を示す新規遺伝子を見出した。ATLでは、しばしばプロ
モーター領域を含めたこの遺伝子内で染色体転座が生
じ、遺伝子の破壊が引き起こされているいことから、こ
の遺伝子はATLの発症に関与する癌抑制遺伝子であるこ
とが示唆された。そして、この遺伝子(ATL1)は、その
エクソン1-4(それぞれ配列番号9-12の塩基配列に示さ
れたエクソン領域)が関与する選択的スプライシングに
よって、それぞれ約8.6kbと6.6kbからなる4種類のタン
パク質(以下、それぞれをATLα、ATL1β、ATL1γ、ATL
1δと記載することがある)を発現することが確認され
た。
【0007】この出願の発明は、以上のとおりの新規ヒ
ト遺伝子およびその発現タンパク質を基礎とするもので
ある。以下、この出願の発明について、実施形態を詳し
く説明する。
ト遺伝子およびその発現タンパク質を基礎とするもので
ある。以下、この出願の発明について、実施形態を詳し
く説明する。
【0008】
【発明の実施の形態】発明(1)のATL関連遺伝子ATL1は、
前記のとおりATL患者の多くに共通する14q32領域の染色
体転座部位から単離された遺伝子であって、配列番号
2、4、6または8のアミン酸配列を有するATL関連タンパ
ク質(すなわち、配列番号2:ATLα、配列番号4:ATL1
β、配列番号6:ATL1γ、配列番号8:ATL1δ)をコード
するヒトゲノム遺伝子である。さらに詳しくは、この遺
伝子ATL1は、mRNAから合成されたcDNAが、配列番号1、
3、5または7の塩基配列を有している。またこのATL1遺
伝子は、配列番号9-12のいずれか1以上の塩基配列を含
んでおり、これら配列番号9-12の各塩基配列において指
定したエクソン(exon)領域が、それぞれエクソン1、
2、3および4を構成している。
前記のとおりATL患者の多くに共通する14q32領域の染色
体転座部位から単離された遺伝子であって、配列番号
2、4、6または8のアミン酸配列を有するATL関連タンパ
ク質(すなわち、配列番号2:ATLα、配列番号4:ATL1
β、配列番号6:ATL1γ、配列番号8:ATL1δ)をコード
するヒトゲノム遺伝子である。さらに詳しくは、この遺
伝子ATL1は、mRNAから合成されたcDNAが、配列番号1、
3、5または7の塩基配列を有している。またこのATL1遺
伝子は、配列番号9-12のいずれか1以上の塩基配列を含
んでおり、これら配列番号9-12の各塩基配列において指
定したエクソン(exon)領域が、それぞれエクソン1、
2、3および4を構成している。
【0009】この遺伝子ATL1は、配列番号2のアミノ酸
配列からなるタンパク質ATL1αを発現するとともに、ス
プライスの様式の違いにより3種類のアイソフォーム
(ATL1β、ATL1γ、ATL1δ)を発現する。
配列からなるタンパク質ATL1αを発現するとともに、ス
プライスの様式の違いにより3種類のアイソフォーム
(ATL1β、ATL1γ、ATL1δ)を発現する。
【0010】このATL1遺伝子の発現レベルの変化や構造
破壊は、後記実施例で詳しく説明するとおり、ATLの発
症に密接に関係している。従って、この遺伝子ATL1の構
造異常の検出や、あるいはそれが発現するタンパク質の
構造異常や発現レベルの解析、あるいはタンパク質に対
する抗体は、ATLの悪性度や予後の予測、さらには正常
細胞とATL等の白血病細胞とを区別するために利用する
ことができる。
破壊は、後記実施例で詳しく説明するとおり、ATLの発
症に密接に関係している。従って、この遺伝子ATL1の構
造異常の検出や、あるいはそれが発現するタンパク質の
構造異常や発現レベルの解析、あるいはタンパク質に対
する抗体は、ATLの悪性度や予後の予測、さらには正常
細胞とATL等の白血病細胞とを区別するために利用する
ことができる。
【0011】なお、この発明(1)の遺伝子ATL1には、そ
れがコードするタンパク質の発現に対する制御領域(プ
ロモーター/エンハンサー、サプレッサー等)も含まれ
る。これらの発現制御領域は、ATL関連タンパク質の機
能やATL関連遺伝子の欠失変異等のメカニズムを解明す
るためにも有用である。
れがコードするタンパク質の発現に対する制御領域(プ
ロモーター/エンハンサー、サプレッサー等)も含まれ
る。これらの発現制御領域は、ATL関連タンパク質の機
能やATL関連遺伝子の欠失変異等のメカニズムを解明す
るためにも有用である。
【0012】この発明(1)のATL1遺伝子は、例えば、配
列番号1、9-12の塩基配列またはその一部配列からなる
ヌクレオチドプローブを用いてヒトゲノムDNAライブラ
リーをスクリーニングすることによって単離するするこ
とができる。また、プロモーター領域やエクソン3が染
色体転座によって欠失した遺伝子は、ATL患者のゲノムD
NAに存在しており、前記と同様のプローブハイブリダイ
ゼーションを用いたスクリーニングによって単離するこ
とができる。そして、前記のヌクレオチドプローブを用
いて遺伝子配列を調べることで、遺伝子の構造異常箇所
を特定することができる。
列番号1、9-12の塩基配列またはその一部配列からなる
ヌクレオチドプローブを用いてヒトゲノムDNAライブラ
リーをスクリーニングすることによって単離するするこ
とができる。また、プロモーター領域やエクソン3が染
色体転座によって欠失した遺伝子は、ATL患者のゲノムD
NAに存在しており、前記と同様のプローブハイブリダイ
ゼーションを用いたスクリーニングによって単離するこ
とができる。そして、前記のヌクレオチドプローブを用
いて遺伝子配列を調べることで、遺伝子の構造異常箇所
を特定することができる。
【0013】発明(4)は、前記発明(1)のATL1遺伝子のゲ
ノムDNA、mRNA、cDNAまたはこれらの相補配列から精製
されたポリヌクレオチドである。このようなポリヌクレ
オチドは、オリゴヌクレオチドの調製や、ATL関連タン
パク質の遺伝子工学的作成のための材料として有用であ
る。
ノムDNA、mRNA、cDNAまたはこれらの相補配列から精製
されたポリヌクレオチドである。このようなポリヌクレ
オチドは、オリゴヌクレオチドの調製や、ATL関連タン
パク質の遺伝子工学的作成のための材料として有用であ
る。
【0014】これらのポリヌクレオチドは、ヒト細胞か
ら単離したゲノムDNAやmRNAから公知の方法により精製
することによってDNA断片やRNA断片として得ることがで
きる。また、cDNAはヒト細胞から抽出したポリ(A)+RNA
を鋳型として合成することができる。ヒト細胞として
は、人体から手術などによって摘出されたものでも培養
細胞でも良い。cDNAは、公知の方法(Mol. Cell Biol.
2, 161-170, 1982; J.Gene 25, 263-269, 1983; Gen
e, 150, 243-250, 1994)を用いて合成することができ
る。あるいは、オリゴヌクレオチドをプライマ−とし
て、ヒト細胞から単離したmRNAを鋳型とするRT-PCR法を
用いて、目的cDNAを合成することもできる。このように
して調製されるcDNAは、例えばATL1αをコードするcDNA
の場合には配列番号1の塩基配列を有している。この配
列番号1において、位置1-1033はエクソン1、位置1034-1
402はエクソン2、位置1403-1615はエクソン3、そして位
置1616-8433はエクソン4に由来する。また、ATL1β、AT
L1γ、ATL1δをそれぞれ発現するATL1遺伝子からは、配
列番号3、5および7のそれぞれの塩基配列からなるcDNA
が合成される。
ら単離したゲノムDNAやmRNAから公知の方法により精製
することによってDNA断片やRNA断片として得ることがで
きる。また、cDNAはヒト細胞から抽出したポリ(A)+RNA
を鋳型として合成することができる。ヒト細胞として
は、人体から手術などによって摘出されたものでも培養
細胞でも良い。cDNAは、公知の方法(Mol. Cell Biol.
2, 161-170, 1982; J.Gene 25, 263-269, 1983; Gen
e, 150, 243-250, 1994)を用いて合成することができ
る。あるいは、オリゴヌクレオチドをプライマ−とし
て、ヒト細胞から単離したmRNAを鋳型とするRT-PCR法を
用いて、目的cDNAを合成することもできる。このように
して調製されるcDNAは、例えばATL1αをコードするcDNA
の場合には配列番号1の塩基配列を有している。この配
列番号1において、位置1-1033はエクソン1、位置1034-1
402はエクソン2、位置1403-1615はエクソン3、そして位
置1616-8433はエクソン4に由来する。また、ATL1β、AT
L1γ、ATL1δをそれぞれ発現するATL1遺伝子からは、配
列番号3、5および7のそれぞれの塩基配列からなるcDNA
が合成される。
【0015】発明(5)は、前記発明(1)のATL1遺伝子また
は前記発明(4)のポリヌクレオチドにハイブリダイズす
る、10塩基対以上の塩基配列からなるオリゴヌクレオチ
ドである。これらのオリゴヌクレオチド(DNA断片また
はRNA断片、若しくはそれらのアンチセンス鎖)は、例
えば、ATL1遺伝子やその変異を検出するためのプロー
ブ、あるいはポリヌクレオチドを合成するためのPCRプ
ライマーとして有用である。また、ATL診断用のマイク
ロアレイのためのプローブとして使用することもでき
る。
は前記発明(4)のポリヌクレオチドにハイブリダイズす
る、10塩基対以上の塩基配列からなるオリゴヌクレオチ
ドである。これらのオリゴヌクレオチド(DNA断片また
はRNA断片、若しくはそれらのアンチセンス鎖)は、例
えば、ATL1遺伝子やその変異を検出するためのプロー
ブ、あるいはポリヌクレオチドを合成するためのPCRプ
ライマーとして有用である。また、ATL診断用のマイク
ロアレイのためのプローブとして使用することもでき
る。
【0016】発明(6)は、発明(4)のポリヌクレオチドを
保有する組換えベクターである。ベクターはクローニン
グベクターまたは発現ベクターであり、インサートして
のポリヌクレオチドの種類や、その使用目的等に応じて
適宜のものを使用する。例えば、cDNAまたはそのORF領
域をインサートとして各ATL関連タンパク質を生産する
場合には、インビトロ転写用の発現ベクターや、大腸
菌、枯草菌等の原核細胞や、酵母、昆虫細胞、哺乳動物
細胞等の真核細胞のそれぞれに適した発現ベクターを使
用することができる。また、各ATL1遺伝子のゲノムDNA
をインサートとする場合には、BAC(Bacterial Artific
ial Chromosome)ベクターやコスミドベクター等を使用
することもでき、こられらの組換えベクターは、例えば
蛍光in situハイブリダイゼーション(FISH)による染
色体異常を診断するためのプローブとして有用である。
さらには、正常なATL1遺伝子由来のポリヌクレオチドを
ウイルスベクター等に組換え、これを遺伝子治療に用い
ることもできる。
保有する組換えベクターである。ベクターはクローニン
グベクターまたは発現ベクターであり、インサートして
のポリヌクレオチドの種類や、その使用目的等に応じて
適宜のものを使用する。例えば、cDNAまたはそのORF領
域をインサートとして各ATL関連タンパク質を生産する
場合には、インビトロ転写用の発現ベクターや、大腸
菌、枯草菌等の原核細胞や、酵母、昆虫細胞、哺乳動物
細胞等の真核細胞のそれぞれに適した発現ベクターを使
用することができる。また、各ATL1遺伝子のゲノムDNA
をインサートとする場合には、BAC(Bacterial Artific
ial Chromosome)ベクターやコスミドベクター等を使用
することもでき、こられらの組換えベクターは、例えば
蛍光in situハイブリダイゼーション(FISH)による染
色体異常を診断するためのプローブとして有用である。
さらには、正常なATL1遺伝子由来のポリヌクレオチドを
ウイルスベクター等に組換え、これを遺伝子治療に用い
ることもできる。
【0017】発明(7)は、発明(6)の組換えベクターによ
る形質転換体細胞である。これらの細胞は、例えば、各
ATL関連タンパク質を製造する場合には、大腸菌、枯草
菌等の原核細胞や、酵母、昆虫細胞、哺乳動物細胞等の
真核細胞等を使用することができる。また、正常なATL1
遺伝子由来のポリヌクレオチドを組み換えたウイルスベ
クターによって形質転換したATL患者由来のT細胞は、遺
伝子治療に用いることもできる。こららの形質転換体細
胞は、電気穿孔法、リン酸カルシウム法、リポソーム
法、DEAEデキストラン法など公知の方法によって組換え
ベクターを細胞に導入することによって調製することが
できる。
る形質転換体細胞である。これらの細胞は、例えば、各
ATL関連タンパク質を製造する場合には、大腸菌、枯草
菌等の原核細胞や、酵母、昆虫細胞、哺乳動物細胞等の
真核細胞等を使用することができる。また、正常なATL1
遺伝子由来のポリヌクレオチドを組み換えたウイルスベ
クターによって形質転換したATL患者由来のT細胞は、遺
伝子治療に用いることもできる。こららの形質転換体細
胞は、電気穿孔法、リン酸カルシウム法、リポソーム
法、DEAEデキストラン法など公知の方法によって組換え
ベクターを細胞に導入することによって調製することが
できる。
【0018】発明(8)は、前記発明(1)のATL1遺伝子の発
現産物であって、配列番号2、4、6および8のアミノ酸配
列をそれぞれ有することを特徴とするATL関連タンパク
質ATLα、ATL1β、ATL1γ、ATL1δである。これらのタ
ンパク質は、抗体作製のための免疫原として、あるいは
ATL治療薬を開発するための標的分子等として有用であ
る。このタンパク質は、ヒト細胞から単離する方法、配
列番号2、4、6および8のそれぞれのアミノ酸配列に基づ
き化学合成によってペプチドを調製する方法等によって
得ることができるが、好ましくは、発明(7)の形質転換
細胞から単離・精製する方法によって大量に生産せるこ
とができる。すなわち、形質転換体細胞を培養し、その
培養物から、例えば、尿素などの変性剤や界面活性剤に
よる処理、超音波処理、酵素消化、塩析や溶媒沈殿法、
透析、遠心分離、限外濾過、ゲル濾過、SDS-PAGE、等電
点電気泳動、イオン交換クロマトグラフィー、疎水性ク
ロマトグラフィー、アフィニティークロマトグラフィ
ー、逆相クロマトグラフィー等によって単離、精製する
ことによって各ATL関連タンパク質(発明(9))を大量に
得ることができる。なお、発明(9)のタンパク質には、
他の任意の蛋白質との融合蛋白質も含まれる。例えば、
ヒスチジンタグ、グルタチン−S−トランスフェラ−ゼ
(GST)や緑色蛍光蛋白質(GFP)との融合蛋白質などが
例示できる。さらに、細胞で発現したタンパク質は、翻
訳された後、細胞内で各種修飾を受ける場合がある。し
たがって、修飾されたタンパク質も発明(9)のタンパク
質の範囲に含まれる。このような翻訳後修飾としては、
N末端メチオニンの脱離、N末端アセチル化、糖鎖付
加、細胞内プロテア−ゼによる限定分解、ミリストイル
化、イソプレニル化、リン酸化などである。
現産物であって、配列番号2、4、6および8のアミノ酸配
列をそれぞれ有することを特徴とするATL関連タンパク
質ATLα、ATL1β、ATL1γ、ATL1δである。これらのタ
ンパク質は、抗体作製のための免疫原として、あるいは
ATL治療薬を開発するための標的分子等として有用であ
る。このタンパク質は、ヒト細胞から単離する方法、配
列番号2、4、6および8のそれぞれのアミノ酸配列に基づ
き化学合成によってペプチドを調製する方法等によって
得ることができるが、好ましくは、発明(7)の形質転換
細胞から単離・精製する方法によって大量に生産せるこ
とができる。すなわち、形質転換体細胞を培養し、その
培養物から、例えば、尿素などの変性剤や界面活性剤に
よる処理、超音波処理、酵素消化、塩析や溶媒沈殿法、
透析、遠心分離、限外濾過、ゲル濾過、SDS-PAGE、等電
点電気泳動、イオン交換クロマトグラフィー、疎水性ク
ロマトグラフィー、アフィニティークロマトグラフィ
ー、逆相クロマトグラフィー等によって単離、精製する
ことによって各ATL関連タンパク質(発明(9))を大量に
得ることができる。なお、発明(9)のタンパク質には、
他の任意の蛋白質との融合蛋白質も含まれる。例えば、
ヒスチジンタグ、グルタチン−S−トランスフェラ−ゼ
(GST)や緑色蛍光蛋白質(GFP)との融合蛋白質などが
例示できる。さらに、細胞で発現したタンパク質は、翻
訳された後、細胞内で各種修飾を受ける場合がある。し
たがって、修飾されたタンパク質も発明(9)のタンパク
質の範囲に含まれる。このような翻訳後修飾としては、
N末端メチオニンの脱離、N末端アセチル化、糖鎖付
加、細胞内プロテア−ゼによる限定分解、ミリストイル
化、イソプレニル化、リン酸化などである。
【0019】発明(10)は、配列番号2、4、6または8の連
続5アミノ酸残基以上のアミノ酸配列からなるオリゴペ
プチドである。このオリゴペプチドは、例えば抗体作製
のための抗原として使用することができ、例えば、各ア
ミノ酸配列に基づき、公知のペプチド合成法等により作
成することができる。
続5アミノ酸残基以上のアミノ酸配列からなるオリゴペ
プチドである。このオリゴペプチドは、例えば抗体作製
のための抗原として使用することができ、例えば、各ア
ミノ酸配列に基づき、公知のペプチド合成法等により作
成することができる。
【0020】発明(11)は、発明(8)のATL関連タンパク質
を認識するポリクローナル抗体またはモノクローナル抗
体である。例えば、ATLα、ATL1β、ATL1γおよびATL1
δのそれぞれの欠失アミノ酸残基の領域をカバーするオ
リゴペプチドを抗原とすることによって、これらの各AT
L関連タンパク質を個別に認識する抗体を得ることがで
きる。この抗体は、細胞での各ATL関連タンパク質の発
現を調べることによってATL診断を行うための材料等と
して有用である。この抗体には、ATL関連タンパク質の
エピトープに結合することができる全体分子、およびFa
b、F(ab')2、Fv断片等が全て含まれる。このような抗体
は、前記のATLタンパク質やペプチドを抗原として用い
て動物を免役した後、血清から得ることが出きる。ある
いは、上記の真核細胞用発現ベクターを注射や遺伝子銃
によって、動物の筋肉や皮膚に導入した後、血清を採取
することによって作製することができる。動物として
は、マウス、ラット、ウサギ、ヤギ、ニワトリなどが用
いられる。免疫した動物の脾臓から採取したB細胞をミ
エロ−マと融合させてハイブリド−マを作製すれば、モ
ノクロ−ナル抗体を産生することができる。
を認識するポリクローナル抗体またはモノクローナル抗
体である。例えば、ATLα、ATL1β、ATL1γおよびATL1
δのそれぞれの欠失アミノ酸残基の領域をカバーするオ
リゴペプチドを抗原とすることによって、これらの各AT
L関連タンパク質を個別に認識する抗体を得ることがで
きる。この抗体は、細胞での各ATL関連タンパク質の発
現を調べることによってATL診断を行うための材料等と
して有用である。この抗体には、ATL関連タンパク質の
エピトープに結合することができる全体分子、およびFa
b、F(ab')2、Fv断片等が全て含まれる。このような抗体
は、前記のATLタンパク質やペプチドを抗原として用い
て動物を免役した後、血清から得ることが出きる。ある
いは、上記の真核細胞用発現ベクターを注射や遺伝子銃
によって、動物の筋肉や皮膚に導入した後、血清を採取
することによって作製することができる。動物として
は、マウス、ラット、ウサギ、ヤギ、ニワトリなどが用
いられる。免疫した動物の脾臓から採取したB細胞をミ
エロ−マと融合させてハイブリド−マを作製すれば、モ
ノクロ−ナル抗体を産生することができる。
【0021】以下、実施例を示してこの出願の発明につ
いてさらに詳細かつ具体的に説明するが、この出願の発
明は以下の例によって限定されるものではない。
いてさらに詳細かつ具体的に説明するが、この出願の発
明は以下の例によって限定されるものではない。
【0022】
【実施例】実施例1:ATL関連遺伝子(ATL1)の同定
50症例の成人T細胞白血病患者について14番染色体q32領
域における染色体異常の好発領域を検索した結果、4症
例における染色体転座が約100kbの領域に集積している
ことを見いだした。そこでこの領域を網羅するヒトゲノ
ムクローンをバクテリア人工染色体(BAC)ライブラリー
ならびにコスミドライブラリーのスクリーニングにより
単離した。さらにこの領域に染色体異常を示す3症例に
ついて染色体転座の切断点をクローン化し、その周辺に
存在する遺伝子を探索した。その結果、図1に示すよう
な構造を持つ新規遺伝子を同定しATL1遺伝子と命名し
た。 実施例2:ATL関連遺伝子cDNAのクローニング ATL1遺伝子に対応するcDNAを、ヒト胸腺由来cDNAライブ
ラリーのスクリーニング、胸腺由来mRNAを用いた5'RACE
法ならびに3'RACE法によって単離した。得られたcDNAク
ローンとゲノムクローンとの構造を比較し、エクソン−
イントロン構造を決定した。
域における染色体異常の好発領域を検索した結果、4症
例における染色体転座が約100kbの領域に集積している
ことを見いだした。そこでこの領域を網羅するヒトゲノ
ムクローンをバクテリア人工染色体(BAC)ライブラリー
ならびにコスミドライブラリーのスクリーニングにより
単離した。さらにこの領域に染色体異常を示す3症例に
ついて染色体転座の切断点をクローン化し、その周辺に
存在する遺伝子を探索した。その結果、図1に示すよう
な構造を持つ新規遺伝子を同定しATL1遺伝子と命名し
た。 実施例2:ATL関連遺伝子cDNAのクローニング ATL1遺伝子に対応するcDNAを、ヒト胸腺由来cDNAライブ
ラリーのスクリーニング、胸腺由来mRNAを用いた5'RACE
法ならびに3'RACE法によって単離した。得られたcDNAク
ローンとゲノムクローンとの構造を比較し、エクソン−
イントロン構造を決定した。
【0023】図2に示すように、ATL1遺伝子は基本的に
4つのエクソンから構成されるが、エクソン2の5'側のス
プライシングの差異による1アミノ酸の有無、ならびに
エクソン3の有無によってATL1遺伝子は、ATL1α、ATL1
β、ATL1γ、ATL1δの少なくとも4種類のタンパク質を
コードする。さらにエクソン4の非翻訳領域に存在する2
種類のポリA付加シグナルの違いにより8.6kbと6.6kbの
転写産物を生じる。このATL1タンパク質のエクソン4に
よってコードされる領域には、図3に示すようにDNAや
タンパク質との相互作用に関わる6箇所のC2H2型のZnフ
ィンガードメインならびに1箇所のプロリンに富むドメ
インが存在し、これらのモチーフは、ATL1α、ATL1β、
ATL1γ、ATL1δの全てのアイソフォームに共通して存在
する。 実施例3:ノザン法およびRT-PCR法を用いた正常組織に
おける発現様式の解析 ATL1 cDNAをプローブとして各種組織由来のmRNAに対し
てノザン法による発現量の解析を行った。図4に示すよ
うに、成人正常組織ではATL1遺伝子由来の転写産物は、
主として胸腺ならびに末梢血白血球において、8.6と6.6
kbの位置に強いシグナルが検出された。
4つのエクソンから構成されるが、エクソン2の5'側のス
プライシングの差異による1アミノ酸の有無、ならびに
エクソン3の有無によってATL1遺伝子は、ATL1α、ATL1
β、ATL1γ、ATL1δの少なくとも4種類のタンパク質を
コードする。さらにエクソン4の非翻訳領域に存在する2
種類のポリA付加シグナルの違いにより8.6kbと6.6kbの
転写産物を生じる。このATL1タンパク質のエクソン4に
よってコードされる領域には、図3に示すようにDNAや
タンパク質との相互作用に関わる6箇所のC2H2型のZnフ
ィンガードメインならびに1箇所のプロリンに富むドメ
インが存在し、これらのモチーフは、ATL1α、ATL1β、
ATL1γ、ATL1δの全てのアイソフォームに共通して存在
する。 実施例3:ノザン法およびRT-PCR法を用いた正常組織に
おける発現様式の解析 ATL1 cDNAをプローブとして各種組織由来のmRNAに対し
てノザン法による発現量の解析を行った。図4に示すよ
うに、成人正常組織ではATL1遺伝子由来の転写産物は、
主として胸腺ならびに末梢血白血球において、8.6と6.6
kbの位置に強いシグナルが検出された。
【0024】RT-PCR法を用いて、より高感度に正常組織
における発現を調べると、ATL1遺伝子は、図5に示すよ
うに、上述の組織以外に、脾臓、リンパ節、骨髄、膵
臓、腎臓においても発現が検出された。末梢血白血球の
中では、主としてCD4陽性/CD8陰性のヘルパーT細胞な
らびに、CD4陰性/CD8陽性の細胞障害性T細胞においてA
TL1遺伝子の高い発現が検出され、CD14陽性の単球に
は、全く発現が検出されず、CD19陽性のB細胞で、弱い
発現が認められた。有糸分裂促進因子を用いて細胞増殖
の刺激を行うと、ヘルパーT細胞ならびに細胞障害性T細
胞におけるATL1遺伝子の発現は有意に減少した(図6参
照)。これらの結果は、ATL1遺伝子が正常組織では主と
してT細胞で発現し、増殖刺激によって発現が減少する
ことが明らかとなった。 実施例4:ATL患者におけるATL1遺伝子の発現 ATL由来細胞株における発現量をノザン法によって解析
すると、ATL1遺伝子は正常組織では主として胸腺細胞あ
るいは末梢血T細胞で発現しているにもかかわらず、AT
L由来細胞株ST-1、RST-1、KKI、ならびにHTLV-1ウイル
スによって形質転換されたT細胞株MT-1ならびにMT-2で
はATL1遺伝子の発現がほとんど検出されなかった。ATL
由来細胞株のうち、OMOTO細胞株とATN1細胞株では弱い
発現が観察されたが、それらの発現量は胸腺の、いずれ
もそれぞれ25%、あるいは、10%以下であった。(図
7) 実施例5:ATL患者における遺伝子変異の解析 ATL1遺伝子座周辺のゲノムクローンをプローブとしてFI
SH法を行い、ATL症例1ならびに2における染色体転座切
断点の位置を絞り込み、次に切断点周辺のゲノムDNA断
片をプローブとするサザン法によって切断点を限局化し
た。次にこれらの切断点をクローン化し、その切断点の
塩基配列を決定し、ATL1遺伝子との関連を解析した。そ
の結果、図8に示すように症例1ならびに2の染色体切断
点は、ATL1遺伝子のプロモーター領域に存在し、それぞ
れ17番あるいは、2番染色体との間で染色体転座を引き
起こしていた。症例3では、両対立遺伝子がATL1遺伝子
の3'非翻訳領域で染色体転座あるいは染色体逆位を伴う
染色体挿入を引き起こしていた。片方の対立遺伝子は、
6番染色体との染色体転座を引き起こし、もう一方の対
立遺伝子では、14番染色体のより動原体よりの領域との
染色体逆位ならびに染色体挿入を生じていた。その結
果、症例3では、全てのATL1対立遺伝子に染色体異常に
よる遺伝子破壊が引き起こされていた。
における発現を調べると、ATL1遺伝子は、図5に示すよ
うに、上述の組織以外に、脾臓、リンパ節、骨髄、膵
臓、腎臓においても発現が検出された。末梢血白血球の
中では、主としてCD4陽性/CD8陰性のヘルパーT細胞な
らびに、CD4陰性/CD8陽性の細胞障害性T細胞においてA
TL1遺伝子の高い発現が検出され、CD14陽性の単球に
は、全く発現が検出されず、CD19陽性のB細胞で、弱い
発現が認められた。有糸分裂促進因子を用いて細胞増殖
の刺激を行うと、ヘルパーT細胞ならびに細胞障害性T細
胞におけるATL1遺伝子の発現は有意に減少した(図6参
照)。これらの結果は、ATL1遺伝子が正常組織では主と
してT細胞で発現し、増殖刺激によって発現が減少する
ことが明らかとなった。 実施例4:ATL患者におけるATL1遺伝子の発現 ATL由来細胞株における発現量をノザン法によって解析
すると、ATL1遺伝子は正常組織では主として胸腺細胞あ
るいは末梢血T細胞で発現しているにもかかわらず、AT
L由来細胞株ST-1、RST-1、KKI、ならびにHTLV-1ウイル
スによって形質転換されたT細胞株MT-1ならびにMT-2で
はATL1遺伝子の発現がほとんど検出されなかった。ATL
由来細胞株のうち、OMOTO細胞株とATN1細胞株では弱い
発現が観察されたが、それらの発現量は胸腺の、いずれ
もそれぞれ25%、あるいは、10%以下であった。(図
7) 実施例5:ATL患者における遺伝子変異の解析 ATL1遺伝子座周辺のゲノムクローンをプローブとしてFI
SH法を行い、ATL症例1ならびに2における染色体転座切
断点の位置を絞り込み、次に切断点周辺のゲノムDNA断
片をプローブとするサザン法によって切断点を限局化し
た。次にこれらの切断点をクローン化し、その切断点の
塩基配列を決定し、ATL1遺伝子との関連を解析した。そ
の結果、図8に示すように症例1ならびに2の染色体切断
点は、ATL1遺伝子のプロモーター領域に存在し、それぞ
れ17番あるいは、2番染色体との間で染色体転座を引き
起こしていた。症例3では、両対立遺伝子がATL1遺伝子
の3'非翻訳領域で染色体転座あるいは染色体逆位を伴う
染色体挿入を引き起こしていた。片方の対立遺伝子は、
6番染色体との染色体転座を引き起こし、もう一方の対
立遺伝子では、14番染色体のより動原体よりの領域との
染色体逆位ならびに染色体挿入を生じていた。その結
果、症例3では、全てのATL1対立遺伝子に染色体異常に
よる遺伝子破壊が引き起こされていた。
【0025】ATL1遺伝子のプロモーターに染色体転座を
持つATL症例1あるいは3'非翻訳領域に染色体異常を持つ
ATL症例3由来のRNAを用いて、RT-PCR法による解析を行
った。いずれの症例もATLに典型的なCD4陽性/CD8陰性
の表現型を示すT細胞性の腫瘍であるにもかかわらず、
図6に示すように、ATL1遺伝子の発現は全く検出されな
かった。症例1では、片方の染色体のATL1遺伝子に破壊
が生じ、もう一方の染色体のATL1遺伝子は、正常である
にもかかわらずATL1遺伝子の発現が検出されなかった。
これは残された正常対立遺伝子のプロモーターがメチル
化による修飾によって不活化されたためであると考えら
れた。実際、ATL1遺伝子内で染色体異常が認められる頻
度は、全ATL患者の約10%であるにもかかわらず、大半
のATL症例でもATL1遺伝子の発現減少が観察された。こ
れらの発現減少もプロモーターのメチル化による不活化
機構によって説明される。ATL1遺伝子に構造的異常を持
つATL症例では物理的にATL1遺伝子が破壊されることに
よって発現が消失し、ATL1遺伝子に構造的異常を認めな
い場合でもプロモーターのメチル化などを介してATL1遺
伝子の発現低下が引き起こされていると考えられる。細
胞増殖刺激を受けたT細胞においてもATL1遺伝子発現の
減少が引き起こされることを考え合わせるとATL1遺伝子
が、細胞増殖を抑制的に制御する癌抑制遺伝子である可
能性が強く示唆される。ATL1遺伝子に構造異常を持つ症
例は、全て悪性度の高い急性型のATLであり、慢性型のA
TL症例には、全くこのような構造異常を見いだせなかっ
た。したがってATL1遺伝子の構造異常の検出あるいは、
発現レベルの測定は、癌の悪性度や予後の予測に応用可
能であると考えられる。 実施例6:ATL1抗体の作製ならびにATL1タンパク質の細
胞内局在 ATL1タンパク質由来の抗体を作製するためATL1タンパク
質の510番目から527番目にいたる領域のペプチド配列の
N端にKLHと結合するためのシステイン残基を付加したペ
プチド(NH2-CLKAADGDFRHHESDPSLG-COOH:配列番号13)を
合成し、このペプチドとキャリアータンパク質であるKL
HをMBSと呼ばれるリンカーを介して共有結合させ、ウサ
ギに対してアジュバントとともに4回の免疫を行い、抗
血清を作製した。得られた抗血清を、免疫に使用したペ
プチドが固定化された樹脂を用いてアフィニティークロ
マトグラフィーを行い、抗体を精製した。
持つATL症例1あるいは3'非翻訳領域に染色体異常を持つ
ATL症例3由来のRNAを用いて、RT-PCR法による解析を行
った。いずれの症例もATLに典型的なCD4陽性/CD8陰性
の表現型を示すT細胞性の腫瘍であるにもかかわらず、
図6に示すように、ATL1遺伝子の発現は全く検出されな
かった。症例1では、片方の染色体のATL1遺伝子に破壊
が生じ、もう一方の染色体のATL1遺伝子は、正常である
にもかかわらずATL1遺伝子の発現が検出されなかった。
これは残された正常対立遺伝子のプロモーターがメチル
化による修飾によって不活化されたためであると考えら
れた。実際、ATL1遺伝子内で染色体異常が認められる頻
度は、全ATL患者の約10%であるにもかかわらず、大半
のATL症例でもATL1遺伝子の発現減少が観察された。こ
れらの発現減少もプロモーターのメチル化による不活化
機構によって説明される。ATL1遺伝子に構造的異常を持
つATL症例では物理的にATL1遺伝子が破壊されることに
よって発現が消失し、ATL1遺伝子に構造的異常を認めな
い場合でもプロモーターのメチル化などを介してATL1遺
伝子の発現低下が引き起こされていると考えられる。細
胞増殖刺激を受けたT細胞においてもATL1遺伝子発現の
減少が引き起こされることを考え合わせるとATL1遺伝子
が、細胞増殖を抑制的に制御する癌抑制遺伝子である可
能性が強く示唆される。ATL1遺伝子に構造異常を持つ症
例は、全て悪性度の高い急性型のATLであり、慢性型のA
TL症例には、全くこのような構造異常を見いだせなかっ
た。したがってATL1遺伝子の構造異常の検出あるいは、
発現レベルの測定は、癌の悪性度や予後の予測に応用可
能であると考えられる。 実施例6:ATL1抗体の作製ならびにATL1タンパク質の細
胞内局在 ATL1タンパク質由来の抗体を作製するためATL1タンパク
質の510番目から527番目にいたる領域のペプチド配列の
N端にKLHと結合するためのシステイン残基を付加したペ
プチド(NH2-CLKAADGDFRHHESDPSLG-COOH:配列番号13)を
合成し、このペプチドとキャリアータンパク質であるKL
HをMBSと呼ばれるリンカーを介して共有結合させ、ウサ
ギに対してアジュバントとともに4回の免疫を行い、抗
血清を作製した。得られた抗血清を、免疫に使用したペ
プチドが固定化された樹脂を用いてアフィニティークロ
マトグラフィーを行い、抗体を精製した。
【0026】この抗体は、用いたペプチドを抗原とする
ELISA法による測定で、64,000倍以上のタイターを示し
た。また発現ベクターに組み込んだATL1遺伝子をサルの
腎臓由来細胞株(COS7細胞)で強制発現させた後、この抗
体を用いて免疫組織化学的染色により細胞内局在を調べ
ると、図9に示すように核内にドット状の特徴的分布を
示すATL1タンパク質が検出された。ATL1タンパク質がC2
H2タイプのZnフィンガードメインを有すること、ならび
に核内で発現していることを考慮するとATL1タンパク質
は核内で遺伝子転写因子として働いている可能性が強く
示唆される。
ELISA法による測定で、64,000倍以上のタイターを示し
た。また発現ベクターに組み込んだATL1遺伝子をサルの
腎臓由来細胞株(COS7細胞)で強制発現させた後、この抗
体を用いて免疫組織化学的染色により細胞内局在を調べ
ると、図9に示すように核内にドット状の特徴的分布を
示すATL1タンパク質が検出された。ATL1タンパク質がC2
H2タイプのZnフィンガードメインを有すること、ならび
に核内で発現していることを考慮するとATL1タンパク質
は核内で遺伝子転写因子として働いている可能性が強く
示唆される。
【0027】またATL1遺伝子をCOS7細胞株中で強制発現
させた後、抗ATL1抗体を用いたウエスタン法によってAT
L1タンパク質を検出したところ、図10に示すようにアミ
ノ酸の1次構造から予測される約96kDaの位置に単一のバ
ンドが観察された。
させた後、抗ATL1抗体を用いたウエスタン法によってAT
L1タンパク質を検出したところ、図10に示すようにアミ
ノ酸の1次構造から予測される約96kDaの位置に単一のバ
ンドが観察された。
【0028】多くのATL症例ではATL1遺伝子の発現が減
少していることから、ATL1タンパク質あるいは、それに
対する抗体は、正常細胞とATL等の白血病細胞とを区別
する、道具としての応用が期待される。
少していることから、ATL1タンパク質あるいは、それに
対する抗体は、正常細胞とATL等の白血病細胞とを区別
する、道具としての応用が期待される。
【0029】
【発明の効果】以上詳しく説明したとおり、この出願の
発明によって、ATL発症に関係する細胞内遺伝子と、そ
の変異体遺伝子、それぞれの遺伝子の発現タンパク質、
およびこれらタンパク質を認識する抗体が提供される。
これらの発明によって、ATL発症の機構解明や、ATLの診
断および治療法の開発が可能となる。
発明によって、ATL発症に関係する細胞内遺伝子と、そ
の変異体遺伝子、それぞれの遺伝子の発現タンパク質、
およびこれらタンパク質を認識する抗体が提供される。
これらの発明によって、ATL発症の機構解明や、ATLの診
断および治療法の開発が可能となる。
【0030】
【配列表】
SEQUENCE LISTING
<110> Japan Science and Technology Corporation
<120> ATL-relating gene and proteins expressed from the gene
<130> NP00290-YS
<140>
<141>
<160> 13
<170> PatentIn Ver. 2.1
<210> 1
<211> 8533
<212> DNA
<213> Homo sapiens
<220>
<221> 5'UTR
<222> (1)..(975)
<220>
<221> CDS
<222> (976)..(3660)
<220>
<221> 3'UTR
<222> (3661)..(8533)
<220>
<221> polyA#signal
<222> (6375)..(6380)
<220>
<221> polyA#signal
<222> (8494)..(8499)
<400> 1
atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60
agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120
ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180
ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240
cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300
ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360
gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420
ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480
tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540
taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600
ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660
gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720
ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780
ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840
cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900
ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960
atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu
1 5 10
tcc cag agg gag ctc atc acc cca gag gct gac cat gtg gag gcc gcc 1059
Ser Gln Arg Glu Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala
15 20 25
atc ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg 1107
Ile Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu
30 35 40
ggg ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag 1155
Gly Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln
45 50 55 60
tgt caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac 1203
Cys Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His
65 70 75
aaa agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc 1251
Lys Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala
80 85 90
ctg gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa 1299
Leu Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys
95 100 105
gtg tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat 1347
Val Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp
110 115 120
gac cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac 1395
Asp His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn
125 130 135 140
att gca ggg ccg tgc agg cct gcc cag ctg cca gcg gtg gcc ccc ata 1443
Ile Ala Gly Pro Cys Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile
145 150 155
gct gcc tcc tcc cac cct cac tca tcc gtg atc act tca cct ctg cgt 1491
Ala Ala Ser Ser His Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg
160 165 170
gcc ctg ggc gct ctc ccg ccc tgc ctc ccc ctg ccg tgc tgc agc gcg 1539
Ala Leu Gly Ala Leu Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala
175 180 185
cgc ccg gtc tcg ggt gac ggg act cag ggt gag ggt cag acg gag gct 1587
Arg Pro Val Ser Gly Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala
190 195 200
ccc ttt gga tgc cag tgt cag ttg tca ggt aaa gat gag cct tcc agc 1635
Pro Phe Gly Cys Gln Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser
205 210 215 220
tac att tgc aca aca tgc aag cag ccc ttc aac agc gcg tgg ttc ctg 1683
Tyr Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu
225 230 235
ctg cag cac gcg cag aac acg cac ggc ttc cgc atc tac ctg gag ccc 1731
Leu Gln His Ala Gln Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro
240 245 250
ggg ccg gcc agc agc tcg ctc acg ccg cgg ctc acc atc ccg ccg ccg 1779
Gly Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro
255 260 265
ctc ggg ccc gag gcc gtg gcg cag tcc ccg ctc atg aat ttc ctg ggc 1827
Leu Gly Pro Glu Ala Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly
270 275 280
gac agc aac ccc ttc aac ctg ctg cgc atg acg ggc ccc atc ctg cgg 1875
Asp Ser Asn Pro Phe Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg
285 290 295 300
gac cac ccg ggc ttc ggc gag ggc cgc ctg ccg ggc acg ccg cct ctc 1923
Asp His Pro Gly Phe Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu
305 310 315
ttc agt ccc ccg ccg cgc cac cac ctg gac ccg cac cgc ctc agt gcc 1971
Phe Ser Pro Pro Pro Arg His His Leu Asp Pro His Arg Leu Ser Ala
320 325 330
gag gag atg ggg ctc gtc gcc cag cac ccc agt gcc ttc gac cga gtc 2019
Glu Glu Met Gly Leu Val Ala Gln His Pro Ser Ala Phe Asp Arg Val
335 340 345
atg cgc ctg aac ccc atg gcc atc gac tcg ccc gcc atg gac ttc tcg 2067
Met Arg Leu Asn Pro Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser
350 355 360
cgg cgg ctc cgc gag ctg gcg ggc aac agc tcc acg ccg ccg ccc gtg 2115
Arg Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val
365 370 375 380
tcc ccg ggc cgc ggc aac cct atg cac cgg ctc ctg aac ccc ttc cag 2163
Ser Pro Gly Arg Gly Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln
385 390 395
ccc agc ccc aag tcc ccg ttc ctg agc acg ccg ccg ctg ccg ccc atg 2211
Pro Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met
400 405 410
ccc cct ggc ggc acg ccg ccc ccg cag ccg cca gcc aag agc aag tcg 2259
Pro Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser
415 420 425
tgc gag ttc tgc ggc aag acc ttc aag ttc cag agc aat ctc atc gtg 2307
Cys Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val
430 435 440
cac cgg cgc agt cac acg ggc gag aag ccc tac aag tgc cag ctg tgc 2355
His Arg Arg Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys
445 450 455 460
gac cac gcg tgc tcg cag gcc agc aag ctc aag cgc cac atg aag acg 2403
Asp His Ala Cys Ser Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr
465 470 475
cac atg cac aag gcc ggc tcg ctg gcc ggc cgc tcc gac gac ggg ctc 2451
His Met His Lys Ala Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu
480 485 490
tcg gcc gcc agc tcc ccc gag ccc ggc acc agc gag ctg gcg ggc gag 2499
Ser Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu
495 500 505
ggc ctc aag gcg gcc gac ggt gac ttc cgc cac cac gag agc gac ccg 2547
Gly Leu Lys Ala Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro
510 515 520
tcg ctg ggc cac gag ccg gag gag gag gac gag gag gag gag gag gag 2595
Ser Leu Gly His Glu Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu
525 530 535 540
gag gag gag ctg cta ctg gag aac gag agc cgg ccc gag tcg agc ttc 2643
Glu Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe
545 550 555
agc atg gac tcg gag ctg agc cgc aac cgc gag aac ggc ggt ggt ggg 2691
Ser Met Asp Ser Glu Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly
560 565 570
gtg ccc ggg gtc ccg ggc gcg ggg ggc ggc gcg gcc aag gcg ctg gct 2739
Val Pro Gly Val Pro Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala
575 580 585
gac gag aag gcg ctg gtg ctg ggc aag gtc atg gag aac gtg ggc cta 2787
Asp Glu Lys Ala Leu Val Leu Gly Lys Val Met Glu Asn Val Gly Leu
590 595 600
ggc gca ctg ccg cag tac ggc gag ctc ctg gcc gac aag cag aag cgc 2835
Gly Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg
605 610 615 620
ggc gcc ttc ctg aag cgt gcg gcg ggc ggc ggg gac gcg ggc gac gac 2883
Gly Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp
625 630 635
gac gac gcg ggc ggc tgc ggg gac gcg ggc gcg ggc ggc gcg gtc aac 2931
Asp Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn
640 645 650
ggg cgc ggg ggc ggc ttc gcg cca ggc acc gag ccc ttc ccc ggg ctc 2979
Gly Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu
655 660 665
ttc ccg cgc aag ccc gcg ccg ctg ccc agc ccc ggg ctc aac agc gcc 3027
Phe Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala
670 675 680
gcc aag cgc atc aag gtg gag aag gac ctg gag ctg ccg ccc gcc gcg 3075
Ala Lys Arg Ile Lys Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala
685 690 695 700
ctc atc ccg tcc gag aac gtg tac tcg cag tgg ctg gtg ggc tac gcg 3123
Leu Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala
705 710 715
gcg tcg cgg cac ttc atg aag gac ccc ttc ctg ggc ttc acg gac gca 3171
Ala Ser Arg His Phe Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala
720 725 730
cga cag tcg ccc ttc gcc acg tcg tcc gag cac tcg tcc gag aac ggc 3219
Arg Gln Ser Pro Phe Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly
735 740 745
agc ctg cgc ttc tcc acg ccg ccc ggg gac ctg ctg gac ggc ggc ctc 3267
Ser Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu
750 755 760
tcg ggc cgc agc ggc acg gcc agc gga ggc agc acc ccg cac ctg ggc 3315
Ser Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly
765 770 775 780
ggc ccg ggc ccc ggg cgg ccc agc tcc aag gag ggc cgc cgc agc gac 3363
Gly Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp
785 790 795
acg tgc gag tac tgc ggc aag gtg ttc aag aac tgc agc aac ttg acg 3411
Thr Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr
800 805 810
gtg cac cgg cgg agc cac acc ggc gag cgg cct tac aag tgc gag ctg 3459
Val His Arg Arg Ser His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu
815 820 825
tgc aac tac gcg tgc gcg cag agc agc aag ctc acg cgc cac atg aag 3507
Cys Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys
830 835 840
acg cac ggg cag atc ggc aag gag gtg tac cgc tgc gac atc tgc cag 3555
Thr His Gly Gln Ile Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln
845 850 855 860
atg ccc ttc agc gtc tac agc acc ctg gag aaa cac atg aaa aag tgg 3603
Met Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp
865 870 875
cac ggc gag cac ttg ctg act aac gac gtc aaa atc gag cag gcc gag 3651
His Gly Glu His Leu Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu
880 885 890
agg agc taa gcgcgcgggc cccggcgccc cgcacctgta cagtggaacc 3700
Arg Ser
895
gttgccaacc gagagaatgc tgacctgact tgcctccgtg tcaccgccac cccgcacccc 3760
gcgtgtcccc ggggcccagg ggaggcggca ctccaaccta acctgtgtct gcgaagtcct 3820
atggaaaccc gagggttgat taaggcagta caaattgtgg agccttttaa ctgtgcaata 3880
atttctgtat ttattgggtt ttgtaatttt tttggcatgt gcaggtactt tttattatta 3940
ttttttctgt ttgaattcct ttaagagatt ttgttgggta tccatccctt ctttgttttt 4000
tttttaaccc ggtagtagcc tgagcaatga ctcgcaagca atgttagagg ggaagcatat 4060
cttttaaatt ataatttggg gggaggggtg gtgctgcttt tttgaaattt aagctaagca 4120
tgtgtaattt cttgtgaaga agccaacact caaatgactt ttaaagttgt ttactttttc 4180
attccttcct tttttttgtc ctgaaataaa aagtggcatg cagttttttt tttaattatt 4240
ttttaatttt tttttttggt ttttgttttt ggggtggggg gtgtggatgt acagcggata 4300
acaatctttc aagtcgtagc actttgtttc agaactggaa tggagatgta gcactcatgt 4360
cgtcccgagt caagcggcct tttctgtgtt gatttcggct ttcatattac ataagggaaa 4420
ccttgagtgg tggtgctggg ggaggcaccc cacagactca gcgccgccag agatagggtt 4480
tttggagggc tcctctggga aatggcccga cagcattctg aggttgtgca tgaccagcag 4540
atactatcct gttggtgtgc cctggggtgc catggctgct attcgctgta gattaggcta 4600
cataaaatgg gctgagggta cctttttggg gagatggggt ggcctgcagt gacacagaaa 4660
ggaagaaact agcggtgttc ttttaggcgt tttctggctt gacggcttct ctcttttttt 4720
aaatcacccc caccacataa atctcaaatc ctatgttgct acaaggggtc atccatcatt 4780
tcccaagcag acgaatgccc taattaattg aagttagtgt tctctcattt aatgcacact 4840
gatgatattg tagggatggg tggggtgggg atcttgcaaa tttctattct cttttactga 4900
aaaagcaggg gatgagttcc atcagaaggt gcccagcgct acttcccagg tttttatttt 4960
ttttttccta tctcattagg ttggaaggta ctaaatattg aactgttaag attagacatt 5020
tgaattctgt tgacccgcac tttaaagctt ttgtttgcat ttaaattaaa tggcttctaa 5080
acaagaaatt gcagcatatt cttctctttg gcccagaggt gggttaaact gtaagggaca 5140
gctgagattg agtgtcagta ttgctaagcg tggcattcac aatactggca ctataaagaa 5200
caaaataaaa taataattta taggacagtt tttctactgc cattcaattt gatgtgagtg 5260
ccttgaaaac tgatcttcct atttgagtct cttgagacaa atgcaaaact ttttttttga 5320
aatgaaaaga ctttttaaaa aagtaaaaca agaaaagtac attctttaga aactaacaaa 5380
gccacattta ctttaagtaa aaaaaaaaaa aattctggtt gaagatagag gatatgaaat 5440
gccataagac ccaatcaaat gaagaaataa acccagcaca accttggaca tccattagct 5500
gaattatcct cagccccttt tgtttttggg acaacgctgc ttagatatgg agtggaggtg 5560
atttactgct gaattaaaac tcaagtgaca caagttacaa gttgatatcg ttgaatgaaa 5620
agcaaaacaa aaacaattca ggaacaacgg ctaatttttt ctaaagttaa atttagtgca 5680
ctctgtctta aaaatacgtt tacagtattg ggtacataca agggtaaaaa aaaaattgtg 5740
tgtatgtgtg ttggagcgat cttttttttt caaagtttgc ttaataggtt atacaaaaat 5800
gccacagtgg ccgcgtgtat attgttttct tttggtgacg gggttttagt atatattata 5860
tatattaaaa tttcttgatt actgtaaaag tggaccagta tttgtaataa tcgagaatgc 5920
ctgggcattt tacaaaacaa gaaaaaaaat acccttttct tttccttgaa aatgttgcag 5980
taaaatttaa atggtgggtc tataaatttg ttcttgttac agtaactgta aagtcggagt 6040
tttagtaaat ttttttctgc cttgggtgtt gaatttttat ttcaaaaaaa atgtatagaa 6100
acttgtattt ggggattcaa aggggattgc tacaccatgt agaaaaagta tgtagaaaaa 6160
aagtgcttaa tattgttatt gctttgcaga aaaaaaaaaa tcacatttct gacctgtact 6220
tatttttctc ttcccgcctc cctctggaat ggatatattg gttggttcat atgatgtagg 6280
cacttgctgt atttttactg gagctcgtaa ttttttaact gtaagcttgt ccttttaaag 6340
ggatttaatg tacctttttg ttagtgaatt tggaaataaa aagaaaaaaa aaacaaaaac 6400
aaacaggctg ccataatata tttttttaat ttggcaggat aaaatattgc aaaaaaaaca 6460
catttgtatg ttaagtccta ttgtacagga gaaaaagggt tgtttgacaa cctttgagaa 6520
aaagaaacaa aaggaagtag ttaaatgctt tggttcacaa atcatttagt tgtatatatt 6580
ttttgtcgga attggcctac acagagaacc gttcgtgttg ggcttctctc tgaacgcccc 6640
gaaccttgca tcaaggctcc ttggtgtggc cacagcagac cagatgggaa attatttgtg 6700
ttgagtggaa aaaaatcagt ttttgtaaag atgtcagtaa cattccacat cgtcctccct 6760
ttctctaaga ggccatctct aagatgtcag atgtagagga gagagagcga gagaacatct 6820
tccttctcta ccatcactcc tgtggcggtc accaccacca cctctcccgc ccttaccagc 6880
agaaagcaat gcaaactgag ctgctttagt ccttgagaaa ttgtgaaaca aacacaaata 6940
tcataaaagg agctggtgat tcagctgggt ccaggtgaag tgacctgctg ttgagaccgg 7000
tacaaattgg atttcaggaa ggagactcca tcacagccag gacctttcgt gccatggaga 7060
gtgttggcct cttgtctttc ttccctgctt tgctgctttg ctctctgaaa cctacattcc 7120
gtcagtttcc gaatgcgagg gcctgggatg aatttggtgc ctttccatat ctcgttctct 7180
ctccttcccc tgcgtttcct ctccatcctt catcctccat tggtcctttt tttttctttc 7240
attttttatt taatttcttt tcttcctgtc tgttcctccc ctaatcctct attttatttt 7300
tattttttgt aaagccaagt agctttaaga taaagtggtg gtcttttgga tgagggaata 7360
atgcattttt aaataaaata ccaatatcag gaagccattt tttatttcag gaaatgtaag 7420
aaaccattat ttcaggttat gaaagtataa ccaagcatcc ttttgggcaa ttccttacca 7480
aatgcagaag cttttctgtt cgatgcactc tttcctcctt gccacttacc tttgcaaagt 7540
taaaaaaaag gggggaggga atgggagaga aagctgagat ttcagtttcc tactgcagtt 7600
tcctacctgc agatccaggg gctgctgttg cctttggatg ccccactgag gtcctagagt 7660
gcctccaggg tggtcttcct gtagtcataa cagctagcca gtgctcacca gcttaccaga 7720
ttgccaggac taagccatcc caaagcacaa gcattgtgtg tctctgtgac tgcagagaag 7780
agagaatttt gcttctgttt tgtgtttaaa aaaccaacac ggaagcagat gatcccgaga 7840
gagaggcctc tagcatgggt gacccagccg acctcaggcc ggtttccgca ctgccacaac 7900
tttgttcaaa gttgccccca attggaacct gccacttggc attagagggt ctttcatggg 7960
gagagaagga gactgaatta ctctaagcaa aatgtgaaaa gtaaggaaat cagcctttca 8020
tcccggtcct aagtaaccgt cagccgaagg tctcgtggaa cacaggcaaa cccgtgattt 8080
tggtgctcct tgtaactcag ccctgcaaag caaagtccca ttgatttaag ttgtttgcat 8140
ttgtactggc aaggcaaaat atttttatta ccttttctat tacttattgt atgagctttt 8200
gttgtttact tggaggtttt gtcttttact acaagtttgg aactatttat tattgcttgg 8260
tatttgtgct ctgtttaaga aacaggcact tttttttatt atggataaaa tgttgagatg 8320
acaggaggtc atttcaatat ggcttagtaa aatatttatt gttcctttat tctctgtaca 8380
agattttggg cctctttttt tccttaatgt cacaatgttg agttcagcat gtgtctgcca 8440
tttcatttgt acgcttgttc aaaaccaagt ttgttctggt ttcaagttat aaaaataaat 8500
tggacattta acttaaaaaa aaaaaaaaaa aaa 8533
<210> 2
<211> 894
<212> PRT
<213> Homo sapiens
<400> 2
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu
1 5 10 15
Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu
20 25 30
Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val
35 40 45
Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn
50 55 60
Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln
65 70 75 80
Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp
85 90 95
Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro
100 105 110
Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu
115 120 125
Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Pro
130 135 140
Cys Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile Ala Ala Ser Ser
145 150 155 160
His Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg Ala Leu Gly Ala
165 170 175
Leu Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala Arg Pro Val Ser
180 185 190
Gly Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala Pro Phe Gly Cys
195 200 205
Gln Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr
210 215 220
Thr Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala
225 230 235 240
Gln Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser
245 250 255
Ser Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu
260 265 270
Ala Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro
275 280 285
Phe Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly
290 295 300
Phe Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro
305 310 315 320
Pro Arg His His Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly
325 330 335
Leu Val Ala Gln His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn
340 345 350
Pro Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg
355 360 365
Glu Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg
370 375 380
Gly Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys
385 390 395 400
Ser Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly
405 410 415
Thr Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys
420 425 430
Gly Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser
435 440 445
His Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys
450 455 460
Ser Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr His Met His Lys
465 470 475 480
Ala Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser
485 490 495
Ser Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala
500 505 510
Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His
515 520 525
Glu Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu
530 535 540
Leu Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser
545 550 555 560
Glu Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val
565 570 575
Pro Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala
580 585 590
Leu Val Leu Gly Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro
595 600 605
Gln Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu
610 615 620
Lys Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly
625 630 635 640
Gly Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly
645 650 655
Gly Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys
660 665 670
Pro Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile
675 680 685
Lys Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser
690 695 700
Glu Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His
705 710 715 720
Phe Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro
725 730 735
Phe Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe
740 745 750
Ser Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser
755 760 765
Gly Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro
770 775 780
Gly Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr
785 790 795 800
Cys Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg
805 810 815
Ser His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala
820 825 830
Cys Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln
835 840 845
Ile Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser
850 855 860
Val Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp His Gly Glu His
865 870 875 880
Leu Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu Arg Ser
885 890
<210> 3
<211> 8530
<212> DNA
<213> Homo sapiens
<220>
<221> 5'UTR
<222> (1)..(975)
<220>
<221> CDS
<222> (976)..(3657)
<220>
<221> polyA#signal
<222> (6372)..(6377)
<220>
<221> polyA#signal
<222> (8494)..(8499)
<400> 3
atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60
agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120
ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180
ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240
cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300
ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360
gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420
ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480
tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540
taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600
ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660
gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720
ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780
ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840
cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900
ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960
atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu
1 5 10
tcc cag agg gag ctc atc acc cag gct gac cat gtg gag gcc gcc atc 1059
Ser Gln Arg Glu Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile
15 20 25
ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg ggg 1107
Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly
30 35 40
ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag tgt 1155
Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys
45 50 55 60
caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac aaa 1203
Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys
65 70 75
agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc ctg 1251
Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu
80 85 90
gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa gtg 1299
Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val
95 100 105
tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat gac 1347
Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp
110 115 120
cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac att 1395
His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile
125 130 135 140
gca ggg ccg tgc agg cct gcc cag ctg cca gcg gtg gcc ccc ata gct 1443
Ala Gly Pro Cys Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile Ala
145 150 155
gcc tcc tcc cac cct cac tca tcc gtg atc act tca cct ctg cgt gcc 1491
Ala Ser Ser His Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg Ala
160 165 170
ctg ggc gct ctc ccg ccc tgc ctc ccc ctg ccg tgc tgc agc gcg cgc 1539
Leu Gly Ala Leu Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala Arg
175 180 185
ccg gtc tcg ggt gac ggg act cag ggt gag ggt cag acg gag gct ccc 1587
Pro Val Ser Gly Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala Pro
190 195 200
ttt gga tgc cag tgt cag ttg tca ggt aaa gat gag cct tcc agc tac 1635
Phe Gly Cys Gln Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser Tyr
205 210 215 220
att tgc aca aca tgc aag cag ccc ttc aac agc gcg tgg ttc ctg ctg 1683
Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu
225 230 235
cag cac gcg cag aac acg cac ggc ttc cgc atc tac ctg gag ccc ggg 1731
Gln His Ala Gln Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro Gly
240 245 250
ccg gcc agc agc tcg ctc acg ccg cgg ctc acc atc ccg ccg ccg ctc 1779
Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu
255 260 265
ggg ccc gag gcc gtg gcg cag tcc ccg ctc atg aat ttc ctg ggc gac 1827
Gly Pro Glu Ala Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly Asp
270 275 280
agc aac ccc ttc aac ctg ctg cgc atg acg ggc ccc atc ctg cgg gac 1875
Ser Asn Pro Phe Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg Asp
285 290 295 300
cac ccg ggc ttc ggc gag ggc cgc ctg ccg ggc acg ccg cct ctc ttc 1923
His Pro Gly Phe Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe
305 310 315
agt ccc ccg ccg cgc cac cac ctg gac ccg cac cgc ctc agt gcc gag 1971
Ser Pro Pro Pro Arg His His Leu Asp Pro His Arg Leu Ser Ala Glu
320 325 330
gag atg ggg ctc gtc gcc cag cac ccc agt gcc ttc gac cga gtc atg 2019
Glu Met Gly Leu Val Ala Gln His Pro Ser Ala Phe Asp Arg Val Met
335 340 345
cgc ctg aac ccc atg gcc atc gac tcg ccc gcc atg gac ttc tcg cgg 2067
Arg Leu Asn Pro Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser Arg
350 355 360
cgg ctc cgc gag ctg gcg ggc aac agc tcc acg ccg ccg ccc gtg tcc 2115
Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val Ser
365 370 375 380
ccg ggc cgc ggc aac cct atg cac cgg ctc ctg aac ccc ttc cag ccc 2163
Pro Gly Arg Gly Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln Pro
385 390 395
agc ccc aag tcc ccg ttc ctg agc acg ccg ccg ctg ccg ccc atg ccc 2211
Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met Pro
400 405 410
cct ggc ggc acg ccg ccc ccg cag ccg cca gcc aag agc aag tcg tgc 2259
Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys
415 420 425
gag ttc tgc ggc aag acc ttc aag ttc cag agc aat ctc atc gtg cac 2307
Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val His
430 435 440
cgg cgc agt cac acg ggc gag aag ccc tac aag tgc cag ctg tgc gac 2355
Arg Arg Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp
445 450 455 460
cac gcg tgc tcg cag gcc agc aag ctc aag cgc cac atg aag acg cac 2403
His Ala Cys Ser Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr His
465 470 475
atg cac aag gcc ggc tcg ctg gcc ggc cgc tcc gac gac ggg ctc tcg 2451
Met His Lys Ala Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser
480 485 490
gcc gcc agc tcc ccc gag ccc ggc acc agc gag ctg gcg ggc gag ggc 2499
Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly
495 500 505
ctc aag gcg gcc gac ggt gac ttc cgc cac cac gag agc gac ccg tcg 2547
Leu Lys Ala Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro Ser
510 515 520
ctg ggc cac gag ccg gag gag gag gac gag gag gag gag gag gag gag 2595
Leu Gly His Glu Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu
525 530 535 540
gag gag ctg cta ctg gag aac gag agc cgg ccc gag tcg agc ttc agc 2643
Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser
545 550 555
atg gac tcg gag ctg agc cgc aac cgc gag aac ggc ggt ggt ggg gtg 2691
Met Asp Ser Glu Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly Val
560 565 570
ccc ggg gtc ccg ggc gcg ggg ggc ggc gcg gcc aag gcg ctg gct gac 2739
Pro Gly Val Pro Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp
575 580 585
gag aag gcg ctg gtg ctg ggc aag gtc atg gag aac gtg ggc cta ggc 2787
Glu Lys Ala Leu Val Leu Gly Lys Val Met Glu Asn Val Gly Leu Gly
590 595 600
gca ctg ccg cag tac ggc gag ctc ctg gcc gac aag cag aag cgc ggc 2835
Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly
605 610 615 620
gcc ttc ctg aag cgt gcg gcg ggc ggc ggg gac gcg ggc gac gac gac 2883
Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp
625 630 635
gac gcg ggc ggc tgc ggg gac gcg ggc gcg ggc ggc gcg gtc aac ggg 2931
Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn Gly
640 645 650
cgc ggg ggc ggc ttc gcg cca ggc acc gag ccc ttc ccc ggg ctc ttc 2979
Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe
655 660 665
ccg cgc aag ccc gcg ccg ctg ccc agc ccc ggg ctc aac agc gcc gcc 3027
Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala
670 675 680
aag cgc atc aag gtg gag aag gac ctg gag ctg ccg ccc gcc gcg ctc 3075
Lys Arg Ile Lys Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu
685 690 695 700
atc ccg tcc gag aac gtg tac tcg cag tgg ctg gtg ggc tac gcg gcg 3123
Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala
705 710 715
tcg cgg cac ttc atg aag gac ccc ttc ctg ggc ttc acg gac gca cga 3171
Ser Arg His Phe Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg
720 725 730
cag tcg ccc ttc gcc acg tcg tcc gag cac tcg tcc gag aac ggc agc 3219
Gln Ser Pro Phe Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly Ser
735 740 745
ctg cgc ttc tcc acg ccg ccc ggg gac ctg ctg gac ggc ggc ctc tcg 3267
Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser
750 755 760
ggc cgc agc ggc acg gcc agc gga ggc agc acc ccg cac ctg ggc ggc 3315
Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly Gly
765 770 775 780
ccg ggc ccc ggg cgg ccc agc tcc aag gag ggc cgc cgc agc gac acg 3363
Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr
785 790 795
tgc gag tac tgc ggc aag gtg ttc aag aac tgc agc aac ttg acg gtg 3411
Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr Val
800 805 810
cac cgg cgg agc cac acc ggc gag cgg cct tac aag tgc gag ctg tgc 3459
His Arg Arg Ser His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys
815 820 825
aac tac gcg tgc gcg cag agc agc aag ctc acg cgc cac atg aag acg 3507
Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys Thr
830 835 840
cac ggg cag atc ggc aag gag gtg tac cgc tgc gac atc tgc cag atg 3555
His Gly Gln Ile Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln Met
845 850 855 860
ccc ttc agc gtc tac agc acc ctg gag aaa cac atg aaa aag tgg cac 3603
Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp His
865 870 875
ggc gag cac ttg ctg act aac gac gtc aaa atc gag cag gcc gag agg 3651
Gly Glu His Leu Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu Arg
880 885 890
agc taa gcgcgcgggc cccggcgccc cgcacctgta cagtggaacc gttgccaacc 3707
Ser
gagagaatgc tgacctgact tgcctccgtg tcaccgccac cccgcacccc gcgtgtcccc 3767
ggggcccagg ggaggcggca ctccaaccta acctgtgtct gcgaagtcct atggaaaccc 3827
gagggttgat taaggcagta caaattgtgg agccttttaa ctgtgcaata atttctgtat 3887
ttattgggtt ttgtaatttt tttggcatgt gcaggtactt tttattatta ttttttctgt 3947
ttgaattcct ttaagagatt ttgttgggta tccatccctt ctttgttttt tttttaaccc 4007
ggtagtagcc tgagcaatga ctcgcaagca atgttagagg ggaagcatat cttttaaatt 4067
ataatttggg gggaggggtg gtgctgcttt tttgaaattt aagctaagca tgtgtaattt 4127
cttgtgaaga agccaacact caaatgactt ttaaagttgt ttactttttc attccttcct 4187
tttttttgtc ctgaaataaa aagtggcatg cagttttttt tttaattatt ttttaatttt 4247
tttttttggt ttttgttttt ggggtggggg gtgtggatgt acagcggata acaatctttc 4307
aagtcgtagc actttgtttc agaactggaa tggagatgta gcactcatgt cgtcccgagt 4367
caagcggcct tttctgtgtt gatttcggct ttcatattac ataagggaaa ccttgagtgg 4427
tggtgctggg ggaggcaccc cacagactca gcgccgccag agatagggtt tttggagggc 4487
tcctctggga aatggcccga cagcattctg aggttgtgca tgaccagcag atactatcct 4547
gttggtgtgc cctggggtgc catggctgct attcgctgta gattaggcta cataaaatgg 4607
gctgagggta cctttttggg gagatggggt ggcctgcagt gacacagaaa ggaagaaact 4667
agcggtgttc ttttaggcgt tttctggctt gacggcttct ctcttttttt aaatcacccc 4727
caccacataa atctcaaatc ctatgttgct acaaggggtc atccatcatt tcccaagcag 4787
acgaatgccc taattaattg aagttagtgt tctctcattt aatgcacact gatgatattg 4847
tagggatggg tggggtgggg atcttgcaaa tttctattct cttttactga aaaagcaggg 4907
gatgagttcc atcagaaggt gcccagcgct acttcccagg tttttatttt ttttttccta 4967
tctcattagg ttggaaggta ctaaatattg aactgttaag attagacatt tgaattctgt 5027
tgacccgcac tttaaagctt ttgtttgcat ttaaattaaa tggcttctaa acaagaaatt 5087
gcagcatatt cttctctttg gcccagaggt gggttaaact gtaagggaca gctgagattg 5147
agtgtcagta ttgctaagcg tggcattcac aatactggca ctataaagaa caaaataaaa 5207
taataattta taggacagtt tttctactgc cattcaattt gatgtgagtg ccttgaaaac 5267
tgatcttcct atttgagtct cttgagacaa atgcaaaact ttttttttga aatgaaaaga 5327
ctttttaaaa aagtaaaaca agaaaagtac attctttaga aactaacaaa gccacattta 5387
ctttaagtaa aaaaaaaaaa aattctggtt gaagatagag gatatgaaat gccataagac 5447
ccaatcaaat gaagaaataa acccagcaca accttggaca tccattagct gaattatcct 5507
cagccccttt tgtttttggg acaacgctgc ttagatatgg agtggaggtg atttactgct 5567
gaattaaaac tcaagtgaca caagttacaa gttgatatcg ttgaatgaaa agcaaaacaa 5627
aaacaattca ggaacaacgg ctaatttttt ctaaagttaa atttagtgca ctctgtctta 5687
aaaatacgtt tacagtattg ggtacataca agggtaaaaa aaaaattgtg tgtatgtgtg 5747
ttggagcgat cttttttttt caaagtttgc ttaataggtt atacaaaaat gccacagtgg 5807
ccgcgtgtat attgttttct tttggtgacg gggttttagt atatattata tatattaaaa 5867
tttcttgatt actgtaaaag tggaccagta tttgtaataa tcgagaatgc ctgggcattt 5927
tacaaaacaa gaaaaaaaat acccttttct tttccttgaa aatgttgcag taaaatttaa 5987
atggtgggtc tataaatttg ttcttgttac agtaactgta aagtcggagt tttagtaaat 6047
ttttttctgc cttgggtgtt gaatttttat ttcaaaaaaa atgtatagaa acttgtattt 6107
ggggattcaa aggggattgc tacaccatgt agaaaaagta tgtagaaaaa aagtgcttaa 6167
tattgttatt gctttgcaga aaaaaaaaaa tcacatttct gacctgtact tatttttctc 6227
ttcccgcctc cctctggaat ggatatattg gttggttcat atgatgtagg cacttgctgt 6287
atttttactg gagctcgtaa ttttttaact gtaagcttgt ccttttaaag ggatttaatg 6347
tacctttttg ttagtgaatt tggaaataaa aagaaaaaaa aaacaaaaac aaacaggctg 6407
ccataatata tttttttaat ttggcaggat aaaatattgc aaaaaaaaca catttgtatg 6467
ttaagtccta ttgtacagga gaaaaagggt tgtttgacaa cctttgagaa aaagaaacaa 6527
aaggaagtag ttaaatgctt tggttcacaa atcatttagt tgtatatatt ttttgtcgga 6587
attggcctac acagagaacc gttcgtgttg ggcttctctc tgaacgcccc gaaccttgca 6647
tcaaggctcc ttggtgtggc cacagcagac cagatgggaa attatttgtg ttgagtggaa 6707
aaaaatcagt ttttgtaaag atgtcagtaa cattccacat cgtcctccct ttctctaaga 6767
ggccatctct aagatgtcag atgtagagga gagagagcga gagaacatct tccttctcta 6827
ccatcactcc tgtggcggtc accaccacca cctctcccgc ccttaccagc agaaagcaat 6887
gcaaactgag ctgctttagt ccttgagaaa ttgtgaaaca aacacaaata tcataaaagg 6947
agctggtgat tcagctgggt ccaggtgaag tgacctgctg ttgagaccgg tacaaattgg 7007
atttcaggaa ggagactcca tcacagccag gacctttcgt gccatggaga gtgttggcct 7067
cttgtctttc ttccctgctt tgctgctttg ctctctgaaa cctacattcc gtcagtttcc 7127
gaatgcgagg gcctgggatg aatttggtgc ctttccatat ctcgttctct ctccttcccc 7187
tgcgtttcct ctccatcctt catcctccat tggtcctttt tttttctttc attttttatt 7247
taatttcttt tcttcctgtc tgttcctccc ctaatcctct attttatttt tattttttgt 7307
aaagccaagt agctttaaga taaagtggtg gtcttttgga tgagggaata atgcattttt 7367
aaataaaata ccaatatcag gaagccattt tttatttcag gaaatgtaag aaaccattat 7427
ttcaggttat gaaagtataa ccaagcatcc ttttgggcaa ttccttacca aatgcagaag 7487
cttttctgtt cgatgcactc tttcctcctt gccacttacc tttgcaaagt taaaaaaaag 7547
gggggaggga atgggagaga aagctgagat ttcagtttcc tactgcagtt tcctacctgc 7607
agatccaggg gctgctgttg cctttggatg ccccactgag gtcctagagt gcctccaggg 7667
tggtcttcct gtagtcataa cagctagcca gtgctcacca gcttaccaga ttgccaggac 7727
taagccatcc caaagcacaa gcattgtgtg tctctgtgac tgcagagaag agagaatttt 7787
gcttctgttt tgtgtttaaa aaaccaacac ggaagcagat gatcccgaga gagaggcctc 7847
tagcatgggt gacccagccg acctcaggcc ggtttccgca ctgccacaac tttgttcaaa 7907
gttgccccca attggaacct gccacttggc attagagggt ctttcatggg gagagaagga 7967
gactgaatta ctctaagcaa aatgtgaaaa gtaaggaaat cagcctttca tcccggtcct 8027
aagtaaccgt cagccgaagg tctcgtggaa cacaggcaaa cccgtgattt tggtgctcct 8087
tgtaactcag ccctgcaaag caaagtccca ttgatttaag ttgtttgcat ttgtactggc 8147
aaggcaaaat atttttatta ccttttctat tacttattgt atgagctttt gttgtttact 8207
tggaggtttt gtcttttact acaagtttgg aactatttat tattgcttgg tatttgtgct 8267
ctgtttaaga aacaggcact tttttttatt atggataaaa tgttgagatg acaggaggtc 8327
atttcaatat ggcttagtaa aatatttatt gttcctttat tctctgtaca agattttggg 8387
cctctttttt tccttaatgt cacaatgttg agttcagcat gtgtctgcca tttcatttgt 8447
acgcttgttc aaaaccaagt ttgttctggt ttcaagttat aaaaataaat tggacattta 8507
acttaaaaaa aaaaaaaaaa aaa 8530
<210> 4
<211> 893
<212> PRT
<213> Homo sapiens
<400> 4
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu
1 5 10 15
Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu Asp
20 25 30
Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val Gly
35 40 45
Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn Phe
50 55 60
Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln Cys
65 70 75 80
Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp Ser
85 90 95
Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro Val
100 105 110
Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu Ser
115 120 125
Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Pro Cys
130 135 140
Arg Pro Ala Gln Leu Pro Ala Val Ala Pro Ile Ala Ala Ser Ser His
145 150 155 160
Pro His Ser Ser Val Ile Thr Ser Pro Leu Arg Ala Leu Gly Ala Leu
165 170 175
Pro Pro Cys Leu Pro Leu Pro Cys Cys Ser Ala Arg Pro Val Ser Gly
180 185 190
Asp Gly Thr Gln Gly Glu Gly Gln Thr Glu Ala Pro Phe Gly Cys Gln
195 200 205
Cys Gln Leu Ser Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr
210 215 220
Cys Lys Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala Gln
225 230 235 240
Asn Thr His Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser
245 250 255
Ser Leu Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala
260 265 270
Val Ala Gln Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro Phe
275 280 285
Asn Leu Leu Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly Phe
290 295 300
Gly Glu Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro
305 310 315 320
Arg His His Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly Leu
325 330 335
Val Ala Gln His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn Pro
340 345 350
Met Ala Ile Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg Glu
355 360 365
Leu Ala Gly Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg Gly
370 375 380
Asn Pro Met His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser
385 390 395 400
Pro Phe Leu Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly Thr
405 410 415
Pro Pro Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly
420 425 430
Lys Thr Phe Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser His
435 440 445
Thr Gly Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys Ser
450 455 460
Gln Ala Ser Lys Leu Lys Arg His Met Lys Thr His Met His Lys Ala
465 470 475 480
Gly Ser Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser
485 490 495
Pro Glu Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala
500 505 510
Asp Gly Asp Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His Glu
515 520 525
Pro Glu Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu
530 535 540
Leu Glu Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser Glu
545 550 555 560
Leu Ser Arg Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val Pro
565 570 575
Gly Ala Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu
580 585 590
Val Leu Gly Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro Gln
595 600 605
Tyr Gly Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys
610 615 620
Arg Ala Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly
625 630 635 640
Cys Gly Asp Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly Gly
645 650 655
Phe Ala Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro
660 665 670
Ala Pro Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys
675 680 685
Val Glu Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu
690 695 700
Asn Val Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His Phe
705 710 715 720
Met Lys Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe
725 730 735
Ala Thr Ser Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser
740 745 750
Thr Pro Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly
755 760 765
Thr Ala Ser Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro Gly
770 775 780
Arg Pro Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys
785 790 795 800
Gly Lys Val Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg Ser
805 810 815
His Thr Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys
820 825 830
Ala Gln Ser Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln Ile
835 840 845
Gly Lys Glu Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser Val
850 855 860
Tyr Ser Thr Leu Glu Lys His Met Lys Lys Trp His Gly Glu His Leu
865 870 875 880
Leu Thr Asn Asp Val Lys Ile Glu Gln Ala Glu Arg Ser
885 890
<210> 5
<211> 8320
<212> DNA
<213> Homo sapiens
<220>
<221> 5'UTR
<222> (1)..(975)
<220>
<221> CDS
<222> (976)..(3447)
<220>
<221> 3'UTR
<222> (3448)..(8320)
<220>
<221> polyA#signal
<222> (6162)..(6167)
<220>
<221> polyA#signal
<222> (8281)..(8286)
<400> 5
atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60
agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120
ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180
ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240
cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300
ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360
gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420
ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480
tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540
taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600
ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660
gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720
ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780
ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840
cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900
ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960
atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu
1 5 10
tcc cag agg gag ctc atc acc cca gag gct gac cat gtg gag gcc gcc 1059
Ser Gln Arg Glu Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala
15 20 25
atc ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg 1107
Ile Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu
30 35 40
ggg ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag 1155
Gly Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln
45 50 55 60
tgt caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac 1203
Cys Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His
65 70 75
aaa agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc 1251
Lys Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala
80 85 90
ctg gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa 1299
Leu Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys
95 100 105
gtg tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat 1347
Val Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp
110 115 120
gac cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac 1395
Asp His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn
125 130 135 140
att gca ggt aaa gat gag cct tcc agc tac att tgc aca aca tgc aag 1443
Ile Ala Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys
145 150 155
cag ccc ttc aac agc gcg tgg ttc ctg ctg cag cac gcg cag aac acg 1491
Gln Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr
160 165 170
cac ggc ttc cgc atc tac ctg gag ccc ggg ccg gcc agc agc tcg ctc 1539
His Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu
175 180 185
acg ccg cgg ctc acc atc ccg ccg ccg ctc ggg ccc gag gcc gtg gcg 1587
Thr Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala
190 195 200
cag tcc ccg ctc atg aat ttc ctg ggc gac agc aac ccc ttc aac ctg 1635
Gln Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu
205 210 215 220
ctg cgc atg acg ggc ccc atc ctg cgg gac cac ccg ggc ttc ggc gag 1683
Leu Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu
225 230 235
ggc cgc ctg ccg ggc acg ccg cct ctc ttc agt ccc ccg ccg cgc cac 1731
Gly Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His
240 245 250
cac ctg gac ccg cac cgc ctc agt gcc gag gag atg ggg ctc gtc gcc 1779
His Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala
255 260 265
cag cac ccc agt gcc ttc gac cga gtc atg cgc ctg aac ccc atg gcc 1827
Gln His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala
270 275 280
atc gac tcg ccc gcc atg gac ttc tcg cgg cgg ctc cgc gag ctg gcg 1875
Ile Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala
285 290 295 300
ggc aac agc tcc acg ccg ccg ccc gtg tcc ccg ggc cgc ggc aac cct 1923
Gly Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro
305 310 315
atg cac cgg ctc ctg aac ccc ttc cag ccc agc ccc aag tcc ccg ttc 1971
Met His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe
320 325 330
ctg agc acg ccg ccg ctg ccg ccc atg ccc cct ggc ggc acg ccg ccc 2019
Leu Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro
335 340 345
ccg cag ccg cca gcc aag agc aag tcg tgc gag ttc tgc ggc aag acc 2067
Pro Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr
350 355 360
ttc aag ttc cag agc aat ctc atc gtg cac cgg cgc agt cac acg ggc 2115
Phe Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser His Thr Gly
365 370 375 380
gag aag ccc tac aag tgc cag ctg tgc gac cac gcg tgc tcg cag gcc 2163
Glu Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala
385 390 395
agc aag ctc aag cgc cac atg aag acg cac atg cac aag gcc ggc tcg 2211
Ser Lys Leu Lys Arg His Met Lys Thr His Met His Lys Ala Gly Ser
400 405 410
ctg gcc ggc cgc tcc gac gac ggg ctc tcg gcc gcc agc tcc ccc gag 2259
Leu Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu
415 420 425
ccc ggc acc agc gag ctg gcg ggc gag ggc ctc aag gcg gcc gac ggt 2307
Pro Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly
430 435 440
gac ttc cgc cac cac gag agc gac ccg tcg ctg ggc cac gag ccg gag 2355
Asp Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu
445 450 455 460
gag gag gac gag gag gag gag gag gag gag gag gag ctg cta ctg gag 2403
Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu
465 470 475
aac gag agc cgg ccc gag tcg agc ttc agc atg gac tcg gag ctg agc 2451
Asn Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser
480 485 490
cgc aac cgc gag aac ggc ggt ggt ggg gtg ccc ggg gtc ccg ggc gcg 2499
Arg Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala
495 500 505
ggg ggc ggc gcg gcc aag gcg ctg gct gac gag aag gcg ctg gtg ctg 2547
Gly Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu
510 515 520
ggc aag gtc atg gag aac gtg ggc cta ggc gca ctg ccg cag tac ggc 2595
Gly Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly
525 530 535 540
gag ctc ctg gcc gac aag cag aag cgc ggc gcc ttc ctg aag cgt gcg 2643
Glu Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala
545 550 555
gcg ggc ggc ggg gac gcg ggc gac gac gac gac gcg ggc ggc tgc ggg 2691
Ala Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly
560 565 570
gac gcg ggc gcg ggc ggc gcg gtc aac ggg cgc ggg ggc ggc ttc gcg 2739
Asp Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala
575 580 585
cca ggc acc gag ccc ttc ccc ggg ctc ttc ccg cgc aag ccc gcg ccg 2787
Pro Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro
590 595 600
ctg ccc agc ccc ggg ctc aac agc gcc gcc aag cgc atc aag gtg gag 2835
Leu Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu
605 610 615 620
aag gac ctg gag ctg ccg ccc gcc gcg ctc atc ccg tcc gag aac gtg 2883
Lys Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val
625 630 635
tac tcg cag tgg ctg gtg ggc tac gcg gcg tcg cgg cac ttc atg aag 2931
Tyr Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys
640 645 650
gac ccc ttc ctg ggc ttc acg gac gca cga cag tcg ccc ttc gcc acg 2979
Asp Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr
655 660 665
tcg tcc gag cac tcg tcc gag aac ggc agc ctg cgc ttc tcc acg ccg 3027
Ser Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro
670 675 680
ccc ggg gac ctg ctg gac ggc ggc ctc tcg ggc cgc agc ggc acg gcc 3075
Pro Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala
685 690 695 700
agc gga ggc agc acc ccg cac ctg ggc ggc ccg ggc ccc ggg cgg ccc 3123
Ser Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro
705 710 715
agc tcc aag gag ggc cgc cgc agc gac acg tgc gag tac tgc ggc aag 3171
Ser Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys
720 725 730
gtg ttc aag aac tgc agc aac ttg acg gtg cac cgg cgg agc cac acc 3219
Val Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg Ser His Thr
735 740 745
ggc gag cgg cct tac aag tgc gag ctg tgc aac tac gcg tgc gcg cag 3267
Gly Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln
750 755 760
agc agc aag ctc acg cgc cac atg aag acg cac ggg cag atc ggc aag 3315
Ser Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln Ile Gly Lys
765 770 775 780
gag gtg tac cgc tgc gac atc tgc cag atg ccc ttc agc gtc tac agc 3363
Glu Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser
785 790 795
acc ctg gag aaa cac atg aaa aag tgg cac ggc gag cac ttg ctg act 3411
Thr Leu Glu Lys His Met Lys Lys Trp His Gly Glu His Leu Leu Thr
800 805 810
aac gac gtc aaa atc gag cag gcc gag agg agc taa gcgcgcgggc 3457
Asn Asp Val Lys Ile Glu Gln Ala Glu Arg Ser
815 820
cccggcgccc cgcacctgta cagtggaacc gttgccaacc gagagaatgc tgacctgact 3517
tgcctccgtg tcaccgccac cccgcacccc gcgtgtcccc ggggcccagg ggaggcggca 3577
ctccaaccta acctgtgtct gcgaagtcct atggaaaccc gagggttgat taaggcagta 3637
caaattgtgg agccttttaa ctgtgcaata atttctgtat ttattgggtt ttgtaatttt 3697
tttggcatgt gcaggtactt tttattatta ttttttctgt ttgaattcct ttaagagatt 3757
ttgttgggta tccatccctt ctttgttttt tttttaaccc ggtagtagcc tgagcaatga 3817
ctcgcaagca atgttagagg ggaagcatat cttttaaatt ataatttggg gggaggggtg 3877
gtgctgcttt tttgaaattt aagctaagca tgtgtaattt cttgtgaaga agccaacact 3937
caaatgactt ttaaagttgt ttactttttc attccttcct tttttttgtc ctgaaataaa 3997
aagtggcatg cagttttttt tttaattatt ttttaatttt tttttttggt ttttgttttt 4057
ggggtggggg gtgtggatgt acagcggata acaatctttc aagtcgtagc actttgtttc 4117
agaactggaa tggagatgta gcactcatgt cgtcccgagt caagcggcct tttctgtgtt 4177
gatttcggct ttcatattac ataagggaaa ccttgagtgg tggtgctggg ggaggcaccc 4237
cacagactca gcgccgccag agatagggtt tttggagggc tcctctggga aatggcccga 4297
cagcattctg aggttgtgca tgaccagcag atactatcct gttggtgtgc cctggggtgc 4357
catggctgct attcgctgta gattaggcta cataaaatgg gctgagggta cctttttggg 4417
gagatggggt ggcctgcagt gacacagaaa ggaagaaact agcggtgttc ttttaggcgt 4477
tttctggctt gacggcttct ctcttttttt aaatcacccc caccacataa atctcaaatc 4537
ctatgttgct acaaggggtc atccatcatt tcccaagcag acgaatgccc taattaattg 4597
aagttagtgt tctctcattt aatgcacact gatgatattg tagggatggg tggggtgggg 4657
atcttgcaaa tttctattct cttttactga aaaagcaggg gatgagttcc atcagaaggt 4717
gcccagcgct acttcccagg tttttatttt ttttttccta tctcattagg ttggaaggta 4777
ctaaatattg aactgttaag attagacatt tgaattctgt tgacccgcac tttaaagctt 4837
ttgtttgcat ttaaattaaa tggcttctaa acaagaaatt gcagcatatt cttctctttg 4897
gcccagaggt gggttaaact gtaagggaca gctgagattg agtgtcagta ttgctaagcg 4957
tggcattcac aatactggca ctataaagaa caaaataaaa taataattta taggacagtt 5017
tttctactgc cattcaattt gatgtgagtg ccttgaaaac tgatcttcct atttgagtct 5077
cttgagacaa atgcaaaact ttttttttga aatgaaaaga ctttttaaaa aagtaaaaca 5137
agaaaagtac attctttaga aactaacaaa gccacattta ctttaagtaa aaaaaaaaaa 5197
aattctggtt gaagatagag gatatgaaat gccataagac ccaatcaaat gaagaaataa 5257
acccagcaca accttggaca tccattagct gaattatcct cagccccttt tgtttttggg 5317
acaacgctgc ttagatatgg agtggaggtg atttactgct gaattaaaac tcaagtgaca 5377
caagttacaa gttgatatcg ttgaatgaaa agcaaaacaa aaacaattca ggaacaacgg 5437
ctaatttttt ctaaagttaa atttagtgca ctctgtctta aaaatacgtt tacagtattg 5497
ggtacataca agggtaaaaa aaaaattgtg tgtatgtgtg ttggagcgat cttttttttt 5557
caaagtttgc ttaataggtt atacaaaaat gccacagtgg ccgcgtgtat attgttttct 5617
tttggtgacg gggttttagt atatattata tatattaaaa tttcttgatt actgtaaaag 5677
tggaccagta tttgtaataa tcgagaatgc ctgggcattt tacaaaacaa gaaaaaaaat 5737
acccttttct tttccttgaa aatgttgcag taaaatttaa atggtgggtc tataaatttg 5797
ttcttgttac agtaactgta aagtcggagt tttagtaaat ttttttctgc cttgggtgtt 5857
gaatttttat ttcaaaaaaa atgtatagaa acttgtattt ggggattcaa aggggattgc 5917
tacaccatgt agaaaaagta tgtagaaaaa aagtgcttaa tattgttatt gctttgcaga 5977
aaaaaaaaaa tcacatttct gacctgtact tatttttctc ttcccgcctc cctctggaat 6037
ggatatattg gttggttcat atgatgtagg cacttgctgt atttttactg gagctcgtaa 6097
ttttttaact gtaagcttgt ccttttaaag ggatttaatg tacctttttg ttagtgaatt 6157
tggaaataaa aagaaaaaaa aaacaaaaac aaacaggctg ccataatata tttttttaat 6217
ttggcaggat aaaatattgc aaaaaaaaca catttgtatg ttaagtccta ttgtacagga 6277
gaaaaagggt tgtttgacaa cctttgagaa aaagaaacaa aaggaagtag ttaaatgctt 6337
tggttcacaa atcatttagt tgtatatatt ttttgtcgga attggcctac acagagaacc 6397
gttcgtgttg ggcttctctc tgaacgcccc gaaccttgca tcaaggctcc ttggtgtggc 6457
cacagcagac cagatgggaa attatttgtg ttgagtggaa aaaaatcagt ttttgtaaag 6517
atgtcagtaa cattccacat cgtcctccct ttctctaaga ggccatctct aagatgtcag 6577
atgtagagga gagagagcga gagaacatct tccttctcta ccatcactcc tgtggcggtc 6637
accaccacca cctctcccgc ccttaccagc agaaagcaat gcaaactgag ctgctttagt 6697
ccttgagaaa ttgtgaaaca aacacaaata tcataaaagg agctggtgat tcagctgggt 6757
ccaggtgaag tgacctgctg ttgagaccgg tacaaattgg atttcaggaa ggagactcca 6817
tcacagccag gacctttcgt gccatggaga gtgttggcct cttgtctttc ttccctgctt 6877
tgctgctttg ctctctgaaa cctacattcc gtcagtttcc gaatgcgagg gcctgggatg 6937
aatttggtgc ctttccatat ctcgttctct ctccttcccc tgcgtttcct ctccatcctt 6997
catcctccat tggtcctttt tttttctttc attttttatt taatttcttt tcttcctgtc 7057
tgttcctccc ctaatcctct attttatttt tattttttgt aaagccaagt agctttaaga 7117
taaagtggtg gtcttttgga tgagggaata atgcattttt aaataaaata ccaatatcag 7177
gaagccattt tttatttcag gaaatgtaag aaaccattat ttcaggttat gaaagtataa 7237
ccaagcatcc ttttgggcaa ttccttacca aatgcagaag cttttctgtt cgatgcactc 7297
tttcctcctt gccacttacc tttgcaaagt taaaaaaaag gggggaggga atgggagaga 7357
aagctgagat ttcagtttcc tactgcagtt tcctacctgc agatccaggg gctgctgttg 7417
cctttggatg ccccactgag gtcctagagt gcctccaggg tggtcttcct gtagtcataa 7477
cagctagcca gtgctcacca gcttaccaga ttgccaggac taagccatcc caaagcacaa 7537
gcattgtgtg tctctgtgac tgcagagaag agagaatttt gcttctgttt tgtgtttaaa 7597
aaaccaacac ggaagcagat gatcccgaga gagaggcctc tagcatgggt gacccagccg 7657
acctcaggcc ggtttccgca ctgccacaac tttgttcaaa gttgccccca attggaacct 7717
gccacttggc attagagggt ctttcatggg gagagaagga gactgaatta ctctaagcaa 7777
aatgtgaaaa gtaaggaaat cagcctttca tcccggtcct aagtaaccgt cagccgaagg 7837
tctcgtggaa cacaggcaaa cccgtgattt tggtgctcct tgtaactcag ccctgcaaag 7897
caaagtccca ttgatttaag ttgtttgcat ttgtactggc aaggcaaaat atttttatta 7957
ccttttctat tacttattgt atgagctttt gttgtttact tggaggtttt gtcttttact 8017
acaagtttgg aactatttat tattgcttgg tatttgtgct ctgtttaaga aacaggcact 8077
tttttttatt atggataaaa tgttgagatg acaggaggtc atttcaatat ggcttagtaa 8137
aatatttatt gttcctttat tctctgtaca agattttggg cctctttttt tccttaatgt 8197
cacaatgttg agttcagcat gtgtctgcca tttcatttgt acgcttgttc aaaaccaagt 8257
ttgttctggt ttcaagttat aaaaataaat tggacattta acttaaaaaa aaaaaaaaaa 8317
aaa 8320
<210> 6
<211> 823
<212> PRT
<213> Homo sapiens
<400> 6
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu
1 5 10 15
Leu Ile Thr Pro Glu Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu
20 25 30
Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val
35 40 45
Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn
50 55 60
Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln
65 70 75 80
Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp
85 90 95
Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro
100 105 110
Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu
115 120 125
Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Lys
130 135 140
Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn
145 150 155 160
Ser Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr His Gly Phe Arg
165 170 175
Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu
180 185 190
Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala Gln Ser Pro Leu
195 200 205
Met Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu Leu Arg Met Thr
210 215 220
Gly Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu Gly Arg Leu Pro
225 230 235 240
Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His His Leu Asp Pro
245 250 255
His Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala Gln His Pro Ser
260 265 270
Ala Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala Ile Asp Ser Pro
275 280 285
Ala Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser
290 295 300
Thr Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro Met His Arg Leu
305 310 315 320
Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro
325 330 335
Pro Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro
340 345 350
Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln
355 360 365
Ser Asn Leu Ile Val His Arg Arg Ser His Thr Gly Glu Lys Pro Tyr
370 375 380
Lys Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala Ser Lys Leu Lys
385 390 395 400
Arg His Met Lys Thr His Met His Lys Ala Gly Ser Leu Ala Gly Arg
405 410 415
Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser
420 425 430
Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly Asp Phe Arg His
435 440 445
His Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu Glu Glu Asp Glu
450 455 460
Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg
465 470 475 480
Pro Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser Arg Asn Arg Glu
485 490 495
Asn Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala Gly Gly Gly Ala
500 505 510
Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu Gly Lys Val Met
515 520 525
Glu Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala
530 535 540
Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly
545 550 555 560
Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala
565 570 575
Gly Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu
580 585 590
Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro
595 600 605
Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu Lys Asp Leu Glu
610 615 620
Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp
625 630 635 640
Leu Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys Asp Pro Phe Leu
645 650 655
Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr Ser Ser Glu His
660 665 670
Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu
675 680 685
Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser
690 695 700
Thr Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu
705 710 715 720
Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn
725 730 735
Cys Ser Asn Leu Thr Val His Arg Arg Ser His Thr Gly Glu Arg Pro
740 745 750
Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu
755 760 765
Thr Arg His Met Lys Thr His Gly Gln Ile Gly Lys Glu Val Tyr Arg
770 775 780
Cys Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys
785 790 795 800
His Met Lys Lys Trp His Gly Glu His Leu Leu Thr Asn Asp Val Lys
805 810 815
Ile Glu Gln Ala Glu Arg Ser
820
<210> 7
<211> 8317
<212> DNA
<213> Homo sapiens
<220>
<221> 5'UTR
<222> (1)..(975)
<220>
<221> CDS
<222> (976)..(3444)
<220>
<221> 3'UTR
<222> (3445)..(8317)
<220>
<221> polyA#signal
<222> (6159)..(6164)
<220>
<221> polyA#signal
<222> (8278)..(8283)
<400> 7
atagagagac cgagagctcc cagagaaccc ggactccgcc atcttcacgt tgcaatctat 60
agctcccagt ctgcgcccgc accgacccag gcgcactggg cgagccgccc ctccgccccg 120
ctccccccgg gcccgcggcg ccaggggagc gctggggagc gctcgcgggg actcggcagc 180
ccctccggcc ggcgccagcc tgccaggtga actgggaagg agcctctcct ggtgtccccc 240
cagagcctcg gaagggtcag tctccgagaa aaaacaaaaa caaaaacaaa aacaggcagc 300
ccgcagaaaa cccagaaaca accgaaccgg ggcagtttta cattgctttg ggttttttga 360
gggggcgggg tgagggggta cgagacaagt ccccaagttt tctttgcttt tttttttcct 420
ttgctttttc ttcttttatt tttttatttg tttgcatttt ttttcccctc ctggtagaag 480
tgcgctttcc acctaccaga ccctgaaaga aagtgtcagg agccggtgca aaacccagtt 540
taagttcaag aagacatttg caagtgcaag aggccaagca gtttgaagaa gtgtaagaga 600
ttttttttcc ttcgaaagaa tatattttta aagaaaccag ccagtccgcg gaaagcaaca 660
gcagtttttt tttttttttg cctctttttc ttattttaga tcgagaggtt tttcttgctt 720
ttcttccctt ttttttcttt ttgcaaacaa aacaaaaaac agcatagaag aaagagcaaa 780
ataaagaaga agaagaggag gaagagaggg aaagagagga agggaaaaaa aacaccaacc 840
cgggcagagg aggaggtgcg gcggcggcgg cggcggcggc agcggcggca gcggcgcggc 900
ggcggctcgg accccctccc ccggctcccc ccatcagtgc agctctccgg cgatgccaga 960
atagatgccg gggca atg tcc cgc cgc aaa cag ggc aac ccg cag cac ttg 1011
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu
1 5 10
tcc cag agg gag ctc atc acc cag gct gac cat gtg gag gcc gcc atc 1059
Ser Gln Arg Glu Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile
15 20 25
ctc gaa gaa gac gag ggt ctg gag ata gag gag cca agt ggc ctg ggg 1107
Leu Glu Glu Asp Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly
30 35 40
ctg atg gtg ggt ggc ccc gac cct gac ctg ctc acc tgt ggc cag tgt 1155
Leu Met Val Gly Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys
45 50 55 60
caa atg aac ttc ccc ttg ggg gac atc ctg gtt ttt ata gag cac aaa 1203
Gln Met Asn Phe Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys
65 70 75
agg aag cag tgt ggc ggc agc ttg ggt gcc tgc tat gac aag gcc ctg 1251
Arg Lys Gln Cys Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu
80 85 90
gac aag gac agc ccg cca ccc tcc tca cgc tcc gag ctc agg aaa gtg 1299
Asp Lys Asp Ser Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val
95 100 105
tcc gag ccg gtg gag atc ggg atc caa gtc acc ccc gac gaa gat gac 1347
Ser Glu Pro Val Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp
110 115 120
cac ctg ctc tca ccc acg aaa ggc atc tgt ccc aag cag gag aac att 1395
His Leu Leu Ser Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile
125 130 135 140
gca ggt aaa gat gag cct tcc agc tac att tgc aca aca tgc aag cag 1443
Ala Gly Lys Asp Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys Gln
145 150 155
ccc ttc aac agc gcg tgg ttc ctg ctg cag cac gcg cag aac acg cac 1491
Pro Phe Asn Ser Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr His
160 165 170
ggc ttc cgc atc tac ctg gag ccc ggg ccg gcc agc agc tcg ctc acg 1539
Gly Phe Arg Ile Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu Thr
175 180 185
ccg cgg ctc acc atc ccg ccg ccg ctc ggg ccc gag gcc gtg gcg cag 1587
Pro Arg Leu Thr Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala Gln
190 195 200
tcc ccg ctc atg aat ttc ctg ggc gac agc aac ccc ttc aac ctg ctg 1635
Ser Pro Leu Met Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu Leu
205 210 215 220
cgc atg acg ggc ccc atc ctg cgg gac cac ccg ggc ttc ggc gag ggc 1683
Arg Met Thr Gly Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu Gly
225 230 235
cgc ctg ccg ggc acg ccg cct ctc ttc agt ccc ccg ccg cgc cac cac 1731
Arg Leu Pro Gly Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His His
240 245 250
ctg gac ccg cac cgc ctc agt gcc gag gag atg ggg ctc gtc gcc cag 1779
Leu Asp Pro His Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala Gln
255 260 265
cac ccc agt gcc ttc gac cga gtc atg cgc ctg aac ccc atg gcc atc 1827
His Pro Ser Ala Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala Ile
270 275 280
gac tcg ccc gcc atg gac ttc tcg cgg cgg ctc cgc gag ctg gcg ggc 1875
Asp Ser Pro Ala Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala Gly
285 290 295 300
aac agc tcc acg ccg ccg ccc gtg tcc ccg ggc cgc ggc aac cct atg 1923
Asn Ser Ser Thr Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro Met
305 310 315
cac cgg ctc ctg aac ccc ttc cag ccc agc ccc aag tcc ccg ttc ctg 1971
His Arg Leu Leu Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe Leu
320 325 330
agc acg ccg ccg ctg ccg ccc atg ccc cct ggc ggc acg ccg ccc ccg 2019
Ser Thr Pro Pro Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro Pro
335 340 345
cag ccg cca gcc aag agc aag tcg tgc gag ttc tgc ggc aag acc ttc 2067
Gln Pro Pro Ala Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr Phe
350 355 360
aag ttc cag agc aat ctc atc gtg cac cgg cgc agt cac acg ggc gag 2115
Lys Phe Gln Ser Asn Leu Ile Val His Arg Arg Ser His Thr Gly Glu
365 370 375 380
aag ccc tac aag tgc cag ctg tgc gac cac gcg tgc tcg cag gcc agc 2163
Lys Pro Tyr Lys Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala Ser
385 390 395
aag ctc aag cgc cac atg aag acg cac atg cac aag gcc ggc tcg ctg 2211
Lys Leu Lys Arg His Met Lys Thr His Met His Lys Ala Gly Ser Leu
400 405 410
gcc ggc cgc tcc gac gac ggg ctc tcg gcc gcc agc tcc ccc gag ccc 2259
Ala Gly Arg Ser Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu Pro
415 420 425
ggc acc agc gag ctg gcg ggc gag ggc ctc aag gcg gcc gac ggt gac 2307
Gly Thr Ser Glu Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly Asp
430 435 440
ttc cgc cac cac gag agc gac ccg tcg ctg ggc cac gag ccg gag gag 2355
Phe Arg His His Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu Glu
445 450 455 460
gag gac gag gag gag gag gag gag gag gag gag ctg cta ctg gag aac 2403
Glu Asp Glu Glu Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu Asn
465 470 475
gag agc cgg ccc gag tcg agc ttc agc atg gac tcg gag ctg agc cgc 2451
Glu Ser Arg Pro Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser Arg
480 485 490
aac cgc gag aac ggc ggt ggt ggg gtg ccc ggg gtc ccg ggc gcg ggg 2499
Asn Arg Glu Asn Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala Gly
495 500 505
ggc ggc gcg gcc aag gcg ctg gct gac gag aag gcg ctg gtg ctg ggc 2547
Gly Gly Ala Ala Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu Gly
510 515 520
aag gtc atg gag aac gtg ggc cta ggc gca ctg ccg cag tac ggc gag 2595
Lys Val Met Glu Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly Glu
525 530 535 540
ctc ctg gcc gac aag cag aag cgc ggc gcc ttc ctg aag cgt gcg gcg 2643
Leu Leu Ala Asp Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala Ala
545 550 555
ggc ggc ggg gac gcg ggc gac gac gac gac gcg ggc ggc tgc ggg gac 2691
Gly Gly Gly Asp Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly Asp
560 565 570
gcg ggc gcg ggc ggc gcg gtc aac ggg cgc ggg ggc ggc ttc gcg cca 2739
Ala Gly Ala Gly Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala Pro
575 580 585
ggc acc gag ccc ttc ccc ggg ctc ttc ccg cgc aag ccc gcg ccg ctg 2787
Gly Thr Glu Pro Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro Leu
590 595 600
ccc agc ccc ggg ctc aac agc gcc gcc aag cgc atc aag gtg gag aag 2835
Pro Ser Pro Gly Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu Lys
605 610 615 620
gac ctg gag ctg ccg ccc gcc gcg ctc atc ccg tcc gag aac gtg tac 2883
Asp Leu Glu Leu Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val Tyr
625 630 635
tcg cag tgg ctg gtg ggc tac gcg gcg tcg cgg cac ttc atg aag gac 2931
Ser Gln Trp Leu Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys Asp
640 645 650
ccc ttc ctg ggc ttc acg gac gca cga cag tcg ccc ttc gcc acg tcg 2979
Pro Phe Leu Gly Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr Ser
655 660 665
tcc gag cac tcg tcc gag aac ggc agc ctg cgc ttc tcc acg ccg ccc 3027
Ser Glu His Ser Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro Pro
670 675 680
ggg gac ctg ctg gac ggc ggc ctc tcg ggc cgc agc ggc acg gcc agc 3075
Gly Asp Leu Leu Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala Ser
685 690 695 700
gga ggc agc acc ccg cac ctg ggc ggc ccg ggc ccc ggg cgg ccc agc 3123
Gly Gly Ser Thr Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro Ser
705 710 715
tcc aag gag ggc cgc cgc agc gac acg tgc gag tac tgc ggc aag gtg 3171
Ser Lys Glu Gly Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys Val
720 725 730
ttc aag aac tgc agc aac ttg acg gtg cac cgg cgg agc cac acc ggc 3219
Phe Lys Asn Cys Ser Asn Leu Thr Val His Arg Arg Ser His Thr Gly
735 740 745
gag cgg cct tac aag tgc gag ctg tgc aac tac gcg tgc gcg cag agc 3267
Glu Arg Pro Tyr Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln Ser
750 755 760
agc aag ctc acg cgc cac atg aag acg cac ggg cag atc ggc aag gag 3315
Ser Lys Leu Thr Arg His Met Lys Thr His Gly Gln Ile Gly Lys Glu
765 770 775 780
gtg tac cgc tgc gac atc tgc cag atg ccc ttc agc gtc tac agc acc 3363
Val Tyr Arg Cys Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser Thr
785 790 795
ctg gag aaa cac atg aaa aag tgg cac ggc gag cac ttg ctg act aac 3411
Leu Glu Lys His Met Lys Lys Trp His Gly Glu His Leu Leu Thr Asn
800 805 810
gac gtc aaa atc gag cag gcc gag agg agc taa gcgcgcgggc cccggcgccc 3464
Asp Val Lys Ile Glu Gln Ala Glu Arg Ser
815 820
cgcacctgta cagtggaacc gttgccaacc gagagaatgc tgacctgact tgcctccgtg 3524
tcaccgccac cccgcacccc gcgtgtcccc ggggcccagg ggaggcggca ctccaaccta 3584
acctgtgtct gcgaagtcct atggaaaccc gagggttgat taaggcagta caaattgtgg 3644
agccttttaa ctgtgcaata atttctgtat ttattgggtt ttgtaatttt tttggcatgt 3704
gcaggtactt tttattatta ttttttctgt ttgaattcct ttaagagatt ttgttgggta 3764
tccatccctt ctttgttttt tttttaaccc ggtagtagcc tgagcaatga ctcgcaagca 3824
atgttagagg ggaagcatat cttttaaatt ataatttggg gggaggggtg gtgctgcttt 3884
tttgaaattt aagctaagca tgtgtaattt cttgtgaaga agccaacact caaatgactt 3944
ttaaagttgt ttactttttc attccttcct tttttttgtc ctgaaataaa aagtggcatg 4004
cagttttttt tttaattatt ttttaatttt tttttttggt ttttgttttt ggggtggggg 4064
gtgtggatgt acagcggata acaatctttc aagtcgtagc actttgtttc agaactggaa 4124
tggagatgta gcactcatgt cgtcccgagt caagcggcct tttctgtgtt gatttcggct 4184
ttcatattac ataagggaaa ccttgagtgg tggtgctggg ggaggcaccc cacagactca 4244
gcgccgccag agatagggtt tttggagggc tcctctggga aatggcccga cagcattctg 4304
aggttgtgca tgaccagcag atactatcct gttggtgtgc cctggggtgc catggctgct 4364
attcgctgta gattaggcta cataaaatgg gctgagggta cctttttggg gagatggggt 4424
ggcctgcagt gacacagaaa ggaagaaact agcggtgttc ttttaggcgt tttctggctt 4484
gacggcttct ctcttttttt aaatcacccc caccacataa atctcaaatc ctatgttgct 4544
acaaggggtc atccatcatt tcccaagcag acgaatgccc taattaattg aagttagtgt 4604
tctctcattt aatgcacact gatgatattg tagggatggg tggggtgggg atcttgcaaa 4664
tttctattct cttttactga aaaagcaggg gatgagttcc atcagaaggt gcccagcgct 4724
acttcccagg tttttatttt ttttttccta tctcattagg ttggaaggta ctaaatattg 4784
aactgttaag attagacatt tgaattctgt tgacccgcac tttaaagctt ttgtttgcat 4844
ttaaattaaa tggcttctaa acaagaaatt gcagcatatt cttctctttg gcccagaggt 4904
gggttaaact gtaagggaca gctgagattg agtgtcagta ttgctaagcg tggcattcac 4964
aatactggca ctataaagaa caaaataaaa taataattta taggacagtt tttctactgc 5024
cattcaattt gatgtgagtg ccttgaaaac tgatcttcct atttgagtct cttgagacaa 5084
atgcaaaact ttttttttga aatgaaaaga ctttttaaaa aagtaaaaca agaaaagtac 5144
attctttaga aactaacaaa gccacattta ctttaagtaa aaaaaaaaaa aattctggtt 5204
gaagatagag gatatgaaat gccataagac ccaatcaaat gaagaaataa acccagcaca 5264
accttggaca tccattagct gaattatcct cagccccttt tgtttttggg acaacgctgc 5324
ttagatatgg agtggaggtg atttactgct gaattaaaac tcaagtgaca caagttacaa 5384
gttgatatcg ttgaatgaaa agcaaaacaa aaacaattca ggaacaacgg ctaatttttt 5444
ctaaagttaa atttagtgca ctctgtctta aaaatacgtt tacagtattg ggtacataca 5504
agggtaaaaa aaaaattgtg tgtatgtgtg ttggagcgat cttttttttt caaagtttgc 5564
ttaataggtt atacaaaaat gccacagtgg ccgcgtgtat attgttttct tttggtgacg 5624
gggttttagt atatattata tatattaaaa tttcttgatt actgtaaaag tggaccagta 5684
tttgtaataa tcgagaatgc ctgggcattt tacaaaacaa gaaaaaaaat acccttttct 5744
tttccttgaa aatgttgcag taaaatttaa atggtgggtc tataaatttg ttcttgttac 5804
agtaactgta aagtcggagt tttagtaaat ttttttctgc cttgggtgtt gaatttttat 5864
ttcaaaaaaa atgtatagaa acttgtattt ggggattcaa aggggattgc tacaccatgt 5924
agaaaaagta tgtagaaaaa aagtgcttaa tattgttatt gctttgcaga aaaaaaaaaa 5984
tcacatttct gacctgtact tatttttctc ttcccgcctc cctctggaat ggatatattg 6044
gttggttcat atgatgtagg cacttgctgt atttttactg gagctcgtaa ttttttaact 6104
gtaagcttgt ccttttaaag ggatttaatg tacctttttg ttagtgaatt tggaaataaa 6164
aagaaaaaaa aaacaaaaac aaacaggctg ccataatata tttttttaat ttggcaggat 6224
aaaatattgc aaaaaaaaca catttgtatg ttaagtccta ttgtacagga gaaaaagggt 6284
tgtttgacaa cctttgagaa aaagaaacaa aaggaagtag ttaaatgctt tggttcacaa 6344
atcatttagt tgtatatatt ttttgtcgga attggcctac acagagaacc gttcgtgttg 6404
ggcttctctc tgaacgcccc gaaccttgca tcaaggctcc ttggtgtggc cacagcagac 6464
cagatgggaa attatttgtg ttgagtggaa aaaaatcagt ttttgtaaag atgtcagtaa 6524
cattccacat cgtcctccct ttctctaaga ggccatctct aagatgtcag atgtagagga 6584
gagagagcga gagaacatct tccttctcta ccatcactcc tgtggcggtc accaccacca 6644
cctctcccgc ccttaccagc agaaagcaat gcaaactgag ctgctttagt ccttgagaaa 6704
ttgtgaaaca aacacaaata tcataaaagg agctggtgat tcagctgggt ccaggtgaag 6764
tgacctgctg ttgagaccgg tacaaattgg atttcaggaa ggagactcca tcacagccag 6824
gacctttcgt gccatggaga gtgttggcct cttgtctttc ttccctgctt tgctgctttg 6884
ctctctgaaa cctacattcc gtcagtttcc gaatgcgagg gcctgggatg aatttggtgc 6944
ctttccatat ctcgttctct ctccttcccc tgcgtttcct ctccatcctt catcctccat 7004
tggtcctttt tttttctttc attttttatt taatttcttt tcttcctgtc tgttcctccc 7064
ctaatcctct attttatttt tattttttgt aaagccaagt agctttaaga taaagtggtg 7124
gtcttttgga tgagggaata atgcattttt aaataaaata ccaatatcag gaagccattt 7184
tttatttcag gaaatgtaag aaaccattat ttcaggttat gaaagtataa ccaagcatcc 7244
ttttgggcaa ttccttacca aatgcagaag cttttctgtt cgatgcactc tttcctcctt 7304
gccacttacc tttgcaaagt taaaaaaaag gggggaggga atgggagaga aagctgagat 7364
ttcagtttcc tactgcagtt tcctacctgc agatccaggg gctgctgttg cctttggatg 7424
ccccactgag gtcctagagt gcctccaggg tggtcttcct gtagtcataa cagctagcca 7484
gtgctcacca gcttaccaga ttgccaggac taagccatcc caaagcacaa gcattgtgtg 7544
tctctgtgac tgcagagaag agagaatttt gcttctgttt tgtgtttaaa aaaccaacac 7604
ggaagcagat gatcccgaga gagaggcctc tagcatgggt gacccagccg acctcaggcc 7664
ggtttccgca ctgccacaac tttgttcaaa gttgccccca attggaacct gccacttggc 7724
attagagggt ctttcatggg gagagaagga gactgaatta ctctaagcaa aatgtgaaaa 7784
gtaaggaaat cagcctttca tcccggtcct aagtaaccgt cagccgaagg tctcgtggaa 7844
cacaggcaaa cccgtgattt tggtgctcct tgtaactcag ccctgcaaag caaagtccca 7904
ttgatttaag ttgtttgcat ttgtactggc aaggcaaaat atttttatta ccttttctat 7964
tacttattgt atgagctttt gttgtttact tggaggtttt gtcttttact acaagtttgg 8024
aactatttat tattgcttgg tatttgtgct ctgtttaaga aacaggcact tttttttatt 8084
atggataaaa tgttgagatg acaggaggtc atttcaatat ggcttagtaa aatatttatt 8144
gttcctttat tctctgtaca agattttggg cctctttttt tccttaatgt cacaatgttg 8204
agttcagcat gtgtctgcca tttcatttgt acgcttgttc aaaaccaagt ttgttctggt 8264
ttcaagttat aaaaataaat tggacattta acttaaaaaa aaaaaaaaaa aaa 8317
<210> 8
<211> 822
<212> PRT
<213> Homo sapiens
<400> 8
Met Ser Arg Arg Lys Gln Gly Asn Pro Gln His Leu Ser Gln Arg Glu
1 5 10 15
Leu Ile Thr Gln Ala Asp His Val Glu Ala Ala Ile Leu Glu Glu Asp
20 25 30
Glu Gly Leu Glu Ile Glu Glu Pro Ser Gly Leu Gly Leu Met Val Gly
35 40 45
Gly Pro Asp Pro Asp Leu Leu Thr Cys Gly Gln Cys Gln Met Asn Phe
50 55 60
Pro Leu Gly Asp Ile Leu Val Phe Ile Glu His Lys Arg Lys Gln Cys
65 70 75 80
Gly Gly Ser Leu Gly Ala Cys Tyr Asp Lys Ala Leu Asp Lys Asp Ser
85 90 95
Pro Pro Pro Ser Ser Arg Ser Glu Leu Arg Lys Val Ser Glu Pro Val
100 105 110
Glu Ile Gly Ile Gln Val Thr Pro Asp Glu Asp Asp His Leu Leu Ser
115 120 125
Pro Thr Lys Gly Ile Cys Pro Lys Gln Glu Asn Ile Ala Gly Lys Asp
130 135 140
Glu Pro Ser Ser Tyr Ile Cys Thr Thr Cys Lys Gln Pro Phe Asn Ser
145 150 155 160
Ala Trp Phe Leu Leu Gln His Ala Gln Asn Thr His Gly Phe Arg Ile
165 170 175
Tyr Leu Glu Pro Gly Pro Ala Ser Ser Ser Leu Thr Pro Arg Leu Thr
180 185 190
Ile Pro Pro Pro Leu Gly Pro Glu Ala Val Ala Gln Ser Pro Leu Met
195 200 205
Asn Phe Leu Gly Asp Ser Asn Pro Phe Asn Leu Leu Arg Met Thr Gly
210 215 220
Pro Ile Leu Arg Asp His Pro Gly Phe Gly Glu Gly Arg Leu Pro Gly
225 230 235 240
Thr Pro Pro Leu Phe Ser Pro Pro Pro Arg His His Leu Asp Pro His
245 250 255
Arg Leu Ser Ala Glu Glu Met Gly Leu Val Ala Gln His Pro Ser Ala
260 265 270
Phe Asp Arg Val Met Arg Leu Asn Pro Met Ala Ile Asp Ser Pro Ala
275 280 285
Met Asp Phe Ser Arg Arg Leu Arg Glu Leu Ala Gly Asn Ser Ser Thr
290 295 300
Pro Pro Pro Val Ser Pro Gly Arg Gly Asn Pro Met His Arg Leu Leu
305 310 315 320
Asn Pro Phe Gln Pro Ser Pro Lys Ser Pro Phe Leu Ser Thr Pro Pro
325 330 335
Leu Pro Pro Met Pro Pro Gly Gly Thr Pro Pro Pro Gln Pro Pro Ala
340 345 350
Lys Ser Lys Ser Cys Glu Phe Cys Gly Lys Thr Phe Lys Phe Gln Ser
355 360 365
Asn Leu Ile Val His Arg Arg Ser His Thr Gly Glu Lys Pro Tyr Lys
370 375 380
Cys Gln Leu Cys Asp His Ala Cys Ser Gln Ala Ser Lys Leu Lys Arg
385 390 395 400
His Met Lys Thr His Met His Lys Ala Gly Ser Leu Ala Gly Arg Ser
405 410 415
Asp Asp Gly Leu Ser Ala Ala Ser Ser Pro Glu Pro Gly Thr Ser Glu
420 425 430
Leu Ala Gly Glu Gly Leu Lys Ala Ala Asp Gly Asp Phe Arg His His
435 440 445
Glu Ser Asp Pro Ser Leu Gly His Glu Pro Glu Glu Glu Asp Glu Glu
450 455 460
Glu Glu Glu Glu Glu Glu Glu Leu Leu Leu Glu Asn Glu Ser Arg Pro
465 470 475 480
Glu Ser Ser Phe Ser Met Asp Ser Glu Leu Ser Arg Asn Arg Glu Asn
485 490 495
Gly Gly Gly Gly Val Pro Gly Val Pro Gly Ala Gly Gly Gly Ala Ala
500 505 510
Lys Ala Leu Ala Asp Glu Lys Ala Leu Val Leu Gly Lys Val Met Glu
515 520 525
Asn Val Gly Leu Gly Ala Leu Pro Gln Tyr Gly Glu Leu Leu Ala Asp
530 535 540
Lys Gln Lys Arg Gly Ala Phe Leu Lys Arg Ala Ala Gly Gly Gly Asp
545 550 555 560
Ala Gly Asp Asp Asp Asp Ala Gly Gly Cys Gly Asp Ala Gly Ala Gly
565 570 575
Gly Ala Val Asn Gly Arg Gly Gly Gly Phe Ala Pro Gly Thr Glu Pro
580 585 590
Phe Pro Gly Leu Phe Pro Arg Lys Pro Ala Pro Leu Pro Ser Pro Gly
595 600 605
Leu Asn Ser Ala Ala Lys Arg Ile Lys Val Glu Lys Asp Leu Glu Leu
610 615 620
Pro Pro Ala Ala Leu Ile Pro Ser Glu Asn Val Tyr Ser Gln Trp Leu
625 630 635 640
Val Gly Tyr Ala Ala Ser Arg His Phe Met Lys Asp Pro Phe Leu Gly
645 650 655
Phe Thr Asp Ala Arg Gln Ser Pro Phe Ala Thr Ser Ser Glu His Ser
660 665 670
Ser Glu Asn Gly Ser Leu Arg Phe Ser Thr Pro Pro Gly Asp Leu Leu
675 680 685
Asp Gly Gly Leu Ser Gly Arg Ser Gly Thr Ala Ser Gly Gly Ser Thr
690 695 700
Pro His Leu Gly Gly Pro Gly Pro Gly Arg Pro Ser Ser Lys Glu Gly
705 710 715 720
Arg Arg Ser Asp Thr Cys Glu Tyr Cys Gly Lys Val Phe Lys Asn Cys
725 730 735
Ser Asn Leu Thr Val His Arg Arg Ser His Thr Gly Glu Arg Pro Tyr
740 745 750
Lys Cys Glu Leu Cys Asn Tyr Ala Cys Ala Gln Ser Ser Lys Leu Thr
755 760 765
Arg His Met Lys Thr His Gly Gln Ile Gly Lys Glu Val Tyr Arg Cys
770 775 780
Asp Ile Cys Gln Met Pro Phe Ser Val Tyr Ser Thr Leu Glu Lys His
785 790 795 800
Met Lys Lys Trp His Gly Glu His Leu Leu Thr Asn Asp Val Lys Ile
805 810 815
Glu Gln Ala Glu Arg Ser
820
<210> 9
<211> 9578
<212> DNA
<213> Homo sapiens
<220>
<221> exon
<222> (5159)..(6223)
<400> 9
gaattcaaac tcacggatat gtgtgtgtct tcaaaacaga gctctcagca tcttcaggaa 60
aacggtcttc cttgcagttt cagttacaca atttggagac tcagtgacaa aagagaaagc 120
agcagagaga cccttttgca taacacacac acacacacac acacacacac acaaacacac 180
acgtgcactc acaccacagc cgctcggatc tctgtatatg tgaggggtgg gggtggaatt 240
tggtgcagtc tgatcatctt catgaacgat atttctccca agtcgaccaa ctgggtgatg 300
ccagtcccta ccaaatttga attgatgact caactaaaga attaaaatta gcaagacaag 360
aaaattccaa atgaggtgag aaagctgtag aaatagttcc agatccccta gtactgagcc 420
attcaatatc atttctgatg acagggacag agctaggaac attcaatgtg ggtgtgagtc 480
cttttcatat acggggagct gggtaagtat tttttaagga aaataataca tgaatcagga 540
acagtgaatt ttatttaacc ccttgcaggc tgcagataca aaggcagccg gcaatgatgc 600
ctcagttttc ctacagctta cctatgcctt atacagttaa gcaacggtca gaaatgtact 660
actgtatcaa ggccaggtat tacttgcaga aaaaaataag gtgccaatga tgtcatgttt 720
taacaaaagc aatgttgtta aattcagtac accaaaagaa tcaaccaaac aactgttgaa 780
aggcaagttt tgtggtcctg actctgctat caggtgacaa cgtgaaaaac tcctctaaat 840
ccagcaaagc tttaattgag tgcttatggc tcccagaaat ttgctgtaat tttcagaaat 900
gacataaaat aattctagaa gatacagcag gaagcccaaa aaggcctctt ttgtcttttt 960
atgcctctgg atttgatagc tgctaaagat tctagaactg taaggaaagr gataaggacc 1020
accttgggag ccttattaat atgtacataa atatgatttg cttggtgcct ccactgtggt 1080
ttcctcacaa gttagaataa gtccatccac tgatcagatc ggaacatcgt attcatgttc 1140
atcttctcag tcaataacac ttatagatcc ggaggaatag aaatgaacag acaggggttg 1200
cttctgagtc tgccctatac ctgtgaatat gaaacgattt gccctctctg catggttttc 1260
ttcttcttct tcttcttctt cttctttgtt ttaaagcacc aaaaatgaag cccaaagtaa 1320
tttggtaaga tgtgctgttg aattgctaca aagttgactg cgtttcagag ggtggatctg 1380
tgttaaaaag aaaacaacaa aaacaaatga aatgtcagtt ttctttctgc agaaacatta 1440
ggacttccca tttctactga cacgtcctta tcttgattct ttccaaattt ttgtaaagac 1500
ataagagata aaatataaca gctcagaagg caaagataac attgtaggat ctcgaataga 1560
gtccaacctc agctgagtta agtattgaga atcgttcaaa gaattttaaa caaaaagcct 1620
ggcttggggg tcacgtgtct gtttaatctg cccccactgc atggtgtgtt acacgcagca 1680
cacacaggga attaaagccc cacataaggt taataaaaat gcactctgat ttgatgaaat 1740
gatttctgat ttctgaacta ttcctctata aagaaattta aagtgactga gaatatggag 1800
gattatctgc tggaatgcac tgtgaagcta gaaaaagaat agcagggaaa tatttgtgag 1860
ttcaaaaagc tttttgacat ctgctctgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgta 1920
aagatagtgc agaaaaggtg gcatttattt ccatgtgatt ccagcatgca caaagcccca 1980
gctttgggcc cagcacacag taggtctgca gcaggtgcta gagaaatgaa cctggtttta 2040
agatattagt tcaggaccac atttggaccc acactttttc cttttacatt ttcatatgtg 2100
agccacctgc accctctttt ttgggggtgg ggagggggca ggagtgactt gtattttaaa 2160
caaaggtttg gtgaagaaga ggtggggtgg ggtgcggtgg ggcggtgcag tgaccttctc 2220
aggagagtcc tgaagccccc tctcgcctgc ctggggtgct gaggcagggg tgggtacatg 2280
gctgtgggcc gaggtcgacc acccccctcc cgccccgcct gctgtctggg catctagaga 2340
gtggggaaac attagtacgg gccagctgcg gaagcctggc agggtcgagg gagaggtcaa 2400
ggtcggccga gaggcggcta ttgatccggc ttggaacgtg agacatggag cgcagcaaga 2460
ctaaaggggg agctgtgaga ccagacatta acagctttgc gcgctgatga ggcccgtgcc 2520
agacgggcag agggaaaaag aggagactgg agtggcagct gggatcgctc cctgcctgcg 2580
cccggccgcc tctcgggaga agaggaggag gaggaggagg rgaaggaggg gragaagrag 2640
gaggaggggg aggaagatgc ggaggaaaag ggggaggagg agggcgaagg ggccggctca 2700
aggctgggca ggggcagagc agcctctccc cggctgccgc gaggtggagc gcgccggcgg 2760
gcggcggcgt gtccggccct gcgtccgccc gcccgcgcgt ccctcttccc gccgtcgggg 2820
cagcgcgggg ccaatgagga agtgctcctc gggtccgtgg ggcacgcgcc ggcccacgcc 2880
agctacttcc tgctgggaag tkgggaggsg gtgccccctc cccaggcacg gccccttacc 2940
gcacgcgggg tggcggctgc agctgggact ccgagagccc ttgcgccgct cgcggagggg 3000
ctcccttttc ctgaggggtc ctccccgtcc cgccttgcca ctggcggggt ctgccttcct 3060
tgtaatcaac cccaggaagg tgagggtcgt gggtcgggat ttcgagtccc ggaccgcggc 3120
ggcgctgggc tgcaggcacg ccgcggtgtt ttgggtccag acctgtccct gacgcgctgt 3180
gtgtcctagg gcaaagtgct caccctctct gggcttcaca tcgctagttc tcagaaagag 3240
agcgcgagtt gatctttcaa atttagagtc cgggcgagta gggatggcca gtttatgaat 3300
gtcttaaaga agtttattaa aggtgcgtgt gggcatattt tttttaagcc actttcctgg 3360
aaagattttc ccggtgagag ggatggcaga agagggaggc cctactagac tttggaccac 3420
gtggaggtgg ggtgttgggg gtgggcagcc gggtgcagcc tgcccggcca gggcgaggag 3480
gtgcaagtcc gcgccccgcc cccggtctcc atccgctcgg cctcgcgtcc gcccaccgtg 3540
gagcccacag tttacagaac tgcaagccag ggcacatttt attgttatta ttttttaggg 3600
tatgggactg gaagggatct ctttctgttc tcgctcacgg actctgggcg ctgttaaatt 3660
gttggtgcca tcgccccacc caagaccttc gggacgaaaa caaaaacccc cgtgtgcccc 3720
ccgaggaaaa ggccccgagg gaggcggcgc tgaggcgtca cggcctcgcc atgcgcccgg 3780
gtgaagccgc cggagccagg cctggggcgg agtggggtgg gtgcagctgg actcgcccgc 3840
gaagcctagc cggagccagg ccccgacccg ccctggccgc ctccagagaa accmtgagaa 3900
gggagaggag gccagcccgt ggcgcgccca gccctggagc cagtcatcaa attgacaaag 3960
ttgccacagc ctgggaatgg gggtgtcacg gggccgtggt ctggccttgt ccccgggcca 4020
cggagaggcc ccacaactcc tcttgtcctc gccggttgga gatcaaacgg ctgacaaggc 4080
agctgcgtcc ttcccagtct gacaggcatt tccaagtcct accctgggcm gaggagcgcg 4140
gggggcgggg tgtgacttcc aggttgctgt gattgtcagg ggcgcctcct ggagtcaccc 4200
acccgagtat ctgcggagat ttggccacac ctactcctgg gctggcaagt ccaagtccct 4260
ctcccacgtg gagcgccccg gtccctttac cctctcgctt gccatagacc cagtttagga 4320
ggtggggtcg tgtttgaccc caggagttaa tcggggtaag gtgaggggag gggacaaaga 4380
tttgagtgaa aatccttttc caagtgggac tcaaacaagg tctcaaacac ttctcacccc 4440
ctcacgtgct cttgattctg ttgtcttagt gtcgtttatt ttgtcatcct caccctccca 4500
gagtctgtaa taccaggatt tatatggaga cactttttgg aagttgaact ccaacatcta 4560
ctcccctccc ctcgccgccc gcgaccataa aacaaaagta aaaactacca agcgactttt 4620
ccagggaaac gaagcgattc ttactgtccc cccaactccc atgtcgaccc caaccctttt 4680
ccacagtcca cgcccccacc cccaaagtcc aagtccgaaa gagcttttgg gtgggtggag 4740
acttgcattg attcaattta gttcactcac acagcacccc gccccccttc tcagggggtc 4800
ctgctcccag gatggaggag atataaggac gatttttctt ttattttaaa ataagctgcc 4860
cagtggcccc ccccaacccc ctcccgctgt tgcgcagccg gggctcgggg gagatgagcg 4920
cacaaaaacg cggtttgcac gtgtgtccgg cttgggctgc gggtgtgcgc aactggcgac 4980
tgtgtgtgtg tgtgtgtgag tgtgcgcgcg cgcgcgagtg tgtctctgtg tgtgctttct 5040
tgttctctta cagggtacaa tgttaaaaag ccaccgctag tcgcccccag tgctccgact 5100
ctctgggtct ttttgtctct agtgcagatt aaacgtcacg tccgcacttg aacttgaatt 5160
ttatcccatt gtacagaggc agccccagcc atagagagac cgagagctcc cagagaaccc 5220
ggactccgcc atcttcacgt tgcaatctat agctcccagt ctgcgcccgc accgacccag 5280
gcgcactggg cgagccgccc ctccgccccg ctccccccgg gcccgcggcg ccaggggagc 5340
gctggggagc gctcgcgggg actcggcagc ccctccgwcc ggcgccagcc tgccaggtga 5400
actgggaagg agcctctcct ggtgtccccc cagagcctcg gaagggtcag tctccgagaa 5460
aaaacaaaaa caaaaacaaa aacaggcagc ccgcagaaaa cccagaaaca accgaaccgg 5520
ggcagtttta cattgctttg ggttttttga gggggcgggg tgagggggta cgagacaagt 5580
ccccaagttt tctttgcttt tttttttcct ttgctttttc ttcttttatt tttttatttg 5640
tttgcatttt ttttcccctc ctggtagaag tgcgctttcc acctaccaga ccctgaaaga 5700
aagtgtcagg agccggtgca aaacccagtt taagttcaag aagacatttg caagtgcaag 5760
aggccaagca gtttgaagaa gtgtaagaga ttttttttcc ttcgaaagaa tatattttta 5820
aagaaaccag ccagtccgcg gaaagcaaca gcagtttttt tttttttttg cctctttttc 5880
ttattttaga tcgagaggtt tttcttgctt ttcttccctt ttttttcttt ttgcaaacaa 5940
aacaaaaaac agcatagaag aaagagcaaa ataaagaaga agaagaggag gaagagaggg 6000
aaagagagga agggaaaaaa aacaccaacc cgggcagagg aggaggtgcg gcggcggcgg 6060
cggcggcggc agcggcggca gcggcgcggc ggcggctcgg accccctccc ccggctcccc 6120
ccatcagtgc agctctccgg cgatgccaga atagatgccg gggcaatgtc ccgccgcaaa 6180
cagggcaacc cgcagcactt gtcccagagg gagctcatca cccgtaagtg tctgcggagt 6240
gcgcgcgagg ggccggagat ggggctccgg gcgtctgggg ctggggacac cgagcccgga 6300
acagccgagc ctggccaggc gccggggccg cccgctggct ggcagagtct acggcgtcgg 6360
cctggagcat ggcggggggc gggggccata graaagtttc tttgcagccc ggggagttgg 6420
ggcgccgagc agccggacgc gcctcgggct cgggggcctg cggacgcggc tccgggccgg 6480
ggagggggca tgcaggctgg aggagtgtgt gtgtgtgcgc gccgagcccg gctggacgct 6540
cgcccctccg agcggcgtgt gtggcggcgg cggcgctggt ggcggggttt ggagaggagg 6600
gggagggggc tgggggagcs ggagggggag ggggagccgg gaagtgggga aaagttggcg 6660
agcgcgtggg tccgcgctga cggcgcgggc ggaggagagc ggggtgcgtt ccggctgggg 6720
gagccgtagg ccagggcggc gcaccgcggc cgcggctccg ggtccccggt ccctgcgccc 6780
ggcccagcag ggtgccggcc gcgccagtcc taggattccg cagccgcctt tctctcccct 6840
cctcctgcta tttgcaaaat aatccagctg cgcggctgtt tgccgggctc aagcccccct 6900
ccccaccccc cacttcccca cctccgtctg tctcctggga tgatcttgtc ttctttcccc 6960
cacttcaaaa aaggtggggg gattggggtt ggtgaaaaat ccccgccacg aggaaaaaaa 7020
aaaaggttgt cagttaggag tgggaagaga gtgatgcgct tgtaaaatag taaaagaaaa 7080
aaaagaaaaa aaggagaccc atcaatctcg tatccatctt tctatctcag tatctttcat 7140
ctttcctatc taaataaaca aggcaggtcg cagtggaaat ccaccggctg aaatcgtgtc 7200
gatttcaagc atgtggctgg gcgggcaaag tcaggcagcg gggcaagaca agcagcagct 7260
tccaccgtcc ctgttgggtt tatttagcag aggggaaaag cgagcgcgag cgggccaggt 7320
acggtgtttg caggggaacc cgccccgagt ccccgcacac ttgcaccggg aaggtggctt 7380
tgcggcgctc cccgcccgcc gcagccgcgg ggcggcttcc ttctgcgcgc gaacatttcc 7440
ccgccgttct ttctctcgcg gtgcctgggt cgccgttcct tttttttttt tttttttttt 7500
tttttttttt ttttaactgc aatagaaata aaacatcctc tgggtgccat cgagaccgcg 7560
ggcaggttat atgcttgcaa tccgccgcgc acctcgccgg gctgggwccg ggctgcccgc 7620
gcggagctcg agaggcgtgc gcgcccagtc accgcagagg actggctgcc gggcggccga 7680
gagccgaata tttatgttat attttaaaaa atttaaataa ataaataaat atataaagtg 7740
gttctcccct cccctgaaaa cccagcatag gagccatctg ctcggagcaa ttgctgttgc 7800
catctctcct ttgttacagc agatacatta gtaagaattt gtggatttat tatgattttt 7860
tttggggggg ggggaataga aattaaagtg ggattcgcct tgggagaggg atgcctcttt 7920
ggaggaaggg aagaggactt ctcttttatt tttcgccgtt gtaacaccaa agaagactcg 7980
ccggctgcgt ttaaaacaaa atgttttgca gctagatttg agcttggttt gatcaaggtc 8040
ttttttgcca gttgacattt cgatccttta ccaagccaca gcaatcgctt attctacacc 8100
cttccccctt tagatggggt ggttgttaaa acgtctatac ttgcagaggc ttaatttctc 8160
caggaggcaa tttgccccac gtagcctctg tataattgca agggttgttt ttgaggaggg 8220
ggaattgggg gggtcgggga agggggagtg gatgggggtg cactgccaag ctggcagcag 8280
cggcgagcca ggagtggttg cagttgtgtg taaggggaag aagcaggtag gttcgctttg 8340
ctttggctct ccttctcctg gcattcctgg gacatcaggc gagagcctgg ccagaggact 8400
ggtggcagct gggcatgggg gtgaggggtg cctggtgcag cactttccca tccttcattt 8460
gttccctgtc tcgctcagcc ctgctcagag ccacgctggg gaaagccagc tgacactgga 8520
gcagtggcag ggagggaaaa agagagaggg caaaggagaa gagaggtgga gagaaaaagg 8580
ggaaggagac cagagggcaa aggaaagccg gcctgccttt gaggggcaca cggagcccag 8640
gctatgtgta caggtttaag ctaggagagt ggtccaacca gtttcagaca agctattatk 8700
atccaaagca gctgctttcg tctgtcctgt gtccccggga ggaggtggga gagcaagcag 8760
gggaaaggca ggaatggggt gcactttagc ctctctggcc tctggaagtg cctctccaca 8820
aatgatgcag gagccgtgga ctcagggtgc tttggagccc tggctggcaa agcgggtgct 8880
gtcgcatcct ctacttggag ttcacatttt agattttaaa ttccaaagat accccttaaa 8940
acatggtaca tctttatcag ttgggtggca gctcctgggc ctgtggggca gcaacctcag 9000
gtccttcagg gatgatgcaa ctgcaaataa ctgatggcct gggaaacaag agggcacaca 9060
aatagcacgc atggtctttg tgggtgggtg gcggtgggga ggggagaagg gggagggagc 9120
gtctgagaag ggctccataa tgagctagtt aaatttacag acagggccag ggacaagagg 9180
agtgaggtaa aaaagagtga gagacagctg gtgatggaaa cctgggcttc tggtttgctt 9240
caaaatgttt gacccagatg gatatggctt ttaaaagcag aggacagaca cagctattaa 9300
taaaaaaaca aacacaaaac aacacagtgg caatcgtgcc gaggggaggt taagggggat 9360
cggctgacca cgcagaggaa agggccagag cccgctgtgc cagacagggc cagggtgaag 9420
ggaagagtac ttaaatccaa gaaggagctt gatgctttct gaagagacca aggaaaataa 9480
gatgtccacg gtaaactgcg taaccccagt caaggtgatt ttctcaacaa cccaccaaca 9540
ggtttcctag gaagattagt aattttccgt atgaattc 9578
<210> 10
<211> 4000
<212> DNA
<213> Homo sapiens
<220>
<221> exon
<222> (1774)..(2142)
<400> 10
tctgtactgc cacatttctg atgcattctg catttaattc atcgagggct ctgtctgctt 60
ttctgtaacc acaggtggga tctcaaattg tagtttctct tctcagcgat acctacgtcg 120
ctacctattc acacatagtt catacgtgcg cgttgtacgt cttacatcgt cgtatattct 180
gtattcagtt tcacacatgg actctcctag gccctgcata ggctcgtgtt cagaaaatag 240
agaacagtga tttatgtgta ggatgggaga tgccacagaa ttttttcctt aaattatctg 300
ttctttggct ctggcacttc aataacttca ctgccacgga atgtattttc ctccctccca 360
ttccttctcg ccgttcctct gtggttttca ttatccttcc ctaaatacca tacaacttaa 420
aatttacctg cctcctcggg tttcagacct ttggctgccc tctggcttcc ctgaagaccc 480
cgccactcgt gtcttctcta cgactactga catttgctct cgaaaaattc cagcccgaat 540
ttgctcagac cccgagggga atatgaaacc tccacactgt ccacttctct ttatttatga 600
cacttttggc tgccgagtct tccaattttc ccttgaggag gttgctgctt tttgaggcat 660
ttattagctt ccaaatattt gggtcctagg ctccctactc tctcccccac aaaaaaaacc 720
caagagaaat ctatcggctg ctaaagaaat ataaaaacat acagtccatt gaaagtgtgg 780
tttgatatct tccaagaaat gcttttggag tctggagaat tttctttctt tcatttttct 840
gggagtgaaa ataaaatcaa caaacagaaa aggacagtgg ggagttgatg agtgtggggg 900
aaatctacag agaaatggaa gtctgaccgg gcctcgggtg cttggcagga gagcctgctt 960
cccgactctg caagccggtt ccagcctccc ttctgctgca gtgctttctc ctaagatatt 1020
tttttggaac ctgacactca cttgttgctt tctgagcatg tgggcttcct tctctcctaa 1080
ggacgggccc ttagacgccc atctgggttt ctgttttcta gtttggtgtg tggccaggtc 1140
ccaggtagag gaatgtgagt tggattcgca tgaatgggga gggcatgaat gaaggtgtaa 1200
gggatgggag gggtggggct ccagcccagc agggggaaag ggctccagct cactggttct 1260
cggccctggc tgcccattgg aatcacctgg ggagtctgaa agactattcc gatgtttgtt 1320
cccagtgtaa ctggtcaggg gtgctgcctg cgccttggga tttttcaaac cctccaggtg 1380
attctcagat actggaaact ttgagagaca catcacgacc tcatgctgtc agcagccagg 1440
gtgtgtgtgt atgcacgtgt gtccgtgtgt gttcttatac tacgttgggg agaaactggc 1500
agaaaataaa ctagaatgca gttagatcgg cactacttac gtggcaatgc ccagggggca 1560
cgacgttgct cctagagcct cagtgtgccc atctgtcctg tgggggatgc tcaccagccc 1620
ccaaccccgg ggaggacctg gtgagctctg gcagccagca gcagaggggg ctgcttcttg 1680
gcggggaagg ggtggaccgg aagttgggtg ctgtgaccgc ctaagcccat ctctatcttc 1740
tctgcccctt ccctttcttc tttctgtctc cagcagaggc tgaccatgtg gaggccgcca 1800
tcctcgaaga agacgagggt ctggagatag aggagccaag tggcctgggg ctgatggtgg 1860
gtggccccga ccctgacctg ctcacctgtg gccagtgtca aatgaacttc cccttggggg 1920
acatcctggt ttttatagag cacaaaagga agcagtgtgg cggcagcttg ggtgcctgct 1980
atgacaaggc cctggacaag gacagcccgc caccctcctc acgctccgag ctcaggaaag 2040
tgtccgagcc ggtggagatc gggatccaag tcacccccga cgaagatgac cacctgctct 2100
cacccacgaa aggcatctgt cccaagcagg agaacattgc aggtatggga tgctgcgctt 2160
gcctggttgc tgtggaagcc acctcctggg tcccatgccc tctgcctgag tgtgctggtg 2220
caggggaagg cccaggggct tccaggatgg cctctgggcc accagccggg gctccccctt 2280
tctgagggtc caccatccag gtgaccttca ggaggagaca ggcctggggc tcggggaggc 2340
ccaaatggct gatggctgct tgcttttggt gaggggactc tgtctcgggg gctaatccag 2400
aggtggtcag aagcacagaa tgaaaatttg gaagtctggt tggccctctc tttgctactg 2460
atcttggctt agtccctgat tttgaagcca gacagttttg ggttagagtt tgtcttcaca 2520
acttggacat gttagtttgc ccatctgtga aatggagcta aggaaaccca cctcattagg 2580
gttgctgtga ggacgaatga gctgttgcat gcggcatgac ctggtaggca cttaggaatg 2640
ggagtgctca ttctctcccc tctcctttct ctctggactc agtttcccat gtgtgaaatg 2700
aggagttagg ccccctgatc tcagaggttg cttctgacat tgcccgaccc caggggccgg 2760
tcccaggcag gggtgtggga acttgttgga gcactgtgcc cgttggggga ggttggatat 2820
gccctttgac atgctcactc atttgaccac tgggacagct ggttttacca ccttgagaac 2880
aggtctaggg cccctctgtc cccaggcgtg ggtctgctca ccacagtgag ttagcatgaa 2940
gtccctccct cttggccagc accatggcat gctggagcct cttccaggga gccgctgctc 3000
tctgtgcaaa ccagagtgtt tgtttctggt ttatacttct gagcccagga ggcctggggg 3060
agaaaggagg gcctggccag cctgggttcc ctaaaaagca gcagcctgtg ctggagcaag 3120
atgggcatca gagtttatgc agacgagtgt tcaaatcctg atggttgact ttggattagc 3180
cacttcatgg gtccgagcct cagtttcccc atctgtcaac agaaagtgat aatagcagca 3240
ggcctggtgt gaggattaga tgagcagggg ctcttaatca gtcttttgcc cgtggcactt 3300
ctctctcaga ggtttcgtct ggctctgcgg tgtgcaagta ggtggctggc tggggaaacg 3360
agtgcattga tcgttaccat gcttccatca tggaaggtag catgggctct ggagggactc 3420
aggctttcga tgcttctagg agggtgagat ggatgggcat gggcactgat caagacccat 3480
cacccaggac gcagtcaggg taatgctgca agcctgtctc ccccacgtct ccaaagcttt 3540
gtgatgctga gcctcacttt gctcacctgc acaaggggct tagtgagccc tctcttttgt 3600
ggggagactg tggtggtatg cagagtcctg cagcctcatg ccaggcactg gggagacatc 3660
agtgaaccag attggcctct gggccttgcc ttctgatggg tgccctagca tgaagtgtct 3720
catacacttt ccaagatgca aggggctttg agacatgtcc aggccaccgg catgtaaaca 3780
ctggcttctc agagtgctat gtgcacctga gcagcgtctc ttcaccgggc tgagccatca 3840
ggcgagagag gtgctgggtc ccttttgtct ttgttggtcc acattccagg gacagtttta 3900
cctgtagtat cgacgcctgg cctcagtgca catcgatctt tcaggggtgg ccttgctagg 3960
gagactcggg ccgcctattt atgtttccat ggaaagattt 4000
<210> 11
<211> 1776
<212> DNA
<213> Homo sapiens
<220>
<221> exon
<222> (587)..(799)
<400> 11
gaatgggaag gcaggcggga agagagcccc aagctggtgg tctgcaagac aggaggctaa 60
cagagccaag acacctggag cggacccaag gctggaggcg gacccaaggt gtcccgggcc 120
tgtaggaaca gcccatcctg atacagcaaa caggggaggc tgtgagcttc ccagctcttc 180
cagggagggg tagcccgaag ttttggaaac aaatccccaa atggaaccta tttgattgct 240
ccagaggcac ccacgtgggg ggtccttcct gagagtgggt cctcacagcc cccgttcacc 300
cagccccctg caccaggccc ccagaggcgg ggtcctgcct ccccgacagc ccagcctggc 360
agctgtggaa accgggccct ccccagtgcc ccctgcccac ctccccgagc ccattccctc 420
gcctgtgtcc cgattgcctt ccctgcaggg cctggcacmc cgggggcmtm ccacccccga 480
agkgtggcct gagcagagcc ccacgccccg agccccgtcc caccccgtgc ccctcacaca 540
gtccagggcc cgactgacca gtcttttcta ttgttttttt ctccagggcc gtgcaggcct 600
gcccagctgc cagcggtggc ccccatagct gcctcctccc accctcactc atccgtgatc 660
acttcacctc tgcgtgccct gggcgctctc ccgccctgcc tccccctgcc gtgctgcagc 720
gcgcgcccgg tctcgggtga cgggactcag ggtgagggtc agacggaggc tccctttgga 780
tgccagtgtc agttgtcagg taacagacga cgccgcggtg gggggcgggc cccgggatgg 840
cggggtgtgc catgggcagc gctggagcaa ggtggggacc cagggaggaa gggcagctcc 900
cacccagaag gctttttggg gtgccagggg aagtggtaaa gaatgttcgc tgaactatga 960
gccagggccc ggtgcccctc ggtcaggagt cccccacggt gcccccaccc gttctgagag 1020
tcttgctccc agaatgcatt ccccagcctc ccaatcccgc ttctttgggt tgtttagcga 1080
cagcttaatt ggataacact taacatctga ggttttcttc ggcccttgcc actgccaccc 1140
cctcccccac cccagacaat cccctgcccc gccaagacca ggctagggga agattccttg 1200
gttgactgtg tacattgctg gagccgtcca aaatgctgag tttctctttg ggagaatgtg 1260
ttgcccatta gctttgaaaa agaaaaatag tggctcaaaa ggagcctctt aaaaatgctg 1320
tggccacgag agggagtgaa acactgtgag gtgtgtgagg ggtgggggcg ggggctgagt 1380
acctgctgtg cgtccggctc tgggccagac ccagacacag ctgtttgtgc cgactcatcc 1440
tgctctccgg gcgggcggtg tggctgccat tctacagatg gcagatgggc cggtgtggtg 1500
acacaaactg gcctctacct gcctgcttct cccaagtgaa cccaagatct tattctgcct 1560
aggtctctgg gatacttggg tccttggatt cagggcaagg gcctctcaca agtctgtccc 1620
ccgcatctcg cagggctggc gtgaagcact gtggcacgaa acaggatgct gcacagcaca 1680
tgtgtgagca gcgtggctgg ttctgtggac gggacggaag gagagggggt gacggctggg 1740
acgttgttgg tcctctttgt acaggatgtg caggtt 1776
<210> 12
<211> 14401
<212> DNA
<213> Homo sapiens
<220>
<221> exon
<222> (7071)..(13969)
<400> 12
cctgrctccc tattcttggs aatggtactc tgtagagtta gtgggtctaa mgagtgatgt 60
ggtggtctgc acatgtgggt ctgaacccca agttgagtcm acacccttga attcttctct 120
ctcycagcac yctgaactcc tcytagcgtc actcactawt ytgyattawa taatgkagtg 180
gttactgkgg gttcyctgtn tcycccctgk agtgtgagct gcanncttag ctaccagcat 240
agtacctagc agatgwagkg gcccagatcc tgtttgttca gtgaattaat gaaagtcaga 300
tgtagacawa gttctcagca gaacacacag tgctaccacg ctcattcagc ccaatctatt 360
ttgatcccca catttactgk atttacatct actgagatcc aggaatggca aagaggtgca 420
ggcatgcttt atttggcaat gactgcctgg agcctggggt taaagaggag tccaaggcct 480
ggagggagag tgcggggatg aactggcaat gtctaccgca ggccttggtg tgggggcagt 540
ggctttctta gccagaggct ggctcagcac attaccacca gaggagacca tgtcttattg 600
gtcatagtac cactgctatt accatcagca cttacacccc tcagtgggcc acttgctttg 660
aaaggttttt ctcttctaaa tggcatctat tatttttgcc atkagataat cagcatgatt 720
tcatggagtt actgcaattc tagccaaaag caacacatct tgacattttt gttagtacgt 780
gggctgaaat gaaaggtaaa atactgaggc ccaggtagct agccccatcc ctgcccagag 840
tgtgtctgct gctcttctga cccagcgttt atcagaacag cataacaaga gcacrrgctt 900
tancgtgggc agctgtgcag ccccaggcgg atcccctatc tcttcccgtc ctcagtttct 960
tcatctgtaa aatggtcatc atgacggtgg gtactgcagg ggttgttgga gcagcatgtg 1020
aggtccttgg tgtgcttagc tcatgcctgg cagktggtaa ggatttcata aagctttctt 1080
gttaccactg tgagtgttat ttccccagtt ycgsctttgt cttggagaga gctgaggttt 1140
cacggaatac atttggaaca ggcagggatg gttatcaatt ctssagatgg ctgtgccaga 1200
wtgatataga cacgaamytw aawtagatcc ctgcggtgcc caatggacat ctcctttctg 1260
acgtcatgaa rgagkakwkt wwtkawakga wtwaggaatc tacacatctg agggataaca 1320
ctgataatta cgatcatttt ggaactgtgg agacggcatc tttagcagac ggattctgga 1380
ggcggactga gtggttggcc ggtgaaacag ccatctcctt gggtactggg tacctgaagt 1440
ccagagtggg gaagggagct gccacagggg gccctgggat ctggtttccc atccctggat 1500
ttggccactt cggtgtctac ctcacgaggt ccccagtgac gtgtcatacc ccgcagctcg 1560
cttgctcgct ctgtgaaacg tctccccttc tcctctccag ggtcaaggcc tgtggtggac 1620
ctgaccgggt tccaaccaaa catcatcagw gycytycact gggaggacac tcacagtgtg 1680
gtgggagaac ctcyttcgtg gccatttgca ttgtgaaaca ggccctracg ataaatgcct 1740
caggtggtgc tgtgtgccga ggcggggctg gagccctgct caggggttgg raasctgagg 1800
aggarcgtgg cctgcccctt tctggccgtg ccgctttgct tctctgagcg tcagtttgct 1860
cacgtgccag ctgggatgca gttttcccct ggcccccctt gaggccacag tgagcaaaga 1920
tggtgtgagt gaatgcatgg gaaatgccac gcctagtgta aaatgttttg caacctgtag 1980
aggggcctgt aaagccagaa tccagttctt actttagccc cccaacctca ggatatcacc 2040
ccgggccctg cttgagtcga gagggtgtct ccttgctgct ycttctcgaa cagcagtggg 2100
ccactaaatc tcacccaggc aggaatgccc ttccctttgg tatcacttgg ccttaggagg 2160
acccctatca attatggcct tttcattgga taataatttc aattaaaggt gtgtttttta 2220
ttgaacatct ctgatacctt tattggtatt attagagtag ccagcttaat aaggaggaac 2280
aattatttaa atgctcataa aaaagcctaa tggcagaggg agagtcacat ttcattgcag 2340
gagtccagct gcacgtcgtt cccaagcatc ataataaaaa acgatgtttc ctcaatgttt 2400
gcaagtttct gcttccctag aacctctaat gcatgaggca ggctgcatta aatgtcctcc 2460
agggtttcat tattgctgga gttatactga aagtcatcac tgaaacatcc atgaccaggt 2520
acaaggatgg ataataaaaa aacaaaacgt gcaaacccca tcgtaacgcc tgcatagcca 2580
tgtgcgattt ataggctgtt atagctgtcc acatacagra gctcattkgg tctccccags 2640
cctctctgra gccaggtata ttatycccat tctactgatg agaagtcaag cctcagagag 2700
kttaaatgaa ttgactgaat ycctcytcct gggaacacca aggcagagrg gtatggacgc 2760
actgctgttg tcmrggktct catgacccag ggtattgcat ttgagaaaga tgtcctgggg 2820
ctctgtctag agccagtgga gcaaagaaga tccagtgtgg gtttctgtca gtggatacaa 2880
aaaatgtctg agaaaggaag aaggatggaa agaagcaagg gaagacgagg ccctgggtct 2940
gagttgccaa gcgtgactta gtgagcaaag tgtagctgac gtttctaggt ctgtaggcca 3000
ggtttgatgt tgctgggtaa atcgcttcct aaatagtcta ggccttgacc tatcagtggg 3060
aatctcagca gcctgtctgg gccgctagca taaagttgtc acccctctcc acagtgcagc 3120
ctccagctca cctgtgggca ggtggccctc agttcctgga ggggggtgac agccagraaa 3180
catctggtcc sgggaaggrg agtgggccag cccccagtca gaagcagcct gctcaccagg 3240
ggtcttttgc tgcacttaaa aatgagccgt ctgagactgc gtgcccatgt gtttaaaata 3300
tttagcgagt tttcaaatag aaaaatgttc tgagtggctc ttcaaagact ttctgacatt 3360
gttccatttc tgaaagtgag caagcctcat gctcagggct acttccgggc aagagataac 3420
catggagtga taataaggaa atgaatgttt tattaaaaaa agaagggagt ggggactgga 3480
aagaaagttg tctagggcgg gcctctgagg gctgggtgat ttttaggata tcggaaggct 3540
tcagatcctg cactggaggc catcgcctga agtgaaatct tgccattgtg cagagggaag 3600
tattggaacc aaagcggttc ccggacacgg gtccagtaag agctttccag gcaggacggg 3660
tggccctgaa atccagchtg atgaataaac atcgctcttc tcacctgatg gtgaattatg 3720
gacaggtaat gccctcccta tgttgctcca agttagtttt agaagctttt tttttttttt 3780
tttttttttt ttttaagatg gattctmatt ctgtcgccca ggctggagtg cagtggttcg 3840
atctcagctc actgccactt ccgtctcccg ggttcaagcg attctcctgc ctcagcctcc 3900
tgagtagctg ggattatagg catatgccac cacacccggc taatttttgt atttttagca 3960
gagatggggt ttcatcatgt tggccaggct ggtcttgaac tcctgacctc aagtgatccg 4020
cccgcttcgg cctcccaaag wgctgggatt acaggcgtga gccaccgtgc ccagccagaa 4080
gcatttaaaa caaacaaaca agaagtggaa acacttgagc tctttagcac ttgtagctac 4140
ctgacttcca gtaactwccc ttttvagttg aaaaacctgt sacttrgcca tttcagctgt 4200
agagccgcct tcactgctgg cctgcgtaas gctctgcatt ttcctctgat agccatgttc 4260
tttcctcacc agccacagaa ctttctagaa aatctgtggc cacccagatc aagaaacagg 4320
aagtgctttg gagcacttch cagggaaaca gagatgatga aaaagagatt ggsggaaggg 4380
aggtggcctg acttgaaaac atgagaaact aaagcgacgg aaagctgtga attgattaat 4440
tagagtggct gaagggtggt gcagggtaca ggaacgatct ttaatttgaa gatctataac 4500
cctgcaggaa ggggcacttc atttgtgtta ttagctcctg tgtcagaaaa ggatgtttat 4560
ctagcttctt tttttattac ttatttattc tgccttgttc ccaaaaaggg tgtgaggagt 4620
cgtctaaata tggcttctgg ccagctctcc tatgaggctg tctgagctaa ggcgtgctgt 4680
tccccaagta caatcactaa taagtgtagg acagaaccag ggaagctggg cacttcctct 4740
gttcgctgag agtgcacaga gcaggagggc tgtggtgttg gggtggcctt acagggagaa 4800
tcgcggccac ccagggcctt gggaaggcgt ccctgcccta tcttaggtgg ggaggtttcc 4860
cctcaggggc tctttcatgg gagaactgag ttacctggat gactaagaga gggaaatgac 4920
ccagacaccc tggagaaaga agatagcctc agaggtgctc cttgagctgt ttttaagagg 4980
gatgaggccg aacttcagam ttyctttttc atttctgtyc tccctaccac cgtcttctca 5040
tcaccaaaca cacagaatag gagaggagag ggaaagaatc cctatgtaat gccaaacttg 5100
taacagcctg gctcggtttc tagtgttggt gtcctgggcc aactggttct gaggtcgcgg 5160
ggggagtctc caccctgccc ctcggacagc acgaagcctt ctgtgacgct gcaggcatgc 5220
gatgtcttgg ggaggtcccg gcccctcaga aactggcaag tccagtttca ggcagaggca 5280
caggccacac tcaagacctt ggatggaatt cagggtattt ggtccccgag tcacttgatt 5340
tttaaaagat ggtttccaaa tgaaagttta tgtgcctata aacactgcta agagtgcagc 5400
cttccagaaa cataattagt gggtggaaaa caaaaatgct gtctgcctag gatttcagaa 5460
ggcctgtaat cgattggtgg agagagtgag acaggggact gttttctcca cttcccatgg 5520
caacttaccg atattgggaa gggtcattca tttgcacgtt tgacttcacc agagcttgtg 5580
gcccctgtac tttagcatct gtgttaaaat cttccaggta gatgaaagtt tgagaaaaca 5640
aaagggatct ttcaagatct cgcatgccat gtcttctgct ggatctgagc tgggattctt 5700
gttcctcttg catccccagc tagtgagtgc aatgctgcaa gacgggtcct gtctgcaccg 5760
tctcttttat gcagagcatt aggagaggta catactggaa aagcggcgag cttcaccccc 5820
aggtgcagga gggcacttgc aggatgggtt ccggagaaat gttcagcctc cattttgtga 5880
ttgtctcagt gatggacaca gacgatgacg ttttggctcc ataccacgag tgttcgctac 5940
aatttgctgc ccgtgtcacc agagccagtt gctaacacat cagcatttgc cactgttcat 6000
cctgactgcc ctgtcagatg tgaggatgtt ctttcattgc ttagtattct ggcagaggac 6060
tttgaaagac tcatgtaggc cagtgtgccc ccgccttccc tggggtctgg aggtggaatt 6120
ccaagcggtg tttgggcgtg tgtgtgagga cacggggtgg gggcagctgt cacagtagta 6180
gccggtcttc acagcatgtt aaattttttc tgttcctagg aatccatatt caggtgtaca 6240
gtgctttctg cacagacggt ggtgtaggaa acacgagaat ttcctatagc taaaaatccc 6300
aaatgttgca gaggtattgc agctatttct cttaaaaaaa aaaaagtttg caggatagta 6360
cagtttgatt tgtgtttctg tacaactccc tggaatcaaa tattatcaga attggttgtt 6420
ctcaaagggg tcggtgatct tgcccccctc cctgggaaga ttcggcaagg cctggagaca 6480
tttttggtcc tcgcaaccgg gggaggtgga tgctcctggc atctatctag tgggtgcagg 6540
cagaggatgt tgctaaacat cctgcaatgc gcaggacagc ccccaccgcc caaagaatta 6600
ggatgtaaat gtcagtagtg ccttgactga aaagccctgg cctagatggt ttcgggtgtg 6660
gagcatcctc gagggctggr atttgccagg gctgttacac agtccagcct tgacagaatt 6720
cctactactg gaccgtattc tcacaaacac gatctcccgt ggcctcggag gtaatggaga 6780
tcagaatccc ttttctttgg gggagcaagg cgggtcttac acaattgaag taagtnnctg 6840
gcgcccgggt ggccagggcg gcccgcccac agacctgcgt cttcggcccc ccagccagga 6900
ggagacaagg ccgggcctgc ttgcaagcgg ccctgcagcc cctgtcaggc agggcactgg 6960
gatcccggat cagcccgggc cgcgtccchc aggccagtgg ccctgcggtg cccgcgcccc 7020
gctgccgctt ctcacgctgt ctctgccttt ctgtccgtgt gtttccccag gtaaagatga 7080
gccttccagc tacatttgca caacatgcaa gcagcccttc aacagcgcgt ggttcctgct 7140
gcagcacgcg cagaacacgc acggcttccg catctacctg gagcccgggc cggccagcag 7200
ctcgctcacg ccgcggctca ccatcccgcc gccgctcggg cccgaggccg tggcgcagtc 7260
cccgctcatg aatttcctgg gcgacagcaa ccccttcaac ctgctgcgca tgacgggccc 7320
catcctgcgg gaccacccgg gcttcggcga gggccgcctg ccgggcacgc cgcctctctt 7380
cagtcccccg ccgcgccacc acctggaccc gcaccgcctc agtgccgagg agatggggct 7440
cgtcgcccag caccccagtg ccttcgaccg agtcatgcgc ctgaacccca tggccatcga 7500
ctcgcccgcc atggacttct cgcggcggct ccgcgagctg gcgggcaaca gctccacgcc 7560
gccgcccgtg tccccgggcc gcggcaaccc tatgcaccgg ctcctgaacc ccttccagcc 7620
cagccccaag tccccgttcc tgagcacgcc gccgctgccg cccatgcccc ctggcggcac 7680
gccgcccccg cagccgccag ccaagagcaa gtcgtgcgag ttctgcggca agaccttcaa 7740
gttccagagc aatctcatcg tgcaccggcg cagtcacacg ggcgagaagc cctacaagtg 7800
ccagctgtgc gaccacgcgt gctcgcaggc cagcaagctc aagcgccaca tgaagacgca 7860
catgcacaag gccggctcgc tggccggccg ctccgacgac gggctctcgg ccgccagctc 7920
ccccgagccc ggcaccagcg agctggcggg cgagggcctc aaggcggccg acggtgactt 7980
ccgccaccac gagagcgacc cgtcgctggg ccacgagccg gaggaggagg acgaggagga 8040
ggaggaggag gaggaggagc tgctactgga gaacgagagc cggcccgagt cgagcttcag 8100
catggactcg gagctgagcc gcaaccgcga gaacggcggt ggtggggtgc ccggggtccc 8160
gggcgcgggg ggcggcgcgg ccaaggcgct ggctgacgag aaggcgctgg tgctgggcaa 8220
ggtcatggag aacgtgggcc taggcgcact gccgcagtac ggcgagctcc tggccgacaa 8280
gcagaagcgc ggcgccttcc tgaagcgtgc ggcgggcggc ggggacgcgg gcgacgacga 8340
cgacgcgggc ggctgcgggg acgcgggcgc gggcggcgcg gtcaacgggc gcgggggcgg 8400
cttcgcgcca ggcaccgagc ccttccccgg gctcttcccg cgcaagcccg cgccgctgcc 8460
cagccccggg ctcaacagcg ccgccaagcg catcaaggtg gagaaggacc tggagctgcc 8520
gcccgccgcg ctcatcccgt ccgagaacgt gtactcgcag tggctggtgg gctacgcggc 8580
gtcgcggcac ttcatgaagg accccttcct gggcttcacg gacgcacgac agtcgccctt 8640
cgccacgtcg tccgagcact cgtccgagaa cggcagcctg cgcttctcca cgccgcccgg 8700
ggacctgctg gacggcggcc tctcgggccg cagcggcacg gccagcggag gcagcacccc 8760
gcacctgggc ggcccgggcc ccgggcggcc cagctccaag gagggccgcc gcagcgacac 8820
gtgcgagtac tgcggcaagg tgttcaagaa ctgcagcaac ttgacggtgc accggcggag 8880
ccacaccggc gagcggcctt acaagtgcga gctgtgcaac tacgcgtgcg cgcagagcag 8940
caagctcacg cgccacatga agacgcacgg gcagatcggc aaggaggtgt accgctgcga 9000
catctgccag atgcccttca gcgtctacag caccctggag aaacacatga aaaagtggca 9060
cggcgagcac ttgctgacta acgacgtcaa aatcgagcag gccgagagga gctaagcgcg 9120
cgggccccgg cgccccgcac ctgtacagtg gaaccgttgc caaccgagag aatgctgacc 9180
tgacttgcct ccgtgtcacc gccaccccgc accccgcgtg tccccggggc ccaggggagg 9240
cggcactcca acctaacctg tgtctgcgaa gtcctatgga aacccgaggg ttgattaagg 9300
cagtacaaat tgtggagcct tttaactgtg caataatttc tgtatttatt gggttttgta 9360
atttttttgg catgtgcagg tactttttat tattattttt tctgtttgaa ttcctttaag 9420
agattttgtt gggtatccat cccttctttg tttttttttt aacccggtag tagcctgagc 9480
aatgactcgc aagcaatgtt agaggggaag catatctttt aaattataat ttggggggag 9540
gggtggtgct gcttttttga aatttaagct aagcatgtgt aatttcttgt gaagaagcca 9600
acactcaaat gacttttaaa gttgtttact ttttcattcc ttcctttttt ttgtcctgaa 9660
ataaaaagtg gcatgcagtt ttttttttaa ttatttttta attttttttt ttggtttttg 9720
tttttggggt ggggggtgtg gatgtacagc ggataacaat ctttcaagtc gtagcacttt 9780
gtttcagaac tggaatggag atgtagcact catgtcgtcc cgagtcaagc ggccttttct 9840
gtgttgattt cggctttcat attacataag ggaaaccttg agtggtggtg ctgggggagg 9900
caccccacag actcagcgcc gccagagata gggtttttgg agggctcctc tgggaaatgg 9960
cccgacagca ttctgaggtt gtgcatgacc agcagatact atcctgttgg tgtgccctgg 10020
ggtgccatgg ctgctattcg ctgtagatta ggctacataa aatgggctga gggtaccttt 10080
ttggggagat ggggtggcct gcagtgacac agaaaggaag aaactagcgg tgttctttta 10140
ggcgttttct ggcttgacgg cttctctctt tttttaaatc acccccacca cataaatctc 10200
aaatcctatg ttgctacaag gggtcatcca tcatttccca agcagacgaa tgccctaatt 10260
aattgaagtt agtgttctct catttaatgc acactgatga tattgtaggg atgggtgggg 10320
tggggatctt gcaaatttct attctctttt actgaaaaag caggggatga gttccatcag 10380
aaggtgccca gcgctacttc ccaggttttt attttttttt tcctatctca ttaggttgga 10440
aggtactaaa tattgaactg ttaagattag acatttgaat tctgttgacc cgcactttaa 10500
agcttttgtt tgcatttaaa ttaaatggct tctaaacaag aaattgcagc atattcttct 10560
ctttggccca gaggtgggtt aaactgtaag ggacagctga gattgagtgt cagtattgct 10620
aagcgtggca ttcacaatac tggcactata aagaacaaaa taaaataata atttatagga 10680
cagtttttct actgccattc aatttgatgt gagtgccttg aaaactgatc ttcctatttg 10740
agtctcttga gacaaatgca aaactttttt tttgaaatga aaagactttt taaaaaagta 10800
aaacaagaaa agtacattct ttagaaacta acaaagccac atttacttta agtaaaaaaa 10860
aaaaaaattc tggttgaaga tagaggatat gaaatgccat aagacccaat caaatgaaga 10920
aataaaccca gcacaacctt ggacatccat tagctgaatt atcctcagcc ccttttgttt 10980
ttgggacaac gctgcttaga tatggagtgg aggtgattta ctgctgaatt aaaactcaag 11040
tgacacaagt tacaagttga tatcgttgaa tgaaaagcaa aacaaaaaca attcaggaac 11100
aacggctaat tttttctaaa gttaaattta gtgcactctg tcttaaaaat acgtttacag 11160
tattgggtac atacaagggt aaaaaaaaaa ttgtgtgtat gtgtgttgga gcgatctttt 11220
tttttcaaag tttgcttaat aggttataca aaaatgccac agtggccgcg tgtatattgt 11280
tttcttttgg tgacggggtt ttagtatata ttatatatat taaaatttct tgattactgt 11340
aaaagtggac cagtatttgt aataatcgag aatgcctggg cattttacaa aacaagaaaa 11400
aaaataccct tttcttttcc ttgaaaatgt tgcagtaaaa tttaaatggt gggtctataa 11460
atttgttctt gttacagtaa ctgtaaagtc ggagttttag taaatttttt tctgccttgg 11520
gtgttgaatt tttatttcaa aaaaaatgta tagaaacttg tatttgggga ttcaaagggg 11580
attgctacac catgtagaaa aagtatgtag aaaaaaagtg cttaatattg ttattgcttt 11640
gcagaaaaaa aaaaatcaca tttctgacct gtacttattt ttctcttccc gcctccctct 11700
ggaatggata tattggttgg ttcatatgat gtaggcactt gctgtatttt tactggagct 11760
cgtaattttt taactgtaag cttgtccttt taaagggatt taatgtacct ttttgttagt 11820
gaatttggaa ataaaaagaa aaaaaaaaca aaaacaaaca ggctgccata atatattttt 11880
ttaatttggc aggataaaat attgcaaaaa aaacacattt gtatgttaag tcctattgta 11940
caggagaaaa agggttgttt gacaaccttt gagaaaaaga aacaaaagga agtagttaaa 12000
tgctttggtt cacaaatcat ttagttgtat atattttttg tcggaattgg cctacacaga 12060
gaaccgttcg tgttgggctt ctctctgaac gccccgaacc ttgcatcaag gctccttggt 12120
gtggccacag cagaccagat gggaaattat ttgtgttgag tggaaaaaaa tcagtttttg 12180
taaagatgtc agtaacattc cacatcgtcc tccctttctc taagaggcca tctctaagat 12240
gtcagatgta gaggagagag agcgagagaa catcttcctt ctctaccatc actcctgtgg 12300
cggtcaccac caccacctct cccgccctta ccagcagaaa gcaatgcaaa ctgagctgct 12360
ttagtccttg agaaattgtg aaacaaacac aaatatcata aaaggagctg gtgattcagc 12420
tgggtccagg tgaagtgacc tgctgttgag accggtacaa attggatttc aggaaggaga 12480
ctccatcaca gccaggacct ttcgtgccat ggagagtgtt ggcctcttgt ctttcttccc 12540
tgctttgctg ctttgctctc tgaaacctac attccgtcag tttccgaatg cgagggcctg 12600
ggatgaattt ggtgcctttc catatctcgt tctctctcct tcccctgcgt ttcctctcca 12660
tccttcatcc tccattggtc cttttttttt ctttcatttt ttatttaatt tcttttcttc 12720
ctgtctgttc ctcccctaat cctctatttt atttttattt tttgtaaagc caagtagctt 12780
taagataaag tggtggtctt ttggatgagg gaataatgca tttttaaata aaataccaat 12840
atcaggaagc cattttttat ttcaggaaat gtaagaaacc attatttcag gttatgaaag 12900
tataaccaag catccttttg ggcaattcct taccaaatgc agaagctttt ctgttcgatg 12960
cactctttcc tccttgccac ttacctttgc aaagttaaaa aaaagggggg agggaatggg 13020
agagaaagct gagatttcag tttcctactg cagtttccta cctgcagatc caggggctgc 13080
tgttgccttt ggatgcccca ctgaggtcct agagtgcctc cagggtggtc ttcctgtagt 13140
cataacagct agccagtgct caccagctta ccagattgcc aggactaagc catcccaaag 13200
cacaagcatt gtgtgtctct gtgactgcag agaagagaga attttgcttc tgttttgtgt 13260
ttaaaaaacc aacacggaag cagatgatcc cgagagagag gcctctagca tgggtgaccc 13320
agccgacctc aggccggttt ccgcactgcc acaactttgt tcaaagttgc ccccaattgg 13380
aacctgccac ttggcattag agggtctttc atggggagag aaggagactg aattactcta 13440
agcaaaatgt gaaaagtaag gaaatcagcc tttcatcccg gtcctaagta accgtcagcc 13500
gaaggtctcg tggaacacag gcaaacccgt gattttggtg ctccttgtaa ctcagccctg 13560
caaagcaaag tcccattgat ttaagttgtt tgcatttgta ctggcaaggc aaaatatttt 13620
tattaccttt tctattactt attgtatgag cttttgttgt ttacttggag gttttgtctt 13680
ttactacaag tttggaacta tttattattg cttggtattt gtgctctgtt taagaaacag 13740
gcactttttt ttattatgga taaaatgttg agatgacagg aggtcatttc aatatggctt 13800
agtaaaatat ttattgttcc tttattctct gtacaagatt ttgggcctct ttttttcctt 13860
aatgtcacaa tgttgagttc agcatgtgtc tgccatttca tttgtacgct tgttcaaaac 13920
caagtttgtt ctggtttcaa gttataaaaa taaattggac atttaacttg atctccaaac 13980
cttgtccttt tctgtgtctt ttaaaggtgg gggatggaca gcttatttcc aagggcaaat 14040
tgaaagtctt tctccatttt cttcctgacc caaatcttta agcccatcga gaggatgaca 14100
ggaaatcatg gcacgagagc cctatagttc tcttagctcc tgtgcagcag tgtgatctag 14160
aacagtggtt ctcagcccag ttgcacatgg gaatcttctg ggagctttca aaaatctcag 14220
ggcccgggag acatcccaga ccaattctgt cagaatctct ggaggcaggt cccagtatca 14280
gcatttttga aaatgatcca ggtgattctc ctatccaact gagcttgtga acaagtagtt 14340
gaaaagaaaa tacacttggc taggaatgat tagactcaag ttgagcctaa tacagctccc 14400
a 14401
<210> 13
<211> 19
<212> PRO
<213> Artificial Sequence
<220>
<223> Artificial Sequence: Synthesized oligopeptide
<400> 13
Cys Leu Lys Ala Ala Asp Gly Asp Phe Arg His His Glu Ser Asp Pro
1 5 10 15
Ser Leu Gly
【図1】ATL1遺伝子のゲノム構造と制限酵素地図を示
す。
す。
【図2】ATL1 mRNAとゲノム構造との比較を示す。
【図3】ATL1αのアミノ酸配列と特徴的モチーフを示
す。矢印は各エクソンの境界、下線および二重線は、そ
れぞれC2H2型Znフィンガードメインおよび富プロリン領
域を示す。囲み領域は富酸性アミノ酸領域である。
す。矢印は各エクソンの境界、下線および二重線は、そ
れぞれC2H2型Znフィンガードメインおよび富プロリン領
域を示す。囲み領域は富酸性アミノ酸領域である。
【図4】正常組織由来mRNAを用いたATL1遺伝子のノザン
ブロットを示す。
ブロットを示す。
【図5】正常組織におけるATL1遺伝子のRT-PCR解析の結
果を示す。
果を示す。
【図6】ヒト抹消血リンパ球におけるATL1遺伝子発現の
RT-PCR解析の結果を示す。
RT-PCR解析の結果を示す。
【図7】ATL細胞株由来mRNAを用いたATL1遺伝子のノザ
ンブロットを示す。
ンブロットを示す。
【図8】ATL1遺伝子のゲノム構造と、染色体異常によっ
て引き起こされた遺伝子再配列を示す。
て引き起こされた遺伝子再配列を示す。
【図9】ATL1タンパク質の細胞内局在を示す。抗ATL1抗
体を用いた免疫染色の結果から明かなように、ATL1タン
パク質は核内でドット状に局在している。
体を用いた免疫染色の結果から明かなように、ATL1タン
パク質は核内でドット状に局在している。
【図10】COS7細胞に強制発現させたATL1遺伝子産物の
抗ATL1抗体を用いたウエスタン法による検出結果を示
す。
抗ATL1抗体を用いたウエスタン法による検出結果を示
す。
フロントページの続き
(51)Int.Cl.7 識別記号 FI テーマコート゛(参考)
C12N 1/21 A61K 45/00
5/10 A61P 35/02
// A61K 45/00 C12N 15/00 ZNAA
A61P 35/02 5/00 A
Fターム(参考) 4B024 AA01 BA36 CA03 CA04 CA12
GA11
4B065 AA19X AA26X AA72X AA90X
AA95Y AB01 AC14 BA02
CA24 CA25 CA44
4C084 AA17 NA14 ZB27
4H045 AA10 AA11 BA10 CA40 DA75
EA20
Claims (11)
- 【請求項1】 ヒト14番染色体q32領域に存在し、配列
番号2、4、6または8のアミノ酸配列を有するタンパク質
をコードする成人T細胞白血病(ATL)関連遺伝子。 - 【請求項2】 転写されたmRNAから合成されるcDNAが、
配列番号1、3、5または7の塩基配列を有する請求項1の
ATL関連遺伝子。 - 【請求項3】 配列番号9-12のいずれか1以上の塩基配
列を含む請求項1のATL関連遺伝子。 - 【請求項4】 請求項1のATL関連遺伝子のゲノムDNA、
mRNA、cDNAまたはそれらの相補配列から精製されたポリ
ヌクレオチド。 - 【請求項5】 請求項1のATL関連遺伝子または請求項
4のポリヌクレオチドにハイブリダイズする、10塩基対
以上の塩基配列からなるオリゴヌクレオチド。 - 【請求項6】 請求項4のポリヌクレオチドを保有する
組換えベクター。 - 【請求項7】 請求項6の組換えベクターによる形質転
換体細胞。 - 【請求項8】 請求項1のATL関連遺伝子の発現産物で
あって、配列番号2、4、6または8のアミノ酸配列を有す
ることを特徴とするATL関連タンパク質。 - 【請求項9】 請求項7の形質転換体細胞によって産生
される請求項8のATL関連タンパク質。 - 【請求項10】 配列番号2、4、6または8の連続5アミ
ノ酸残基以上のアミノ配列からなるATL関連ペプチド。 - 【請求項11】 請求項8のATL関連タンパク質を認識
する抗体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001313067A JP2003116558A (ja) | 2001-10-10 | 2001-10-10 | 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001313067A JP2003116558A (ja) | 2001-10-10 | 2001-10-10 | 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003116558A true JP2003116558A (ja) | 2003-04-22 |
Family
ID=19131621
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001313067A Pending JP2003116558A (ja) | 2001-10-10 | 2001-10-10 | 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2003116558A (ja) |
-
2001
- 2001-10-10 JP JP2001313067A patent/JP2003116558A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2022201329B2 (en) | Genetically modified cells, tissues, and organs for treating disease | |
| CN114176043B (zh) | 用于治疗疾病的遗传修饰的细胞、组织和器官 | |
| KR102507624B1 (ko) | C/ebp 알파 짧은 활성화 rna 조성물 및 사용 방법 | |
| KR102301464B1 (ko) | 종양 세포에 의한 면역 억제를 감소시키기 위한 방법 및 조성물 | |
| US11103538B2 (en) | Targeting epigenetic regulators using a bacterial delivery system | |
| AU2021202758A1 (en) | Terminally modified RNA | |
| KR101840618B1 (ko) | 종양 억제 유전자에 대한 천연 안티센스 전사체의 억제에 의해 종양 억제 유전자 관련된 질환의 치료 | |
| KR20210138587A (ko) | 개선된 면역요법을 위한 조합 유전자 표적 | |
| US12473334B2 (en) | SWI/SNF family chromatin remodeling complexes and uses thereof | |
| AU2016364667A1 (en) | Materials and methods for treatment of Alpha-1 antitrypsin deficiency | |
| AU2016376191A1 (en) | Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration | |
| KR20230034198A (ko) | 종양 침윤 림프구의 활성화 및 확장 방법 | |
| KR20120082906A (ko) | 자가포식현상-향상 유전자 생성물의 조절을 통한 자가포식현상의 조절 방법 | |
| WO2001012659A2 (en) | Human dna sequences | |
| KR20220077916A (ko) | 세포를 형질세포양 수지상 세포 또는 인터페론 유형 i-생산 세포로 재프로그래밍하기 위한 조성물, 방법 및 이의 용도 | |
| US20030207286A1 (en) | Nucleic acid sequences showing enhanced expression in benign neuroblastoma compared with acritical human neuroblastoma | |
| US12478665B2 (en) | Cancer vaccine compositions and methods for using same to prevent and/or treat cancer | |
| AU2012337708B2 (en) | Marker for diagnosing forelimb-girdle muscular anomaly in mammal individual, and detection method using same | |
| JP2003116558A (ja) | 成人t細胞白血病(atl)関連遺伝子とその発現タンパク質 | |
| US20030064379A1 (en) | Novel polynucleotides and method of use thereof | |
| US20040110194A1 (en) | Genes regulated by human cytokines | |
| KR20140083735A (ko) | 폐암 진단용 융합유전자 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20031031 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040129 |