CA2245242C

CA2245242C - Proteine purifiee sr-p70

Info

Publication number: CA2245242C
Application number: CA 2245242
Authority: CA
Inventors: Daniel Caput; Pascual Ferrara; Ahmed Mourad Kaghad
Original assignee: Sanofi Synthelabo SA
Current assignee: Sanofi Aventis France
Priority date: 1996-02-02
Filing date: 1997-02-03
Publication date: 2010-07-13
Anticipated expiration: 2017-02-03
Also published as: CA2245242A1

Abstract

Cette invention a pour objet de nouvelles séquences d'acides nucléiques de la famille des gènes suppresseurs de tumeurs apparantée avec le gène de la protéine p53, et les séquences protéiques correspondantes.

Description

W O 97/28186 PCT~R97/00214 "Protein~ puri~iee SR-p70".
L'invention concerne de nouvelles sequences d'acides nucléiques de la famille des gènes suppresseurs de tumeurs apparentée avec le gene de la protéine p53, et lesséquences protéiques correspondantes.
L'invention concerne é~alement les applications prophylactiques, thérapeutiques et ,,,, 5 diagnostiques de celles-ci, notamment dans le domaine des pathologies liees aux phenomènes d'apoplose ou de ~,dnsrum'ation cellulaire.
Les gènes suppresseurs de tumeurs jouent un rôle clef dans la protection contre les phénomenes de cancerisation, et toute modi~i~,alion susceptible d'entraîner la perte de l'un de ces gènes, son inactivation ou son dysfonctionnement, peut avoir un caractère oncogène, créant ainsi des cond;l;ons favorables au developpement d'un cancer.
Les auteurs de la présente invention ont identifié les produits de transcription d'un nouveau gene ainsi que les protéines correspondantes. Ce gene SR-p70 est apparenté au gène suppresseur de tumeur p53, dont l'activite anti-tumorale est liée à
son activité de facteur de ~(a,lscnpLion et plus spécifiquement aux contrôles exercés sur l'activité des genes Bax et Bc1-2, instrumentaux dans les mecanismes de mortcellulaire.
La presente invention es~ donc relative à des protéines purifiées SR-p70, ou desfragments biologiquement actifs de celles-ci.
L'invention conce",e egalement des séquences d'acides nucléiques isolées codant pour lesdites p~ohi.les ou leurs fragments biologiquement actifs et des oligonucléotides spécifiques obtenues à partir de ces sequences.
Elle vise en outre les vecteurs de clonage eVou d'expression contenant au moins l'une des séquences nur'ectidiques définies ci-dessns, et les cellules hc3tes l,ansrec-tées par ces vecteurs de c;lonage et/ou d'expression dans des conditions permettant la l~pl;c~lioll e~t/ou l'expression de l'une des~it~s sec~uences nucléotidiques Les méthodes de production de protéines recon,~ ~an~es SR-p70 ou de leurs frag-ments b s'ay;~uement acti~s par les cellules hôtes transfectées font egalement partie de l'invention.
~'invention comprend également des anticorps ou des dérivés d'anticorps spécifiques des proteines déri,. ss ci-dessus, Elle vise en outre des ~ hocies de detecLioQ des cancers, soit par la mesure de l'accumulation des prùLéi,~es SR-p7û dans les tumeurs selon des techniques d'immuno-l~iaLochi. ";a, soit par la mise en évidence dans le sénum de patients d'auto-anLiccir~,s dirigés contre ces protéines.

W O 97/28186 PCT~FR97100214 L'invention concerne egalement tout inhibiteur ou activateur de l'activite du SR-p70 par exemple d'interaction protéine-protéine faisant intervenir le SR-p70.
Elle concerne aussi des séquences oligonucléotidiques antisens, spécifiques des sequences d'acides nucléiques ci-dessus, pouvant moduler in vivo l'expression dugène SR-p70.
L'invention comprend enfin une méthode de thérapie génique dans laquelle des vecteurs tels que par exemple des vecteurs viraux inactivés capables de transferer des sequences codantes pour une protéine selon l'invention sont injectés à des cellules déficientes pour cette protéine, à des fins de régulation des phénomènes 0 d'apoptose ou de reversion de la llansfor,llation.
La présente invention a pour objet un polypeptide purifié comprenant une séquence d'acides aminés choisie parmi:
a) la séquence SEQ ID n~ 2;
b~ la séquence SEQ ID n~ 4;
c) la séquence SEQ ID n~ 6;
d) la séquence SEQ ID n~ 8;
e) la sequence SEQ ID n~ 10;
f) la sequence SEQ ID n~ 13;
g) la séquence SEQ ID n~ 15;
h) la séquence SEQ ID n~ 17;
i) la sequence SEQ ID n~ 19;
j) toute séquence biologiquement active dérivée de SEQ ID n~ 2, SEQ ID n~ 4, SEQlDn~6,SEQlDn~8,SEQlDn~10,SEQlDn~13,SEQlDn~15,SEQlDn~ 17 ou SEQ ll:~ n~ 19.
Dans la des~ iG,~ de l'invention, on utilise les dérir,i~ions suivantes:
- pr~lei.,e SR-p70: un poly~eplide comprenant une sequence d'acides aminés choisie parmi les séquences SEQ ID n~ 2, SEQ ID n~ 4, SEQ ID n~ 6, SEC;I ID n~ 8, SEQ ID n~ 1û, SEQ ID n~13, SEQ ID n~ 15, SEQ ID n~ 17 ou SEQ iD n~ 19, ou tout fragment ou dérivé de celui-ci biologiquement actif.
dérivé: tout polypeptide variant du polypeptide de séquence SEQ ID n~2, SEQ
ID n~ 4, SEQ ID n~ 6, SEQ ID n~ 8, SEQ ID n~ 10, SEQ ID n~ 13, SEQ ID n~ 15, SEQID n~ 17 ou SEQ ID n~ 19 ou toute molécule résultant d'une l"odiriça~ion de nature génétique eUou cl~ ue de la sequence SEQ ID n~ 2, SEQ ID n~ 4, SEQ ID n~ 6, SEQ ID n~ 8, SEQ ID n~ 1 0, SEQ ID n~1 3, SEQ ID n~ 1 ~, SEQ ID n~ 1 7 ou SEQ ID n~
3~ 19 c'est-à-dire obtenue par mutation, délétion, addition, substitution eVou modification chimique d'un seul ou d'un nombre limité d'acides amines, ainsi que toute sequence W O 97/28186 PCTA~R97/00214 -isoforme c'est-à-dire une séquence identique à la sequence SEQ ID n~ ~ SEQ iD
n~ 4 SEQ ID n~ 6 SEQ ID n~ 8 SEQ ID n~ 10 SEQ ID n~ 13 SEQ ID n~ 15 SEQ ID
- n~ 17 ou SEQ ID n~ 19 à l'un de ses ~ragments ou séquences modifiées contenànt un ou plusieurs acides aminés sous la forme d'énantiomère D lesdites séquences variantes modifiées ou isoformes ayant conse,-vé au moins l'une des propriétés les rendant biologiquement actives.
- biologiquement actif: c~p~hle de se lier a l'ADN eVou d'exercer une activité de facteur de transcription eVou de pa,liciper au conl,ole du cycle cellulaire de la diffél~ncialion et de l'apoptose eVou c~pa~ IQ d'être reconnu par les antico"~s spécifiques du polypeptide de sequence SEQ ID n~2 SEC2 ID n~4 SEQ ID n~ 6 SEQ
ID n~ 8 SEQ ID n~ 10 SEQ ID n~13 SEQ ID n~ 15 SEQ ID n~ 17 ou SEQ ID n~ 19 eVou capable d'induire des anLicolps qui reconnaissent ce polypeptide.
La fabrication de dérivés peut avoir dirterenla objectifs dont en particulier celui d'augmenter l'affinité du polypeptide pour l'ADN ou son activité de facteur de transc,-iption celui d'améliorer ses taux de prosiuction d'au~",en,'er sa resiaLc"~ce à
des protéases de ,-,odi~ier ses activités biol~giriues ou de lui conférer de nouvelles propriétes pl~al"~aceutiques et/ou biolag;~ues Parmi les polypeptides de l'invention on préfere le pol~"~eplide d'origine humaine co""~,~"ant la séquence SECI ID n~ 6 SEQ ID n~ 13 SEQ ID n~15 SEQ ID n~17 ou SEQ ID n~19. Le polypeptide de 636 acides aminés co"espondant a la séquence SEQ ID n~ 6 est identique à plus de 97 % au polypeptide de séquence SEQ ID n~ 2.Le polypeptide de sequence SEQ ID n~ 2 et celui de séquence SEQ ID n~ 4 sont deux produits d'expression d'un même gene de même pour les séquences SEQ ID n~ 8 et SEQ ID n~ 10 et pour les séquences SEQ ID n~ 6 SEQ ID n~13 SEQ ID n~ 15 SEQ
IDn~17etSE.QlDn~19.
Comme il sera expliqué dans les exemples le polypeptide de séquence SEQ ID n~ 4 correspond à une t~i",inaisol1 prématuree du peptide de sequence SEQ ID n~ 2 liée à un épissage alL~"~alit du llanscr,pt codant pour le polypeptide de SEQ ID n~ 2 le plus long (ARN messager) du gène c~"esponda"i. De même chez l'humain les polypeptides cGI~espondant aux séquences SEQ ID n~ 6 SEQ ID n~ 13 SEQ ID n~15 SEQ ID n~ 17 et SEQ ID n~ 19 divergent dans leur composition au niveau des parties N- eVou -C terr,-,inales et ce consécutif à des épiss~ges alLe",alirs d'un même L,ansc~i ,t primaire. La séquence peptidique N-terminale de la séquence SEQ ID n~
10 est délétée ce lié à un epissage alternatif de son Llal1sc~i~,t codant Avantageusement I'inven~ion vise un polypeptide CGI, aspondant au domaine de fixation sur ~'ADN de l'un des poiypeptides précédents.

W O 97/28186 PCTA~R97/00214 Ce domaine correspond a la sequence comprise entre le résidu 110 et le residu 310 pour les séquences SEQ ID n~ 2 ou 6, et entre le residu 60 et le résidu 260 pour la séquence SEQ ID n~ 8.
La presente invention a également pour objet des séquences d'acides nucléiques codant pour une protéine SR-p70 ou des fragments ou dérives de celle-ci biologiquement actifs.
Plus préferentiellement, I'invention a pour obJet une sequence d'acides nucleiques isolée choisie parmi:
a) la séquence SEQ ID n~ 1;
b) la sequence SEQ ID no 3;
c) la séquence SEQ ID n~ 5;
d) la sequence SEQ ID n~7;
e) la sequence SEQ ID n~9;
f) la sequence SEQ ID n~ 11;
9) la sequence SEQ ID n~ 12;
h) la séquence SEQ ID n~ 14;
i) la séquence SEQ ID n~ 16;
j) la séquence SEQ ID n~ 18;
k) les séquences d'acides nucleiques c~r~hles de s'hybrider specifiquement a la séquence SEQ ID no 1, SEQ ID n~ 3, SEQ ID n~ 5,SEQ ID n~7, SEQ ID n~9, SEQ ID n~ 11, SEQID n~ 12, SEQ ID n~14 ou SEQ ID n~ 16 ou SEQ ID n~ 18 ou a leurs séquences co" r'o,ne"Laifes, ou de s'hybrider spécifiquement à leurs séquences pruAi" -'es;
I) les séquences dérivées des séquences a), b), c), d), e), fl, 9), h), i), j) ou k) du 25 fait de la degéné~sc~ nce du code génétique Selon un mode de re~ s~lion preférQ, I'invention a pour objet les séquences nu-'écti-~iques SEQ ID n~ 5, SEQ ID n~ 12, SEQ ID n~ 14, SEQ ID n~ 16 et SEQ ID n~
18 co~ po"~ a"l respectivement aux ADNc des proteines humaines des séquences SEQlDn~6,SEQlDn~13,SEQlDn~15,SEQlDn~17etSEQlDn~ 19.
30 Les ditrérenles séquences nu~ ~eoti~ i;qu9s de l'invention peuvent être d'origine artificielle ou non. Il peut s'agir de séquences d'ADN ou d'ARN, obtenues par criblage de banques de séquences au moyen de sondes élaborees sur la base des sequences SEQ ID n~ 1, 3, 5, 7, 9, 11, 12, 14, 16 ou t8. De telles banques peuvent être préparees par des ~ec~niques classiques de biologie mo!éculaire, connues de35 I'hommede l'art.

.

W O 97/28186 PCT~R97/00214 -Les séquences nucléotidiques selon l'invention peuvent également etre preparees par synthese chimique, ou encore par des méthodes mixtes incluant la modification chimique ou enzymatique de séquences obtenues par cribla~e de banques.
Ces séquences nucleotidiques permettent la réaiisation de sondes nucléotidiques capables de s'hybrider fortement et specifiquement avec une séquence d'acides nu-cléiques d'un ADN génomique ou d'un ARN messager. codant pour un polypeptide selon l'invention ou un fragment biolo~iquement actif de celui-ci. De telles sondes font également partie de l'invention. Elles peuvent être utilisées comme outil de diagnostic in vitro pour la détection par des expériences d'hybridation. de transcripts spécifiques des polypeptides de l'invention dans des echar,lillons bi~ o~iq~les ou pour la mise en évidence de synth~ses a~e"anles ou d'ano",alies génétiques telles que la perte d'hétérozygotie ou le réarran~ement génétique, résultant d'un polymc~r~his",e demutations ou d'un ép.ssage différent.
Les sondes de l'invention cG""w,~ent au minimum 10 nucléotides et au maxi~num co,l,~o,len~ a totalité de la séquence du ~ène SR-p70 ou de son ADNc contenu parexemple dans un cos",ide.
Parmi les sondes les plus courtes c'est-à-dire d'environ 10 a 20 nucléotides lesconditions d'hy~iddlion appr~u, iées correspondent aux conditions stringentes usuellement utilisees par l'homme de métier.
La température utilisée est de preférQnce comprise entre Tm -5~ C a Tm -30~ C, de préference encore entre Tm -5~ C et Tm -10~ C Tm étant la temperature de fusion température a l~que'l~ 50 % des brins d'ADN appa(iés se séparent.
L'h~,~ridalion est del préférence menée dans des solutions à force ionique elevee telles 4ue ncl~"".,~r,l des solutions 6 x SSC
De maniere avar,~ aeuse les con~itiGl)s d'hyL~ ahon utilisées sont les suivantes:
- te,.)pérdtur~: 42~ C, - ~.",~,o., d'h~yLlidalion: 6 x SSC, 5 x Denhart's, 0 1 % SDS.
telles que décrites dans l'exemple lll Avantageuse!ment ces sondes sont représentees par les oligonucleotides suivants ou leurs complérnentaires:
SEQ ID n~ 20: GCG AGC TGC CCT CGG AG
SEQ ID n" 21: GGT TCT GCA GGT GAC TCA G
SEQ ID n" 22: GCC ATG CCT GTC TAC AAG
SEQ ID n~ 23: ACC AGC TGG TTG ACG GAG
SEQ ID n'' 24: GTC AAC CAG CTG GTG GGC CAG
SEQ ID n~ 25: GTG GAT CTC GGC CTC C

PCT~FR97/00214 .

SEQ ID n~ 26: AGG CCG GCG TGG GGA AG
SEQ ID n~ 27: CTT GGC GAT CTG GCA GTA G
SEQ ID n~ 28: GCG GCC ACG ACC GTG AC
SEQ ID n~ 29: GGC AGC TTG GGT CTC TGG
SEQID n~ 30: CTG TAC GTC GGT GAC CCC
SEQID n~ 31: TCA GTG GAT CTC GGC CTC
SEQID n~ 32: AGG GGA CGC AGC GAA ACC
SEQ ID n~ 33: CCA TCA GCT CCA GGC TCT C
SEQ ID n~ 34: CCA GGA CAG GCG CAG ATG
SEQ ID n~ 35: GAT GAG GTG GCT GGC TGG A
SEQ ID n~ 36: TGG TCA GGT TCT GCA GGT G
SEQ ID n~ 37: CAC CTA CTC CAG GGA TGC
SEQ ID n~ 38: AGG AAA ATA GAA GCG TCA GTC
SEQ ID n~ 39: CAG GCC CAC l~G CCT GCC
SEQ ID n~ 40: CTG TCC CCA AGC TGA TGA G

Préférentiellement les sondes de l'invention sont marquées pre~lahlcment à leur ulilisdlion. Pour cela plusis ~rs tecl"~ ues sont à la portee de l'homme du metier (marquage fluorescent radioactif chimioluminescent enzymatique etc).
Les methodes de diagnostic in Yifro dans lesquelles ces sondes nucléotidiques sont mises en oeuvre sont incluses dans l'objet de la presente invention.
Ces méthodes concement par exemplc la détection de synthèses anormales (ex.
accumulation de produits de transcription) ou d'ano~ s génetiques telles que la perte d'hét~irozygotie et le rea.,angei"ent génetique et les mutations ponctuelles au 25 niveau des séquences nucléo~ , 'es d'acides nu~ iques codant pour une protéine SR-p70, selon la d~rillit;oll donnée précéden~",ent.
Les séquences nucléoti~/iques de l'invention sont également utiles pour la fab(ica~ion et l'utilisation d'amorces oligonu.;eoli~ ules pour des réactions de séquençage ou d'a""~liricdlio,) spécifique selon la technique dite de PCR ou toute variante de celle-ci (Ligase Chain Reaction (LCR) .. ).
Des paires d'a",or..es préférées sont consti~ees par des a,l,o,- es choisies sur les séquences nucléotidiques: SEQ ID n~ 1: séquence de singe de 2 874 nucléotides etSEQ ID n~5: ADNc SR-p70a humain "ota"""ent en amont du codon ATG d'initiation et en aval du codon TGA d'arrêt de traduction.
35 Avantageusement ces amorces sont repri:senlées par les couples suivants:
-PCT~R97/00214 - couple n~1:
amorce sens: GCG AGC TGC CCT CGG AG (SEQ ID n~ 20) amorce antisens: GGT TCT GCA GGT GAC TCA G (SEQ ID n~ 21) - couPIe n~2:
amorce sens: GCC ATG CCT GTC TAC AAG (SEQ ID n~22~
amorce antisens: ACC AGC TGG TTG ACG GAG (SEQ ID n~ 23) - couple n~ 3:
amorce sens: GTC AAC CAG CTG GTG GGC CAG (SEQ ID n~ 24) amorce antisens: GTG GAT CTC GGC CTC C (SEQ ID n~ 25) - couple n~ 4:
amorce sens: AGG CCG GCG TGG GGA AG (SEQ ID n~ 26) amorce antisens: CTT GGC GAT CTG GCA GTA G (SEQ ID n~ 27) - couple n~ 5:
amorce sens: GCG GCC ACG ACC GTG A (SEQ ID n~ 28) amorce anlisens: GGC AGC TTG GGT CTC TGG (SEQ tD n~29) - couPle n~ 6:
amorce sens: CTG TAC GTC GGT GAC CCC (SEQ ID n~3~) amorce a.lllisens: TCA GTG GAT CTC GGC CTC (SEQ IDn~31) - couPle n~ 7:
amorCe sens: AGG GGA CGC AGC GAA ACC (SEQ ID n~ 32) amorce ar~lisens: GGC AGC TTG GGT CTC TGG (SEQ ID n~ 29) -couplen~8:
amorce sens: CCCCCCCCCCCCCCN(oùN est égal à G, A ou T) amorce antisens: CCA TCA GCT CCA GGC TCT C (SEQ ID n~ 33) - couPle n~ 9:
amorce sens: CCCCCCCCCCCCCCN(oùN est égal à G, A ou T) amorCe an~tisens: CCA GGA CAG GCG CAG ATG (SEQ ID n~ 34) CA 02245242 l998-07-28 PCTn~R97/00214 - couple n~ 10:
amorce sens: CCCCCCCCCCCCCCCN~où N est égal à G, A ou T3 amorce antisens: crr GGC GAT CTG GCA GTA G (SEQ ID n~ 27) - couPle n~ 11: *
amorce sens: CAC CTA CTC CAG GGA TGC (SEQ ID n~ 37) amorce antisens: AGG AAA ATA GAA GCG TCA GTC ~SEQIDn~38) - couPle n~ 12:
amorce sens: CAG GCC CAC TTG CCT GCC (SEQ ID n~ 39) amorce antisens: CTG TCC CCA AGC TGA TGA G (SEQ ID n~ 40) Ces amorces correspondent aux séquences allant respectivement:
- du nucléotide n~ 124 au nucléotide n~ 140 sur SEQ ID n~ 1 et du nucleotide n~
1 au nucléotide n~ 17 sur SEQ ID n~5 pour SEQ ID N~ 20 - du nucléotide n~ 2280 au nucléotide n~ 2262 sur SEQ ID n~ 1 et du nucléotide n~ 2156 au nurlQotide 2138 sur SEQ ID n~5 pour SEQ ID N~ 21 - du nucléotide n~ 684 au nucléotide n~ 701 sur SEQ ID n~ 1 pour SEQ ID N~ 22 - du nucléotide n~ 1447 au nur~éotide n~ 143Q sur SEQIDn~1 et du nucléotide 1324 au nucléotide 1307 sur SEQ ID n~5 pour SEQ ID N~ 23 - du nucléotide 1434 au nucleo~ide 1454 sur SEQ ID n~1 et du nucléotide 1311 au nur~éotide1331 sur SEQ ID n~5 pour SEQ ID n~ 24 - du nurieotide 2066 au nucléotide 2051 sur SEQID n~1 et du nucleotide 1940 au nuc;éolide 1925 sur SEQ ID n~5 pour SEQ ID n~25.
- du nucl~3tide 16 au nucl~olide 32 sur SEQ iD n~ 5 pour SEQ iD n~26 - du nucléotide 503 au nucléotide 485 sut SEQ ID n~ 5 pour SEQ ID n~ 27 - du nuciéotide 160 au nurle~tids 176 sur SEQID n~ 11 pour SEQ ID n~ 28 - du n~ ~r!~ctide 1993 au nucléotide 1976 sur SEQID n~ 5 pour SEQ ID n~ 29 - du nucléotide 263 au nur~éQtide 280 sur SEQ ID n~ 11 pour SEQ ID n~ 30 du n~rleoti~le 1943 au nucléotide 1926 sur SEQ ID n~ 5 pour SEQ ID n~ 31 - du nucleotide 128 au nur~otide 145 sur la séquence nucléotidique représentée à la fi~ure 22 pour SEQ ID n~ 32 - du nucléotide 1167 au nur'~olicie 1149 sur SEQ ID n~ 5 pour SEQ ID n~ 33 - du nucléotide 928 au nucléotide 911 sur SEQ ID n~ 5 pour SEQ ID n~ 34 - du nuciéotide 677 au nucléotide 659 sur SEQ ID n~ 5 pour SEQID n~ 35 - du nucléotide 1605 au nucléotide 1587 sur SEQID n~ 5 pour SEQID n~ 36 CA 02245242 l998-07-28 W O 97/28186 PCT~FR97/00214 -- du nucléotide 1 au nucleotide 18 sur la sbquence nuc~éotidique représentee a la figure 13 pour SEQ ID n~ 37 - - du nucléotide 833 au nucléotide 813 sur la séquence nucléotidique représentée à la figure 13 pour SEQ ID n~ 38 - du nucléotide 2~ au nucléotide 42 sur la sequence nucléotidique représentée à
la figure 13 pour SEQ ID n~ 39 - du nucléotide 506 au nuciéotide 488 sur la séquence nucleotidique representée à la figure 13 pour SEQ ID n~ 40 Les sequences nucléotidiques seion l'invention peuvent avoir par ailleurs des utilisations en therapie génique, notamment pour le contrôle des phénomenes d'apop-tose et de réversion de la transtur...alion.
Les séquena~s nucléuLidi~,Jes selon l'invention peuvent par ailleurs être utilisées pour la production de protéines recombi.,anles SR-p70, selon la déri,.iliGn qui a été donnée à ce terme.
Ces protéine!; peuvent être produites à partir des séquences nucléotidiques definies ci-dessus, selon des techniq-les de prodl~ction de produits ,ecomlsinanl~ connues de l'homme du métier. Dans ce cas, la séquence nu~ leolid; tue utilisee est placee sous le cor,l~le de signaux peu.~ellà.)t son expression dans un hôte cellulaire.
Un système erricac~ de production d'une protéine recombinante nécessite de disposer d'un vecteur, par exemple d'origine plas-nidique ou virale, et d'une cellule hôte compatible L'hôte cellulaire peut être choisi parmi des systëmes procar~rotes, comme tes bacté-ries, ou euGaryotes, comme par exemple les levures, cell~ ~es d'insectes, CHO
(cell~ ~'es d'ovaires de ha",~ r chinois) ou tout autre système avantageusement disponil~le. Un hdte cellulaire préféré pour l'expression des proteines de l'invention est constitué par la bactérie ~ co/i, nota-,--ne,-t Ia souche MC 1061 (Clontec).
Le vecteur doit compo,Ler un p,u,,,uhur, des signaux ~J'initialion et de terminaison de la traduction, ainsi que les régions ~pp,up~iées de régulation de la transcription. Il doit pouvoir être maintenu de façon stable dans la cellule et peut éventueltement posséder des signaux particuliers spécirianl la secrétion de la protéine traduite.
Ces différents signaux de co-l~'e sont choisis en fonction de l'hôte cellulaire utilisé. A
cet effet, les sequences nucléotidiques selon l'invention peuvent être inserées dans des vecteurs a replication aulonoi "e au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi. De tets vecteurs seront préparés selon les méthodes co-.,am..,ent utilisées par l'homme du métier, et les clones en resultant peuvent être PCTrFR97/00214 W O 97/281~6 introduits dans un hôte approprié par des méthodes standard, telles que par exemple l'electroporation .
Les vecteurs de clonage eVou d'expression contenant au moins l'une des séquencesnuciéotidiques définies ci-dessus font également partie de la présente invention.
S Un vecteur de clonage et d'expression préféré est le plasmide pSE1 qui comporte ~ la fois les éléments necessaires pour son utilisation comme vecteur de cionage dansE.coli (origine de replication dans E. coli et gène de résislance à l'a,l,picilline, provenant du plasl"ide pTZ 18R), et comme vecteur d'expression dans les cellulesanimales (promoteur, intron, site de polyadenylation, origine de réplication du virus SV40), ainsi que les éléments pe,lllelLanl sa copie en simple brin dans un but de sé~uençage (origine de le~ ;on du phage fl).
Les caractéristiques de ce plasmide sont décrites dans la demande EP 0 506 574.
Sa construction, ainsi que l'intégration des ADNc provenant des sequences d'acides nucléiques de l'invention sont par ailleurs decrites dans les exemples ci-après.Selon un mode de réalisation préféré, les protéines de l'invention sont sous forme de protéines de fusion, nolamll,enl sous forme de protéine fusionnée avec la glutathione S-transférase tGST). Un vecteur d'expression désigné dans ce cas est representé par le vecteur plaslllidi4-1e pGEX-4T-3 (Dl lall.lacia ref-27.4583).
L'invention vise en outre les cellules hôtes lldnsre~ées par ces vecteurs précédents.
Ces cellules peuvent être obtenues par l'intro~ ction dans des cellules hotes d'une séquence nucléotidique inserée dans un vecteur tel que défini ci-d~ssus puis la mise en culture des~lites cellllles dans des cGndilions pe"l~ellant la replication et/ou l'e~c~ression de la séquence nu '~cti~fique transfectée.
Ces cellules sont utilisables dans une ~ tl IO~:Ie de production d'un polypeptide recombinant ds sé~uence SEQ ID n~ 2, SEQ ID n~ 4, SEQ ID n~ 6, SEQ ID n~8, SEQ ID n~10, SEQ ID n~ 12, SEQID n~ 14, SEQ ID n~ 16 ou SEQ ID n~ 18 ou tout rle.y"len~ ou dérive ~ ement actif de celui-ci.
La ~ lllode de pro~uction d'un polypeptids de l'invention sous forme recolo~illante est elle-même comp,ise dans la présente invention, et se ca,acleri~e en ce que l'on cultive les ce"LIes llansfeclées dans des con-Jilions permettant l'expression d'un polypeptide recombinant de séquence SEQID n~ 2, SEQ ID n~ 4, SEQ ID n~ 6, SEQ
ID n~8, SEQ ID n~10, SEQ ID n~ 12, SEQ ID n~ 14, SEQ ID n~ 16 ou SEQ ID n~ 18 oude tout fragment ou dérivé biologiquement actif de celui-ci, et que l'on récupère ledi~
polypeptide recom~inanl.
Les procédes de p~,, iricalion utilisés sont connus de l'homme du metier. Le polypeptide recGIll~.)anl peut être purifié a partir de Iysats et extraits cellulaires, du -surnageant du milieu de culture, par des methodes utilisées individuellement ou en combinaison, telles que le fractionnement, les methodes de chromatographiel les - techniques d'immunoaffinité à l'aide d'anticorps mono ou polyclonaux spécifiques, etc.
Une variante ~réferée consiste a produire un polypeptide recombii)ant fusionné à une 5 proteine "porteuse" (protéine chimère). L'avantage de ce système est qu'il permet une stabilisation et une diminution de la protéolyse du produit recombinant, une augmentat}on de la solubilité au cours de la renaturation in vitro eVou une simplifi-cation de la purification lorsque le partenaire de fusion possede une affinite pour un ligand spécifique.
Avantageusement, les polypeptides de l'invention sont fusionnés avec la glutathion S-transférase en position N-terminale (système "GST" Pharmacia). Le produit de fusion est dans ce cas détecté et quantifié grace a l'activité enzymatique de la GST.
Le réactif colorimétrique utilisé est un accepteur de gluthation, substrat de la GST. Le produit recombinant est purifié sur un support de chtol"alog,aphie auquel ont eté
préalablement couplées des Il~ es de glutathion.
Les a"lico".s mono ou polyclonaux c~rahles de reconnalLI~ spécifiquement une protéine SR-p70 selon la cleriniLion donnée précede"""ent font également partie de l'invention. Des anticG,I,s polyclonaux peuvent être obtenus à partir du sérum d'un animal immunisé contre la p,~ teine, produite par exemple par recombina;son génétique suivant la "~U,ode décrite ci-dessus, selon les modes opérdtoi,~:s usuels.
Les anlico".s "~onoclG,-a.Jx peuvent être obtenus selon la méthode classique de culture d'hyL.iclG",es décrit~ par Kohler et 1\1 '~ :~.n, Nature, 1975, 256, 495-497.
Des anlicG"Js avantageux sont des anLico, ys diriges contre la région centrale co",prise entre le résidu 110 et le résidu 310 pour les séquences SEQ ID n~ 2 ou 6 ou entre le résidu 6Q et le résidu 260 pour la séquence SEQ ID n~ 8 Les a"li~,o".s selon l'invention sont par exemple des anlico".s chimériques, desa,)Lico,~s hu",at)isés, des r,dgmenls Fab et F(ab')2. Ils peuvent également se présenter sous forme d'immunoconjugues ou d'anLico,ps marqués.
30 Par ailleurs, outra leur uLilis~ion pour la pu,iti~,ation des polypeptides recombil1a"Ls, les anlicG, ~s de l'invention, en particulier les a"licol ~us monoclonaux, peuvent également etre utilisés pour la détection de ces polypeptides dans un échantillon biologique.
lls constituent ainsi un moyen d'analyse immunocytochirl ~;que ou 35 immunohistochimique de l'ex~n:ssior) de protéines SR-p70 sur des coupes de tissus W O 97/28186 PCTA~R97/00214 spécifiques, par exemple par immunofluorescenCe, marquage à l'or, immunoconjugués enzymatiques.
Ils permettent notamment de mettre en evidence une accumulation ano,l"ale de protéines SR-p70 dans certains tissus ou préièvements biolo5iques, ce qui les rend 5 utiles pour la détection des cancers ou le suivi de l'évolution ou de la remission de cancers preexistants.
Plus géneralement, les anticorps de l'invention peuvent etre avantageusement mis en oeuvre dans toute situation où l'expression d'une protéine SR-p70 doit etre observée.
L'invention concerne donc également un procedé de diayl loslic in vitro de pathologies corrélées à une expression ou une accumulation ano,l,lale de protéines SR-p70, notamment tes phénomènes de canceiisalion, à partir d'un prelevement bi~'oyi~ e,caractérisé en ce que l'on met en contact au moins un ar,licG,,us de l'invention avec ledit prélèvement biologique, dans des conditions permettant la fol",alion eventuelle de complexes immunologiques spécifiques entre une protéine SR-p70 et le ou lesdits anticorps et en ce que l'on détecte les CGIIl, l~xes immunologiques specifiques éven-tuellement formés.
L'invention conce",e également un l<it pour le ciiagnoslic in vitr~ d'une expression ou une accumulation ano,,,,c.la de proteines SR-p70 dans un prélèvement biologique et/ou pour la mesure du taux d'e~,,essiol- de celle-ci dans ledit prélèvement compre-nant:
- au moins un ~nlicol~Js spéciti~ e d'une protéine SR-p70, eventuellement fixe sur un support, - des moyens de revélation de la ror"~alion de complexes anti~ènes/anticorps spécitiq~es entre une protéine SR-p70 et ledit anLicol~s etlou des moyens de qu~l lliticalion de ces complexes.
L'invention vise également une méthode de dia~noslic précoce de la formation destumeurs, par la mise en evidence dans le sérum d'un individu, d'auto-anlicor~s dirigés contre une protéine SR-p70.
Une telle ",~lhode de diagnostic précoce est caractérisee en ce que l'on met en contact un échantillon de sérum prélevé chez un individu avec un polypeptide de l'invention, éventuellement fixé sur un support, dans des conditions pe,l"ellanl la fo",~alio" de co,r,A:q~ :~s immunc'~ j~ 'es specitiques entre iedit polypeptide et les auto-an~icol~.s éventuellement présents dans l'échanlillol) de serum, et en ce que l'on détecte les cc~",5,'e~s immunologiques spécifiques eventuellement formes.
L'invention a égalemenl pour objet une méthode de determination d'une variati::Lé
allelique, d'une mutation, d'une déletion, d'une insertion, d'une perte d'hetérozy~otie , W O 97/28186 PCT~R97/00214 -ou d'une anomalie génetique du gène SR-p70. pouvant être impliquées dans des pathologies caractérisée en ce qu'elle utilise au moins une sé~uence nucléotidique décrite ci-dessus. Parrri les methodes de déterminatiOn d'une varabilité allélique d'une mutation d'une délétion d'une insertion d'une perte d'hétérozygotie ou d'une anomalie genétique du gène SR-p70 on prefere la méthode ca~d- lérlsée en ce qu'elle comprend au moins une etape d'~" ,pliricclion par PCR de la sequence nucléique cible du SR-p70 suscepLible de présenter un polymorphisme une mutationune délétion ou une insertion à l'aide de couple d'amorces de sequences nucléotidiques définies ci-dessus une étape au cours de laquelie on procède au traitement des produits d",pliriés à l'aide d'enzyme de resl,i~lio,- ap~,oprié et une etape au cours de laquelle on procede à la détection ou au dosage d'au moins l'un des produits de ia réaction enzymatique.
L'invention col"pi~nd également des compositions pharmaceutiques co~prenanl comme principe actif un polypeplide ,epondant aux définitions précédentes préfé-rentiellement sous forme sa luhle 5550cie à un véhicule pha" "aceutiquement ~ccep~hle.
De telles con,posilions offrent une nouvelle approche pour traiter les phénomènes de cancérisation au niveau du cor,l,ûle de la multirlic~tion et la dirterencialior, cellulaire.
Pr~férenliellement ces co",po~ilions peuvent être Eid",;n;~L,ees par voie systémique de préférence par voie intraveineuse par voie intramusculaire intradermique ou par voie orale.
Leurs modes d'adm~ (cilion posologies et forrres galéniques optimaux peuvent être déterminés selon les critères générdl-~"~enl pris en compte dans l'et ihlissement d'un l~dile",ent therapeutique adapté à un patient comme par exemple i'âge ou le poids cGr,uGret du paffent la gravit~ de son état géné~al la tolérance au traitement et les effets secondai,_s consld~s, etc.
L'invention co,i,pr~nd enfin une ",etl)ode de thérapie génique dans laquelle desséquences nur~4Qti~l;quec codant pour une pru~eine SR-p70 sont l,ans~er~es a descell~ 'le5 cibies par le biais de vecteurs viraux inactivés.

D'autres ca,d,_lérisliq.les et avantages de l'invention appa,cissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-apres.

PCT~FR97/00214 ? EGENDE DES FIGURES

Figure 1: Comparaison nucléique de l ADNc du SR-p70a de singe (correspondant à SEQ ID n~1 ) avec la sequence nucleique de l ADNc de p53 de singe.

Figure 2: Comparaison protéique de SR-p70a de singe avec la proteine p53 de singe (sw: p53-cerae).

Figure 3: Coi"paraison de la séquence nucléique de l ADNc de SR-p70a et b de singe (correspondant respectivement ~ SEQ ID n~ 1 et SEQ ID n~ 3).

Figure 4: Séquence nucleique et sequence protéique deduite de SR-p70a de singe.
Figure 5: Séquence nucléique partielle et sequence protéique déduite complète de SR-p70b de singe.

Figure 6: Séquence nucléique partielle et séquence protéique complète déduite de SR-p70a humain (cGr,~spondant à SEQ ID n~ 5).

Figure 7: Séquenca nucléique partielle et sequence protéique déduite complete de SR-p70c de souris (cGIl~spondanl à SEQ ID n~ 7).

Figure 8: Séquence nuc!e;q-le pa, I;~lle et séquence protéique déduite partielle de SR-p70a de souris (cor,~ponddnl à SEQ ID n~ 9).
30 Figure 9: Multialignement des protéines déduites des ADNc SR-p70 de singe (a et b) humain (a) et de souris (a et c).

Figure 10a: Immunoempreinte de la p,otei.)e SR-p70.

Figure 1Qb: Détecliei) de la protéine endogene SR-p70.

W O 97/28186 PCT~FR97/00214 -Figure 11: Localisation chromosomique du gène SR-p70 humain. Le signal apparait sur le chromosome 1 dans la région p36.
,.
Figure 12: Structure génomique du gène SR-p70 et comparaison avec cetle du d. gene p53. Les séquences protéiques humaines du SR-p70a (ligne du haut de l'alignement) et de la p53 (ligne du bas) sont morcelées en peptides en fonction des exons respectifs à partir desquels ils sont codes. Les chiffres au niveau des fleches correspondent a la numérotation des exons correspondants.

Figure 13: Sé~uence génomique humaine du SR-p70 depuis le 3' de l'intron 1 jusqu'au 5' de l'exon 3. Les introns sont encadrés. Aux positions 123 et 133 sont localisées deux positions nucléiques variables (G ~ A en 123 et C ~ T en 133). Les sites de ~esl~i~ lion de l'enzyme Styl -sont soulignés (position 130 dans le cas ou il y a presence d'un T au lieu d'un C à la position 133 position 542 et position 610). Les fleches posilionnent les a",Gr es nuclQiques utiiisées dans l'exemple X~.

Figure 14: (Jol~pdldison nucléique du 5' des ADNc humains du SR-p70d et du SR-p70a.

Figure 15: Mullial;~"e",ent des séquences nu~l~iques correspondant au SR-p70 humain a b d e etf.

Figure 16: ~1ulti al:g"ei,~ent des protéines de~uites des ADNc SR-p70 humains (a b~ d eetf).
Figure 17: Séquence nu:'éiql:e partielle et sequence protéique déduite partielle du SR-p70a humain. Les deux bases en ca,a~lères gras correspondent à
deux positions variables (voir figure 6). Cetl:e séquence présente une région 5' non codante plus con ~!ete que celle présentée dans la figure 6.
Figure 18: Analyse des transcrits SR-p70a apres al"plif;~ a~ion par PCR.
piste M: marqueurs de poids ,~'éeul~ires "1 I<b ladder" (GIBCO-BRL) W O 97/28186 PCT~R97/00214 piste 1: iignée HT29 piste 3: iignée SK-N-AS
piste 5: lignée UMR-32 piste 7: lignée U-373 MG
piste 9: lignée SW 48Q
piste 11: lignée CHP 212 piste 13: lignée SK-N-MC

pistes 2 4 6 8 10 12 14: témoins negatifs correspondant aux pistes 101 3 ~ 7 9 11 et 13 respectivement (absence de transc,i,utase inverse dans la réaction RT-PCR).

Figure 19: A : Analyse par electrophorèse sur gel d'agarose des fragments génomiques amplifiés par PCR (depuis le 3' de l'intron 1 ius~u~au 155' de l'exon 3). La nume,ota~ion des pistes cor,e~spond à la numérotation de l'échantillonnage témoin. Piste M: marqueurs de poids moléc~ es ("1 kb ladder").
B: Analyse identique a celle de la parti~ A apres une digestion par l'enzyme de resl,i~ liori Styl des mêmes écl~anLillons.

Figure20: Represe"laLion schématique avec une carte de reaL,i~lion partielle du plasl"iJe pCDNA3 contenant le SR-p70a humain.

W O 97/28186 PCT~FR97/00214 EXEMPLE I

Clonage de l'ADNc du SR-p70 de cellules COS-3.

1 Culture des celtules COS-3 Les cellules COS-3 (cellules de rein de singe vert d'Afrique transformées par l'antigène T du virus SV 40) sont cultivées dans le milieu DMEM (GIBCO-BRL refé-rence 41 96';-047) contenant 2 mM de L-glutamine et supplémenté avec 50 mg/l de gentamycine et de 5 % de serum de bovin foetal (GIE3CO-BRL reférence 10231-074) jusqu'à semi-confluence.

2. Preparation de l'ARN messager a) extraction de l'ARN mess~ger Les cellules sont récupérées de la façon suivante:
- les cellules adhérentes sont lavees deux fois avec du ta,~"~on PBS (phosphate buffered saline référence 04104040-GIBCO-BRL) puis grattees avec un grattoir en caoutchouc et centrifugées.
Le culot clellulaire est mis en suspension dans le tdlllpon de Iyse de composition suivante: guanidine-thiocyanate 4M; citrate de sodium 25mM pH 7; sarcosyl 0,5 %; ,~-men ap~oéUIanol 0,1 M. La suspension est soniquée a l'aide d'un sonicateur Ultra-Turrax n~ 231256(Janke et Kundel) à puissance maxi",ale pendan~ une minute. On ajoute de l'acetate de sodium pH 4 jusqu'à 0 2 M. La solution est extraite avec un volume d'un melange phénol/cl,lo,or~"",e (v/v; 5/1). On précipite à -2Q~C l'ARN contenu dans la phase a~uellse à l'aide d'un volume d'isopropanol.Le culot est resuspendu dans le ld,npon de Iyse. La solution est à nouveau extraite avec un mélange phenol/cl,lorofo",1e et l'ARN est précipité avec de l'isopropanol.
Après lavage du culot avec de l'athanol 70 % puis 100 % I'ARN est resuspendu dans de l'eau.
b) PuriricaliG" de la r,a~.liol1 poly A~ de l'ARN
La purifical:ion de la fraction poly A~ de l'ARN est réalisee à l'aide du kit Dynabeads oligo (dT)2~ de DYNAL (référence 610.05) suivant le p,~Jlocole préconisé par le fal" i. anl. Le principe est basé sur l'utilisation de billes polystyrène super-pardr"aynetique sur lesquelles est attaché un oligonuc~éotide poly(dT)25. La frac-tion poly A~ de l'ARN est hybridée sur l'oligo(dT)2s couplé aux billes que l'on piège sur un support magnetique.

W O 97/28186 PCT~R97/00214

3. Constitution de la banque d'ADN complémentaire a) préparation de l'ADN complémentaire A partir de 0,5 ~9 des ARN-poly A~ de cellules COS-3 obtenus à l'issue de l'etape 2, on prépare l'ADN complémentaire simple-brin marqué au 32P.dCTP (I'ADN
complémentaire obtenu présente une activité spécifique de 3000 dpmJng) avec r l'amorce synthetique de séquence suivante (comprenant un site E3amHI):
5'CGATCCGGGCC C I I I m I I I I T 1 1 <3' dans un volume de 30 ~I de tampon de composition: Tris I ICI 50 mM pH 8,3, MgCI2 6 mM, Drr 10 mM, KCI 40 mM, contenant 0,5 mM de chacun des désoxynucléotides triphosphates, 30~Ci de dCTP a32P et 30 U de RNasin (prome-ga). Après une heure d'incubation a 37~C, puis 10 minutes à ~0~C, puis de nouveau 10 minutes à 37~C, avec 200 unités de l'enzyme transcriptase inverse RNase H (GIBCO-BRL référence 8064A), on ajoute 4 1ll d'EDTA.
b) Hydrolyse alcaline de ia matrice ARN
1~ On ajoute 6 ~I d'une solution de NaOH 2N, puis on incube pendant 5 minutes à
6~~ C.
c) P-,~ irioalion sur ~ nne sephacryl S400 Afin d'éliminer l'amorce sy~ etiq.le, on purifie l'ADN cG"I~'én~enlaire sur une colonne de 1 ml de sephacryl S400 (Pi,a""ac,ia), équilibrée dans du tampon TE.
Les deux pre."ières rlaulions radioactives sont regroupées et préciritees avec 1/10 de volume d'une solution d'acétate d'ammonium 10 M et 2,5 volumes d'éthanol, ceci après une e~lla-,~ion, avec un volume de chlo,ufo,,lle.
d) Addition holl,opolyméri~ue de dG
On allonge l'ADN co."r'é."entaire en 3' avec une "queue" de dG avec 20 unités deI'enzyme te",~;aal~ t,ansrerase ~Pharmacia 27073001). On incube dans 20 ~I de Idl~pon de co-l~oci~ion: Tris HCI 30 mM pH 716; chlonure de cobalt 1mM, acide cacodylique 140 mM, Drr û,1mM, dGTP 1 mM, pendant 15 minutes à 37~C, puis on ajoute 2 ~I d'EDTA 0,5 M
~3) On rép~te à nouveau les étapes b) e~ c) f) Appariement du vecteur de clonage pSE1 (EP 506 574) et de l'ADN
complementaire en presence de l'adap~dleur.
On centrifuge, le culot est dissous dans 33 ~11 de tampon TE, on ajoute 5 1ll (125 ng) de vecteur de clona5~e pSE1, 1 ~1(120 ng) de l'adaplalèur de séquence sui-vante (cGmprenant un site Apal):
5'AAAAAAAAAAAAAGGGCCCG3'.

PCTrFR97/00214 10 ~11 d'une solution de NaCI 200 mM, on incube pendant 5 minutes a 65~C puis on laisse refroidir le mélange réactionnel jusqu'à temperature ambiante.
g) Ligation On ligue le vecteur de clonage et l'ADNc simple brin dans un volume de 100 1ll avec 32,~ unites de l'enzyme ADN ligase du phage T4 (Pharmacia reférence 270 87002) pendant une nuit à 15~C dans un tampon de composition: Tris HCI 50 mM p~ 7,5, MgCI2 10 mM, ATP 1 mM.
h) Synthese du deuxième brin de l'ADNc On élimine! les p~ei.)es par extraction au phénol suivie d'une extraction au ~illor~fo""e~, puis on ajoute 1/10ème de volume d'une solution d'acétate d'ammo-nium 10 mM, puis 2,5 volumes d'éthanol. On centrifuge, le culot est dissous dans le tampon de composition Tris acétate ~3 mM pH 7,9 acétate de potassium 62,5 mM, acétate de magnesium 1 mM et dithiothréitol (Drr) 1 mM, le deuxième brin d'ADN
complementaire est synl:hétisé dans un volume de 30 ~l avec 30 unites de l'enzyme ADN polymérase du phage T4 (Pha"nacia, référence 270718) et un mélange de 1 mM des quatre désoxynucléotides triphosphates de dATP, dCTP, dGTP et dTTP, ainsi que deux unités de la protéine du gène 32 du phage T4 (Pha~n,acia, référence 27-0213)) pendant une heure à 37~C On extrait au phénol et on retire les traces de phenol par une colonne de polyacrylamide P10 (Biogel P10-200-400 mesh -, ~:férence 15011050 - Biorad).
i) Transro""dlion parélec;t,opordlion On transforme des cell~ ~les E. Coli MC 1061 avec l'ADN recombinant obtenu précéde"~."el)l par électropol~ion à l'aide de l'appareil Biorad Gene Pulser (Biorad) utilisé à 2,~ kV dans les co"dilions prescrites par le fabncan~, puis on fait pousser les bactérie~ )danl une heure dans du milieu dit milieu L3 (Sambrook op cit~) de co~ osilio,): bactotryptone 1Q g/l; extrait de levure 5 g/l; NaCI 10 g/l.
On déle" ";ne le nG" ,bre de clones independants en etalant une dilution au 1/1000ème de la l.ansrur,,,alion après la première heure d'incubation sur une boîte de milieu LE~ addilionné de 1,5 % d'agar (p/v) et de 100 ~ g/ml d'ampicilline, appelé
par la suite rnilieu LB gélosé. Le nombre de clones indépendanl:, est de 1 million.
J) Analyse des ADNc de la banque Dans le cadre de l'analyse de clones individ~ ~alises de la banque par un séquençage nurléiq-le du 5' des ADNc, un clone, dénommé SF'<-p70a s'est révelé
présenter une hGIl.~'o~;c pa,~;el'~ avec l'ADNc de la protéine déja connue, la proteine p53 (Genbank X 02469 et X 16384) (Figure 1). Les séquences ont été
ré~lisées avec le kit United States Bio~he,r.:~~' (reférence 70770) et/ou le kit Applied .
Biosystems (références 401434 eVou 401628) qui utilisent la méthode de Sanger etal. Proc. Natl. Acad. Sci. USA ; 1977 14 5463-5467. L'ADN plzsmidique esit preparé à partir du kit WIZARD mini préparation (Promega réference A7510). Le.s amorces utilisées sont des oligonucléotides de 16 à 22 mer complementaires soit S au vecteur pSE1 dans la région immediatement en 5' de l'ADNc soit à la séquence de l'ADNc.
Un second ADNc a éte isolé à partir de la même banque en criblant de manière similaire à la technique décrite dans l'EXEMPLE lll 3) ci-après avec un fragment de I'AI:)N SR-p70a marque au 32p avec le kit RRL "Random Primers DI~IA labelling~
systems'' (référence 18187-013). Les tampons d'hybridation et de iava~e sont additionnés de 50 % de fo,ma""~e. Le demier lavage est réalisé en 0 1 x SSC/SDS
0 1 % a 60~C Cette seconde séquence (ADNc SR-p70b) est identique à la première mais présente un fragment interne délété (Figure 3).
Les deux ADNc SR-p70 d'une longueur de 2874 nucléotides (SR-p70a) et de 2780 1~ nucléotides ~SR-p70b) cs"espondent aux produits d'un seul gène un épissage altematif enl,aillanl une déletion de 94 bases entre les nucléotides 1637 et 1732 et une terminaison prématurée de la pr.,leine codée co"esporldante. Les protéines déduites des deux ADNc présentent respectivement 637 acides aminés et 499 acides aminés (Figures 4 et 5).

EXEMPLE ll Ol~tenlion de ta séquence et clonage de l'ADNc de la proteine SR-p70a a partir de 25 cellules HT-29 (Adénocatc.no",e de colon humain).

1~ Cu/tur~ des cell ~'3s HT-29 Les c~Hu'es sont cultivées en milieu McCoy 5 (GIBCO 26600-023) additionné de 10 %
de sérum foetal de veau (GIBCO 10081-23) et 50 mg/l de gentamycine jusqu'à semi-3~ confluence 2) Pr~paration do l~ADN compJ~mentaire L'ARN messager est prepa,~5 comme décrit dans l'EXEMPLE 1.2. L'ADNc est préparé
de manière si,.,ila;.e ~ celle décrite dans l'EXEMPLE 1.3 avec 5 ~lg d'ARN messager 3~ total en utilisant une a",on e polytT)t2. La .eaclion n'est pas interrompuQ avec de l'EDTA.

W O 97tZ8186 PCT/FR97/00214 3) Amplifcation spécifque de J'ADNc humain parla technique d~te de PCR
La polymérisation est réalisés avec 4 ~I d'ADNc dans 50 ~I final avec le tampon de composition suivante: Tris I ICI 10 mM pH 8,3, MgCI2 2,5 mM, KCI 50 mM en présence de 1!0 % DMSO, dNTP 0,5 mM, 4 ~lglml de chacune des deux amorces nucléiques et de 2,5 unttés de Taq ADN polymérase (Boehringer). Les couples d'amorces ont été choisis sur la séquence nucléique du clone SR-p70 de COS-3, notamment en amont de l'ATG d'lnitiation et en aval du ~GA d'arrêt de traduction et sont de compositions suivantes:

amorce sens: ACT GGT ACC GCG AGC TGC CCT CGG AG
site de restriction Kpn I

an ~G~e antisens: GAC TCT AGA GGT TCT GCA GGT GAC TCA G.
site de r~ ,l, i-,lion Xba I

La réaction est réalisée durant 30 cycles 94~C/1 minute, 54-60~CI1 minute 3û
secondes et 72~C/1 minute 30 secondes, suivi d'un dernier cycle de 72~C/6 minutes.

4) Obtentron de la séquence de l'ADNc hvmain Dans un premier temps, le produit de PCR sst éliminé des oligonucléotides sur une colonne de sephacryl S400 puis déss-'~ par cb,o"~aLoy-aphie d'Pxclusion sur une co-lonne de polyacrylamide P10 (Biorad reference 1504144). Les reactions de séquen,cage sont réalisées a l'aide du kit Applied Biosystems (,eférence 4û1628)avec des oligonucléotides spécifiques de l'ADNc. La séquence obtenue est trbs similaire à celle du SR-p70a de singe et la p,o~éi~e déduite contient 636 acidesaminés (Figure 6).
De m~nicr~ similaire, d'autres séquences issues de lignées ou de tissus humains ont été obtenues pour la partie codanl~ du SR-p70 humain, no~an.rllent a partir du 30 poumon ou du pancreas Les proleines déd~ litPs de ces séquences sont identiques à
celles obtenues pour la lignee HT-2~.

5) Clonage de ~"ADNc humain dans le plas"L_ ~ pCDNA3 (Inv~trogen V 790-20) Le produit PCR obtenu en 3) ainsi que le plasmide sont digéfés par les deux enzymes 35 de.resllicLio~ Kpn I et Xba I puis purifiés apres migralic~n sur un gel d'agarose 1 % à
I'aide du kit Geneclcan (Bio 101 ~efert l)ce 3105). Après ligation avec 100 ng d'insert W O 97128186 PCT~FR97/00214 -et 10 ng de vecteur et transformation (technique décrite dans I~ExEMpLE 1.3.g et i les clones recombinants sont vérifies par séquençage a I'aide du kit Applied Biosystems citb ci-dessus.

EXEMPI E lll Clonage de i'ADNc du SR-p70 de souris à partir de cellules AtT-20 (tumeur hypophysaire) 1J Cu/tur~ cellulair~ de la lis~née AtT-20 Les cellules sont cultivées dans du miiieu Ham F10 (GIBCO 31550-023) additionné de 15 ~/0 de sérum de cheval (GIBCO 26050-047) et de 2 5 % de serum foetal de veau (GIBCO 10081-073) et de 50 mg/l de gen~ ,ycine jusqu'a serni-confluence.

2) Pr~paration de la banque d'ADN co" ,~ mentair~
La banque est réalisée comme décrit dans l'EXEMPLE 1 2) et 3) à partir des cellules cultivées ci-dessus.
3) Cnbtage de la banque a) Préparation des ."e",brc.,-es Les clones de la banque sont étalés sur du milieu LB gélosé (boîtes de petri diamètre 150) revêtu de ."emi~ranes Biodyne A ( PALL ,~férence BNNG 132). Après une nuit à
37~C les clones sont l,c~ ér~s par contact sur de nouvelles membranes. Ces dernières sont traitées en les dépos~nl sur du papier Whatman 3 mm imbibé des solutions suivantes: NaOH û 5 N NaCI 1.5 M pendant 5 minutes puis Tris HCI 0.5 MpH 8 NaCI 1.5 M ,oendanl 5 minutes. Après un traitement à la p,oléinase K dans le Lampon suivant: Tris HCI 10 mM pH 8 EDTA 10 mM NaCI 50 mM SDS 0.1 %
protéinase K 100 iug/ml pendant une heura à Le",pér. lure a",~ia~te les me",b,dnes sont lavées ai~ondal""~enl dans du 2 x SSC (sodium citrate NaCI) séchees puis incubées au four sous vide à 80~C pen~ian~ 20 minutes.
b) Prepa,~lion de la sonde Sur la base de sequences des ADNc SR-p70 de singe et d'humain une premiere séquence a eté réalisée sur un r~.~ylllelll amplifié a partir de l'ARNm de la lignée AtT-20 comme décrit dans i'EXEMPLE 11.3 et 4 avec les oiigomeres de compositions suivantes:

6 23 amorce sens: GCC ATG CCT GTC TAC AAG
amorce antisens: ACC AGC TGG TTG ACG GAG.
Sur la base de cette séquence une sonde oligomérique spécifique de souris a été
choisie et présente la composition suivante:
GAG CAT G1-G ACC GAC ATT G.
100 ng de la sonde sont marques en 3' avec 10 unites de Terminal Transferase (Pharmacia) et 100 ~Ci de dCTP a32P 3000 Ci/mmole (Amersham réference PB
10205) dans 10 ~I du tampon suivant: Tris HCI 30 mM pH 7.6 acide cacodylique 140 mM CoC12 1 mM DTT 0.1 mM pendant 15 minutes à 37~C. Les nucléotides 10 radiomarquési non incorporés sont éliminés sur une colonne de polyacrylamide P10 (Biorad référence 1504144). La sonde obtenue a une activité specifique environ de 5.1o8 dpml,ug.
c) Préhybridation et hybridation Les membranes préparée5 en a) sont préhybridees 30 minutes a 42~C dans 6 x SSC
15 5 x Denhart's; 01 % SDS puis hybridées quelques heures dans le même tampon additionné de la sonde préparée en b) à raison de 106 dpm/ml.
d) Lavage et exrosition des ",emL.rdnes Les menl~rdlles sont lavées deux fois à ie,l-pér~ re ambianLe dans le tdmpon 2 xSSC/SDS 0.1 % puis une heure à 56~C en 6 x SSC/SOS 0.1 %. Les clones hybridés 20 sont revelés avec des films KODAK XOMAT. Un clone positif contenant le SR-p70 de souris est séleclionne et deno")l"e ci-après SR-p70c.

4) S~quençage du SR-p70 de souris et analyse de la séquence La sequence est obtenue à l'aide du kit Applied Biosystem (reférence 401628). La25 séquence pro~ei~ue déduite de l'ADNc SR-p70c de souris (Figure 7) présente une très forte l~o"i~'~gie avec celles de l'humain et de singe excepté dans la partie N-te"";nale qui diverge fortement (voir Figure 9). A l'aide de la tec~lni,llJe dite de PCR
de maniere si.,.;'~ à celle décrite dans l'EXEMPLE 11.3 el: 4 une seconde sequence 5' (issue de la même banque AtT-20) a eté obtenue (Figure 8). La sequence 30 protéique N-terminale déduite (séquence déno""llé SR-p70a) est très similaire à celle deduite des ADNc SR-p70 humain et de singe ~SR-p70a) (Figure ~). La lignée AtT-20 présente donc au moins deux transcripts SR-p70. Ces 2 derniers divergent dans lapartie N-terminale par des épissages différents.

,.

W O 97128186 PCT~R97/00214 EXEMPLE IV

1) Product~on de protélne recombinante SR-p70 dans E. coli a) Construction du plasmide d'expression 5 Elle consiste à mettre la partie -COOH terminale de la proteine SR-p70a de singe depuis la valine en position 427 à l'histidine -COOH terminale en position 637 en fusion avec la glutathione S-l~ans~eiase (GST) du vecteur plasmidique pGEX-4T-3 (Pharmacia reférence 27-4583). Pour cela I'insert correspondant de la SR-p70a (position 1434 a 2Q66) a éte amplifié par PCR avec 10 ng de plasmide contenant I'ADNc SR-p70a de singe. Les amorces nu~ ues sont de composition suivante:

amorce sens: m GGA TCC GTC AAC CAG CTG GTG GGC CAG
site de restnction BamHI

amorce antisens: AAA GTC GAC GTG GAT CTC GGC CTC C.
site Sal I

Le fragment obtenu ainsi que le vecteur sont digéres par les enzymes de restriction Bamtll et Sal I et le clonage est réalisé comme décrit dans l'EXEMPLE 11.5. Le clone selectionné est appelé pG SR-p70.
b) Expression et p~" iricaliGI ~ de la pn.tei. ,e fusion GST-pSR-p70 Cette étape a été ,~r' -~e en utilisant le kit "bulk GST p-~nficdlion module" (Fl,a""acia Référtsnce 27-4570-01).
De ll,an;~re schemaffque le clone ~ecorr,'~ nanL a eté mis en culture à 37~C dans un litre de milieu 2x YTA + ampicilline 100 ~lglml. A DO 0 8 I'expression est induite avec 0 5 mM d'lPTG pendant 2 heures à 37~C Après centrifugation le culot cellulaire est repris dans du PBS froid puis sonique par ultrason. Après aujonclion de 1 % triton X-100 on incube 30 minutes sous agitation à temperature a"~bianle. Après centrifugation à 12 000 g 10 minutes à 4~C on récupère le sumageant. La purifica-3~ tion est ensuite réalisee sur une colonne de ch,o",alog,dphie d'affinité glutathionsepl~a,use 4B. La fixation et le lavage sont ré~iisées en Id",pon PBS et l'élution est réalisée par compétitlon avec du glutathion réduit La concentration finale est amenee ~ 300 ~lg/ml de protéine fusion.

PCTA~R97/00214 -2) Production de protéine SR-p70a dans les cellules COS-3.
Les cellules COS-3 sont transfectées avec de l'ADN piasmidique pSE1 dans lequel a été cloné l'ADNc de SR-p70a de singe (EXEMPLE 1.1) ou avec de l'ADN plasmidique du vecteur pSE1 en tan~ que témoin par la technique du DEAE Dextran: les cellules COS-3 sont ensemencees à 5 x 10~ cellules par boite de 6 cm en milieu de culturecontenant 5 % de serum de bovin foetal (EXEMPLE 1.1). Apres culture les cellulessont rincées avec du PBS. On ajoute 1 ml du mélange suivant ~ milieu contenant 6 5 1~9 d'ADN 250 ~ g/ml de DEAE Dextran et 100 ~M de chloroquine. Les cellules sontincubées a 37~C en 5 % CO2 durant 4 à 5 heures. Le milieu est aspire on ajoute 2 ml de PBS additionne de 10 % DMSO et les cellules sont incu~ées pendant une minute en remuant l~égèrement les boites. Le milieu est à nouveau aspiré et les cellules sont rincees deux fois avec du PBS. Les cellules sont alors incubées à 37~C avec du milieu contenant 2 % de serum de bovin foetal pendant la durée de l'expression qui est généralernent de 3 iours.
La protéine SR-p70a est alors analysée comme décrit dans l'EXEMPLE Vl par immunoe",p,~i ,la.

EXEMPLE V

Préparation d'anlicG-~s specifiques 150 1l9 de protéines de l'~chanlillon p~pa,e selon l'EXEMPLE IV ont été utilises pour immuniser un lapin (male de 1 5 à 2 kg environ New-Zealand) Les immu"isalions ont eté effect~ees tous les 15 jours selon le pru~ocola décrit par V~itl~4~itis Methods in Enzymology, 1981 73 4~i. Pour la première in, ction un volume de solution antigé-nique est émulsifi~ par un volume d'adiuvant cGn~ 'et de Freund (Sigma réference4258~. Cinq rappels ont et~ administrés en adiuvant inco",plet de Freund (Sigma référence ~5CI6).
EXEMPI E Vl Détection de la protéine SR-p70 "Westem immu" t'slli,lg" (immunoempreinte) 1~ Matériels u~ilisés pourl'immunoe""~r~inte a) Lignées cellulaires utilisées pour l'immunoer,~ , einle.
35 Les lignées cellulaires suivantes ont eté cultivées comme decrit dans le catalogue ~catalogue of cell lines and hyL,ndo",as 7th edition 19g2>~ de l'ATCC (American Type CA 02245242 l998-07-28 Culture Collection): COS-3 CV-1 (lignée de cellules de rein de singe) HT-29 U-373MG (glioblastome humain), MCF7 (adenocarcinome mamrnaire humain) SKNAS
(neuroblastome humain cultivé dans les mêmes conditions que COS-3) SK-N-MC
(neuroblastome humain) IMR-32 (neuroblastome humain) CHP212 (neuroblastome 5 humain cultivé dans les mêmes conditions que CV-1) Saos-2 (osteosarcome) SK-OV-3 (adénocarcinome d'ovaire) et SW 480 (adénocarcinome de colon humain).
b) Cellules COS-3 transfectées par l'ADNc SR-p70a.
Les cellules COS-3 ont été transfectees comme décrit dans l'EXEMPLE IV.2. En tant que témoin les cellules ont ete transfectées avec de l'ADN plas",idiq.le pSE1 ne1 Q contel1anl pas l'ADNc recombinant SR-p70a.

2) Pn~paration des échantillons protéiques à partir de cvlture cellulaire eucaryote o~J
de cellules transfect~es.
Apres cultùre les cellules sont lavées avec du PBS puis reprises dans un La,~,pon RIPA (PBS avec 1 % NP40 0 5 % sodium déoxycholal,a Q 5 % SDS) complémenté
avec 10 ug/ml RNAse A 20~Lg/ml DNAse 1 2 ,ug/ml aprolil)i"e 0 5 !lglml leupepli"e 0 7 ~lg/ml pepaLdli"e et 170 ,ug/mt PMSF. Les c~ es sont soniquees par ultrason a 4 ~C et laissées 30 minutes à 4~C. Après "~;c,ucenl,ir.lgation à 12 000 rpm on recupère le sumageant. La concenl,dlion de proleine est mesurée par la méthode de Gladrord.

3) "Westem ~lolki"~"
S ou 50 ~9 de protéines (50 ug pour les lignées cellulaires et 5 ug pour des cellules transfectées) sont mis dans 0 2 volume du te""pon d'éle~.L,opl,orese 6X suivant: Tris HCI 0 35 mM pH 6 8 10 3 % SDS 36 % glycérol 0 6 mM DTT 0 012 % bleu de broi"ophénol. Les echantillons sont deposés et mis a migrer dans un gel SDS-Page 10 % (30/0 8 Bis) puis éle~ l,ul,ansrérés sur une me",bra-1e de nitrocellulose.

4) Révélafion parl'anticorps Lz "le",iJ.ane est incubée 30 minutes dans le ld-."~on de blocage TBST (Tris HCI 10 mM pH 8 NaCI 150 mM 0 2 % Tween 20) addilis~,u~é de 5 % de lait (GIBCO- SKIM
MILK) à temperature a",bianle. La ",e",l,r.~ne est s~ccessivement mise en présence de l'anlico,ps anti-SR-p70 (aSR-p70) dans le même ta,npon 16 heures à 4~C lavée 3 fois pendant 10 minutes avec du TBST, puis incubée une heure a 37~C avec un second a"lico"~s anti-imm~" ,oglobuline de lapin couplé avec de l.a peroxydase (SIGMA A055). Après trois lava~es de 15 minutes la révélation est effectuée en utili-sant le kit ECL (A",elaha,t, RPN2106) par chimioluminescence.

W O 97/28186 PCT~FR97tOO214 Parallèlement les memes echantillons ont eté revelés par un antico~us anti-pS3 (a p53) (sigma E3P5312) suivi d'un second anticorps anti-immunoglobine de souris.

5) Figl~res et resultats.
5 Fiqure 10: Immunoempreinte de la protéine SR-p70 Fiqure 10a: Détection de ia protéine recombinante SR-p70 - colonnes 1 et 3: COS-3 transfectée par le vecteur pSE1.
- colonnes 2 et 4: COS-3 L,dnsfe..lée par le plasmide pSE1 conLt:na"l I'ADNc du SR-p70a.
- colonnes 1 et 2: Révélation par l'anLico,ys anti-SR-p70 (aSR-p70).
- colonnes 3 et 4: Révélation par l'anticorps anti-P53 (ap53).
Fiaure 10b: Oéteclion de la p,oleine endogène SR-p70 -colonnes1 :COS-3;2:CV-1 ;3:HT-29;4:U-373MG;5:MCF7;6:SKNAS;7 :SK-N-MC;8:1MR-32;9:CHP212;10:Saos-2;11:SK-OV-3et12:SW480.
A: Révélation par l'anlicor~us aSR-p70.
B: Révéiation par l'a~ ,liCG-~5 ap53.

L'a~tic~,~s ~I:~R-p70 reconnait spécifiquement les protéines recombinantes (Figure 10a) et endo~ènes (Figure 10b) et ne croise pas avec la p53. L'analyse de lignées cellulaires humaines ou de singe montre que la pru~eine SR-p70 comme la p53 est genéralement faiblement det*~hl~. Par contre lorsqu'une accumulation de p53 existe la SR-p70 devienl: elle aussi plus facilement détect~hle (Figure 10b). Une etude par RT-PCR de la distribution des lldlls~ . SR-p70 montre que le gène est exprime dans tous les types cellulaires testés.

EXEMPLE Vll Clonage du gi~ne du SR-p70 et lo~--lisal-Qn cl~,u,,,osomique.

1) Clonage du gène SR-p70 La banque utilisée est une banque de c~sr":~es preparée avec de l'ADN génomique humain purifié de placer,La et cG"""e-- ialisée par Stratagene (reférence 95 1202).
Le cril~lage du gène est réa~isé comme decrit dans l'exemple 111.3 avec un fragment d'ADN SR-p70 marqué au 32p avec le kit BRL "Random Primers DNA Labelling Systems" (référence 18187-013). Les tampons d'hybridation et de lavage sont additionnés de 50 % formamide. Le demier lavage est réalise en 01 x SSCISDS
0 1 % à 60~C. De maniere similaire le gène SR-p70 a éte isolé à partir d'une banque préparee avec de l'ADN genomique de la souris black C57.

Une analyse et un séquençage partiel des clones mettent en évidence la p,t:sence de 14 exons avec une structure proche de celle du gene p53 notal~""ent dans la partie centrale ou la taille et le positionnement des exons sont très conserves (Figure 12).
Cette structure a eté definie partiellement chez la souris et chez l'homme A titre d'exemple~ les séquences génomiques humaines du 3' de l'intron 1 de l'exon 2 de l'intron 2 et du ~' de l'exon 3 sont presentees dans la figure 13.

2) 1 oc~lisation chromosomique du gene SP~-p70 chez l'homms Elle a eté réalisée avec de l'ADN du gène SR-70 humain en utilisant la tecl~nique décrite par R. Slim et al. Hum. Genet. 1991 88 21-26. Cinquante mitoses ont été
analysées dont plus de 80% avaient des doubles spots loc~lisés en 1 p3B sur les deux ~ I"or"oso",es et plus particulièrement en 1p36.2 -1p36.3 (Figure 11). L'idenl,ficdlion du chromosome 1 et son orientation sont b~sées sur l'hétérocl~ro" ,aline de la col,sl,iclion seconda;r~. Lesimages ont éte faites sur un ",icroscope Zeiss Axiophot saisies par une ca",é,a CCD refroidie LHESA et traitees par Optilab.

EXEMPLE Vlll A) Mise en cvidellce d'un ARNm codant pour une protéine SR-p7û humaine déduite présentant à lafois une e~ mite N-terminale plus courte et une divergence.

1) Cultures des cPl~Jes IMR-32 fneuruh,'a h~mQ hvmafn) Les cellules ont eté cultivées comms décrit dans ie cdLalogue "catalogue of cell lines and hy~,ido")as, 7th edition 1992" de l'ATCC ~American Type Culture Col'ection).
2) Pr~paration de l'AONc L'ARN est ptépdrb comme décrit dans l'exemple 1.2.a. L'ADNc est pr~:~ua,~ de manière similaire à celle décrite dans l'exemple 1.3 avec ~ ug d'ARN total dans un volume final de 20 ul en uti~isant une amorce poly (T)12 et avec des nucléotides froids. La reaction n'est pas interrompue avec de l'EDTA.

, 3) Amplifcation spécifque de l'AONc SR-P70 parla tecf7nique dite de PC~
- La polymerisation est réalisée avec 2 ul d'ADNc dans 50 ~il final avec le tampon de composition suivant: Tris HCI 50 mM pH 9 2 16 mM (NH4)2 SO4 1 75 mM MgCI2 en presence de DMSO 10% de NTP 0.4 mM de 100 ng de chacune des deux amorces nucléiques et de 3 5 unités du mélange des Taq et PWO polymerases (BoehringerMannheim réf. 1~81 842).
Le couple d'arnorce est de co",po:"lion suivante:
amorce sens: AGGCCGGCGTGGGGAAG (position 16 à 32 Figure6) amorce antisens: CTTGGCGATCTGGCAGTAG (position 503 à 485 Figure 6).

La reaction est réalisée durant 30 cycles à 95~C/30 secondes 58~C/1 minute et 68~C/2 minutes 30 secondes suivi d'un demier cycle de 68~C/10 minutes.
Le produit PCIR est soumis à une élecl,ophG,t:se. sur un gel d'agarose 1% ~tampon T~E). Après coloration au bromure d'ethidium deux bandes majeures sont rcvolca~:une bande d'une taille d'environ 490 pb (taille attendue (voir Figure 63) et une bande supplémentaire d'une taille d'environ 700 pb. Cette demière est extraite du gel à l'aide du kit "geneclean" (Bio 101 réf 1001 400) Apres un dess~lage sur une colonne de polyacrylamide! P10 (Biorad réf 15011050) le r,c,y",enL est soumis à une nouvelle amplificaLion par PCR durant 10 cycles comme décrit ci-dessus 4J Défermination d~ la séq{u~nce d~/ p~duit 3..,-1,'1é
Dans un pr~i-,ier temps le produit PCR est élimine des oligonucléotides sur une colonne de sephac.yl S400 (rl~a""acia 17-0609-01) puis dessalé sur une colonne de P10. La ,eaction de séquençagQ est réalisée à l'aide du kit Applied Biosystems (réf.
401 628) (373 DNA sequencer) avec l'amorce ar,lisens.
La séquence obtenue est identique à la séquence de l'ADNc SR-p70 (exemple 11.4) avec une illse~,iGn de 198 pb entre les posilions 217 et 218 (Figure 14). La séquence protéique N-terminale dédui~e (sequence déno.. ",.ée SR-p70d) est plus courte de 49 acides aminés avec une divergence des 13 premiers acides aminés (sequence ID
N~13). Il y a donc co-existence d'au moins deux t,~r,s- -ils différents SR-p70 comme déja décrit pour la li~3née At r-20 de souris W O 97/28186 PCT~R97/00214 -B) Clonage du SR-p70 humain et mise en evidence d un AF;Nm codant pour une protéine SR-p70 humaine déduite présentant la meme extrémité N-terminale que le SR-p70d et une divergence dans la partie C-~erminale 1 ) Amplification spécifique de l'ADNc du SR-p7~) par la technique dite de PCR

L'amplification a été réalisee comme décrit dans l'EXEMPLE Vlll.A a partir d'ARNpurifié des cellules IMR-32 avec le couple d'amor~es de composition suivante:
amorce sens: GCG GCC ACG ACC GTG AC (position 160 a 176 sequence ID N~ 11) amorce anlisens: GGC AGC rrG GGT CTC TGG (position 1gg3 à 1976 Figure 6).

Après élimination de l'excés d'amorces sur colonne S400 et dess~lage sur colonneP10 1,u1 de l'échantillon est de nouveau soumis a une PCR avec le couple d'arr~orces de composition suivante:
a"~on e sens: TAT CTC GAG CTG TAC GTC GGT GAC CCC
Xho I (posilion 263 à 280 sequence ID
N~ 11) all~Gr~e anlisens: ATA ~CT AGA TCA GTG GAT CTC GGC CTC
Xba I (posi~ion 1943 à 1926 Figure 6).

2) Clonage du produit amplifie dans le plas",i~e pCDNA3 Le produit PCR obtenu en 1) est déssalé sur colonne P10 digéré par les enzymes de resl,i.lion Xho I et Xba 1 puis cloné dans le plas"~i~e pCDNA3 comme décrit dans l'EXEMPLE 11.5 . Deux clones reco,nL,i,)allls sont séquencés a l'aide du kit Applied Biosystems avec les oligonu~-léotides spéciriques de l'ADNc du SR-p70.
La pre~ re séquence obtenue co"espond a la séquence complète de l'ARNm codant pour le SR-p70 décrit dans l'EXEMPLE Vlll.a .ba prPtéine deduite co""uolle 587 acides aminés (séquence ID N~ 13 et Figure 16).
La seconde séquence obtenue est identique à la séquence de 1' ADNc de SR-p70d décrite ci-dessus mais avec deux délétions de 148 pb et de g4 pb entre les positions 1049 et 1050 d'une part et entre les posiliol1s 1188 et 1189 d'autre part (sequence ID
N~ 14 et Figure 15). La sequence protéique déduite de cette seconde séquence revèle une protéine ayant une partie N-terminale plus courte dc 49 acides aminésavec une divergence dans les 13 pre~ e a acides aminés ainsi qu'une divergence de W O 97/28186 PCT~R97/00214 sequence protéique entre les acides amines 350 et 397 (séquence ID N~ 15 et Figure 16) (séquenc:e dénommée SR-p70e). La protéine déduite comporte 506 acides - amines.

C) Mise en evidence d'un ARNm codant pour une protéine SR-p70 humaine deduite presentant une e~lre"~i~e N-terminale plus courte 1~ Culture de~; cellules SK-N-SH (neuroblastome humain) Les cellules sont cultivées comme décrit dans le ~ c atalogue of cell lines and hybridomas 7th edition 1992 ~ de l'ATCC ~American Type Culture Collection).

2) Préparation de l'ADNc et ar"plirication de l'ADNc du SR-p70 par la technique dite de PCR

Ces étapes sont ré~lisées comme décrit dans l'EXEMP~E Vill.A avec le couple d'a" ,or~es de col l Iposilion suivante:
amorce sens: AGG GGA CGC AGC GAA ACC (position 128 à 145 Figure 17) amorce anti sens :GGC AGC l~G GGT CTC TGG (position 1993 à 1976 Figure 6).

Le séquéncage est réalisé avec le kit Applied Biosystem avec des amorces spécifiques de l'ADNc du SR-p70 et revèle deux AONc:
un premier ADNc c~,~s,~ondanl à l'ARNm codant pour le SR-p70a - un second ADNc présentant une délétion de ~8 pb entre les positions 24 et 25 (séquence ID N~ 16 et Figure 15).
Cette déletion cG"~pr~nd l'ATG d'i.,iliaLion de traduction du SR-p70a. La protéine déd-lit~ (déno~"",ée SR-p70f) de ce second ADNc présente un ATG initiateur de traduction en aval correspondant à un ATG inteme du SR-p70a. La protéine déduite COrnpG,le donc: 588 acides aminés (séquence ID N~ 17 et Figure 16) et est tronquée des 48 acides amines N-te""inaux du SR-p70a.

D~ Mise en évk~ence d'un ARNm codant pour le SR-p70b humain.

1) Culture des cellu~es K562 W O 97/28186 PCTn~R97/00214 -Les cellules sont a~ltivees comme décrit dans le "cataloque of cell lines and hybridomas 7 th edition 1992" de l'ATCC (American Type Cylture Clo"~ n) 2) Preparation de l'ADNc amplification de l'ADNc du SR-p70 par la technique dite de 5 PCR et séquençage.

Ces étapes sont réalisées comme décrit dans l'EXEMPLE Vlll C.

Le séquençage revèle deux ADNc:
Un premier ADNc corresponclanl a l'ARNm codant pour le SR-p70a et un second ADNc presentant une déletion de 94 pb entre les posilions 1516 et 1517 (séquenceID N~ 18 et Figure 15). La protéine déduite (dénommée SR-p70b) compo,le 199 acides amines et presente une séquence C-temlinale tronquée de 137 acides aminéspar rapport au SR-p70a avec les 4 de",iers acides aminés divergents (sequence IDN~ 1getFigure21).
Cet ADNc est si",iia.,e à celui décrit dans l'EXEMPI E I relatif au SR-p70b de singe.

~es n~cl~ es décrites dans cet exemple (E)CEMPLE Vlll. A. B. C. et D) mettent enévidence des variants du SR-p70 cGnsé~utifs a des epissages dirr~renl.els de l'ARNm pri",- e L,dns~ par le gène SR-P70.
Le SR-p70a est codé par un ARNm composé de 14 exons (voir EX~:MPLE Vll). C'est la prulO;ae de ,~:fe,~nce. Le SR-p70b est consécutif à une insertion entre les exons 3 et 4 et à l'abseoce des exons 11 et 13. Le SR-p70f est consécutif a l'absence del'exon 2. Cet exe.,.pl2 décrit l'e~.is~ence de variants du SR-p70 de maniere nonexhaustive avec une probabilite forte d'exi~tence d'autres variants. De meme l'exister,ce de ces variants décrits dans cet exemple ainsi que le SR-p70a ne se limite pas aux lignées dans lesque"es ils ont éte mis en évidence. En effet des etudes effect~ées par RT-PCR ont montré que ces variants sont retrouvés dans les diverses lignées ~h~diées 30 De plus la métl~ion;.)e d'i"ilialiGn du SR-p70f correspond à une mell~ion;. Ie inteme du SR-p70a suggérar,~ la possibilité d'ill;.ialio,) en aval sur l'ARNm codant pour le SR-p70a.
y CA 02245242 l998-07-28 W O 97/28186 PCT~R97/00214 EXEMPLE IX
.~
Obtention d'une sequence 5' de l'ARNm SR-P70a humaine.
,t 1) Ampl~ficat,ion de l'extremlt~ de ~'de l'ADNc SR-P70 par PCR
La culture cellulaire et le~ préparabons d'ARN total et d'ADNc sont ré~lisees comme décrit dans l'EXEMPLE \/111.1 et 2. La matrice ARN est hydrolysée par incubation 5 minutes à 65~C apres adion~ l,on de 4 IJI EDTA 500 mM et 4 ul NaOH 2N.
l~ L'echantillon est ensuite dessalé sur ~'~nne P10. L'ADNc est aliongé en 3' avec une "queue" de dG comme décrit dsns l'EXEMPLE 1.3.d dans un volume final de 40 1~1.
Après adjonction de 4 ,ul EDTA 500 mM et 4 ~I NaOI ! 2N I'ADNc est incubé à 65~Cpendant 3 minutes puis dessale sur une colonne P10. L'al"plitication par PCR estrealisee comrne decrit dans l'EXEMPLE V111.3 avec 8 ul d'ADNc et durant 3û cycles avec le couple d'a",orces de CG"~pOSiliOn suivante amorcesens: CCCCCCCCCCCCCCN(oùNestégalaGAouT) amorce anlise:ns: CCATCAGCTCCAGGCTCTC (posilion 1167 à 1149 Figure 6).
Apres élir"inalion de l'exces d'amGI~l_es sur colonne S400 et dessalage sur colonne P10 1 ul de l'écl~dnlillon est de nouveau soumis à un PCR avec le couple de composition suivante:
amorcesens: CCCCCCCCCCCCCCN
amorce antisens: CCAGGACAGGCGCAGATG (posiiion 928 à 911 Figure6).
L'echantillon de nouveau passé sur une ~ nne S400 et une cotonne P10 est soumis à une ltoisie,ne a."plitic~ioo durant 20 cycles avec le couple suivant:
a~Gr~esens: CCCCCCCCCCCCCCCN
a-"or~e antisens: CTTGGCGATCTGGCAGTAG (position 503 à 485 Figure 6).
2) Déte""i,)at,on de la séquence 5'ADNc SR-P70 La sequence est realisée comme décrit dans l'EXEMPLE V111.4). Cette séquence fait apparaître un 5' non codant d'au moins 237 bases en amont de l'A~G d'initiation du SR-p70a (Figure 17). Par co",pa,disor- de cette séquence (obtenue à partir de lalignée IMR-32) avec celle obtenue ~ partir de la lignée HT-29 notamment (Figure 6) deux differences ponrtuel'es (Figure 17 : voir caracteres gras) sont mises en { évidence (G -~ ~ et C ~ T) respecthement positionné a -20 et -30 de l'ATG

CA 02245242 l998-07-28 d'initiation du SR-p70a (Figures 6 et 17). Cette variabilité est Situee au niveau de l'exon 2 (Figure 13). Il n'est pas exclu que cette variabilité se retrouve egalement a l'intérieur d'une phase codante consécutivement à un épissage alternatif comme decrit dans les EXEMPLES lll che~ la souris et Vlll chez l'homme ou bien consécutivement à une initiation de la traduction sur un CTG (comme cela a eté
demontré pour le FGFb (Proc. Natl. Acad. Sci USA. 1989 86 1836 - 1840).
De meme il n'est pas exclu que cette variabilité ait une i""~licalion sur la traduction du SR-p70 ou sur l'épissage de i'ARN primaire.
En tout etat de cause cette variabilité, probablement d'origine ~lielique peut servir de marqueur soit au niveau gér,o",;que (voir EXEMPLE Xl) soit au niveau de l'ARNm (voir EXEMPLE X).

EXEMPLE X
1) Analyse par PCR, de t'expression transc~iplionnelle du SR-P70a dans les échantillons ce/lulaires (RT- PCRJ
Les cultures cellulaires (SK-N-AS SK-N-MC ItT-29 U-373MG SW480 IMR-32 CHP212) sont re~';~ees comme d~crit dans l'exemple Vl.1.a (reférées au caldlo~ue~'catalogue of cell lines and hy~ndo",as 7th edition" 19~2 de l'ATCC).
La prepardliG" de l'ADNc et l'a"lptifi~al,on par PCR sont ré-' ~é~s comme decrit dans I'exemple Vl11.2 et 3 Le couple d'amorce utilisé est de c~",~osili~n suivante:
amorce sens: AGGG~iACGCAGCGAAACC (posilion 128 à 14~ Figure 17) a",o"_e antisens: GGCAGCrrGG~ ; I C I ~G (posiLion 1Q93 à 1976 Figure 6).
Les écl~anlillons sont analysés par élecl~pho~se sur un gel d'agarose 1% et 25 revelation au Bromure d'éthidium (Figure 18).

La taille de la bande obtenue dans les é~l,anlil;ons correspond à la taille attendue (environ 2 kb Figures 6 et 17). L'intensilé des bandes obtenues est reproduetible.
Une réa""~liticalion de 1 ~I de l'écl~anlillon dans les mêmes corldilions durant 20 30 cycles fait appaidil,~ une bande dans chacun des e~_lldnlillGIls.

2) Déte""ina~ion de la séc~uence des prod~ its amplif~s Apres passage des échantillons sur colonnes S400 et P10 le séquençaS~e est réalisé
sur le séquenceur 373 de Applied Biosystems avec le kit de reférence 401 628. Les 35 amorces ~n~ séeS sont entre autres les suivantes:
-CA 02245242 l998-07-28 PCT~R97/00214 position figure AGGGGACGCAGCGAAACC 128à 145 22 CTTGGCGA1-CTGGCAGTAG 503 à 485 6 GATGAGGTGGCTGGCTGGA 677 à659 6 CCATCAGCTCCAGGCTCTC 1167 à 1149 6 TGGTCAGG1~CTGCAGGTG 1605 à 1587 6 GGCAGCTTCiGGTCTCTGG 1993 à 1976 6 Aucune différence protéique du SR-p70a n'a été décelée. Cependant, les séquencesobtenues fon1: appa,dîL~e une double vafiabiliLe aux positions -20 et -30 en amont de I'ATG d'iniLia~iGn du SR-p70a (Figures ~i et 17). Cette variabilite, probablement d'origine allélique, permet de définir deux classes de l,dnsc.il~: une première ctasse présentant un G à la position -30 et un C à la position -20 (classe G-30/C-20) et une seconde classie présentan~ une différence aux deux posilions: un A en -30 et un T en -20 (classe A-30, T-20) Prel"iere classe: SK-N-AS, SK-N-MC, Itt-29, U-373MG, SW480.
Deuxième classe: IMR-32, CHP212.

EXEMPLE Xl Méthode d'analyse pour la détermination de la répartition allélique du gène SR-p70 dans un échantillonnage de 10 pe,~on"es~

Cette ,t:pa,lilic,n "~ 9 est basée sur la vd,iabililé allélique mise en evidence dans 2~ les exe,r ,r ' 25IX et X:
~ Allèle G-30l'C-20 présentant respectivement un G et un C aux positions -3Q et -20 en amont d~ l'ATG .I iniLi3tion du SR-p70a ~ All~le A-30/T-20 présentant respectivement un A et un T aux mêmes posilions Cette va,;ab;lit~ pe~t être mise en évidence par l'u 'i~ ?tion d'enzymes de, e~l, iclion 3~ dirre,er)cianl les deux allèles (Figure 13) A titre d'exemple:
~ Enzyme Bpl I prese"lant un site de coupure uniquement sur l'allèle G-30/C-20 dans la zone ~'intéfbt(CQ site englobe les deux posiLions variables).
Enzyme Styl prése"lant un site de coupure uniquement sur l'allele A-30/T-20 dansla zone d'i"te,el 3~

PCT~FR97/00214 .
I) Amplifcafion génomique de l'exon 2 parPCR
La reaction de polymerisation est realisée avec 500 ng d'ADN genomique purifié
dans 50 ~ul final avec les conditions décrites dans l'exemple Vl11.3.
Le couple d'amorces est de composition suivante:

amorce sens: CACCTACTCCAGGGATGC (position 1 a 18 Figure 13) amorce antisens: AGGAAAATAGAAGCGTCAGTC (position 833 à 813 Figure 13).

La réaction est réalisée durant 30 cycles comme decrit dans l'EXEMPLE Vl11.3.
10 Après élimination de l'excès d'amorce sur une colonne S400 et dess~ e sur une colollne de P10 1 ~I de l'écha,l "~n est a",plirié de nouveau durant 25 cycles dans les memes condilions avec le couple d'amorces suivant:

amorce sens: CAGGCCCACrrGCCTGCC (position 25 à 32 Figure.13) amorce antisens: CTG~CCCCAAGCTGATGAG (position 506 à 488 Figure 13).

Les produits a""~liries sont soumis à une éle-_L-uphor~se sur un gel d'agarose 1%
(Figure 19-A).
2) Digestion par/'enzyme d~ "~ n Styl Les échantillons sont au preatabte des~~'es sur une colonne P10 puis digérés parl'enzyme de re~l.i. liol) Styl (BRL 15442-015) dans le la,."~o,- de c~ poci~ion suivant:
Tris HCI pH 8 50 mM NaCI 100 mM MgCI2 10 mM à 37~C pendant 30 mn. Les produits de ~lige,~ion sont analysés par électrophorèse sur un ge~ d'agarose 1%
2~ (~a."pon TAE) La rév~i~tion est réalisee par ccl3ralion au bromure d'ethidium (Figure ~9-B~.

Une bande de 482 paires de bases cara~ lense l'allele G-30/C-20 ~Figures 13 et 19).
La prese.~c~ d'une bande de 376 paires de bases et d'une bande de 106 paires de bases c~,a- lé~isenl l'allèle A-301T-20 (allèle présenla,-L un site de coupure Styl).
Sur l'echanl,llonnage de 10 pe,aonnes, 2 pe~so"nes presentent les allèles G-30/C-20 et A-30/T-20 les 8 autres personnes étant homozygotes avec l'allèle G-30/C-20.
I 'étude d'un nouvel é~l~anlillonnage de 9 personnes a mis en évidence 3 personnes hétérozy~otes présenlan~ les allèles G-30/C-20 et A-30/T-20 les 6 autres personnes etanthomozygotes pourl'allele G-30/C-20.

W O 97/28186 PCT~R97/00214 .

EXEMPLE Xll Test de re~ve3rsion de transfol",alion de la lignée SK-N-AS par lld.~sfe~lion avec I~ADNc SR-p70.

Le vecteur d'expression utilisé est décrit dans l'EXEMPLE 11.5 et schématisé dans la figure 15. La méthode utilisée est celle dite du phosphate de calcium décrite par Graham et al. (Virology 1973, ~4, 2, 536-539). La lignée est ensemencee à raison de 5.105 cellules par bolte de 6 cm de dia"~elre dans 5 ml du milieu décrit dans l'exemple l 1.. Les cel'~ s sont mises en culture à 37~C et à ~% de CO2 pendant une nuit. Le milieu de transr~~i~n est preparé de la ",anièrt: suivante: le mélange suivant est réalise~ en ajoutant dans l'ordre 1 ml de tampon HERS (NaCI 8 mg/ml, KCI 370,ug/ml, Na2HP04-2H20 t25 ,ug/ml, De~l,ose 1 mg/ml, Hepes pH 7,05 5 mg/ml), 10 ~ug du plasmide àl transfecter et 50 lul CaC12 2,5 M aiouté goutte à goutte. Le milieu de transfection est laissé 30 mn à température a",bi~-)te puis ajouté goutte a goutte sur le milieu conte''nu dans la boite de culture. Les cellu'es sont incubées S à 6 heures à
37~ C/5% CO2. Apres aspi.dlio., du milieu, 5 ml de miiieu frais contenant ~% de sérum du bovin foetal sont ajoutés Après 48 heures à 37~ C/5% C02, les cellules sont rincées avec du P~3S, décollées par try,~,~i"isaliol-, diluées dans 10 ml de milieu de culture (5% sérum de bovin foetal) e~t étalées dans une boîte de 10 cm de ~lid,,,è~l~
(la dilution peut être ajust~e en fon~,lion de~ l'erricacile de t,d"sreclion). Apres une nouvelle incuhation durant 10 heures (le temps que les ~ e"L~les adhèrent), les cellules sont pass~es en 5eIeCl;GII paradjonction de3 G418 à la conce~,l,dlion finale de 600 l~g/ml équivalent génélic;ne durant 15 à 21 jours (le milieu est changé tous les 30urs).
Les clones obtenus sont alors rincés au PBSI fixés a l'éthanol 70%, séchés, colores avec 1 % de cristal violet, puis comp~-~hil;sés.
Quatre lldl~sreeliol)s plas",;diq.les ont été ré~lisées en double:
- pld~"~;de pCDNA3 sans insert plas"L:~e pCDNA3/SR-p70 contendnl l'ADNc- SR-P70a humaine - plasmide pCDNA3/SR-p70 Mut conLenal,t l'ADNc - SR-p70a présentant une mutation a la posilion 293 AA (R ~ H) qui est analogue à la mutation 273 (R -H~ dans le domaine de fixation à l'ADN de la p53 - témoin sans plasmide.
3~
Le résultat est e~xprimé en no")bre de clones par boîte.

W O 97/28186 PCT~FR97/00214 Expérience 1Expérience 2Moyenne pCDNA3 172 353 262 pCDNA3 / SR-p70 13 8 10 pCDNA3 / SR-p70 mut 92 87 89 Absence de pta~"l:de 1 3 2 Le nombre de clones obtenu par transfection avec le plasmide pCDNA3/SR-p70 est 10 de 25 fois inférieur au nombre de clones obtenu avec le témoin pCDNA3 et de 9 fois inférieur au nombre de clones obtenu avec le pcDNA3/SR-p70 Mut indiquant une mortalité ou un arrêt de division cell~ des cellules transfectees par l'ADNc SR-p70. Ce resultat n'est pas la conséquenc~ d'une toxicité au vue des clones obtenus avec l'ADNc SR-p70 mute mais probablement d'une apoplose comme cela a été
démontré pour la protéine p53 (Koshland et al. Sciences 1 9g3 262 1953~1981).

EXEMP~E Xlil Role biologique de la pfuLei.. e SR-p70.
L'homologie de structure entre le domaine de fixation à l'ADN de la p53 et la région centrale de la p,ula;ne SR-p70 permet .I'interer que la SR-p70 est un facteur delldnsc,i~tion (cf Figures 1 et 2). En effet la p53 (393 acides aminés) est constituee de Flusie ~rs don,~i"es fonclionl~els. La région N-terminale (1-91 acides aminés) est i"irli~ lée dans l'activation de la l,ansc,ipLion et conlienl des sites d'interaction à
dirter~r)les proteines cellulaires et virales. La partie centrale (acides amines 92 a 292) permet la fixation aux séquences d'ADN spéciriques situés dans les régions p,.~n~olnces de ce.la;ns gènes (la ",ajo,i~e des mutations ponc~e"es inactivant la p53 sont loc~isées dans cette region) elle présente également de nombreux sites d'interaction avec des proteines viralQs qui inhibent son activité. Enfin les 1 û0 derniers acides aminés de la p53 sont responsables de son oligomérisation ainsi que de la régulation de cell~ci ~Hainaut P. Current Opinion in Oncology 1995 7 76-82;
ProkocimerM Blood 1994 84n~8 2391-2411).
L'ho",ol~ ~, o de séquence entre p53 et SR-p70 est sig,.irirali.~e nola",."ent en ce qui conce",e les acides aminés i",pl.lués directement dans l'interaction à l'ADN
suggérant que la SR-p70 se fixe aux sites p53 sur l'ADN. Ces acides aminés =

CA 02245242 l998-07-28 W O 97/28186 PCT~R97/00214 .. 3g correspondent très exactement à ce qu'on zppelle les 'hot spot~, acides amines frequemment mutés dans les tumeurs humaines (SWiSS PROT: SW: P53_human et - Prokocimer M., Blood, 1994, 84 n~8, 2391-2411). De cette homologie, on peut déduire que la protéine SR-p70 exerce un contrôle sur l'activité des genes regules par la p53, 5 soit indépendamment de celle-ci soit en formant des hétérooligomères avec cette dernière.
En consequence, à l'instar de la p53, les produits du gène SR-p70 doivent être impliqués dans le contrôle et la régulatlon du cycle cellulaire provoquant des arrêts du cycle (",G",entanés ou définitifs), et la mise en oeuvre de programmes tels que: la réparation de I'ADN, la dirréren~ialion ou la mort cellulaire. L'existence d'activités 'p53-like" avait été fortement préssentie avec la mise en évidence chez les souris p53~/~, d'activités de réparation de l'ADN et de mort cellulaire en réponse aux radiations ionisantes (Strasser et al., Cell, 1994, 79, 329-339). Les auteurs de la présente invention ont localisé le gene SR-p70 humain dans la ré~ion télomériqtle du bras court du chromosome 1, précisément en 1 p36.2-36.3, la plus petite region délétée (SRO) commune à une "~aio,il~ de neu,oblasLomes et d'autres types de tumeurs (mélanomes et c~f~inollles) (White et al., PNAS, 1995, 92, 5520-5~24).
Cette region de perte d'hetérozygotie (LOH) délimite le locus d'un gene suppresseur de tumeur dc)nt la perte d'activité serait la cause de la formation des tumeurs. Il est i",po,lant de ,appeler que cette ré~ion est également sujet~e à "I'empr~i.,le maternelle"; I'alièle ")alel"el est pre(ér~:nliellement perdu dans les neuroblastomes présentant la délétion 1p36 (sans al"pl;rica~ion de N-Myc) (Caron et a/., Hum. Mol.
Gen., 19g5, 4, 535-539) Le gene sauvage SR-p70 introduit et exprimé dans des cell~es de neu,ùbl~s~me permet la réversion de leur transro""ation. La perte de cette activit~ anti-Gnco9én ~ ~e est donc aCsGr é~ au développement de la tumeur. La région 1 p36 pr~,senta une hGr, .a I ~ie syngénique avec le segment distal du cl~ro,noso.)~e 4 de souris. Dans cette ré~ion a été lo~-' se le gene curfy tail (cf) (Beier e?t al., Mal,lll,alian Genome, 1995, 6, 269-272) illl, 'i-~ué dans les ~llalro""aLions congénitales du tube neural (MTN: spida bifda, anencephalie...). La souris ct est le meilleur modèle animal d'étude de ces ,-,~lto,ll~alions. Il est admis que ces ,ualrulllld~iGnsl résultent d'ano,ll~';es de la prolifération cellulaire Compte tenu de la nature du gene SR-p70 et de sa loc~isation chrumosG-"i~ue, une des hypothèses est que le SR-p70 pourrait être l'hGIll~,~c~, le humain de ct et qu'à ce titre, la détection des mutations precoces et les ano",alies ~_hlur~ûsollliques concemant ce gene devraient permettre par exemple comme applicaUûn, I'idenli(ication des personnes à risques(0,5-1 % des nouveaux-nes atteints par MTN), et la mise en oeuvre de traitements préventffs (Neumann et al. Nature Genetics 1994 6 357-362; Di Vinci et a/. Int. J.
Cancer 1994 59 422-426; Moll etal., PNAS 1995 92~ 4407-4411; Chen et a/., Development 1995 121, 681-691).

EXEMPLE XIV

Etude allelique du gène SR-p70.
Les allèles GC et AT sont identifiés aisé"~ent par ~eslliction Styl des produits PCR de l'exon 2 (voir exemple Xl). On a donc pu determiner ainsi chez des individus héterozygotes GC/AT et porteurs de tumeurs neuroblastomes I'allète SR-p70 perdu (GC ou AT) et cela malgré la présence de tissu contaminant sain.
D'une façon su",renanla lorsque la même analyse est realisée sur l'ARN ur~ seul allèle est mis en évidence indépenda"""enL de presence ou non d'une délétion et plus surprenant encore malgre la présence de tissu sain. Cela suggère que l'empreinte (expression dirrer~:"lielles des deux allèles) exislerait également dans le tissu conldl"inant.
Pour le vérifier on a répété la même analyse sur de l'ARN provenant des celiulessanguines d'individus sains hétérozygotes GC/A~. Un seul des deux types de Lrdns~
a éte détecté e~'en,ent dans ces cel~ Qs Ce résultat confirme l'observation faite sur les échant;lloos tumoraux quant à l'exisLence d'une el"~)r inLe genétique gé"ér-' ~é~
pour le gene SR-p70.
Les il~,ulicalions de cette découverte sont i,ll~Gildl,las puisqu'elle permet de postuler 25 qu'une seule mutation sporadique inactivant l'allèle actif SR-p70 entraînera une perte d'activité et ceta poLe,~e'le."-~nt dans tous les tissus.
L'aLsence de dG"nees precises sur la fonclion b'o'ogique SR-p70 ne permet pas demesurer les cGnsé~.Jences de cette perte d'activité SR-p70 pour la cellule.
N~anrl,G;.,s sa forte homologie avec la pr~,t8;ne suppr~sseur de tumeur p53 ainsi 30 que la d~n,onal,dti~n que la SR-p70 est un facteur de transcription C:~p~ Q d'utiliser le ,c,o",oLaur P21~ suggère un rôle de cette proteine dans le contrôle d ~ cyrlecellu' 1ire et dans la dirré, ~ncialio"
Knudson and Meadows 1980 (New Eng. J. Med. 302 :1254-56) considèrent les neu,ohl~sl~r"es IV-S comme une collectidn de cellules non m~lig~es de la crête 35 neurale portant une mutation qui i,lLe,rare avec leur clitré,~:ncaLion normale.

CA 02245242 l998-07-28 W O 97/28186 PCTA~R97/00214 Il est concevable que la perte d'activité SR-p70 tout comrne la perte du contrôle p53 sur le cycle cellulaire favorise l'apparition d'anomalies cellulaires telles quel'aneuploïdie I'amplification (décrites dans le cas des neu~o~ lu",es) et d'autres remaniements génétiques pouvant provoquer la transron"aLion cellulaire (Livingstone et al. 19~2 Cell 71 :923-25; Yin et al. 1992 Cell 72 :937-48; Cross et al. 1995 Science 267 :1353-!~i6; Fukasawa et al. 1996 science 271 :1744-47). Les neuroblastomes pourraient donc provenir à leur origine d'une perte d'activite temporaire ou definitive de la SR-p70, favorisant ainsi l'~pparilion d'evenements oncogénique's et donc la proy,~:ssion tumorale.
t o Dans le cas de la deiétion constitutionnelle 1 p36 décrite par Biegel et al 1993 (Am. J.
Hum. Genet. 52 :176-82),il y a bien app~.ilio" de neuroblastome IV-S et le gène concerné est NBS-1 (SR-p70).
En conclusion ce qui est décrit pour les neuroblastomes pourrait ê galement s'appliquer a d'autres types de tumeurs notamment ceux aCso~:es à des ,~n,anie,l,enls de l'e~cl,izr"ile du bras court du ~ ulllosollle 1 (report 2 illte"~a~iGnal workshop on human chr 1 mapping 1995 Cytogenetics and Cell Genet. 72 :113-154).
Sur un plan i:hérapeutique l'i"")li~ on de la SR-p70 dans l'appa,ilion de tumeurs devrait conduire à éviter l'u1;~:5-f;on d'agents mul~èries en Cl1i"~ioll~erapie compte tenu des risques de t,dnsfo""alion cellulaire par ces produits et leur preférer des su~sldnces non mutagènes qui stimulent la différenc;alion.
D'autre part la frequence d'app~ ion des allèles GC et AT est la suivante: dans la pop~ tion Frequence(AT)=0. 15 et sur un echanlillon de 25 patients (neurohl-sto",es) F(AT)=0.30. Ces s~lisli.~ues indiquent qùe l'allèle AT pourrait être un facteur de p,e~;spo~;~;on.

WO 97t28186 42 PCTAFR97/00214 LISTE DE SEQ~ENCES

(1) INFORMATION GENERALE:
(i) DEPOSANT:
(A) NOM: sanofi (B) RUE: 32-34 rue Marbeuf (C) vILLE: PARIS
(E) PAYS: FRANCE
(F) CODE POSTAL: 75008 (G) TELEPHONE: 01 53 77 40 00 (H) TELECOPIE: 01 53 17 41 33 (ii) TITRE DE L' INVENTION: SR-p70 (iii) NOMBRE DE SEQUENCEs: 40 (iv) FORME LISIBLE PAR ORDINATEUR:
(A) TYPE DE SUPPORT: Floppy di3k (B) ORDINATEUR: IBM PC compatible (C) SYSTEM~ D' EXPLOITATION: PC-DOS/MS-DOS
(D) LOGICIEL: PatentIn Release #1.0, Version #1.25 (OEB) (2) INFORMATION POUR LA SEQ ID NO: 1:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 2874 paire~ de ba~e~
(B) TYPE: acide nucléique (C) NOMBRE DE BRINS: double (D) CONFIGURATION: l; n~; re (ii) TYPE DE MOLECULE: ADNC
(vi) ORIGINE:
(A) ORGANISME: Cebu~ apella (ix) CARACTERISTIQUE ADDITIONELLE:
(A) NOM/CLE: CDS
(B) EMPLACEMENT: 156..2066 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1:
TGCCTCCCCG CCCGCGCACC CGCCCC~-~GG C~l~.~ ,CC TGCGA~GGGG ACGCAGCGAA 60 GCCGGGGCCC GCGCCAGGCC GGCCGG~ACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 AGAGCGAGCT GCC~lCG~AG GCcG~.~.~ GGAAG ATG GCC CAG TCC ACC ACC 173 Met Ala Gln Ser Thr Thr Thr Ser Pro A~p Gly Gly Thr Thr Phe Glu Hi~ Leu Trp Ser Ser Leu Glu Pro A~p Ser Thr Tyr Phe A~p Leu Pro Gln Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr A-~p Ser Ser Met A3p Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe Asn Leu Leu ser Ser Thr Met A~p Gln Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr CA 0224~242 1998-07-28 W O 97/28186 ~3 PCT~R97/00214 CCG GAG CAC GCC GCC AGC GTG CcC ACC cAT TCA cCC TAC GCA CAG CcC 461 Pro Glu Hi~ Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gln Pro AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC ccC TCc AAC S 09 Ser Ser Thr Phe P.~p Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn ACC GAC TAT CCC G:GA CCC CAC CAC TTC GAG GTC ACT TTC cAG CAG TCC S57 Thr Asp Tyr Pro Gly Pro EIi~ His Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Ly~ Lys 135 140 145 lS0 Leu Tyr Cys Gln Ile Ala Lys Thr cy9 Pro Ile Gln Ile Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Lys AAG GcG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 749 LyY Ala Glu Hi~ Val Thr Asp Ile Val Lys Arg cy~ Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser His Leu Ile Arg Val Glu Gly Asn Asn Leu Ser Gln Tyr Val A~p Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr Aqn Phe Met Cy~ Asn Ser Ser Cys GTG GGG GGC ATG AAC CGA CG& CCC ATC CTC ATC ATC ATC ACC CTG GAG 989 Val Gly Gly Met A3n Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Thr Arg Aqp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile CyY Ala Cys Pro Gly Arg A~p Arg Ly~ Ala A-lp Glu A~p Hi C Tyr Arg Glu Gln Gln Ala Leu A~n Glu Ser Ser Ala Ly~ A~n Gly Ala Ala Ser Lys Arg Ala Phe Lys Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Pro Gly Val Ly!l Lys Arg Arg Hi~ Gly Asp Glu A~p Thr Tyr Tyr Leu Gln GTG CGA GGC CGC GA~ AAC TTC G~G ATC CTG ATG AAG CTG AAG GAG AGC 1277 Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Ly~ Leu Ly~ Glu Ser CA 0224~242 1998-07-28 W O 97/28186 1~ PCT~F~97/00214 LeU Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val Asp Ser Tyr ALg 375 380 38~ 390 Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser His Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met A~n Ly~ Val Hi~ Gly Gly Val Asn 410 ~15 420 A~G CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 1469 Ly~ Leu Pro Ser Val Asn Gln Leu Val Gly Gln Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly ser Gly Met Leu Asn AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC lS65 A~n Hi.~ Gly Hia Ala Val Pro Ala A~n Ser Glu Met Thr Ser Ser Hi~

Gly Thr Gln Ser Met Val Ser Gly Ser Hi~ Cy~ Thr Pro Pro Pro Pro Tyr Hls Ala A~p Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cy~

Pro A~n CyY Ile Glu Tyr Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr Hi~ Leu Gln A~n Leu Thr Ile Glu A p Leu Gly Ala Leu Ly~ Ile Pro Glu Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Asp Leu Ly~ Gln Gly Hi.~ A~p Tyr Gly Ala Ala Ala Gln Gln Leu Leu Arg Ser Ser A~n Ala Ala Ala Ile Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln Arg Val Met Glu Ala Val Hi~ Phe Arg Val Arg Hi3 Thr Ile Thr Ile Pro A~n Arg Gly Gly Pro Gly Ala Gly Pro A~p Glu Trp Ala Asp Phe Gly Phe A~p Leu Pro A~p Cy-~ Ly~ Ala Arg Lys Gln Pro Ile Ly~ Glu Glu Phe Thr Glu Ala Glu Ile Hi~

CACCGCCCAG AGACCCAGGC CGCCTCGCTC LC~l L~l~'l GTCCAAAACT ~C~CCGGAG 2156 GCAGGGCCTC CAGGC.~LGC CCGGGGAAAG GCAAGGTCCG GCCCATGCCC CGGCACCTCA 2216 -CA 02245242 l998-07-28 W O 97/28186 45 PCT~R97/00214 CCGGCCCC~G GAGAGGCCCA GCCACCAAAG CCGCCTGCGG ACAGCCTGAG TCACCTGCAG 2276 CCTCCAGGCC TCATCCTAGA GACTC~GTCA TCTGCCGATC AAGCAAGGTC CTTCCAGAGG 2456 AGAGTGGTGA GCAGCCA~GC GACTGTGTCT GAAACACCGT GCATTTTCAG GGAATGTccc 2576 ATTCTGCGGG ACCGCCTCCT TCCTGCCCCT AACAACCACC AAA~l~lLGC TGAAATTGGA 2696 AGTGCCCCTC AGCCTGGCCA CAGTCACCTC TC~LLG~A ACCCTGGGCA GAAAGGGACA 2816 GCCTGTCCTT AGAGGACCGG AAATTGTCAA TATTTGATAA AATGATACCC ~IlL~lAC 2874 (2) INFORMATION POUR LA SEQ ID NO: 2:
(i) CARACTLRISTIQUES DE LA SEQUENCE:
~A) LONGUEUR: 637 acides aminés (B) TYPE: acide aminé
(D) COr~FIGURATION: linéaire (ii) TYPE DE MOLECULE: protéine (xi) D~SCRIPI'ION D~ LA SEQUENC~: SEQ ID NO: 2:
Met Ala Gln ser I'hr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu ~ S 10 15 ~is Leu Trp Ser Ser Leu Glu Pro A~p Ser Thr Tyr Phe A~p Leu Pro Gln Ser Ser Arg Gly Asn A~n Glu Val Val Gly Gly Thr A~p Ser Ser Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe Asn Leu Leu Ser Ser Thr Met Asp Gln Met Ser Ser Arg Ala Ala ~er Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His ~er Pro Tyr Ala Gln Pro Ser Ser Thr Phe A~p Thr Met Ser Pro Ala Pro Val Ile Pro Ser A~n Thr A~p Tyr Pro Gly Pro Hi~ His Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Ly~ Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Ly Lys Leu Tyr Cy~ Gln Ile Ala Lys Thr Cys Pro ~le Gln Ile Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala Ile Arg ~la Met Pro Val Tyr Ly~ Ly~ Ala Glu Hi~ Val Thr Asp Ile Val Lys 180 185 ~ 190 Arg Cy~ Pro Asn His Glu Leu Gly Arg Asp Phe A-~n Glu Gly Gln Ser CA 0224~242 l998-07-28 W O 97/28186 46 PCTAFR97/0~214 Ala Pro Ala Ser His Leu Ile Arg Val Glu Gly Asn Asn Leu Ser Gln Tyr Val Asp Asp Pro Val Thr Gly Arg Gln ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu ehe Thr Thr Ile Leu Tyr Asn Phe 2g5 250 255 Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Thr Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cy~ Pro Gly Arg Asp Arg Lys Ala A3p Glu Asp His Tyr Arg Glu Gln Gln Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lya Arg Ala Phe Lys Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 340 345 3~0 Asp Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu A.~n Phe Glu Ile Leu Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val Asp Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser Hi3 Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Ly3 Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gln Leu Val Gly Gln Pro Pro Pro Hi~ ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly ser Gly Met Leu AYn A~n Hiq Gly Hi~ Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser Hia Gly Thr Gln Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro Tyr Hi~ Ala A!~p Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cya Pro Asn Cya Ile G1U Tyr Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr Hi~ Leu Gln Aan Leu Thr Ile Glu Asp Leu Gly Ala Leu Lys Ile Pro G u Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Asp Leu Lys G n Gly Hi~ Asp Tyr Gly Ala ~la Ala Gln Gln Leu Leu Arg Ser Ser Asn Ala Ala Ala Ile Ser Ile Gly Gly Ser Gly r Glu Leu Gln Arg Gln Arg Val Met Glu Ala Val His Phe Arg Val Arg HiY Thr Ile Thr Ile Pro Asn Arg Gly Gly Pro Gly Ala Gly Pro Asp Glu Trp Ala Asp ehe Gly Phe Asp Leu Pro Asp Cy~ Ly~ Ala Arg Ly3 Gln Pro Ile Lys Glu Glu Phe Thr Glu Ala Glu Ile His (2) INFORMATION POUR LA SEQ ID NO: 3:
(i) CARACTERISTIQUES DE LA S~QU~NCE:.
(A) LOI~GUEUR: 2034 paire~ de bases (B) TYPE: acide nucleique (C) NO2~RE DE BRINS: double (D) CONFIGURATION: linéalrc (ii) TYPE DE MOL~CULE: ADNc (vi) ORIGINE:
(A) ORGANISME: Cebus apella (ix) CARACTEP~ISTIQUE ADDITIONELLE:
(A) NOM/CLE: CDS
(B) EMPLACEMENT: 156..1652 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3:
TGCCTCCCCG CCCGCG~.CC CGCCCCGAGG C - L~1~1CC TGCGAAGGGG ACGCAGCGAA 60 GCCGGGGCCC GCGCCA.GGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 AGAGCGAGCT GCCCTCGGAG GCCG~l~A GGAAG ATG GCC CAG TCC ACC ACC 173 Met Ala Gln Ser Thr Thr Thr Ser Pro A~p Gly Gly Thr Thr Phe Glu Hi~ Leu Trp Ser Ser Leu Glu Pro A~p Ser Thr Tyr Phe Asp Leu Pro Gln Ser Ser Arg Gly Asn A~n Glu Val Val Gly Gly Thr A~p Ser Ser Met A~p Val Phe Hi~ Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe A~n Le~ Leu Ser Ser Thr Met A~p Gln M~t Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro Glu Hi~ Ala A].a Ser Val Pro Thr His Ser Pro Tyr Ala Gln Pro AGC TCC ACC TTC G~-C ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 509 Ser Ser Thr Phe A~p Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn ACC GAC TAT CCC G~A CCC CAC CAC TTC GAG GTC ACT TTC CAG CAG TCC 557 Thr A~p Tyr Pro Gly Pro His Hi~ Phe Glu Val Thr Phe Gln Gln Ser CA 0224~242 1998-07-28 W O 97/28186 48 PCT~FR97/00214 Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys 135 140 ' 145 150 Leu Tyr Cy~ Gln Ile Ala Lys Thr Cy~ Pro Ile Gln Ile Lys Val ser Ala Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Ile Val Lys Arg Cy9 Pro Asn Hi~ Glu Leu Gly Arg Asp Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser His Leu Ile Arg Val Glu Gly Aqn Asn Leu Ser Gln Tyr Val Asp A~p Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr A~n Phe Met Cy3 Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Thr Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile 280 285 29~

Cys Ala Cyq Pro Gly Arg Asp Arg Ly~ Ala A~p Glu A3p His Tyr Arg Glu Gln Gln Ala Leu A n Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Ly Gln ser Pro Pro Ala Val Pro Ala Leu Gly Pro Gly Val Lyq Ly~ Arg Arg Hi~ Gly A-~p Glu A:sp Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu A~n Phe Glu Ile Leu Met Lys Leu Ly3 Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val A~p Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser Hi~ Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val A~n WO 97/28186 PCTrFR97/00214 Lys Leu Pro Ser Val Asn Gln Leu Val Gly Gln Pro Pro Pro His Ser 425 430 . 435 ser Ala Ala Thr Pro A~n Leu Gly Pro Val Gly Ser Gly Met Leu A~n AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC cAC 1565 Asn Hi~ Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His Gly Thr Gln ser Met Val ser Gly Ser Hi~ Cys Thr Pro Pro Pro Pro Tyr Hls Ala Asp Pro Ser Leu Val Arg Thr Trp Gly Pro CGGCGCCGCC GCGCAGCAGC TGCTCCGCTC CAGCAACGCG GCCGCCATTT CCATCG&CGG 1782 CGAGATCCAC TGAGGG~GCCG GGCCCAGCCA GAGCCTGTGC CACCGCCCAG AGACCCAGGC 2022 (2) IW~ORMATION }'OUR LA SEQ ID NO: 4:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 499 acide-~ aminé3 (B) TYPE: acide amin~
(D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: protéin¢
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4:
Met Ala Gln Ser Thr Thr Thr Ser Pro A~p Gly Gly Thr Thr Phe Glu ~iY Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe A~p Leu Pro Gln Ser Ser Arg G.ly A~n A~n Glu Val Val Gly Gly Thr A~p Ser Ser Met A~p Val Phe H.ia Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe A~n Leu Leu ser Ser Thr Met A~p Gln Met Ser Ser Arg Ala Ala ~er Ala Ser Pro Tyr Thr Pro Glu Hia Ala Ala Ser Val Pro Thr Hi~
~5 90 95 ~er Pro Tyr Ala Gln Pro Ser Ser Thr Phe A~p Thr Met Ser Pro Ala Pro Val Ile Pro Ser AYn Thr Asp Tyr Pro Gly Pro His Hi~ Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Lya Ser Ala ~hr Trp Thr Tyr CA 0224~242 1998-07-28 WO 97/28186 so PCTrFR97/00214 Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gln Ile Ala Lys Thr Cys ero ~le Gln Ile Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala Ile Arg ~la Met Pro Val Tyr Lya Ly3 Ala Glu His Val Thr Asp Ile Val Lys Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser His Leu Ile Arg Val Glu Gly Asn A~n Leu Ser Gln 210 215 ~ 220 Tyr Val Asp Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr ~lu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr Asn Phe ~e~ Cys A3n Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Thr Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cy Pro Gly Arg A~p Arg Lys Ala Asp Glu Asp His Tyr Arg Glu Gln Gln Ala Leu Asn Glu ser Ser Ala ~y~ Asn Gly Ala Ala Ser Lya Arg Ala Phe Ly~ Gln Ser Pro Pro Ala ~al Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu Aap Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Ly~ Leu Ly~ Glu Ser Leu G1U Leu Met Glu Leu Val Pro Gln Pro Leu Val A~p Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser ~i~ Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Aan Lys ~al Hi~ Gly Gly Val Asn Ly~ Leu Pro Ser Val Aan Gln Leu Val Gly Gln Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Aqn Aan HiY Gly Hi~ Ala Val Pro Ala A~n Ser Glu Met Thr Ser Ser Hiq Gly Thr Gln Ser Met Val Ser Gly Ser His ~ys Thr Pro Pro Pro Pro Tyr Hi~ Ala A~p Pro Ser Leu Val Arg Thr ~rp Gly Pro ~2) INFORMATION POUR LA S~Q ID NO: S:

- =
CA 02245242 l998-07-28 WO 97/28186 ~I PCT~FR97t00214 ~ (i) CARACTERISTIQU~S DE LA SEQuENCE:
(A) LONGUEUR: 2156 paires de base~
(B) TYPE: acide nuclélque (C) NOMBRE DE BRINS: double (D) CONFIGURATION: linéaire (il) TYPE DE MOLECULE: ADNc (vi) ORIGINE:
(A) ORGANISME: Homo sapiens (ix) CARACTERISTIQUE ADDITIoNELLE:
(A) NOI~/CLE: CDS
(B) EMPLACEMENT: 33..1940 (xi) DESCRIPTION DE LA S~QUENCE: SEQ ID NO: 5:

Met Ala Gln Ser Thr Ala Thr TCC CCT GAT GGG GGC ACC ACG TTT GAG cAc CTC TGG AGC TCT CTG GAA 101 Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu Glu CCA GAC AGC ACC l'AC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT AAT 149 Pro A3p Ser Thr l'yr Phe Asp Leu Pro Gln Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp ser ser Met A~p Val Phe His Leu Glu GGC ATG ACT ACA l'CT GTC ATG GCC CAG TTC AAT CTG CTG AGC AGC ACC 245 Gly Met Thr Thr Ser Val Met Ala Gln Phe A~n Leu Leu Ser Ser Thr Met Asp Gln Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gln Pro Ser TCC ACC TTC GAC A.CC ATG TCG CCG GCG CCT GTC ATC CCC TCC AAC ACC 389 Ser Thr Phe A~p Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gln Gln Ser Ser ACG GCC A~G TCA GCC ACC TGG ACG TAC TCC cCG CTC TTG AAG AAA CTC 485 Thr Ala Ly~ Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Ly~ Leu Tyr Cys Gln Ile Ala Lys Thr Cyq Pro Ile Gln Ile Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Ly-~ Ly~

Ala Glu His Val Thr Asp Val Val Ly~ Arg Cy~ Pro A-~n Hiq Glu Leu GGG AGG GAC TTC AAC GAA GGA. CAG TCT GCT CCA GCC AGC CAC CTC ATC 677 , CA 0224~242 1998-07-28 W O 97/28186 ~2 PCT~R97/00214 Gly Arg Asp Phe Asn GlU Gly Gln S~r Ala Pro Ala Ser ~is Leu Ile Arg Val Glu Gly Asn Asn Leu Ser Gln Tyr Val A~p Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr Asn Phe Met Cy~ Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Met Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu A~p His Tyr Arg Glu CAG CAG GCC CTG AAC GAG AGC TCC GCC AAG AAC GGG GCC GCC AGC AAG 1013 .Gln Gln Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Ly~ Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly Val Lyq Lyq Arg Arg Hiq Gly Asp Glu A~p Thr Tyr Tyr Leu Gln Val CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG AAA GAG AGC CTG llS7 Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Ly_ Leu Lyq Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val A~p Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser Hi~ Leu Gln Pro Pro Ser Tyr GGG CCG GTC CTC TCG CCC ATG AAC A~G GTG CAC GGG GGC ATG AAC AAG 1301 Gly Pro Val Leu Ser Pro Met Asn Ly~ Val Hi~ Gly Gly Met Asn Ly~

Leu Pro ser Val Aqn Gln Leu Val Gly Gln Pro Pro Pro Hi-~ Ser Ser Ala Ala Thr Pro Aqn Leu Gly Pro Val Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly GlU Met Ser Ser Ser His Ser Ala Gln Ser Met Val Ser Gly Ser HiY Cys Thr Pro Pro Pro Pro Tyr WO 97128186 ~3 PCT~FR97/00214 His Ala A~p Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys Pro 490 ~95 ~ 500 A~n Cys Ile Glu Tyr Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr His Leu Gln A~n Leu Thr Ile Glu Asp Leu Gly Ala Leu Lys Ile Pro Glu CAG TAC CGC ATG AcC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG GGC 1685 Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Asp Leu Lya Gln Gly CAC GAC TAc AGc ACC GcG CAG CAG CTG CTC CGC TCT AGC AAC GCG GCC 1733 His Asp Tyr Ser l'hr Ala Gln Gln Leu Leu Arg Ser Ser A~n Ala Ala ACC ATC TcC ATC GGC GGC TcA GGG GAA CTG CAG cGC CAG CGG GTC ATG 1781 Thr I1e Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln Arg Val Met GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC AAC cGC 1829 Glu Ala Val His Phe Arg Val Arg Hi~ Thr Ile Thr Ile Pro Asn Arg GGC GGC CCA GGC GGC GGC CCT GAC GAG TGG GCG GAC TTC GGC TTc GAC 1877 Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro A~p Cys Ly~ Ala Arg Ly~ Gln Pro Ile Lys Glu Glu Phe Thr GAG GCC GAG ATC CAC TGAGGGCClC GC~rGG~lGC AGCCTGCGCC ACCGCCCAGA 1980 Glu Ala Glu Ile Hi~

GACCCAAGCT GCCTCCCCTC TCCTTCCTGT GTGTCCAAAA ~L~CCTCAGG AGGCAGGACC 2040 AGGAAAGGCC CA ~ CACCGA AGCC ~ CTGT GGACAGCCTG AGTCACCTGC AGAACC 2156 (2) INFORMATION POUR LA SEQ ID NO: 6:
ti) CARACT~SRISTIQUES DE LA SEQUENCE:
(A) LON~U~UK: 636 acide~ amin~s (B) TYPE: acide amune (D) CONFIGURATION: };n~ire (ii) TYPE DE MOLECULE: protéine (xi) DESCRIPTI.ON DE LA SEQUENCE: SEQ ID NO: 6:
Met Ala Gln Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu ~is Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 2û 25 3û
Gln Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe Hi~ Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe A~n Leu Leu Ser Ser Thr Met A~p Gln Met Ser Ser Arg Ala Ala CA 0224~242 1998-07-28 W O 97/28186 54 PCT~FR97/00214 ~er Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His ~er Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 100 105 llQ
Pro Val Ile Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gln Ile Ala Lys Thr Cy3 Pro ~le Gln Ile Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg ~la Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Ly~

Arg Cy~ Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gln Ser Ala Pro Ala ser His Leu Ile Arg Val Glu Gly Asn A~n Leu Ser Gln Tyr Val A:sp Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr ~lu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr A-ln Phe ~et Cys Asn Ser Ser Cy~ Val Gly Gly Met Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Met Arg A-~p Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cy~ Ala Cys Pro Gly Arg Asp Arg Ly~ Ala Asp Glu A~p His Tyr Arg Glu Gln Gln Ala Leu A-~n Glu Ser Ser Ala ~y-~ Asn Gly Ala Ala Ser Lys Arg Ala Phe Ly~ Gln Ser Pro Pro Ala ~al Pro Ala Leu Gly Ala Gly Val Lyq Lyq Arg Arg His Gly A~p Glu A~p Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Ly-l Leu Ly~ Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val Asp Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser ~is Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys ~al Hi': G}y Gly Met Asn Lys Leu Pro Ser Val A~n Gln Leu Val Gly Gln Pro Pro Pro His ser Ser ~la Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met Leu A~n A n Hi~ Gly Hi-~ Ala Val Pro Ala A~n Gly CA 02245242 l998-07-28 WO 97/28186 55 PCTrFR97/00214 Glu Met Ser Ser Ser His Ser Ala Gln Ser Met val Ser Gly Ser His ~ys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe ~85 990 495 ~eu Thr Gly Leu Gly Cy9 Pro Asn Cys Ile Glu Tyr Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr Hi~ Leu Gln Asn Leu Thr Ile Glu A3p Leu Gly Ala Leu Ly3 Ile Pro Glu Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Aqp Leu Lys Gln Gly Hi~ Aqp Tyr Ser Thr Ala Gln Gln Leu ~eu Arg Ser Ser A.sn Ala Ala Thr Ile Ser Ile Gly Gly Ser Gly Glu ~eu Gln Arg Gln Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr Ile Thr Ile Pro A~n Arg Gly Gly Pro Gly Gly Gly Pro A~p Glu Trp Ala Asp Phe Gly Phe A~p Leu Pro A~p Cys Ly~ Ala Arg Lys Gln Pro Il.e Lys Glu Glu Phe Thr Glu Ala Glu Ile Hi~

(2) INFORMATION POUR LA SEQ ID NO: 7:
(i) CARACTERISTIQUES DE L~ SEQUENCE:
(A) LONGUEUR: 2040 paire~ de baqeY
(B) TYPE: acide nucléique IC) NOMBRE DE BRINS: double (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE:
(A) ORGANISME: Mu~ mu~culu3 (ix) CARACTERI'STIQU2 ADDITIONELLE:
(A) NOM~CLE: CDS
(B) EMPLACEMENT: 124..1890 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7:
TGAL~LCC~l GTGGCCTGCA GGGGACTGAG CCAGGGAGTA GATGCCCTGA GACCCCAAGG 60 GACACCCAAG GA~ACCTTGC l~G~LLlGAG A~AGGGATCG ~ C~l GCCCAAGAGA 120 AGC ATG TGT ATG GGC CCT GTG TAT GAA TCC TTG GGG CAG GCC CAG TTC 168 Met Cy~ Met Gly Pro Val Tyr Glu Ser Leu Gly Gln Ala Gln Phe AAT TTG CTC AGC AGr GCC ATG GAC CAG ATG GGC AGC CGT GCG GCC CCG 216 A~n Leu Leu Ser ser Ala Met Asp Gln Met Gly Ser Arg Ala Ala Pro Ala Ser Pro Tyr Th r Pro Glu Hi~ Ala Ala Ser Ala Pro Thr His Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe A~p Thr Met Ser Pro Ala Pro CA 0224~242 1998-07-28 Val Ile Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gln Ile Ala Lys Thr Cys Pro Ile Gln Ile Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Lys Lya Ala Glu His Val Thr Asp Ile Val Lys Arg Cy5 Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser His Leu Ile Arg Val Glu Gly Asn Asn Leu Ala Gln Tyr Val Asp Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr A~n Phe Met Cys Asn Ser Ser Cy5 Val Gly Gly Met Asn Arg Arg Pro Ile Leu Val Ile Ile Thr Leu Glu Thr Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cys Pro Gly Arg A p Arg Lys Ala Asp GAA GAC CAT TAC CGG GAG CAA. CAG GCT CTG AAT GAA AGT ACC ACC AAA 936 Glu Asp His Tyr Arg Glu Gln Gln Ala Leu Asn Glu Ser Thr Thr Lys Asn Gly Ala Ala Ser Lya Arg Ala Phe Ly~ Gln Ser Pro Pro Ala Ile Pro Ala Leu Gly Thr Asn Val Lys Ly~ Arg Arg Hi~ Gly Asp Glu A~p Met Phe Tyr Met His Val Arg Gly Arg Glu Aan Phe Glu Ile Leu Met Ly~ Val Lya Glu Ser Leu G1U Leu Met Glu Leu Val Pro Gln Pro Leu Val Asp Ser Tyr Arg Gln Gln Gln Gln Gln Gln Leu Leu Gln Arg Pro W O 97/28186 57 PCT~FR97/00214 AGT CAC CTG CAG CCT CCA TCC TAT GGG cCC GTG CTC TCC CcA ATG AAC 1224 ser His Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val Hls Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gln Leu Val Gly Gln Pro Pro Pro Hi Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro ATG GGC TCC GGG ~TG CTC AAC AGC CAC GGC CAC AGC ATG CCG GCC AAT 1368 ~t Gly Ser Gly Met Leu Asn Ser His Gly His ser Met Pro Ala Asn Gly Glu Met Asn Gly Gly His Ser Ser Gln Thr Met Val Ser Gly Ser ~20 425 430 His Cys Thr Pro Pro Pro Pro Tyr Hi~ Ala Asp pro Ser Leu Val Ser Phe Leu Thr Gly I.eu Gly Cy~ Pro A~n Cys Ile Glu Cy~ Phe Thr Ser CAA GGG TTG CAG P~GC ATC TAC CAC CTG CAG AAC CTT ACC ATC GAG GAC 1560 Gln Gly Leu Gln Ser Ile Tyr Hi~ Leu Gln A~n Leu Thr Ile Glu Asp Leu Gly Ala Leu Ly3 Val Pro Asp Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Asp Leu Lys Gln Ser Hi3 A~p Cy~ Gly Gln Gln Leu Leu CGC TCC AGC AGc AAC GCG GCC ACC ATC TCC ATC GGC GGC TCT GGC GAG 1704 Arg ser Ser Ser Asn Ala Ala Thr Ile Ser Ile Gly Gly Ser Gly Glu SlS 520 525 Leu Gln Arg Gln Arg Val Met Glu Ala Val Eis Phe Arg Val Arg His ACC ATC AC~ ATC CCC AAC CGT GGA GGC GCA GGT GCG GTG ACA GGT CCC 1800 Thr Ile Thr Ile Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro GAC GAG TGG GCG G~C TTT GGC TTT GAC CTG CCT GAC TGC AAG TCC CGT 1848 Asp Glu Trp Ala A.~p Phe Gly Phe A-~p Leu Pro Asp Cy Ly~ Ser Arg Lys Gln Pro Ile Ly~ Glu Glu Phe Thr Glu Thr Glu Ser His 5~0 585 TGAGGA~CGT AC~l~..l~I C~L~1CC1LC ~.Cl~l~GA AA~I~l~ll GGAAGTGGGA 1950 C~l~llGG~l GTGCCCACAG AAACCAGCAA GGAC~l~lG CCGGATGCCA TTCCTGAAGG 2010 GAAGTCGCTC ATGAACT.AAC ICC~L~ ~ lGG 2040 (2) INFORMATION POUR LA SEQ ID NO: 8:
(i) CARACTERISTIQUES DE LA SE~u~
(A) LONGUEUR: 589 acide~ amin~

CA 0224~242 1998-07-28 W O 97128186 ~8 PCT~R97/00214 - (B) TYPE: aclde aminé
~D) CONFIGURATION: linéalre (ii) TYPE DE MOLECULE: protéine (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8:
Met Cys Met Gly Pro Val Tyr Glu Ser Leu Gly Gln Ala Gln Phe Asn Leu Leu Ser Ser Ala Met Asp Gln Met Gly Ser Arg Ala Ala Pro Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gln Ile Ala Lys Thr Cys Pro Ile Gln Ile Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Ly~ Ly-~ Ala Glu His Val Thr Asp Ile Val I ys Arg Cys Pro A:sn Hi Glu Leu Gly Arg A~p Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser Hi~l Leu Ile Arg Val Glu Gly Asn Asn Leu Ala Gln Tyr Val 165 170 . 175 Asp Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro Ile Leu Val Ile Ile Thr Leu Glu Thr Arg A~p Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cy:~ Pro Gly Arg A~p Arg Lys Ala A~p Glu Asp His Tyr Arg Glu Gln Gln Ala Leu A3n Glu Ser Thr Thr Ly~ A~n Gly Ala Ala Ser Ly Arg Ala Phe Ly~ Gln Ser Pro Pro Ala Ile Pro Ala Leu Gly Thr A~n Val Ly~ Ly~ Arg Arg His Gly A~p Glu Asp Met Phe Tyr Met Hi3 Val Arg Gly Arg Glu A-~n Phe Glu Ile Leu Met Ly~

Val Ly~s Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val A~p Ser Tyr Arg Gln Gln Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser CA 02245242 l998-07-28 WO 97/28186 S9 PCT~FR97/00214 His Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu ser Pro Met Asn Lys Val His Gly Gly Val Asn Ly~ Leu Pro Ser Val Acn Gln Leu Val Gly Gl~ Pro Pro Pro Hi~ Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro Met ~ly Ser Gly Met Leu Asn Ser Hi3 Gly His Ser Met Pro Ala Asn Gly ~05 410 415 ~lu Met Asn Gly Gly His Ser Ser Gln Thr Met Val Ser Gly Ser H

Cy3 Thr Pro Pro Pro Pro Tyr Hi~ Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cy-Y Pro Asn Cy~ Ile Glu Cy3 Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr His Leu Gln AYn Leu Thr Ile Glu Asp Leu ~ly Ala Leu LyY Val Pro A~p Gln Tyr Arg Met Thr Ile Trp Arg Gly 4~5 490 49S
~eu Gln A3p Leu Lys Gln Ser Hi3 A3p Cy-Y Gly Gln Gln Leu Leu Arg Ser Ser Ser Asn Al.a Ala Thr Ile Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln Arg Va.l Met Glu Ala Val Hi3 Phe Arg Val Arg Hi~ Thr Ile Thr Ile Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro A~p Glu Trp Ala A~p Phe Gly Phe A~p Leu Pro Asp Cy3 Ly~ Ser Arg LyY

Gln Pro Ile Ly3 Glu Glu Phe Thr Glu Thr Glu Ser Hi~

(2) INFORMATION POUR LA SEQ ID NO: 9:
(i) CARACTERI~TIQUES DE LA SEQUENCE:
AI LON~U~UK: 758 paire3 de baYe~
~B TYPE: acide nucleique C~ NOMBRE DE BRINS: double :D, CONFIGURATION l;n~aire (ii) TYPE DE MOLECU1E: ADNc (vi) ORIGINE:
(A) ORG~ISME: Mu3 mu~culus (ix) CARACTERISTIQUE ADDITIONELLE:
~A) NOM/CLE: CDS
(B) EMPLACEMENT: 389..757 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9:

CCGCTGGGGC TA~L L G~GCG ACGCGCGCCA AGC~CG6CG GGAAGGAGGC GGGAGGAGCG 120 GGGCCCGAGA CCCCGACTCG GGCAGAGCCA G~GG&CAGG CGGGGCGCGC GTGGGAGCCA 180 CA 0224~242 1998-07-28 W O 97t28186 60 PCTAFR97/00214 Met Ser Gly Ser Val Gly Glu Met Ala Gln Thr Ser Ser Ser Ser Ser Ser Thr Phe Glu His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gln Pro Ser Gln Gly Thr Ser Glu Ala Ser Gly ser Glu Glu Ser Asn Met Asp Val Phe His Leu Gln Gly Met Ala Gln Phe A~n Leu Leu Ser Ser Ala Met Asp Gln Met Gly Ser Arg Ala Ala Pro Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn Thr A~p Tyr Pro Gly Pro ~2) INFORMATION POUR LA SEQ ID NO: 10:
~i) CARACTERISTIQUES DE LA SEQUENCE:
(A) L~N~u~:uK: 123 acide~ amine~
(B) TYPE: acide aminé
(D) CONFIGURATION: linéaire ~ii) TYPE DE MOLECULE: protéine (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10:
Met Ser Gly Ser Val Gly Glu Met Ala Gln Thr Ser Ser Ser ser Ser ~er Thr Phe Glu His Leu Trp ser Ser Leu Glu Pro A3p Ser Thr Tyr Phe Asp Leu Pro Gln ~ro Ser Gln Gly Thr Ser Glu Ala Ser Gly Ser Glu Glu Ser A~n Met Asp Val Phe His Leu Gln Gly Met Ala Gln Phe A~n Leu Leu Ser Ser Ala Met Asp Gln Met Gly Ser Arg Ala Ala Pro Ala Ser Pro Tyr Thr Pro Glu Hi~ Ala Ala Ser Ala Pro Thr Hi~ Ser 9û 95 WO 97/28186 61 PCT~FRg7/00214 Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val I~e Pro Ser Asn Thr Acp Tyr Pro Gly Pro (2) INFORMATION E'OUR LA SEQ ID NO: 11:
(i) CARACTEP~ISTIQUES DE LA SEQU~NCE:
(A) L~U~UK: 559 paire~ de ba3es (B) TYPE: acide nucléique (C) NOY~BRE DE BRINS: double (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE:
(A~ ORGANISME: Homo sapiens (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11:

GGACGTCTTC CACCTGGAGG GCATGACTAC ATCTGTCATG CATCCTCGGC TCCTGCCTcA 120 CCCCTCGGGC CGCCCA~,ATC CATGCCTCGT CCCACGGGAC ACCAGTTCCC TGGCGTGTGC 240 AGACCCCCCG GCGCCT~CCA ~L~ACGT CGGTGACCCC GCACGGCACC TCGCCAcGGC 300 CCAGTTCAAT CTGCTGAGCA GCACCATGGA CCAGATGAGC AGCCGCGCGG CCTCGGCCAG ,360 CTCCACCTTC GACACC~TGT CGCCGGCGCC TGTCATCCCC TCCAACACCG ACTACCCCGG 480 GTACTCCCCG cT~~ AG 559 (2) INFORMATION POUR LA SEQ ID NO: 12:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A: ~ONGUEUR: 1764 paire~ de ba~e~
(B~ TYPE:: acide nucl~ique (CI NOME~RE DE BRINS: double (D, CONFIGURATION: lin~Aire (ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE:
(A) ORGPNISME: Homo sapiens (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12:

ATGCTGTACG TCGGTGA.CCC CGCACGGCAC CTCGCCACGG CCCAGTTCAA T~T~cl~AGC 60 AGCACCATGG ACCAGATGAG CAGCCGCr,CrJ GCCTCGGCCA GCCCCTACAC CCCAGAGCAC 120 ACTTTCCAGC AGTCCAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC Gol~l~AAG 300 CCCCCAGGCA CTGCCAT~CG GGCCATGCCT GTTTACAAGA AAGCGGAGCA CGTGACCGAC 420 CA 0224~242 1998-07-28 W O 97/Z8186 62 PCT~R97/00214 GTCGTGAAAC GCTGCCCCAA CCACGAGCTC ÇGGAGGGACT TCAACGAAGG ACAGTCTGCT 480 TTCAAGCAGA GCCCCCCTGC CGTCCCCGCC ~lLG~lGCCG GTGTGAAGAA GCGGCGGCAT 900 GACCCCAGCC TCGTCAGTTT TTTAACAGGA TTGGGGTGTC CA~ACTGCAT CGAGTATTTC 1380 GCCCTGAAGA TCCCCGAGCA GTACCGCATG ACCATCTGGC GG~C~GCA GGACCTGAAG 1500 TCCATCGGCG GCTCAGGGGA ACTGCAGCGC CAGCGG~l~A TGGAGGCCGT GCACTTCCGC 1620 GTGCGCCACA CCATCACCAT CCCCAACCGC GGCGGCCCAG GC~CCC TGACGAGTGG 1680 (2) INFORMATION POUR LA SEQ ID NO: 13:
(i) CARACTERISTIQUES DE LA SEQUENCE:
~A) L~N~u~UK: 587 acide~ ami~és (B~ TYPE: acide aminé
(D) CONFIGURATION: 1 jn~i re (ii) TYPE DE MOLECULE: protéine (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13:
Met Leu Tyr Val Gly A~p Pro Ala Arg Hi~ Leu Ala Thr Ala Gln Phe l 5 10 15 A~n Leu Leu Ser Ser Thr Met Asp Gln Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro Glu Hi~ Ala Ala Ser Val Pro Thr ~is Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro W O 97/Z8186 63 PCT~R97/00214 Val Ile Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Th~ Phe Gln Gln Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gln Ile Ala Lys Thr Cys Pro Ile Gln Ile Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser His Leu Ile Arg Val G1U Gly Asn A~n Leu Ser Gln Tyr Val Asp Asp Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr Asn Phe Met Cys Asn Ser Ser Cy Val Gly Gly Met Asn A~g Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Met Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu A-~p His ryr Arg Glu Gln Gln Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly Val Ly~ Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu ~et Lys Leu Lys (~lu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val A~p Ser ~yr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser His '~40 345 350 Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly ~let A~n Lys Leu Pro Ser Val A~n Gln Leu Val Gly Gln Pro Pro Pro EIi~ Ser Ser Ala Ala Thr Pro A:~n Leu Gly Pro Val Gly Pro Gly Met Leu Asn A~n His Gly Hi~ Ala Val Pro Ala Asn Gly Glu Met Ser Ser Ser Hi~ Ser Ala Gln Ser Met Val Ser Gly Ser Hi~ Cys Thr Pro Pro Pro Pro Tyr Hi~ Ala A-~p Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys Pro Asn cy5 Ile Glu Tyr Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr His Leu Gln Asn Leu Thr Ile Glu Asp Leu Gly Ala Leu Lys Ile Pro Glu Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Asp Leu Lys Gln Gly His Asp Tyr Ser Thr Ala Gln Gln Leu Leu Arg Ser Ser Asn Ala Ala Thr Ile Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln Arg Val Met Glu Ala Val His Phe Arg Val Arg Hls Thr Ile Thr Ile Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro A~p Cys Ly~ Ala Arg Lys Gln Pro Ile Ly~ Glu Glu Phe Thr Glu Ala Glu Ile His (2) INFORMATION POUR LA SEQ ID NO: 14:
(i) CARACTERISTIQUES DE LA SEQUENCE
(A) LONGUEUR: 1521 paireq de ba eq (B) TYPE acide nucléique (C) NOMBRE DE BRINS: double (D) CONFIGURATION: lin~aire (ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE:
(A) ORGANISME: Homo qapienq (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19:
ATGCTGTACG TCGGTGACCC CGCACGGCAC CTCGCCACGG CCCAGTTCAA ~LG~G~GC 60 A~LlC~AGC AGTCCAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC G~IL~AAG 300 GTCGTGAAAC GCTGCCCCAA CCACGAGCTC GGGAGGGACT TCAACGAAGG ACA~L~T~ 480 GTCACCGGCA GGCAGAGCGT C~LG~LGCCC TATGAGCCAC CACAGGTGGG GACGGAATTC 600 TTTGAGGGCC GCA.~.'~CGC CTGTCCTGGC CGCGACCGAA AAGCTGATGA GGACCACTAC 780 TTCAAGCAGA GCCCCCCTGC CGTCCCCGCC ClL~l~CCG GTGTGAAGAA GCGGCGGCAT 900 W O 97/28186 65 PCT~97/00214 GGAGACGAGG ACAC&TACTA CCTTCA~GTG CGAGGCCGGG AGAACTTTGA GATCCTGATG 960 A~GCTGAAAG AGAGCCTGGA GCTGATGGAG TTGGTGCCGC AGCCACTGGT GGACTCCTAT 1020 r AGTGCCAGCC AACGGCGAGA TGAGCAGCAG CCACAGCGCC CAGTCCATGG TCTCGGGGTC 1140 (2) INFORMATION POUR LA SEQ ID NO: lS:
(i) CARACTE~ISTIQUES DE LA SEQUENCE:
(A) LO~rGUEUR: 506 acide~ aminés (B) TYE'E: acide aminé
(D) COWFIGURATION: linéaire (ii) TYPE DE MOLECULE: protéine (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15:
Met Leu Tyr Val Gly A~p Pro Ala Arg His Leu Ala Thr Ala Gln Phe A~n Leu Leu Ser Ser Thr Met Asp Gln Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro Glu Hi~ Ala Ala Ser Val Pro Thr Hi~ Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe A3p Thr Met Ser Pro Ala Pro Val Ile Pro Ser A~n ~hr A~p Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gln Gln Ser Ser Thr Ala Ly~ Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Ly~ Lys Leu Tyr Cy~ Gln Ile Ala Ly~ Thr Cys Pro Ile Gln Ile Ly~ Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Lys Ly Ala Glu Hi~ Val Thr Asp Val Val Lys Arg Cy3 Pro Asn Hi~ Glu Leu &ly Arg A~p Phe Asn Glu Gly Gln Ser Ala Pro Ala Ser ~is Leu Ile Arg Val Glu Gly A n A~n Leu Ser Gln Tyr Val A~p A p Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu CA 02245242 l998-07-28 WO 97/28186 66 PCT/F~97/00214 Pro Pro Gln Val Gly Thr Glu P~e Thr Thr Ile Leu Tyr Asn Phe Met Cys A~n Ser Ser Cys Val Gly Gly ~et Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Met Arg Asp Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu A~p Hls Tyr Arg Glu Gln Gln Ala Leu Asn Glu Ser ser Ala Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly Val Ly~ Lyq Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val Aap Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Pro Arg .

Asp Ala Gln Gln Pro Trp Pro Arg Ser Ala ser Gln Ar~ Arg Asp Glu Gln Gln Pro Gln Arg Pro Val Hi~ Gly Leu Gly Val Pro Leu Hi~ Ser Ala Thr Pro Leu Pro Arg Arg Pro Gln Pro Arg Gln Asp Leu Gly Ala Leu Lys Ile Pro Glu Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Aqp Leu Lys Gln Gly His Asp Tyr Ser Thr Ala Gln Gln Leu Leu Arg Ser Ser A~n Ala Ala Thr Ile Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln Arg Val Met Glu Ala Val Hi~ Phe Arg Val Arg Hiq Thr Ile Thr Ile Pro A~n Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe Gly Phe A p Leu Pro A~p Cy~ Lys Ala Arg Ly~ Gln Pro Ile Lys Glu Glu Phe Thr Glu Ala Glu Ile His (2) INFORMATION POUR LA SEQ ID NO: 16:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A~ L~N~u~uK: 1870 paireY de baqe~
(B TYPE: acide nucleique (C NOMBRE DE LRINS: double (Dl CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE:
(A) ORGANISME: Homo sapienq =

CA 0224~242 l998-07-28 W O 97/28186 67 PCT~FR97/00214 .
~ (ix) CARACTERISTIQUE ADDITIONELLE:
~A) NOM/CLE: CDS
(~) EMPLACEMENT: 104..1867 r (Xl) DESC~IPTION DE LA SEQUENCE: S~Q ID NO: 16:

AAGCcGGGGG AATAATGAGG TGGTGGGCGG AAcGGATTCC AGC ATG GAC GTC TTC 115 Met Asp Val Phe CAC CTG GAG GGC ATG AcT ACA TCT GTC ATG Gcc CAG TTC AAT cTG CTG 163 Hls Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe Asn Leu Leu AGC AGC ACC ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CcC 211 Ser Ser Thr Met Asp Gln Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro Glu Hi~ Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn Thr A-~p Tyr Pro Gly Pro Hiq Hi~ Phe Glu Val Thr Phe Gln Gln Ser Ser Thr ~la Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Ly~ Lys Leu Tyr Cys Gln Ile Ala Ly~ Thr Cy~ Pro Ile Gln Ile Ly~
~05 110 115 Val Ser Thr Pro l?ro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Ly~ Ly Ala Glu His Val Thr Asp Val Val Ly~ Arg Cyq Pro Asn CAC GAG CTC GGG ~GG GAC TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC 595 Hi~ Glu Leu Gly Arg AYP Phe Aqn Glu Gly Gln Ser Ala Pro Ala Ser 150 lSS 160 His Leu Ile Arg Val Glu Gly A~n Asn Leu Ser Gln Tyr Val Acp A~p Pro Val Thr Gly ~rg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln 185 lg0 195 Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr A~n Phe Met Cy~ A~n Ser Ser Cys Val Gly Gly Met A~n Arg Arg Pro Ile Leu Ile Ile Ile Thr ~ 215 220 225 Leu Glu Met Arg A~p Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly CA 0224~242 1998-07-28 W O 97/28186 68 PCTA~R97/00214 230 23s 2qo CGC ATC TGC GCC TGT CCT GGC CGC GAC CGA A~A GCT GAT GAG GAC CAC 883 Arg Ile Cy3 Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His ?45 250 255 260 Tyr Arg Glu Gln Gln Ala Leu Asn Glu Ser Ser Ala Lyq Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr CTT CAG GTG CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG A~A 1075 Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val Asp Ser 325 330 33s 340 Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser His Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met A~n Lya Val His Gly Gly Met Asn Lys Leu Pro Ser Val A~n Gln Leu Val Gly Gln Pro Pro Pro Hi~ Ser Ser Ala Ala Thr Pro Aan Leu Gly Pro Val Gly Pro Gly Met Leu Asn Asn Hi~ Gly Hi-~ Ala Val Pro Ala A3n Gly Glu Met Ser Ser Ser Hi~ Ser Ala Gln Ser Met Val Ser &ly Ser His Cys Thr Pro Pro Pro Pro Tyr His Ala A~p Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys Pro A~n Cy3 Ile GlU Tyr Phe Thr Ser Gln Gly Leu Gln Ser Ile Tyr Hi Leu Gln A n Leu Thr Ile Glu Asp Leu Gly Ala Leu Lyq Ile Pro Glu Gln Tyr Arg Met Thr Ile Trp Arg Gly Leu Gln Asp Leu Lys Gln Gly His Asp Tyr Ser Thr Ala Gln Gln Leu Leu Arg Ser Ser A~n Ala Ala Thr Ile Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln CA 02245242 l998-07-28 Arg Val Met Glu Ala Val His Phe Arg Val Arg Hls Thr Ile Thr Ile Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe GGC TTC GAC CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG 18~3 Gly Phe A~p Leu Pro Asp Cys Lys Ala Arg Lys Gln Pro Ile Lys Glu GAG TTC AcG GAG GCC GAG ATC CAC TGA 1870 Glu Phe Thr Glu Ala Glu Ile His (2) IrrFORMATION POUR LA SEQ ID NO: 17:
(i) CARACT~RISTIQUES DE LA S~QU~NCL:
(A) LONGUEUR: 588 aclde~ amin~
(B) TYPE: acide amlné
(D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: protéine (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17:
Met Asp Val Phe Hi~ Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln l 5 10 15 ~he Asn Leu Leu Ser Ser Thr Met A p Gln Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro Glu Hi~ Ala Ala Ser Val Pro Thr Hls Ser Pro Tyr Ala Gl.n Pro Ser Ser Thr Phe A~p Thr Met Ser Pro Ala Pro Val Ile Pro S~r A~n Thr Asp Tyr Pro Gly Pro His His Phe Glu ~al Thr Phe Gln Gln Ser ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr ~er Pro Leu Leu Ly~q Ly~ Leu Tyr Cy~ Gln Ile Ala Lyq Thr Cy~ Pro Ile Gln Ile Ly~ Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg l1S 120 125 Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr A~p Val Val Lys Arg Cys Pro A~n Hi~ Glu Leu Gly Arg A~p Phe Asn Glu Gly Gln Ser 145 150 lSS 160 ~la Pro Ala Ser His Leu Ile Arg Val Glu Gly A~n A~n Leu Ser Gln ~yr Val A-cp A p Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr 180 lBS 190 Glu Pro Pro Gln Va.l Gly Thr Glu Phe Thr Thr Ile Leu Tyr Asn Phe l9S 200 205 Met Cys Asn Ser Ser Cy~ Val Gly Gly Met A~n Arg Arg Pro Ile Leu -CA 0224~242 l998-07-28 W O 97/28186 70 PCTn~R97/00214 Ile Ile Ile Thr Leu Glu Met Arg A~p Gly Gln Val Leu Gly Arg Arg 22s 230 23s 240 Ser Phe Glu Gly Arg Ile Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 245 2s0 255 ~sp Glu Asp His Tyr Arg Glu Gln Gln Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gln Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Ly~ Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro 325 330 33s ~eu Val Asp Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser His Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val Hi ~ Gly Gly Met A~n Lys Leu Pro Ser Val A~n Gln Leu Val Gly Gln Pro Pro Pro His Ser ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met Leu Asn A n His Gly His Ala Val Pro Ala A~n Gly ~lu Met Ser Ser ser His Ser Ala Gln Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro Tyr His Ala Asp erO Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cy~ Pro Asn Cys Ile Glu Tyr Phe Thr Ser Gln q50 455 460 Gly Leu Gln Ser Ile Tyr Hi~ Leu Gln Asn Leu Thr Ile Glu Asp Leu Gly Ala Leu Lys Ile Pro Glu Gln Tyr Arg Met Thr Ile Trp Arg Gly ~eu Gln A p Leu Lys Gln Gly Hi ~ A-~p Tyr Ser Thr Ala Gln Gln Leu Leu Arg Ser Ser Asn Ala ~la Thr Ile Ser Ile Gly Gly Ser Gly Glu Leu Gln Arg Gln Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr Ile Thr Ile Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 54s 550 555 560 Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gln Pro Ile Lys Glu Glu Phe Thr Glu ~la GlU Ile His (2) IN2'0RMATION POUR LA S5Q ID NO: 18:
( i ) CARACTERISTIQUES DE LA SEQUENCE:

CA 0224~242 1998-07-28 (A) LONGUEUR 1817 paireS de baqes ) TYPE: acide nucléique (C) NOMBRE DE BRINS double (D) CONFIGURATION linéaire (ii) TYPE DE MOLECULE ADNc (vi) ORIGINE:
(A) ORGJANISME Homo sapiens (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18 CAACCCAGCT CCACCI'TCGA CACCATGTCG CCGGCGCCTG TCATCCCCTC CAACACCGAC 360 ACCTGGACGT ACTCCCCGCT CTTGAAGAAA CTCTAcTGCC AGATCGCCAA GACATGCCCC 480 TACAAGA~AG CGGAGCACGT GACCGACGTC GTGAAACGCT GCCCCAACCA CGAGCTCGGG 600 AGGGACTTCA ACGAAGGACA ~L~G~lCCA GCCAGCCACC TCATCCGCGT GGAAGGCAAT 660 AAGAACGGGG CCGCCAGCAA GC~.GC~.lC AAGCAGAGCC CCCCTGCCGT CCCCGCCCTT 1020 GGTGCCGGTG TGAAGA~GCG GCGGCATGGA GACGAGGACA CGTACTACCT TCAGGTGCGA 1080 GGCCGGGAGA ACTTTG~GAT CCTGATGAAG CTGAAAGAGA GC~lG~AGCT GATGGAGTTG 1140 GTGCCGCAGC CA~L~rG~A CTCCTATCGG CAGCAGCAGC AG~C~lACA GAGGCCGAGT 1200 ATGAACAAGC TGCCCTCCGT CA~CCAGCTG GTGGGCCAGC CTCCCCCGCA CAGTTCGGCA 1320 GCTACACCCA AC~lGGGGCC C~l~&GCCCC GGGATGCTCA ACAACCATGG CCACGCAGTG 1380 CCAGCCAACG GCGAGA'rGAG CAGCAGCCAC AGCGCCCAGT CCALG~.C GGGGTCCCAC 1440 AGATCCCCGA GCAGTACCGC ATGACCATCT GGCG~GGC~l GCAGGACCTG AAGCAGGGCC 1560 CA 0224~242 1998-07-28 WO 97/2818~ 72 PCT~FR97/00214 ~ AGGCCGAGAT CCACTGA 1817 (2) INFORMATION POUR LA SEQ ID NO: 19:
(1) CARACTERISTIQUES ~ LA S~QUENC~:
(A) LONGUEUR: 499 acide~ amlnés (B) TYPE: acide aminé
(D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: protélne (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19:
Met Ala Gln Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gln Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gln Phe Asn Leu Leu Ser Ser Thr Met Asp Gln Met Ser Ser Arg Ala ALa Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gln Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val Ile Pro Ser Asn Thr A~p Tyr Pro Gly Pro His Hls Phe Glu Val Thr Phe Gln Gln ser Ser Thr Ala Ly~ Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Ly~ Lyq Leu Tyr CyY Gln Ile Ala Ly~ Thr Cys Pro lg5 150 155 160 Ile Gln Ile Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala Ile Arg Ala Met Pro Val Tyr Lys Lyq Ala Glu Hiq Val Thr Asp Val Val Lys Arg Cy~ Pro Asn Hi~ Glu Leu Gly Arg A~p Phe Asn Glu Gly Gln Ser Ala Pro Ala ser Hi~ Leu Ile Arg Val Glu Gly AYn Asn Leu Ser Gln Tyr Val Aqp A~p Pro Val Thr Gly Arg Gln Ser Val Val Val Pro Tyr Glu Pro Pro Gln Val Gly Thr Glu Phe Thr Thr Ile Leu Tyr Asn Phe Met Cy~ Asn Ser Ser Cy~ Val Gly Gly Met Asn Arg Arg Pro Ile Leu Ile Ile Ile Thr Leu Glu Met Arg A~p Gly Gln Val Leu Gly Arg Arg Ser Phe Glu Gly Arg Ile Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 2g0 295 300 CA 02245242 l998-07-28 WO 97/28186 PCTAFR97/0~214 Asp GlU Asp Hls Tyr Arg Glu Gln Gln Ala Leu Asn Glu Ser Ser Ala 305 ~10 315 320 Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Dy9 &ln Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg Hl~ Gly Asp Glu Asp Thr Tyr Tyr Leu Gln Val Arg Gly Arg Glu Asn Phe Glu Ile Leu Met Lys Leu :Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gln Pro Leu Val Asp Ser Tyr Arg Gln Gln Gln Gln Leu Leu Gln Arg Pro Ser His Leu Gln Pro Pro Ser Tyr Gly Pro Val Leu Ser pro Met Asn Lys Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gln Leu Val Gly ~i20 425 430 Gln ero Pro Pro ~is Ser Ser Ala Ala Thr Pro A~n Leu Gly Pro Val Gly Pro Gly Met Leu Asn Asn Hi~ Gly Hi~ Ala Val Pro Ala Asn Gly Glu ~et Ser Ser Ser His Ser Ala Gln Ser Met Val Ser Gly Ser His Cys Thr Pro E'ro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr Trp Gly Pro (2) INFORMATION POUR LA SEQ ID NO: 20:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A~ LONGUEUR: 17 paireq de base~
(B) TYPE: acide nucléique ~C) NOMBRE DE BRINS: ~imple (D) CONFIGURATION: linéaire (ii) TYPB DE MOLECULE: ADN
(iii) hY~OI~h~lQUE: NON
(iii) ANTI-SENS: NON

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20:

(2) INFORMATION POUR LA SEQ ID NO: 21:

(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 19 paires de ba~es (B) TYPE: acide nucléigue (C) NOMBRE DE BRINS: simple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS.: OUI

7~ PCT~FR97/00214 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21:

~2) INFORMATION POUR LA SEQ ID NO: 22:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 18 paires de baAes (B) TYPE: acide nucléique (C) WOMBRE DE BRINS: ~lmple (D) CONFIGURATION: linéaire tii) TYPE DE MOLECULE: ADN
(lii) ANTI-SENS: NON

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: Z2:

(2) INFORMATION POUR LA SEQ ID NO: 23:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 18 paireY de ba eA
(B) TYPE: acide nucléique (C) NOMBRE DE BRINS: 3imple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23:

(2) INFORMATION POUR LA SEQ ID NO: 24:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A~ LONGUEUR: 21 paire~ de ba~e~
(B TYPE: acide nucléique (C~ NOMBRE DE BRINS: Yimple (D~ CONFIGURATIoN: l; n~ e (ii) TYPE DE MOLECULE: ADN .. .
(iii) ANTI-SENS: NON

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24:
GTCAACCAGC T~lG~GCCA G 2l (2) INFORMATION POUR LA SEQ ID NO: 25:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 16 paires de base (B) TYPE: acide nucléique (C) NOMBRE DE BRINS: ~imple (D) CONFIGURATION: lin~Aire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

W O 97/28186 75 PCT~FR97/OU214 (Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25:
GTGGATCTCG GCCTCC l6 (2) INFORMATION POUR LA SEQ ID NO: 26:
(1) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 17 paire~ de bases (B) TYPE: acide nucléique (C) NOMBRE DE BRINS: ~imple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: NON

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26:

(2) INFORMATION POUR LA SEQ ID NO: 27:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LON~U~UK: 19 paires de baYe~ -(B) TYPE: acide nucleique (C) NOMBRE DE BRINS: simple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

(Xi) DESCRIPTrON DE LA SEQUENCE: SEQ ID NO: 27:

(2) INFORMATION POUR LA SEQ ID NO: 28:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A: LONGUEUR: 17 paires de ba~e.
(B TYPE: acide nucléique (C~ NOMBRE DE 8RINS: qimP1e (D. CONE~IGURATION: lin~aire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: NON

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28:

(2) INFORMATION POUR LA SEQ ID NO: 29:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) L~N~u~uK: 18 paire~ de base~
(B) TYPE: acide nucléique rC) NOM8RE DE BRINS: simple (D) CONFIGURATION: lin~aire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

- ~Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29:

(2) INFORMATION POUR LA SEQ ID NO: 30:
(1) CARACTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 18 paire~ de bases (B) TYPE: acide nucléique (C) NOMBRE DE BRINS: simple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: NON

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30:

(2) INFORMATION POUR LA SEQ ID NO: 31:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LON~U~UK: 18 paire~ de ba~e~
(B) TYPE: acide nucléique (C) NOMBRE DE BRINS: aimple (D) CONFIGURATION: lineaire (ii) TYPE DE MOLECULE: ADN
(1ii) ANTI-SENS: OUI

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31:

(2) INFORMATION POUR L~ SEQ ID NO: 32:
(i) CARACTERISTIQUES DE LA SEQUENCE:
A) LON~U~UK: 18 paireY de ba~es ~B) TYPE: acide nucléique ~C) NOMBRE DE BRINS: ~imple ~D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
~1ii) ANTI-SENS: NON

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32:

(2) INFORMATION POUR LA SEQ ID NO: 33:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) L~N~U~UK: 19 paires de ba~e~
(B) TYPE: acide n~cléique (C) NOMBRE DE BRINS: ~imple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

WO 97/28186 PCT~FR97/00214 - (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33:
CcATCAGCTC CAGGcTcTc l9 (2) INFORMATION POUR LA SEQ ID NO: 39:
(i) CARACTEE~ISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 18 paires de basec (B) TYPE: acide nucléique (C) NOMBRE DE BRINS: ~lmple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SEMS: OUI

(xi) DESCRIPI'ION DE LA SEQUENCE: SEQ ID NO: 34:
CCAGG~CAGG CGCAGATG l8 (2) INFORMATION POUR LA SEQ ID NO: 35:
(i) CARACTER.ISTIQUES DE LA SEQUENCE:
(Al LON'GUEUR: l9 palre~ de ba~et (8' TYPE: acide nucléique .
(Cl NOM:BRE DE BRINS: simple (D,l CONFIGURATION: lin~aire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35:
GATGAGGTGG CTCG~TG~A 19 (2) INFORMATION POUR LA SEQ ID NO: 36:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) LO~U~UK: 19 paire~ de ba~e~
(B) TYPE: acide nucléique (C) NOMBRE DE BRINS: ~imple (D) CONFIGURATION: linéaire ~ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36:
TGGTCAGGTT CTGCAGt;TG l9 (2) INFORMATION POUR LA SEQ ID NO: 37:
(i) CARACTERXSTIQUES DE LA SEQUENCE:
'A) LO~U~UK: 18 paires de ba~ec B) TYP~S: acide nucl~ique 'C) NOM~RE DE BRINS: ~imple ,D) CONFIGURATION: li n~a~ re (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: NON

WO 97/28186 PCTrFR97/00214 (Xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37:

(2) INFORMATION POUR LA SEQ ID NO: 38:
(i) CAR~CTERISTIQUES DE LA SEQUENCE:
(A) LONGUEUR: 21 paires de ba3e3 (B) TYPE: aclde ~ucléique (C) NOMBRE DE BRINS: 3imple (D) CONFIGURATION: lineaire (il) TYPE DE MOLECULE: ADN
(iil) ANTI-SENS: OUI

(Xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38:
AGGAAAATAG AAGCGTCAGT C 2l (2) INFORMATION POUR LA SEQ ID NO: 39:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(A) L~N~u~u~: 18 paire~ de ba~e~
(B) TYPE: acide nucléique (C) NOMBRE DE BRINS: 3imple (D) CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: NON

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39:.
CAGGCCCACT TGCCTGCC l8 (2) INFORMATION POUR LA SEQ ID NO: 40:
(i) CARACTERISTIQUES DE LA SEQUENCE:
(Al LONGUEUR: l9 paire3 de ba~e~
(B TYPE: acide nucl~ique (C NOMBRE DE BRINS: imple (Dl CONFIGURATION: linéaire (ii) TYPE DE MOLECULE: ADN
(iii) ANTI-SENS: OUI

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4û:
CTGTCCCCAA GCTGATGAG l9

Claims

REVENDICATIONS

1. Polypeptide purifié comprenant une séquence d'acides aminés choisie parmi:
a) la séquence SEQ ID n° 2;
b) la séquence SEQ ID n° 4;
c) la séquence SEQ ID n° 6;
d) la séquence SEQ ID n° 8;
e) la séquence SEQ ID n° 10;
f) la séquence SEQ ID n°13;
g) la séquence SEQ ID n° 15;
h) la séquence SEQ ID n° 17;
i) la séquence SEQ ID n° 19;
et j) toute séquence biologiquement active dérivée de SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17, ou SEQ ID n° 19.

2. Polypeptide selon la revendication 1, caractérisé en ce qu'il comprend la séquence d'acides aminés choisie parmi SEQ iD no 6, SEQ ID n° 13, SEQ ID n° 15, SEQ ID
n° 17 et SEQ ID n° 19.

3. Polypeptide selon la revendication 1, caractérisé en ce qu'il comprend la séquence comprise entre:
- le residu 110 et le résidu 310 de SEQ ID n° 2 ou 6;
- le résidu 60 et le résidu 260 de SEQ ID n° 8.

4. Polypeptide selon la revendication 1, caractérisé en ce qu'il résulte d'un épissage alternatif de l'ARN messager du gène correspondant.

5. Polypeptide selon l'une quelconque des revendications précédentes caractériséen ce qu'il s'agit d'un polypeptide recombinant produit sous la forme d'une protéine de fusion.

6. Séquence d'acides nucléiques isolée codant pour un polypeptide selon l'une quelconque des revendications précédentes.

7. Séquence d'acides nucléiques isolée selon la revendication 6, caractérisée en ce qu'elle est choisie parmi:
a) la sequence SEQ ID n° 1;
b) la séquence SEQ ID n° 3;
c) la séquence SEQ ID n° 5;
d) la séquence SEQ ID n° 7;
e) la séquence SEQ ID n° 9;
f) la séquence SEQ ID n° 11;
g) la séquence SEQ ID n° 12;
h) la séquence SEQ ID n° 14;
i) la séquence SEQ ID n° 16;
j) la séquence SEQ ID n° 18;
k) les séquences d'acides nucléiques capables de s'hybrider spécifiquement à la sequence SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n°7, SEQ ID n°9, SEQ
ID n° 11, SEQ ID n°12, SEQ ID n° 14, SEQ ID n° 16 ou SEQ ID n° 18 ou à leurs séquences complémentaires, ou de s'hybrider spécifiquement à leurs séquences proximales.;
et l) les séquences dérivées des sequences a), b), c), d), e), f), g), h), i), j) ou k) du fait de la dégénérescence du code génétique, de mutation, de délétion, d'insertion, d'un épissage alternatif ou d'une variabilité allélique.

8. Séquence nucléotidique selon la revendication 6, caractérisée en ce qu'il s'agit d'une séquence choisie parmi SEQ ID n° 5, SEQ ID n° 12, SEQ ID n° 14, SEQ ID
n° 16 et SEQ ID n° 18 codant respectivement pour le polypeptide de séquences SEQ ID n°6, SEQ ID n°13, SEQ ID n°15, SEQ ID n°17 et SEQ ID n°19.

9. Vecteur de clonage et/ou d'expression contenant une séquence d'acides nucléiques selon l'une quelconque des revendications 6 à 8.

10. Vecteur selon la revendication 9, caractérisé en ce qu'il s'agit du plasmide pSE1.

11. Cellule hôte transfectée par un vecteur selon la revendication 9 ou 10.

12. Cellule hôte transfectée selon la revendication 11, caractérisée en ce qu'il s'agit de E. coli MC 1061.

REVENDICATIONS

13. Sonde nucléotidique ou amorce nucléotidique caractérisée en ce qu'elle s'hybride spécifiquement dans des conditions stringentes avec l'une quelconque des séquences selon les revendications 6 à 8 ou leurs séquences complémentaires ou les ARN messagers correspondants ou les gènes correspondants.

14. Sonde ou amorce selon la revendication 13, caractérisée en ce qu'elle comporte au moins 16 nucléotides.

15. Sonde ou amorce selon la revendication 13, caractérisée en ce qu'elle comprend l'intégralité de la séquence du gène codant pour l'un des polypeptides de la revendication 1.

16. Sonde ou amorce nucléotidique choisie parmi les oligonucléotides suivants ou leurs complémentaires:
SEQ ID n° 20: GCG AGC TGC CCT CGG AG
SEQ ID n° 21: GGT TCT GCA GGT GAC TCA G
SEQ ID n° 22: GCC ATG CCT GTC TAC AAG
SEQ ID n° 23: ACC AGC TGG TTG ACG GAG
SEQ ID n° 24: GTC AAC CAG CTG GTG GGC CAG
SEQ ID n° 25: GTG GAT CTC GGC CTC C
SEQ ID n° 26: AGG CCG GCG TGG GGA AG
SEQ ID n° 27: CTT GGC GAT CTG GCA GTA G
SEQ ID n° 28: GCG GCC ACG ACC GTG AC
SEQ ID n° 29: GGC AGC TTG GGT CTC TGG
SEQ ID n° 30: CTG TAC GTC GGT GAC CCC
SEQ ID n° 31: TCA GTG GAT CTC GGC CTC
SEQ ID n° 32: AGG GGA CGC AGC GAA ACC
SEQ ID n° 33: CCA TCA GCT CCA GGC TCT C
SEQ ID n° 34: CCA GGA CAG GCG CAG ATG
SEQ ID n° 35: GAT GAG GTG GCT GGC TGG A
SEQ ID n° 36: TGG TCA GGT TCT GCA GGT G
SEQ ID n° 37: CAC CTA CTC CAG GGA TGC
SEQ ID n° 38: AGG AAA ATA GAA GCG TCA GTC
SEQ ID n° 39: CAG GCC CAC TTG CCT GCC
et SEQ ID n° 40: CTG TCC CCA AGC TGA TGA G

17. Utilisation d'une séquence selon l'une quelconque des revendications 6 à 8 pour la fabrication d'amorces oligonucléotidiques pour des réactions de séquençage ou d'amplification spécifique selon la technique de PCR ou toute variante de celle-ci.

18. Couple d'amorces nucléotidiques, caractérisé en ce qu'il comprend les amorces choisies parmi les séquences suivantes:

a) amorce sens: GCG AGC TGC CCT CGG AG (SEQ ID n°20) amorce antisens: GGT TCT GCA GGT GAC TCA G (SEQ ID n°21) b) amorce sens: GCC ATG CCT GTC TAC AAG (SEQ ID n°22) amorce antisens: ACC AGC TGG TTG ACG GAG (SEQ ID n°23) c) amorce sens: GTC AAC CAG CTG GTG GGC CAG (SEQ ID n°24) amorce antisens: GTG GAT CTC GGC CTC C (SEQ ID n°25) d) amorce sens: AGG CCG GCG TGG GGA AG (SEQ ID n°26) amorce antisens: CTT GGC GAT CTG.GCA GTA G (SEQ ID n°27) e) amorce sens: GCG GCC ACG ACC GTG A (SEQ ID n°28) amorce antisens: GGC AGC TTG GGT CTC TGG (SEQ ID n°29) f) amorce sens: CTG TAC GTC GGT GAC CCC (SEQ ID n°30) amorce antisens: TCA GTG GAT CTC GGC CTC (SEQ ID n°31) g) amorce sens :AGG GGA CGC AGC GM ACC (SEQ ID n°32) amorce antisens: GGC AGC TTG GGT CTC TGG (SEQ ID n°29) h) amorce sens: CCCCCCCCCCCCCCN (où N est égal à G, A ou T) amorce antisens: CCA TCA GCT CCA GGC TCT C (SEQ ID n°33) i) amorce sens: CCCCCCCCCCCCCCN (où N est egal à G, A ou T) amorce antisens: CCA GGA CAG GCG CAG ATG (SEQ ID n°34) j) amorce sens: CCCCCCCCCCCCCCCN (où N est égal à G, A ou T) amorce antisens: CTT GGC GAT CTG GCA GTA G (SEQ ID n°27) k) amorce sens :CAC CTA CTC CAG GGA TGC (SEQ ID n°37) amorce antisens: AGG AAA ATA GAA GCG TCA GTC (SEQ ID n°38) et l) amorce sens :CAG GCC CAC TTG CCT GCC (SEQ ID n°39) amorce antisens: CTG TCC CCA AGC TGA TGA G (SEQ ID n°40).

19. Utilisation d'une séquence selon l'une quelconque des revendications 6 à 8, utilisable en thérapie génique.

20. Utilisation d'une séquence selon l'une quelconque des revendications 6 à 8, pour la réalisation de sondes ou d'amorces nucléotidiques de diagnostic, ou de séquences antisens utilisables en thérapie génique.

21. Utilisation d'amorces nucléotidiques selon l'une quelconque des revendications 6 à 8 peur le séquençage.

22. Utilisation d'une sonde ou amorce selon l'une quelconque des revendications 13 à 16, comme outil de diagnostic in vitro pour la détection, par des expériences d'hybridation, des séquences d'acides nucléiques codant pour un polypeptide selon l'une quelconque des revendications 1 à 4, dans des échantillons biologiques, ou pour la mise en évidence de synthèses aberrantes ou d'anomalies génétiques.

23. Méthode de diagnostic in vitro pour la détection de synthèses aberrantes ou d'anomalies génétiques au niveau des séquences d'acides nucléiques codant pour un polypeptide selon l'une quelconque des revendications 1 à 4, caractérisée en ce qu'elle comprend:
- la mise en contact d'une sonde nucléotidique selon l'une quelconque des revendications 13 à 16 avec un échantillon biologique dans des conditions permettant) la formation d'un complexe d'hybridation entre ladite sonde et la susdite séquence nucléotidique, éventuellement après une étape préalable d'amplification de la susdite séquence nucléotidique, - la détection du complexe d'hybridation éventuellement formé;
- éventuellement le séquençage de la séquence nucléotidique formant le complexe d'hybridation avec la sonde de l'invention.

24. Utilisation d'une séquence d'acides nucléiques selon l'une quelconque des revendications 6 à 8, pour la production d'un polypeptide recombinant selon l'une quelconque des revendications 1 à 5.

25. Méthode de production d'une protéine recombinante SR-p70, caractérisée en ceque l'on cultive des cellules transfectées selon la revendication 10 ou 11 dans des conditions permettant l'expression d'un polypeptide recombinant de séquence SEQ ID n°2, SEQ ID n°4, SEQ ID n°6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n°13, SEQ ID n°15, SEQ ID n°17, ou SEQ ID n°19 ou tout fragment ou dérivé biologiquement actif, et que l'on récupère ledit polypeptide recombinant.

26. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'une quelconque des revendications 1 à 4.

27. Utilisation des anticorps selon la revendication précédente, pour la purification ou la détection d'un polypeptide selon l'une quelconque des revendications 1 à 4 dans un échantillon biologique.

28. Procédé de diagnostic in vitro de pathologies corrélées à une expression ou une accumulation anormale de protéines SR-p70, notamment les phénomènes de cancérisation, à partir d'un prélèvement biologique, caractérisé en ce que l'on met en contact au moins un anticorps selon la revendication 25 avec ledit prélèvement biologique, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre une protéine SR-p70 et le ou lesdits anticorps et en ce que l'on détecte les complexes immunologiques spécifiques éventuellement formés.

29. Kit pour le diagnostic in vitro d'une expression ou une accumulation anormale de protéines SR-p70 dans un prélèvement biologique et/ou pour la mesure du taux d'expression de celles-ci dans ledit prélèvement comprenant:

- au moins un anticorps selon la revendication 25, éventuellement fixé sur un support, - des moyens de révélation de la formation de complexes antigènes/anticorps spécifiques entre une protéine SR-p70 et ledit anticorps et/ou des moyens de quantification de ces complexes.

30. Méthode pour le diagnostic précoce de la formation des tumeurs caractérisée en ce que l'on met en évidence dans un échantillon de sérum prélevé chez un individu des auto-anticorps dirigés contre une protéine SR-p70 selon les étapes consistant à mettre en contact un échantillon de sérum prélevé chez un individu avec un polypeptide de l'invention, éventuellement fixé sur un support, dans desconditions permettant la formation de complexes immunologiques spécifiques entre ledit polypeptide et les auto-anticorps éventuellement présents dans l'échantillon de sérum, et en ce que l'on détecte les complexes immunologiques spécifiques éventuellement formés.

31. Méthode de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une insertion, d'une perte d'hétérozygotie ou d'une anomalie génétique du gène SR-p70 caractérisée en ce qu'elle utilise au moins une séquence nucléotidique selon l'une quelconque des revendications 6 à 8.

32. Méthode de détermination d'une variabilité allélique du gène SR-p70 au niveau de la position -30 et -20 par rapport à l'ATG d'initiation de l'exon 2 pouvant être impliquée dans des pathologies et caractérisée en ce qu'elle comprend au moins:
- une étape au cours de laquelle on procède à l'amplification par PCR de l'exon 2 du gène SR-p70 portant la séquence cible à l'aide de couple d'amorces oligonucléotidiques selon l'une quelconque des revendications 6 à 8;
- une étape au cours de laquelle on procède au traitement des produits amplifiéspar un enzyme de restriction dont le site de coupure correspond à l'allèle recherché;
- une étape au cours de laquelle on procède à la détection ou au dosage d'au moins l'un des produits de la réaction enzymatique.

33. Composition pharmaceutique comprenant, à titre de principe actif, un polypeptide selon l'une quelconque des revendications 1 à 4.

34. Composition pharmaceutique selon la revendication précédente caractérisée en ce qu'elle comprend un polypeptide selon la revendication 2.

35. Composition pharmaceutique contenant un inhibiteur ou un activateur de l'activité
du SR-p70.

36. Composition pharmaceutique contenant un polypeptide dérivé d'un polypeptide selon l'une quelconque des revendications 1 à 5 caractérisé en ce qu'il est un inhibiteur ou un activateur du SR-p70.