PT1012286E

PT1012286E - Variante alélica stat3 humana

Info

Publication number: PT1012286E
Application number: PT98951396T
Authority: PT
Inventors: Ottaviano Serlupi-Crescenzi; Linda Della Pietra
Original assignee: Applied Research Systems
Priority date: 1997-09-16
Filing date: 1998-09-15
Publication date: 2006-12-29
Also published as: US20030166854A1; EP1012286B1; EP0905234A2; US6660848B2; JP2001516578A; WO1999014322A3; US6369198B1; ES2272010T3; DE69836278D1; EP1012286A2; WO1999014322A2; EP0905234A3; DE69836278T2; DK1012286T3; AU9743698A; ATE343633T1

Description

1

DESCRIÇÃO "VARIANTE ALÉLICA DA STAT3 HUMANA"

ÁREA DA INVENÇÃO A presente invenção relaciona-se com uma variante alélica da STAT3 humana, com a sequência de ADNc que a codifica, com a sua utilização em terapêutica e/ou no diagnóstico de doenças autoimunes e/ou inflamatórias, bem como com as composições farmacêuticas que a contêm.

ANTECEDENTES DA INVENÇÃO

As proteínas Transdutoras de Sinal e Activadoras de Transcrição (STAT) são uma nova classe de factores de transcrição intracelulares que desempenham uma função essencial na resposta celular de citocinas (Stahl et al., 1994; Gouilleux et al., 1995; Azam et al., 1995; Tian et al., 1994; May et al., 1996; e Iwatsuki et al., 1997). A maior parte destas proteínas foram bem caracterizadas por sequenciação, e a sua estrutura bem como o mecanismo das suas acções foram largamente analisados e estão bem documentados (Wegenka et al., 1993; Akira et al., 1994; Wegenka et al., 1994; Quelle et al., 1995 e Silva et al., 1996) .

Estas proteínas contêm domínios SH2 e SH3 bem como um sítio de fosforilação na sua região carboxilo terminal (Kapetein et al., 1996; e Herman et al., 1996). Após activação do receptor de citocina através da ligação do 2 ligando, a parte intracelular do receptor torna-se fosforilada por uma cinase associada da família JAK.

As proteínas STAT ligam-se em seguida ao receptor fosforilado, através do seu domínio SH2 e são, por sua vez, fosforiladas pelas JAKs (Stahl et al., 1995). Em seguida as proteínas STAT fosforiladas dimerizam e deslocam-se para o núcleo, onde elas são capazes de reconhecer elementos reactivos de ADN específicos (Seidel et al., 1995; e Harroch et al., 1994). A STAT3 foi identificada como um mediador importante do sinal comunicado pela família IL-6 de citocinas, bem como pelo EGF e por um conjunto de outras interleucinas e factores de crescimento.

Foi demonstrado que a STAT3 desempenha uma função central na regulação positiva de proteínas hepáticas de fase aguda (Wegenka et al., 1993; e Zhang et al., 1996) na paragem do crescimento de células monocíticas (Yamanaka et al., 1996; e Minami et al., 1996) e na sobrevivência de células de mieloma (Harroch et al., 1994). J. Biol. Chem. , May 31, 1996, 271 (22), pág. 13221-7, Caldehoven E. e tal., "STAT3p, a splice variant of transcription factor STAT3, is a dominant negative regulator of transcription" descreve a proteína STAT3P· É ainda descrita uma molécula de ADN que codifica a referida STAT3P e um vector de expressão numa célula hospedeira para a produção recombinante da proteína. A EP 0 676 469 descreve o factor de resposta de fase aguda humano (APRF) o qual transmite o sinal de transcrição 3 do receptor de IL-6 para o gene induzido pela IL-6. É ainda descrita uma molécula de ADN que codifica a proteína, um vector de expressão que contém a referida molécula de ADN, uma célula hospedeira compreendendo o referido vector de expressão e um processo recombinante para preparar a referida proteína.

DESCRIÇÃO DA INVENÇÃO

No decurso das experiências na análise das interacções da STAT3, nós amplificamos por RT-PCR um fragmento de ADNc de células HepG2 correspondente ao domínio SH2 da STAT3 humana. Nós constatamos por sequenciação de ADN que o domínio SH2 que nós isolamos apresenta uma divergência de 13 resíduos em relação à sequência correspondente do gene da STAT3 humana originalmente publicada (Akira et al., 1994) .

Para determinar a natureza desta variante de sequência, nós concebemos três pares de iniciadores com extremidades 3' que correspondem a posições nucleótidas na variância entre as duas sequências de ADNc humano.

Após estas investigações tornou-se evidente que a nova variante corresponde pelo menos ao alelo mais frequente da STAT3 humana.

Por conseguinte, o objecto principal desta invenção é a variante alélica supramencionada da proteína STAT3 humana compreendendo a sequência de aminoácidos da SEQ ID NO: 2, ou um sal funcionalmente equivalente, ou um derivado funcionalmente equivalente, ou uma fracção activa, ou uma proteína de fusão. 4 A definição "sal" como aqui utilizada refere-se a sais dos grupos carboxilo e a sais das funções amino do composto que podem ser obtidos através de métodos conhecidos. Os sais de grupos carboxilo incluem sais inorgânicos como, por exemplo, sais de sódio, potássio, cálcio e sais com bases orgânicas como os preparados com uma amina tal como trietanolamina, arginina ou lisina. Os sais dos grupos amino incluem, por exemplo sais com ácidos inorgânicos como ácido clorídrico e com ácidos orgânicos como ácido acético. A definição "derivado" como aqui utilizada refere-se a derivados que podem ser preparados a partir dos grupos funcionais presentes nas cadeias laterais das unidades aminoácido ou nos grupos N- ou C-terminais segundo métodos conhecidos e que estão incluídos na invenção quando eles são farmaceuticamente aceitáveis i.e. quando eles não destroem a actividade da proteína ou não conferem toxicidade às composições farmacêuticas que os contêm. Estes derivados incluem, por exemplo, amidas alifáticas ou ésteres dos grupos carboxilo e derivados N-acilo dos grupos amino livres ou derivados O-acilo dos grupos hidroxilo livres e são preparados com grupos acilo como, por exemplo, grupos alcanoílo ou aroílo.

Como "fracção activa" da proteína, a presente invenção refere-se a qualquer fragmento ou precursor da cadeia polipeptídica do próprio composto, sozinho ou em combinação com moléculas relacionadas ou resíduos ligados àquele, por exemplo resíduos de açúcares ou fosfatos, ou agregados da molécula polipeptídica quando tais fragmentos ou precursores apresentam a mesma actividade da proteína da invenção, como medicamento. 5 A definição “proteína de fusão" como aqui utilizada refere-se a polipéptidos que compreendem o polipéptido da invenção acima especificado fundido com uma outra proteína e possuindo um maior tempo de semivida em fluidos orgânicos. Ele pode, por exemplo, estar fundido com uma outra proteína tal como, por exemplo, uma imunoglobulina.

Um outro objecto da invenção é a molécula de ADN compreendendo a sequência de ADN que codifica a variante alélica da invenção, incluindo as sequências de nucleótidos essencialmente iguais. “Sequências de nucleótidos essencialmente iguais" inclui todas as outras sequências de ácido nucleico que, em virtude da degeneração do código genético, também codificam as referidas sequências de aminoácidos. Em particular, a presente invenção refere-se à sequência de nucleótidos que compreende a SEQ ID NO: 1. A presente invenção refere-se também às moléculas de ADN recombinante que hibridizam com a sequência de ADN que codifica a variante alélica da hSTAT3 supramencionada e cuja sequência de nucleótidos apresenta pelo menos 13 diferenças no domínio SH2 (relativamente à sequência da STAT3 humana em Akira et al., 1994), como se mostra na Figura 1. 0 gene pode conter, ou não, os intrões naturais e pode ser obtido, por exemplo, por extracção de células apropriadas e purificação com métodos conhecidos.

Além disso, a presente invenção também inclui moléculas de ADN recombinante que hibridizam em condições rigorosas com uma sonda possuindo uma sequência de nucleótidos seleccionada entre SEQ ID NO: 16 e SEQ ID NO: 17. 6 0 termo "condições rigorosas" refere-se às condições de hibridização e lavagem subsequente que os técnicos médios na matéria referem convencionalmente como "rigorosas". Ver Ausubel et al., Current Protocols in Molecular Biologic supra. Interscience. N.Y. pare. 6.3 e 6.4 (1987, 1992), e Sambrook et al, 1989. Sem restrição, os exemplos de condições rigorosas incluem condições de lavagem 12-20 °C abaixo do Tm calculado do híbrido em estudo, por exemplo 2 x SSC e 0,5% de SDS durante 5 minutos, 2 x SSC e 0,1% de SDS durante 15 minutos; 0,1 x SSC e 0,5% de SDS a 37 °C durante 30-60 minutos e depois 0,1 x SSC e 0,5% de SDS a 68 °C durante 30-60 minutos. Os técnicos médios na matéria compreendem que condições rigorosas dependem também do comprimento das sequências de ADN, sondas de oligonucleótidos (tais como 10-40 bases) ou sondas mistas de oligonucleótidos. Se forem utilizadas sondas mistas é preferível utilizar cloreto de tetrametilamónio (TMAC) em vez de SSC. Ver Ausubel. supra. A invenção também inclui vectores de expressão que compreendem os ADNs anteriores, células hospedeiras transformadas com esses vectores e um processo de preparação dessa variante alélica da hSTAT3, os seus fragmentos ou proteínas de fusão activos, através da cultura em meio de cultura apropriado das referidas células transformadas. A sequência de ADN que codifica a proteína da invenção pode ser inserida e ligada a um plasmídeo adequado. Uma vez preparado, o vector de expressão é introduzido numa célula hospedeira adequada, a qual expressa em seguida o(s) vector(es) para produzir a proteína desejada. 7 A expressão de qualquer uma das proteínas recombinantes da invenção como aqui mencionada pode ser efectuada em células eucariotas (por exemplo células de leveduras, insecto ou mamífero) ou células procariotas, utilizando os vectores de expressão apropriados. Pode utilizar-se qualquer método conhecido na matéria.

Por exemplo, as moléculas de ADN que codificam as proteínas obtidas por qualquer um dos métodos anteriores são inseridas em vectores de expressão adequadamente construídos por técnicas bem conhecidas na matéria (ver Sambrook et al, 1989) . Liga-se ADNc de cadeia dupla a vectores de plasmídeo por terminação homopolimérica ou por ligação por restrição envolvendo a utilização de grupos de ligação de ADN sintético ou técnicas de ligação de extremidade plana: são utilizadas ADN-ligases para ligar as moléculas de ADN, evitando-se a junção indesejada por tratamento com fosfatase alcalina.

Para se conseguir expressar a proteína desejada, um vector de expressão deveria também compreender sequências específicas de nucleótidos que contêm informação reguladora de transcrição e tradução ligadas ao ADN que codifica a proteína desejada de modo a permitir a expressão do gene e a produção da proteína. Em primeiro lugar para o gene ser transcrito, ele tem de ser precedido por um promotor que possa ser reconhecido pela ARN-polimerase, ao qual se liga a polimerase e inicia, desse modo, o processo de transcrição. Existe uma variedade desses promotores em uso, os quais funcionam com eficácias diferentes (promotores fortes e fracos). 8

Para hospedeiros eucariotas pode utilizar-se várias sequências reguladoras da transcrição e tradução, dependendo da natureza do hospedeiro. Elas podem ser provenientes de fontes virais, tais como adenovirus, vírus do papiloma bovino, vírus Símio ou semelhantes, em que os sinais reguladores estão associados com um gene específico o qual tem um nível elevado de expressão. São exemplos o promotor TK do vírus da Herpes, o promotor precoce SV40, o promotor do gene gal4 da levedura, etc. Podem ser seleccionados sinais reguladores do início da transcrição que permitam a repressão e activação, de modo a que se possa modular a expressão dos genes. A molécula de ADN que compreende a sequência de nucleótidos que codifica a proteína da invenção é inserida em vector(es), possuindo os sinais reguladores da transcrição e tradução ligados operacionalmente, que é capaz de integrar as sequências de genes desejadas na células hospedeira.

As células que foram transformadas de modo estável pelo ADN introduzido podem ser seleccionadas introduzindo também um ou mais marcadores que permitem a selecção de células hospedeiras que contêm o vector de expressão. 0 marcador também pode proporcionar fototrofia a um hospedeiro auxotrópico, resistência a biocidas, por exemplo antibióticos, ou metais pesados tais como cobre, ou semelhantes. 0 gene marcador seleccionável pode estar ligado directamente às sequências de ADN a serem expressadas ou introduzido na mesma célula por co-transfecção. Também podem ser necessário elementos adicionais para a síntese óptima de proteínas da invenção. 9

Os factores importantes na selecção de um plasmídeo ou vector virai particular incluem: a facilidade com que as células receptoras que contêm o vector podem ser reconhecidas e seleccionadas das células receptoras que não contêm o vector; o número de cópias do vector que são desejadas num hospedeiro particular; e se é desejável ser-se capaz de "transferir" o vector entre células hospedeiras de espécies diferentes.

Uma vez preparados o(s) vector (es) ou sequência de ADN que contém a(s) construção(ões) para expressão da(s) construção(ões) de ADB eles podem ser introduzidos numa célula hospedeira apropriada por qualquer um de uma variedade de meios adequados: Transformação, transfecção, conjugação, fusão de protoplasto, electroporação, precipitação com fosfato de cálcio, microinjecção directa, etc.

As células hospedeiras podem ser procariotas ou eucariotas. São preferidas células eucariotas, por exemplo células de mamíferos, tais como células de humano, macaco, ratinho e células de Ovário de Hamster Chinês (CHO), porque elas proporcionam modificações pós-tradução nas moléculas de proteína, incluindo enrolamento correcto ou glicosilação em sítios correctos. De igual modo, as células de levedura podem efectuar modificações pós-tradução do péptido incluindo glicosilação. Existe um conjunto de estratégias de ADN recombinante que utilizam sequência promotoras fortes e um número elevado de cópias de plasmídeo que podem ser utilizadas para a produção das proteínas desejadas em levedura. A levedura reconhece sequências líder em produtos de genes de mamíferos clonados e segrega péptidos portadores de sequências líder (i.e., pré-péptidos). 10

Após a introdução do(s) vector(es), as células hospedeiras são multiplicadas num meio selectivo, o qual selecciona o crescimento de células possuindo o vector. A expressão da(s) sequência(s) do gene clonado leva à produção das proteínas desejadas. A purificação das proteínas recombinantes é realizada por qualquer um dos métodos conhecidos para este fim, i.e. qualquer procedimento convencional envolvendo extracção, precipitação, cromatografia, electroforese ou semelhantes. Um outro procedimento de purificação que pode ser preferencialmente utilizado para purificar a proteína da invenção é a cromatografia de afinidade utilizando anticorpos monoclonais que se ligam à proteína alvo e que são produzidos e imobilizados numa matriz de gel contida dentro de uma coluna. Passa-se preparações impuras que contêm a proteína recombinante através da coluna. A proteína ligar-se-á à coluna através do anticorpo especifico ao passo que as impurezas passá-la-ão sem serem retidas. Depois de lavar, a proteína é eluída do gel por uma alteração no pH ou na força iónica.

Como já foi mencionado, a proteína da invenção é útil na terapêutica e/ou diagnóstico de doenças autoimunes e/ou inflamatórias. Por conseguinte, num outro aspecto, a presente invenção proporciona a utilização da proteína da invenção no fabrico de um medicamento para o tratamento de doenças autoimunes e/ou doenças inflamatórias. O medicamento é preferencialmente apresentado na forma de uma composição farmacêutica compreendendo a proteína da invenção em conjunto com um ou mais veículos e/ou excipientes farmaceuticamente aceitáveis. Estas composições 11 farmacêuticas constituem ainda um outro aspecto da presente invenção. A invenção será agora descrita através dos Exemplos seguintes, os quais não deverão ser interpretados como restringindo a presente invenção seja de que forma for. Os Exemplos referir-se-ão às Figuras especificadas a seguir.

DESCRIÇÃO DAS FIGURAS

Figura 1: Mostra uma comparação da sequência de ADNc do domínio SH2 da STAT3 humana depositada no EMBL-GB com os correspondentes fragmentos de HepG2 humana e de ADNc do fígado de ratinho. A sequência de nucleótidos com 424 bp apresentada e a sua numeração são da sequência de ADNc do domínio SH2 da STAT3 humana depositada nos bancos de dados EMBL-GB (Akira et al., 1994). Os nucleótidos na variante identificada nos ADNc da HepG2 humana (este pedido de patente) e do fígado de ratinho (Akira et al., 1994) são descritos acima da sequência total, a negrito e sublinhados. Também na sequência total é indicada a negrito e sublinhado a alteração de nucleótidos que resultam numa variação a nível dos aminoácidos, estando uma Leucina codificada na sequência depositada substituída por uma Valina na nova sequência deste pedido de patente. Os iniciadores USO; LSO; US1; LSI; LS2; US3; LS3; US4 e LS4, utilizados nas reacções de RT-PCR são indicados por pontas de seta por cima das sequências.

Figura 2. Descreve a sequência total de nucleótidos da STAT3 humana isolada de células HepG2, em particular a região de codificação. 12 A. A estratégia de sequenciação. B. A sequência completa de nucleótidos. Os nucleótidos em desacordo com a sequência conhecida publicada são mostrados a negrito e sublinhado. Os residuos de aminoácido modificados relativamente à sequência publicada são apresentados por baixo da sequência de nucleótidos.

Figura 3. Mostra a análise da expressão dos ADNc da hSTAT3 originalmente publicada e da nova variante hSTAT3. 0 ARN foi extraído com o reagente de Trizol, submetido a transcrição reversa com oligo(dT) e a reacção de PCR analítica foi realizada com a Taq polimerase em tubos capilares, como se descreve nos Exemplos. A. Produtos de PCR amplificados com o par de iniciadores US1/LS1 específicos para a sequência de hSTAT3 original publicada. B. Produtos de PCR amplificados com o par de iniciadores US3/LS3 específico para a nova variante da sequência hSTAT3 apresentada neste pedido de patente. Pistas: M) Marcadores de tamanho molecular. 1) ARN de fígado. 2) ARN do baço. 3) ARN do útero. 4) ARN do pulmão. 5) ARN da pele. 6) ARN dos glóbulos vermelhos do cordão umbilical. 7) ARN de fibroblastos dérmicos. 8) ARN do coração sem transcriptase inversa. 9) ARN do coração. 10) ARN de fígado fetal sem transcriptase inversa. 11) ARN de fígado fetal. 12) ARN do intestino delgado sem transcriptase inversa. 13) ARN do intestino delgado. 14) ARN placentário sem transcriptase inversa. 15) ARN placentário.

Figura 4. Mostra a amplificação da cadeia molde de ADN artificial com iniciadores US1/LS1. A cadeia molde de ADN artificial constituída pelo fragmento da sequência variante 13 de hSTAT3 flanqueado na sua extremidade 5' pela sequência iniciadora US1 e na sua extremidade 3' pela sequência iniciadora LSI, foi criada por PCR preparativa, utilizando os iniciadores US4/LS4, do ADNc da HepG2 (onde poderia ser apenas amplificada a sequência variante, não mostrado), como se descreve na secção de Materiais e métodos. A cadeia molde artificial foi fraccionada em gel de 2% de agarose e a banda relevante de 285 bp foi purificada com o estojo de extracção de ADN de gel de agarose (Boeringer Mannheim, Mannheim, Alemanha). Esta cadeia molde foi depois adicionada a várias concentrações a 1 μΐ do ADNc relevante (proveniente de aproximadamente 100 ng do ARN correspondente). Pistas: M) Marcadores de tamanho molecular. 1) Sem adição. 2) 0,3 fg de cadeia molde artificial fortificada. 3) 3 f g de cadeia molde artificial fortificada 4) 30 fg de cadeia molde artificial fortificada . 5) 300 fg de cadeia molde artificial fortificada.

Figura 5. Mostra a análise por PCR do fragmento da sequência genómica da hSTAT3 original e da nova variante da hSTAT3. Utilizou-se 40 ng do ADN genómico humano nas reacções de PCR analítico realizadas em tubos capilares, como se descreve na secção de Materiais e métodos. Pistas: M) Marcadores de tamanho molecular. 1, 4) ADN genómico amplificado com o par de iniciadores US1/LS1, específico para a sequência da hSTAT3 original, publicada. 2) ADN genómico amplificado com o par de iniciadores US1/LS2, específico para a sequência da hSTAT3 original, publicada. 3) ADN genómico amplificado com o par de iniciadores US3/LS3 específico para a nova sequência da hSTAT3 variante. 5, 6, 7, 8) ADN genómico amplificado com o par de iniciadores US1/LS1 e fortificado com 0,3, 3, 30 e 300 fg 14 respectivamente, da cadeia molde de ADN artificial amplificada com US4/LS4.

EXEMPLOS

MATERIAIS E MÉTODOS

Materiais A linha celular de hepatoma humano HepG2 foi da ATCC (Rockville, Md., USA). Os ARN totais humanos de coração, figado, figado fetal, intestino delgado, placenta e o ADN genómico humano foram obtidos de Clontech (Paio Alto, Calif., USA). Outros ARN utilizados neste pedido de patente foram preparados no nosso laboratório. A Pfu polimerase foi da Stratagene (La Jolla, Calif., USA) ; A ADN Taq polimerase foi da Advanced Biotechnology, Leatherhead, UK. 0 estojo de sequenciação da ADN foi da Perkin Elmer (Applied Biosystems Division, Foster City, Calif., USA); a transcriptase inversa SuperScript II (200 U/μΙ) e o Reagente Trizol para extracção do ARN foram da Gibco (Grand Island, N.Y., USA).

Iniciadores de oligonucleótidos

Todos os iniciadores utilizados neste pedido de patente foram concebidos no nosso laboratório utilizando o suporte lógico OLIGO (National Biosciences, Plymouth, Minn., USA), para optimizar a especificidade da amplificação por PCR de sequências de cadeias molde de nucleótidos que diferem apenas em um ou nalguns nucleótidos. 15

Todos os iniciadores foram sintetizados no nosso laboratório, com um Sintetizador de ADN/ARN 392 da Perkin Elmer (Applied Biosystems Division, Foster City, Calif., USA). Utilizou-se um primeiro par de iniciadores, USO/LSO, para isolamento das 424 bp contendo o ADNc do domínio SH2 total da STAT3 humana.

As sequências de nucleótidos de todos os iniciadores utilizados são mostradas abaixo.

Iniciador uso 5 ' AAC ACC ATG CCC TGG CTA GAG AAT ATC ATC GAC CTT SEQ ID NO: : 7 CTG AAA AAG TA 3 ' Iniciador LSO 5 ' ATA TAT GGA TCC TGG CCC AGC GCT ACC TCG GTC AGC SEQ ID NO: 8 TTC 3 ' Iniciador STAU 5 ' TCC CCC CAA GCT TCA CAC GCG CAG CCC CGG CTT CT 3' SEQ ID NO: 9 Iniciador STAL 5 ' GTT CAT CAC TTT TGT GTT TGT GCC CAG AAT 3' SEQ ID NO: 10 Iniciador STBU 5 ' GAC AAA GAC TCT GGG GAC GTT GCA GCT CTC 3' SEQ ID NO: 11 Iniciador STBL 5 ' TCA GTC CTC GAG TAT CTT TCT GCA GCT TCC GTT CT 3' SEQ ID NO: 12 Iniciador UST 5 ' TGA AGG GTA CAT CAT GGG TTT C 3 ' SEQ ID NO: 13 Iniciador LSI 5' TCA GGA TAG AGA TAG ACA ACT GGA GAG AA 3' SEQ ID NO: 14 Iniciador LS2 5' CCT CCT TCT TTG CTG CTT TCA CTG AAG 3' SEQ ID NO: 15 Iniciador US3 5' CGA AGG GTA CAT CAT GGG CTT T 3' SEQ ID NO: 16 Iniciador LS3 5' CCT CCT TCT TTC CTG CTT TCA CTG AAT CTT 3' SEQ ID NO: 17 Iniciador US4 5' TGA AGG GTA CAT CAT GGG TTT CAT GAG TAA GGA 3' SEQ ID NO: 18 Iniciador LS4 5' TCA GGA TAG AGA TAG ACA ACT CGA GAG AAC AGG ATA SEQ ID NO: 19 T 3' A posição dos iniciadores USO/LSO na sequência da hSTAT3 é mostrada na Figura 1.

Outros iniciadores para isolar o ADNc da STAT3 humana total foram: Iniciador STAU, Iniciador STAL, Iniciador STBU e Iniciador STBL.

Dois pares iniciadores adicionais, designados US1/LS1 e US1/LS2, que amplificam produtos de 285 e 111 bp respectivamente, eram específicos de modo único para a sequência de ADNc da STAT3 humana original, publicada 16 (Akira et al., 1994), mas não para a sequência variante da hSTAT3 que nós apresentamos neste pedido de patente. Pelo menos um nucleótido em desacordo entre as sequências da STAT3 publicada e variante estava posicionado na extremidade 3' de cada iniciador. 0 par de iniciadores US3/LS3 era específico de modo único para a sequência de hSTAT3 variante descrita neste pedido de patente. Este par de iniciadores US3/LS3 não amplificou um fragmento de 111 bp especificamente na sequência da variante da hSTAT3, correspondente à sequência amplificada pelos iniciadores US1/LS2 na sequência de ADNc da hSTAT3 original, publicada.

Utilizou-se um par de iniciadores de validação, US4/LS4, para criar uma cadeia molde de hSTAT3 artificial de 285 bp correspondente ao produto esperado dos iniciadores US1/LS1.

ARN e RT-PCR

Preparou-se ARN total de células HepG2 humanas pelo método de Birnboim (Birnboim, 1988). Para outros tecido e células, extraiu-se o ARN com o reagente de Trizol disponível de Gibco, Grand Island, N.Y., USA, seguindo as instruções do fabricante.

Utilizou-se Oligo(dT) para preparar a transcrição inversa de 5 μg de ARN total com 200 U de transcriptase inversa (RT) SuperScript II em 50 μΐ de mistura reaccional. A reacção com a RT foi realizada a 37 °C durante 1 h e 30 min. Realizou-se em seguida PCR preparativa utilizando os produtos da RT como cadeias moldes de ADNc. As reacções de 17 PCR continham 10 μΐ de ADNc, 50 pmoles de cada iniciador (ver abaixo), 2,5 unidades de Stratagene Pfu polimerase, 0,2 mM de cada um dos quatro desoxinucleótidos trifosfatos, 10 μΐ de tampão Pfu, num volume reaccional de 100 μΐ, coberta com 50 μΐ de óleo mineral. A amplificação foi geralmente realizada durante 30 ciclos com um perfil de temperatura de 45 segundos a 94 °C (desnaturação), 45 segundos a 50 até 60 °C (emparelhamento) e 5 minutos a 72 °C (extensão) . Os produtos de PCR foram purificados por centrifugação através de filtros Microcon 100 (Amicon) e depois submetidos a electroforese em geles de 1,5% de agarose em tampão de Tris/borato/EDTA. Os PCRs analíticos foram realizados em tubos capilares, com a mesma concentração de reagentes descrita acima num volume dez vezes menor, excepto para a Pfu polimerase a qual foi substituída por 0,5 U de Taq polimerase. O perfil de temperatura foi de 94 °C para a desnaturação, 55 °C para o emparelhamento e 72 °C para a extensão.

Seguenciação de ADN

Os produtos de PCR da STAT3 foram sequenciados como representado na Figura 2. As sequências de ADN foram realizadas com o método do didesoxi, utilizando um estojo de sequenciação de ADN (Perkin Elmer, Applied Biosystems Division, Foster City, Calif., USA) num sequenciador automático ABI modelo 373A, seguindo as instruções do fabricante. As sequências de nucleótidos de todos os fragmentos de ADNc foram determinadas por sequenciação de ambas as cadeias de ADN. A sequência de nucleótidos e a 18 sequência deduzida de aminoácidos foram comparadas com as existentes no GenBank e no banco de dados Swiss-Prot.

Resultados e Discussão

Isolamento e sequenciação de um fragmento de ADNc que codifica a STAT3 humana

Para isolar o domínio SH2 da STAT3 humana, nós amplificamos por RT-PCR, um fragmento de ADNc com 424 pares de bases correspondentes às posições de nucleótidos entre 1909 e 2332 da sequência de ADNc da STAT3 placentária humana publicada (Akira et al., 1994), utilizando ARN total de células HepG2.

Este fragmento de PCR foi depois inserido num vector de expressão, e determinou-se a sequência de nucleótidos. Os resultados (Figura 1) mostraram que 13 resíduos de nucleótidos diferiram da sequência original de ADNc placentário humano. A grande maioria dos 13 resíduos modificados estava localizada na posição do terceiro códão, não provocando qualquer alteração na sequência de aminoácidos correspondente.

Apenas um resíduo de nucleótido mutado provocou a substituição de uma leucina na posição 667 na proteína STAT3 humana por uma valina (Figura 1). Nós amplificamos em seguida a partir de células HepG2 mais dois fragmentos de ADNc correspondentes à região de codificação total do ADNc da STAT3 humana. A sequenciação destes fragmentos (Figura 2) demonstrou que na globalidade 43 nucleótidos estavam em desacordo com a sequência publicada, correspondendo a um total de 6 alterações de aminoácidos (Akira et al., 1994). 19

Sabe-se que as sequências consenso da STAT3 humana e murídea, publicadas diferem em 172 nucleótidos, ao passo que a sequência da STAT3 humana nova que nós apresentamos difere em 193 residuos relativamente à sequência de ratinho (Raz et al., 1994; Akira et al., 1994; Zhong et al., 1994).

Assim, ao nível do nucleótido, a sequência da STAT3 humana nova corresponde a uma distância evolucionária ligeiramente aumentada em relação à sequência murídea. Uma região entre os nucleótidos 1680 e 1940 da sequência humana original mostrou uma conservação elevada de nucleótidos entre o homem e o ratinho. Esta conservação perde-se quando é considerada a nova sequência humana apresentada neste pedido de patente.

Pelo contrário, ao nível dos aminoácidos a nova sequência humana está mais próxima da sequência murídea. Todas as seis alterações na sequência de aminoácidos da STAT3 humana nova fornecem os correspondentes resíduos de ratinho (e ratazana) originais, pelo que existe apenas um resíduo a diferir entre a sequência humana e a sequência de consenso de 770 aminoácidos da STAT3 de ratinho: um ácido glutâmico na posição 760 da sequência humana está substituído por um ácido aspártico na sequência do ratinho. Por conseguinte, a sequência da STAT3 codificada corresponde agora a uma das mais conservadas entre determinantes genéticos conhecidos. Como uma referência, as proteínas STAT1 e STAT5 de ratinho e humana diferem em 67 e 29 resíduos de aminoácido, respectivamente.

Sabe-se que a STAT3, como outros membros da família STAT, ligam várias proteínas diferentes para efectuar as suas funções múltiplas (Darnell, 1997). O domínio SH2 da 20 STAT3 interactua com a parte intracelular das moléculas receptoras de transdução do sinal; a região C-terminal é importante para activação e dimerização (Sasse et al., 1997) e a região central é importante para ligação ao ADN (Horvath et al., 1995).

Entre as seis alterações de aminoácidos descritas no presente pedido de patente, uma cai dentro da região N-terminal, na posição 288. A segunda alteração de aminoácido cai na posição 460, no domínio de ligação de ADN. Duas alterações adicionais caem dentro do domínio SH3, nas posições 548 e 561 respectivamente.

Finalmente, mais duas alterações de aminoácidos caem dentro do domínio SH2 na posição 667 e na região C-terminal, na posição 730 respectivamente (ver Figura 2).

Caracterização da nova variante da sequência da STAT3

Para determinar a natureza da nova variante da sequência aqui apresentada, nós concebemos três pares de iniciadores com extremidades 3' correspondentes às posições de nucleótidos que diferem entre as duas sequências de ADNc humana. Nós determinamos que os primeiro e segundo pares de iniciadores (US1/LS1 e US1/LS2) foram exclusivamente específicos para a sequência de nucleótidos do ADNc da hSTAT3 original, publicada, ao passo que o terceiro par de iniciadores (US3/LS3) foi exclusivamente específico para a nova variante da sequência de nucleótidos da STAT3 humana. Nós utilizamos os dois pares iniciadores US1/LS1 e US3/LS3 (específicos para as sequências original e a nova variante, respectivamente) para amplificar os ARNs de 11 21 tecidos humanos diferentes em 22 reacções de RT-PCR separadas. Cada fonte de ARN que nós examinamos foi proveniente de grupos de 1 até 17 indivíduos, com um total de 31 indivíduos analisados.

Uma vez que a sequência de ADNc da hSTAT3 original era proveniente da placenta humana, este tecido foi incluído entre as 11 fontes de ARN testadas. Como se mostra na Figura 3, apenas o par de iniciadores específicos para a nova variante da sequência foram capazes de amplificar todos os 11 RN A testados, originando o produto de amplificação esperado, ao passo que não foi possível obter qualquer banda significativa em qualquer ARN testado com os iniciadores correspondentes à sequência da hSTAT3 original, publicada. Uma vez que os iniciadores da US1/LS1 não originaram qualquer produto de amplificação significativo, nós quisemos verificar se este insucesso era devido a um defeito nos iniciadores, quer na sua capacidade intrínseca para emparelhar com a cadeia molde apropriada quer na sua capacidade para preparar a reacção de amplificação.

Por outras palavras, nós quisemos validar o par de iniciadores US1/LS1. Assim foram concebidos iniciadores de validação US4/LS4 que se assemelhavam exactamente aos iniciadores US1/LS1, mas em que cada um dos iniciadores tinha uma extensão 3' igual à sequência variante da hSTAT3 determinada neste trabalho. A amplificação resultaria então numa cadeia molde híbrida artificial constituída pelo fragmento da sequência variante da hSTAT3, com as suas extremidades 5' e 3' idênticas aos iniciadores US1 e LSI respectivamente. Esta cadeia molde artificial deveria permitir uma amplificação 22 eficaz com os iniciadores US1/LS1, até mesmo na ausência da correspondente cadeia molde de ADN natural (i.e., o fragmento de ADNc da hSTAT3 original, publicada com 285 bp) .

Esta cadeia molde artificial foi obtida por PCR com iniciadores US4/LS4 e fortificada a concentrações diferentes no ADNc placentário humano e noutros ADNc humanos. Os iniciadores US1/LS1 foram depois utilizados para amplificar estes ADNc fortificados, tendo-se obtido prontamente um produto de PCR do tamanho esperado (Figura 4) . Por conseguinte, este resultado excluiu o fracasso do par de iniciadores US1/LS1 na reacção de amplificação. Nós utilizamos então os pares de iniciadores US1/LS1, US1/LS2 e US3/LS3 para amplificar o ADN genómico humano. 0 produto de amplificação esperado foi novamente obtido apenas com o par iniciador especifico para a nova sequência variante que nós determinamos (Figura 5). Nós demonstramos que as sequências da proteína STAT3 do ratinho e humana revista estão extremamente conservadas, diferindo as duas espécies ao longo dos 770 resíduos de aminoácidos de comprimento total em apenas um resíduo. Nós não conseguimos detectar a sequência de nucleótidos da hSTAT3 originariamente descrita por Akira et al. (Akira et al., 1994) em qualquer uma das fontes de ADN genómico ou ADNc que nós testamos. Por conseguinte, a sequência de nucleótidos original publicada e a nova sequência variante não são genes ou variantes de junção diferentes presentes em simultâneo no mesmo genoma, uma vez que se detectou apenas uma sequência (a identificada neste pedido de 23 patente) em cada fonte de ácido nucleico humano testada. As duas variantes da sequência da hSTAT3 poderiam ser alelos diferentes.

No entanto neste caso, a nova sequência variante é provavelmente predominante, uma vez que estava representada em todas as amostras de ácido nucleico testadas, provenientes de um total de 31 indivíduos. A sequência da hSTAT3 original, publicada não estava representada de todo nestes indivíduos. 24

Referências 1. Akira, S., et al., (1994) Cell 77, 63-71; 2. Azam, M., et al., (1995) EMBO Journal 14, 1402-1411; 3. Birnboim, H. C. (1988) Nucleic Acids Research 16, 1487- 14 9 7; 4. Darnell J. E. (1997) Science 277, 1630-1635; 5. Gouilleux, F., et al., (1995) EMBO Journal 14, 2005- 2013; 6. Gram, H., et al., (1992) Proceedings of the National

Academy of Sciences of the United States of America 89, 3576-3580; 7. Harroch, S., et al., (1994) Journal of Biological

Chemistry 269, 26191-26195; 8. Hemmann, U., et al., (1996) Journal of Biological

Chemistry 271, 12999-13007; 9. Horvath C. M. et al., (1995) Genes & Development 9, 984- 99 4; 10. Iwatsuki, K., et al., (1997) J. Biol. Chem. 272, 8149- 8152; 11. Kapetein, A., et al., (1996) Journal of Biological Chemistry 271, 5961-5964; 12. May, P., et al., (1996) FEBS. Lett. 394, 221-226; 13. Minami, M., et al., (1996) Proceedings of the National

Academy of Sciences of the United States of America 93, 3963-3966; 14. Quelle, F. W., et al., (1995) Molecular & Cellular

Biology 15, 3336-3343; 15. Raz, R., et al., (1994) Journal of Biological Chemistry 269, 24391-24395; 16. Sasse J. et al., (1997) Mol. Cell Biol. 17, 4677-4686; 25 17. Seidel, Η. M., et al., (1995) Proceedings of the

National Academy of Sciences of the United States of America 92, 3041-3045; 18. Shi, W., et al. , (1996) International Immunology 8, 1205-1211; 19. Silva, C. M., et al. , (1996) Molecular Endocrinology 10, 508-518; 20. Stahl, N., et al., (1994) Science 263, 92-95; 21. Stahl, N., et al., (1995) Science 267, 1349-1353; 22. Tian, S. S., et al., (1994) Blood 84, 1760-1764; 23. Wegenka, U. M., et al., (1993) Mol. Cell Biol. 13, 276- 288; 24. Wegenka, U. M., et al. , (1994) Molecular & Cellular Biology 14, 3186-3196; 25. Yamanaka, Y., et al. , (1996) EMBO Journal 15, 1557- 1565; 26. Zhang, D., et al. , (1996) Journal of Biological Chemistry 271, 9503-9509; 27. Zhong, Z., et al., (1994) Science 264, 95-98. 1

LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL:

(i) REQUERENTE (A) NOME: APPLIED RESEARCH SYSTEMS ARS HOLDING N.V.

(B) RUA: 14 JOHN B. GORSIRAWEG

(C) CIDADE: CURACAO

(E) PAÍS: ANTILHAS HOLANDESAS

(F) CÓDIGO POSTAL: NENHUM (G) TELEFONE: 599-9-639300 (H) TELEFAX: 599-9-614129

(I) TELEX: NENHUM

(ii) TÍTULO DA INVENÇÃO: VARIANTE ALÉLICA DA STAT3 HUMANA (iii) NÚMERO DE SEQUÊNCIAS: 19 (iv) FORMA LEGÍVEL POR COMPUTADOR: (A) TIPO DE MEIO: Disquete

(B) COMPUTADOR: IBM compatível com PC

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, Versão #1.30 (2) INFORMAÇÃO PARA SEQ ID NO: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2344 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MEN SAGEIRA: NÃO 2 (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..2310 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1: ATS GCC CM i W laf MT CAG cm CAG CAG CTT GAC ACA CGG TAC CTG GAG 48 .Met 1 Ala Gin Trp &sn 5 Gin L*u Gin Gin Leu 10 Asp Thr Axg Tyr Leu 15 Glu CAG CTC €AT CAG CTC TAC AGT GAC ASC TTC CCA ATO GAS CTG CGG CAG 96 0-1Ϊ5. teu :His 61 π teu Tyr Ser Asp Ser Phé J?ro Net Glu Leu Arg Gin 20 2:5 30 TXT CTG GCC ccr TGS ATT GAG AG? CAA GAT TGG CCA TAT GCG GCC AGC 144 PtlS: Leu Ala Pr o Trp lie Glu Ser Gin Asp Trp Ala Tyr Ala Ala Ser 35 40 45

MA. 6AA TGA CAT GCC ACT TTG GTG TTT CAT MT CTC CTG GGA GAG ATT 152 lys Glu. Ser His Ala Thr Leu Vai Pb* His Ãsn Leu Leu 61 y GiU íie 50 55 60 GAC CAG CAG TAX AGC CGC TTC CTG CM CAG TCG AAT GTT CTC TAT CAG 240 fep Gin Gin Tyr Ser Arg The Leu Gin Slu Ser Aan Vai Leu Tyr Gin 65 70 7 5 80 CAC MT CTA OSA ÀGA ATC AAG CAG TTT CAG AGC ASG 7ΆΤ CTT SAS 268 His ÀSO Leu Arg Arg Ile Lys Gin The Leu Gin Ser Arg Tyr Leu Glu 85 SO 55 MS CCA ATG MG ATT GCC CGG ATT GTG CCC CGG TSC CTG TGG GM GM 336 Lys Ara Metfc Glu XI e Ale A zg Ua Vai Ala Arg Cyá Lau Trp Glu Glu 100 .1.05 110 CGC CTT CTA CAG ACT GCA CCC ACT GCS GCC CAG CAA GGG GGC CAG 384 Ser Arg Leu Leu Gin Thr Ara Ala Thr Alá Ais Gin Gin Sly Sly Gi ri 115 120 125 GCC AAC CAC CCC ACA GCA GCC GTG GTG ACG GAG AAC CAG CAG ATG CTG 432 Ala Asn Ki.s Pro Thr Ala Ala. Vai Vai Thr Slu Lys Gin Gin Met Leu 130 135 i’4Ô GAG CAG CAC CTT CAG SAT 6TC CGG AAG AáA GTG CAG GAT CTA MA CAG 480 Glu Gin Hís. Leu Gin Asp Vai Arg & Àrg Vã.1 Glu Asp Leu Glu 61¾ 145 ISO 15*5 160 AM ATS AAA GTG GTA GAG AAT CTC CAG Γ! W ou·’, i GAC TTT GAT TTC AAC TAT 528 Lys Me t Lys Vai Vai Glu Ajsíi Leu Gin Asp Asp Phs Asp Phe Asri Tyr 165 170 175 AM ACC CTC AAG Mf CAA gga GAC ATS CAA GAf CTG MT GGA AAC AAC 576 Lys Thr Leu Lys Ser Gin Siy Asp Mefc Gin Asp Leu Asn Sly As Si Aso ISO MS ISO 3 CAG TCA STG ACC AGS CAG AAS ATS CAG CAG CTG GAA CAG ATG CTC ACT 624 Gin Ser Va.l Thr Arg Glu Lys «et Gin Gin teu Glíi Sln «et teu Thr 195 200· 205 GCG CTG gac CAG ATC CGC AOA AGC Aí, Xv GTG AST GAG CTG GCG EíGG CTT 672 .Ala Leu Asp Gin Met Ara Arg Set lie Vai Ser Glu Leu Alâ Gly LéU 2X0 215 22Ô TTG TCA GCG ATC GAG TAC GTG CAG AaA ACT CTC ACG GAC CAG GAG CTG 720 Leu Ser Ai a Hat Glu Tyr Vai Gin Lys Thr teu The Asp Glu Giu Leu 225 230 235 240 SCT íãAC TOO MG AGO CGG CAA CAG ATT GOC leeyVN· ATT «GA G^GC CCS CCC ?M Ala Asp Tfp Lys heq Arg Gin Gin lie Ala. Cys U« Giy Gly £r© Pr o MÍ 256 255 MC ATC TOC cm «AT cm cm GAA AAC TGG ATA ACG TCA TTA GCA. GM S16 Asm Ile Cys teu Asp Aeg Leu 01 u Asn Trp lie The Ser Léu Ma Glu 260 .265 270 TC? CAA CAG ACC CGT CAA ATT MG .AAA CTG GAG QAC TTG CAG 864 Ser Gin Leu. Gin Th£ Arg Gin Gin ile Lys Lys teu biiii Glu Leu Gin 275 280 285 CM AAA STT TCC TAC AAA QCQ. GAC ATT GTA CAG GAC CGG CCG ATG 912 Gin Lys Vai ser Lys Gly Asp Pro ile Vai Gin Hiâ Arg Prs Met 290 .205 309 CTG GAG ÀGÀ ATC CTC «AG CTG TTT AC.A AAC TTA ATG AAA ACT CCC 960 Leu GlU Gi.lu Arg Ile Vai Glís teu 0he Arg Asa teu «et Lys Ser Ale 305 310 315 320 TTT STG GTG GA-G CGG CAG CCC TGC ATO CCC ATG CAT CCT GAC CGG CCC 1008 Phe Vai Vai Giu Arg Gin Trs Cys «et Prô «et His Pre Asp Arg Fre 325 33Q 335 CTC «TC ATC MG ACC GGC GTC CAG TTC ACT ACT AAA GTC AGC TTG CTG ΐΰ Sê Leu Vai Us Lys Thr Gly Vai Gin Phe The The Lys Vai Aeg Leu teu 340 345 350 GTC MA TTC CCT GAG TTG AAT TAT CAS CTT AAA ATT AAA GTG TGC ATT 004 Vâ.i Lyâ 8he PtO Giu Leu Asn Tvr Gin teu Lys lie Lys Vai cy.s 11« 355 360 365 SAC AAA GAC TCT GG-G GAC GTT GCA j"'r?sn bG X CTC ASA GGA. TCC CGG AM TTT 032 Asp Lya Asp Sêc Gly Asp Vai Alâ. Aiã Leu Arg 51 y ser Arg tys The 370 37 S 3S0 AAC ATT cm GGC Ã.CA AAC ACA AAA GTG ATS AÂC ATG Ghh cm TCC MC 1200 Asn lie Leu Çiy Thr Asn ThE tya Vai «et Asn «et «Xu Glu Ser Asn 38,5 390 39.5 400 AAC CGC A®C CTC TCT GCA GAA TTC AAA CAC TTG ACC. CTG AG® CAL·? CAG 1248 Aati Gly Set Leu Set Ala Glu Phs Lys :hís Leu Thr teu Axg Giu Gin 4 05 410 415 4 4 ASA. TGT GSG AAT GGG GCC CGA GCC ÃAT *SíJl GAT GCT TCC CTG ATT GTG Arg Cys Gly Asn Gly ôiy Arg Ala Asn Cys Asp Ala Ser Leu He Vai 420 425 430 ACT OAG GA6 CTG CAC CTG ATG ACC TTT GAG ACC GAG GTG TAT CA.C CAA The Glu Glu Leu Bis Leu lie Thr Phe GlU Thr Glu vai Tyr sis Gin 435 440 44 5 GGC CTC AAS ATT GAC CTA GAG ACC CAC TCC TTC CCA 6TT GTG GTG ATC Gly Leu tya Ile Asp Leu -Glu Thff His Sér Leu Pr® Val Vàl Vai Ile 450 455 460 TCC AAC ATC TGT CAG Λ-ΙΛ* CCÃ AAT GCC i ί'ίΚιΡ *»W>* rrr·?* ATC CTG TGS TAC Ser Asn Xis Cys Gin Met Pffô Asn Ala Trp Ala set: Ile Leu Ttp Tyr 465 470 475 ^ § 0 ÂAC ATS CTG ACC .AAC AAT ccc AAG AAT C»TA AAC TTT ACC ccc A.SA Met Leu Th ff Asn Asn Pr® Lys Asn Vai Mn Phe Phe Th ff Lys Pro 48$ 4 90 40$ CCA ATT GGA ACC TGG GAT CAA, STS GCC CTC CTG ÂOC TGG CAG ►íMtí,·**. Pr o Ile Gly TL ff Tffp Asp Gin. Vâ.X AI â Gili Vsl Leu Ser Trp Gin Phe $00 505 5IG TCC TCC ACC ACC AAS CGA GOA GTG ACC ATC GAG CAG CTG ACT ACA /VÍWJe· νΠϊ Ser Ser The Thr Lys Arg Gly Leu Set Ile G.lu Gin Leu Thr Thr Leu 515 $2.0 525 GCA GAG AAA CTC TTG GGA CCT GGT GTG AAT TAT TCA TGT CAG ATC Ala Glu Lys Leu Leu Gly Pr o Gly Vai Asíí Tyr ser Gly Cys Qln He 530 535 540 ACA TGS GCT AAA TTT TGC AAA GAA AAC ATG GCT GCC AÃG GGÇ TTC TCÇ Thr Ttp Ala Lys Phe CVS Lys Glu Asn Met Ala Gly Lys Gly Ph® Ser 545 550 555 $60 TTC TGG GTC TGG CTA GÀC AAT ATC ATC 6AC CTT GTG AAA AAG TAC ATC Phe Trp Vai Trp L®u Asp Asn Ile Ile Aso Leu Val Lys Lys Tyr He 565 570 $75 CTG GCC CTT TGG AAC GAA GGG TAC ATC Ài U G^C TTT ATC AGT ààG GAG Leu Ala Leu Ttp Asn Glu siy Tyr ile Ket Gly He He Ser Lys Glu $80 $85 $3Õ CGO QAG CGS GCC ATC TTG AGC ACT AAG í».o,rçV VVi CCA 6GC ACC TTC CTG cm Arg Glu Arg Ala He Leis Ser Thr Lys Pro Pro Gly Thr Fhe Leu LeU 595 600 605 AGA TTC AGT GAA AGC .ACC AAA GAA CLÃ CGC GTC ACT TTC ACT TGG GTG Arg Pha Ser Glu Ser Ser Lys Glu Gly Vai Thr Fhe Thff Trp Val 610 615 620 SAG AAG > CAC ATC ACC CGT < AAG .ACC CAG ATC CAC TCC GTG GAA CCA. TAC Glu Lys As;p 11a Ser 61 y : Lys 1 Thr Gin He ser Vai GlU PffO Tyr 625 630 535 64 0 ACA AAC CAC CAG CTC , AAC AAC . ATG TCA TTT GCT GAA ATC ATC ATG GGC Thx Lys 1 Gin Gin Leu , As n j Asn ! Met Ser Phe Ma Glu He 11® Met Gly 645 650 SSS TAT AAG ATC ATG 6AT GCT ACC . AAT ATC CTC GTC rct CCA. CTG GTC TAT Tyr Lys 11¾ Mst Asp Ais Thff . Asn He Leu Vàl Ser Pr® Leu Val Tyr 660 665 670 1296 1344 13¾ 1440 148¾ 1536 1584 1632 1660 1728 1776 1824 1872 1920 1968 2016 5 CSC TAT CCT GAC ATT CCC AAtS CAG GAC GCA TTC CCA AAG TAT TCT CCC 2064 Leu Tyr Pr© As;p 11« Fí© Lys Glu 01« Ala Phe Gly Lys Tyr Cys Arf 675 680 605 CCA GAÇ ACC CM GAG CAT CCT OAA CCT GAC CCA CCT ASC CCT CCC CCA 2112 Pr© 0.1« Ser Gin. Glu His Pr o Glu. Ala Aap eiy Ser Ala Ala Ρ.ΐ* SS8 685 700 ΙΆ1-.- CTG AÀS ACC AAG TTT ATC TGT GTG ACA l-V y-A ACC ACC TCC AGC AAT 2i m Tyr Leis Lys Thr iy* Lhe Ile cys Vai Tkr Pr o Thr The Cys Ser Asn 705 710 715 ?20 ACC ATT SAC CTG CCS ATG TCC CCC CCC ACT TTA mr TCA TTC ATS CAG 22Ô8 lhe U« Asp Leu i S$E £j?9 Açg The Leu Asp Se.s Leu Met Gin 725 730 73 5 TTT GGA AA.T AAT CGT GAA GST GCT GAA CCC· TCA GCA CCA CftG TTT 2256 !?'h* Gly Asm· ft&fi 01 y ciu Çly Al.à Fr© Set Alá Giy Giy Gin The 74 0 745 750 GAG TCC CTC ACC rrr gac ATC GAC TTG ACC 7 CG GAC TCC GCT ACC TCC 2304 Ciu Leu The í»he Mp Môt Glu Leu Thr Ser Ciu Cys Alá Thr Ser 7S5 760 765 CCC ATS TGAGCASCTS ASAACGSftAS CTGCASAAAG ATAC 2344

Pr© Mst 770 (2) INFORMAÇÃO PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 770 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 2: 6

Met Ma Gin Τερ ASR Gin. Leu Gin Gin Leu Asp Thr Arg tyi Leu Glu 1 5 10 15 Gin Leu His Gin pau Tyr Ser Asp Ser Phe p£P Hat 01 u Lais Arg 61n 20 25 30 Pfce Leu Ala Pro Τερ lie Glu S®c Gin Asp Trp Ala Tyr Ala AI a &«r 35 40 46 Lys Olu Ser1 His Alâ Thr Leu Vai Ptse h r a Asn Leu Leu Giy Glu Xle 50 55 69 Asp Gin Gin Tyc Sei Arg Phe Leu Gin Glu Ser As :'i VaL Leu Tyr Gin 65 70 75 80 Hia Aso Leu Arg Arg ,à 1 £ Lys Gin £‘he Leu Gin Ser Arg Tyt Leu Glu SS 90 95 Ly.s Pío Ket Glu 11 e Ala Arg Zle Vai Aj.a Ãrg Cys Leu Trp Olu Glu 109 105 110 Ser Arg Leu Leu Sin Thr Ala Ala The Ala Ala Gin Gin G1 f oiy Gin 116 120 12:5 Ma Asfi His ?;o Thr Ma Alâ Vai Vai TM Glu Lys sin Gin Η«ε Leu 130 135 140 GlU Gin His Leu Sin Asp Vai Arg Lys Ar <? Vai Gin Asp Leu Glu Glu 145 150 155 IGO Lys Mst Lys Vai Vai Glu Asn Leu Gin Asp Asp Phe Asp Phe Asn Tyr 165 170 175 Lys Thr Leu Lys Ser Gin Giy Asp Met Gin Asp Leu Asn 0iy Asn As a ISO xes ISO Gin Ser Vai Thr Acg Gin Lys mt 01 n Gin Leu Glu Gin Hat Leu Thr 195 200 205 Ala Leu Asp Gin Mst Arg Arg Ser 11 e Vai Ser Glu Leu Ala 01 y Leu 210 215 220 Leu Ser Alâ Hat Glvi Tyr vai 51 n Lys TM Leu Thr Asp Glu Glu Leu .225 230 235 .240 Ai S AS p Trp Lys Arg Acg Gin Gin Xle Ala oys lie Giy Giy Pro pro 245 250 255 Asn lia Cys Lsu Asp Arg Leu Glu Asn Trp lie. Thr Ser Leu Ala Glu 260 265 210 Ser Gin Leu Gin Thr Ar g Gin Gin lie Lys ry s Leu Glu Glu LSUi em

275 280 2SS 7

Gin Lys Vai Ser Tyr Lys Gly Asp Peo Ile Val Gin His Arg Pr* Met zm 295 300 teu 51« 51« Arg 11a Vai Glu Leu Êhe Arg Asn Leu Het Lys Ser Ala 305 310 315 320 Phe Vai vax Glu &zq Gin Pro Cys Het Pro Hefc His Pro Asp Arg Pro 325 330 358 Leu Vai Ile tys Thr Gly Vai Gin Xhir Thr Lys Val Arg Leu Leu 340 345 350 Val tys ?h« !? ΧΓφ GlU teu Asn Tyr Gl:n Leu Lys lie Lys Val cys Ile 355 360 u 65 ASJ>- Lys A.sp Set Gly As;p Vai Ala Alá LèU Atg Gly ser Arg Lys Phe 310 375 380 As n ík Leu Gly Thr Asa Thr Cys Vai Ns.t Asn Met Glu Glu Ser Asn 39$ 390· 395 400 Asn Gly .Ser Leu Ser Ala Glu The tys His teu Thr teu Arg Glu Gin 405 410 41:5 Asf Cys Gly Asa Gly eiy Arg Ala Asn Cys Asp A1'U Ser Leu Ile Val 420 425 430 Th r Gltt Glu teu Bi» teu Ile Thr fhe 61« Thr G iU Val Tyr His Gin 435 440 44S Gly tm Lys 11* Aap Leu Glu. The His Ser teu Pec Vai Val Val Ile 450 455 460 ser Aâ ri n« cy* Gin Hat Frõ A» ri Ai.â Ττρ Ala Ser Ile Lé« Trp Tyr 465 470 475 480 Asn Met Leu Thr Asn Asa Fro Lys Asn Val Asn Fhe Phe Thr tys Pres 485 490 495 Peo Ué 615Γ The Tcp Asp Gin Vai Ala Glu vai teu Ser Trp Gin Phe 500 5Ô5 510 Ser Ser fh£ Thr m* Arg Gly Leu set Ile Glu Gin teu Thr Thr Leu 515 520 528 Ala 01« Lys teu Leu Gly Pre Gly Val Asn Tyr Ser Gly Cys Gin Ile 530 535 540 The Trp Ala Lys The Cys Lys Glu Asn M«t Ala Gly Lys Gly Phs» Ser 545 550 555 560 Phe Trp Vai Trp Leu Asp Asn Ile Ile Asp teu Val Lys Lys Tyr Ile SS$ 570 575 teu Alã Le« Trp As ri Glu Gly Tyr Ile Het Gly Pha lie Ser Lys Glu 580 SS$ 590 8

Arç Glu Arg Ala Xle Leu Ser The Lys Pró Pr o Gly Thr Phe Leu Leu S 9 5 600

Arg Phe: Ser Glu Ser Ser Lys slu Gly Gly Vai Thr Fhs Tlir Txp Vai 610 615 S2Q

Glu Lys Asp Xle Ser Gly Lys Thr Gin lie Gin Ser Vai Glu Pm Tyr 625 630 635 640

Thr Lys Gin Gin Leu Asm As* Met Ser Phe Ala Glu Xle lie Met Gly 645 650

Tyr Lys Xle Kefc Asp Ala Thr Asn lie Leu Vai Ser Pro Leu Vai Tyr 660 66S 670

Leu Tyr Pro Aap Xle P*o Lys Glu Glu Ala phe Gly Lys Tyx cys Arg 675 660 m 5

Pro Glu Ser Gin Glu His Pro Glu Ala Asp Pr» Gly Ser Ala Ala Pru 690 695 700

Tyr Leu Lys Thr Lys Phe 11« Cys Vai Thr Pm Thr Thr Cys Ser Asn 705 710 715 729

Thr lie Asp Leu Pre Hat Ser Pm Arg Thr Leu Asp Ser Leu ffefc Gin 72S 73G 735

Phe Gly Asn Asn Gly Glu Gly Ala Glu Fra Ser Ala Gly Gly Gin Phe 740 145 750

Glu ser Leu Thr Phe Asp Hat Glu Leu Thr Ser Glu Cys Ala Thr Ser 755 76Ô 765

Pro Sfet 770 (2) INFORMAÇÃO PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 423 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MEN SAGEIRA: NÃO (v) TIPO DE FRAGMENTO: interno 9 (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOACALIZAÇÃO: 1..423 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: misc_feature (B) LOCALIZAÇÃO: 1..423 (D) OUTRA INFORMAÇÃO:/nota= "domínio SH2 da sequência da hSTAT3 publicada (Akira et al. ) " (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 3: TGG cm ©AC AA? ATC ATC ©AC CTT ©T© TAT ATC TTG GCC crr 43 Τφ Leu Asp Asíí He Ile Asp Lati Vai Lys Lys Ty.r Ile Leu Ala Leu 5 10 15 tgg aat SAA GGG TAC ATC AT© GGT TTC ATC ACC AAG GA© CGG GAG CG© 96 Trp Asn Glu Gly Tyt Ile Mefc Gly Phe lie Ser Lys Glu Arg Glu Arg 20 25 3© 6CC ktc TTG AGC ACT AAS CCC CCA GGG ACC TTC CTG CTG CGC TTC AGT 144 Ais. Ile Leu Ser Thr Lys Pro Pro Gly Thr Phe Leu Leu Arg Phe SèE 3S 40 45 AGC AGC ΑΑΆ SAA GGA GGC STC ACT TTC ACT TG© GTG ©AG AAG GAC 192 Gl u Ser Ser Lys Glu Gly Gly Vai Thr Phe Thr Trp Vai Glu Lys Asp 50 55 eo ATC AGC GGT AAG ACC CAG ATC CAG TCC 3TÔ GAA CCA TAC ACA AAG CAG 240 11¾ Ser ΛΊ 11* Lys Thr Gin Ile Gin Ser Vai Glu Tyr Thr Lys ©lo *65 70 75 8(5 CM CTG AAC AAC AT© TCA TTT GCT GAA ATC ATC AT© GGC TAT M© ATC 268 GXíl L«W Asn A$n Met Ser The Ma Glu Ile Ile Kefe Gly Tyr Lys lie ®5 M §5 AT© GAT GCT ACC AAT ATC CT© TTG TCT CCA CTT ©TC TAT CTC TAT CCT 336 Met Asp Ala Thr Asn 11® L&u Lati Ser Pro Leu Vai Tyr Leu Tyr Pro 100 105 120 SAC ATT ccc AÂ© ©Á© GAG GCA TTC G©© AÂ© TAT TQT CG© CCA GAG AGC 384 Asp Ile Pr© Lys Glu Glu Ma The ©ly Lys Tyr Cys Arg Pre Glu Ser ias 130 135 CAG GA\a: CAT CCT ©AA GCT GAC CCA GCT AGC GCT ©ce CCA 423 Glrs G>ly His F ro Glu Ale Asp Pro Gly Ser Ala Ala Pro 140 145 150 10 (2) INFORMAÇÃO PARA SEQ ID NO: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 141 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 4:

Trp Leu Asp Asn Ile Ile Asp Leu. Vai Lys Lys Tyr Ile Leu Ala Leu 1 5 10 15 Trp Asn Giu Giy Tyr He Mefc. 51 y Phe I le Ser Lys Giu Arg Glu Arg 20 25 30 Alâ. íle Leu Ser Thff Lys Fr© Pre 51 y The FhÈ Leu Leu Arg PAe Ser 35 40 45 Glu Ser Ser Lys Giu Gly Gly Vai Thr Pha Tíu Trp Vai Glu Lys Asp 50 55 60 lk Sér Gly Lys TLr Gin Ile Gin Ser Vai G.l« Pro Tyr Thr Lys Gin 65 70 15 80 Glm Leu Asn Asn Ket Ser Pb.e AI Si Giu Ile Ile Mel. Sly Tyr Lys Ile 85 90 Hat Assp Ala Thr Asei Ile Leu Leu Ser Pro Leu Vai Tyr Leu Tyr Pro 100 103 110 Asp Ile Pro Lys Giu Giu Ale Phe Giy Lys Tyr Cys Arg Pro Giu Ser 115 120 125 Gin Giu Mis Pro Giu Aiâ. Aap Pe<5 Gly Ser Ala Ala Pro 130 135 140 (2) INFORMAÇÃO PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 423 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 11 (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO (v) TIPO DE FRAGMENTO: interno (ix) CARACTERÍSTICA:

(C) NOME/CHAVE: CDS (D) LOACALIZAÇÃO: 1..423 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: misc_feature (B) LOCALIZAÇÃO: 1..423 (D) OUTRA INFORMAÇÃO:/nota= "domínio SH2 da STAT3 murídea" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 5: τββ cm gac aat ATC ATC GAC C7T GTG AAA AAG TAT AT w TTG GCÇ CTT 46 Tcp Leu Asp Asn Ile Ile Asp Leu Vâl Lys Lys Tyr He Leu Ala Leu 5 10 15 TGG AAT GAA GGG TAC ATC ATG GGT TTC ATC AGC AAC GAG CGG GAG CGG 96 Trp Asn G1Gl y Tyr Ile Met Gly Phe lie Ser Lys Glu Arg GrU Arg 20 25 30 GCC AtC CTA AGC ACA AAG ccc CCC GGC ACC TTC CTA CTG CGC TTC AGC 144 Ma lie Leu Ser The Lys PffO Pró Gly Thr The Leu Leu Arg Phe ser 35 40 45 SAG AGC AGC AAA. SAA GGA GGG GTC ACT TTC ACT T>SG GTG GAA AAG GAC 192 Glu Ser Set Lys. Glu Gly Gly Vai Thr Phe Thr Trp Vai Giu Lys Asp $0 55 60 ATC ACT mc AAG ACC CAG ATC CAG TCT GTA GAG CCA TAC ACC AAG CAS 240 IÍ€ Sfiff Gly Lys Tb ff Gin 1)8 Gin Set Vai Glu Píõ Tyr Thr Lys Gin 65 76 75 60 CAS CTS AAG AÃC ATG TCA ttt ccT GAA ATC ATC ATO GGC TAT AAG ATC 268 Gin Leu Asm Asít Met Ser Phe Ala Glu lie lie Met Gly Tyr Lys llfe 05 90 55 ATS GAT GCG ACC AAC ATC CTG GTG TCT CCA err GTC TAC CTC TAC ccc 336 Met Asp Ala Thr Asn lia Leu Vai Ser Pre» Leu Vai Tyr Leu Tyr Pro 100 105 HÚ 12

ATT ccc AAG GAG SAG GCA TTT Àsp Xis iro U5 Lys Giu Slu Ala Phe 120 CAG SAG CAC cec GAA QCC GAC cch Gin GJlU; 130 His Aiu Asp 135 ?ÍO

(2) INFORMAÇÃO PARA SEQ ID 423 ÂA'3 TAC * va « mg CCC GAG AGC Cíl y Ly.â Tyr Cyâ Arg 12$ Pr o Q\\ã Ser GGY ACC TCT pÍ..Ç OCA Gly Ser ser Ma 140 3?£í> NO: 6 : (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 141 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 6:

Trp Lsu A$p Aso. Ilê 11« Asp LsU Vãi Lys Lys Tyr Ils Leu Ais Leu 1 5. 10 15 Trp Mft Siu Gi y 20 Tyr 11« Kêt Gly The 25 11« Ser Lys Glu Arg 30 Glu Ârg Ala Ile Leu Ser Th£ Lys Pro PÉS Gly Thr Phe Le u Leu Arg eh® Ser 35 40 45 Glu Ser Ser Lys Glu Gly Gly Vai Thr Pha Thr Trp Vai Glu Lys Asp S-Ô SS 60 Ile Ser Gly Lys Thr Gin Ile Gin Ser Vai Glu Pro Tyr Thr Lys Gin ê5 70 15 00 Gifi Leu Asn Aso Mèt Ssr Ala Ile Ile Mefc Sly Tyr Lya lia 90 95 Asp Ala Thr Asa lia Lau Vàl $« x. PrsJ Laa Vai Tyr Lau Tyr fra 100 105 110 Mp Ha P:t'0 Lya Glu Gin Ala Phe Sly Lys Tyr Cys Mg ftíQ Glu Ser 115 120 125 Gin Glu His Pr o Glu Ala Asp Pro Gly Ser sar Ala P.ta 130 135 140 2) INFORMAÇÃO PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 47 pares de bases 13 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 7: AAC&OCATGG CCTGSCmGA CÍAfAlCATC SÃCCTTQTSÃ AAAAGTA 4? (2) INFORMAÇÃO PARA SEQ ID NO: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 39 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 8: ATATATGGAT CCTGGSGCAG CSCTACÇTGG GTCAGCTTC $$ (2) INFORMAÇÃO PARA SEQ ID NO: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 9 TCGCCGSÃAfi CfTCAÇAÇGC GCA6CCCCGG CTTCT (2) INFORMAÇÃO PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1 CTTCRTCACT TTTGTGTTTG TGCCCAGAAT (2) INFORMAÇÃO PARA SEQ ID NO: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11 6&ÇAAA3AC? CJNSSSS&eSf S^çASCTCTC (2) INFORMAÇÃO PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MENSAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 12 TCASTCGTCG AGTATCTTTC TQCAGCTTCC STTCT (2) INFORMAÇÃO PARA SEQ ID NO: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO (iv) ANTI-MEN SAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 13 mmQGGTAC MTCATGGSTT TC (2) INFORMAÇÃO PARA SEQ ID NO: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MEN SAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 14 TCACSATÂGÂ CAfÃGACAAC TGGAGACAA (2) INFORMAÇÃO PARA SEQ ID NO: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO 17

(iv) ANTI-ΜΕΝ SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15: CCfCCfTCff TGCTSCTTfC AtTÚh&G 27 (2) INFORMAÇÃO PARA SEQ ID NO: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MEN SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 16: CGAAGGSTAC ATCATSGGCT TT 22 (2) INFORMAÇÃO PARA SEQ ID NO: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 30 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MEN SAGEIRA: NÃO

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 17 CCTCCTTCTT TGCfíSCffTC ACTGAATCTT (2) INFORMAÇÃO PARA SEQ ID NO: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO

(iv) ANTI-MEN SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 18 TSfcASGSTAC ATCATeSGrr TCATCAGTM GGft (2) INFORMAÇÃO PARA SEQ ID NO: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 37 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADNc

(iii) HIPOTÉTICA: NÃO (iv) ANTI-MEN SAGEIRA: NÃO (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 19 19 19 37

TCAGGATAGA OATAGACAAG TGGAGACMC AGSATAT

Lisboa, 10 de Novembro de 2006

Claims

REIVINDICAÇÕES Variante alélica da proteína STAT3 humana que compreende a sequência de aminoácidos da SEQ ID NO: 2. Proteína constituída pela sequência de aminoácidos da SEQ ID NO: 2. Proteína de acordo com a reivindicação 1 ou 2 na forma de um sal, derivado ou uma proteína de fusão. Proteína de acordo com a reivindicação 1 ou 2 fundida com imunoglobulina. Molécula de ADN que compreende uma sequência de ADN para a proteína da reivindicação 1 ou 2. Molécula de ADN recombinante que hibridiza em condições rigorosas, isto é 2 x SSC e 0,5% de SDS durante 5 minutos, 2 x SSC e 0,1% de SDS durante 15 minutos; 0,1 x SSC e 0,5% de SDS a 37°C durante 30-60 minutos e depois 0,1 x SSC e 0,5% de SDS a 68°C durante 30-60 minutos, com uma sonda possuindo uma sequência de nucleótidos seleccionada entre a SEQ ID NO:16 e SEQ ID NO:17. Utilização de uma sonda possuindo uma sequência de nucleótidos seleccionada entre SEQ ID NO:16 e 17 para a detecção de uma molécula de ADN possuindo a sequência de nucleótidos da SEQ ID NO:l. 2
8. Molécula de ADN de acordo com a reivindicação 5 que compreende a sequência de nucleótidos da SEQ ID N0:1.
9. Vector de expressão o qual compreende a molécula de ADN de qualquer uma das reivindicações 5 até 6 ou 8.
10. Célula hospedeira compreendendo o vector de expressão da reivindicação 9.
11. Processo recombinante para preparar a proteina de qualquer uma das reivindicações 1 até 4, compreendendo cultivar num meio de cultura adequado as células da reivindicação 10.
12. Proteina de qualquer uma das reivindicações 1 até 4 para ser utilizada como medicamento.
13. Utilização de uma proteína de acordo com qualquer uma das reivindicações 1 até 4 no fabrico de um medicamento para o tratamento de doenças autoimunes e/ou doenças inflamatórias.
14. Composição farmacêutica compreendendo a proteína definida em qualquer uma das reivindicações 1 até 4 com um ou mais veículos e/ou excipientes farmaceuticamente aceitáveis. Lisboa, 10 de Novembro de 2006