PT1996238T

PT1996238T - Vetores adenovíricos quiméricos e arncd como agonista de tlr3

Info

Publication number: PT1996238T
Application number: PT77521094T
Authority: PT
Inventors: N Tucker Sean
Original assignee: Vaxart Inc
Priority date: 2006-02-28
Filing date: 2007-02-28
Publication date: 2016-07-11
Also published as: EA014757B1; CN101432291A; US20110081375A1; JP2009533018A; BRPI0708344A8; LT1996238T; IL193684A0; PL1996238T3; RS54843B1; DK1996238T3; IL229523A0; NZ571010A; AP2844A; CN101432291B; US20130164326A1; AU2007220988A1; ES2573456T3; JP5016614B2; US20070269410A1; BRPI0708344B8

Description

DESCRIÇÃO "Vetores adenovíricos quiméricos e ARNcd como agonista de TLR3"

ANTECEDENTES DA INVENÇÃO

As vacinas são um importante meio de prevenir e/ou tratar várias doenças e distúrbios (e.g., infeção virica, infeção bacteriana e cancro). As vacinas baseadas em ácidos nucleicos apresentam várias vantagens relativamente a vacinas de proteína ou a vacinas vivas atenuadas. A introdução de um ácido nucleico que expressa um antigénio numa célula alvo permite o desenvolvimento rápido de uma vacina que gera uma resposta imunitária contra um antigénio de interesse. Para vacinas de proteína, é necessário desenvolver um método eficaz e eficiente para purificação de proteínas de cada vez que se cria uma nova vacina. Para vacinas vivas, é necessário identificar um método de atenuação que não pare completamente o crescimento do agente patogénico, mas que prove ser completamente seguro em humanos. 0 desenvolvimento de metodologias de purificação de proteínas e de atenuação são processos extremamente morosos. Contrariamente, a maioria das vacinas baseadas em ácido nucleico pode ser fabricada muito rapidamente usando sempre as mesmas técnicas de fabrico com apenas uma pequena alteração no ácido nucleico que codifica para o antigénio de interesse. 0 adenovirus incompetente para replicação constitui um sistema de vacina baseado em ácido nucleico que é produzido com títulos elevados de forma rápida, previsível e barata [Polo, J. M. e Dubensky, T. W., Jr., Drug Discov Today, 7(13), 719-727 (2002)]. Contudo, a eficácia da resposta específica do antigénio após administração de vetores adenovíricos conhecidos na área técnica é baixa. O documento US6511845, descreve a imunização por administração intranasal de um vetor adenovírico que expressa um antigénio, seguida de uma ou mais administrações de reforço pelas vias intranasal ou intramuscular do referido adenovirus recombinante. O documento W02005014038 descreve um efeito adjuvante de ARNcd sobre a imunidade mucosa induzida contra um antigénio de subunidade ou contra um antigénio inativado de um agente patogénico. Assim, há uma necessidade na área técnica de novos vetores adenovíricos que possam ser usados para desencadear de forma eficiente uma resposta imunitária contra um antigénio de interesse. A presente invenção satisfaz essas e outras necessidades.

SUMÁRIO DA INVENÇÃO A invenção no seu sentido mais abrangente é tal como definida nas reivindicações independentes.

Uma concretização da invenção proporciona um vetor de expressão adenovirico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista do recetor de tipo toll, (TLR)-3, em que o agonista de TLR-3 é ARNcd (ou "dsRNA" em inglês) heterólogo e em que o ácido nucleico que codifica para o agonista de TLR-3 compreende uma sequência selecionada do grupo que consiste em: SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 e 12; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico. Em algumas concretizações, o polipéptido heterólogo é selecionado entre um polipéptido do invólucro de HIV (e.g., gp41, gpl20 ou gpl60) e polipéptido HA de influenza. Em algumas concretizações, o primeiro e o segundo promotores são o mesmo. Em algumas concretizações, o primeiro e o segundo promotores são diferentes. Em algumas concretizações, os promotores são selecionados entre o promotor de beta-actina e o promotor de CMV. A invenção também proporciona composições imunogénicas compreendendo o vetor de expressão.

Uma concretização adicional da invenção proporciona um vetor de expressão adenovirico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de recetor de tipo toll 3 (TLR-3), em que o agonista de TLR-3 é ARNcd heterólogo; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico para utilização num método de tratamento que desencadeia uma resposta imunitária, o referido método compreendendo a administração de uma quantidade imunogenicamente eficaz do vetor a um indivíduo mamífero tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e por via mucosa tal como vaginal. 0 indivíduo mamífero é, e.g., um roedor tal como um ratinho, um rato ou um porquinho-da-índia ou um primata tal como um chimpanzé, um macaco rhésus ou um ser humano. Em algumas concretizações, o polipéptido heterólogo é expresso numa célula selecionada entre uma célula dendrítica, uma célula de micropregas (célula M) e uma célula epitelial intestinal.

Uma concretização adicional da invenção proporciona uma composição imunogénica, a referida composição compreendendo: (a) um vetor de expressão adenovírico guimérico compreendendo um promotor ligado operacionalmente a um ácido nucleico gue codifica para um polipéptido heterólogo imunogénico; (b) um agonista de TLR-3, em que o agonista de TLR-3 é ARNcd heterólogo; e (c) um transportador farmaceuticamente aceitável; para utilização num método de tratamento gue desencadeia uma resposta imunitária, o referido método compreendendo a administração de uma guantidade imunogenicamente eficaz da composição a um indivíduo mamífero tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e por via mucosa tal como vaginal. 0 indivíduo mamífero é, e.g., um roedor tal como um ratinho, um rato ou um porquinho-da-índia ou um primata tal como um chimpanzé, um macaco rhésus ou um ser humano. A divulgação também proporciona um ácido nucleico isolado compreendendo a sequência apresentada em SEQ ID NO: 1, 2, 6, 7, 13, 14, 15, 16 ou 17.

DESCRIÇÃO SUCINTA DOS DESENHOS A figura 1 ilustra dados que demonstram que um vetor adenovírico quimérico da invenção (i.e., DS1) em combinação com um agonista de TLR-3 é mais eficaz do que um vetor adenovírico padrão (i.e., rAd5) na indução de uma resposta imunitária específica do antigénio após entrega oral do vetor. A figura IA ilustra dados que representam o título de anticorpo contra proteína do invólucro de HIV (i.e., gpl20) 3 semanas após a entrega oral dos vetores adenovíricos. A figura 1B ilustra dados que representam o título de anticorpo contra proteína do invólucro de HIV (i.e., gpl20) 6 semanas após entrega oral dos vetores adenovíricos. A figura 2 ilustra dados que demonstram que um vetor adenovírico quimérico da invenção (i.e., DSlb ou DSlc) em combinação com um agonista de TLR-3 é mais eficaz na indução de uma resposta imunitária específica do antigénio do que um vetor adenovírico padrão (i.e., rAd5). A figura 2A ilustra dados que representam o título de IgG anti-GFP 3 semanas após administração oral dos vetores. A figura 2B ilustra dados que representam a resposta de células T CD8+ a GFP 10 semanas após administração do vetor às 0, 4 e 8 semanas. A figura 2C ilustra dados que representam o título do anticorpo anti-HA 3 semanas após administração oral dos vetores. A figura 3 ilustra dados que demonstram que os vetores adenovíricos quiméricos da invenção são melhores a desencadear respostas imunitárias quando administrados por vias não parentéricas. A figura 3A ilustra dados que representam o título do anticorpo anti-gpl20 3 semanas após administração intramuscular de DS1. A figura 3B ilustra dados que representam o título do anticorpo anti-HA três semanas após administração intranasal de DSlc. A figura 4 ilustra dados que demonstram que os agonistas de ligando de TLR-3 expressos podem induzir ativação de células apresentadoras de antigénio. A figura 4A ilustra dados que apresentam a ativação de células dendríticas pelo ARNcd agonista de TLR-3 lucl expresso. A figura 4B ilustra dados que apresentam a ativação de células dendríticas pelos ARNcd agonistas de TLR-3 lucl e ml expressos. A figura 5 é uma ilustração gráfica dos vetores adenovíricos quiméricos da invenção, i.e., vetores adenovíricos quiméricos compreendendo ácidos nucleicos que codificam para ARNcd agonistas de TLR-3 expressos. A figura 6 ilustra dados que demonstram que os vetores adenoviricos quiméricos da invenção são eficazes na indução de uma resposta imunitária especifica do antigénio após entrega oral. A figura 6 ilustra dados que apresentam o titulo de anticorpo anti-gpl20 3 semanas após administração oral de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl. A figura 7 ilustra dados que demonstram que os agonistas de TLR-7/8 têm uma baixa eficácia na indução de uma resposta imunitária especifica do antigénio. A figura 8 ilustra dados que demonstram que os vetores adenoviricos quiméricos da invenção são eficazes na indução de uma resposta imunitária especifica do antigénio após entrega oral. A figura 8A ilustra dados que apresentam o titulo de anticorpo anti-HA 4 semanas após administração oral de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl. A figura 8B ilustra dados que apresentam o titulo de anticorpo anti-HA 4 semanas ou 7 semanas após administração de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl. A figura 8C ilustra dados que apresentam o titulo de anticorpo anti-HA 3 semanas após administração oral ou intranasal de um adenovirico quimérico compreendendo uma sequência de ácido nucleico que codifica para o ARNcd agonista de TLR-3 lucl.

DESCRIÇÃO SUCINTA DAS SEQUÊNCIAS SEQ ID N0:1 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS1. SEQ ID NO:2 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS2. SEQ ID NO: 3 apresenta uma sequência de nucleótidos que codifica para um agonista de TLR-3. SEQ ID NO: 4 apresenta uma sequência de nucleótidos que codifica para um agonista de TLR-3. SEQ ID NO :5 apresenta uma sequência de nucleótidos que codifica para um agonista de TLR-3. SEQ ID NO:6 apresenta uma sequência de nucleótidos para um vetor adenovirico quimérico compreendendo um ácido nucleico que codifica para o HA de influenza e um ácido nucleico que codifica para um agonista de TLR-3 (luc), em que o HA de influenza e o agonista de TLR-3 estão na mesma orientação. SEQ ID NO: 7 apresenta uma sequência de nucleótidos para um vetor adenovirico quimérico compreendendo um ácido nucleico que codifica para o HA de influenza e um ácido nucleico que codifica para um agonista de TLR-3 (luc), em que o HA de influenza e o agonista de TLR-3 estão em orientações opostas. SEQ ID NO: 8 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3. As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 9 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3 (gl). As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 10 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3 (luc). As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 11 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3 (ml). As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 12 apresenta uma sequência de nucleótidos que codifica para um ARN em gancho de cabelo curto, agonista de TLR-3. As partes complementares da sequência apresentam-se em letras maiúsculas e a sequência ligante apresenta-se em letras minúsculas. SEQ ID NO: 13 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DSlc. A sequência compreende um nucleótido que codifica para HA(PR8/34). SEQ ID NO: 14 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS2beta-luc. 0 vetor compreende uma sequência que codifica para o agonista de TLR-3 luc sob o controlo do promotor de beta-actina. 0 vetor também compreende locais de clonagem aberta para inserção de sequência(s) de ácido nucleico que codifica(m) para um antigénio de interesse. SEQ ID NO: 15 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico DS2C-luc. 0 vetor compreende uma sequência que codifica para o agonista de TLR-3 luc sob o controlo do promotor de CMV. 0 vetor também compreende locais de clonagem aberta para inserção de sequência (s) de ácido nucleico que codifica(m) para um antigénio de interesse. SEQ ID NO: 16 apresenta a sequência de nucleótidos para o vetor pShuttle compreendendo uma sequência de ácido nucleico que codifica para o agonista de TLR-3 luc sob o controlo do promotor de CMV e uma sequência de ácido nucleico que codifica para HA (gripe aviária) sob o controlo de um promotor de CMV independente. SEQ ID NO: 17 apresenta a sequência de nucleótidos para o vetor adenovirico quimérico ND1.1 214. 0 ácido nucleico que codifica para o antigénio heterólogo está com texto em negrito e está flanqueado por um local de reconhecimento para Cia I na extremidade 5' e um local de reconhecimento para Not I na extremidade 3'. A sequência de ácido nucleico que codifica para os agonistas de TLR-3 está em itálico, com a sequência ligante em negrito.

DESCRIÇÃO DETALHADA DA INVENÇÃO A invenção no seu âmbito mais abrangente é tal como definida nas reivindicações independentes. I. Introdução A presente invenção proporciona novos vetores adenoviricos quiméricos que podem ser administrados de forma não parentérica para desencadear uma resposta imunitária contra um antigénio de interesse. Os vetores adenoviricos quiméricos da invenção compreendem um ácido nucleico que codifica para um polipéptido heterólogo e um ácido nucleico que codifica para um agonista de TLR-3. Os vetores adenoviricos quiméricos desencadeiam respostas imunitárias fortes e eficazes, especificas para o polipéptido heterólogo, nomeadamente quando administrados através de uma via não parentérica (e.g., oralmente, intranasalmente ou pela mucosa). A invenção baseia-se na verificação surpreendente de que a administração de ARNcd agonistas de TLR-3 são adjuvantes eficazes quando administrados conjuntamente com vetores viricos. De facto, a utilização de ARNcd como um adjuvante para vetores viricos seria contraintuitiva considerando que a principal utilidade proposta dos miméticos de ARNcd poli I:C foi como agente antivirico [Nemes, et al. , Proc Soc Exp Biol Med. (1969) 132:776; Schafer, et al, Nature. (1970) 226:449;

Fenje, et al, Nature (1970) 226:171.]. II. Definições

As expressões "quimérico" ou "recombinante" tal como aqui utilizadas com referência a, e.g., um ácido nucleico, uma proteína ou um vetor, indicam que o ácido nucleico, a proteína ou o vetor, foram modificados pela introdução de um ácido nucleico ou uma proteína heterólogos ou pela alteração de um ácido nucleico ou uma proteína nativos. Assim, por exemplo, os vetores quiméricos e recombinantes incluem sequências de ácido nucleico que não se encontram na forma nativa (não quimérica ou não recombinante) do vetor. Um vetor de expressão adenovírico quimérico refere-se a um vetor de expressão adenovírico compreendendo uma sequência de ácido nucleico que codifica para um polipéptido heterólogo.

Um "vetor de expressão" é uma construção de ácido nucleico, gerada de forma recombinante ou sintética, com uma série de elementos de ácido nucleico especificados que permitem a transcrição de um ácido nucleico especifico numa célula hospedeira. 0 vetor de expressão pode ser parte de um plasmideo, virus ou fragmento de ácido nucleico. Tipicamente, o vetor de expressão inclui um ácido nucleico para ser transcrito, ligado operacionalmente a um promotor.

As expressões "promotor" e "sequência de controlo da expressão" são aqui usadas para referir uma matriz de sequências de controlo de ácido nucleico que dirigem a transcrição direta de um ácido nucleico. Tal como aqui usado, um promotor inclui sequências de ácido nucleico necessárias perto do local de iniciação da transcrição, tal como, no caso de um promotor do tipo de polimerase II, um elemento TATA. Um promotor também inclui opcionalmente elementos facilitadores ou repressores distais, que podem localizar-se a distâncias tão elevadas como de vários milhares de pares de bases a partir do local de iniciação da transcrição. Os promotores incluem promotores constitutivos e promotores indutiveis. Um promotor "constitutivo" é um promotor que é ativo na maioria das condições ambientais e de desenvolvimento. Um promotor "indutivel" é um promotor que é ativo sob regulação ambiental ou de desenvolvimento. A expressão "ligado operacionalmente" refere-se a uma ligação funcional entre uma sequência de controlo da expressão de ácido nucleico (tal como um promotor ou uma matriz de locais de ligação de fatores de transcrição) e uma segunda sequência de ácido nucleico, em que a sequência de controlo da expressão dirige a transcrição do ácido nucleico correspondente à segunda sequência.

As expressões "agonista de TLR" ou "agonista de recetor de tipo Toll" tal como aqui utilizadas, referem-se a um composto que se liga e que estimula um recetor do tipo Toll incluindo, e.g., TLR-2, TLR-3, TLR-6, TLR-7 ou TLR-8. Os agonistas de TLR estão revistos em MacKichan, IAVI Report. 9:1-5 (2005) e Abreu et ai., J Immunol, 174(8), 4453-4460 (2005). Os agonistas induzem transdução de sinal após ligação ao seu recetor.

As expressões "agonista de TLR-3" ou "agonista de recetor do tipo Toll 3" tal como aqui utilizadas, referem-se a um composto que se liga a, e estimula, TLR-3. Identificaram-se agonistas de TLR-3 incluindo ARN em cadeia dupla, ARNcd obtido de vírus, vários análogos de ARN em cadeia dupla sintetizados quimicamente incluindo ácido poli-inosina-policitidílico (poli I:C) - ácido poliadenílico-poliuridílico (poli A:U) e poli I:poli C e anticorpos (ou anticorpos de ligação cruzada) contra TLR-3 que originam produção de IFN-beta [Matsumoto, M, et al, Biochem Biophys Res Commun 24:1364 (2002), de Bouteiller, et al, J Biol Chem 18:38133-45 (2005)]. Os agonistas de TLR-3 também incluem ARNcd expresso (e.g., ARNcd codificados por um ácido nucleico compreendendo uma sequência apresentada em SEQ ID NO: 3, 7, 8, 9, 10, 11 ou 12).

As expressões "agonista de TLR-7/8" ou "agonista de recetor de tipo Toll 7/8" tal como aqui usadas, referem-se a um composto que se liga a, e estimula, o recetor TLR-7 ou o recetor TLR-8; estes recetores reconhecem vários ligandos comuns. Identificaram-se vários agonistas de TLR-7/8 tal como ARN em cadeia simples virico, imiquimod, loxorribina, ácido poliuridilico ou resiquimod. A expressão "heterólogo" quando usada em referência a partes de um ácido nucleico indica que o ácido nucleico compreende duas ou mais subsequências que não se encontram na natureza na mesma relação entre si. Por exemplo, o ácido nucleico é tipicamente produzido de forma recombinante, apresentando duas ou mais sequências de genes não relacionados arranjadas de modo a produzir um novo ácido nucleico funcional, e.g., um promotor de uma fonte e uma região de codificação de outra fonte. De igual modo, uma proteína heteróloga indica que essa proteína compreende duas ou mais subsequências que não se encontram na natureza na mesma relação entre si (e.g., uma proteína de fusão).

As expressões "ácido nucleico" e "polinucleótido" usam-se aqui indiferentemente para referir desoxirribonucleótidos ou ribonucleótidos e seus polímeros nas formas em cadeia simples ou em cadeia dupla. A expressão abrange ácidos nucleicos contendo análogos de nucleótido conhecidos ou resíduos ou ligações de esqueleto modificados, que são sintéticos, de ocorrência natural ou que não são de ocorrência natural, que têm propriedades de ligação semelhantes às do ácido nucleico de referência e que são metabolizados de uma forma semelhante à dos nucleótidos de referência. Os exemplos de tais análogos incluem, fosforotioatos, fosforamidatos, metilfosfonatos, metilfosfonatos quirais, 2-0-metilribonucleótidos, ácidos nucleicos peptídicos (PNA), não se lhes limitando.

Salvo indicação em contrário, uma sequência de ácido nucleico especifica também abrange as suas variantes modificadas conservativamente (e.g., substituições de codão degeneradas) e sequências complementares, assim como a sequência explicitamente indicada. Especificamente, podem obter-se substituições de codão degeneradas pela geração de sequências nas quais a terceira posição de um ou mais (ou de todos) os codões selecionados é substituída por bases mistas e/ou por resíduos de desoxinosina (Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)). A expressão ácido nucleico é usada indiferentemente de gene, ADNc, ARNm, oligonucleótido e polinucleótido.

Antigénio - refere-se a uma proteína ou parte de uma cadeia polipeptídica que pode ser reconhecida por recetores de células T e/ou anticorpos. Tipicamente, os antigénios são derivados de proteínas bacterianas, víricas ou fúngicas.

Uma "dose ou quantidade imunogenicamente eficaz" das composições da presente invenção é uma quantidade que desencadeia ou modula uma resposta imunitária específica ao polipéptido heterólogo. As respostas imunitárias incluem respostas imunitárias humorais e respostas imunitárias mediadas por células. Pode usar-se uma composição imunogénica de forma terapêutica ou profilática para tratar ou prevenir uma doença em qualquer estágio.

As "respostas imunitárias humorais" são mediadas por componentes do sangue, i.e., plasma ou soro, isentos de células; a transferência do soro ou plasma de um indivíduo para outro leva a transferência de imunidade.

As "respostas imunitárias mediadas por células" são mediadas por linfócitos específicos de antigénios; a transferência dos linfócitos específicos de antigénios de um indivíduo para outro leva a transferência de imunidade

Uma "dose terapêutica" ou "quantidade terapeuticamente eficaz" ou "quantidade eficaz" de um vetor adenovirico quimérico ou de uma composição compreendendo um vetor adenovirico quimérico é uma quantidade do vetor ou da composição compreendendo o vetor que evita, alivia, atenua ou reduz a gravidade dos sintomas de doenças e distúrbios associados com a fonte do polipéptido heterólogo (e.g., um vírus, bactéria, um parasita ou um cancro).

Anticorpo - refere-se a um polipéptido codificado por um gene de imunoglobulina ou seus fragmentos que ligam especificamente e reconhecem um antigénio. Os genes de imunoglobulina reconhecidos incluem os genes da região constante capa, lambda, alfa, gama, delta, épsilon e mi, assim como a grande variedade de genes de região variável de imunoglobulina. As cadeias leves classificam-se como capa ou lambda. As cadeias pesadas classificam-se como gama, mi, alfa, delta ou épsilon, que por sua vez definem as classes de imunoglobulinas, IgG, IgM, IgA, IgD e IgE, respetivamente. Células T - refere-se a uma classe específica de linfócitos que expressam um recetor específico (recetor de células T) codificado por uma família de genes. Os genes do recetor de células T reconhecidos incluem loci alfa, beta, delta e gama e os recetores de células T reconhecem tipicamente (mas não universalmente) uma combinação de MHC com um péptido curto.

Resposta imunitária adaptativa - refere-se a reconhecimento de antigénios por células T e/ou por anticorpos.

Células apresentadoras de antigénios (APC, do inglês "Antigen Presenting Cell")) - tal como aqui usado, refere-se a células que são capazes de apresentar péptidos imunogénicos ou seus fragmentos a células T para ativar ou intensificar uma resposta imunitária. As APC incluem células dendríticas, macrófagos, células B, monócitos e outras células que podem ser manipuladas para serem APC eficazes. Tais células podem, embora não necessariamente, ser modificadas geneticamente para melhorar a capacidade para apresentar o antigénio, para melhorar ativação e/ou a manutenção da resposta de células T, para ter efeitos antitumorais por si só e/ou para serem imunologicamente compatíveis com o recebedor (i.e., haplotipo de HLA emparelhado) . Podem isolar-se as APC de qualquer um de entre vários fluidos biológicos e órgãos incluindo medula óssea, sangue periférico, tecidos tumorais e peritumorais e podem ser células autólogas, alogénicas, singénicas ou xenogénicas. As APC utilizam tipicamente um recetor do locus de histocompatabilidade major (MHC) para apresentar polipéptidos curtos a células T.

Adjuvante - é um intensificador da resposta imunitária não especifico. Os adjuvantes adequados incluem, por exemplo, toxina da cólera, monofosforil-lipido A (MPL), adjuvante completo de Freund, adjuvante incompleto de Freund, Quil A e AI (OH) . Os adjuvantes podem também ser as substâncias que provocam ativação de APC e apresentação melhorada de células T através de moléculas de sinalização secundárias tais como recetores de tipo Toll. Os exemplos de recetores de tipo Toll incluem os recetores que reconhecem ARN em cadeia dupla, flagelos bacterianos, LPS, ADN em CpG e lipopéptido bacteriano (revisto recentemente em [Abreu et al., J Immunol, 174(8), 4453-4460 (2005)]) .

As expressões "polipéptido", "péptido" e "proteína" são aqui utilizadas indiferentemente para referir um polímero de resíduos de aminoácido. As expressões aplicam-se a polímeros de aminoácidos nos quais um ou mais resíduos de aminoácido são miméticos químicos artificiais de um aminoácido de ocorrência natural correspondente, assim como a polímeros de aminoácidos de ocorrência natural e polímeros de aminoácidos que não são de ocorrência natural. A expressão "aminoácido" refere-se a aminoácidos de ocorrência natural e sintéticos, assim como análogos de aminoácidos e miméticos de aminoácidos que funcionam de forma semelhante aos aminoácidos de ocorrência natural. Os aminoácidos de ocorrência natural são os codificados pelo código genético, assim como os aminoácidos que são modificados posteriormente, e.g., hidroxiprolina, y-carboxiglutamato e 0-fosfosserina. Os análogos de aminoácidos referem-se a compostos que têm a mesma estrutura química básica que um aminoácido de ocorrência natural, i.e., um carbono y que está ligado a um hidrogénio, um grupo carboxilo, um grupo amino e um grupo R, e.g., homosserina, norleucina, sulfóxido de metionina, metionina-metilsulfónio. Tais análogos têm grupos R modificados (e.g., norleucina) ou esqueletos peptídicos modificados, mas mantêm a mesma estrutura química básica do aminoácido de ocorrência natural. Os miméticos de aminoácidos referem-se a compostos químicos que têm uma estrutura que é diferente da estrutura química geral de um aminoácido, mas que funcionam de forma semelhante a um aminoácido de ocorrência natural.

Os aminoácidos podem ser aqui referidos quer pelos seus símbolos de três letras de conhecimento comum, quer pelos símbolos de uma letra recomendados pela comissão de nomenclatura bioquímica da IUPAC-IUB. De igual modo, os nucleótidos, podem ser referidos pelos seus códigos de letra única habitualmente aceites. "Variantes modificadas conservativamente" aplica-se tanto a sequências de aminoácidos como a sequências de ácido nucleico. Relativamente a sequências de ácido nucleico específicas, as variantes, modificadas conservativamente referem-se a ácidos nucleicos que codificam para sequências de aminoácidos idênticas ou essencialmente idênticas ou, quando o ácido nucleico não codifica para uma sequência de aminoácidos, a sequências essencialmente idênticas. Devido ao código genético ser degenerado, um grande número de ácidos nucleicos funcionalmente idênticos codifica para uma determinada proteína. Por exemplo, os codões GCA, GCC, GCG e GCU codificam todos para o aminoácido alanina. Assim, em cada posição na qual uma alanina é especificada por um codão, o codão pode ser alterado para qualquer dos codões correspondentes descritos sem alterar o polipéptido codificado. Tais variações de ácidos nucleicos são "variações silenciosas" que são uma espécie de variações modificadas conservativamente. Cada sequência de ácidos nucleicos aqui, que codifica para um polipéptido, também descreve todas as variações silenciosas possíveis do ácido nucleico. 0 perito reconhecerá que cada codão num ácido nucleico (exceto AUG, que é habitualmente o único codão para metionina e TGG, que é habitualmente o único codão para triptofano), pode ser modificado para proporcionar uma molécula funcionalmente idêntica. Assim, cada variação silenciosa de um ácido nucleico que codifica para um polipéptido está implícita em cada sequência descrita.

Relativamente às sequências de aminoácidos, o perito reconhecerá que as substituições, deleções ou adições individuais a uma sequência de ácido nucleico, péptido, polipéptido ou proteína que altere, adicione ou elimine um único aminoácido ou uma pequena percentagem de aminoácidos na sequência codificada, é uma "variante modificada conservativamente" em que a alteração resulta na substituição de um aminoácido por um aminoácido quimicamente semelhante. São bem conhecidas na área técnica as tabelas de substituições conservativas que proporcionam aminoácidos funcionalmente semelhantes. Tais variantes modificadas conservativamente são adicionais a variantes polimórficas, homólogos interespécies e alelos da invenção, não os excluindo.

Os seguintes oito grupos contêm, cada um, aminoácidos que constituem substituições conservatives entre si: 1) Alanina (A), Glicina (G); 2) Ácido aspártico (D), Ácido glutâmico (E); 3) Asparagina (N), Glutamina (Q); 4) Arginina I, Lisina (K); 5) Isoleucina (I), Leucina (L), Metionina (M), Valina (V); 6) Fenilalanina (F), Tirosina (Y), Triptofano (W); 7) Serina (S), Treonina (T); e 8) Cisteína (C), Metionina (M) (consultar, e.g., Creighton, Proteins (1984)). A frase "híbrida seletivamente (ou especificamente) com" refere-se à ligação, formação de cadeia dupla ou hibridação de uma molécula apenas com uma sequência de nucleótidos específica sob condições de hibridação rigorosas quando essa sequência está presente numa mistura complexa (e.g., ADN ou ARN celular total ou de biblioteca) A frase "condições de hibridação rigorosas" refere-se a condições sob as quais uma sonda hibridará com a sua subsequência alvo, tipicamente numa mistura complexa de ácidos nucleicos, mas não com outras sequências. As condições rigorosas são dependentes da sequência e serão diferentes em circunstâncias diferentes. As sequências mais longas hibridarão especificamente a temperaturas mais elevadas. Encontra-se um guia extenso para a hibridação de ácidos nucleicos em Tijssen, Techniques in Biochemistry and Molecular Biology-~Hybridization with Nucleic Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays" (1993). Geralmente, selecionam-se condições rigorosas como sendo de cerca de 5-10°C abaixo do ponto de fusão térmico I para a sequência especifica a uma força iónica definida Ph. A Tm é a temperatura (a uma força iónica, Ph e concentração nucleica definidas) à qual 50% das sondas complementares ao alvo hibridam com a sequência alvo no equilíbrio (dado que as sequências alvo estão presentes em excesso, a Tm, 50% das sondas estão ocupadas no equilíbrio). As condições rigorosas serão aquelas nas quais a concentração de sal é inferior a cerca de 1,0 M em ião sódio, tipicamente cerca de 0,01 a 1,0 M de concentração de ião sódio (ou outros sais), a Ph entre 7,0 e 8,3 e a temperatura é pelo menos cerca de 30°C para sondas curtas (e.g., 10 a 50 nucleótidos) e pelo menos cerca de 60°C para sondas longas (e.g., maiores que 50 nucleótidos). Também se podem obter condições rigorosas com a adição de agentes de desestabilização tais como formamida. Para hibridação seletiva ou específica, um sinal positivo é de pelo menos duas vezes a linha de base, opcionalmente é de 10 vezes a hibridação da linha de base. Os exemplos de condições de hibridação rigorosas podem ser os seguintes: formamida a 50%, SSC 5x e SDS a 1%, incubação a 42°C ou SSC 5x, SDS a 1%, incubação a 65 °C, com lavagem com SSC 0,2x e SDS a 0,1% a 65°C.

Os ácidos nucleicos que não hibridam entre si em condições rigorosas são ainda substancialmente idênticos se os polipéptidos que codificam forem substancialmente idênticos. Tal ocorre, por exemplo, quando é criada uma cópia de um ácido nucleico usando a degenerescência de codões máxima permitida pelo código genético. Em tais casos, os ácidos nucleicos hibridam tipicamente em condições de hibridação moderadamente rigorosas. Os exemplos de "condições de hibridação moderadamente rigorosas" incluem uma hibridação num tampão com formamida a 40%, NaCl 1 M, SDS a 1% a 37°C e uma lavagem com SSC IX a 45°C. Uma hibridação positiva é de pelo menos duas vezes a linha de base. Os peritos na especialidade reconhecerão facilmente que se podem utilizar condições alternativas de hibridação e lavagem para proporcionar condições de rigor semelhante. "Anticorpo" refere-se a um polipéptido compreendendo uma região de esqueleto proveniente de um gene de imunoglobulina ou seus fragmentos, que ligam especificamente e reconhecem um antigénio. Os genes de imunoglobulina reconhecidos incluem os genes de região constante capa, lambda, alfa, gama, delta, épsilon e mi, assim como a grande variedade de genes de região variável de imunoglobulina. As cadeias leves classificam-se como capa ou lambda. As cadeias pesadas classificam-se como gama, mi, alfa, delta ou épsilon, que por sua vez definem as classes de imunoglobulina, IgG, IgM, IgA, IgD e IgE, respetivamente.

Um exemplo de unidade estrutural de imunoglobulina (anticorpo) compreende um tetrâmero. Cada tetrâmero é composto por dois pares idênticos de cadeias polipeptídicas, contendo cada par uma cadeia "leve" (cerca de 25 kDa) e uma cadeia "pesada" (cerca de 50-70 kDa) . O terminal N de cada cadeia define uma região variável de cerca de 100 a 110 ou mais aminoácidos principalmente responsáveis pelo reconhecimento do antigénio. As expressões cadeia leve variável (Vl) e cadeia pesada variável (Vh) referem-se a essas cadeias leves e pesadas, respetivamente.

As frases "liga-se especificamente (ou seletivamente)" a um anticorpo ou "especificamente (ou seletivamente) imunorreativo com", em referência a uma proteína ou péptido, referem-se a uma reação de ligação que é determinante da presença da proteína numa população heterogénea de proteínas e outros produtos biológicos. Assim, em condições de imunoensaio designadas, os anticorpos especificados ligam uma proteína específica em quantidade de pelo menos duas vezes a linha de base e não ligam substancialmente em quantidade significativa outras proteínas presentes na amostra. A ligação específica a um anticorpo em tais condições pode necessitar de um anticorpo que é selecionado com base na sua especificidade para uma proteína específica. Por exemplo, podem selecionar-se anticorpos policlonais desenvolvidos contra proteínas de fusão para obter apenas os anticorpos policlonais que são especificamente imunorreativos com a proteína de fusão e não com componentes individuais das proteínas de fusão. Esta seleção pode obter-se retirando anticorpos que apresentem reação cruzada com antigénios individuais. Podem usar-se vários formatos de imunoensaio para selecionar anticorpos que são especificamente imunorreativos com uma proteína específica. Por exemplo, os imunoensaios de ELISA em fase sólida são usados de forma rotineira para selecionar anticorpos que são especificamente imunorreativos com uma proteína (consultar, e.g., Harlow & Lane, Antibodies, A Laboratory Manual (1988), para uma descrição dos formatos e condições de imunoensaios que podem ser usados para determinar imunorreatividade específica). Tipicamente uma reação específica ou seletiva será de pelo menos duas vezes o sinal de linha de base ou ruído e mais tipicamente mais de 10 a 100 vezes a linha de base.

Os polinucleótidos podem compreender uma sequência nativa (i.e., uma sequência endógena que codifica para um polipéptido individual ou ARNcd ou uma sua parte) ou podem compreender uma variante de tal sequência. As variantes de polinucleótidos podem conter uma ou mais substituições, adições, deleções e/ou inserções de modo a que a atividade biológica do polipéptido codificado não diminua, relativamente a um polipéptido compreendendo antigénios nativos. As variantes de polinucleótidos podem conter uma ou mais substituições, adições, deleções e/ou inserções de modo a que a atividade agonista de TLR-3 dos ARNcd codificados não seja diminuída relativamente a um ARNcd que não contém as substituições, adições, deleções e/ou inserções. As variantes apresentam preferentemente pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% relativamente a uma sequência polinucleotídica que codifica para um polipéptido nativo ou uma sua parte ou a uma sequência polinucleotídica que codifica para um ARNcd com atividade de agonista de TLR-3.

As expressões "idêntica" ou percentagem de "identidade", no contexto de duas ou mais sequências de ácido nucleico (e.g., um ARNcd que é um agonista de TLR-3) ou polipeptídicas, refere-se a duas ou mais sequências ou subsequências que são a mesma ou que têm uma percentagem especificada de resíduos de aminoácido ou de nucleótidos que são os mesmos (i.e., 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade ao longo de uma região especificada), quando comparados e alinhados para correspondência máxima ao longo de uma janela de comparação ou região designada tal como medida usando um dos seguintes algoritmos de comparação de sequências ou por alinhamento manual e inspeção visual. Diz-se então que tais sequências são "substancialmente idênticas". Esta definição também se refere a uma sequência de ensaio. Opcionalmente, a identidade existe ao longo de uma região que tem pelo menos cerca de 10 a cerca de 100, cerca de 20 a cerca de 75, cerca de 30 a cerca de 50 aminoácidos ou nucleótidos de comprimento.

Para comparação de sequências, tipicamente uma sequência funciona como uma sequência de referência, contra a qual se comparam as sequências de ensaio. Quando se usa um algoritmo de comparação de sequências, introduzem-se num computador as sequências de ensaio e de referência, designam-se as coordenadas de subsequência, caso necessário e designam-se os parâmetros do programa do algoritmo de sequências. Podem usar-se os parâmetros por omissão do programa ou podem designar-se parâmetros alternativos. O algoritmo de comparação de sequências calcula então a percentagem de identidades de sequência para as sequências de ensaio relativamente à sequência de referência, com base nos parâmetros do programa.

Uma "janela de comparação", tal como aqui usada, inclui referência a um segmento de qualquer uma de entre várias posições contíguas desde cerca de 10 a cerca de 500, cerca de 25 a cerca de 200, 50 a cerca de 150, na qual uma sequência pode ser comparada com uma sequência de referência do mesmo número de posições contíguas, após as duas sequências serem alinhadas de forma ótima. Os métodos de alinhamento de sequências para comparação são bem conhecidos na área técnica. O alinhamento ótimo de sequências para comparação pode efetuar-se, e.g., pelo algoritmo de homologia local de Smith e Waterman, Adv. Appl. Math. 2:482 (1981), algoritmo de alinhamento por homologia de Needleman e Wunsch, J. Mol. Biol. 48:443 (1970), pelo método de busca de semelhança de Pearson e Lipman, Proc. Nat'l. Acad. Sei. USA 85:2444 (1988), pelas implementações computorizadas destes algoritmos (GAP, BESTFIT, FASTA e TFASTA do pacote de utilitários da Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, WI) ou por alinhamento manual e inspeção visual (consultar, e.g., Current Protocols in Molecular Biology (Ausubel et al., ed. 1995 suplemento)).

Um exemplo de um algoritmo útil é PILEUP. 0 PILEUP cria um alinhamento de sequências múltiplo a partir de um grupo de sequências relacionadas usando alinhamentos emparelhados progressivos para evidenciar a relação e a percentagem de identidade de sequência. Também faz a representação gráfica de uma árvore ou dendograma que evidencia as relações entre membros do conjunto que foram usadas para criar o alinhamento. 0 PILEUP usa uma simplificação do método de alinhamento progressivo de Feng e Doolittle, J. Mol. Evol. 35:351-360 (1987). O método usado é semelhante ao método descrito por Higgins e Sharp, CABIOS 5:151-153 (1989). O programa pode alinhar até 300 sequências, cada uma com um comprimento máximo de 5000 nucleótidos ou aminoácidos. O procedimento de alinhamento múltiplo inicia-se com o alinhamento emparelhado das duas sequências mais semelhantes, produzindo um conjunto de duas sequências alinhadas. Alinha-se então este conjunto com a próxima sequência ou conjunto de sequências alinhadas que forem mais fortemente relacionadas. Alinham-se então dois conjuntos de sequências pela simples extensão do alinhamento emparelhado de duas sequências individuais. Obtém-se o alinhamento final através de uma série de alinhamentos emparelhados progressivos. O programa corre designando sequências especificas e as suas coordenadas de aminoácidos ou nucleótidos para as regiões da comparação de sequências e designando os parâmetros do programa. Usando PILEUP, compara-se uma sequência de referência com outras sequências de ensaio para determinar a relação de percentagem de identidade de sequência usando os parâmetros seguintes: peso da falha por omissão (3,00), peso do comprimento da falha por omissão (0,10) e falhas de terminação ponderadas. Pode obter-se PILEUP a partir do pacote utilitário de análise de sequências GCG, e.g., versão 7.0 (Devereaux et al., Nuc. Acids Res. 12:387-395 (1984) .

Outro exemplo de algoritmo que é adequado para determinar percentagem de identidade de sequência e de semelhança de sequência são os algoritmos BLAST e BLAST 2.0, que se descrevem em Altschul et al., Nuc. Acids Res. 25:3389-3402 (1977) e Altschul et al., J. Mol. Biol. 215:403-410 (1990), respetivamente. O utilitário para efetuar análises de BLAST está disponível ao público através de National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/). Este algoritmo envolve primeiramente identificar os pares de sequências com pontuações elevadas (HSP) pela identificação de palavras curtas de comprimento W na sequência em teste, que correspondem ou que satisfazem um limiar de pontuação T com valor positivo quando alinhadas com uma palavra do mesmo comprimento numa sequência de base de dados. Refere-se T como o limiar de pontuação de palavra da vizinhança (Altschul et al., anteriormente). Estes acertos iniciais de palavras vizinhas funcionam como sementes para iniciar buscas para encontrar HSP mais longas que as contenham. Vão-se estendendo os acertos de palavras em ambos os sentidos ao longo de cada sequência desde que tal conduza a um aumento da pontuação acumulada do alinhamento. Calculam-se as pontuações acumuladas usando, para sequências de nucleótidos, os parâmetros M (pontuação de prémio para um par de resíduos correspondentes; sempre >0) e N (pontuação de penalização para resíduos não correspondentes; sempre < 0) . Para sequências de aminoácidos, usa-se uma matriz de pontuação para calcular a pontuação acumulada. Para-se a extensão dos acertos de palavra em cada sentido quando a pontuação acumulada do alinhamento desce de uma quantidade X a contar do seu valor máximo atingido; a pontuação acumulada desce para zero ou abaixo de zero devido à acumulação de um ou mais alinhamentos de resíduos com pontuação negativa ou quando se atinge o final de qualquer uma das sequências. Os parâmetros W, T e X do algoritmo BLAST determinam a sensibilidade e velocidade do alinhamento. O programa BLASTN (para sequências de nucleótidos) usa como valores por omissão um comprimento de palavra (W) de 11, uma expetativa (E) de 10, M=5, N=-4 e uma comparação de ambas as cadeias. Para sequências de aminoácidos, o programa BLASTP usa como valores por omissão um comprimento de palavra de 3 e expetativa (E) de 10 e a matriz de pontuação BLOSUM62 (consultar Henikoff e Henikoff, Proc. Natl. Acad. Sei. USA 89:10915 (1989)) alinhamentos (B) de 50, expetativa (E) de 10, M=5, N=-4 e uma comparação de ambas as cadeias. O algoritmo BLAST também efetua uma análise estatística da semelhança entre duas sequências (consultar, e.g., Karlin e Altschul, Proc. Nat'l. Acad. Sei. USA 90:5873-5787 (1993)). Uma medida de semelhança proporcionada pelo algoritmo BLAST é a probabilidade da soma mínima (P(N)), que proporciona uma indicação da probabilidade pela qual uma semelhança entre duas sequências de nucleótidos ou de aminoácidos ocorreria aleatoriamente. Por exemplo, considera-se que um ácido nucleico é semelhante a uma sequência de referência se a probabilidade da soma mínima numa comparação entre o ácido nucleico de ensaio e o ácido nucleico de referência, for inferior a cerca de 0,2, com maior preferência inferior a cerca de 0,01 e com a maior preferência inferior a cerca de 0,001. III. Composições da presente invenção A invenção proporciona composições compreendendo vetores adenovíricos quiméricos. Em algumas concretizações, os vetores adenovíricos quiméricos da invenção compreendem um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo e um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de TLR3. O primeiro e o segundo promotores podem ser o mesmo ou podem ser diferentes. Em algumas concretizações, o primeiro e o segundo promotores são selecionados independentemente de: o promotor de beta-actina e o promotor de CMV.

Em alguns aspetos da invenção, o vetor adenovírico quimérico compreende o genoma adenovírico (sem os genes El e E3) e um ácido nucleico que codifica para um gene que ativa IRF-3 e outras moléculas de sinalização a jusante de TLR-3. Pode administrar-se o vetor quimérico a uma célula que expressa o gene EI de Ad de modo a que o adenovirus recombinante (rAd) seja produzido pela célula. Este rAd pode ser recolhido e é capaz de um único ciclo de infeção que entregará a composição transgénica a outra célula num mamífero de modo a desencadear respostas imunitárias contra o polipéptido heterólogo. A. Vetores adenovíricos adequados

Em algumas concretizações, o vetor adenovírico é adenovirus 5, incluindo, por exemplo, Ad5 com deleções das regiões E1/E3 e Ad5 com uma deleção da região E4. Outros vetores adenovíricos adequados incluem as estirpes 2, as estirpes 4 e 7 ensaiadas oralmente, os adenovirus entéricos 40 e 41 e outras estirpes (e.g. Ad34) que são suficientes para entregar um antigénio e desencadear uma resposta imunitária adaptativa contra o

antigénio do transgene [Lubeck et al., Proc Natl Acad Sci U S A, , 86(17), 6763-6767 (1989); Shen et al., J Virol, 75(9), 4297-4307 (2001); Bailey et al., Virology, 202(2), 695-706 (1994)]. Em algumas concretizações, o vetor adenovirico é um vetor adenovírico vivo incompetente para replicação (tal como rAd5 com deleção de El e E3), um vetor adenovírico vivo e atenuado (tal como os vírus de deleção E1B55K) ou um vetor adenovírico vivo com replicação de tipo selvagem.

As sequências de controlo de transcrição e de tradução em vetores de expressão para serem usados para transformar células de vertebrado in vivo, podem ser proporcionadas por fontes víricas. Por exemplo, os promotores e facilitadores habitualmente utilizados são derivados, e.g., de beta-actina, de adenovirus, de vírus símio (SV40) e de citomegalovírus humano (CMV) . São adequados, por exemplo, vetores que permitem a expressão de proteínas sob a direção do promotor de CMV, promotor precoce de SV40, promotor tardio de SV40, promotor de metalotioneína, promotor do vírus do tumor mamário murino, promotor do vírus do sarcoma de Rous, promotor de transdutor ou outros promotores que se mostrar serem eficazes para expressão em células de mamífero. Podem usar-se adicionalmente um promotor de genoma vírico e sequências de controlo e/ou de sinalização, desde que tais sequências de controlo sejam compatíveis com a célula hospedeira escolhida. B. Polipéptidos heterólogos

Os ácidos nucleicos que codificam para polipéptidos heterólogos adequados podem ser derivados a partir de antigénios tais como, por exemplo, antigénios víricos, antigénios bacterianos, antigénios de cancro, antigénios fúngicos ou antigénios de parasitas.

Os antigénios víricos podem ser derivados de, por exemplo, vírus da imunodeficiência humana (e.g., gag (p55 e pl60), pol, env (gpl20 e gp41) tal como apresentado em Shiver et al. Nature 415(6869):331 (2002); as sequências genómicas de HIV tal como apresentadas nos números de acesso Genbank EF363127; EF363126; EF363125; EF363124; EF363123; EF363122; EF192592; e EF192591; as sequências de gag de HIV tal como apresentadas nos números de acesso Genbank EF396891; EF396890; EF396889; EF396888; EF396887; EF396886; EF396885; EF396884; EF396883; EF396882; EF396881; EF396880; EF396879; EF396878; EF396877; EF396876; EF39687; EF396874; EF396873; e EF396872; as sequências de pol de HIV tal como apresentadas nos números de acesso Genbank EF396810; EF396809; EF396808; EF396807; EF396806; EF396805; EF396804; EF396803; EF396802; EF396801; EF396800; EF396799; EF396798; EF396797; EF396796; EF396795; EF396794; EF396793; EF396792; e EF396791; e as sequências de env de HIV tal como apresentadas nos números de acesso Genbank 9: EF367234; EF367233; EF367232; EF367231; EF367230; EF367229; EF367228; EF367227; EF367226; EF367225; EF367224; e EF367223, papilomavírus humano (e.g., proteina de cápside LI tal como descrito em, e.g., Donnelly et al. J Infect Dis. 173:314 (1996) e as sequências tal como apresentadas nos números de acesso Genbank EF362755; EF362754; NC_001694; NC_001693; NC_001691; NC_0 016 90; NC_005134; NC_001458; NC_001457; NC_001354; NC_001352; NC_001526; e X94164), virus de Epstein Barr, virus de herpes simplex, virus de herpes humana, rinovirus, virus de Cocksackie, enterovirus, hepatite A, B, C e E (e.g., antigénio de superfície de hepatite B tal como descrito em e.g., Lubeck et al, PNAS USA 86:6763 (1989) e as sequências tal como apresentadas nos números de acesso GenBank AB236481; AB236471; AB206501; AB206489; AB206487; AB221788; AB221777; AB221773; AR 933 671;AR 93367 0; AB236514; AB236513; AB236512; AB236511; AB236510; AB236509; AB236508; AB236507); NS5 de hepatite C (consultar, e.g., números de acesso Genbank X59609; DQ911563; S71627; S70787; S70786; S70341; S62220; S70790; S70789; S70788; e AB204642)), vírus da papeira, vírus da rubéola, vírus do sarampo, poliovirus, vírus da varíola, vírus da raiva e vírus de varicela-zóster. Os antigénios de influenza incluem, e.g., hemaglutinina (HA), proteína 1 de matriz (Ml) e nucleoproteína (NP) (consultar, e.g., Donnelly, et al, Vaccine 15:865 (1997) e as sequências de HA de influenza tal como apresentadas nos números de acesso Genbank AB294219; AB294217; AB294215; AB294213; EF102944; EF102943; EF102942; EF102941; EF102940; EF102939; EF102938; EF102937; EF102936; EF102935; EF102934; EF102933; DQ643982; DQ464354; CY019432; CY019424; CY019416; CY019408; CY019400; CY019392; CY019384; CY019376; CY019368; CY019360; CY019352; EF124794; EF110519; EF110518; EF165066; EF165065; EF165064; e EF165063; as sequências de Ml de influenza tal como apresentadas nos números de acesso Genbank AB292791; CY019980; CY019972; CY019964; CY019956; CY019948; CY019940; CY019628; CY019652; CY019644; CY019932; CY019924; CY019916; CY019908; CY019900; CY019892; CY019884; CY019876; CY019868; CY019860; e as sequências de NP de influenza tal como apresentadas nos números de acesso Genbank AB292790; CY019461; CY019974; CY019966; CY019958; CY019950; CY019942; CY019630; CY019654; CY019646; CY019934; CY019926; CY019918 CY019910; CY019902; CY019894; CY019886; CY019878; CY019870; e CY019862.

Os antigénios víricos adequados também incluem, e.g., proteínas víricas não estruturais. A expressão "proteína vírica não estrutural" tal como aqui usada, refere-se a proteínas codificadas pelo ácido nucleico vírico que não codifica para polipéptidos estruturais, tal como aquelas que constituem a cápside ou a proteína que rodeia o vírus. As proteínas não estruturais incluem as proteínas que promovem a replicação do ácido nucleico vírico e a expressão génica vírica tais como, por exemplo, as proteínas não estruturais 1, 2, 3 e 4 (NS1, NS2, NS3 e NS4, respetivamente) da encefalite equina venezuelana (VEE), EEE ou vírus de Semliki Forest [Dubensky et al., J Virol, 70(1), 508-519 (1996); Petrakova et al J Virol 2005 79(12): 7597-608; patentes U.S. 5 185 440; 5 739 026; 6 566 093; e 5 814 482. Vários exemplos representativos de alfavírus adequados incluem Aura (ATCC VR-368), vírus Bebaru (ATCC VR-600, ATCC VR-1240), Cabassou (números de acesso Genbank AF398387, ATCC VR-922), vírus da chicungunha (ATCC VR-64, ATCC VR-1241), vírus da encefalomielite equina oriental (números de acesso Genbank AY705241, AY7 05240, ATCC VR-65, ATCC VR-1242), Fort Morgan (ATCC VR-924), Getah (ATCC VR-369, ATCC VR-1243), Kyzylagach (ATCC VR-927), Mayaro (ATCC VR-66), vírus Mayaro (ATCC VR-1277), Middleburg (ATCC VR-370), vírus Mucambo (ATCC VR-580, ATCC VR- 1244) , Ndumu (ATCC VR-371), vírus Pixuna (ATCC VR-372, ATCC VR- 1245) , vírus de Ross River (ATCC VR-373, ATCC VR-1246), Semliki Forest (números de acesso Genbank AJ251359, ATCC VR-67, ATCC VR-1247), vírus Sindbis (números de acesso Genbank J02363, ATCC VR-68, ATCC VR-1248), Tonate (ATCC VR-925), Triniti (ATCC VR-469) , Una (ATCC VR-374), encefalomielite equina venezuelana (ATCC VR-69), vírus da encefalomielite equina venezuelana (números de acesso Genbank AY986475, AY973944, NC 001449, ATCC VR-923, ATCC VR-1250 ATCC VR-1249, ATCC VR-532), encefalomielite equina ocidental (ATCC VR-70, ATCC VR-1251, ATCC VR-622, ATCC VR-1252), Whataroa (ATCC VR-926) e Y-62-33 (ATCC VR-375).

Os antigénios bacterianos podem ser derivados de, por exemplo, Staphylococcus aureus, Staphylococcus epidermis, Helicobacter pylori, Streptococcus bovis, Streptococcus pyogenes, Streptococcus pneumoniae, Listeria monocytogenes, Mycobacterium tuberculosis, Mycobacterium leprae, Corynebacterium diphtheriae, Borrelia burgdorferi, Bacillus anthracis, Bacillus cereus, Clostridium botulinum, Clostridium difficile, Salmonella typhi, Vibrio chloerae, Haemophilus influenzae, Bordetella pertussis, Yersinia pestis, Neisseria gonorrhoeae, Treponema pallidum, Mycoplasm sp., Neisseria ransducer sp., Legionella pneumophila, Rickettsia typhi, Chlamydia trachomatis e Shigella dysenteriae, Vibrio cholera (e.g., subunidade B da toxina da cólera tal como apresentada nos números de acesso Genbank U25679; A09803; EF158842; X76391; AF390572; pilus corregulado pela toxina de cólera (TCP) tal como descrito em Wu et al., Infection and Immunity Vol. 69(12):7695 (2001) e tal como apresentado nos números de acesso Genbank NC_002505 e AE004169); Helicobacter pylorii (VacA tal como apresentado nos números de acesso Genbank AY848858; AF 042 7 37; AF042736; AF042735; AF042734; NC_000921; CagA tal como apresentado nos números de acesso Genbank AF043490; AF043489; AF043488; AF043487; NAP tal como apresentado nos números de acesso Genbank AF284121; AF284120; AF284119; AF284118; AF284117; AF284116; AB045143; AB045142; AF227081; AF227080; AF227079; AF227078; AF227077; AF227076; AF227075; AF227074; Hsp ou catalase tal como apresentado no número de acesso Genbank NC_000921; urease tal como apresentado nos números de acesso Genbank AM417610; AM417609; AM417608; AM417607; AM417606; AM417605; AM417604; AM417603; AM417602; AM417601; e AM417600; antigénios de E. coli tal como apresentado nos números de acesso Genbank NC_000913; U00096; NC_002655; BA000007; AE014075; incluindo os antigénios das fímbrias de E. coli tal como apresentado nos números de acesso Genbank AB214865; AB214864; AB214863; AB214862; enterotoxina lábil ao calor de E. coli tal como apresentado nos números de acesso Genbank X83966; V00275; X83966; J01646; V00275; M35581; M17873; M17874; K01995; M61015; M17894; M17101; K00433.

Os antigénios de parasita podem ser derivados de, por exemplo, Giardia lamblia, Leishmania sp., Trypanosoma sp., Trichomonas sp., Plasmodium sp. {e.g., antigénios da proteína de superfície de P. falciparum tal como sequências de pfs25 tal como apresentadas nos números de acesso Genbank XM_001347551; X07802; AF193769; AF179423; AF154117; e AF030628, sequências de pfs28 tal como apresentadas no número de acesso Genbank L25843, sequências pfs45 tal como apresentadas nos números de acesso Genbank EF158081; EF158079; EF158078; EF158076; EF158075; e EF158085, sequências de pfs84, pfs 48/45 tal como apresentadas nos números de acesso Genbank AF356146; AF356145; AF356144; AF 3 5 614 3; AF356142; AF356141; AF356140; AF356139; AF356138; AF 35 6137; AF356136; AF356135; AF356134; AF356133; AF356132; AF356131; AF356130; AF356129; AF356128; AF356127, sequências de pfs 230 tal como apresentadas nos números de acesso Genbank NC_00 0 910; XM_001349564; AE001393; L22219; L08135; e AF269242, antigénios de P. vivax tal como sequências de Pvs25 tal como apresentadas nos números de acesso Genbank DQ641509; DQ641508; DQ641507; AY639972; AY639971; AY639970; AY639969; AY639968; AY639967; AY639966; e AY639965; e sequências de Pvs28 tal como apresentadas nos números de acesso Genbank AB033364; AB033363; AB 0333 62; AB033361; AB033360; AB033359; AB033358; AB033357; AB 0 3335 6; B033355; AB033354; AB033353; AB033352; AB033351; AB0 3335 0; AB033349; AB033348; AB033347; AB033346; e AB033345), Schistosoma sp., Mycobacterium tuberculosis (e.g., sequências de Ag85 tal como apresentadas nos números de acesso Genbank AX253506; AX253504; AX253502; e AX211309; e sequências de MPT64, ESAT-6, CFP10 , R8307, MTB-32, MTB-39, CSP, LSA-1, LSA-3, EXP1, SSP-2, SALSA, STARP, GLURP, MSP-1, MSP-2, MSP-3, MSP-4, MSP-5, MSP-8, MSP-9, AMA-1, proteína integral de membrana do Tipo I, RESA, EBA-175 e DBA tal como apresentadas nos números de acesso Genbank BX842572; BX842573; BX842574; BX842575; BX842576; BX842577; BX842578; BX842579; BX842580; BX842581; BX842582; BX842583; BX842584, e NC_000962 e sequências de HSP65 tal como apresentadas nos números de acesso Genbank AY299175; AY299174; AY2 99144; AF547886; e AF547885) .

Os antigénios de cancro incluem antigénios expressos, por exemplo, em cancro do cólon, cancro de estômago, cancro pancreático, cancro de pulmão, cancro do ovário, cancro da próstata, cancro da mama, cancro da pele (e.g., melanoma), leucemia, linfoma ou mieloma, os exemplos de antigénios de cancro incluem, por exemplo, HPV LI, HPV L2, HPV El, HPV E2, fosfatase alcalina de placenta, AFP, BRCA1, Her2/neu, CA 15-3, CA 19-9, CA-125, CEA, Hcg, ativador de plasminogénio do tipo urocinase (Upa), inibidor do ativador de plasminogénio.

Os antigénios fúngicos podem ser derivados de, por exemplo, Tinea pedis, Tinea corporus, Tinea cruris, Tinea unguium, Cladosporium carionii, Coccidioides immitis, Candida sp., Aspergillus fumigatus e Pneumocystis carinii.

Os ácidos nucleicos gue codificam para polipéptidos imunogénicos são produzidos tipicamente por métodos de ADN recombinante (consultar, e.g., Ausubel, et al. ed. (2001) Current Protocols in Molecular Biology). Por exemplo, as seguências de ADN gue codificam para o polipéptido imunogénico podem ser montadas a partir de fragmentos de ADNc e ligantes de oligonucleótidos curtos ou de uma série de oligonucleótidos ou amplificadas a partir de ADNc usando iniciadores apropriados para proporcionar um gene sintético que é capaz de ser inserido num vetor de expressão recombinante (i.e., um vetor de plasmídeo ou um vetor virico) e expresso numa unidade de transcrição recombinante. Após produção do ácido nucleico que codifica para um polipéptido imunogénico, este pode ser inserido num vetor de expressão recombinante que é adequado para expressão in vivo ou ex-vivo.

Os vetores de expressão recombinantes contêm uma sequência de ADN que codifica para um polipéptido imunogénico ligado operacionalmente a elementos de regulação de transcrição ou tradução adequados derivados de genes de mamífero ou viricos. Tais elementos de regulação incluem um promotor de transcrição, uma sequência de operador opcional para controlar a transcrição, uma sequência que codifica para locais de ligação ribossómicos para ARNm adequados e sequências que controlam a terminação de transcrição e tradução. Pode incorporar-se adicionalmente uma origem de replicação e um marcador selecionável para facilitar o reconhecimento de produtos de transformação. Os genes utilizados nos vetores de expressão recombinantes podem ser divididos entre mais que um vírus de modo a que os produtos génicos estejam em dois vetores diferentes e usam-se os vetores para cotransdução para proporcionar todos os produtos génicos em trans. Pode haver razões para dividir os produtos génicos tal como limitações de tamanho para inserções ou toxicidade dos produtos génicos combinados relativamente às linhas celulares produtoras de vírus. C. Agonistas de TLR-3

Na presente invenção, utiliza-se um agonista de TLR-3 que é um ARNcd heterólogo para estimular reconhecimento imunitário de um antigénio de interesse. Os agonistas de TLR-3 incluem, por exemplo, ARN em gancho de cabelo curto (ARNgc, ou "shRNA" do inglês "short hairpin RNA"), ARN derivado de virus, segmentos curtos de ARN que podem formar cadeias duplas ou ARN em gancho de cabelo curto e ARN de interferência pequeno (ARNip, ou "siRNA" do inglês "short interfering RNA"). Numa concretização da invenção, o agonista de TLR-3 é ARNcd derivado por via virica, tal como por exemplo um ARNcd derivado de um vírus Sindbis ou intermediários de ARNcd vírico [Alexopoulou et ai, Nature 413:732-8 (2001)]. Em algumas concretizações, os agonistas de TLR-3 são um ARN em gancho de cabelo curto. As sequências de ARN em gancho de cabelo curto compreendem tipicamente duas sequências complementares ligadas por uma sequência ligante. A sequência ligante específica não é um aspeto crítico da invenção. Pode usar-se qualquer sequência ligante apropriada desde que não interfira com a ligação das duas sequências complementares para formar um ARNcd.

Em algumas concretizações, o ARN em gancho de cabelo curto compreende uma sequência apresentada em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 ou 12, uma sequência com identidade substancial com uma sequência apresentada em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11, ou 12 ou uma variante de uma sequência apresentada em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 ou 12. Em determinadas concretizações, o ARNcd que é um agonista de TLR-3 não codifica para um polipéptido específico, mas produz uma citocina pró-inflamatória (e.g. IL-6, IL-8, TNF-alfa, IFN-alfa, IFN-beta) quando posto em contacto com uma célula respondedora (e.g., uma célula dendrítica, uma célula mononuclear de sangue periférico ou um macrófago) in vitro ou in vivo. Em alguns casos, administram-se o ácido nucleico que codifica para o agonista de TLR-3 (ARNcd não expressos) e o vetor adenovírico quimérico compreendendo um ácido nucleico que codifica para um antigénio heterólogo na mesma formulação. Em algumas concretizações, o ácido nucleico que codifica para o agonista de TLR-3 e o ácido nucleico que codifica para o antigénio heterólogo estão sob o controlo de promotores diferentes.

Estão disponíveis comercialmente vários análogos de ARN em cadeia dupla sintetizados quimicamente. Estes incluem ácido poli-inosina-policitidílico (poli I:C), ácido poliadenílico: poliuridílico (poli A:U) e poli I:poli C. Os anticorpos (ou a ligação cruzada de anticorpos) para TLR-3 podem também levar à produção de IFN-beta ou de citocina pró-inflamatória [Matsumoto et al, Biochem. Biophys. Res. Commun. 24:1364 (2002), de Bouteiller et al, J Biol. Chem. 18:38133-45 (2005)]. Podem também obter-se segmentos de ARNip de qualquer sequência disponíveis comercialmente, através de fontes tais como Invitrogen. IV. Composições farmacêuticas

As composições farmacêuticas compreendendo os vetores aqui descritos podem também conter outros compostos que podem ser biologicamente ativos ou inativos. Os polipéptidos podem ser, embora não necessariamente, conjugados com outras macromoléculas tal como descrito, por exemplo, nas patentes U.S. 4372945 e 4474757. As composições farmacêuticas podem ser geralmente usadas com objetivos profiláticos e terapêuticos. As composições farmacêuticas podem ser compostas por métodos para proteger contra degradação no estômago tal que o vetor adenovírico quimérico administrado possa atingir os locais pretendidos. Para o ambiente oral, estão disponíveis vários destes, incluindo os sistemas de libertação Eudragit e TimeClock assim como outros métodos especificamente concebidos para adenovirus [Lubeck et al., Proc Natl Acad Sei USA, 86(17), 6763-6767 (1989); Chourasia e Jain, J Pharm Pharm Sei, 6(1), 33-66 (2003)] . Existem também vários métodos já descritos para a microencapsulação de ADN e fármacos para entrega oral (consultar, e.g., publicação de patente U.S. 2004043952). Em algumas concretizações, utilizar-se-á o sistema Eudragit para entregar o vetor adenovírico quimérico ao intestino delgado inferior. Contudo, a entrega em outros locais do intestino delgado deve também funcionar.

Tal como mencionado anteriormente, os vetores adenovíricos quiméricos da invenção podem ser entregues usando quaisquer sistemas de entrega conhecidos dos peritos na especialidade. São bem conhecidas na área técnica várias técnicas de entrega de genes, tais como as descritas por Rolland (1998) Crit. Rev.

Therap. Drug Carrier Systems 15:143-198 e referências aí citadas .

Será evidente que as composições imunogénicas podem conter sais farmaceuticamente aceitáveis dos polinucleótidos que codificam para os polipéptidos heterólogos (e.g., polipéptidos imunogénicos). Tais sais podem preparar-se a partir de bases não tóxicas e farmaceuticamente aceitáveis, incluindo bases orgânicas (e.g., sais de aminas primárias, secundárias e terciárias e aminoácidos básicos) e bases inorgânicas (e.g., sais de sódio, potássio, lítio, amónio, cálcio e magnésio). Alguns exemplos específicos de sais incluem solução salina tamponada com fosfato e solução salina injetável.

Pode utilizar-se nas composições farmacêuticas da presente invenção qualquer transportador adequado conhecido dos peritos na especialidade. Os transportadores adequados incluem, por exemplo, água, solução salina, álcool, uma gordura, uma cera, um tampão, um transportador sólido, tal como manitol, lactose, amido, estearato de magnésio, sacarina sódica, talco, celulose, glucose, sacarose e carbonato de magnésio ou microesferas biodegradáveis (e.g., polilactatopoliglicolato). Estão divulgadas microesferas biodegradáveis adequadas, por exemplo, nas patentes U.S. 4897268; 5075109; 5928647; 5811128; 5820883. O polipéptido imunogénico e/ou o vírus transportador podem ser encapsulados no interior da microesfera biodegradável ou associados a superfície da microesfera.

Tais composições podem também compreender tampões (e.g., solução salina tamponada neutra ou solução salina tamponada de fosfato), hidratos de carbono (e.g., glucose, manose, sacarose ou dextranos), manitol, proteínas, polipéptidos ou aminoácidos tais como glicina, antioxidantes, bacteriostáticos, agentes quelantes tais como EDTA ou glutationa, adjuvantes (e.g., hidróxido de alumínio), solutos que tornam a formulação isotónica, hipotónica ou ligeiramente hipertónica relativamente ao sangue de um recebedor, agentes de suspensão, agentes espessantes e/ou conservantes. Alternativamente, podem formular-se as composições da presente invenção como um liofilizado. Os compostos podem também encapsular-se no interior de lipossomas utilizando tecnologia bem conhecida.

Em algumas divulgações, as composições compreendem adicionalmente um adjuvante. Os adjuvantes adequados incluem, por exemplo, os compostos lipidicos e não lipídicos, toxina da cólera (CT), subunidade B de CT, CTK63 derivado de CT, enterotoxina lábil ao calor (LT) de E. coli, LTK63 derivado de LT, AI (OH)3 e ácidos orgânicos poli-iónicos tal como descrito em e.g., WO 04/020592, Anderson e Crowle, Infect. Immun. 31(1):413-418 (1981), Roterman et al, J. Physiol. Pharmacol, 44(3):213-32 (1993), Arora e Crowle, J. Reticuloendothel. 24(3):271-86 (1978) e Crowle e May, Infect. Immun. 38(3):932-7 (1982)). Os ácidos orgânicos poli-iónicos adequados incluem por exemplo, 6, 6' -[3, 3' -demitil[1,r-bifenil]-4,4'-di-iljbis(azo)bis[ácido 4-amino-5-hidroxi-l,3-naftalenodissulfónico] (azul de Evans) e 3,3'-[1,1'-bifenil]-4,4'-di-ilbis(azo)bis[ácido 4-amino-l-naftalenossulfónico] (vermelho do Congo). Os peritos na especialidade considerarão que os ácidos orgânicos poli-iónicos podem ser usados para qualquer método de vacinação genética em conjunção com qualquer tipo de administração.

Outros adjuvantes adequados incluem imunomoduladores tópicos tais como membros da família da imidazoquinolina, tal como, por exemplo, imiquimod e resiquimod (consultar, e.g., Hengge et al, Lancet Infect. Dis. 1(3):189-98 (2001). Podem também usar-se agonistas de TLR-3 expressos {e.g., ARNcd) e agonistas de TLR-7 (e.g., ARNss).

Estão disponíveis comercialmente adjuvantes adequados adicionais tais como, por exemplo, adjuvantes baseados em alúmen adicionais (e.g., Alhydrogel, Rehydragel, fosfato de alumínio, Algammulin); adjuvantes baseados em óleo (adjuvante incompleto de Freund e adjuvante completo (Difco Laboratories, Detroit, Mich.), Specol, RIBI, TiterMax, Montanide ISA50 ou Seppic MONTANIDE ISA 720); adjuvantes baseados em copolímero em bloco não iónico, citocinas (e.g., GM-CSF ou ligando Flat3); adjuvante 65 de Merck (Merck and Company, Inc., Rahway, N. J.); AS-2 (SmithKline Beecham, Philadelphia, Pa.); sais de cálcio, ferro ou zinco; uma suspensão insolúvel de tirosina acilada; açúcares acilados; polissacáridos derivatizados catiónica ou anionicamente; polifosfazenos; microesferas biodegradáveis; monofosforil-lípido A e Quil A. São também adjuvantes adequados as citocinas, tais como GM-CSF ou interleucina-2, interleucina-7 ou interleucina-12. Podem também usar-se na invenção hemocianinas (e.g., hemocianina de lapa gigante) e hemeritrinas. Os polissacáridos são também adjuvantes adequados tais como, por exemplo, quitina, quitosano e quitina desacetilada. Outros adjuvantes adequados incluem dipéptido de muramilo (MDP, N-acetilmuramil-L-alanil-D-isoglutamina) peptidoglicanos bacterianos e seus derivados (e.g., treonil-MDP e MTPPE). Podem também usar-se como adjuvantes BCG e BCG do esqueleto da parede celular (CWS), com ou sem tre-halosedimicolato. Pode também usar-se tre-halosedimicolato de per se (consultar, e.g., patente U.S. 4579945). As endotoxinas destoxifiçadas são também úteis como adjuvantes sozinhas ou em combinação com outros adjuvantes (consultar, e.g., patentes U.S. 4866034; 4435386; 4505899; 4436727; 4436728; 4505900; e 4520019. As saponinas QS21, QS17, QS7 são também úteis como adjuvantes (consultar, e.g., patente U.S. 5057540; EP 0362279; WO 96/33739; e WO 96/11711). Outros adjuvantes adequados incluem Montanide ISA 720 (Seppic, França), SAF (Chiron, Calif., Estados Unidos), ISCOMS (CSL), MF-59 (Chiron), a série SBAS de adjuvantes (e.g., SBAS-2, SBAS-4 ou SBAS-6 ou suas variantes, disponíveis de SmithKline Beecham, Rixensart, Bélgica) , Detox (Corixa, Hamilton, Mont.) , e RC-529 (Corixa, Hamilton, Mont) .

Estão também contemplados superantigénios para utilização como adjuvantes na presente divulgação. Os superantigénios incluem exoproteínas de estafilococos, tais como as enterotoxinas oí, β, γ e Δ de S. aureus e S. epidermidis e as exotoxinas α, β, γ e Δ de E. coli. As enterotoxinas de estafilococos comuns são conhecidas como enterotoxina A de estafilococos (SEA) e enterotoxina B de estafilococos (SEB), tendo sido descritas enterotoxinas até E (SEE) (Rott et al., 1992). São também úteis como superantigénios a enterotoxina de Streptococcus pyogenes B (SEB), de Clostridium perfringens (Bowness et al., 1992), proteína associada à membrana citoplasmática (CAP) de S. pyogenes (Sato et al, 1994) e toxina 1 de síndrome de choque tóxico (TSST 1) de S. aureus (Schwab et al., 1993).

Nas composições farmacêuticas aqui proporcionadas, a composição de adjuvante pode ser concebida para induzir, e.g., uma resposta imunitária predominantemente do tipo Thl ou Th2. Os níveis elevados de citocinas do tipo Thl (e.g., IFN-gama, TNF-alfa, IL-2 e IL-12) tendem a favorecer a indução de respostas imunitárias mediadas por células a um antigénio administrado. Contrariamente, os niveis elevados de citocinas do tipo Th2 (e.g., IL-4, IL-5, IL-6 e IL-10) tendem a favorecer a indução de respostas imunitárias humorais. Após administração oral de uma composição compreendendo um polipéptido imunogénico tal como aqui proporcionado, será tipicamente desencadeada uma resposta imunitária que inclui respostas do tipo Thl e Th2.

As composições aqui descritas podem ser administradas como parte de uma formulação de libertação prolongada (i.e., uma formulação tal como uma cápsula ou esponja que efetua uma libertação lenta do composto após administração). Tais formulações podem ser geralmente preparadas usando tecnologia bem conhecida (consultar, e.g., Coombes et al. (1996) Vaccine 14:1429-1438). As formulações de libertação prolongada podem conter um polipéptido, polinucleótido ou anticorpo disperso numa matriz transportadora e/ou contido num reservatório rodeado por uma membrana de controlo da velocidade.

Os transportadores para utilização em tais formulações são biocompativeis e podem também ser biodegradáveis; preferentemente a formulação proporciona um nível relativamente constante de libertação do componente ativo. Tais transportadores incluem micropartícuias de poli(lactida-co-glicolida), bem como poliacrilato, látex, amido, celulose e dextrano. Outros transportadores de libertação prolongada incluem biovetores supramoleculares, que compreendem um núcleo hidrofílico não líquido (e.g., um polissacárido ou oligossacárido reticulado) e, opcionalmente, uma camada externa compreendendo um composto anfifílico (consultar, e.g., WO 94/20078; WO 94/23701; e WO 96/06638). A quantidade de composto ativo contida no interior de uma formulação de libertação prolongada depende do local de implante, da velocidade e duração prevista de libertação e da natureza da condição a ser tratada ou prevenida.

As composições farmacêuticas podem ser apresentadas em recipientes de dose unitária ou multidose, tais como ampolas ou frasquinhos selados. Tais recipientes são preferentemente selados hermeticamente para conservar a esterilidade da formulação até à sua utilização. Em geral, as formulações podem ser armazenadas como suspensões, soluções ou emulsões em veículos oleosos ou aquosos. Alternativamente, pode armazenar-se uma composição farmacêutica numa condição liofilizada que requer apenas a adição de um transportador líquido estéril, imediatamente antes da utilização. V. Utilizações terapêuticas da invenção

Um aspeto da presente invenção envolve as composições imunogénicas para utilização num método de tratamento que desencadeia uma resposta imunitária específica do antigénio num indivíduo ou doente com uma doença tal como, por exemplo, uma infeção vírica, uma infeção bacteriana, uma infeção por parasita, uma infeção fúngica ou cancro. Tal como aqui se utilizam, um "indivíduo" ou um "doente" referem-se a qualquer animal de sangue quente tal como, por exemplo, um roedor, um felino, um canino ou um primata, preferentemente um ser humano. Podem usar-se as composições imunogénicas para tratar qualquer estágio da doença, i.e., nos estágios précancro, cancro ou metastáticos, ou para prevenir a doença. Por exemplo, as composições aqui descritas podem ser usadas para tratar uma doença vírica tal como HIV ou hepatite ou para prevenção ou tratamento de cancro. Em tais métodos, as composições farmacêuticas são tipicamente administradas a um doente. 0 doente pode ou não sofrer de uma doença ou distúrbio (e.g., uma infeção vírica, uma infeção bacteriana ou cancro). Assim, as composições farmacêuticas anteriores podem ser usadas para evitar o desenvolvimento de uma doença ou distúrbio (e.g., uma infeção vírica, uma infeção bacteriana ou cancro) ou para tratar um doente que sofre da doença ou distúrbio (e.g., uma infeção vírica, uma infeção bacteriana ou cancro). A doença ou distúrbio podem ser diagnosticados usando critérios aceites geralmente na área técnica. Por exemplo, a infeção vírica pode ser diagnosticada por medição de título de vírus numa amostra de um doente, a infeção bacteriana pode ser diagnosticada por deteção de bactérias numa amostra do doente e o cancro pode ser diagnosticado por deteção da presença de um tumor maligno. As composições farmacêuticas podem ser administradas quer antes, quer após remoção cirúrgica de tumores primários e/ou tratamento tal como administração de radioterapia ou fármacos quimioterapêuticos convencionais. A imunoterapia é tipicamente imunoterapia ativa, na qual o tratamento se baseia na estimulação in vivo do sistema imunitário endógeno do hospedeiro para reagir contra, e.g., tumores ou células infetadas por bactérias ou virus, com a administração de agentes de modificação de resposta imunitária (composições compreendendo ácidos nucleicos que codificam para polipéptidos imunogénicos tal como aqui proporcionados). A frequência de administração das composições profiláticas ou terapêuticas aqui descritas, bem como a dosagem, variarão de indivíduo para indivíduo e podem ser facilmente estabelecidas usando técnicas padrão. Frequentemente podem ser administradas entre 1 e 10 doses ao longo de um período de 52 semanas. Tipicamente administram-se 3 doses, a intervalos de 1 mês, mais tipicamente, administram-se 2-3 doses de 2 em 2 ou de 3 em 3 meses. Para determinadas terapias é possível que os intervalos sejam mais provavelmente de um ano. Posteriormente, podem administrar-se vacinas de reforço periodicamente. Podem ser adequados protocolos alternativos para determinados doentes e doenças e distúrbios específicos. Uma dose adequada é uma quantidade de um composto que, quando administrado tal como descrito anteriormente, é capaz de promover uma resposta imunitária, e.g., uma resposta antitumor, antivírica ou antibacteriana, e é pelo menos 10-50% superior ao nível de base (i.e., não tratado). Tal resposta pode ser monitorizada por medição dos anticorpos antitumor num doente ou por geração dependente de vacina de células T citolíticas capazes de matar, e.g., as células de tumor do doente, as células do doente infetadas com vírus ou as células do doente infetadas com bactérias in vitro. Tais vacinas também deveriam ser capazes de causar uma resposta imunitária que leva a um resultado clínico melhorado (e.g., remissões mais frequentes, sobrevivência sem doença completa ou parcial ou mais prolongada) em doentes vacinados comparativamente a doentes não vacinados. Tipicamente, a quantidade de título vírico será entre Ι,ΟχΙΟ4 pfu/animal e Ι,ΟχΙΟ15 pfu/animal. Os tamanhos de dose adequados variarão com o tamanho do doente, mas tipicamente serão na gama de cerca de 0,01 ml a cerca de 10 ml, mais tipicamente de cerca de 0,025 a cerca de 7,5 ml, o mais tipicamente de cerca de 0,05 a cerca de 5 ml. Os peritos na especialidade considerarão que o tamanho da dose pode ser ajustado com base no doente específico ou na doença ou distúrbio específicos a serem tratados. Para administraçao oral, o vetor adenovírico quimérico pode ser convenientemente formulado como uma pílula.

Em geral, um regime de dosagem e tratamento adequado proporciona o(s) composto (s) ativo (s) numa quantidade suficiente para proporcionar benefício terapêutico e/ou profilático. Tal resposta pode ser monitorizada estabelecendo um resultado clínico melhorado {e.g., remissões, completas ou parciais, mais frequentes ou sobrevivência sem doença mais prolongada) em doentes tratados comparativamente a doentes não tratados. Tais respostas imunitárias podem ser geralmente avaliadas usando ensaios padrão de proliferação, citotoxicidade ou citocina descritos anteriormente, que podem ser efetuados usando amostras obtidas de um doente antes e após tratamento.

Por exemplo, pode usar-se deteção de imunocomplexos formados entre polipéptidos imunogénicos e anticorpos num fluido corporal que são específicos para polipéptidos imunogénicos, para monitorizar a eficácia da terapia, que envolve um polipéptido imunogénico específico, para uma doença ou distúrbio com o qual está associado o polipéptido imunogénico. Podem analisar-se amostras de fluido corporal obtidas de um indivíduo antes e após o início da terapia para os imunocomplexos, pelas metodologias descritas anteriormente. Sucintamente, compara-se o número de imunocomplexos detetados em ambas as amostras. Uma alteração substancial do número de imunocomplexos na segunda amostra (após início da terapia) relativamente à primeira amostra (pré-terapia) reflete uma terapia com sucesso. A. Administração das composições da presente invenção

De acordo com a composição para utilização em métodos da presente invenção, administra-se uma composição compreendendo o vetor adenovírico quimérico por via oral, intranasal ou mucosa, por exemplo, a vagina, pulmões, glândulas salivares, cavidades nasais, intestino delgado, cólon, reto, amígdalas ou placas de Peyer. A composição pode ser administrada sozinha ou com um adjuvante, tal como descrito anteriormente. Em algumas divulgações, os adjuvantes são codificados por uma sequência de ácido nucleico (e.g., um ácido nucleico que codifica para IL-2, GM-CSF, IL-12, de flagelina bacteriana). Em algumas divulgações, o adjuvante é administrado ao mesmo tempo da composição. Em algumas divulgações, o adjuvante é administrado após a composição, e.g., 6, 12, 18, 24, 36, 48, 60 ou 72 horas após administração da composição. B. Deteção de uma resposta imunitária contra antigénios de interesse

Pode detetar-se uma resposta imunitária contra o polipéptido heterólogo usando quaisquer meios conhecidos na área técnica incluindo, por exemplo, detetar ativação especifica de células T CD4+ ou CD8+ ou por deteção da presença de anticorpos que se ligam especificamente ao polipéptido. A ativação especifica de células T CD4+ ou CD8+ associadas a uma resposta imunitária mucosa, humoral ou mediada por célula pode ser detetada de várias formas. Os métodos para detetar ativação especifica de células T incluem a deteção da proliferação de células T, a produção de citocinas (e.g., linfocinas) ou a geração de atividade citolitica (i.e., geração de células T citotóxicas específicas para o polipéptido imunogénico), não se lhes limitando. Para células T CD4+, um método preferido para detetar a ativação específica de células T é a deteção da proliferação de células T. Para células T CD8+, um método preferido para detetar a ativação especifica de células T é a deteção da geração de atividade citolitica usando ensaios de libertação de 51Cr (consultar, e.g., Brossart e Bevan, Blood 90(4): 1594-1599 (1997) e Lenz et ai., J. Exp. Med. 192 (8) :1135-1142 (2000)) .

Pode conseguir-se a deteção da proliferação de células T por uma variedade de técnicas conhecidas. Por exemplo, pode detetar-se proliferação de células T por medição da taxa de síntese de ADN. As células T que foram estimuladas para proliferar apresentam uma taxa de síntese de ADN aumentada. Um modo típico para medir a taxa de síntese de ADN é, por exemplo, por marcação com impulsos de culturas de células T com timidina tritiada, um precursor de nucleósido que é incorporado em ADN sintetizado recentemente. Pode determinar-se a timidina tritiada incorporada usando um espetrofotómetro de cintilação de líquidos. Outras formas de detetar a proliferação de células T incluem medição do aumento de produção de interleucina-2 (IL-2), fluxo de Ca2+ ou absorção de corante, tal como 3-(4,5-dimetiltiazol-2-il)-2,5-difeniltetrazólio. Alternativamente, pode medir-se a síntese de linfocinas (e.g., interferão-gama) ou pode quantificar-se o número relativo de células T que podem ser sensíveis ao polipéptido imunogénico.

As respostas imunitárias de anticorpo (ou seja, respostas imunitárias humorais ou respostas de células B), incluindo as respostas de anticorpo nas mucosas, podem ser detetadas usando imunoensaios conhecidos na área técnica [Tucker et al., Mol Therapy, 8, 392-399 (2003); Tucker et al., Vaccine, 22, 2500-2504 (2004)]. Os imunoensaios adequados incluem a técnica de imunoensaio em sanduíche com anticorpo monoclonal duplo de David et al. (patente U.S. 4376110); ensaios em sanduíche de anticorpo monoclonal-policlonal (Wide et al., em Kirkham e Hunter, ed., Radioimmunoassay Methods, E. e S. Livingstone, Edinburgh (1970)); o método de "transferência western" de Gordon et al. (patente U.S. 4452901); imunoprecipitação de ligando marcado (Brown et al. (1980) J. Biol. Chem. 255:4980-4983); ensaios de imunoadsorção enzimática (ELISA) tal como descritos, por exemplo, por Raines et al. (1982) J. Biol. Chem. 257:5154-5160; técnicas imunocitoquímicas, incluindo a utilização de fluorocromos (Brooks et al. (1980) Clin. Exp. Immunol. 39:477); e neutralização de atividade (Bowen-Pope et al. (1984) Proc. Natl. Acad. Sei. USA 81:2396-2400). Adicionalmente aos imunoensaios descritos anteriormente, estão disponíveis vários outros imunoensaios, incluindo os descritos em patentes U.S. 3817827; 3850752; 3901654; 3935074; 3984533; 3996345; 4034074; e 4098876.

EXEMPLOS

Os exemplos seguintes destinam-se a ilustrar, mas não a limitar, a presente invenção.

Exemplo 1: Construção de um vetor adenovírico quimérico (DS1)

Para demonstrar que os agonistas de TLR-3 podem melhorar as respostas imunitárias adaptativas a antigénios de interesse expressos, construíram-se vários vetores adenovíricos quiméricos diferentes que compreendem sequências de ácido nucleico que codificam para vários antigénios de interesse diferentes. Neste exemplo, colocou-se o ácido nucleico que codifica para gpl20 (de NIH AIDS Reagent and Reference Reagent

Program) sob controlo de um promotor de CMV com um pequeno intrão imediatamente a montante do codão de iniciação no vetor de vaivém (pShuttle, Qbiogene). Colocou-se uma cauda poli A de bGH a jusante do ácido nucleico que codifica para gpl20. A sequência de vetor apresenta-se em SEQ ID NO: 1. Efetuou-se recombinação homóloga com o vetor pAd (Qbiogene) para gerar um vetor capaz de produzir Ad recombinante (com deleção de E1/E3) que continha o ácido nucleico que codifica para gpl20. Gerou-se DS1 por transfeção da nova construção de expressão pAd-CMV-gpl20 para células 293. Mediram-se os titulos por métodos padrão.

Exemplo 2: DS1 (vetor com agonista de TLR-3) é superior a rAd5 padrão na indução de resposta imunitária específica do antigénio

Para determinar se a adição do agonista de TLR-3 poderia melhorar as respostas imunitárias adaptativas, administrou-se lOxlO7 PFU de rAd-CMV-gpl20 com poli I:C (DS1) ou rAd-CMV-gpl20 sozinho (rAd5) a 5 ug/ml, a animais por gavagem oral nas semanas 0 e 3. Ambos os vetores expressam gpl20 de HIV sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra gpl20 no plasma, 3 e 6 semanas após a administração inicial por ELISA de IgG anti-gpl20 tal como descrito em Tucker, et al., Mol Ther 8:392 (2004)). Tal como apresentado na figura 1, DS1 teve um desempenho significativamente melhor do que rAd5, desencadeando respostas de anticorpo à proteína gpl20 tanto às 3, como às 6 semanas após administração oral inicial. Em particular, o título médio de anticorpo contra gpl20 foi 100 vezes melhor no grupo de DS1 do que no grupo de rAd5 na semana 6. Também parece que o grupo de DS1 foi reforçado por readministração na semana 4, dado que o título médio aumentou mais de 20 vezes entre as semanas 3 e 6, enquanto o grupo de rAd5 apresentou apenas um ligeiro aumento do título médio de anticorpo. Os resultados demonstram que a adição de um agonista de TLR-3 pode melhorar muito as respostas de anticorpo mediadas por Ad5 a antigénios de interesse, após administração oral de um vetor adenovírico quimérico compreendendo um ácido nucleico que codifica para o antigénio de interesse. Como um controlo positivo para o ensaio, mediu-se também soros de um animal injetado subcutaneamente com gpl20 com adjuvante completo de Freund na ELISA de anti-gpl20 na semana 3. Como controlo negativo e de linha de base para ELISA usaram-se animais não tratados e animais a que se administrou apenas o análogo de ARNcd (ARNcd), respetivamente. Cada grupo continha 6 animais.

Exemplo 3: Construção de um segundo vetor adenovírico quimérico (DSlb) e um terceiro vetor adenovírico quimérico (DSlc)

Inseriu-se um ácido nucleico que codifica proteína verde fluorescente (GFP) em pShuttle-CMV (Qbiogene) usando digestões com enzimas de restrição padrão. Combinou-se o plasmídeo pShuttleCMV-GFP por recombinação homóloga com o vetor pAd (Qbiogene), tal como descrito anteriormente, de modo a gerar um vetor capaz de produzir Ad recombinante (deleção de E1/E3) compreendendo uma sequência de ácido nucleico que codifica para GFP. Clonou-se um ácido nucleico que codifica para hemaglutinina (HA) de influenza A/PR/8/34 e colocou-se no vetor pShuttle-CMV (Qbiogene) (SEQ ID NO: 13). Combinou-se o plasmídeo pShuttleCMV-HA (PR/8) por recombinação homóloga com o vetor pAd (Qbiogene), tal como descrito anteriormente, de modo a gerar um vetor capaz de produzir Ad recombinante (deleção de E1/E3) compreendendo uma sequência de ácido nucleico que codifica para HA. Gerou-se Ad recombinante por transfeção das novas construções de expressão pAd-CMV-GFP e pAd-CMV-HA para células 293. Mediram-se os títulos por métodos padrão.

Exemplo 4: DSlb (Ad-CMV-GFP com agonista de TLR-3) e DSlc (Ad-CMV-HA com agonista de TLR-3) são superiores a rAd5 padrão para induzir uma resposta imunitária específica do antigénio.

Administrou-se Ι,ΟχΙΟ7 PFU de Ad-CMV-GFP com poli I:C (DSlb) ou Ad-CMV-GFP (rAd5) a 5 ug/ml a animais por gavagem oral na semana 0. Ambos os vírus expressam GFP sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra GFP no plasma 3 semanas após a administração inicial de vírus por ELISA de IgG anti-GFP. Tal como apresentado na figura 2, o grupo de DSlb teve um desempenho significativamente melhor do que rAd5 a desencadear respostas de anticorpo à proteína GFP, às 3 semanas após administração oral inicial.

As respostas de células T CD8+ a GFP foram medidas por coloração com tetrâmero de esplenócitos. Vacinaram-se os animais nas semanas 0, 4, 8 e recolheram-se baços na semana 10. Coraram-se os esplenócitos com CD8-FITC e o tetrâmero que reconhece o epítopo imunodominante para GFP em ratinhos Balb/c. Os resultados mostram que a administração oral do vetor DSlb foi estatisticamente melhor do que rAd sozinho, na indução de células CD8 positivas para tetrâmero (figura 2b) .

Administrou-se Ι,ΟχΙΟ7 PFU de Ad-CMV-HA com poli I:C (DSlc) ou Ad-CMV-HA (rAd5) a 5 ug/ml, a animais por gavagem oral na semana 0. Ambos os vírus expressam HA sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra HA no plasma 3 semanas após a administração inicial de vírus por ELISA de IgG anti-PR8/34. O procedimento para medir as respostas de anticorpo é semelhante ao descrito anteriormente, com a exceção de se terem revestido as placas de ELISA com lisado de A/PR8/34 completo a 5 ug/ml (Advanced Biotechnology Incorporated, Gaithersburg, MD) . Tal como apresentado na figura 2C, o grupo de DSlc teve um desempenho significativamente melhor (aproximadamente 100 vezes melhor) do que rAd5 a desencadear respostas de anticorpo a influenza, às 3 semanas após administração oral inicial. Os resultados destes estudos também demonstram que a abordagem de usar o agonista de TLR-3 conjuntamente com um vetor adenovírico recombinante quimérico pode ser aplicada geralmente a múltiplos antigénios heterólogos diferentes, com um titulo de anticorpo melhorado 100 vezes.

Exemplo 5: As vias não parentéricas de entrega são melhores do que as vias parentéricas

Ensaiou-se entrega intramuscular por injeção direta de Ι,ΟχΙΟ7 pfu de pAd-CMV-gpl20 (DS10 +/- poli I:C a 5 ug/ml nos quadricípites dos animais. Mediram-se os títulos de IgG de soro de plasma contra GFP tal como descrito anteriormente. Cada grupo continha 6 animais. Tal como apresentado na figura 3A, verificaram-se títulos de anticorpo contra gpl20 significativos 3 semanas após administração, no grupo com agonista de TLR-3 (i.m. rAd+PI). (figura 3a).

Ensaiou-se administração intranasal por administração de 20 ul de 1, lxl06 pfu de DSlc +/-5 ug/ml de poli I:C na cavidade nasal de ratinhos. Os ratinhos foram anestesiados ligeiramente com isoflurano antes de administração do vírus formulado em solução salina estéril. Os resultados mostram que rAd-CMV-HA com poli I:C (DSlc) apresentaram títulos de anticorpo ligeiramente maiores comparativamente a animais a que se administrou rAd-CMV-HA padrão. Os resultados foram representados graficamente como animais individuais para os grupos de DSlc (N=6) e de rAd (N=5) . Usaram-se animais não tratados (N=4) como controlos negativos.

Exemplo 6: Construção de um agonista de TLR3 expresso.

Sintetizou-se um segmento de ADN curto de 45 pb por ordenação de oligonucleótidos de ADN que quando hibridados entre si formaram um segmento de 45 pb concebido para formar um ARN em cadeia dupla em gancho de cabelo (GAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTC) (SEQ ID NO:10). Este segmento curto (denominado lucl) foi clonado no plasmideo pSK contendo o promotor de beta-actina humana e uma cauda poli A de BGH. Este plasmideo é denominado pSk-lucl.

Exemplo 7: 0 pSK-lucl funciona em culturas de células dendríticas como poli I:C, os efeitos de poli I:C e rAd são aditivos.

Para determinar se o agonista de TLR-3 expresso do exemplo 6 anterior poderia funcionar como um indutor de citocinas pró-inflamatórias e maturação de células dendríticas, tal como o ligando de TLR-3, poli I:C, ensaiou-se um ARNcd de agonista de TLR-3 expresso em culturas de células dendríticas. Cultivou-se medula óssea de fémures de ratinhos Balb/c com ligando flt-3 (200 ng/ml) , soro a 5%, em meio DMEM, de modo a preparar culturas de células dendríticas primárias. Cinco dias após se estabeleceram culturas primárias de medula óssea, transfetaram-se células 293 com pSk-lucl, pSK-beta2 (um segmento longo de beta galactosidase que forma um gancho de cabelo de 200 pb) ou pcDNA3 (vetor de expressão vazio). No dia 6, trataram-se as células transfetadas por irradiação UV (20 segundos a 40 kJ/cm2) para causar apoptose e administraram-se estas células às células dendríticas. Administraram-se células transfetadas com poli I:C (1 ug/ml), rAd (1 pfu/célula), rAd + poli I:C, pSK-lucl, células transfetadas com pSK-beta2 ou células transfetadas com pcDNA3 às células dendríticas e cultivaram-se durante a noite. Tal como apresentado na figura 4A, as células transfetadas com pSK-lucl podem melhorar significativamente a ativação de células dendríticas, tal como medido por ELISA de IL-6 de ratinho. Os resultados desta experiência também mostram que a combinação conjunta de rAd com ligando de TLR3 (poli I:C) pode melhorar grandemente a atividade de células dendriticas.

Ensaiaram-se também ligandos adicionais. 0 agonista de TLR-3 apresentado em SEQ ID NO: 11 (ml) também forma um ARNcd em gancho de cabelo com aproximadamente o mesmo tamanho que lucl. Estes foram preparados por sobreposição de oligonucleótidos e sua hibridação conjunta, antes de clonagem para o vetor pSK sob controlo do promotor de beta-actina humana. Os vetores foram transfetados para células 293 e administrados a células dendriticas primárias, tal como descrito anteriormente. Tal como apresentado na figura 4B, estes ligandos adicionais podem ativar as células dendriticas de forma semelhante ao ligando lucl (figura 4B).

Exemplo 8. Construção de um quarto vetor adenovírico quimérico (DS2) e vetores de clonagem rápida (DS2beta-luc e DS2C-luc).

Colocou-se um ácido nucleico que codifica para gpl20 (de NIH AIDS Research and Reference Reagent Program)) sob controlo de um promotor de CMV, com um pequeno intrão imediatamente a montante do codão de iniciação no vetor de vaivém (pShuttleCMV, Qbiogene) . Colocou-se uma cauda de poli A de bGH a jusante do ácido nucleico que codifica para gpl20. Inseriu-se ARNcd de agonista de TLR-3, luc 1, sob controlo do promotor de beta-actina humana e poli A (descrito no exemplo 5 anteriormente) no vetor gpl20 pShuttle de modo que tanto o ácido nucleico que codifica para gpl20, como o ácido nucleico que codifica para o agonista de TLR-3 estivessem contidos num único vetor sob o controlo de dois promotores independentes. A orientação da expressão do ácido nucleico que codifica para o antigénio de interesse e a expressão do agonista de TLR-3 encontra-se ilustrada na figura 5.

Construiram-se também dois vetores de vaivém genéricos denominados DS2beta-luc (SEQ ID NO: 14) e DS2C-luc (SEQ ID NO: 15) de modo que se pudesse inserir um ácido nucleico que codifica para qualquer antigénio de interesse sob controlo do promotor de CMV e usa-se o promotor de beta-actina humana ou o promotor de CMV para dirigir a expressão de um ARNcd de agonista de TLR-3. Em particular, o vetor DS2C-luc tem um local único de Kpn 1 de modo que se pode facilmente clonar para ai um ácido nucleico que codifica para um antigénio de interesse. 0 objetivo destes vetores é preparar um vetor de construção subsequente muito mais facilmente, porque se poderia inserir um ácido nucleico que codifica para qualquer antigénio de interesse no local de clonagem, para fabricar rapidamente um vetor capaz de desencadear respostas de anticorpo e de células T contra o antigénio de interesse. A recombinação homóloga de DS2 com o vetor pAd (Qbiogene) foi efetuada tal como anteriormente, de modo a gerar um vetor capaz de produzir Ad recombinante (deleção de E1/E3) que continha um ácido nucleico que codifica para GFP e um ácido nucleico que codifica para o ARNcd de agonista de TLR-3, luc 1. Gerou-se Ad recombinante por transfeção da nova construção de expressão pAd-beta-actina-lucl-CMV-gpl20 para células 293. Mediram-se os títulos por métodos padrão.

Exemplo 9: Indução de uma resposta imunitária específica do antigénio após entrega oral de DS2.

Administrou-se Ι,ΟχΙΟ7 PFU de pAd-CMV-gpl20 com o agonista de TLR-3, lucl (DS2) ou pAd-CMV-gpl2 0 (rAd5) a animais por gavagem oral na semana. Ambos os vírus expressam gpl20 sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra gpl20 no plasma, 3 semanas após administração do vírus por ELISA de IgG anti-gpl20. 0 protocolo de ELISA foi descrito anteriormente (Tucker, et al, Mol Therapy 8:392 (2004)). Os resultados demonstram que DS2 pode induzir uma melhoria de aproximadamente 2 log no título de anticorpo contra gpl20, o antigénio heterólogo usado na experiência. O vetor DS2 compreende uma sequência de ácido nucleico que codifica para expressar gpl20 e uma sequência de ácido nucleico que expressa um ARNcd agonista de TLR-3. Como um controlo positivo para o ensaio, mediram-se também soros de dois animais injetados subcutaneamente com 10 microgramas de proteína gpl20 com adjuvante completo de Freund em ELISA de anti-gpl20. Usaram-se como controlos negativos para ELISA, animais não tratados. Cada grupo continha 6 animais. Os resultados encontram-se ilustrados na figura 6.

Exemplo 10: Indução de uma resposta imunitária específica do antigénio após entrega oral de DS3.

Administrou-se Ι,ΟχΙΟ7 PFU de pAd-CMV-HA de influenza (de A/PR/8/34) com o ligando de ácido poliuridico TLR7/8 (DS3) ou pAd-CMV-HA (rAd5) a animais, por gavagem oral na semana 0. Ambos os virus expressam HA de influenza sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra HA no plasma, 3 semanas após administração do vírus por ELISA de IgG anti-HA de influenza. Cada grupo continha 6 animais. Os resultados estão ilustrados na figura 7.

Exemplo 11: Construção de um quinto, sexto e sétimo vetores adenovíricos quiméricos (DS2b, DS2b-for e ND1.1 214).

Sintetizou-se o gene de HA de influenza (A/Indo/5/2005) por CelTek (Nashville, TN) e colocou-se no vetor pShuttleCMV (Qbiogene) que tem um promotor de CMV com um pequeno intrão imediatamente a montante do codão de iniciação no vetor de vaivém. Colocaram-se o ADN de lucl com promotor de beta-actina humana e poli A (descrito no exemplo 5) no vetor a jusante do antigénio, na orientação apresentada na figura 5 para DS2b. A sequência de lucl é (GAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCA TATCGTTTC) (SEQ ID NO:10) e o vetor pShuttle completo apresenta-se em SEQ ID NO: 6. Descreve-se uma orientação alternativa de lucl com promotor num vetor de vaivém como SEQ ID NO: 7 e denomina-se DS2b-for. Também construímos outro vetor pShuttle (denominado DS2bC-HA) (SEQ ID NO: 16) que compreende dois promotores de CMV independentes que dirigem a expressão do agonista de TLR-3, lucl e HA de influenza descritos anteriormente. Efetuou-se recombinação homóloga com o vetor pAd (Qbiogene) tal como anteriormente de modo a gerar vetores capazes de produzir Ad recombinante (com deleção de E1/E3) que continham o ácido nucleico que codifica para HA e para o agonista de TLR-3, lucl, sob promotores independentes. Gerou-se Ad recombinante por transfeção das novas construções de pAd para células 293. Mediram-se os títulos por métodos padrão. O vetor pAd completo contendo DS2C-luc foi denominado ND1.1 214 e depositado no depositório de patentes de ATCC a 22 de fevereiro de 2007 (Manassus, VA). A sequência de ácido nucleico deste vetor adenovírico quimérico apresenta-se em SEQ ID NO: 17. 0 ácido nucleico que codifica para o antigénio heterólogo está em texto a negrito e está flanqueado por um local de reconhecimento de Cia I na extremidade 5' e um local de reconhecimento de Not 1 na extremidade 3'. A sequência de ácido nucleico que codifica para os agonistas de TLR-3 está em itálico, com a sequência ligante a negrito. Uma sequência de ácido nucleico que codifica para qualquer antigénio de interesse e uma sequência de ácido nucleico que codifica para qualquer agonista de TLR-3 expresso adequado podem ser inseridas no vetor adenovirico quimérico.

Exemplo 12: Indução de uma resposta imunitária específica do antigénio após entrega oral de DS2b.

Administrou-se Ι,ΟχΙΟ7 PFU de pAd-CMV-HA com os agonistas de TLR-3, lucl, na orientação inversa (DS2b) ou na orientação direta (DS2b-for) ou pAd-CMV-HA (rAd5) a animais, por gavagem oral na semana 0. Estes vírus expressam o antigénio de HA de influenza sob controlo do promotor de CMV e usam adenovirus de tipo 5 recombinante com deleção de E1/E3. Mediram-se os títulos de anticorpo contra HA no plasma 3 semanas após administração de vírus por ELISA de IgG anti-HA. Os resultados demonstram que o vetor DS2b desencadeia respostas de anticorpo contra proteína HA superiores às do vetor rAd padrão (rAd5). O vetor DS2b contém rAd5 que expressa HA, bem como expressa um agonista de recetor do tipo "toll" 3 (TLR3) , um ARN em cadeia dupla em gancho de cabelo, demonstrando que a utilização do ligando de ARNcd codificado pode melhorar as respostas imunitárias adaptativas a antigénios de interesse. Tal como apresentado na figura 8A e na figura 6, o ARNcd expresso pode melhorar as respostas imunitárias adaptativas a múltiplos antigénios heterólogos diferentes. Usaram-se animais não tratados como controlo negativo para ELISA. Cada grupo continha 6 animais.

Analisaram-se os vetores na orientação oposta (DS2for) para respostas de anticorpo após administração oral ou intramuscular de Ι,ΟχΙΟ7 pfu de vírus por animal, às 0 e 5 semanas. As respostas de anticorpo contra HA foram medidas às 4 e 7 semanas após administração inicial. Tal como apresentado na figura 8B, o vetor com orientação oposta também pode induzir respostas de anticorpo substanciais a antigénios heterólogos. Os vetores DSlb e DSlbfor induziram respostas semelhantes a HA ao ponto temporal de 4 semanas. Significativamente, o efeito de reforço da resposta de anticorpo foi demonstrado com o vetor DSlbfor e mostrou que se podem usar múltiplas doses para aumentar as respostas de anticorpo ao antigénio heterólogo.

Demonstrou-se também outro exemplo do potencial da abordagem de vetor adenovírico quimérico. Administrou-se o vetor ND1.1 214 a animais por administração oral (Ι,ΟχΙΟ7 pfu) ou intranasal (3xl06 pfu) e mediram-se as respostas de anticorpo ao antigénio heterólogo na semana 3. Tal como apresentado na figura 8C, mediram-se respostas de anticorpo substanciais contra HA após administração oral, bem superiores aos valores típicos para uma única administração oral de vetor rAd. LISTAGEM DE SEQUÊNCIAS INFORMAL SEQ ID NO:1 (DS1) taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataattttgtgttactcatagcgcgtaatactggtaccgcggccgcctcgagtctag

agatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCC

AGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTG GGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcataatatgtacattt atattggctcatgtccaacattaccgccatgttgacattgattattgactagttattaatag taatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttac ggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgt atgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacgg taaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgt caatgacggtaaatggcccgcctggcattat-gcccagtacatgaccttatgggactttccta cttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtac atcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgt caatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccg ccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgt ttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagaca ccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgaggccctgggcagg ttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcatgtggagacag agaagactcttgggtttctgataggcactgactctctctgcctattggtctattttcccacc

cttaggctgctggtctgagcctagGAGATCTCTCGAGGTCGACGGTATAGCTTCTAGAGATC

CCTCGACCTCGAGATCCATTGTGCTCTAAAGGAGATACCCGGCCAGACACCCTCACCTGCGG

TGCCCAGCTGCCCAGGCTGAGGCAAGAGAAGGCCAGAAACCATGCCCATGGGGTCTCTGCAA

CCGCTGGCCACCTTGTACCTGCTGGGGATGCTGGTCGCTTCCGTGCTAGCTGTGGAGAAGCT

GTGGGTGACTGTATACTATGGGGTGCCTGTGTGGAAGGAGGCCACCACCACCCTGTTCTGTG

CCTCTGATGCCAAGGCCTATGACACTGAGGTCCACAATGTCTGGGCCACCCATGCCTGTGTG

CCCACTGACCCCAACCCTCAGGAGGTGGTGCTGGAGAATGTGACTGAGCACTTCAACATGTG

GAAGAACAACATGGTGGAGCAGATGCAGGAGGACATCATCAGCCTGTGGGACCAGAGCCTGA

AGCCCTGTGTGAAGCTGACCCCCCTGTGTGTGACCCTGAACTGCAAGGATGTGAATGCCACC

AACACCACCAATGACTCTGAGGGCACTATGGAGAGGGGTGAGATCAAGAACTGCAGCTTCAA

CATCACCACCAGCATCAGGGATGAGGTGCAGAAGGAGTATGCCCTGTTCTACAAGCTGGATG

TGGTGCCCATTGACAACAACAACACCAGCTACAGGCTGATCAGCTGTGACACCTCTGTGATC

ACCCAGGCCTGCCCCAAGATCAGCTTTGAGCCCATCCCCATCCACTACTGTGCCCCTGCTGG

CTTTGCCATCCTGAAGTGCAATGACAAGACCTTCAATGGCAAAGGCCCTTGCAAGAATGTGA

GCACTGTGCAGTGCACTCATGGCATCAGGCCTGTGGTGAGCACCCAGCTGCTGCTGAATGGC

AGCCTGGCTGAGGAGGAGGTGGTGATCAGGTCTGACAACTTCACCAACAATGCCAAGACCAT

CATTGTGCAGC

TGAAGGAGTCTGTGGAGATCAACTGCACCAGGCCCAACAACAACACCAGGAAGAGCATTCAC

ATTGGCCCTGGCAGGGCCTTCTACACCACTGGGGAGATCATTGGGGACATCAGGCAGG

CCCACTGCAACATCAGCAGGGCCAAGTGGAATGACACCCTGAAGCAGATTGTGATCAAGCTG

AGGGAGCAGTTTGAGAACAAGACCATTGTGTTCAATCACAGCTCTGGTGGTGATCCTGAGAT

TGTGATGCACAGCTTCAACTGTGGTGGTGAGTTCTTCTACTGCAACAGCACCCAGCTGTTCA

ACAGCACCTGGAACAACAACACTGAGGGCAGCAACAACACTGAGGGCAACACCATCACCCTG CCTTGCAGGATCAAGCAGATCATCAACATGTGGCAGGAGGTGGGCAAGGCCATGTATGCTCC TCCCATCAGGGGCCAGATCAGGTGCAGCAGCAACATCACTGGCCTGCTGCTGACCAGGGATG GTGGCATCAATGAGAATGGCACTGAGATTTTCAGGCCTGGTGGTGGGGACATGAGGGACAAC TGGAGGTCTGAGCTGTACAAGTACAAGGTGGTGAAGATTGAGCCCCTTGGTGTGGCTCCCAC CAAGGCTAAGCGCAGGGTGGTGCAGAGGGAGAAGcgcgctgtgggctgaggatccCGAGGGT GAGTGCTCCTGCCTGGACGCATCCCGGCTATGCAGCCCCAGTCCAGGGCAGCAAGGCAGGCC CCGTCTGCCTCTTCACCCGGAGCCTCTGCCCGCCCCACTCATGCTCAGGGAGAGGGTCTTCT GGCTTTTTCCCAGGCTCTGGGCAGGCACAGGCTAGGTGCCCCTAACCCAGGCCCTGCACACA AAGGGGCAGGTGCTGGGCTCAGACCTGCCAAGAGCCATATCCGGGAGGACCCTGCCCCTGAC CTAAGCCCACCCCAAAGGCCAAACTCTCCACTCCCTCAGCTCGGACACCTTCTCTCCTCCCA GATTCCAGTAACTCCCAATCTTCTCTCTGCAGAGCCCAAATCTTGTGACAAAACTCACACAT GCCCACCGTGCCCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAAGGCGGGACAGGTGC CCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACACGTCCACCTCCATCT CTTCCTCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAG GACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGA AGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAA AGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCAC CAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCC CATCGAGAAAACCATCTCCAAAGCCAAAGGTGGGACCCGTGGGGTGCGAGGGCCACATGGAC AGAGGCCGGCTCGGCCCACCCTCTGCCCTGAGAGTGACCGCTGTACCAACCTCTGTCCTACA GGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAA CCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGG AGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGC TCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTT CTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGT CTCCGGGTAAATGAGTGCGACGGCCGCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAA GGCGGGACAGGTGCCCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACAC GTCCACCTCCATCTCTTCCTCAGGTCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGC CTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGT TGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATG GAGCAAGGGGCCCAAGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAG CATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAAC TCATCAATGTATCTTATCATGTCTGgatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag'cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcijctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID :2 (Sequência do vetor DS2) taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC

CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc a-tgfcggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc

tattttcccacccttaggctgctggtctgagcctagGAGATCTCTCGAGGTCGACGGTAirCG

ATGGGIACAGCTTCTAGAGATCCCTCGACCTCGAGATCCATTGTGCTCTAAAGGAGATACCC

GGCCAGACACCCTCACCTGCGGTGCCCAGCTGCCCAGGCTGAGGCAAGAGAAGGCCAGAAAC

CATGCCCATGGGGTCTCTGCAACCGCTGGCCACCTTGTACCTGCTGGGGATGCTGGTCGCTT

CCGTGCTAGCTGTGGAGAAGCTGTGGGTGACTGTATACTATGGGGTGCCTGTGTGGAAGGAG

GCCACCACCACCCTGTTCTGTGCCTCTGATGCCAAGGCCTATGACACTGAGGTCCACAATGT

CTGGGCCACCCATGCCTGTGTGCCCACTGACCCCAACCCTCAGGAGGTGGTGCTGGAGAATG

TGACTGAGCACTTCAACATGTGGAAGAACAACATGGTGGAGCAGATGCAGGAGGACATCATC

AGCCTGTGGGACCAGAGCCTGAAGCCCTGTGTGAAGCTGACCCCCCTGTGTGTGACCCTGAA

CTGCAAGGATGTGAATGCCACCAACACCACCAATGACTCTGAGGGCACTATGGAGAGGGGTG

AGATCAAGAACTGCAGCTTCAACATCACCACCAGCATCAGGGATGAGGTGCAGAAGGAGTAT

GCCCTGTTCTACAAGCTGGATGTGGTGCCCATTGACAACAACAACACCAGCTACAGGCTGAT

CAGCTGTGACACCTCTGTGATCACCCAGGCCTGCCCCAAGATCAGCTTTGAGCCCATCCCCA

TCCACTACTGTGCCCCTGCTGGCTTTGCCATCCTGAAGTGCAATGACAAGACCTTCAATGGC

AAAGGCCCTTGCAAGAATGTGAGCACTGTGCAGTGCACTCATGGCATCAGGCCTGTGGTGAG

CACCCAGCTGCTGCTGAATGGCAGCCTGGCTGAGGAGGAGGTGGTGATCAGGTCTGACAACT

TCACCAACAATGCCAAGACCATCATTGTGCAGC

TGAAGGAGTCTGTGGAGATCAACTGCACCAGGCCCAACAACAACACCAGGAAGAGCATTCAC

ATTGGCCCTGGCAGGGCCTTCTACACCACTGGGGAGATCATTGGGGACATCAGGCAGG

CCCACTGCAACATCAGCAGGGCCAAGTGGAATGACACCCTGAAGCAGATTGTGATCAAGCTG

AGGGAGCAGTTTGAGAACAAGACCATTGTGTTCAATCACAGCTCTGGTGGTGATCCTGAGAT

TGTGATGCACAGCTTCAACTGTGGTGGTGAGTTCTTCTACTGCAACAGCACCCAGCTGTTCA

ACAGCACCTGGAACAACAACACTGAGGGCAGCAACAACACTGAGGGCAACACCATCACCCTG

CCTTGCAGGATCAAGCAGATCATCAACATGTGGCAGGAGGTGGGCAAGGCCATGTATGCTCC

TCCCATCAGGGGCCAGATCAGGTGCAGCAGCAACATCACTGGCCTGCTGCTGACCAGGGATG

GTGGCATCAATGAGAATGGCACTGAGATTTTCAGGCCTGGTGGTGGGGACATGAGGGACAAC

TGGAGGTCTGAGCTGTACAAGTACAAGGTGGTGAAGATTGAGCCCCTTGGTGTGGCTCCCAC

CAAGGCTAAGCGCAGGGTGGTGCAGAGGGAGAAGcgcgctgtgggctgaggatccCGAGGGT

GAGTGCTCCTGCCTGGACGCATCCCGGCTATGCAGCCCCAGTCCAGGGCAGCAAGGCAGGCC

CCGTCTGCCTCTTCACCCGGAGCCTCTGCCCGCCCCACTCATGCTCAGGGAGAGGGTCTTCT

GGCTTTTTCCCAGGCTCTGGGCAGGCACAGGCTAGGTGCCCCTAACCCAGGCCCTGCACACA

AAGGGGCAGGTGCTGGGCTCAGACCTGCCAAGAGCCATATCCGGGAGGACCCTGCCCCTGAC

CTAAGCCCACCCCAAAGGCCAAACTCTCCACTCCCTCAGCTCGGACACCTTCTCTCCTCCCA

GATTCCAGTAACTCCCAATCTTCTCTCTGCAGAGCCCAAATCTTGTGACAAAACTCACACAT

GCCCACCGTGCCCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAAGGCGGGACAGGTGC

CCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACACGTCCACCTCCATCT cttcctcagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaag GACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGA AGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAA AGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCAC CAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCC CATCGAGAAAACCATCTCCAAAGCCAAAGGTGGGACCCGTGGGGTGCGAGGGCCACATGGAC AGAGGCCGGCTCGGCCCACCCTCTGCCCTGAGAGTGACCGCTGTACCAACCTCTGTCCTACA GGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAA CCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGG AGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGC TCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTT CTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGT CTCCGGGTAAATGAGTGCGACGGCCGCAGGTAAGCCAGCCCAGGCCTCGCCCTCCAGCTCAA GGCGGGACAGGTGCCCTAGAGTAGCCTGCATCCAGGGACAGGCCCCAGCCGGGTGCTGACAC GTCCACCTCCATCTCTTCCTCAGGTCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGC CTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGT TGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATG GAGCAAGGGGCCCAAGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAG CATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAAC TCATCAATGTATCTTATCATGTCTGgatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat

CGGCGGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGfCTCGCTGATCAGCCTCGACTG

TGCCTT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCTATGGCTTCTGAGGCGGAAAGAACCAACCACCGCGG TGGCGGCCGCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCT AGAGAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTCCTGCAGGAATT CGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGGGTTTTATAG GGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACGCTGATTGGC CCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCCCTCTCCCCT CCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGGAGAGTTTTG GCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATTCGATATCAagct agctTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgaaac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggàctggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct eaccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID No :3 GAAACGATATGGGCTGAATACTTAAGTATTCAGCCCATATCGTTTC.

Seq id no :4

CGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCGCCCTTAGATATC

GTCGACGCCCAGCACCCCAAGGCGGCCAACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATC

TCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACT

GTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTG

CCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTATAAAACCCAGCGGCGCGACGCGCCACC

ACCGCCGAGACATCGATGATATCTA

AAGGGCGAATTCCTGCAGCCCGGGGGATCCACTAGTCTAGATGCATGCTCGAGCGGCCGCCA

GTGTGATGGATATCTGCAGAATTCGCCCTTCAGCTGCGGATCCATTCGCCATTCAGGCTGCG

CAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGG

GATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAA

ACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGTACCGGGCCCCCCCT

CGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCCCGGGGGATCCACTAGTT

TCTAGAAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCG

CCACCGCGGTGGAGCT

Atcgaattcaagcttgtcgactc gaagatc

CT AG ACTAGTGGAT CCCCCGGGCTGCAGGAATT

CGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGGGTTTTATAG GGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACGCTGATTGGC CCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCCCTCTCCCCT CCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGGAGAGTTTTG GCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATT C GATATCAAGC TTAT CGATAC CGTCGACCTC GAGGGGGGGC CCG SEQ NO :5

CGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATC

GAATTCGCCCTTAGATATCGTCGACGCCCAGCACCCCAAGGCGGCCA

ACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAA

AAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCG

CGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGG

CGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACATCGATGATATCTA

AAGGGCGAATTCCTGCAGCCCGGGGGATCCACTAGTCTAGATGCATGCTCGAGCGGCCGCCA

GTGTGATGGATATCTGCAGAATTCGCCCTT

CAGCTGCGGATCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGC

GATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGT GCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACG·

TTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAAT

TGGGTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATC

GAATTCCTGCAGCCCGGGGGATCCACTAGTT

TCTAGAAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCG

CCACCGCGGTGGAGCTA

Tcgaattcaagcttgtcgactc gaagatcgtaca caggaagtgacaattttcgcgcggttttaggcggatgttg tagtaaatttgggcgtaaccgagtaagatttggccattttcgcgggaaaactgaataaga ggaagtgaaatctgaãtaattttgtgttactcatagcgcgtaatactggtac

CGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATC

GAATTCGCCCTTAGATATCGTCGACGCCCAGCACCCCAAGGCGGCCA

ACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAA

AAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCG

CGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGG

.CGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACATCGATGATATCTA

AAGGGCGAATTCCTGCAGCCCGGGGGATCCACTAGTCTAGAACTAGTGGATCCCCCGGGCTG

CAGGAATTC

GATATCAAGCTTATCGATACCGTCGACCTCGAGGGGGGGCCCGGTACCCA

ATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAA

CGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGC

ACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATC

GCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGATCCGCAGCTG

AAGGGCGAATTCTGCAGATATCCATCACACTGGCGGCCGCTCGAGCATGCA

TCTAGAAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCG

CCACCGCGGTGGAGCTA SEQ ID:6 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata. atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacg-tafctagtcatcgatattaeeatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gocctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagaotcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcatagGAGArciCTCGAGGTCGACGGTArcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCICT 51 AGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAG 101 AGCAGGTCGA TAC TAT CAT G GAGAAAAACG TAACAGTTAC TCATGCCCAA 151 GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT 201 GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CXGCTCGGGA 251 ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG 301 gagaaggcta accctaccaa xgacctctgc tatcctgggt catttaacga 351 TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA 401 TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC 451 GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT 501 GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT 551 ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG .TATCCATCAC 601 CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA 651 CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG 701 CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG 751 ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT 801 CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA 851 TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA 901 CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT 951 GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG 1001 CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT 1051 GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT 1101 GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT 1151 ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC 1201 AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG 1251 GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA 1301 TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA 1351 CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 14 01 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGG 1451 GGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAA 1501 AGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCG 1551 GCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACAT 1601 ATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT 1651 ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCA 1701 GTGCCGTATT TGTATATGAg c

GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCC

TT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT

CTATGGCTTCTGAGGCGGAAAGAACCAA

CCACCGCGGTGGCGGCCGCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATAT

TTTATTTCTAGAGAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTCCT

GCAGGAATTCGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGG

GTTTTATAGGGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACG

CTGATTGGCCCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCC

CTCTCCCCTCCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGG

AGAGTTTTGGCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATTCGA

TATCA AGCTAGCT Tgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg egcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctCc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgpcgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg. 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaa'cc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cc.cccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5,581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID :7 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgafcCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agt-tattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagat-cgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagaetcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcctagGAGArcrCTCGAGGTCGACGGTArcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCT

51 AGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAG 101 AGCAGGTCGA TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA 151 GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT 201 GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA 251 ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG 301 GAGAAGGCTA ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA 351 TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA 401 TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC 451 GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT 501 GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT 551 ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC 601 CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA 651 CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG 701 CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG 751 ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT 801 CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA 851 TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA 901 CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT 951 GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG 1001 CAACCGGTCT AAGAAATAGC ÇCGCAGAGAG AATCGCGGAG GAAGAAACGT 1051 GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT 1101 GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT 1151 ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC 1201 AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG 1251 GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA 1301 TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA 1351 CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 1401 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGG 1451 GGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAA 1501 AGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCG 1551 GCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACAT 1601 ATCAAATCCT GTCCATCTAT TCCACCGTGG CCTCTTCGCT GGCCCTCGCT 1651 ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCA 1701 GTGCCGTATT TGTATATGAg c

GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCrCGCTGATCAGCCTCGACTGTGCC

TT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT

CTATGGCTTCTGAGGCGGAAAGAACCAA

TGATATCGAATTCGCCCTTAGATATCGTCGACGCCCAGCACCCCAAGGCGGCCAACGCCAAA

ACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGG GAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCC&

ATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTAT

AAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACATCGATGATATCTAAAGGGCGAATT

CCTGCAGgaaacgatatgggctgaatacggatccgtattcagcccatatcgtttcTCTAGAA

ATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGGCGGCCGCCACCGC

GGTGG agctTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct oaatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc act.tccgt.tt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t

SEQ ID :8 GATGGTGCTTCAAGCTAGTACttaaGTACTAGCTTGAAGCACCATC SEQ ID: 9 GATGGTGCTTCAAGCTAGTACggatCCGTACTAGCTTGAAGCACCATC SEQ ID: 10 GAAACGATATGGGCTGAATACggatccGTATTCAGCCCATATCGTTTC SEQ ID: 11 CCTAATAATTAT CAAAATGTggatccACATTTTGATAATTATTAGG SEQ ID: 12 CCTAATAATTAT CAAAATGTaattACATTTTGATAATTATTAGG SEQ ID: 13 (DSlc) 1 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg 61 agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag 121 tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt 181 ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg 241 tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga 301 ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca 361 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 421 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 481 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 541 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac 601 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt 661 cctacttggc agtacatcta cgtattagte atcgctatta ccatggtgat gcggttttgg 721 cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 781 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 841 aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 901 agcagagctg gtttagtgaa ccgtcagatc cgctagagat ctGGTACCGAGCTCGGATCCGCCACCATGGAGGCAAACCTACTGGTCCTGTTATGTGCACTT GCAGCTGCAGATGCAGACACAATATGTATAGGCTACCATGCGAACAATTCAACCGACACTGG TGACACAGTAcfccgagaaga atgtgacagt gacacaetct gttaacctgc 181 tcgaagacag ccacaacgga aaactatgta gattaaaagg aatagcccca ctacaattgg 241 ggaaatgtaa catcgccgga tggctcttgg gaaacccaga atgcgaccca ctgcttccag 301 tgagatcatg gtcctacatt gtagaaacac caaactctga gaatggaata tgttatccag 361 gagatttcat cgactatgag gagctgaggg agcaattgag ctcagtgtca tcattcgaaa 421 gattcgaaat atttcccaaa gaaagctcat ggcccaacca caacacaacc aaaggagtaa 481 cggcagcatg ctcccatgcg gggaaaagca gtttttacag aaatttgcta tggctgacgg 541 agaaggaggg ctcataccca aagctgaaaa attcttatgt gaacaagaaa gggaaagaag 601 tccttgtact gtggggtatt catcacccgt ctaacagtaa ggatcaacag aatatctatc 661 agaatgaaaa tgcttatgtc tctgtagtga cttcaaatta taacaggaga tttaccccgg 721 aaatagcaga aagacccaaa gtaagagatc aagctgggag gatgaactat tactggacct 781 tgctaaaacc cggagacaca ataatatttg aggcaaatgg aaatctaata gcaccaaggt 841 atgctttcgc actgagtaga ggctttgggt ccggcatcat cacctcaaac gcatcaatgc 901 atgagtgtaa cacgaagtgt caaacacccc tgggagctat aaacagcagt ctccctttcc 961 agaatataca cccagtcaca ataggagagt gcccaaaata cgtcaggagt gccaaattga . 1021 ggatggttac aggactaagg aacattccgt ccattcaatc cagaggtcta tttggagcca 1081 ttgccggttt tattgaaggg ggatggactg gaatgataga tggatggtac ggttatcatc 1141 atcagaatga acagggatca ggctatgcag cggatcaaaa aagcacacaa aatgccatta 1201 acgggattac aaacaaggtg aactctgtta tcgagaaaat gaacattcaa ttcacagctg 1261 tgggtaaaga attcaacaaa ttagaaaaaa ggatggaaaa tttaaataaa aaagttgatg 1321 atggatttct ggacatttgg acatataatg cagaattgtt agttctactg gaaaatgaaa 1381 ggactctgga tttccatgac tcaaatgtga agaatctgta tgagaaagta aaaagccaat 1441 taaagaataa tgccaaagaa atcggaaatg gatgttttga gttctaccac aagtgtgaca 1501 atgaatgcat ggaaagtgta agaaatggga cttatgatta tcccaaatat tcagaagagt 1561 caaagttgaa cagggaaaag gtagatggag tgaaattgga atcaatgggg atctatcaga 1621 ttctggcgat ctactcaact gtcgccagtt cactggtgct tttggtctcc ctgggggcaa 1681 tcagtttctg gatgtgttct aatggatctt tgcagtgcag aatatgcatc tgagattaga

1741 atttcagaga tatgaggaaa aacacccttg tttctact CCCAAGCTTTAATGCGGTAGTTTATCACAGTTAAATTGCTAA CGCAGTCAGGCACCGTGTATGAAATCTAACAATGCGCTCATCGTCATCCTCGGCACCGTCAC CCTGGATGCTGTAGGCATAGGCTTGGTTATGCCGGTACTGCCGGGCCTCTTGCGGGATGG GCGGCCGCtcgagcct aagcttctag ataagatatc cgatccaccg gatctagata actgatcata 1021 atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 1081 ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 1141 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 1201 cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt 1261 taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgtatc tgttttgcag 1321 cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtgagc tcatatttga 1381 caacgcgcat gcccccatgg gccggggtgc gtcagaatgt gatgggctcc agcattgatg 1441 gtcgccccgt cctgcccgca aactctacta ccttgaccta cgagaccgtg tctggaacgc 1501 cgttggagac tgcagcctcc gccgccgctt cagccgctgc agccaccgcc cgcgggattg 1561 tgactgactt tgctttcctg agcccgcttg caagcagtgc agcttcccgt tcatccgccc 1621 gcgatgacaa gttgacggct cttttggcac aattggattc tttgacccgg gaacttaatg 1681 tcgtttctca gcagctgttg gatctgcgcc agcaggtttc tgccctgaag gcttcctccc 1741 ctcccaatgc ggtttaaaac ataaataaaa aaccagactc tgtttggatt tggatcaagc 1801 aagtgtcttg ctgtctttat ttaggggttt tgcgcgcgcg gtaggcccgg gaccagcggt 1861 ctcggtcgtt gagggtcctg tgtatttttt ccaggacgtg gtaaaggtga ctctggatgt 1921 tcagatacat gggcataagc ccgtctctgg ggtggaggta gcaccactgc agagcttcat 1981 gctgcggggt ggtgttgtag atgatccagt cgtagcagga gcgctgggcg tggtgcctaa 2041 aaatgtcttt cagtagcaag ctgattgcca ggggcaggcc cttggtgtaa gtgtttacaa 2101 agcggttaag ctgggatggg tgcatacgtg gggatatgag atgcatcttg gactgtattt 2161 ttaggttggc tatgttccca gccatatccc tccggggatt catgttgtgc agaaccacca 2221 gcacagtgta tccggtgcac ttgggaaatt tgtcatgtag cttagaagga aatgcgtgga 2281 agaacttgga gacgcccttg tgacctccaa gattttccat gcattcgtcc ataatgatgg 2341 caatgggccc acgggcggcg gcctgggcga agatatttct gggatcacta acgtcatagt 2401 tgtgttccag gatgagatcg tcataggcca tttttacaaa gcgcgggcgg agggtgccag 2461 actgcggtat aatggttcca tccggcccag gggcgtagtt accctcacag atttgcattt 2521 cccacgcttt gagttcagat ggggggatca tgtctacctg cgqqgcqat.q aagaaaacgg 2581 tttccggggt aggggagatc agctgggaag aaagcaggtt cctgagcagc tgcgacttac 2641 cgcagccggt gggcccgtaa atcacaccta ttaccgggtg caactggtag ttaagagagc 2701 tgcagctgcc gtcatccctg agcagggggg ccacttcgtt aagcatgtcc ctgactcgca 2761 tgttttccct gaccaaatcc gccagaaggc gctcgccgcc cagcgatagc agttcttgca 2821 aggaagcaaa gtttttcaac ggtttgagac cgtccgccgt aggcatgctt ttgagcgttt 2881 gaccaagcag ttccaggcgg tcccacagct cggtcacctg ctctacggca tctcgatcca 2941 gcatatctcc tcgtttcgcg ggttggggcg gctttcgctg tacggcagta gtcggtgctc 3001 gtccagacgg gccagggtca tgtctttcca cgggcgcagg gtcctcgtca gcgtagtctg 3061 ggtcacggtg aaggggtgcg ctccgggctg cgcgctggcc agggtgcgct tgaggctggt 3121 cctgctggtg ctgaagcgct gccggtcttc gccctgcgcg tcggccaggt agcatttgac 3181 catggtgtca tagtccagcc cctccgcggc gtggcccttg gcgcgcagct tgcccttgga 3241 ggaggcgccg cacgaggggc agtgcagact tttgagggcg tagagcttgg gcgcgagaaa 3301 taccgattcc ggggagtagg catccgcgcc gcaggccccg cagacggtct cgcattccac 3361 gagccaggtg agctctggcc gttcggggtc aaaaaccagg tttcccccat gctttttgat 3421 gcgtttctta cctctggttt ccatgagccg gtgtccacgc tcggtgacga aaaggctgtc 3481 cgtgtccccg tatacagact tgagagggag tttaaacgaa ttcaatagct tgttgcatgg 3541 gcggcgatat aaaatgcaag gtgctgctca aaaaatcagg caaagcctcg cgcaaaaaag 3601 aaagcacatc gtagtcatgc tcatgcagat aaaggcaggt aagctccgga accaccacag 3661 aaaaagacac catttttctc tcaaacatgt ctgcgggttt ctgcataaac acaaaataaa 3721 ataacaaaaa aacatttaaa cattagaagc ctgtcttaca acaggaaaaa caacccttat 3781 aagcataaga cggactacgg ccatgccggc gtgaccgtaa aaaaactggt caccgtgatt 3841 aaaaagcacc accgacagct cctcggtcat gtccggagtc ataatgtaag actcggtaaa 3901 cacatcaggt tgattcatcg gtcagtgcta aaaagcgacc gaaatagccc gggggaatac 3961 atacccgcag gcgtagagac aacattacag cccccatagg aggtataaca aaattaatag 4021 gagagaaaaa cacataaaca cctgaaaaac cctcctgcct aggcaaaata gcaccctccc 4081 g.ctccagaac aacatacagc gcttcacagc ggcagcctaa cagtcagcct taccagtaaa 4141 aaagaaaacc tattaaaaaa acaccactcg acacggcacc agctcaatca gtcacagtgt 4201 aaaaaagggc caagtgcaga gcgagtatat ataggactaa aaaatgacgt aacggttaaa 4261 gtccacaaaa aacacccaga aaaccgcacg cgaacctacg cccagaaacg aaagccaaaa 4321 aacccacaac ttcctcaaat cgtcacttcc gttttcccac gttacgtaac ttcccatttt 4381 aagaaaacta caattcccaa cacatacaag ttactccgcc ctaaaaccta cgtcacccgc 4441 cccgttccca cgccccgcgc cacgtcacaa actccacccc ctcattatca tattggcttc 4501 aatccaaaat aaggtatatt attgatgatg ttaattaaca tgcatggatc catatgcggt 4561 gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct 4621 cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 4681 aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 4741 aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 4801 tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 4861 caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 4921 cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 4981 ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 5041 gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 5101 agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 5161 gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 5221 acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 5281 gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 5341 gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 5401 cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 5461 caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 5521 gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 5581 cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 5641 cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 5701 caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 5761 gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 5821 gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcagcc atgagattat 5881 caaaaaggat cttcacctag atccttttca cgtagaaagc cagtccgcag aaacggtgct 5941 gaccccggat gaatgtcagc tactgggcta tctggacaag ggaaaacgca agcgcaaaga 6001 gaaagcaggt agcttgcagt gggcttacat ggcgatagct agactgggcg gttttatgga 6061 cagcaagcga accggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca 6121 aagtaaactg gatggctttc tcgccgccaa ggatctgatg gcgcagggga tcaagctctg 6181 atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 6241 ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 6301 gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 6361 ccgacctgtc cggtgccctg aatgaactgc aagacgaggc agcgcggcta tcgtggctgg 6421 ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 6481 ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 6541 agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 6601 gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 6661 gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 6721 tcgccaggct caaggcgagc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 6781 cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 6841 ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 6901 agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 6961 cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgaattttg ttaaaatttt 7021 tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaacatccc ttataaatca 7081 aaagaataga ccgcgatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 7141 aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 7201 cgtgaaccat cacccaaatc aagttttttg cggtcgaggt gccgtaaagc tctaaatcgg 7261 aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 7321 aaggaaggga agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg 7381 ctgcgcgtaa ccaccacacc cgcgcgctta atgcgccgct acagggcgcg tccattcgcc 7441 attcaggatc gaattaattc ttaat SEQ ID :14 DS2beta-luc taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC

CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc

tattttcccacccttaggctgctggtctgagcctagGAGATCrCTCGAGGTCGACGGTATCG

ATGGGTACCGGCGGCCGCCCTATTCTATAGTGTCACCTAAATGCTA(3AGCrCGCTGATCAGC

CTCGACTGTGCCTT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT

CTATGGCTTCTGAGGCGGAAAGAACCTATGGCTTCTGAGGCGGAAAGAACCAACCACCGCGG

TGGCGGCCGCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCT

AGAGAAACGATATGGGCTGAATACGGATCCGTATTCAGCCCATATCGTTTCCTGCAGGAATT

CGCCCTTTAGATATCATCGATGTCTCGGCGGTGGTGGCGCGTCGCGCCGCTGGGTTTTATAG GGCGCCGCCGCGGCCGCTCGAGCCATAAAAGGCAACTTTCGGAACGGCGCACGCTGATTGGC CCCGCGCCGCTCACTCACCGGCTTCGCCGCACAGTGCAGCATTTTTTTACCCCCTCTCCCCT CCTTTTGCGAAAAAAAAAAAGAGCGAGAGCGAGATTGAGGAAGAGGAGGAGGGAGAGTTTTG GCGTTGGCCGCCTTGGGGTGCTGGGCGTCGACGATATCTAAGGGCGAATTCGATATCAagct agctTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggt’ttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcgg£ cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agáagcctgt cttacaacag gaaaaacaac ccttataage 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct . 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID: 15 taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC

CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacg-tattagfcaatcgctattaacatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggaotttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcGtattggtc tattttcccacccttaggctgctggtctgagcctagGAGATCTCTCGAGGTCGACGGTATCG!

ATG GGTACCG GCGGCCGCC CT AT T C T AT AGT GTCAC C TAAAT GC T AGAGCTCG C Ϊ GAT CAGC

CTCGACTGTGCCTT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT

CTATGGCTTCTGAGGCGGAAAGAACCA

AAGCTTAGGCTCGAGCGGCC

GCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCTAGAGAAAC gatatgggctgaatacggatccgtattcagcccatatcgtttcccagatctctagcggatCt

GACGGTTCACTAAACCAGCTCTGCT

TATATAGACCTCCCACCGTACACGCCTACCGCCCATTTGCGTCAATGGGGCGGAGTTGTT

ACGACATTTTGGAAAGTCCCGTTGATTTTGGTGCCAAAACAAACTCCCATTGACGTCAAT

GGGGTGGAGACTTGGAAATCCCCGTGAGTCAAACCGCTATCCACGCCCATTGATGTACTG

CCAAAACCGCATCACCATGGTAATAGCGATGACTAATACGTAGATGTACTGCCAAGTAGG

AAAGTCCCATAAGGTCATGTACTGGGCATAATGCCAGGCGGGCCATTTACCGTCATTGAC

GTCAATAGGGGGCGTACTTGGCATATGATACACTTGATGTACTGCCAAGTGGGCAGTTTA

CCGTAAATACTCCACCCATTGACGTCAATGGAAAGTCCCTATTGGCGTTACTATGGGAAC

ATACGTCATTATTGACGTCAATGGGCGGGGGTCGTTGGGCGGTCAGCCAGGCGGGCCATT

TACCGTAAGTTATGTAACGCGGAACTCCATATATGGGCTATGAACTAATGACCCCGTAAT

TGATTACTATTACAGTATTACGCGCTATGAGTAACACAAAATTATTCAGATTTCACTTCC

TCTTATTCAGTTTTCCCGCGAAAATGGCCAAATCTTACTCGGTTACGCCCAAATTTACTA

CAACATCCGCCTAAAACCGCGCGAAAATTGTCACTTCCTGTGTACACCGGCGCACACCAA

AAACGTCACTTTTGCCACATCCGTCGCTTACATGTGTTCCGCCACACTTGCAACATCACA

CTTCCGCCACACTACTACGTCACCCGCCCCGTTCCCACGCCCCGCGCCACGTCACAAACT

CCACCCCCTCATTATCATATTGGCTTCAATCCAAAATAAGGTATATTATTGATGATGTTAAG

CTT gtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc , atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagegett cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t SEQ ID: 16 vetor de vaivém de HA, CMV-luc taacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAga-kCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC

CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaGGatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccàaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgaoct ccatagaagacaccgggaccgatccagcotgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc

tattttcccacccttaggctgctggtctgagccta.gGAGArCTCTCGAGGTCGACGGT.ATcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCT 51 AGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAG 101 AGCAGGTCGA TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA 151 GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT 201 GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA 251 ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG 301 GAGAAGGCTA ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA 351 TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA 401 TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC 451 GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT 501 GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT 551 ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC 601 CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA 651 CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG 7 01 CAACACGGAG CAAAGTAAAT GGGCAATCTG G CAG GAT G GA GTTTTTCTGG 751 ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT 801 CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA 851 TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA 901 CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT 951 GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG 1001 CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT 1051 GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT 1101 GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT 1151 ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC 1201 AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG 1251 GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA 1301 TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA 1351 CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 1401 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGG 1451 GGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAA 1501 AGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCG 1551 GCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACAT 1601 ATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT 1651 ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCA 1701 GTGCCGTATT TGTATATGAg c

GCCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCC

TT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCAAAGCTtaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg 61 agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag 121 tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt 181 ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg 241 tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga 301 ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca 361 attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 421 aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 481 gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 541 taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac 601 gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt 661 cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 721 cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 781 attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 841 aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata

901 agcagagctg gtttagtgaa ccgtcagatc cgctagAGA37C2GGgaaacgatatgggctgaatacggatccgtat:tcagcccatatcgtttc T CT AGA AAT AAA ATA TCT TTA TTT TCA TTA CAT CTG TGT GTT GGT TTT TTG TGT GGC GG CCGCfccgagcct AAGCTTctag ataagatatc cgatccaccg gatctagata actgatcata 1021 atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 1081 ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 1141 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 1201 cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt 1261 taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgtatc tgttttgcag 1321 cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtg AGCTTgtcgactcg aagatctggg cgtggttaag 421 ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc 481 cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac 541 gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg 601 ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt 661 ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac 721 tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga 781 tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt 841 ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc 901 caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt 961 gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg 1021 gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag 1081 atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg 1141 cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat 1201 gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg 1261 gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag 1321 gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac 1381 agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa 1441 cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat 1501 gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg 1561 ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg 1621 cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca 1681 cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc 1741 cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca 1801 gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagctgca 1861 gctgccgtca tccctgagca ggggggccac ttcgttaagc atgtccctga ctcgcatgtt 1921 ttccctgacc aaatccgcca gaaggcgctc gccgcccagc gatagcagtt cttgcaagga 1981 agcaaagttt ttcaacggtt tgagaccgtc cgccgtaggc atgcttttga gcgtttgacc 2041 aagcagttcc aggcggtccc acagctcggt cacctgctct acggcatctc gatccagcat 2101 atctcctcgt ttcgcgggtt ggggcggctt tcgctgtacg gcagtagtcg gtgctcgtcc 2161 agacgggcca gggtcatgtc tttccacggg cgcagggtcc tcgtcagcgt agtctgggtc 2221 acggtgaagg ggtgcgctcc gggctgcgcg ctggccaggg tgcgcttgag gctggtcctg 2281 ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg 2341 gtgtcatagt ccagcccctc cgcggcgtgg cccttggcgc gcagcttgcc cttggaggag 2401 gcgccgcacg aggggcagtg cagacttttg agggcgtaga gcttgggcgc gagaaatacc 2461 gattccgggg agtaggcatc cgcgccgcag gccccgcaga cggtctcgca ttccacgagc 2521 caggtgagct ctggccgttc ggggtcaaaa accaggtttc ccccatgctt tttgatgcgt 2581 ttcttacctc tggtttccat gagccggtgt ccacgctcgg tgacgaaaag gctgtccgtg 2641 tccccgtata cagacttgag agggagttta aacgaattca atagcttgtt gcatgggcgg 2701 cgatataaaa tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag 2761 cacatcgtag tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa 2821 agacaccatt tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa 2881 caaaaaaaca tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc 2941 ataagacgga ctacggccat gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa 3001 agcaccaccg acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca 3061 tcaggttgat tcatcggtca gtgctaaaaa gcgaccgaaa tagcccgggg gaatacatac 3121 ccgcaggcgt agagacaaca ttacagcccc cataggaggt ataacaaaat taataggaga 3181 gaaaaacaca taaacacctg aaaaaccctc ctgcctaggc aaaatagcac cctcccgctc 3241 cagaacaaca tacagcgctt cacagcggca gcctaacagt cagccttacc agtaaaaaag 3301 aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 3361 aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 3421 acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 3481 cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtaacttcc cattttaaga 3541 aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 3601 ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 3661 caaaataagg tatattattg atgatgttaa ttaacatgca tggatccata tgcggtgtga 3721 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 3781 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3841 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3901 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3961 cccccctgac'gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4021 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4081 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4141 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4201 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4261 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4321 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4381 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4441 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4501 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4561 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4621 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4681 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4741 gatctgtcta tttcgttcat ccatagttgc ctgaatcccc gtcgtgtaga taactacgat 4801 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4861 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4921 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4981 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcagccatga gattatcaaa 5041 aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc 5101 ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa 5161 gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc 5221 aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 5281 aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 5341 agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 5401 ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 5461 tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 5521 cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 5581 gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 5641 gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 5701 agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 5761 attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 5821 tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 5881 caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 5941 cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 6001 gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 6061 tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 6121 gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt 6181 aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag 6241 aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 6301 acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 6361 aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc 6421 ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 6481 aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc 6541 gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc 6601 aggatcgaat taattcttaa t 1 taaggatccn nncctgtccfc cgaccgatgc ccttgagagc cttcaaccca gtcagctcct 61 tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc 121 aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac cgctttcgct 181 ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac gccctcgctc 241 aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc attatcgccg 301 gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga ggctggatgg 361 ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg ttgcaggcca 421 tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg ctcgcggctc 481 ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat gccgcctcgg 541 cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt gtctgcctcc 601 ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa gccggcggca 661 cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc ggagaactgt 721 gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct ccagcagccg 781 cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga tcgtgctcct 841 gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga atgaatcacc 901 gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac 961 atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt cagcgccctg 1021 caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg gaacacctac 1081 atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt cccgccgcat 1141 ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt catcatcagt 1201 aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca tgaacagaaa 1261 ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct taacatggcc 1321 cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct ggacgcggat 1381 gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta ccgcagctgc 1441 ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 1501 acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 1561 gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact 1621 ggcttaacta tgcggçatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa 1681 taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca 1741 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 1801 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 1861 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 1921 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 1981 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 2041 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 2101 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 2161 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 2221 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 2281 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 2341 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 2401 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 2461 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 2521 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 2581 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 2641 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 2701 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 2761 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 2821 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 2881 caactttatc cgcctccatc cagtctatta attgttgpcg ggaagctaga gtaagtagtt 2941 cgccagttaa tagtttgcgc aacgttgttg ccattgctga agccatga gattatcaaa aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggatcgaat taattcttaa ttaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agfctattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgc-fcattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcctagGAGArcrCTCGAGGTCGACGGTATcg atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCTAGTGAAGAGC GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAGAGCAGGTCGA TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA GACATCTTGG AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT GAAGCCCCTG ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA ACCCTATGTG TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG GAGAAGGCTA ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA TTACGAGGAA CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA TACAGATTAT ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC GTTAGCTCAG CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT GGTCTGGTTA ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGTCTT ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT GGTCGATGGT TGGTACGGAT ACCACCATAG CAACGAACAG GGGTCCGGCT

ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA 1401 CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGGGGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAAAGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCGGCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACATATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT ATCATGATGG CTGGTCTGTC CCTATGGATG TGTTCCAATG GAAGCCTTCAGTGCCGTATT TGTATATGAg c

GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCrCGCTGATCAGCCTCGACTGTGCC

TT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGC

GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCAAAGCÍTtaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata

agcagagctg gtttagtgaa ccgtcagatc cgctagAGArCiTGGgaaacgatatgggctgaatacggatccgtattcagcccatatcgtttc TCT AGA AAT AAA ATA TCT TTA TTT TCA TTA CAT CTG TGT GTT GGT TTT TTG TGT GGC GG CCGCfccgragcct AAGCTTctag ataagatatc cgatccaccg gatctagata actgatcata atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgfcatc tgttttgcag cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtg AGCTTgtcgactcg aagatctggg cgtggttaag ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat. ccgcccgcga tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagct g cagctgccgt catccctgag caggggggcc acttcgttaa gcatgtccct gactcgcatg ttttccctga ccaaatccgc cagaaggcgc tcgccgccca gcgatagcag ttcttgcaag gaagcaaagt ttttcaacgg tttgagaccg tccgccgtag gcatgctttt gagcgtttga ccaagcagtt ccaggcggtc ccacagctcg gtcacctgct ctacggcatc tcgatccagc atatctcctc gtttcgcggg ttggggcggc tttcgctgta cggcagtagt cggtgctcgt ccagacgggc cagggtcatg tctttccacg ggcgcagggt cctcgtcagc gtagtctggg tcacggtgaa ggggtgcgct ccgggctgcg cgctggccag ggtgcgcttg aggctggtcc tgctggtgct gaagcgctgc cggtcttcgc cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt ggcccttggc gcgcagcttg cccttggagg aggcgccgca cgaggggcag tgcagacttt tgagggcgta gagcttgggc gcgagaaata ccgattccgg ggagtaggca tccgcgccgc aggccccgca gacggtctcg cattccacga gccaggtgag ctctggccgt tcggggtcaa aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tctggtttcc atgagccggt gtccacgctc ggtgacgaaa aggctgtccg tgtccccgta tacagacttg agaggcctgt cctcgagcgg tgttccgcgg tcctcctcgt atagaaactc ggaccactct gagacaaagg ctcgcgtcca ggccagcacg aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt gtaggtgtag gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc tcactctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta ctccctctga aaagcgggca tgacttctgc gctaagattg tcagtttcca 6301 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcat 6361 ccatctggtc agaaaagaca atctttttgt tgtcaagctt ggtggcaaac gacccgtaga 6421 gggcgttgga cagcaacttg gcgatggagc gcagggtttg gtttttgtcg cgatcggcgc 6481 gctccttggc cgcgatgttt agctgcacgt attcgcgcgc aacgcaccgc cattcgggaa 6541 agacggtggt gcgctcgtcg ggcaccaggt gcacgcgcca accgcggttg tgcagggtga 6601 caaggtcaac gctggtggct acctctccgc gtaggcgctc gttggtccag cagaggcggc 6661 cgcccttgcg cgagcagaat ggcggtaggg ggtctagctg cgtctcgtcc ggggggtctg 6721 cgtccacggt aaagaccccg ggcagcaggc gcgcgtcgaa gtagtctatc ttgcatcctt 6781 gcaagtctag cgcctgctgc catgcgcggg cggcaagcgc gcgctcgtat gggttgagtg 6841 ggggacccca tggcatgggg tgggtgagcg cggaggcgta catgccgcaa atgtcgtaaa 6901 cgtagagggg ctctctgagt attccaagat atgtagggta gcatcttcca ccgcggatgc 6961 tggcgcgcac gtaatcgtat agttcgtgcg agggagcgag gaggtcggga ccgaggttgc 7021 tacgggcggg ctgctctgct cggaagacta tctgcctgaa gatggcatgt gagttggatg 7081 atatggttgg acgctggaag acgttgaagc tggcgtctgt gagacctacc gcgtcacgca 7141 cgaaggaggc gtaggagtcg cgcagcttgt tgaccagctc ggcggtgacc tgcacgtcta 7201 gggcgcagta gtccagggtt tccttgatga tgtcatactt atcctgtccc ttttttttcc 7261 acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7321 cgtcggcctc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7381 agcatccctt ttctacgggt agcgcgtatg cctgcgcggc cttccggagc gaggtgtggg 7441 tgagcgcaaa ggtgtccctg accatgactt tgaggtactg gtatttgaag tcagtgtcgt 7501 cgcatccgcc ctgctcccag agcaaaaagt ccgtgcgctt tttggaacgc ggatttggca 7561 gggcgaaggt gacatcgttg aagagtatct ttcccgcgcg aggcataaag ttgcgtgtga 7621 tgcggaaggg tcccggcacc tcggaacggt tgttaattac ctgggcggcg agcacgatct 7681 cgtcaaagcc gttgatgttg tggcccacaa tgtaaagttc caagaagcgc gggatgccct 7741 tgatggaagg caatttttta agttcctcgt aggtgagctc ttcaggggag ctgagcccgt 7801 gctctgaaag ggcccagtct gcaagatgag ggttggaagc gacgaatgag ctccacaggt 7861 cacgggccat tagcatttgc aggtggtcgc gaaaggtcct aaactggcga cctatggcca 7921 ttttttctgg ggtgatgcag tagaaggtaa gcgggtcttg ttcccagcgg tcccatccaa 7981 ggttcgcggc taggtctcgc gcggcagtca ctagaggctc atctccgccg aacttcatga 8041 ccagcatgaa gggcacgagc tgcttcccaa aggcccccat ccaagtatag gtctctacat 8101 cgtaggtgac aaagagacgc tcggtgcgag gatgcgagcc gatcgggaag aactggatct 8161 cccgccacca attggaggag tggctattga tgtggtgaaa gtagaagtcc ctgcgacggg 8221 ccgaacactc gtgctggctt ttgtaaaaac gtgcgcagta ctggcagcgg tgcacgggct 8281 gtacatcctg cacgaggttg acctgacgac cgcgcacaag gaagcagagt gggaatttga 8341 gcccctcgcc tggcgggttt ggctggtggt cttctacttc ggctgcttgt ccttgaccgt 8401 ctggctgctc gaggggagtt acggtggatc ggaccaccac gccgcgcgag cccaaagtcc 8461 agatgtccgc gcgcggcggt cggagcttga tgacaacatc gcgcagatgg gagctgtcca 8521 tggtctggag ctcccgcggc gtcaggtcag gcgggagctc ctgcaggttt acctcgcata 8581 gacgggtcag ggcgcgggct agatccaggt gatacctaat ttccaggggc tggttggtgg 8641 cggcgtcgat ggcttgcaag aggccgcatc cccgcggcgc gactacggta cçgcgcggcg 8701 ggcggtgggc cgcgggggtg tccttggatg atgcatctaa aagcggtgac gcgggcgagc 8761 ccccggaggt agggggggct ccggacccgc cgggagaggg ggcaggggca cgtcggcgcc 8821 gcgcgcgggc aggagctggt gctgcgcgcg taggttgctg gcgaacgcga cgacgcggcg 8881 gttgatctcc tgaatctggc gcctctgcgt gaagacgacg ggcccggtga gcttgagcct 8941 gaaagagagt tcgacagaat caatttcggt gtcgttgacg gcggcctggc gcaaaatctc 9001 ctgcacgtct cctgagttgt cttgataggc gatctcggcc atgaactgct cgatctcttc 9061 ctcctggaga tctccgcgtc cggctcgctc cacggtggcg gcgaggtcgt tggaaatgcg 9121 ggccatgagc tgcgagaagg cgttgaggcc tccctcgttc cagacgcggc tgtagaccac 9181 gcccccttcg gcatcgcggg cgcgcatgac cacctgcgcg agattgagct ccacgtgccg 9241 ggcgaagacg gcgtagtttc gcaggcgctg aaagaggtag ttgagggtgg tggcggtgtg 9301 ttctgccacg aagaagtaca taacccagcg tcgcaacgtg gattcgttga tatcccccaa 9361 ggcctcaagg cgctccatgg cctcgtagaa gtccacggcg aagttgaaaa actgggagtt 9421 gcgcgccgac acggttaact cctcctccag aagacggatg agctcggcga cagtgtcgcg 9481 cacctcgcgc tcaaaggcta caggggcctc ttcttcttct tcaatctcct cttccataag 9541 ggcctcccct tcttcttctt ctggcggcgg tgggggaggg gggacacggc ggcgacgacg 9601 gcgcaccggg aggcggtcga caaagcgctc gatcatctcc ccgcggcgac ggcgcatggt 9661 ctcggtgacg gcgcggccgt tctcgcgggg gcgcagttgg aagacgccgc ccgtcatgtc 9721 ccggttatgg gttggcgggg ggctgccatg cggcagggat acggcgctaa cgatgcatct 9781 caacaattgt tgtgtaggta ctccgccgcc gagggacctg agcgagtccg catcgaccgg 9841 atcggaaaac ctctcgagaa aggcgtctaa ccagtcacag tcgcaaggta ggctgagcac 9901 cgtggcgggc ggcagcgggc ggcggtcggg gttgtttctg gcggaggtgc tgctgatgat 9961 gtaattaaag taggcggtct tgagacggcg gatggtcgac agaagcacca tgtccttggg 10021 tccggcctgc tgaatgcgca ggcggtcggc catgccccag gcttcgtttt gacatcggcg 10081 caggtctttg tagtagtctt gcatgagcct ttctaccggc acttcttctt ctccttcctc 10141 ttgtcctgca tctcttgcat ctatcgctgc ggcggcggcg gagtttggcc gtaggtggcg 10201 ccctcttcct cccatgcgtg tgaccccgaa gcccctcatc ggctgaagca gggotaggtc 10261 ggcgacaacg cgctcggcta atatggcctg ctgcacctgc gtgagggtag actggaagtc 10321 atccatgtcc acaaagcggt ggtatgcgcc cgtgttgatg gtgtaagtgc agttggccat 10381 aacggaccag ttaacggtct ggtgacccgg ctgcgagagc tcggtgtacc tgagacgcga 10441 gtaagccctc gagtcaaata cgtagtcgtt gcaagtccgc accaggtact ggtatcccac 10501 caaaaagtgc ggcggcggct ggcggtagag gggccagcgt agggtggccg gggctccggg 10561 ggcgagatct tccaacataa ggcgatgata tccgtagatg tacctggaca tccaggtgat 10621 gccggcggcg gtggtggagg cgcgcggaaa gtcgcggacg cggttccaga tgttgcgcag 10681 cggcaaaaag tgctccatgg tcgggacgct ctggccggtc aggcgcgcgc aatcgttgac 10741 gctctaccgt gcaaaaggag agcctgtaag cgggcactct tccgtggtct ggtggataaa 10801 ttcgcaaggg tatcatggcg gacgaccggg gttcgagccc cgtatccggc cgtccgccgt 10861 gatccatgcg gttaccgccc gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga 10921 gtgctccttt tggcttcctt ccaggcgcgg cggctgctgc gctagctttt ttggccactg 10981 gccgcgcgca gcgtaagcgg ttaggctgga aagcgaaagc attaagtggc tcgctccctg 11041 tagccggagg gttattttcc aagggttgag tcgcgggacc cccggttcga gtctcggacc 11101 ggccggactg cggcgaacgg gggtttgcct ccccgtcatg caagaccccg cttgcaaatt 11161 cctccggaaa cagggacgag cccctttttt gcttttccca gatgcatccg gtgctgcggc 11221 agatgcgccc ccctcctcag cagcggcaag agcaagagca gcggcagaca tgcagggcac 11281 cctcccctcc tcctaccgcg tcaggagggg cgacatccgc ggttgacgcg gcagcagatg 11341 gtgattacga acccccgcgg cgccgggccc ggcactacct ggacttggag gagggcgagg 11401 gcctggcgcg gctaggagcg ccctctcctg agcggtaccc aagggtgcag ctgaagcgtg 11461 atacgcgtga ggcgtacgtg ccgcggcaga acctgtttcg cgaccgcgag ggagaggagc 11521 ccgaggagat gcgggatcga aagttccacg cagggcgcga gctgcggcat ggcctgaatc 11581 gcgagcggtt gctgcgcgag gaggactttg agcccgacgc gcgaaccggg attagtcccg 11641 cgcgcgcaca cgtggcggcc gccgacctgg taaccgcata cgagcagacg gtgaaccagg 11701 agattaactt tcaaaaaagc tttaacaacc' acgtgcgtac gcttgtggcg cgcgaggagg 11761 tggctatagg actgatgcat ctgtgggact ttgtaagcgc gctggagcaa aacccaaata 11821 gcaagccgct catggcgcag ctgttcctta tagtgcagca cagcagggac aacgaggcat 11881 tcagggatgc gctgctaaac atagtagagc ccgagggccg ctggctgctc gatttgataa 11941 acatcctgca gagcatagtg gtgcaggagc gcagcttgag cctggctgac aaggtggccg 12001 ccatcaacta ttccatgctt agcctgggca agttttacgc ccgcaagata taccataccc 12061 cttacgttcc catagacaag gaggtaaaga tcgaggggtt ctacatgcgc atggcgctga 12121 aggtgcttac cttgagcgac gacctgggcg tttatcgcaa cgagcgcatc cacaaggccg 12181 tgagcgtgag ccggcggcgc gagctcagcg accgcgagct gatgcacagc ctgcaaaggg 12241 ccctggctgg cacgggcagc ggcgatagag aggccgagtc ctactttgac gcgggcgctg 12301 acctgcgctg ggccccaagc cgacgcgccc tggaggcagc tggggccgga cctgggctgg 12361 cggtggcacc cgcgcgcgct ggcaacgtcg gcggcgtgga ggaatatgac gaggacgatg 12421 agtacgagcc agaggacggc gagtactaag cggtgatgtt tctgatcaga tgatgcaaga 12481 cgcaacggac ccggcggtgc gggcggcgct gcagagccag ccgtccggcc ttaactccac 12541 ggacgactgg cgccaggtca tggaccgcat catgtcgctg actgcgcgca atcctgacgc 12601 gttccggcag cagccgcagg ccaaccggct ctccgcaatt ctggaagcgg tggtcccggc 12661 gcgcgcaaac cccacgcacg agaaggtgct ggcgatcgta aacgcgctgg ccgaaaacag 12721 ggccatccgg cccgacgagg ccggcctggt ctacgacgcg ctgcttcagc gcgtggctcg 12781 ttacaacagc ggcaacg.tgc agaccaacct ggaccggctg gtgggggatg tgcgcgaggc 12841 cgtggcgcag cgtgagcgcg cgcagcagca gggcaacctg ggctccatgg ttgcactaaa 12901 cgccttcctg agtacacagc ccgccaacgt gccgcgggga caggaggact acaccaactt 12961 tgtgagcgca ctgcggctaa tggtgactga gacaccgcaa agtgaggtgt accagtctgg 13021 gccagactat tttttccaga ccagtagaca aggcctgcag accgtaaacc tgagccaggc 13081 tttcaaaaac ttgcaggggc tgtggggggt gcgggctccc acaggcgacc gcgcgaccgt 13141 gtctagcttg ctgacgccca actcgcgcct gttgctgctg ctaatagcgc ccttcacgga 13201 cagtggcagc gtgtcccggg acacatacct aggtcacttg ctgacactgt accgcgaggc 13261 cataggtcag gcgcatgtgg acgagcatac tttccaggag attacaagtg tcagccgcgc 13321 gctggggcag gaggacacgg gcagcctgga ggcaacccta aactacctgc tgaccaaccg 13381 gcggcagaag atcccctcgt tgcacagttt aaacagcgag gaggagcgca ttttgcgcta 13441 cgtgcagcag agcgtgagcc ttaacctgat gcgcgacggg gtaacgccca gcgtggcgct 13501 ggacatgacc gcgcgcaaca tggaaccggg catgtatgcc tcaaaccggc cgtttatcaa 13561 ccgcctaatg gactacttgc atcgcgcggc cgccgtgaac cccgagtatt tcaccaatgc 13621 catcttgaac ccgcactggc taccgccccc tggtttctac accgggggat tcgaggtgcc 13681 cgagggtaac gatggattcc tctgggacga catagacgac agcgtgtttt ccccgcaacc 13741 gcagaccctg ctagagttgc aacagcgcga gcaggcagag gcggcgctgc gaaaggaaag 13801 cttccgcagg ccaagcagct tgtccgatct aggcgctgcg gccccgcggt cagatgctag 13861 tagcccattt ccaagcttga tagggtctct taccagcact cgcaccaccc gcccgcgcct 13921 gctgggcgag gaggagtacc taaacaactc gctgctgcag ccgcagcgcg aaaaaaacct 13981 gcctccggca tttcccaaca acgggataga gagcctagtg gacaagatga gtagatggaa 14041 gacgtacgcg caggagcaca gggacgtgcc aggcccgcgc ccgcccaccc gtcgtcaaag 14101 gcacgaccgt cagcggggtc tggtgtggga ggacgatgac tcggcagacg acagcagcgt 14161 cctggatttg ggagggagtg gcaacccgtt tgcgcacctt cgccccaggc tggggagaat 14221 gttttaaaaa aaaaaaagca tgatgcaaaa taaaaaactc accaaggcca tggcaccgag 14281 cgttggtttt cttgtattcc ccttagtatg cggcgcgcgg cgatgtatga ggaaggtcct 14341 cctccctcct acgagagtgt ggtgagcgcg gcgccagtgg cggcggcgct gggttctccc 14401 ttcgatgctc ccctggaccc gccgtttgtg cctccgcggt acctgcggcc taccgggggg 14461 agaaacagca tccgttactc tgagttggca cccctattcg acaccacccg tgtgtacctg 14521 gtggacaaca agtcaacgga tgtggcatcc ctgaactacc agaacgacca cagcaacttt 14581 ctgaccacgg tcattcaaaa caatgactac agcccggggg aggcaagcac acagaccatc 14641 aatcttgacg accggtcgca ctggggcggc gacctgaaaa ccatcctgca taccaacatg 14701 ccaaatgtga acgagttcat gtttaccaat aagtttaagg cgcgggtgat ggtgtcgcgc 14761 ttgcctacta aggacaatca ggtggagctg aaatacgagt gggtggagtt cacgctgccc 14821 gagggcaact actccgagac catgaccata gaccttatga acaacgcgat cgtggagcac 14881 tacttgaaag tgggcagaca gaacggggtt ctggaaagcg acatcggggt aaagtttgac 14941 acccgcaact tcagactggg gtttgacccc gtcactggtc ttgtcatgcc tggggtatat 15001 acaaacgaag ccttccatcc agacatcatt ttgctgccag gatgcggggt ggacttcacc 15061 cacagccgcc tgagcaactt gttgggcatc cgcaagcggc aacccttcca ggagggcttt 15121 aggatcacct acgatgatct ggagggtggt aacattcccg cactgttgga tgtggacgcc 15181 taccaggcga gcttgaaaga tgacaccgaa cagggcgggg gtggcgcagg cggcagcaac 15241 agcagtggca gcggcgcgga agagaactcc aacgcggcag ccgcggcaat gcagccggtg 15301 gaggacatga acgatcatgc cattcgcggc gacacctttg ccacacgggc tgaggagaag 15361 cgcgctgagg ccgaagcagc ggccgaagct gccgcccccg ctgcgcaacc cgaggtcgag 15421 aagcctcaga agaaaccggt gatcaaaccc ctgacagagg acagcaagaa acgcagttac 15481 aacctaataa gcaatgacag caccttcacc cagtaccgca gctggtacct tgcatacaac 15541 tacggcgacc ctcagaccgg aatccgctca tggaccctgc tttgcactcc tgacgtaacc 15601 tgcggctcgg agcaggtcta ctggtcgttg ccagacatga tgcaagaccc cgtgaccttc 15661 cgctccacgc gccagatcag caactttccg gtggtgggcg ccgagctgtt gcccgtgcac 15721 tccaagagct tctacaacga ccaggccgtc tactcccaac tcatccgcca gtttacctct 15781 ctgacccacg tgttcaatcg ctttcccgag aaccagattt tggcgcgccc gccagccccc 15841 accatcacca ccgtcagtga aaacgttcct gctctcacag atcacgggac gctaccgctg 15901 cgcaacagca tcggaggagt ccagcgagtg accattactg acgccagacg ccgcacctgc 15961 ccctacgttt acaaggccct gggcatagtc tcgccgcgcg tcctatcgag ccgcactttt 16021 tgagcaagca tgtccátcct tatatcgccc agcaataaca caggctgggg cctgcgcttc 16081 ccaagcaaga tgtttggcgg ggccaagaag cgctccgacc aacacccagt gcgcgtgcgc 16141 gggcactacc gcgcgccctg gggcgcgcac aaacgcggcc gcactgggcg caccaccgtc 16201 gatgacgcca tcgacgcggt ggtggaggag gcgcgcaact acacgcccac gccgccacca 16261 gtgtccacag tggacgcggc cattcagacc gtggtgcgcg gagcccggcg ctatgctaaa 16321 atgaagagac ggcggaggcg cgtagcacgt cgccaccgcc gccgacccgg cactgccgcc 16381 caacgcgcgg cggcggccct gcttaaccgc gcacgtcgca ccggccgacg ggcggccatg 16441 cgggccgctc gaaggctggc cgcgggtatt gtcactgtgc cccccaggtc caggcgacga 16501 gcggccgccg cagcagccgc ggccattagt gctatgactc agggtcgcag gggcaacgtg 16561 tattgggtgc gcgactcggt tagcggcctg cgcgtgcccg tgcgcacccg ccccccgcgc 16621 aactagattg caagaaaaaa ctacttagac tcgtactgtt gtatgtatcc agcggcggcg 16681 gcgcgcaacg aagctatgtc caagcgcaaa atcaaagaag agatgctcca ggtcatcgcg 16741 ccggagatct atggcccccc gaagaaggaa gagcaggatt acaagccccg aaagctaaag 16801 cgggtcaaaa agaaaaagaa agatgatgat gatgaacttg acgacgaggt ggaactgctg 16861 cacgctaccg cgcccaggcg acgggtacag tggaaaggtc gacgcgtaaa acgtgttttg 16921 cgacccggca ccaccgtagt ctttacgccc ggtgagcgct ccacccgcac ctacaagcgc 16981 gtgtatgatg aggtgtacgg cgacgaggac ctgcttgagc aggccaacga gcgcctcggg 17041 gagtttgcct acggaaagcg gcataaggac atgctggcgt tgccgctgga cgagggcaac 17101 ccaacaccta gcctaaagcc cgtaacactg cagcaggtgc tgcccgcgct tgcaccgtcc 17161 gaagaaaagc gcggcctaaa gcgcgagtct ggtgacttgg cacccaccgt gcagctgatg 17221 gtacccaagc gccagcgact ggaagatgtc ttggaaaaaa tgaccgtgga acctgggctg 17281 gagcccgagg tccgcgtgcg gccaatcaag caggtggcgc cgggactggg cgtgcagacc 17341 gtggacgttc agatacccac taccagtagc accagtattg ccaccgccac agagggcatg 17401 gagacacaaa cgtccccggt tgcctcagcg gtggcggatg ccgcggtgca ggcggtcgct 17461 gcggccgcgt ccaagacctc tacggaggtg caaacggacc cgtggatgtt tcgcgtttca 17521 gccccccggc gcccgcgcgg ttcgaggaag tacggcgccg ccagcgcgct actgcccgaa 17581 tatgccctac atccttccat tgcgcctacc cccggctatc gtggctacac ctaccgcccc 17641 agaagacgag caactacccg acgccgaacc accactggaa cccgccgccg ccgtcgccgt 17701 cgccagcccg tgctggcccc gatttccgtg cgcagggtgg ctcgcgaagg aggcaggacc 17761 ctggtgctgc caacagcgcg ctaccacccc agcatcgttt aaaagccggt ctttgtggtt 17821 cttgcagata tggccctcac ctgccgcctc cgtttcccgg tgccgggatt ccgaggaaga 17881 atgcaccgta ggaggggcat ggccggccac ggcctgacgg gcggcatgcg tcgtgcgcac 17941 caccggcggc ggcgcgcgtc gcaccgtcgc atgcgcggcg gtatcctgcc cctccttatt 18001 ccactgatcg ccgcggcgat tggcgccgtg cccggaattg catccgtggc cttgcaggcg 18061 cagagacact gattaaaaac aagttgcatg tggaaaaatc aaaataaaaa gtctggactc 18121 tcacgctcgc ttggtcctgt aactattttg tagaatggaa gacatcaact ttgcgtctct 18181 ggccccgcga cacggctcgc gcccgttcat gggaaactgg caagatatcg gcaccagcaa 18241 tatgagcggt ggcgccttca gctggggctc gctgtggagc ggcattaaaa atttcggttc 18301 caccgttaag aactatggca gcaaggcctg gaacagcagc acaggccaga tgctgaggga 18361 taagttgaaa gagcaaaatt tccaacaaaa ggtggtagat ggcctggcct ctggcattag 18421 cggggtggtg gacctggcca accaggcagt gcaaaataag attaacagta agcttgatcc 18481 ccgccctccc gtagaggagc ctccaccggc cgtggagaca gtgtctccag aggggcgtgg 18541 cgaaaagcgt ccgcgccccg acagggaaga aactctggtg acgcaaatag acgagcctcc 18601 ctcgtacgag gaggcactaa agcaaggcct gcccaccacc cgtcccatcg cgcccatggc 18661 taccggagtg ctgggccagc acacacccgt aacgctggac •ctgcctcccc ccgccgacac 18721 ccagcagaaa cctgtgctgc caggcccgac cgccgttgtt gtaacccgtc ctagccgcgc 18781 gtccctgcgc cgcgccgcca gcggtccgcg atcgttgcgg cccgtagcca gtggcaactg 18841 gcaaagcaca ctgaacagca tcgtgggtct gggggtgcaa tccctgaagc gccgacgatg 18901 cttctgaata gctaacgtgt cgtatgtgtg tcatgtatgc gtccatgtcg ccgccagagg 18961 agctgctgag ccgccgcgcg cccgctttcc aagatggcta ccccttcgat gatgccgcag 19021 tggtcttaca tgcacatctc gggccaggac gcctcggagt acctgagccc cgggctggtg 19081 cagtttgccc gcgccaccga gacgtacttc agcctgaata acaagtttag aaaccccacg 19141 gtggcgccta cgcacgacgt gaccacagac cggtcccagc gtttgacgct gcggttcatc 19201 cctgtggacc gtgaggatac tgcgtactcg tacaaggcgc ggttcaccct agctgtgggt 19261 gataaccgtg tgctggacat ggcttccacg tactttgaca tccgcggcgt gctggacagg 19321 ggccctactt ttaagcccta ctctggcact gcctacaacg ccctggctcc caagggtgcc 19381 ccaaatcctt gcgaatggga tgaagctgct actgctcttg aaataaacct agaagaagag 19441 gacgatgaca acgaagacga agtagacgag caagctgagc agcaaaaaac tcacgtattt 19501 gggcaggcgc cttattctgg tataaatatt acaaaggagg gtattcaaat aggtgtcgaa 19561 ggtcaaacac ctaaatatgc cgataaaaca tttcaacctg aacctcaaat aggagaatct •19621 cagtggtacg aaactgaaat taatcatgca gctgggagag tccttaaaaa gactacccca 19681 atgaaaccat gttacggttc atatgcaaaa cccacaaatg aaaatggagg gcaaggcatt 19741 cttgtaaagc aacaaaatgg aaagctagaa agtcaagtgg aaatgcaatt tttctcaact 19801 actgaggcga ccgcaggcaa tggtgataac ttgactccta aagtggtatt gtacagtgaa 19861 gatgtagata tagaaacccc agacactcat atttcttaca tgcccactat taaggaaggt 19921 aactcacgag aactaatggg ccaacaatct atgcccaaca ggcctaatta cattgctttt 19981 agggacaatt ttattggtct aatgtattac aacagcacgg gtaatatggg tgttctggcg 20041 ggccaagcat cgcagttgaa tgctgttgta gatttgcaag acagaaacac agagctttca 20101 taccagcttt tgcttgattc cattggtgat agaaccaggt acttttctat gtggaatcag 20161 gctgttgaca gctatgatcc agatgttaga attattgaaa atcatggaac tgaagatgaa 20221 cttccaaatt actgctttcc actgggaggt gtgattaata cagagactct taccaaggta 20281 aaacctaaaa caggtcagga aaatggatgg gaaaaagatg ctacagaatt ttcagataaa 20341 aatgaaataa gagttggaaa taattttgcc atggaaatca atctaaatgc caacctgtgg 20401 agaaatttcc tgtactccaa catagcgctg tatttgcccg acaagctaaa gtacagtcct 20461 tccaacgtaa aaatttctga taacccaaac acctacgact acatgaacaa gcgagtggtg 20521 gctcccgggt tagtggactg ctacattaac cttggagcac gctggtccct tgactatatg 20581 gacaacgtca acccatttaa ccaccaccgc aatgctggcc tgcgctaccg ctcaatgttg 20641 ctgggcaatg gtcgctatgt gcccttccac atccaggtgc ctcagaagtt ctttgccatt 20701 aaaaacctcc ttctcctgcc gggctcatac acctacgagt ggaacttcag gaaggatgtt 20761 aacatggttc tgcagagctc cctaggaaat gacctaaggg ttgacggagc cagcattaag 20821 tttgatagca tttgccttta cgccaccttc ttccccatgg cccacaacac cgcctccacg 20881 cttgaggcca tgcttagaaa cgacaccaac gaccagtcct ttaacgacta tctctccgcc 20941 gccaacatgc tctaccctat acccgccaac gctaccaacg tgcccatatc catcccctcc 21001 cgcaactggg cggctttccg cggctgggcc ttcacgcgcc ttaagactaa ggaaacccca 21061 tcactgggct cgggctacga cccttattac acctactctg gctctatacc ctacctagat 21121 ggaacctttt acctcaacca cacctttaag aaggtggcca ttacctttga ctcttctgtc 21181 agctggcctg gcaatgaccg cctgcttacc cccaacgagt. ttgaaattaa gcgctcagtt 21241 gacggggagg gttacaacgt tgcccagtgt aacatgacca aagactggtt cctggtacaa 21301 atgctagcta actacaacat tggctaccag ggcttctata tcccagagag ctacaaggac 21361 cgcatgtact ccttctttag aaacttccag cccatgagcc gtcaggtggt ggatgatact 21421 aaatacaagg actaccaaca ggtgggcatc ctacaccaac acaacaactc tggatttgtt 21481 ggctaccttg cccccaccat gcgcgaagga caggcctacc ctgctaactt cccctatccg 21541 cttataggca agaccgcagt tgacagcatt acccagaaaa agtttctttg cgatcgcacc 21601 ctttggcgca tcccattctc cagtaacttt atgtccatgg gcgcactcac agacctgggc 21661 caaaaccttc tctacgccaa ctccgcccac gcgctagaca tgacttttga ggtggatccc 21721 atggacgagc ccacccttct ttatgttttg tttgaagtct ttgacgtggt ccgtgtgcac 21781 cggccgcacc gcggcgtcat cgaaaccgtg tacctgcgca cgcccttctc ggccggcaac 21841 gccacaacat aaagaagcaa gcaacatcaa caacagctgc cgccatgggc tccagtgagc 21901 aggaactgaa agccattgtc aaagatcttg gttgtgggcc atattttttg ggcacctatg 21961 acaagcgctt tccaggcttt gtttctccac acaagctcgc ctgcgccata gtcaatacgg 22021 ccggtcgcga gactgggggc gtacactgga tggcctttgc ctggaacccg cactcaaaaa 22081 catgctacct ctttgagccc tttggctttt ctgaccagcg actcaagcag gtttaccagt 22141 ttgagtacga gtcactcctg cgccgtagcg ccattgcttc ttcccccgac cgctgtataa 22201 cgctggaaaa gtccacccaa agcgtacagg ggcccaactc ggccgcctgt ggactattct 22261 gctgcatgtt tctccacgcc tttgccaact ggccccaaac tcccatggat cacaacccca 22321 ccatgaacct tattaccggg gtacccaact ccatgctcaa cagtccccag gtacagccca 22381 ccctgcgtcg caaccaggaa cagctctaca gcttcctgga gcgccactcg' ccctacttcc 22441 gcagccacag tgcgcagatt aggagcgcca cttctttttg tcacttgaaa aacatgtaaa 22501 aataatgtac tagagacact ttcaataaag gcaaatgctt ttatttgtac actctcgggt 22561 gattatttac ccccaccctt gccgtctgcg ccgtttaaaa atcaaagggg ttctgccgcg 22621 catcgctatg cgccactggc agggacacgt tgcgatactg gtgtttagtg ctccacttaa 22681 actcaggcac aaccatccgc ggcagctcgg tgaagttttc actccacagg ctgcgcacca 22741 tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa gtcgcagttg gggcctccgc 22801 cctgcgcgcg cgagttgcga tacacagggt tgcagcactg gaacactatc agcgccgggt 22861 ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc cgcgtccagg tcctccgcgt 22921 tgctcagggc gaacggagtc aactttggta gctgccttcc caaaaagggc gcgtgcccag 22981 gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg accgtgcccg gtctgggcgt 23041 taggatacag cgcctgcata aaagccttga tctgcttaaa agccacctga gcctttgcgc 23101 cttcagagaa gaacatgccg caagacttgc cggaaaactg attggccgga caggccgcgt 23161 cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac cacatttcgg ccccaccggt 23221 tcttcacgat cttggccttg ctagactgct ccttcagcgc gcgctgcccg ttttcgctcg 23281 tcacatccat ttcaatcacg tgctccttat ttatcataat gcttccgtgt agacacttaa 23341 gctcgccttc gatctcagcg cagcggtgca gccacaacgc gcagcccgtg ggctcgtgat 23401 gcttgtaggt cacctctgca aacgactgca ggtacgcctg caggaatcgc cccatcatcg 23461 tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc gcggtgctcc tcgttcagcc 23521 aggtcttgca tacggccgcc agagcttcca cttggtcagg cagtagtttg aagttcgcct 23581 ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg cgcagcctcc atgcccttct 23641 cccacgcaga cacgatcggc acactcagcg ggttcatcac cgtaatttca ctttccgctt 23701 cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg cgccactggg tcgtcttcat 23761 tcagccgccg cactgtgcgc ttacctcctt tgccatgctt gattagcacc ggtgggttgc 23821 tgaaacccac catttgtagc gccacatctt ctctttcttc ctcgctgtcc acgattacct 23881 ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt ctttttcttc ttgggcgcaa 23941 tggccaaatc cgccgccgag gtcgatggcc gcgggctggg tgtgcgcggc accagcgcgt 24001 cttgtgatga gtcttcctcg tcctcggact cgatacgccg cctcatccgc ttttttgggg 24061 gcgcccgggg aggcggcggc gacggggacg gggacgacac gtcctccatg gttgggggac 24121 gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg ctgctcctct tcccgactgg 24181 ccatttcctt ctcctatagg cagaaaaaga tcatggagtc agtcgagaag aaggacagcc 24241 taaccgcccc ctctgagttc gccaccaccg cctccaccga tgccgccaac gcgcctacca 24301 ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt gattatcgag caggacccag 24361 gttttgtaag cgaagacgac gaggaccgct cagtaccaac agaggataaa aagcaagacc 24421 aggacaacgc agaggcaaac gaggaacaag tcgggcgggg ggacgaaagg catggcgact 24481 acctagatgt gggagacgac gtgctgttga agcatctgca gcgccagtgc gccattatct 24541 gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat agcggatgtc agccttgcct 24601 acgaacgcca cctattctca ccgcgcgtac cccccaaacg ccaagaaaac ggcacatgcg 24661 agcccaaccc gcgcctcaac ttctaccccg tatttgccgt gccagaggtg cttgccacct 24721 atcacatctt tttccaaaac tgcaagatac ccctatcctg ccgtgccaac cgcagccgag 24781 cggacaagca gctggccttg cggcagggcg ctgtcatacc tgatatcgcc tcgctcaacg 24841 aagtgccaaa aatctttgag ggtcttggac gcgacgagaa gcgcgcggca aacgctctgc 24901 aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt ggtggaactc gagggtgaca 24961 acgcgcgcct agccgtacta aaacgcagca tcgaggtcac ccactttgcc tacccggcac 25021 ttaacctacc ccccaaggtc atgagcacag tcatgagtga gctgatcgtg cgccgtgcgc 25081 agcccctgga gagggatgca aatttgcaag aacaaacaga ggagggccita cccgcagttg 25141 gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc tgccgacttg gaggagcgac 25201 gcaaactaat gatggccgca gtgctcgtta ccgtggagct tgagtgcatg cagcggttct 25261 ttgctgaccc ggagatgcag cgcaagctag aggaaacatt gcactacacc tttcgacagg 25321 gctacgtacg ccaggcctgc aagatctcca acgtggagct ctgcaacctg gtctcctacc 25381 ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct tcattccacg ctcaagggcg 25441 aggcgcgccg cgactacgtc cgcgactgcg tttacttatt tctatgctac acctggcaga 25501 cggccatggg cgtttggcag cagtgcttgg aggagtgcaa cctcaaggag ctgcagaaac 25561 tgctaaagca aaacttgaag gacctatgga cggccttcaa cgagcgctcc gtggccgcgc 25621 acctggcgga catcattttc cccgaacgcc tgcttaaaac cctgcaacag ggtctgccag 25681 acttcaccag tcaaagcatg ttgcagaact ttaggaactt tatcctagag cgctcaggaa 25741 tcttgcccgc cacctgctgt gcacttccta gcgactttgt gcccattaag taccgcgaat 25801 gccctccgcc gctttggggc cactgctacc ttctgcagct agccaactac cttgcctacc 25861 actctgacat aatggaagac gtgagcggtg acggtctact ggagtgtcac tgtcgctgca 25921 acctatgcac cccgcaccgc tccctggttt gcaattcgca gctgcttaac gaaagtcaaa 25981 ttatcggtac ctttgagctg cagggtccct cgcctgacga aaagtccgcg gctccggggt 26041 tgaaactcac tccggggctg tggacgtcgg cttaccttcg caaatttgta cctgaggact 26101 accacgccca cgagattagg ttctacgaag accaatcccg cccgccaaat gcggagctta 26161 ccgcctgcgt cattacccag ggccacattc ttggccaatt gcaagccatc aacaaagccc 26221 gccaagagtt tctgctacga aagggacggg gggtttactt ggacccccag tccggcgagg 26281 agctcaaccc aatccccccg ccgccgcagc cctatcagca gcagccgcgg gcccttgctt 26341 cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc cacccacgga cgaggaggaa 26401 tactgggaca gtcaggcaga ggaggttttg gacgaggagg aggaggacat gatggaagac 26461 tgggagagcc tagacgagga agcttccgag gtcgaagagg tgtcagacga aacaccgtca 26521 ccctcggtcg cattcccctc gccggcgccc cagaaatcgg caaccggttc cagcatggct 26581 acaacctccg ctcctcaggc gccgccggca ctgcccgttc gccgacccaa ccgtagatgg 26641 gacaccactg gaaccagggc cggtaagtcc aagcagccgc cgccgttagc·ccaagagcaa 26701 caacagcgcc aaggctaccg ctcatggcgc gggcacaaga acgccatagt tgcttgcttg 26761 caagactgtg ggggcaacat ctccttcgcc cgccgctttc ttctctacca tcacggcgtg 26821 gccttccccc gtaacatcct gcattactac cgtcatctct acagcccata ctgcaccggc 26881 ggcagcggca gcggcagcaa cagcagcggc cacacagaag caaaggcgac cggatagcaa 26941 gactctgaca aagcccaaga aatccacagc ggcggcagca gcaggaggag gagcgctgcg 27001 tctggcgccc aacgaacccg tatcgacccg cgagcttaga aacaggattt ttcccactct 27061 gtatgctata tttcaacaga gcaggggcca agaacaagag ctgaaaataa aaaacaggtc 27121 tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc gaagatcagc ttcggcgcac 27181 gctggaagac gcggaggctc tcttcagtaa atactgcgcg ctgactctta aggactagtt 27241 tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat ctccagcggc cacacccggc 27301 gccagcacct gtcgtcagcg ccattatgag caaggaaatt cccacgccct acatgtggag 27361 ttaccagcca caaatgggac ttgcggctgg agctgcccaa gactactcaa cccgaataaa 27421 ctacatgago gcgggacccc acatgatatc ccgggtcaac ggaatccgcg cccaccgaaa 27481 ccgaattctc ttggaacagg cggctattac caccacacct cgtaataacc ttaatccccg 27541 tagttggccc gctgccctgg tgtaccagga aagtcccgct cccaccactg tggtacttcc 27501 cagagacgcc caggccgaag ttcagatgac taactcaggg gcgcagcttg cgggcggctt 27661 tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac ctgacaatca gagggcgagg 27721 tattcagctc aacgacgagt cggtgagctc ctcgcttggt ctccgtccgg acgggacatt 27781 tcagatcggc ggcgccggcc gtccttcatt cacgcctcgt caggcaatcc taactctgca 27841 gacctcgtcc tctgagccgc gctctggagg cattggaact ctgcaattta ttgaggagtt 27901 tgtgccatcg gtctacttta accccttctc gggacctccc ggccactatc cggatcaatt 27961 tattcctaac tttgacgcgg taaaggactc ggcggacggc tacgactgaa tgttaagtgg 28021 agaggcagag caactgcgcc tgaaacacct ggtccactgt cgccgccaca agtgctttgc 28081 ccgcgactcc ggtgagtttt gctactttga attgcccgag gatcatatcg agggcccggc 28141 gcacggcgtc cggcttaccg cccagggaga gcttgcccgt agcctgattc gggagtttac 28201 ccagcgcccc ctgctagttg agcgggaoag gggaccctgt gttctcactg tgatttgcaa 28261 ctgtcctaac cttggattac atcaagatcc tctagttata actagagtac ccggggatct 28321 tattcccttt aactaataaa aaaaaataat aaagcatcac ttacttaaaa tcagttagca 28381 aatttctgtc cagtttattc agcagcacct ccttgccctc ctcccagctc tggtattgca 28441 gcttcctcct ggctgcaaac tttctccaca atctaaatgg aatgtcagtt tcctcctgtt 28501 cctgtccatc cgcacccact atcttcatgt tgttgcagat gaagcgcgca agaccgtctg 28561 aagatacctt caaccccgtg tatccatatg acacggaaac cggtcctcca actgtgcctt 28621 ttcttactcc tccctttgta tcccccaatg ggtttcaaga gagtccccct ggggtactct 28681 ctttgcgcct atccgaacct ctagttacct ccaatggcat gcttgcgctc aaaatgggca 28741 acggcctctc tctggacgag gccggcaacc ttacctccca aaatgtaacc actgtgagcc 28801 cacctctcaa aaaaaccaag tcaaacataa acctggaaat atctgcaccc ctcacagtta 28861 cctcagaagc cctaactgtg gctgccgccg cacctctaat ggtcgcgggc aacacactca 28921 ccatgcaatc acaggccccg ctaaccgtgc acgactccaa acttagcatt gccacccaag 28981 gacccctcac agtgtcagaa ggaaagctag ccctgcaaac atcaggcccc ctcaccacca 29041 ccgatagcag tacccttact atcactgcct caccccctct aactactgcc actggtagct 29101 tgggcattga cttgaaagag cccatttata cacaaaatgg aaaactagga ctaaagtacg 29161 gggctccttt gcatgtaaca gacgacctaa acactttgac cgtagcaact ggtccaggtg 29221 tgactattaa taatacttcc ttgcaaacta aagttactgg agccttgggt tttgattcac 29281 aaggcaatat gcaacttaat gtagcaggag gactaaggat tgattctcaa aacagacgcc 29341 ttatacttga tgttagttat ccgtttgatg ctcaaaacca actaaatcta agactaggac 29401 agggccctct ttttataaac tcagcccaca acttggatat taactacaac aaaggccttt 29461 acttgtttac agcttcaaac aattccaaaa agcttgaggt taacctaagc actgccaagg 29521 ggttgatgtt tgacgctaca gccatagcca ttaatgcagg agatgggctt gaatttggtt 29581 cacctaatgc accaaacaca aatcccctca aaacaaaaat tggccatggc ctagaatttg 29641 attcaaacaa ggctatggtt cctaaactag gaactggcct tagttttgac agcacaggtg 29701 ccattacagt aggaaacaaa aataatgata agctaacttt gtggaccaca ccagctccat 29761 ctcctaactg tagactaaat gcagagaaag atgctaaact cactttggtc ttaacaaaat 29821 gtggcagtca aatacttgct acagtttcag ttttggctgt taaaggcagt ttggctccaa 29881 tatctggaac agttcaaagt gctcatctta ttataagatt tgacgaaaat ggagtgctac 29941 taaacaattc c-ttcctggac ccagaatatt ggaactttag aaatggagat cttactgaag 30001 gcacagccta tacaaacgct gttggattta tgcctaacct atcagcttat ccaaaatctc 30061 acggtaaaac tgccaaaagt aacattgtca gtcaagttta cttaaacgga gacaaaacta 30121 aacctgtaac actaaccatt acactaaacg gtacacagga aacaggagac acaactccaa 30181 gtgcatactc tatgtcattt tcatgggact ggtctggcca caactacatt aatgaaatat 30241 ttgccacatc ctcttacact ttttcataca ttgcccaaga ataaagaatc gtttgtgtta 30301 tgtttcaacg tgtttatttt tcaattgcag aaaatttcaa gtcatttttc attcagtagt 30361 atagccccac caccacatag cttatacaga tcaccgtacc ttaatcaaac tcacagaacc 30421 ctagtattca acctgccacc tccctcccaa cacacagagt acacagtcct ttctccccgg 30481 ctggccttaa aaagcatcat atcatgggta acagacatat tcttaggtgt tatattccac 30541 acggtttcct gtcgagccaa acgctcatca gtgatattaa taaactcccc gggcagctca 30601 cttaagttca tgtcgctgtc cagctgctga gccacaggct gctgtccaac ttgcggttgc 30661 ttaacgggcg gcgaaggaga agtccacgcc tacatggggg tagagtcata atcgtgcatc 30721 aggatagggc ggtggtgctg cagcagcgcg cgaataaact gctgccgccg ccgctccgtc 30781 ctgcaggaat acaacatggc agtggtctcc tcagcgatga ttcgcaccgc ccgcagcata 30841 aggcgccttg tcctccgggc acagcagcgc accctgatct cacttaaatc agcacagtaa 30901 ctgcagcaca gcaccacaat attgttcaaa atcccacagt gcaaggcgct gtatccaaag 30961 ctcatggcgg ggaccacaga acccacgtgg ccatcatacc acaagcgcag gtagattaag 31021 tggcgacccc tcataaacac gctggacata aacattacct cttttggcat gttgtaattc 31081 accacctccc ggtaccatat aaacctctga ttaaacatgg cgccatccac caccatccta 31141 aaccagctgg ccaaaacctg cccgccggct atacactgca gggaaccggg actggaacaa 31201 tgacagtgga gagcccagga ctcgtaacca tggatcatca tgctcgtcat gatatcaatg 31261 ttggcacaac acaggcacac gtgcatacac ttcctcagga ttacaagctc ctcccgcgtt 31321 agaaccatat cccagggaac aacccattcc tgaatcagcg taaatcccac actgcaggga 31381 agacctcgca cgtaactcac gttgtgcatt gtcaaagtgt tacattcggg cagcagcgga 31441 tgatcctcca gtatggtagc gcgggtttct gtctcaaaag gaggtagacg atccctactg 31501 tacggagtgc gccgagacaa ccgagatcgt gttggtcgta gtgtcatgcc aaatggaacg 31561 ccggacgtag tcatatttcc tgaagcaaaa ccaggtgcgg gcgtgacaaa cagatctgcg 3Ί621 tctccggtct cgccgcttag atcgctctgt gtagtagttg tagtatatcc actctctcaa 31681 agcatccagg cgccccctgg cttcgggttc tatgtaaact ccttcatgcg ccgctgccct 31741 gataacatcc accaccgcag aataagccac acccagccaa cctacacatt cgttctgcga 31801 gtcacacacg ggaggagcgg gaagagctgg aagaaccatg tttttttttt tattccaaaa 31861 gattatccaa aacctcaaaa tgaagatcta ttaagtgaac gcgctcccct ccggtggcgt 31921 ggtcaaactc tacagccaaa gaacagataa tggcatttgt aagatgttgc acaatggctt 31981 ccaaaaggca aacggccctc acgtccaagt ggacgtaaag gctaaaccct tcagggtgaa 32041 tctcctctat aaacattcca gcaccttcaa ccatgcccaa ataattctca tctcgccacc 32101 ttctcaatat atctctaagc aaatcccgaa tattaagtcc ggccattgta aaaatctgct 32161 ccagagcgcc ctccaccttc agcctcaagc agcgaatcat gattgcaaaa attcaggttc 32221 ctcacagacc tgtataagat tcaaaagcgg aacattaaca aaaataccgc gatcccgtag 32281 gtcccttcgc agggccagct gaacataatc gtgcaggtct gcacggacca gcgcggccac 32341 ttccccgcca ggaaccttga caaaagaacc cacactgatt atgacacgca tactcggagc 32401 tatgctaacc agcgtagccc cgatgtaagc tttgttgcat gggcggcgat ataaaatgca 32461 aggtgctgct caaaaaatca ggcaaagcct cgcgcaaaaa agaaagcaca tcgtagtcat 32521 gctcatgcag ataaaggcag gtaagctccg gaaccaccac agaaaaagac accatttttc 32581 tctcaaacat gtctgcgggt ttctgcataa acacaaaata aaataacaaa aaaacattta . 32641 aacattagaa gcctgtctta caacaggaaa aacaaccctt ataagcataa gacggactac 32701 ggccatgccg gcgtgaccgt aaaaaaactg gtcaccgtga ttaaaaagca ccaccgacag. 32761 ctcctcggtc atgtccggag tcataatgta agactcggta aacacatcag gttgattcat 32821 cggtcagtgc taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag 32881 acaacattac agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa 32941 cacctgaaaa accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca 33001 gcgcttcaca gcggcagcct aacagtcagc cttaccagta aaaaagaaaa cctattaaaa 33061 aaacaccact cgacacggca ccagctcaat cagtcacagt gtaaaaaagg gccaagtgca 33121 gagcgagtat atataggact aaaaaatgac gtaacggtta aagtccacaa aaaacaccca 33181 gaaaaccgca cgcgaaccta cgcccagaaa cgaaagccaa aaaacccaca acttcctcaa 33241 atcgtcactt ccgttttccc acgttacgta acttcccatt ttaagaaaac tacaattccc 33301 aacacataca agttactccg ccctaaaacc tacgtcaccc gccccgttcc cacgccccgc 33361 gccacgtcac aaactccacc ccctcattat catattggct tcaatccaaa ataaggtata 33421 ttattgatga tnnnnnttaa t SEQ ID NO:17 (ND1.1 214) 1 taaggatccn nncctgtcct cgaccgatgc ccttgagagc cttcaaccca gtcagctcct 61 tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc 121 aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac cgctttcgct 181 ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac gccctcgctc 241 aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc attatcgccg 301 gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga ggctggatgg 361 ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg ttgcaggcca 421 tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg ctcgcggctc 481 ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat gccgcctcgg 541 cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt gtctgcctcc 601 ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa gccggcggca 661 cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc ggagaactgt 721 gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct ccagcagccg 781 cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga tcgtgctcct 841 gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga atgaatcacc 901 gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac 961 atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt cagcgccctg 1021 caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg gaacacctac 1081 atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt cccgccgcat 1141 ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt catcatcagt 1201 aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca tgaacagaaa 1261 ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct taacatggcc 1321 cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct ggacgcggat 1381 gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta ccgcagctgc 1441 ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 1501 acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 1561 gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact 1621 ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa 1681 taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca 1741 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 1801 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 1861 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 1921 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 1981 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 2041 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 2101 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 2161 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 2221 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 2281 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 2341 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 2401 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 2461 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 2521 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 2581 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 2641 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 2701 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 2761 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 2821 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 2881 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 2941 cgccagttaa tagtttgcgc aacgttgttg ccattgctgc agccatga gattatcaaa aaggatcttc acctagatcc ttttcacgta gaaagccagt ccgcagaaac ggtgctgacc ccggatgaat gtcagctact gggctatctg gacaagggaa aacgcaagcg caaagagaaa gcaggtagct tgcagtgggc ttacatggcg atagctagac tgggcggttt tatggacagc aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attttgttaa aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa catcccttat aaatcaaaag aatagaccgc gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggacto caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc caaatcaagt tttttgcggt cgaggtgccg taaagctcta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcg cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggatcgaat taattcttaa ttaacatcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg

taatactGCTAGAgatCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGC

CAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTA TAGGGCGAATTGGGTACTGGCCAcagagcttggcccattgcatacgttgtatccatatcata atatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgact agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgt tacataacttacggtaaatggcccgoctggctgaccgcccaacgacccccgcccattgacgt caataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtg gagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgcc ccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttat gggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcgg ttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctcca ccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtc gtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatata agcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacct ccatagaagacaccgggaccgatccagcctgactctagCctAGCTCtgaagttggtggtgag gccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggc atgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtc tattttcccacccttaggctgctggtctgagcctagGAGATCrCTCGAGGTCGACGGTAFcg

atgcca ccATGGAGAA AATCGTCCTG TTGCTCGCTA TTGTGTCTCTAGTGAAGAGC

GATCAAATTT GTATCGGCTA CCATGCCAAT AACTCAACAGAGCAGGTCGA

TACTATCATG GAGAAAAACG TAACAGTTAC TCATGCCCAA GACATCTTGG

AAAAGACCCA CAACGGCAAA CTTTGCGACC TGGATGGAGT GAAGCCCCTG

ATCCTCCGGG ACTGTTCAGT CGCTGGTTGG CTGCTCGGGA ACCCTATGTG

TGATGAGTTT ATCAACGTGC CTGAATGGTC TTACATTGTG GAGAAGGCTA

ACCCTACCAA TGACCTCTGC TATCCTGGGT CATTTAACGA TTACGAGGAA

CTGAAACACC TGTTGTCTAG AATTAACCAC TTTGAAAAGA TACAGATTAT

ACCCAAGTCT AGTTGGAGTG ATCACGAAGC CTCCTCAGGC GTTAGCTCAG

CGTGTCCCTA TCTGGGCTCT CCATCCTTCT TTAGAAATGT GGTCTGGTTA

ATCAAAAAGA ACAGTACCTA CCCAACCATC AAAAAGXCTT ATAACAATAC CAATCAGGAG GACCTGCTCG TGTTGTGGGG TATCCATCAC CCGAACGACG CCGCTGAACA GACTAGGCTG TATCAGAACC CCACTACATA CATCAGTATT GGCACGAGTA CTCTGAACCA GCGATTAGTG CCAAAGATTG CAACACGGAG CAAAGTAAAT GGGCAATCTG GCAGGATGGA GTTTTTCTGG ACAATCTTAA AACCCAACGA TGCGATAAAT TTCGAGTCCA ATGGCAATTT CATCGCCCCT GAATACGCCT ATAAGATCGT GAAAAAGGGG GACTCTGCAA TTATGAAGTC CGAATTAGAG TATGGCAATT GCAACACGAA GTGCCAGACA CCAATGGGAG CCATTAATAG CTCAATGCCC TTCCATAATA TTCATCCATT GACCATTGGG GAGTGCCCAA AGTACGTGAA GTCCAACCGC CTGGTCCTCG CAACCGGTCT AAGAAATAGC CCGCAGAGAG AATCGCGGAG GAAGAAACGT GGCCTGTTTG GCGCGATTGC CGGATTCATC GAGGGAGGCT GGCAGGGTAT GGTCGATGGT TGGTACGGAT ACCACGATAG CAACGAACAG GGGTCCGGCT ATGCAGCAGA TAAGGAGAGC ACTCAGAAAG CTATTGACGG AGTTACAAAC AAGGTTAATA GTATTATAGA TAAAATGAAC ACGCAATTCG AGGCCGTTGG GAGGGAGTTT AACAATCTGG AACGCCGGAT CGAAAATCTG AATAAGAAAA TGGAAGACGG CTTCCTTGAC GTGTGGACTT ATAATGCAGA GCTGCTTGTA CTCATGGAGA ACGAGAGGAC CCTGGATTTC CACGATAGCA ACGTGAAGAA CCTTTACGAC AAGGTGAGAC TTCAGCTCCG AGACAACGCC AAGGAGCTGGGGAATGGATG CTTCGAGTTT TACCACAAAT GTGACAATGA GTGCATGGAAAGTATACGCA ACGGGACCTA CAATTACCCT CAGTATAGCG AAGAGGCTCGGCTCAAACGC GAAGAGATAA GCGGGGTGAA ATTGGAATCA ATCGGAACATATCAAATCCT GTCCATCTAT TCCACCGTCG CCTCTTCGCT GGCCCTCGCT ATCATGATGG CTGGTCTGTC CCTATGGAIG TGTTCCAATG GAAGCCTTCAGTGCCGTATT TGTATATGAg c

GGCCGCCCTATTCTATAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCC

TT

CTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCC

ACTCCCAC

TGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTC

TGGGGGGT

GGGGT G GGGC AG GAC AGC AAGGGGGAG GAT T G GGAAGAC AATAGCAGGC AT GCTGGG GATGC GGTGGGCT CTATGGCTTCTGAGGCGGAAAGAACCAAAGCrtaacatfcatc aataatatac cttattttgg attgaagcca atatgataat gagggggtgg. agtttgtgac gtggcgcggg gcgtgggaac ggggcgggtg acgtagtagt gtggcggaag tgtgatgttg caagtgtggc ggaacacatg taagcgacgg atgtggcaaa agtgacgttt ttggtgtgcg ccggtgtaca caggaagtga caattttcgc gcggttttag gcggatgttg tagtaaattt gggcgtaacc gagtaagatt tggccatttt cgcgggaaaa ctgaataaga ggaagtgaaa tctgaataat tttgtgttac tcatagcgcg taatactgta atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata

agcagagctg gtttagtgaa ccgtcagatc cgc taqAGATCTGGgaaacga ta tgggctgaatacggatccgtattcagccca ta tcgt ttc TCT AGA AAT AAA ATA TCT TTA TTT TCA TTA CAT CTG TGT GTT GGT TTT TTG TGT GGC GG CCGCtcgagcct AAGCTTctag ataagatatc cgatccaccg gatctagata actgatcata atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt aacgcggatc tgggcgtggt taagggtggg aaagaatata taaggtgggg gtcttatgta gttttgtatc tgttttgcag cagccgccgc cgccatgagc accaactcgt ttgatggaag cattgtg AGCTTgtcgactcg aagatctggg cgtggttaag ggtgggaaag aatatataag gtgggggtct tatgtagttt tgtatctgtt ttgcagcagc cgccgccgcc atgagcacca actcgtttga tggaagcatt gtgagctcat atttgacaac gcgcatgccc ccatgggccg gggtgcgtca gaatgtgatg ggctccagca ttgatggtcg ccccgtcctg cccgcaaact ctactacctt gacctacgag accgtgtctg gaacgccgtt ggagactgca gcctccgccg ccgcttcagc cgctgcagcc accgcccgcg ggattgtgac tgactttgct ttcctgagcc cgcttgcaag cagtgcagct tcccgttcat ccgcccgcga tgacaagttg acggctcttt tggcacaatt ggattctttg acccgggaac ttaatgtcgt ttctcagcag ctgttggatc tgcgccagca ggtttctgcc ctgaaggctt cctcccctcc caatgcggtt taaaacataa ataaaaaacc agactctgtt tggatttgga tcaagcaagt gtcttgctgt ctttatttag gggttttgcg cgcgcggtag gcccgggacc agcggtctcg gtcgttgagg gtcctgtgta ttttttccag gacgtggtaa aggtgactct ggatgttcag atacatgggc ataagcccgt ctctggggtg gaggtagcac cactgcagag cttcatgctg cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcgtggt gcctaaaaat gtctttcagt agcaagctga ttgccagggg caggcccttg gtgtaagtgt ttacaaagcg gttaagctgg gatgggtgca tacgtgggga tatgagatgc atcttggact gtatttttag gttggctatg ttcccagcca tatccctccg gggattcatg ttgtgcagaa ccaccagcac agtgtatccg gtgcacttgg gaaatttgtc atgtagctta gaaggaaatg cgtggaagaa cttggagacg cccttgtgac ctccaagatt ttccatgcat tcgtccataa tgatggcaat gggcccacgg gcggcggcct gggcgaagat atttctggga tcactaacgt catagttgtg ttccaggatg agatcgtcat aggccatttt tacaaagcgc gggcggaggg tgccagactg cggtataatg gttccatccg gcccaggggc gtagttaccc tcacagattt gcatttccca cgctttgagt tcagatgggg ggatcatgtc tacctgcggg gcgatgaaga aaacggtttc cggggtaggg gagatcagct gggaagaaag caggttcctg agcagctgcg acttaccgca gccggtgggc ccgtaaatca cacctattac cgggtgcaac tggtagttaa gagagct g cagctgccgt catccctgag caggggggcc acttcgttaa gcatgtccct gactcgcatg ttttccctga ccaaatccgc cagaaggcgc tcgccgccca gcgatagcag· ttcttgcaag gaagcaaagt ttttcaacgg tttgagaccg tccgccgtag gcatgctttt gagcgtttga ccaagcagtt ccaggcggtc ccacagctcg gtcacctgct ctacggcatc tcgatccagc atatctcctc gtttcgcggg ttggggcggc tttcgctgta cggcagtagt cggtgctcgt ccagacgggc cagggtcatg tctttccacg ggcgcagggt cctcgtcagc gtagtctggg tcacggtgaa ggggtgcgct ccgggctgcg cgctggccag ggtgcgcttg aggctggtcc tgctggtgct gaagcgctgc cggtcttcgc cctgcgcgtc ggccaggtag catttgacca tggtgtcata gtccagcccc tccgcggcgt ggcccttggc gcgcagcttg cccttggagg aggcgccgca cgaggggcag tgcagacttt tgagggcgta gagcttgggc gcgagaaata ccgattccgg ggagtaggca tccgcgccgc aggccccgca gacggtctcg cattccacga gccaggtgag ctctggccgt tcggggtcaa aaaccaggtt tcccccatgc tttttgatgc gtttcttacc tctggtttcc atgagccggt gtccacgctc ggtgacgaaa aggctgtccg tgtccccgta tacagacttg agaggcctgt cctcgagcgg tgttccgcgg tcctcctcgt atagaaactc ggaccactct gagacaaagg ctcgcgtcca ggccagcacg aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt gtaggtgtag gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc tcactctctt ccgcatcgct gtctgcgagg gccagctgtt ggggtgagta ctccctctga aaagcgggca tgacttctgc gctaagattg tcagtttcca 6301 aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcat 6361 ccatctggtc agaaaagaca atctttttgt tgtcaagctt ggtggcaaac gacccgtaga 6421 gggcgttgga cagcaacttg gcgatggagc gcagggtttg gtttttgtcg cgatcggcgc 6481 gctccttggc cgcgatgttt agctgcacgt attcgcgcgc aacgcaccgc cattcgggaa 6541 agacggtggt gcgctcgtcg ggcaccaggt gcacgcgcca accgcggttg tgcagggtga 6601 caaggtcaac gctggtggct acctctccgc gtaggcgctc gttggtccag cagaggcggc 6661 cgcccttgcg cgagcagaat ggcggtaggg ggtctagctg cgtctcgtcc ggggggtctg 6721 cgtccacggt aaagaccccg ggcagcaggc gcgcgtcgaa gtagtctatc ttgcatcctt 6781 gcaagtctag cgcctgctgc catgcgcggg cggcaagcgc gcgctcgtat gggttgagtg 6841 ggggacccca tggcatgggg tgggtgagcg cggaggcgta catgccgcaa atgtcgtaaa 6901 cgtagagggg ctctctgagt attccaagat atgtagggta gcat'cttcca ccgcggatgc 6961 tggcgcgcac gtaatcgtat agttcgtgcg agggagcgag gaggtcggga ccgaggttgc 7021 tacgggcggg ctgctctgct cggaagacta tctgcctgaa gatggcatgt gagttggatg 7081 atatggttgg acgctggaag acgttgaagc tggcgtctgt gagacctacc gcgtcacgca 7141 cgaaggaggc gtaggagtcg cgcagcttgt tgaccagctc ggcggtgacc tgcacgtcta 7201 gggcgcagta gtccagggtt tccttgatga tgtcatactt atcctgtccc ttttttttcc 7261 acagctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7321 cgtcggcctc cgaacggtaa gagcctagca tgtagaactg gttgacggcc tggtaggcgc 7381 agcatccctt ttctacgggt agcgcgtatg cctgcgcggc cttccggagc gaggtgtggg 7441 tgagcgcaaa ggtgtccctg accatgactt tgaggtactg gtatttgaag tcagtgtcgt 7501 cgcatccgcc ctgctcccag agcaaaaagt ccgtgcgctt tttggaacgc ggatttggca 7561 gggcgaaggt gacatcgttg aagagtatct ttcccgcgcg aggcataaag ttgcgtgtga 7621 tgcggaaggg tcccggcacc tcggaacggt tgttaattac ctgggcggcg agcacgatct 7681 cgtcaaagcc gttgatgttg tggcccacaa tgtaaagttc caagaagcgc gggatgccct 7741 tgatggaagg caatttttta agttcctcgt aggtgagctc ttcaggggag ctgagcccgt 7801 gctctgaaag ggcccagtct gcaagatgag ggttggaagc gacgaatgag ctccacaggt 7861 cacgggccat tagcatttgc aggtggtcgc gaaaggtcct aaactggcga cctatggcca 7921 ttttttctgg ggtgatgcag tagaaggtaa gcgggtcttg ttcccagcgg tcccatccaa 7981 ggttcgcggc taggtctcgc gcggcagtca ctagaggctc atctccgccg aacttcatga 8041 ccagcatgaa gggcacgagc tgcttcccaa aggcccccat ccaagtatag gtctctacat 8101 cgtaggtgac aaagagacgc tcggtgcgag gatgcgagcc gatcgggaag aactggatct 8161 cccgccacca attggaggag tggctattga tgtggtgaaa gtagaagtcc ctgcgacggg 8221 ccgaacactc gtgctggctt ttgtaaaaac gtgcgcagta ctggcagcgg tgcacgggct 8281 gtacatcctg cacgaggttg acctgacgac cgcgcacaag gaagcagagt gggaatttga 8341 gcccctcgcc tggcgggttt ggctggtggt cttctacttc ggctgcttgt ccttgaccgt 8401 ctggctgctc gaggggagtt acggtggatc ggaccaccac gccgcgcgag cccaaagtcc 8461 agatgtccgc gcgcggcggt cggagcttga tgacaacatc gcgcagatgg gagctgtcca 8521 tggtctggag ctcccgcggc gtcaggtcag gcgggagctc ctgcaggttt acctcgcata 8581 gacgggtcag ggcgcgggct agatccaggt gatacctaat ttccaggggc tggttggtgg 8641 cggcgtcgat ggcttgcaag aggccgcatc cccgcggcgc gactacggta ccgcgcggcg 8701 ggcggtgggc cgcgggggtg tccttggatg atgcatctaa aagcggtgac gcgggcgagc 8761 ccccggaggt agggggggct ccggacccgc cgggagaggg ggcaggggca cgtcggcgcc 8821 gcgcgcgggc aggagctggt gctgcgcgcg taggttgctg gcgaacgcga cgacgcggcg 8881 gttgatctcc tgaatctggc gcctctgcgt gaagacgacg ggcccggtga gcttgagcct 8941 gaaagagagt tcgacagaat caatttcggt gtcgttgacg gcggcctggc gcaaaatctc 9001 ctgcacgtct cctgagttgt cttgataggc gatctcggcc atgaactgct cgatctcttc 9061 ctcctggaga tctccgcgtc cggctcgctc cacggtggcg gcgaggtcgt tggaaatgcg 9121 ggccatgagc tgcgagaagg cgttgaggcc tccctcgttc cagacgcggc tgtagaccac 9181 gcccccttcg gcatcgcggg cgcgcatgac cacctgcgcg agattgagct ccacgtgccg 9241 ggcgaagacg gcgtagtttc gcaggcgctg aaagaggtag ttgagggtgg tggcggtgtg 9301 ttctgccacg aagaagtaca taacccagcg tcgcaacgtg gattcgttga tatcccccaa 9361 ggcctcaagg cgctccatgg cctcgtagaa gtccacggcg aagttgaaaa actgggagtt 9421 gcgcgccgac acggttaact cctcctccag aagacggatg agctcggcga cagtgtcgcg 9481 cacctcgcgc tcaaaggcta caggggcctc ttcttcttct tcaatctcct cttccataag 9541 ggcctcccct tcttcttctt ctggcggcgg tgggggaggg gggacacggc ggcgacgacg 9601 gcgcaccggg aggcggtcga caaagcgctc gatcatctcc ccgcggcgac ggcgcatggt 9661 ctcggtgacg gcgcggccgt tctcgcgggg gcgcagttgg aagacgccgc ccgtcatgtc 9721 ccggttatgg gttggcgggg ggctgccatg cggcagggat acggcgctaa cgatgcatct 9781 caacaattgt tgtgtaggta ctccgccgcc gagggacctg agcgagtccg catcgaccgg 9841 atcggaaaac ctctcgagaa aggcgtctaa ccagtcacag tcgcaaggta ggctgagcac 9901 cgtggcgggc ggcagcgggc ggcggtcggg gttgtttctg gcggaggtgc tgctgatgat 9961 gtaattaaag taggcggtct tgagacggcg gatggtcgac agaagcacca tgtccttggg 10021 tccggcctgc tgaatgcgca ggcggtcggc catgccccag gcttcgtttt gacatcggcg 10081 caggtctttg tagtagtctt gcatgagcct ttctaccggc acttcttctt ctccttcctc 10141 ttgtcctgca tctcttgcat ctatcgctgc ggcggcggcg gagtttggcc gtaggtggcg 10201 ccctcttcct cccatgcgtg tgaccccgaa gcccctcatc ggctgaagca gggctaggtc 10261 ggcgacaacg cgctcggcta atatggcctg ctgcacctgc gtgagggtag actggaagtc 10321 atccatgtcc acaaagcggt ggtatgcgcc cgtgttgatg gtgtaagtgc agttggccat 10381 aacggaccag ttaacggtct ggtgacccgg ctgcgagagc tcggtgtacc tgagacgcga 10441 gtaagccctc gagtcaaata cgtagtcgtt gcaagtccgc accaggtact ggtatcccac 10501 caaaaagtgc ggcggcggct ggcggtagag gggccagcgt agggtggccg gggctccggg 10561 ggcgagatct tccaacataa ggcgatgata tccgtagatg tacctggaca tccaggtgat 10621 gccggcggcg gtggtggagg cgcgcggaaa gtcgcggacg cggttccaga tgttgcgcag 10681 cggcaaaaag tgctccatgg tcgggacgct ctggccggtc aggcgcgcgc aatcgttgac 10741 gctctaccgt gcaaaaggag agcctgtaag cgggcactct tccgtggtct ggtggataaa 10801 ttcgcaaggg tatcatggcg gacgaccggg gttcgagccc cgtatccggc cgtccgccgt 10861 gatccatgcg gttaccgccc gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga 10921 gtgctccttt tggcttcctt ccaggcgcgg cggctgctgc gctagctttt ttggccactg 10981 gccgcgcgca gcgtaagcgg ttaggctgga aagcgaaagc attaagtggc tcgctccctg 11041 tagccggagg gttattttcc aagggttgag tcgcgggacc cccggttcga gtctcggacc 11101 ggccggactg cggcgaacgg gggtttgcct ccccgtcatg caagaccccg cttgcaaatt 11161 cctccggaaa cagggacgag cccctttttt gcttttccca gatgcatccg gtgctgcggc 11221 agatgcgccc ccctcctcag cagcggcaag agcaagagca gcggcagaca tgcagggcac 11281 cctcccctcc tcctaccgcg tcaggagggg cgacatccgc ggttgacgcg gcagcagatg 11341 gtgattacga acccccgcgg cgccgggccc ggcactacct ggacttggag gagggcgagg 11401 gcctggcgcg gctaggagcg ccctctcctg agcggtaccc aagggtgcag ctgaagcgtg 11461 atacgcgtga ggcgtacgtg ccgcggcaga acctgtttcg cgaccgcgag ggagaggagc 11521 ccgaggagat gcgggatcga aagttccacg cagggcgcga gctgcggcat ggcctgaatc 11581 gcgagcggtt gctgcgcgag gaggactttg agcccgacgc gcgaaccggg attagtcccg 11641 cgcgcgcaca cgtggcggcc gccgacctgg taaccgcata cgagcagacg gtgaaccagg 11701 agattaactt tcaaaaaagc tttaacaacc acgtgcgtac gcttgtggcg cgcgaggagg 11761 tggctatagg actgatgcat ctgtgggact ttgtaagcgc gctggagcaa aacccaaata 11821 gcaagccgct catggcgcag ctgttcctta tagtgcagca cagcagggac aacgaggcat 11881 tcagggatgc gctgctaaac atagtagagc ccgagggccg ctggctgctc gatttgataa 11941 acatcctgca gagcatagtg gtgcaggagc gcagcttgag cctggctgac aaggtggccg 12001 ccatcaacta ttccatgctt agcctgggca agttttacgc ccgcaagata taccataccc 12061 cttacgttcc catagacaag gaggtaaaga tcgaggggtt ctacatgcgc atggcgctga 12121 aggtgcttac cttgagcgac gacctgggcg tttatcgcaa cgagcgcatc cacaaggccg 12181 tgagcgtgag ccggcggcgc gagctcagcg accgcgagct gatgcacagc ctgcaaaggg 12241 ccctggctgg cacgggcagc ggcgatagag aggccgagtc ctactttgac gcgggcgctg 12301 acctgcgctg ggccccaagc cgacgcgccc tggaggcagc tggggccgga cctgggctgg 12361 cggtggcacc cgcgcgcgct ggcaacgtcg gcggcgtgga ggaatatgac gaggacgatg 12421 agtacgagcc agaggacggc gagtactaag cggtgatgtt tctgatcaga tgatgcaaga 12481 cgcaacggac ccggcggtgc gggcggcgct gcagagccag ccgtccggcc ttaactccac 12541 ggacgactgg cgccaggtca tggaccgcat catgtcgctg actgcgcgca atcctgacgc 12601 gttccggcag cagccgcagg ccaaccggct ctccgcaatt ctggaagcgg tggtcccggc 12661 gcgcgcaaac cccacgcacg agaaggtgct ggcgatcgta aacgcgctgg ccgaaaacag 12721 ggccatccgg cccgacgagg ccggcctggt ctacgacgcg ctgcttcagc gcgtggctcg 12781 ttacaacagc ggcaacgtgc agaccaacct ggaccggctg gtgggggatg tgcgcgaggc 12841 cgtggcgcag cgtgagcgcg cgcagcagca gggcaacctg ggctccatgg ttgcactaaa 12901 cgccttcctg agtacacagc ccgccaacgt gccgcgggga caggaggact acaccaactt 12961 tgtgagcgca ctgcggctaa tggtgactga gacaccgcaa agtgaggtgt accagtctgg 13021 gccagactat tttttccaga ccagtagaca aggcctgcag accgtaaacc tgagccaggc 13081 tttcaaaaac ttgcaggggc tgtggggggt gcgggctccc acaggcgacc gcgcgaccgt 13141 gtctagcttg ctgacgccca actcgcgcct gttgctgctg ctaatagcgc ccttcacgga 13201 cagtggcagc gtgtcccggg acacatacct aggtcacttg ctgacactgt accgcgaggc 13261 cataggtcag gcgcatgtgg acgagcatac tttccaggag attacaagtg tcagccgcgc 13321 gctggggcag gaggacacgg gcagcctgga ggcaacccta aactacctgc tgaccaaccg 13381 gcggcagaag atcccctcgt tgcacagttt aaacagcgag gaggagcgca ttttgcgcta 13441 cgtgcagcag agcgtgagcc ttaacctgat gcgcgacggg gtaacgccca gcgtggcgct 13501 ggacatgacc gcgcgcaaca tggaaccggg catgtatgcc tcaaaccggc cgtttatcaa 13561 ccgcctaatg gactacttgc atcgcgcggc cgccgtgaac cccgagtatt tcaccaatgc 13621 catcttgaac ccgcactggc taccgccccc tggtttctac accgggggat tcgaggtgcc 13681 cgagggtaac gatggattcc tctgggacga catagacgac agcgtgtttt ccccgcaacc 13741 gcagaccctg ctagagttgc aacagcgcga gcaggcagag gcggcgctgc gaaaggaaag 13801 cttccgcagg ccaagcagct tgtccgatct aggcgctgcg gccccgcggt cagatgctag 13861 tagcccattt ccaagcttga tagggtctct taccagcact cgcaccaccc gcccgcgcct 13921 gctgggcgag gaggagtacc taaacaactc gctgctgcag ccgcagcgcg aaaaaaacct 13981 gcctccggca tttcccaaca acgggataga gagcctagtg gacaagatga gtagatggaa 14041 gacgtacgcg caggagcaca gggacgtgcc aggcccgcgc ccgcccaccc gtcgtcaaag 14101 gcacgaccgt cagcggggtc tggtgtggga ggacgatgac tcggcagacg acagcagcgt 14161 cctggatttg ggagggagtg gcaacccgtt tgcgcacctt cgccccaggc tggggagaat 14221 gttttaaaaa aaaaaaagca tgatgcaaaa taaaaaactc accaaggcca tggcaccgag 14281 cgttggtttt cttgtattcc ccttagtatg cggcgcgcgg cgatgtatga ggaaggtcct 14341 cctccctcct acgagagtgt ggtgagcgcg gcgccagtgg cggcggcgct gggttctccc 14401 ttcgatgctc ccctggaccc gccgtttgtg cctccgcggt acctgcggcc taccgggggg 14461 agaaacagca tccgttactc tgagttggca cccctattcg acaccacccg tgtgtacctg .14521 gtggacaaca agtcaacgga tgtggcatcc ctgaactacc agaacgacca cagcaacttt 14581 ctgaccacgg tcattcaaaa caatgactac agcccggggg aggcaagcac acagaccatc 14641 aatcttgacg accggtcgca ctggggcggc gacctgaaaa ccatcctgca taccaacatg 14701 ccaaatgtga acgagttcat gtttaccaat aagtttaagg cgcgggtgat ggtgtcgcgc 14761 ttgcctacta aggacaatca ggtggagctg aaatacgagt gggtggagtt cacgctgccc 14821 gagggcaact actccgagac catgaccata gaccttatga acaacgcgat cgtggagcac 14881 tacttgaaag tgggcagaca gaacggggtt ctggaaagcg acatcggggt aaagtttgac 14941 acccgcaact tcagactggg gtttgacccc gtcactggtc ttgtcatgcc tggggtatat 15001 acaaacgaag ccttccatcc agacatcatt ttgctgccag gatgcggggt ggacttcacc 15061 cacagccgcc tgagcaactt gttgggcatc cgcaagcggc aacccttcca ggagggcttt 15121 aggatcacct acgatgatct ggagggtggt aacattcccg cactgttgga tgtggacgcc 15181 taccaggcga gcttgaaaga tgacaccgaa cagggcgggg gtggcgcagg cggcagcaac 15241 agcagtggca gcggcgcgga agagaactcc aacgcggcag ccgcggcaat gcagccggtg 15301 gaggacatga acgatcatgc cattcgcggc gacacctttg ccacacgggc tgaggagaag 15361 cgcgctgagg ccgaagcagc ggccgaagct gc.cgcccccg ctgcgcaacc cgaggtcgag 15421 aagcctcaga agaaaccggt gatcaaaccc ctgacagagg acagcaagaa acgcagttac 15481 aacctaataa gcaatgacag caccttcacc cagtaccgca gctggtacct tgcatacaac 15541 tacggcgacc ctcagaccgg aatccgctca tggaccctgc tttgcactcc tgacgtaacc 15601 tgcggctcgg agcaggtcta ctggtcgttg ccagacatga tgcaagaccc cgtgaccttc 15661 cgctccacgc gccagatcag caactttccg gtggtgggcg ccgagctgtt gcccgtgcac 15721 tccaagagct tctacaacga ccaggccgtc tactcccaac tcatccgcca gtttacctct 15781 ctgacccacg tgttcaatcg ctttcccgag aaccagattt tggcgcgccc gccagccccc 15841 accatcacca ccgtcagtga aaacgttcct gctctcacag atcacgggac gctaccgctg 15901 cgcaacagca tcggaggagt ccagcgagtg accattactg acgccagacg ccgcacctgc 15961 ccctacgttt acaaggccct gggcatagtc tcgccgcgcg tcctatcgag ccgcactttt 16021 tgagcaagca tgtccatcct tatatcgccc agcaataaca caggctgggg cctgcgcttc 16081 ccaagcaaga tgtttggcgg ggccaagaag cgctccgacc aacacccagt gcgcgtgcgc 16141 gggcactacc gcgcgccctg gggcgcgcac aaacgcggcc gcactgggcg caccaccgtc 16201 gatgacgcca tcgacgcggt ggtggaggag gcgcgcaact acacgcccac gccgccacca 16261 gtgtccacag tggacgcggc cattcagacc gtggtgcgcg gagcccggcg ctatgctaaa 16321 atgaagagac ggcggaggcg cgtagcacgt cgccaccgcc gccgacccgg cactgccgcc 16381 caacgcgcgg cggcggccct gcttaaccgc gcacgtcgca ccggccgacg ggcggccatg 16441 cgggccgctc gaaggctggc cgcgggtatt gtcactgtgc cccccaggtc caggcgacga 16501 gcggccgccg cagcagccgc ggccattagt gctatgactc agggtcgcag gggcaacgtg 16561 tattgggtgc gcgactcggt tagcggcctg cgcgtgcccg tgcgcacccg ccccccgcgc 16621 aactagattg caagaaaaaa ctacttagac tcgtactgtt gtatgtatcc agcggcggcg 16681 gcgcgcaacg aagctatgtc caagcgcaaa atcaaagaag agatgctcca ggtcatcgcg 16741 ccggagatct atggcccccc gaagaaggaa gagcaggatt acaagccccg aaagctaaag 16801 cgggtcaaaa agaaaaagaa agatgatgat gatgaacttg acgacgaggt ggaactgctg 16861 cacgctaccg cgcccaggcg acgggtacag tggaaaggtc gacgcgtaaa acgtgttttg 16921 cgacccggca ccaccgtagt ctttacgccc ggtgagcgct ccacccgcac ctacaagcgc 16981 gtgtatgatg aggtgtacgg cgacgaggac ctgcttgagc aggccaacga gcgcctcggg 17041 gagtttgcct acggaaagcg gcataaggac atgctggcgt tgccgctgga cgagggcaac 17101 ccaacaccta gcctaaagcc cgtaacactg cagcaggtgc tgcccgcgct tgcaccgtcc 17161 gaagaaaagc gcggcctaaa gcgcgagtct ggtgacttgg cacccaccgt gcagctgatg 17221 gtacccaagc gccagcgact ggaagatgtc ttggaaaaaa tgaccgtgga acctgggctg 17281 gagcccgagg tccgcgtgcg gccaatcaag caggtggcgc cgggactggg cgtgcagacc 17341 gtggacgttc agatacccac taccagtagc accagtattg ccaccgccac agagggcatg 17401 gagacacaaa cgtccccggt tgcctcagcg gtggcggatg ccgcggtgca ggcggtcgct 17461 gcggccgcgt ccaagacctc tacggaggtg caaacggacc cgtggatgtt tcgcgtttca 17521 gccccccggc gcccgcgcgg ttcgaggaag tacggcgccg ccagcgcgct actgcccgaa 17581 tatgccctac atccttccat tgcgcctacc cccggctatc gtggctacac ctaccgcccc 17641 agaagacgag càactacccg acgccgaacc accactggaa cccgccgccg ccgtcgccgt 17701 cgccagcccg tgctggcccc gatttccgtg cgcagggtgg ctcgcgaagg aggcaggacc 17761 ctggtgctgc caacagcgcg ctaccacccc agcatcgttt aaaagccggt ctttgtggtt 17821 cttgcagata tggccctcac ctgccgcctc cgtttcccgg tgccgggatt ccgaggaaga 17881 atgcaccgta ggaggggcat ggccggccac ggcctgacgg gcggcatgcg tcgtgcgcac 17941 caccggcggc ggcgcgcgtc gcaccgtcgc atgcgcggcg gtatcctgcc cctccttatt 18001 ccactgatcg ccgcggcgat tggcgccgtg cccggaattg catccgtggc cttgcaggcg 18061 cagagacact gattaaaaac aagttgcatg tggaaaaatc aaaataaaaa gtctggactc 18121 tcacgctcgc ttggtcctgt aactattttg tagaatggaa gacatcaact ttgcgtctct 18181 ggccccgcga cacggctcgc gcccgttcat gggaaactgg caagatatcg gcaccagcaa 18241 tatgagcggt ggcgccttca gctggggctc gctgtggagc ggcattaaaa atttcggttc 18301 caccgttaag aactatggca gcaaggcctg gaacagcagc acaggccaga tgctgaggga 18361 taagttgaaa gagcaaaatt tccaacaaaa ggtggtagat ggcctggcct ctggcattag 18421 cggggtggtg gacctggcca accaggcagt gcaaaataag attaacagta agcttgatcc 18481 ccgccctccc gtagaggagc ctccaccggc cgtggagaca gtgtctccag aggggcgtgg 18541 cgaaaagcgt ccgcgccccg acagggaaga aactctggtg acgcaaatag'acgagcctcc 18601 ctcgtacgag gaggcactaa agcaaggcct gcccaccacc cgtcccatcg cgcccatggc 18661 taccggagtg ctgggccagc acacacccgt aacgctggac ctgcctcccc ccgccgacac 18721 ccagcagaaa cctgtgctgc caggcccgac cgccgttgtt gtaacccgtc ctagccgcgc 18781 gtccctgcgc cgcgccgcca gcggtccgcg atcgttgcgg cccgtagcca gtggcaactg 18841 gcaaagcaca ctgaacagca tcgtgggtct gggggtgcaa tccctgaagc gccgacgatg 18901 cttctgaata gctaacgtgt cgtatgtgtg tcatgtatgc gtccatgtcg ccgccagagg 18961 agctgctgag ccgccgcgcg cccgctttcc aagatggcta ccccttcgat gatgccgcag 19021 tggtcttaca tgcacatctc gggccaggac gcctcggagt acctgagccc cgggctggtg 19081 cagtttgccc gcgccaccga gacgtacttc agcctgaata acaagtttag aaaccccacg 19141 gtggcgccta cgcacgacgt gaccacagac cggtcccagc gtttgacgct gcggttcatc 19201 cctgtggacc gtgaggatac tgcgtactcg tacaaggcgc ggttcaccct agctgtgggt 19261 gataaccgtg tgctggacat ggcttccacg tactttgaca tccgcggcgt gctggacagg 19321 ggccctactt ttaagcccta ctctggcact gcctacaacg ccctggctcc caagggtgcc 19381 ccaaatcctt gcgaatggga tgaagctgct actgctcttg aaataaacct agaagaagag 19441 gacgatgaca acgaagacga agtagacgag caagctgagc agcaaaaaac tcacgtattt • 19501 gggcaggcgc cttattctgg tataaatatt acaaaggagg gtattcaaat aggtgtcgaa 19561 ggtcaaacac ctaaatatgc cgataaaaca tttcaacctg aacctcaaat aggagaatct 19621 cagtggtacg aaactgaaat taatcatgca gctgggagag tccttaaaaa gactacccca 19681 atgaaaccat gttacggttc atatgcaaaa cccacaaatg aaaatggagg gcaaggcatt 19741 cttgtaaagc aacaaaatgg aaagctagaa agtcaagtgg aaatgcaatt tttctcaact 19801 actgaggcga ccgcaggcaa tggtgataac ttgactccta aagtggtatt gtacagtgaa 19861 gatgtagata tagaaacccc aga'cactcat atttcttaca tgcccactat taaggaaggt 19921 aactcacgag aactaatggg ccaacaatct atgcccaaca ggcctaatta cattgctttt 19981 agggacaatt ttattggtct aatgtattac aacagcacgg gtaatatggg tgttctggcg 20041 ggccaagcat cgcagttgaa tgctgttgta gatttgcaag acagaaacac agagctttca 20101 taccagcttt tgcttgattc cattggtgat agaaccaggt acttttctat gtggaatcag 20161 gctgttgaca gctatgatcc agatgttaga attattgaaa atcatggaac tgaagatgaa 20221 cttccaaatt actgctttcc actgggaggt gtgattaata cagagactct taccaaggta 20281 aaacctaaaa caggtcagga aaatggatgg gaaaaagatg ctacagaatt ttcagataaa 20341 aatgaaataa gagttggaaa taattttgcc atggaaatca atctaaatgc caacctgtgg 20401 agaaatttcc tgtactccaa catagcgctg tatttgcccg acaagctaaa gtacagtcct 20461 tccaacgtaa aaatttctga taacccaaac acctacgact acatgaacaa gcgagtggtg 20521 gctcccgggt tagtggactg ctacattaac cttggagcac gctggtccct tgactatatg 20581 gacaacgtca acccatttaa ccaccaccgc aatgctggcc tgcgctaccg ctcaatgttg 20641 ctgggcaatg gtcgctatgt gcccttccac atccaggtgc ctcagaagtt ctttgccatt 20701 aaaaacctcc ttctcctgcc gggctcatac acctacgagt ggaacttcag gaaggatgtt 20761 aacatggttc tgcagagctc cctaggaaat gacctaaggg ttgacggagc cagcattaag 20821 tttgatagca tttgccttta cgccaccttc ttccccatgg cccacaacac cgcctccacg 20881 cttgaggcca tgcttagaaa cgacaccaac gaccagtcct ttaacgacta tctctccgcc 20941 gccaacatgc tctaccctat acccgccaac gctaccaacg tgcccatatc catcccctcc 21001 cgcaactggg cggctttccg cggctgggcc ttcacgcgcc ttaagactaa ggaaacccca 21061 tcactgggct cgggctacga cccttattac acctactctg gctctatacc ctacctagat 21121 ggaacctttt acctcaacca cacctttaag aaggtggcca ttacctttga ctcttctgtc 21181 agctggcctg gcaatgaccg cctgcttacc cccaacgagt ttgaaattaa gcgctcagtt 21241 gacggggagg gttacaacgt tgcccagtgt aacatgacca aagactggtt cctggtacaa 21301 atgctagcta actacaacat tggctaccag ggcttctata tcccagagag ctacaaggac 21361 cgcatgtact ccttctttag aaacttccag cccatgagcc gtcaggtggt ggatgatact 21421 aaatacaagg actaccaaca ggtgggcatc ctacaccaac acaacaactc tggatttgtt 21481 ggctaccttg cccccaccat gcgcgaagga caggcctacc ctgctaactt cccctatccg 21541 cttataggca agaccgcagt tgacagcatt acccagaaaa agtttctttg cgatcgcacc 21601 ctttggcgca tcccattctc cagtaacttt atgtccatgg gcgcactcac agacctgggc 21661 caaaaccttc tctacgccaa ctccgcccac gcgctagaca tgacttttga ggtggatccc 21721 atggacgagc ccacccttct ttatgttttg tttgaagtct ttgacgtggt ccgtgtgcac 21781 cggccgcacc gcggcgtcat cgaaaccgtg tacctgcgca cgcccttctc ggccggcaac 21841 gccacaacat aaagaagcaa gcaacatcaa caacagctgc cgccatgggc tccagtgagc 21901 aggaactgaa agccattgtc aaagatcttg gttgtgggcc atattttttg ggcacctatg 21961 acaagcgctt tccaggcttt gtttctccac acaagctcgc ctgcgccata gtcaatacgg 22021 ccggtcgcga gactgggggc gtacactgga tggcctttgc ctggaacccg cactcaaaaa 22081 catgctacct ctttgagccc tttggctttt ctgaccagcg actcaagcag gtttaccagt 22141 ttgagtacga gtcactcctg cgccgtagcg ccattgcttc ttcccccgac cgctgtataa 22201 cgctggaaaa gtccacccaa agcgtacagg ggcccaactc ggccgcctgt ggactattct 22261 gctgcatgtt tctccacgcc tttgccaact ggccccaaac tcccatggat cacaacccca 22321 ccatgaacct tattaccggg gtacccaact ccatgctcaa cagtccccag gtacagccca 22381 ccctgcgtcg caaccaggaa cagctctaca gcttcctgga gcgccactcg ccctacttcc 22441 gcagccacag tgcgcagatt aggagcgcca cttctttttg tcacttgaaa aacatgtaaa 22501 aataatgtac tagagacact ttcaataaag gcaaatgctt ttatttgtac actctcgggt 22561 gattatttac ccccaccctt gccgtctgcg ccgtttaaaa atcaaagggg ttctgccgcg · 22621 catcgctatg cgccactggc agggacacgt tgcgatactg gtgtttagtg ctccacttaa 22681 actcaggcac aaccatccgc ggcagctcgg tgaagttttc actccacagg ctgcgcàcca 22741 tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa gtcgcagttg gggcctccgc 22801 cctgcgcgcg cgagttgcga tacaçagggt tgcagcactg gaacactatc agcgccgggt 22861 ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc cgcgtccagg tcctccgcgt 22921 tgctcagggc gaacggagtc aactttggta gctgccttcc caaaaagggc gcgtgcccag 22981 gctttgagtt gcactcgcac cgtagtggca tcaaaaggtg accgtgcccg gtctgggcgt 23041 taggatacag cgcctgcata aaagccttga tctgcttaaa agccacctga gcctttgcgc 23101 cttcagagaa gaacatgccg caagacttgc cggaaaactg attggccgga caggccgcgt 23161 cgtgcacgca gcaccttgcg tcggtgttgg agatctgcac cacatttcgg ccccaccggt 23221 tcttcacgat cttggccttg ctagactgct ccttcagcgc gcgctgcccg ttttcgctcg 23281 tcacatccat ttcaatcacg tgctccttat ttatcataat gcttccgtgt agacacttaa 23341 gctcgccttc gatctcagcg cagcggtgca gccacaacgc gcagcccgtg ggctcgtgat 23401 gcttgtaggt cacctctgca aacgactgca ggtacgcctg caggaatcgc cccatcatcg 23461 tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc gcggtgctcc tcgttcagcc 23521 aggtcttgca tacggccgcc agagcttcca cttggtcagg cagtagtttg aagttcgcct 23581 ttagatcgtt atccacgtgg tacttgtcca tcagcgcgcg cgcagcctcc atgcccttct 23641 cccacgcaga cacgatcggc acactcagcg ggttcatcac cgtaatttca ctttccgctt 23701 cgctgggctc ttcctcttcc tcttgcgtcc gcataccacg cgccactggg tcgtcttcat 23761 tcagccgccg cactgtgcgc ttacctcctt tgccatgctt gattagcacc ggtgggttgc 23821 tgaaacccac catttgtagc gccacatctt ctctttcttc ctcgctgtcc acgattacct 23881 ctggtgatgg cgggcgctcg ggcttgggag aagggcgctt ctttttcttc ttgggcgcaa 23941 tggccaaatc cgccgccgag gtcgatggcc gcgggctggg tgtgcgcggc accagcgcgt 24001 cttgtgatga gtcttcctcg tcctcggact cgatacgccg cctcatccgc ttttttgggg 24061 gcgcccgggg aggcggcggc gacggggacg gggacgacac gtcctccatg gttgggggac 24121 gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg ctgctcctct tcccgactgg 24181 ccatttcctt ctcctatagg cagaaaaaga tcatggagtc agtcgagaag aaggacagcc 24241 taaccgcccc ctctgagttc gccaccaccg cctccaccga tgccgccaac gcgcctacca 24301 ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt gattatcgag caggacccag 24361 gttttgtaag cgaagacgac gaggaccgct cagtaccaac agaggataaa aagcaagacc 24421 aggacaacgc agaggcaaac gaggaacaag tcgggcgggg ggacgaaagg catggcgact 24481 acctagatgt gggagacgac gtgctgttga agcatctgca gcgccagtgc gccattatct 24541 gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat agcggatgtc agccttgcct 24601 acgaacgcca cctattctca ccgcgcgtac cccccaaacg ccaagaaaac ggcacatgcg 24661 agcccaaccc gcgcctcaac ttctaccccg tatttgccgt gccagaggtg cttgccacct 24721 atcacatctt tttccaaaac tgcaagatac ccctatcctg ccgtgccaac cgcagccgag 24781 cggacaagca gctggccttg cggcagggcg ctgtcatacc tgatatcgcc tcgctcaacg 24841 aagtgccaaa aatctttgag ggtcttggac gcgacgagaa gcgcgcggca aacgctctgc 24901 aacaggaaaa cagcgaaaat gaaagtcact ctggagtgtt ggtggaactc gagggtgaca 24961 acgcgcgcct agccgtacta aaacgcagca tcgaggtcac ccactttgcc tacccggcac 25021 ttaacctacc ccccaaggtc atgagcacag tcatgagtga gctgatcgtg cgccgtgcgc 25081 agcccctgga gagggatgca aatttgcaag aacaaacaga ggagggccta cccgcagttg 25141 gcgacgagca gctagcgcgc tggcttcaaa cgcgcgagcc tgccgacttg gaggagcgac 25201 gcaaactaat gatggccgca gtgctcgtta ccgtggagct tgagtgcatg cagcggttct 25261 ttgctgaccc ggagatgcag' cgcaagctag aggaaacatt gcactacacc tttcgacagg 25321 gctacgtacg ccaggcctgc aagatctcca acgtggagct ctgcaacctg gtctcctacc 25381 ttggaatttt gcacgaaaac cgccttgggc aaaacgtgct tcattccacg ctcaagggcg 25441 aggcgcgccg cgactacgtc cgcgactgcg tttacttatt tctatgctac acctggcaga 25501 cggccatggg cgtttggcag cagtgcttgg aggagtgcaa cctcaaggag ctgcagaaac 25561 tgctaaagca aaacttgaag gacctatgga cggccttcaa cgagcgctcc gtggccgcgc 25621 acctggcgga catcattttc cccgaacgcc tgcttaaaac cctgcaacag ggtctgccag 25681 acttcaccag tcaaagcatg ttgcagaact ttaggaactt tatcctagag cgctcaggaa 25741 tcttgcccgc cacctgctgt gcacttccta gcgactttgt gcccattaag taccgcgaat 25801 gccctccgcc gctttggggc cactgctacc ttctgcagct agccaactac cttgcctacc 25861 actctgacat aatggaagac gtgagcggtg acggtctact ggagtgtcac tgtcgctgca 25921 acctatgcac cccgcaccgc tccctggttt gcaattcgca gctgcttaac gaaagtcaaa 25981 ttatcggtac ctttgagctg cagggtccct cgcctgacga aaagtccgcg gctccggggt 26041 tgaaactcac tccggggctg tggacgtcgg cttaccttcg caaatttgta cctgaggact 26101 accacgccca cgagattagg ttctacgaag accaatcccg cccgccaaat gcggagctta 26161 ccgcctgcgt cattacccag ggccacattc ttggccaatt gcaagccatc aacaaagccc 26221 gccaagagtt tctgctacga aagggacggg gggtttactt ggacccccag tccggcgagg 26281 agctcaaccc aatccccccg ccgccgcagc cctatcagca gcagccgcgg gcccttgctt 26341 cccaggatgg cacccaaaaa gaagctgcag ctgccgccgc cacccacgga cgaggaggaa 26401 tactgggaca gtcaggcaga ggaggttttg gacgaggagg aggaggacat gatggaagac 26461 tgggagagcc tagacgagga agcttccgag gtcgaagagg tgtcagacga aacaccgtca 26521 ccctcggtcg cattcccctc gccggcgccc cagaaatcgg caaccggttc cagcatggct 26581 acaacctccg ctcctcaggc gccgccggca ctgcccgttc gccgacccaa ccgtagatgg 26641 gacaccactg gaaccagggc cggtaagtcc aagcagccgc cgccgttagc ccaagagcaa 26701 caacagcgcc aaggctaccg ctcatggcgc gggcacaaga acgccatagt tgcttgcttg 26761 caagactgtg ggggcaacat ctccttcgcc cgccgctttc ttctctacca tcacggcgtg 26821 gccttccccc gtaacatcct gcattactac cgtcatctct acagcccata ctgcaccggc 26881 ggcagcggca gcggcagcaa cagcagcggc cacacagaag caaaggcgac cggatagcaa 26941 gactctgaca aagcccaaga aatccacagc ggcggcagca gcaggaggag gagcgctgcg 27001 tctggcgccc aacgaacccg tatcgacccg cgagcttaga aacaggattt ttcccactct 27061 gtatgctata tttcaacaga gcaggggcca agaacaagag ctgaaaataa aaaacaggtc 27121 tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc gaagatcagc ttcggcgcac 27181 gctggaagac gcggaggctc tcttcagtaa atactgcgcg ctgactctta aggactagtt 27241 tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat ctccagcggc cacacccggc 27301 gccagcacct gtcgtcagcg ccattatgag caaggaaatt cccacgccct acatgtggag 27361 ttaccagcca caaatgggac ttgcggctgg agctgcccaa gactactcaa cccgaataaa 27421 ctacatgagc gcgggacccc acatgatatc ccgggtcaac ggaatccgcg cccaccgaaa 27481 ccgaattctc ttggaacagg cggctattac caccacacct cgtaataacc ttaatccccg 27541 tagttggccc gctgccctgg tgtaccagga aagtcccgct cccaccactg tggtacttcc 27601 cagagacgcc caggccgaag ttcagatgac taactcaggg gcgcagcttg cgggcggctt 27661 tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac ctgacaatca gagggcgagg 27721 tattcagctc aacgacgagt cggtgagctc ctcgcttggt ctccgtccgg acgggacatt 27781 tcagatcggc ggcgccggcc gtccttcatt cacgcctcgt caggcaatcc taactctgca 27841 gacctcgtcc tctgagccgc gctctggagg cattggaact ctgcaattta ttgaggagtt 27901 tgtgccatcg gtctacttta accccttctc gggacctccc ggccactatc cggatcaatt 27961 tattcctaac tttgacgcgg taaaggactc ggcggacggc tacgactgaa tgttaagtgg 28021 agaggcagag caactgcgcc tgaaacacct ggtccactgt cgccgccaca agtgctttgc 28081 ccgcgactcc ggtgagtttt gctactttga attgcccgag gatcatatcg agggcccggc 28141 gcacggcgtc cggcttaccg cccagggaga gcttgcccgt agcctgattc gggagtttac 28201 ccagcgcccc ctgctagttg agcgggacag gggaccctgt gttctcactg tgatttgcaa 28261 ctgtcctaac cttggattac atcaagatcc tctagttata actagagtac ccggggatct 28321 tattcccttt aactaataaa aaaaaataat aaagcatcac ttacttaaaa tcagttagca 28381 aatttctgtc cagtttattc agcagcacct ccttgccctc ctcccagctc tggtattgca 28441 gcttcctcct ggctgcaaac tttctccaca atctaaatgg aatgtcagtt tcctcctgtt 28501 cctgtccatc cgcacccact atcttcatgt tgttgcagat gaagcgcgca agaccgtctg 28561 aagatacctt caaccccgtg tatccatatg acacggaaac cggtcctcca actgtgcctt 28621 ttcttactcc tccctttgta tcccccaatg ggtttcaaga gagtccccct ggggtactct 28681 ctttgcgcct atccgaacct ctagttacct ccaatggcat gcttgcgctc aaaatgggca 28741 acggcctctc tctggacgag gccggcaacc ttacctccca aaatgtaacc actgtgagcc 28801 cacctctcaa aaaaaccaag tcaaacataa acctggaaat atctgcaccc ctcacagtta 28861 cctcagaagc cctaactgtg gctgccgccg cacctctaat ggtcgcgggc aacacactca 28921 ccatgcaatc acaggccccg ctaaccgtgc acgactccaa acttagcatt gccacccaag 28981 gacccctcac agtgtcagaa ggaaagctag ccctgcaaac atcaggcccc ctcaccacca 29041 ccgatagcag tacccttact atcactgcct caccccctct aactactgcc actggtagct 29101 tgggcattga cttgaaagag cccatttata cacaaaatgg aaaactagga ctaaagtacg 29161 gggctccttt gcatgtaaca gacgacctaa acactttgac cgtagcaact ggtccaggtg 29221 tgactattaa taatacttcc ttgcaaacta aagttactgg agccttgggt tttgattcac 29281 aaggcaatat gcaacttaat gtagcaggag gactaaggat tgattctcaa aacagacgcc 29341 ttatacttga tgttagttat ccgtttgatg ctcaaaacca actaaatcta agactaggac 29401 agggccctct ttttataaac tcagcccaca acttggatat taactacaac aaaggccttt 29461 acttgtttac agcttcaaaç aattccaaaa agcttgaggt taacctaagc actgccaagg 29521 ggttgatgtt tgacgctaca gccatagcca ttaatgcagg agatgggctt gaatttggtt 29581 cacctaatgc accaaacaca aatcccctca aaacaaaaat tggccatggc ctagaatttg 29641 attcaaacaa ggctatggtt cctaaactag gaactggcct tagttttgac agcacaggtg 29701 ccattacagt aggaaacaaa aataatgata agctaacttt gtggaccaca ccagctccat 29761 ctcctaactg tagactaaat gcagagaaag atgctaaact cactttggtc ttaacaaaat 29821 gtggcagtca aatacttgct acagtttcag ttttggctgt taaaggcagt ttggctccaa 29881 tatctggaac agttcaaagt gctcatctta ttataagatt tgacgaaaat ggagtgctac 29941 taaacaattc cttcctggac ccagaatatt ggaactttag aaatggagat cttactgaag 30001 gcacagccta tacaaacgct gttggattta tgcctaacct atcagcttat ccaaaatctc 30061 acggtaaaac.tgccaaaagt aacattgtca gtcaagttta cttaaacgga gacaaaacta 30121 aacctgtaac actaaccatt acactaaacg gtacacagga aacaggagac acaactccaa 30181 gtgcatactc tatgtcattt tcatgggact ggtctggcca caactacatt aatgaaatat 30241 ttgccacatc ctcttacact ttttcataca ttgcccaaga ataaagaatc gtttgtgtta 30301 tgtttcaacg tgtttatttt tcaattgcag aaaatttcaa gtcatttttc attcagtagt 30361 atagccccac caccacatag cttatacaga tcaccgtacc ttaatcaaac tcacagaacc 30421 ctagtattca acctgccacc tccctcccaa cacacagagt acacagtcct ttctccccgg 30481 ctggccttaa aaagcatcat atcatgggta acagacatat tcttaggtgt tatattccac 30541 acggtttcct gtcgagccaa acgctcatca gtgatattaa taaactcccc gggcagctca 30601 cttaagttca tgtcgctgtc cagctgctga gccacaggct gctgtccaac ttgcggttgc 30661 ttaacgggcg gcgaaggaga agtccacgcc tacatggggg tagagtcata atcgtgcatc 30721 aggatagggc ggtggtgctg cagcagcgcg cgaataaact gctgccgccg ccgctccgtc 30781 ctgcaggaat acaacatggc agtggtctcc tcagcgatga ttcgcaccgc ccgcagcata 30841 aggcgccttg tcctccgggc acagcagcgc accctgatct cacttaaatc agcacagtaa 30901 ctgcagcaca gcaccacaat attgttcaaa atcccacagt gcaaggcgct gtatccaaag 30961 ctcatggcgg ggaccacaga acccacgtgg ccatcatacc acaagcgcag gtagattaag 31021 tggcgacccc tcataaacac gctggacata aacattacct cttttggcat gttgtaattc 31081 accacctccc ggtaccatat aaacctctga ttaaacatgg cgccatccac caccatccta 31141 aaccagctgg ccaaaacctg cccgccggct atacactgca gggaaccggg actggaacaa 31201 tgacagtgga gagcccagga ctcgtaacca tggatcatca tgctcgtcat gatatcaatg 31261 ttggcacaac acaggcacac gtgcatacac ttcctcagga ttacaagctc ctcccgcgtt 31321 agaaccatat cccagggaac aacccattcc tgaatcagcg taaatcccac actgcâggga 31381 agacctcgca cgtaactcac gttgtgcatt gtcaaagtgt tacattcggg cagcagcgga 31441 tgatcctcca gtatggtagc gcgggtttct gtctcaaaag gaggtagacg atccctactg 31501 tacggagtgc gccgagacaa ccgagatcgt gttggtcgta gtgtcatgcc aaatggaacg 31561 ccggacgtag tcatatttcc tgaagcaaaa ccaggtgcgg gcgtgacaaa cagatctgcg 31621 tctccggtct cgccgcttag atcgctctgt gtagtagttg tagtatatcc actctctcaa 31681 agcatccagg cgccccctgg cttcgggttc tatgtaaact ccttcatgcg ccgctgccct 31741 gataacatcc accaccgcag aataagccac acccagccaa cctacacatt cgttctgcga 31801 gtcacacacg ggaggagcgg gaagagctgg aagaaccatg tttttttttt tattccaaaa 31861 gattatccaa aacctcaaaa tgaagatcta ttaagtgaac gcgctcccct ccggtggcgt 31921 ggtcaaactc tacagccaaa gaacagataa tggcatttgt aagatgttgc acaatggctt 31981 ccaaaaggca aacggccctc acgtccaagt ggacgtaaag gctaaaccct tcagggtgaa 32041 tctcctctat aaacattcca gcaccttcaa ccatgcccaa ataattctca tctcgccacc 32101 ttctcaatat atctctaagc aaatcccgaa tattaagtcc ggccattgta aaaatctgct 32161 ccagagcgcc ctccaccttc agcctcaagc agcgaatcat gattgcaaaa attcaggttc 32221 ctcacagacc tgtataagat tcaaaagcgg aacattaaca aaaataccgc gatcccgtag 32281 gtcccttcgc agggccagct gaacataatc gtgcaggtct gcacggacca gcgcggccac 32341 ttccccgcca ggaaccttga caaaagaacc cacactgatt atgacacgca tactcggagc 32401 tatgctaacc agcgtagccc cgatgtaagc tttgttgcat gggcggcgat ataaaatgca 32461 aggtgctgct caaaaaatca ggcaaagcct cgcgcaaaaa agaaagcaca tcgtagtcat 32521 gctcatgcag ataaaggcag gtaagctccg gaaccaccac agaaaaagac accatttttc 32581 tctcaaacat gtctgcgggt ttctgcataa acacaaaata aaataacaaa aaaacattta 32641 aacattagaa gcctgtctta caacaggaaa aacaaccctt ataagcataa gacggactac 32701 ggccatgccg gcgtgaccgt aaaaaaactg gtcaccgtga ttaaaaagca ccaccgacag 32761 ctcctcggtc atgtccggag tcataatgta agactcggta aacacatcag gttgattcat 32821 cggtcagtgc taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag 32881 acaacattac agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa 32941 cacctgaaaa accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca 33001 gcgcttcaca gcggcagcct aacagtcagc cttaccagta aaaaagaaaa cctattaaaa 33061 aaacaccact cgacacggca ccagctcaat cagtcacagt gtaaaaaagg gccaagtgca 33121 gagcgagtat atataggact aaaaaatgac gtaacggtta aagtccacaa aaaacaccca 33181 gaaaaccgca cgcgaaccta cgcccagaaa cgaaagccaa aaaacccaca acttcctcaa 33241 atcgtcactt ccgttttccc acgttacgta acttcccatt ttaagaaaac tacaattccc 33301 aacacataca agttactccg ccctaaaacc tacgtcaôcc gccccgttcc cacgccccgc 33361 gccacgtcac aaactccacc ccctcattat catattggct tcaatccaaa ataaggtata 33421 ttattgatga tnnnnnttaa t

Claims

REIVINDICAÇÕES

1. Vetor de expressão adenovírico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de recetor de tipo toll 3 (TLR-3), em que o agonista de TLR-3 é ARNcd heterólogo e em que o ácido nucleico que codifica para o agonista de TLR-3 compreende uma sequência selecionada do grupo que consiste em: SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 e 12; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico.
2. Vetor de expressão adenovírico quimérico da reivindicação 1, em que o primeiro promotor e o segundo promotor são o mesmo, opcionalmente em que o primeiro promotor e o segundo promotor são, cada qual, um promotor de CMV.
3. Composição imunogénica compreendendo o vetor de expressão de qualquer uma das reivindicações anteriores e um transportador farmaceuticamente aceitável.
4. Vetor de expressão adenovírico quimérico, o referido vetor compreendendo uma cassete de expressão compreendendo os seguintes elementos: (a) um primeiro promotor ligado operacionalmente a um ácido nucleico que codifica para um agonista de recetor de tipo toll 3 (TLR-3) , em que o agonista de TLR-3 é ARNcd heterólogo; e (b) um segundo promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico para utilização num método de tratamento que desencadeia uma resposta imunitária, o referido método compreendendo administrar uma quantidade imunogenicamente eficaz do vetor a um indivíduo mamífero, tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e via mucosa, tal como vaginal.
5. Vetor para a utilização da reivindicação 4, em que o polipéptido heterólogo é expresso numa célula selecionada do grupo que consiste em uma célula dendrítica, uma célula de micropregas (célula M) e uma célula epitelial intestinal.
6. Vetor da reivindicação 1, em que o ARNcd heterólogo é ARN em gancho de cabelo curto (ARNgc).
7. Composição imunogénica, a referida composição compreendendo: (a) um vetor de expressão adenovírico quimérico compreendendo um promotor ligado operacionalmente a um ácido nucleico que codifica para um polipéptido heterólogo imunogénico; (b) um agonista de TLR-3, em que o agonista de TLR-3 é ARNcd heterólogo; e (c) um transportador farmaceuticamente aceitável; para utilização num método de tratamento que desencadeia uma resposta imunitária, o referido método compreendendo administrar uma quantidade imunogenicamente eficaz da composição a um indivíduo mamífero, tal como um ser humano, em que a resposta imunitária é dirigida contra o polipéptido heterólogo e em que a via de administração é selecionada do grupo que consiste em oral, intranasal e via mucosa, tal como vaginal.
8. Composição para a utilização da reivindicação 7, em que o promotor é um promotor de CMV.
9. Composição para a utilização da reivindicação 7, em que o agonista de TLR-3 é um ácido nucleico compreendendo uma sequência selecionada do grupo que consiste em SEQ ID NO: 3, 4, 5, 8, 9, 10, 11 e 12.
10. Composição para a utilização da reivindicação 7, em que o polipéptido heterólogo é expresso numa célula selecionada do grupo que consiste em uma célula dendrítica, uma célula de micropregas (célula M) e uma célula epitelial intestinal.
11. Composição para a utilização da reivindicação 7, em que o ARNcd heterólogo é ARN em gancho de cabelo curto (ARNgc).
12. Vetor da reivindicação 1, vetor para a utilização da reivindicação 4 ou composição para a utilização da reivindicação 7, em que o polipéptido heterólogo é: (a) um polipéptido env de HIV, tal como um polipéptido selecionado do grupo que consiste em gp41, gpl20 e gpl60; (b) um polipéptido HA de influenza; (c) um antigénio de vírus de herpes simplex (HSV); ou (d) um antigénio de papilomavírus humano (HPV).