BRPI0616894A2

BRPI0616894A2 - proteìnas da seda

Info

Publication number: BRPI0616894A2
Application number: BRPI0616894-9A
Authority: BR
Inventors: D. Sutherland Tara; S. Haritos Victoria; Trueman Holly; Sriskantha Alagacone; Weisman Sarah; M. Campbell Peter
Original assignee: Commonwealth Scientific And Industrial Research Organisation
Priority date: 2005-10-05
Filing date: 2006-10-04
Publication date: 2011-07-05
Also published as: ES2403733T3; HK1119718A1; US8481681B2; RU2008117631A; NZ567202A; US20210094989A1; DK1931702T3; BRPI0616894B1; CN101321777A; EP1931702A4; JP2015002746A; JP2009509550A; CN101321777B; CA2624667C; BRPI0616894B8; EP1931702A1; JP5748392B2; RU2467015C2; ZA200803178B; US20170051025A1

Abstract

PROTEìNAS DA SEDA. A presente invenção provê proteínas da seda, bem como ácidos nucléicos que codificam essas proteínas. A presente invenção também provê células recombinantes e/ou organismos que sintetizam proteínas da seda. Proteínas da seda da invenção podem ser utilizadas para uma variedade de finalidades como na fabricação de produtos de higiene pessoal, plásticos, artigos têxteis e produtos biomédicos.

Description

PROTEÍNAS DA SEDA

Campo da invenção

A presente invenção refere-se a proteínas da seda, bemcomo a ácidos nucléicos que codificam tais proteínas. Apresente invenção também se refere a células recombinantese/ou organismos que sintetizam proteínas da seda. Proteínasda seda da invenção podem ser utilizadas para uma variedadede finalidades como na produção de produtos de higienepessoal, plásticos, artigos têxteis e produtos biomédicos.

Antecedentes da invenção

Sedas são secreções de proteína fibrosa que apresentamresistência e tenacidade excepcionais e como tal têm sido oalvo de extenso estudo. Sedas são produzidas por mais de30.000 espécies de aranhas e por muitos insetos. Umaquantidade bem pequena dessas sedas tem sido caracterizada,com a maior parte da pesquisa se concentrando em seda decasulo do bicho-da-seda domestiçado, Bombyx mori e na sedade linha de arrasto da aranha de tecedura redonda Nephilaclavipes.

Em Lepidóptera e em aranha, os genes de seda def ibroí^na codificam para proteínas que são genericamentegrandes com domínios de terminal hidrofílicos predominantesem qualquer extremidade cobrindo uma região extensa deblocos hidrofóbicos e hidrofílicos alternados (Bini eoutros; 2004). Genericamente, essas proteínas compreendemdiferentes combinações de conjuntos cristalinos de folhasβ-pregueadas associadas de forma solta a folhas-β,espirais-pm hélices-α e regiões amorfas (vide Craig eRiekel, 2002 para exame).

Como fibras de seda representam algumas das fibrasnaturais mais fortes conhecidas, têm sido submetidas àextensa pesquisa em tentativas para reproduzir sua síntese.Entretanto, um problema recorrente com expressão de genesde fibroína de aranha e Lepidópteras tem sido baixas taxasde expressão em vários sistemas de expressão recombinantedevido ã combinação dos motivos de nucleotídeo de repetiçãono gene de seda que levam a eventos de recombinaçãoprejudiciais, tamanho grande, .gene e número pequeno decódons utilizados para cada aminoácido no gene que leva àdepleção de reuniões de tRNA nas células hospedeiras.

Expressão recombinante leva a dificuldades durantetranslação como pausas traducionais como resultado depreferências de códon e demandas de códon e taxas derecombinação extensas que levam a truncamento dos genes.Seqüências menos repetitivas e mais curtas evitariam váriosdos problemas associados à expressão de gene de seda até apresente data.

Em contraste com o conhecimento extenso que acumulousobre Lepidópteras (em particular a seda de casulo deBombyx mori) e aranha (em particular a seda de linha dearrasto de Nephila clavipes) pouco se sabe sobre acomposição química e organização molecular de outras sedasde insetos.

No início da década de 60, a seda de himenópteroaculeado foi mostrada como tendo uma estrutura alfa-helicoidal por padrões de difração de raios X obtidos apartir de fibras de seda tiradas da glândula salivar deabelha de mel de larva (Rudall, 1962) . Além de demonstrarque essa seda era helicoidal, os padrões obtidos foramindicativos de um sistema de de espiral enrolada de cadeiasalfa-helicoidal (Altkins, 1967). Padrões de difração deraios X similares foram obtidos para sedas de casulo apartir de outras espécies ,Aculeadas incluindo a vespaPseudopompilus humbolti (Rudall, 1962) e abelhão, Bombuslucorum (Lucas e Rudall, 1967) .

Em contraste com a estrutura alfa-helicoidal descritanas sedas Aculeadas, as sedas caracterizadas a partir de umclade relacionado à aculeada, Ichneumonoidea, têmestruturas β-paralelas. Diagramas de raios X para quatroexemplos dessa estrutura foram descritos em Braconidae(Cotesia (=Apenteles) glomerate; Cotesia (=Apenteles)gonopterygis; Apenteses bignelli) e três em Ichneumonidae(Dusona sp.; Phytodietris sp.; Branchus femoralis) (Lucas eRudall, 1967) . Além da seqüência de uma única seda deBranconidade (Cotesia glomerate) foi descrita (número deacessão de banco de dados Genbank AB1S86S0; Yamada eoutros; 2004). Essa seqüência de proteína parcial consisteem uma repetição de X-asparagina 28, altamente conservada(onde X é alanina ou serina) e "não é predita como contendorepetições heptavalentes contendo espiral enrolada. Análiseextensa da composição de aminoácido das sedas de casulo daBraconidae mostrou que as sedas a partir da subfamíliaMicrogastrinae são exclusivas em seu teor elevado deasparagina e serina (Lucas e outros; 1960; Quicke e outros;2004) . Subfamilias relacionadas produzem sedas comcomposições de aminoácido significativamente diferentessugerindo que as sedas Microgastrinae se desenvolveramespecificamente nessa subfamília (Yamada e outros, 2004) . OcDNA parcial de Cotesia glomerata foi isolado utilizandoiniciadores PCR designados a partir da seqüência obtida depeptídeos internos derivados de proteínas da seda de casuloisoladas. A composição de aminoácidos predita dessaseqüência parcial lembra de perto a composição deaminoácidos da seda extensamente lavada dessa espécie.

A estrutura de muitas das sedas dentro de outraApocrita não aculeada e dentro do texto de Himenópteros(Symphata) são mais comumente folhas-β paralelas, com sedastanto semelhantes a colágeno como poliglicina produzidaspela Tenthredinidae (Lucas e Rudall, 1967).

Proteínas da seda de abelha de mel são sintetizadas nomeio do instar final e podem ser imageadas como uma misturade proteínas da seda despolimerizadas (Silva-Zacarin eoutros; 2003). À medida que o instar progride, água éretirada da glândula e a desidratação resulta napolimerização da proteína de seda para formar filamentos deseda insolúveis e bem organizados rotulados tactóides(Silva-Zacarin e outros; 2003). A desidratação progressivaleva a reorganização adicional dos tactóides (Silva-Zacarine outros, 2003) e possivelmente nova ligaçãointerfilamentos entre filamentos (Rudall, 1962). Imagens demicroscópio de elétron de fibrilas isolados a partir daglândula de seda de abelha de mel mostram estruturas comdiâmetro de aproximadamente 20-25 angstroms (Flower eKenchington, 1967). Esse valor é compatível com espirasenroladas com três, quatro ou cinco fitas.

A composição de aminoácidos das sedas de váriasespécies de Himenóptero aculeado foi determinada por Lucase Rudall (1967) e verificada como contendo elevados teoresde alanina, serina, os resíduos de ácido, ácido aspártico,e ácidos glutâmicos, e quantidades reduzidas de glicina emcomparação com fibroínas clássicas. Foi considerado que oteor helicoidal da seda de Himenóptero aculeado era umaconseqüência de um teor reduzido de glicina e teoraumentado de resíduos acídicos (Rudall e Kenchington,1971).

Pouco se sabe sobre a seda larval de lagartas verdes(Ordem: Neuroptera). 0 casulo é compreendido de duascamadas, uma camada sólida interna e uma camada fibrosaexterna. Anteriormente o casulo foi descrito como sendocompreendido de uma seda de cuticulina (Rudall eKenchington, 1971); uma descrição que somente serelacionada à camada sólida interna. LaMunyon (1988)descreveu uma substância excretada a partir dos túbulos demalpighi que compunham as fibras externas. Após depósitodessa camada, a parede interna sólida foi construída apartir de secreções das células epiteliais no lúmenaltamente viloso (LaMunyon, 1988).

Também é sabido que larvas de lagartas verdes produzemuma substância adesiva proteinácea a partir dos túbulos demalpighi através de todos os ínstares para aderir às larvasaos substratos, para colar itens de camuflagem no dorso daslarvas ou reter a presa (Speilger, 1962). No gêneroLomamyia (Bethothidae), as larvas produzem a seda esubstância adesiva ao mesmo tempo e foi postulado que essasduas substâncias podem bem ser o mesmo produto (Speilger,1962) . A secreção adesiva é altamente solúvel e também sepensa que é associada à defesa contra predadores (LaMunyon& Adams; 1987).

Considerando as propriedades exclusivas de sedasproduzidas por insetos como Himenópteros e Neuropteros, hánecessidade para identificação· de novos ácidos nucléicosque codificam proteínas da seda a' partir desses organismos.

SUMÁRIO DA INVENÇÃO

Os presentes inventores identificaram inúmerasproteínas da seda a partir de insetos. Essas proteínas daseda são surpreendentemente diferentes de outras proteínasda seda conhecidas em sua seqüência primária, estruturasecundária e/ou teor de aminoácidos.

Desse modo, em um primeiro aspecto a presente invençãoprovê um polipeptídeo de seda substancialmente purificadoe/ou recombinante, onde pelo menos uma porção dopolipeptídeo tem uma estrutura de espiral enrolada.

Como sabido na técnica, estruturas de espiral enroladade polipeptídios são caracterizadas por repetiçõesheptavalentes representadas pela seqüência de consenso(abcdefg)rw com resíduos genericamente hidrofóbicos emposição a e d, e resíduos genericamente polares nasposições restantes. Surpreendentemente, os heptavalentesdos polipeptídeos da presente invenção têm uma composiçãonova quando vistos coletivamente - com uma abundânciaincomumente elevada de alanina nas posições heptavalentes'hidrofóbicas' a e d. Adicionalmente, há níveis elevados deresíduos polares pequenos nessas posições. Além disso, aposição e tem também níveis elevados de alanina e resíduoshidrofóbicos pequenos.

Por conseguinte, em uma modalidade particularmentepreferida, a porção do polipeptídeo que tem uma estruturade espiral enrolada compreende pelo menos 10 cópias daseqüência heptavalente abcdefg, e pelo menos 25% dosaminoácidos nas posições a e d são resíduos de alanina.Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 10 cópias da seqüência heptavalenteabcdefg, e pelo menos 25% dos aminoácidos nas posições a, de e são resíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 10 cópias da seqüência heptavalenteabcdefg, e pelo menos 25% dos aminoácidos na posição a sãoresíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 10 cópias da seqüência heptavalenteabcdefg, e pelo menos 25% dos aminoácidos na posição d sãoresíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 10 cópias da seqüência heptavalenteabcdefg, e pelo menos 25% dos aminoácidos na posição e sãoresíduos de alanina.

Em uma modalidade particularmente preferida, pelomenos 10 cópias da seqüência heptavalente são contíguas.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 5 cópias da seqüência heptavalenteabcdefg, e pelo menos 15% dos aminoácidos nas posições a ed são resíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 5 cópias da seqüência heptavalenteabcdefg, e pelo menos 15% dos aminoácidos nas posições a, de e são resíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 5 cópias da seqüência heptavalenteabcdefg, e pelo menos 15% dos aminoácidos na posição a sãoresíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 5 cópias da seqüência heptavalenteabcdefg, e pelo menos 15% dos aminoácidos na posição d sãoresíduos de alanina.

Em uma modalidade adicional, preferida, a porção dopolipeptídeo que tem uma estrutura de espiral enroladacompreende pelo menos 5 cópias - da seqüência heptavalenteabcdefg, e pelo menos 15% dos aminoácidos na posição e sãoresíduos de alanina.

Em uma modalidade particularmente preferida, pelomenos 5 cópias da seqüência heptavalente são contíguas.

Em uma modalidade, o polipeptídeo compreende umaseqüência selecionada a partir de:

i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N° : 1; SEQ ID N° : 2; SEQ ID N° :22; SEQ ID N° : 23; SEQ ID N°: 40; SEQ ID N°: 41; SEQ ID N°:56 e SEQ ID N°: 57;

ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntica a qualquer uma ou mais entre SEQ ID N° : 1; SEQ IDN0 :2; SEQ ID N°: 22; SEQ ID N°: 23; SEQ ID N°: 40; SEQ IDN°:41; SEQ ID N0:56 e SEQ ID N°:57; e

iii) um fragmento biologicamente ativo de i) ou ii).Em outra modalidade, o polipeptídeo compreende umaseqüência selecionada a partir de:

i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N°: 3; SEQ ID N°: 4; SEQ ID N°:24; SEQ ID N°: 25; SEQ ID N°: 42>,SEQ ID N°: 43; SEQ ID N°:58 e SEQ ID N0: 59;

ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntica a qualquer uma ou mais das SEQ ID N°: 3; SEQ IDN0 :4; SEQ ID N0 :24; SEQ ID N°: 25; SEQ ID N°: 42; SEQ IDN°:43; SEQ ID N°:58 e SEQ ID N°:59; e

iii) um fragmento biologicamente ativo de i) ou ii) .

Em outra modalidade, o polipeptídeo compreende umaseqüência selecionada a partir de:

i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N°: 5; SEQ ID N° : 6; SEQ ID N°:26; SEQ ID N°: 27; SEQ ID N=: 44; SEQ ID N°: 45; SEQ ID N=:60 e SEQ ID N°: 61;

ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntica a qualquer uma ou mais das SEQ ID N0 : 5, SEQ IDN°: 6, SEQ ID N°: 26, SEQ ID N°: 27, SEQ ID N0 :44, SEQ IDN°: 45, SEQ ID N°:60 e SEQ ID N°:61; e

iii) um fragmento biologicamente ativo de i) ou ii).

Em outra modalidade, o polipeptídeo compreende umaseqüência selecionada entre:

i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N- 7; SEQ ID N° : 8; SEQ ID N° :28; SEQ ID N° : 29; SEQ ID N° : 46; SEQ ID N°: 47; SEQ ID N°:62 e SEQ ID N°: 63;

ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntica a qualquer uma ou mais das SEQ ID N0 : 7, SEQ IDN0 : 8, SEQ ID Ν°:28, SEQ ID Ν°:29, SEQ ID Ν°:46, SEQ IDΝ°:47, SEQ ID N0:62 e SEQ ID N0:63; e

iii) um fragmento biologicamente ativo de i) ou ii).

Em uma modalidade adicional, o polipeptídeo compreendeuma seqüência selecionada entre:

i) uma seqüência de aminoácidos como fornecido em SEQID N°: 72 OU SEQ ID N°: 73;

ii) uma seqüência de aminoácidos que é pelo menos 30%idêntica a SEQ ID N° : 72 e/ou SEQ ID N°: 73; e

iii) um fragmento biologicamente ativo de (i) ou (ii).

Proteínas da seda adicionais que co-associam aproteínas do primeiro aspecto foram identificadas. Umadessas proteínas (SEQ ID N°: 10) é predita como tendo 41%alfa-helicoidal, 8% beta-folha e 50% de estruturasecundária de laço por PROFsec7 e portanto é classificadacorno uma proteína de estrutura misturada. A análise deMARCOIL dessa proteína previu somente uma região curta derepetições heptavalentes características de proteínas comuma estrutura de espiral enrolada.

Por conseguinte, em um segundo aspecto, a presenteinvenção provê um polipeptídeo de seda substancialmentepurificado e/ou recombinante que compreende uma seqüênciaselecionada de:

i) uma seqüência de aminoácido como fornecido emqualquer uma das SEQ ID N°: 9; SEQ ID N° : 10 e SEQ ID N°: 30;

ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntico a qualquer um ou mais das SEQ ID N0: 9, SEQ ID N°:10 e SEQ ID N0: 30; e

iii) um fragmento biologicamente ativo de i) ou ii).Sem desejar ater-se à teoria, parece que quatroproteínas do primeiro aspecto1 se tornam entrelaçadas paraformar um feixe com eixos helicoidais quase paralelos entresi, e esse feixe estende-se axialmente para dentro de umafibrila. Além disso, é previsto que pelo menos em algumasespécies como abelha de mel é abelhão as proteínas dosegundo aspecto atuam como uma "cola" auxiliando a ligarvários feixes de proteínas de espiral enrolada do primeiroaspecto, juntos, para formar um complexo de proteínafibrosa. Entretanto, fibras e copolímeros de seda podemainda ser formados sem um polipeptídeo de segundo aspecto.

Em uma modalidade preferida, um polipeptídeo dainvenção pode ser purificado a partir de, ou é um mutantede um polipeptídeo purificado a partir de, uma espécie deHimenóptera ou Neuroptera. Preferivelmente, a espécie dehimenÓOtera é Apis mallifera, Gecophylla smaragdma,Myrmecia foricata ou Bombus terrestris. Preferivelmente, aespécie de Neuroptera é Mallada signata.

Em outro aspecto, a presente invenção provê umpolipeptídeo da invenção fundido com pelo menos outropolipeptídeo.

Em uma modalidade preferida, pelo menos outropolipeptídeo é selecionado do grupo que consiste em: umpolipeptídeo que aumenta a estabilidade de um polipeptídeoda presente invenção, um polipeptídeo que auxilia napurificação da proteína de fusão e um polipeptídeo queauxilia no polipeptídeo da invenção sendo secretado apartir de uma célula (por exemplo, secretado a partir deuma célula de planta).

Em outro aspecto, a presente invenção provê umpolinucleotídeo isolado e/ou exógeno que codifica umpolipeptideo de seda, onde pelo menos uma porção dopolipeptídeo tem uma estrutura de espiral enrolada.

Em uma modalidade, o polinucleotídeo compreende umaseqüência selecionada entre:

i) uma seqüência de nucleotídeos como fornecido emqualquer uma de SEQ ID N°: 11; SEQ ID N°: 12; SEQ ID N°:31; SEQ ID N°: 32; SEQ ID N°: 48; SEQ ID N°: 49; SEQ ID N°:64 e SEQ ID N°: 65;

ii) uma seqüência de nucleotídeos codificando umpolipeptídeo da invenção,

iii) uma seqüência de nucleotídeos que é pelo menos30% idêntica qualquer um ou mais das SEQ ID N°: 11; SEQ IDN° : 12; SEQ ID N°: 31; SEQ ID N°: 32; SEQ ID N°: 48; SEQ IDN°: 49; SEQ ID N°: 64 e SEQ ID N°: 65; e

iv) uma seqüência que hibriaiza com qualquer um entrei) a iii) sob condições rigorosas.

Em outra modalidade, o polinucleotídeo compreende umaseqüência selecionada de:

i) uma seqüência de nucleotídeos como fornecido emqualquer uma das SEQ ID N°: 13; SEQ ID N°: 14; SEQ ID N°:33; SEQ ID N°: 34; SEQ ID N°: 50; SEQ ID N°: 51; SEQ ID N°:66 e SEQ ID N0: 67;

ii) uma seqüência de nucleotídeos codificando umpolipeptídeo da invenção,

iii) uma seqüência de nucleotídeos que é pelo menos30% idêntico a qualquer uma ou mais entre SEQ ID N°: 13;SEQ ID N°: 14; SEQ ID N°: 33; SEQ ID N°: 34; SEQ ID N°: 50;SEQ ID N°: 51; SEQ ID N°: 66 e SEQ ID N°: 67; e

iv) uma seqüência que hibridiza com qualquer um entrei) a iii) sob condições rigorosas.

Em outra modalidade, o polinucleotideo compreende umaseqüência selecionada de:

i) uma seqüência de nucleotideos como fornecido emqualquer uma entre SEQ ID N°: 15; SEQ ID N°: 16; SEQ ID N° :35; SEQ ID N°: 36; SEG ID N° : 52; SEQ ID N°: 53; SEQ ID N°:68 e SEQ ID N0: 69,

ii) uma seqüência de nucleotideos codificando umpolipeptideo da invenção,

iii) uma seqüência de nucleotideos que é pelo menos30% idêntica a qualquer um ou mais das SEQ ID N°: 15; SEQID N° : 16; SEQ ID N°: 35; SEQ ID N°: 36; SEG ID N°: 52; SEQID N°: 53; SEQ ID N°: 68 e SEQ ID N0: 69, e

iv) uma seqüência que hibridiza com qualquer um de i)a iii) sob condições rigorosas.

Em uma modalidade adicional, o polinucleotideocompreende uma seqüência selecionada de:

i) uma seqüência de nucleotideos como fornecido emqualquer uma entre SEQ ID N° : 17; SEQ ID N°: 18; SEQ ID N° :37; SEQ ID N° : 38; SEG ID N°: 54; SEQ ID N°: 55; SEQ ID N°:70; SEQ ID N°: 71 e SEQ ID N°: 76,

ii) uma seqüência de nucleotideos codificando umpolipeptideo da invenção,

iii) uma seqüência de nucleotideos que é pelo menos30% idêntica a qualquer um ou mais das SEQ ID N°: 17; SEQID N° : 18; SEQ ID N° : 37; SEQ ID N°: 38; SEG ID N°: 54; SEQID N° : 55; SEQ ID N° : 70; SEQ1ID N° : 71 e SEQ ID N°: 76, e

i) uma seqüência de nucleotídeos como fornecido na SEQID N° : 74 OU SEQ ID N°: 75,

ii) uma seqüência de nucleotídeos codificando umpolipeptídeo da invenção,

iii) uma seqüência de nucleotídeos que é pelo menos30% idêntica a SEQ ID N°: 74 e/ou SEQ ID N°: 75; e

Em um aspecto adicional, a presente invenção provê umpolinucleotídeo isolado e/ou exógeno, o polinucleotídeocompreendendo uma seqüência selecionada de:

i) uma seqüência de nucleotídeos como fornecido emqualquer um entre SEQ ID N° : 19; SEQ ID N° : 20; SEQ ID N° :21; e SEQ ID N0: 39;

ii) uma seqüência de nucleotídeos codificando umpolipeptídeo da invenção,

iii) uma seqüência de nucleotídeos que é pelo menos30% idêntica a qualquer uma ou mais de SEQ ID N°: 19; SEQID N° : 20; SEQ ID N°: 21 e SEQ ID N°: 39; e

Em uma modalidade preferida', um polinucleotídeo podeser isolado a partir de, ou é um mutante de umpolinucleotídeo isolado a partir de uma espécie dehimenóptera ou Neuroptera. Preferivelmente, a espécie dehimenóptera é Apis mellifera, Oecophylla smaragdina,Myrmecia foricata ou Boiubus terrestris. Preferivelmente, aespécie de Neuroptera é Mallada signata.

Em um aspecto adicional, a presente invenção provê umvetor que compreende pelo menos um polinucleotídeo dainvenção.

Preferivelmente, o vetor é um vetor de expressão.

Em outro aspecto, a presente invenção provê uma célulahospedeira compreendendo pelo menos um polinucleotídeo dainvenção, e/ou pelo menos um vetor da invenção.

A célula hospedeira pode ser qualquer tipo de célula.Os exemplos incluem, porém não são limitados a, uma célulabacteriana, de levedo ou de planta.

Também é fornecido um processo para preparar umpolipeptídeo de acordo com a invenção, o processocompreendendo cultivar uma célula hospedeira da invenção,ou um vetor da invenção sob condições que permitemexpressão do polinucleotídeo codificando o polipeptídeo, erecuperar o polipeptídeo expresso.

Considera-se que plantas transgênicas serãoparticularmente úteis para a produção de polipeptídeos dainvenção. Desse modo, ainda em outro aspecto, a presenteinvenção provê uma planta transgênica compreendendo umpolinucleotídeo exógeno, o polinucleotídeo codificando pelomenos um polipeptídeo da invenção.

Em outro aspecto, a presente invenção provê um animalnão humano transgênico compreendendo um polinucleotídeoexógeno, o polinucleotídeo codificando pelo menos um

polipeptídeo da invenção.

Ainda em outro aspecto, a presente invenção provê umanticorpo que especificamente liga um polipeptídeo dainvenção.

Em um aspecto adicional, a presente invenção provê umafibra de seda compreendendo pelo menos um polipeptídeo dainvenção.

Preferivelraente, o polipeptídeo é um polipeptídeorecombinante.

Em uma modalidade, pelo menos alguns dos polipeptídeossão reticulados. Em uma modalidade, pelo menos alguns dosresíduos de lisina dos polipeptídeos são reticulados.

Em outro aspecto, a presente invenção provê umcopolímero compreendendo pelo menos dois polipeptídeos dainvenção.

Preferivelmente, os polipeptídeos são polipeptídeosrecombinantes.

Em uma modalidade, o copolímero compreende pelo menosquatro polipeptídeos diferentes "do primeiro aspecto. Emoutra modalidade, o copolímero compreende ainda um

polipeptídeo do segundo aspecto.

Como a pessoa versada reconhecerá, os polipeptídeos dainvenção têm uma ampla variedade de usos como sabido natécnica para outros tipos de proteínas da seda. Desse modo,em um aspecto adicional, a presente invenção provê umproduto que compreende pelo menos um polipeptídeo dainvenção, uma fibra de seda da'invenção e/ou um copolímeroda.invenção.

Os exemplos de produtos incluem, porém não sãolimitados a, produtos de higiene pessoal, artigos têxteis,

plásticos e produtos biomédicos.

Ainda em um aspecto adicional, a presente invençãoprovê uma composição que compreende pelo menos umpolipeptídeo da invenção, uma fibra de seda da invençãoe/ou um copolímero da invenção, e um ou mais veículos aceitáveis.

Em uma modalidade, a composição compreende ainda umfármaco.

Em outra modalidade, a composição é utilizada como umremédio, em um dispositivo médico ou um cosmético.

Em outro aspecto, a presente invenção provê umacomposição compreendendo pelo menos um polinucleotídeo dainvenção, e um ou mais veículos aceitáveis.

Em uma modalidade preferida, uma composição, fibra deseda, copolímero e/ou produto da invenção não compreendeuma proteína de geléia real produzida por um inseto.

Em um aspecto adicional, a presente invenção provê ummétodo de tratar ou evitar uma doença, o métodocompreendendo administrar uma composição que compreende urafármaco para tratar ou evitar a doença e um veículofarmaceuticamente aceitável, em que o veículofarmaceuticamente aceitável é selecionado de pelo menos umpolipeptídeo da invenção, uma fibra de seda da invençãoe/ou um copolímero da invenção.

Ainda em outro aspecto, a presente invenção provê parao uso de pelo menos um polipeptídeo da invenção, uma fibrade seda da invenção e/ou um copolímero da invenção, e umfármaco, para a fabricação de um medicamento para tratar ouevitar uma doença.

Em um aspecto adicional, a..presente invenção provê umkit compreendendo pelo menos um polipeptídeo da invenção,pelo menos um polinucleotídeo da invenção, pelo menos umvetor da invenção, pelo menos uma fibra de seda da invençãoe/ou um copolímero da invenção.

Preferivelmente, o kit compreende ainda informaçãoe/ou instruções para uso do kit.

Como será evidente, aspectos e característicaspreferidas de um aspecto da invenção são aplicáveis amuitos outros aspectos da invenção.

Em todo esse relatório descritivo a palavra"compreender" ou variações como "compreende" ou"compreendendo" serão entendidas como abrangendo a inclusãode um elemento mencionado, número inteiro ou etapa, ougrupo de elementos, números inteiros ou etapas, porém não aexclusão de qualquer outro elemento, número inteiro ouetapa, ou grupo de elementos, números inteiros ou etapas.

A invenção é descrita a . seguir por intermédio dosseguintes exemplos não limitadores e com referência às

figuras em anexo.

BREVE DESCRIÇÃO DOS DESENHOS EM ANEXO

Figura 1. Espectros infravermelhos de transformaçãoFourier das regiões de amida I e II das sedas: 1) seda deabelha de mel, 2) seda de abelhão, 3) seda de formigabulldog, 4) seda de formiga tecelã 5) seda larval delagarta verde. Todas as sedas têm espectros esperados deproteínas helicoidais. As sedas de Himenóptero (formigas eabelhas) têm máximos espectrais em 1645-1646 cm"1

(rotulados), deslocados aproximadamente 10 cm"1 mais baixos

(

do que um sinal alfa-helicoidal clássico e alargado, como étípico de proteínas de espiral emrolada (Heimburg e outros,

1999) .

Figura 2. Comparação de composição de aminoácido deseda de abelha de mel de favo de progênie lavado com SDScom composição de aminoácido de proteínas Xenospira (asaber, Xenospiral, Xenospira2, Xenospira3 e Xenospira4)(quantidades equimolares totalizando 65%) e Xenosin (35%).

Figura 3. Comparação de composição de aminoácidos deseda com composição de aminoácidos predita de proteínascodificadas por genes de seda.

Figura 4. Predição de regiões de espiral enrolada emproteínas da seda de abelha de mel. COILS é um programa quecompara uma seqüência com um banco de dados de espirasenroladass de duas fitas, paralelas, conhecidas e derivauma marcação de similaridade. Pela comparação dessamarcação com a distribuição de marcações em proteínasglobulares e espiral enrolada, o programa então calcula aprobabilidade de que a seqüência adotará uma conformação deespiral enrolada como descrito em Lupas e outros (1991).Utilizando um tamanho de janela de 2 8 esse programa prevêos seguintes números de resíduos existentes em cadaproteína em domínios de espiral enrolada: Xenospira3: 77;Xensopira4: 35; Xenospiral: 28; Xenospira2: 80.

Figura 5. Alinhamento de proteínas da seda de abelhade mel mostrando predição MARCOIL dos principaisheptavalentes que formam uma estrutura de espiral enrolada.Seqüências heptavalentes são mostradas acima dosaminoácidos, e resíduos de alanina em posições a e d sãoacentuados.

Figura 6. Alinhamento de regiões de espiral enroladacom predição Marciol de proteínas da seda de himenóptero(abelhas e formigas) mostrando a atribuição de posiçãoheptavalente. Amei, abelha de melV BB, abelhão; BA, formigabulldog; WA, formiga tecelã; Fl-4, fibroínas de seda 1-4.As seqüências heptavalentes são mostradas acima dosaminoácidos, e resíduos de alanina nas posições a, d e esão acentuados.

Figura 7. 0 caráter de aminoácidos de posiçõesheptavalentes nas regiões de espiral enrolada preditas daproteína de seda larval Malladasignata e os agrupamentosortólogos das proteínas da seda de Himenóptero.

Figura 8. Eletroforese de gel de poliacrilamida SDS deproteínas de glândula salivar de último instar tardio. Asproteínas foram identificadas após digestão tríptica eanálise de conjunto de dados espectrais de massa utilizandosoftware Spectrum Mill de Agilent para casar os dados compredições de seqüências de proteínas a partir de proteínasidentificadas de seqüências de cDNA. 0 software geroumarcações para a qualidade de cada casamento entreconjuntos experimentalmente observados de massas defragmentos de peptídeos e as predições de fragmentos quepoderiam ser geradas de acordo com as seqüências deproteínas em um banco de dados fornecido. Todos oscasamentos de seqüência mostrados aqui receberam marcaçõesmaiores do que 20 pelo software Spectrum Mill, onde umamarcação de 20 seria suficiente para aceitação automática,segura de um casamento válido.

Figura 9. Análise com ,.parcimônia da região de deespiral enrolada de proteínas da seda. A relação das quatroproteínas de espiral enrolada sugere que os genesdesenvolvidos a partir de um ancestral comum que pré-data adivergência de Euaculeata. A, área ligada pela linhatracejada indica variação que ocorreu antes das formigas evespas (Vespoidea) divergirem ' das abelhas (Apoidea) noJurássico tardio (155 myrs; Grimaldi e Engel, 2005). Osnúmeros indicando valores de alça a partir de 1000iterações são mostrados.

Figura 10. A) Proteínas da seda Apis melliferaidentificados por análise espectral de massa de peptídeosgerados a partir de seda de abelha após digestão comtripsina. O sombreamento indica peptídeos identificadospela análise espectral de massa, Todos os casamentos deseqüência mostrados aqui receberam marcações maiores do que20 pelo software Spectrum Mill, onde uma marcação de 20seria suficiente para aceitação automática, segura de umcasamento válido.

B) Seqüências de amino de comprimento total deproteínas da seda de abelhão, formiga bulldog, formigatecelã e lagarta verde.

Fiaura 11= Quadros de leitura aberta codificandoproteínas da seda de abelha de mel, abelhão, formigabulldog, formiga tecelã e lagarta verde.

Figura 12. Seqüência de gene codificando Xenosin. Aseqüência de codificação inteira fornecida que éinterrompida por um intron único (acentuado).

Figura 13. Expressão de proteína de seda em tabaco.Detecção de proteínas marcadas com histidina após análisede western blot de proteínas a partir de: 1. E. colitransformado com vetor de expressão vazio, 2. E.colitransformado com vetor de expressão contendo região decodificação AmelF4 (Xenospira4), 3. Tabaco transformado comvetor de expressão vazio, 4. Tabaco transformado com vetorde expressão contendo região de codificação AmelF4.

Figura 14. Fibras feitas a partir de proteínas da sedade abelha de mel recombinantes mostrando fiosbirrefringentes. Biorrefringência indica que estrutura estápresente nos fios. Fios de abelha de mel recombinantesdiferentes são mostrados em cada painel A-D, e fio delagarta verde recombinante é mostrado no painel E.

CHAVE PARA A LISTAGEM DE SEQÜÊNCIAS

SEQ ID N0 : 1 - proteína de seda de abelha de meldenominada aqui Xenospiral (também denominada aqui AmelFl)(peptídeo de sinal menos).

SEQ ID N0 : 2 - proteína de seda de abelha de meldenominada aqui Xenospiral.

SEQ ID N0 : 3 - proteína de seda de abelha de meldenominada aqui Xenospira2 (também denominada aqui AmelF2)(peptídeo de sinal menos).

SEQ ID N0 : 4 - proteína de seda de abelha de meldenominada aqui Xenospira2 =

SEQ ID N0 : 5 - proteína de seda de abelha de meldenominada aqui Xenospira3 (também denominada aqui AmelF3)(peptídeo de sinal menos).

SEQ ID N0 : 6 - proteína·' de seda de abelha de meldenominada aqui Xenospira3.

SEQ ID N0 : 7 - proteína de seda de abelha de meldenominada aqui Xenospira4 (também denominada aqui AmelF4)(peptídeo de sinal menos).

SEQ ID N0 : 8 - proteína de seda de abelha de meldenominada aqui Xenospira4.

SEQ ID N0 : 9 - proteína de seda de abelha de meldenominada aqui xenosin (também denominada aqui AmelSAl)(peptídeo de sinal menos).

SEQ ID N0 : 10 - proteína de seda de abelha de meldenominada aqui xenosin.

SEQ ID N0: 11 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospiral (peptídeo desinal de codificação de região menos).

SEQ ID N0: 12 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospiral.

SEQ ID N0: 13 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospira2 (peptídeo desinal de codificação de região menos).

SEQ ID N°: 14 - seqüência dê nucleotídeos codificandoproteína de seda de abelha de mel Xenospira2.

SEQ ID N0: 15 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospira3 (peptídeo desinal de codificação de região menos).

SEQ ID N0: 16 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospira3 .

SEQ ID N0: 17 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospira4 (peptídeo desinal de codificação de região menos).

SEQ ID N0: 18 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel Xenospira4.

SEQ ID N0: 19 - seqüência dè nucleotídeos codificandoproteína de seda de abelha de mel xenosin.

SEQ ID N0: 20 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel xenosin.

SEQ ID N0 : 21 - seqüência de genes codificandoproteína de seda de abelha de mel xenosin.

SEQ ID N°: 22 - proteína de seda de abelhão denominadoaqui BBFl (menos peptídeo de sinal).

SEQ ID N0 : 23 - proteína de seda de abelhão denominadoaqui BBFl.

SEQ ID N0 : 24 - proteína de seda de abelhão denominadoaqui BBF2 (menos peptídeo de sinal).

SEQ ID N0 : 25 - proteína de seda de abelhão denominadoaqui BBF2.

SEQ ID N° : 26 - proteína de seda de abelhão denominadoaqui BBF3 (menos peptídeo de sinal).

SEQ ID N0 : 27 - proteína de seda de abelhão denominadoaqui BBF3.

SEQ ID N0 : 28 - proteína de seda de abelhão denominadoaqui BBF4 (menos peptídeo de sinal).

SEQ ID N°: 29 - proteína de seda de abelhão denominadoaqui BBF4 .

SEQ ID N0 : 3 0 - seqüência de aminoãcidos parciais deproteína de seda de abelhão denominada aqui BBSAl.

SEQ ID N°: 31 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBFl (menos peptídeo de sinalde codificação de região).

SEQ ID N0: 32 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBFl.

SEQ ID N0: 33 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBF2 (menos peptídeo de sinalde codificação de região).

SEQ ID N0: 34 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBF2.

SEQ ID N0: 35 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBF3 (menos peptídeo de sinalde codificação de região).

SEQ ID N0: 3 6 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBF3.SEQ ID N0: 37 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBF4 (menos peptídeo de sinalde codificação de região).

SEQ ID N°: 38 - seqüência de nucleotídeos codificandoproteína de seda de abelhão BBF4.

SEQ ID N0 : 3 9 - seqüência de nucleotídeos parcialcodificando proteína de seda de abelhão BBSAl.

SEQ ID N0 : 4 0 - proteína de seda de formiga bulldogdenominada aqui BAFl (menos peptídeo de sinal).

SEQ ID N°: 41 - proteína de seda de formiga bulldog

denominada aqui BAFl.

SEQ ID N0 : 42 - proteína de seda de formiga bulldog

denominada aqui BAF2 (menos peptídeo de sinal).

SEQ ID N0 : 43 - proteína de seda de formiga bulldog

denominada aqui BAF2.

SEQ ID N0 : 44 - proteína de seda de formiga bulldogdenominada aqui BAF3 (menos peptídeo de sinal) .

SEQ ID N°: 45 - proteína de seda de formiga bulldogdenominada aqui BAF3.

SEQ ID N0 : 46 - proteína de seda de formiga bulldog

denominada aqui BAF4 (menos peptídeo de sinal).

SEQ ID N°: 47 - proteína de seda de formiga bulldogdenominada aqui BAF4.

SEQ ID N°: 48 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAFl (menos peptídeo desinal de codificação de região).

SEQ ID N°: 49 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAFl.

SEQ ID N0 : 50 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAF2 (menos peptídeo desinal de codificação de região).

SEQ ID N°: 51 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAF2.

SEQ ID N°: 52 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAF3 (menos peptídeo desinal de codificação de região).

SEQ ID N0: 53 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAF3.

SEQ ID N0: 54 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAF4 (menos peptídeo desinal de codificação de região).

SEQ ID N°: 55 - seqüência de nucleotídeos codificandoproteína de seda de formiga bulldog BAF41.

SEQ ID N°: 56 - proteína de seda de formiga tecelãdenominada aqui GAFl (menos peptídeo de sinal).

SEQ ID N°: 57 - proteína de seda de formiga tecelãdenominada aqui GAFl.

SEQ ID N0 : 58 - proteína de seda de formiga tecelãdenominada aqui GAF2 (menos peptídeo de sinal).

SEQ ID N°: 59 - proteína de seda de formiga tecelãdenominada aqui GAF2.

SEQ ID N° : 60 - proteína de seda de formiga tecelãdenominada aqui GAF3 (menos peptídeo de sinal).

SEQ ID N0 : 61 - proteína de seda de formiga tecelãdenominada aqui GAF3.

SEQ ID N0 : 62 - proteína de seda de formiga tecelãdenominada aqui GAF4 (menos peptídeo de sinal).

SEQ ID N0 : 63 - proteína de seda de formiga tecelãdenominada aqui GAF4.

SEQ ID N0 : 64 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAFl (menos peptídeo desinal de codificação de região).

SEQ ID N0: 65 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAFl.

SEQ ID N0: 66 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAF2 (menos peptídeo desinal de codificação de região).

SEQ ID N0: 67 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAF2 .

SEQ ID N0: 68 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAF3 (menos peptídeo desinal de codificação de região).

SEQ ID N0: 69 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAF3.

SEQ ID N0: 70 - seqüência dé nucleotídeos codificandoproteína de seda de formiga tecelã GAF4 (menos peptídeo desinal de codificação de região).

SEQ ID N0: 71 - seqüência de nucleotídeos codificandoproteína de seda de formiga tecelã GAF4.

SEQ ID N0 : 72 - proteína de seda de lagarta verdedenominada aqui MalFl (menos peptídeo de sinal).

SEQ ID N0 : 73 - proteína de seda de lagarta verdedenominada aqui MalFl.

SEQ ID N0: 74 - seqüência de nucleotídeos codificandoproteína de lagarta verde MalFl '(menos peptídeo de sinal decodificação de região).

SEQ ID N0: 75 - seqüência dé nucleotídeos codificandoproteína de seda de lagarta verde MalFl.

SEQ ID N0: 76 - seqüência de nucleotídeos codificandoproteína de seda de abelha de mel denominada aqui códonXenospira4 otimizado para expressão de planta (antes desubclonagem em pET14b e pVEC8).

SEQ ID N0 : 77 - quadro de leitura aberta de proteínade seda de abelha de mel (Xenospira4) otimizado paraexpressão de planta (sem fusão traducional).

DESCRIÇÃO DETALHADA DA INVENÇÃO

Técnicas gerais e definições

A menos que especificamente definido de outro modo,todos os termos técnicos e científicos utilizados aquiserão assumidos como tendo, o mesmo significado comocomumente compreendido por uma pessoa com conhecimentoscomuns na técnica (por exemplo, em cultura de células,genética molecular, imunologia, imunoistoquímica, químicade proteína e bioquímica).

A menos que indicado de outro modo, a proteínarecombinante, cultura de células e técnicas imunolõgicasutilizadas na presente invenção são procedimentos padrão,bem conhecidos por aqueles versados na técnica. Taistécnicas são descritas e explicadas em toda literatura emfontes como, J. Perbal, A Practical Guide to MolecularCloning, John Wiley and Sons (1984), J. Sambrook e outros,Molecular Cloning: A Laboratory Manual, Cold Spring HarbourLaboratory Press (1989) , T.A. Brown (editor) , EssentialMolecular Biology: A Practical Approach, Volumes 1 and 2,IRL Press (1991), D. M. Glover and B.D. Hames (editores),DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press(1995 and 1996) , e F.M. Ausubel e outros (editores) ,Current Protocols in Molecular Biology, Greene Pub.Associates and Wiley-Interscience (1988, incluindo todas asatualizações até o presente) , Ed Harlow e David Lane(editores) Antibodies: A Laboratory Manual, Cold SpringHarbour Laboratory, (1988), and J.E. Coligan e outros,(editores) Current Protocols in Immunology, John Wiley &Sons (incluindo todas as atualizações até o presente), esão incorporados aqui a título de-referência.

Como utilizado aqui, os termos "proteína de seda" e"polipeptídeo de seda" se referem à proteína/polipeptídeofibroso, que pode ser utilizada para produzir uma fibra deseda e/ou um complexo de proteína fibrosa. Proteínas daseda de ocorrência natural da invenção fazem parte da sedade favo de progênie de insetos como abelhas de mel,entretanto, como descrito aqui, variantes dessas proteínaspoderiam ser facilmente produzidas que executariam a mesmafunção se expresso em um inseto apropriado.

Como utilizado aqui, uma "fibra de seda" se refere afilamentos compreendendo proteínas da invenção que podemser trançadas em vários itens como artigos têxteis.

Como utilizado aqui, um "copolímero" é uma composiçãoque compreende duas ou mais proteínas da seda da invenção.Esse termo exclui copolímeros de ocorrência natural como ofavo de progênie de insetos.

O termo "planta" inclui plantas inteiras, estruturasvegetativas (por exemplo, folhas, caules), raízes,estruturas/órgãos florais, sementes (incluindo embriões,endosperma e tegumento), tecido de planta (por exemplo,tecido vascular, tecido de base e similares), células eprogênie das mesmas.

Uma "planta transgênica" se. refere a uma planta quecontém uma construção de gene ("transgene") não encontradaem uma planta do tipo selvagem da mesma espécie, variedadeou cultivar. Um "transgene" como mencionado aqui tem osignificado normal na técnica de biotecnologia e inclui umaseqüência genética que foi produzida ou alterada portecnologia de DNA ou RNA recombinante e que foi introduzidana célula da planta. 0 transgene pode incluir seqüênciasgenéticas derivadas de uma célula de planta. Tipicamente, otransgene foi introduzido na planta por manipulação humanacomo, por exemplo, por transformação porém qualquer métodopode ser utilizado como uma pessoa versada na técnicareconhece.

"Polinucleotídeo" se refere a um oligonucleotídeo,molécula de ácido nucléico ou qualquer fragmento da mesma.Pode ser DNA ou RNA de origem genômica ou sintética, defita dupla ou fita única, e combinada com carboidrato,lipídeos, proteína ou outros materiais para executar umaatividade específica definida, aqui.

"Operativamente ligado", como utilizado aqui, serefere a uma relação funcional entre dois ou mais segmentosde ácido nucléico (por exemplo, DNA). Tipicamente, serefere à relação funcional de elemento regulador detranscrição com uma seqüência transcrita. Por exemplo, umpromotor é operativamente ligado a uma seqüência decodificação, como um polinucleotídeo definido aqui, seestimular ou modular a transcrição da seqüência decodificação em uma célula hospedeira apropriada.Genericamente, elementos reguladores de transcrição depromotor que são operativamente ligados a uma seqüênciatranscrita são fisicamente contíguos à seqüênciatranscrita, isto é, são de atuação-cis. Entretanto, algunselementos reguladores de transcrição, comointensificadores, não necessitam estar fisicamentecontíguos ou localizados em proximidade estreita àsseqüências de codificação cuja transcrição elesintensificam.

O termo "peptídeo de sinal" se refere a umpolipeptídeo de terminal amino precedendo uma proteínamadura secretada. 0 peptídeo de.sinal é clivado a partir dee, portanto, não está presente na proteína madura.Peptídeos de sinal têm a função de orientar e trans-locarproteínas secretadas através de membranas de células. 0peptídeo de sinal também é mencionado como seqüência desinais.

Como utilizado aqui, "transformação" é a aquisição degenes novos em uma célula pela incorporação de umpolinucleotídeo.

Como utilizado aqui, o termo "fármaco" se refere aqualquer composto que pode ser utilizado para tratar ouevitar uma doença específica, exemplos de fármacos quepodem ser formuladas com uma proteína de seda da invençãoincluem, porém não são limitados a, proteínas, ácidosnucléicos, agentes antitumor, analgésicos, antibióticos,compostos antiinflamatórios (tanto esteroidais como nãoesteroidais), hormônios, vacinas, substâncias rotuladas, esimilares.

Polipeptídeos

Por "polipeptídeo substancialmente purificado" se querdizer um polipeptídeo que foi genericamente separado doslipídeos, ácidos nucléicos, outros polipeptídeos, e outrasmoléculas de contaminação como cera com as quais estáassociado em seu estado nativo. Com a exceção de outrasproteínas da invenção, prefere-se que o polipeptídeosubstancialmente purificado seja pelo menos 60% livre, maispreferivelmente pelo menos 75% livre, e maispreferivelmente ainda pelo 1 menos 90% livre de outroscomponentes com os quais é naturalmente associado.

O termo "recombinante" no contexto de um polipeptídeose refere ao polipeptídeo quando produzido por uma célula,ou em um sistema de expressão livre de células, em umaquantidade alterada ou em uma taxa alterada em comparaçãocom seu estado nativo. Em uma modalidade a célula é umacélula que não produz naturalmente o polipeptídeo.Entretanto, a célula pode ser uma célula que compreende umgene não endógeno que faz com que uma quantidade alterada,preferivelmente aumentada do polipeptídeo seja produzida.

Um polipeptídeo recombinante da invenção incluipolipeptídeos que não foram separados a partir de outroscomponentes da célula transgênica (recombinante), ousistema de expressão livre de células, no qual é produzido,e polipeptídeos produzidos em tais células ou sistemaslivres de células que são subseqüentemente purificados paralonge de pelo menos alguns outros>componentes.

Os termos "polipeptídeo" e "proteína" sãogenericamente utilizados de forma intercambiável e sereferem a uma única cadeia de polipeptídeos que pode ou nãoser modificada pela adição de grupos de ácido não amino. Ostermos "proteínas" e "polipeptídeos", como utilizados aqui,também incluem variantes, mutantes, modificações, análogose/ou derivados dos polipeptídeos da invenção, como descritoaqui.

A % de identidade de um polipeptídeo é determinada poranálise GAP (Needleman e Wunsch, 197 0) (programa GCG) comuma penalidade de criação de lacuna=5, e uma penalidade deextensão de Iacuna=O,3. A seqüência de consulta tem pelomenos 15 aminoácidos de comprimento, e a análise GAP alinhaas duas seqüências sobre uma região de pelo menos 15aminoácidos. Mais preferivelmente a seqüência de consultatem pelo menos 50 aminoácidos em comprimento, e a análiseGAP alinha as duas seqüências sobre uma região de pelomenos 50 aminoácidos. Mais preferivelmente, a seqüência deconsulta tem pelo menos 100 aminoácidos em comprimento e aanálise GAP alinha as duas seqüências sobre uma região depelo menos 100 aminoácidos. Ainda mais preferivelmente, aseqüência de consulta tem pelo menos 25 0 aminoácidos emcomprimento e a análise GAP alinha as duas seqüências sobreuma região de pelo menos 250 aminoácidos. Maispreferivelmente ainda, a análise GAP alinha as duasseqüências sobre seu comprimento inteiro.

Como utilizado aqui um fragmento "biologicamenteativo" é uma porção de um polipeptídeo da invenção quemantém uma atividade definida do polipeptídeo decomprimento total, a saber, a capacidade de ser utilizadopara produzir seda. Fragmentos biologicamente ativos podemser de qualquer tamanho desde que mantenham a atividadedefinida.

Com relação a um polipeptídeo definido, seráreconhecido que algarismos de % de identidade mais elevadosdo que aqueles fornecidos acima abrangerão modalidadespreferidas. Desse modo, onde aplicável, à luz dosalgarismos de % de identidade mínimos, prefere-se que opolipeptídeo compreenda uma seqüência de aminoácidos que épelo menos 40%, mais preferivelmente pelo menos 45%, maispreferivelmente pelo menos 50%, mais preferivelmente pelomenos 55%, mais pref erivelmente pelo menos 60%, maispreferivelmente pelo menos 65%, mais preferivelmente pelomenos 70%, mais pref erivelmente pelo menos 75%, maispreferivelmente pelo menos 80%, mais preferivelmente pelomenos 85%, mais pref erivelmente pelo menos 90%, maispreferivelmente pelo menos 91%, mais preferivelmente pelomenos 92%, mais pref erivelmente pelo menos 93%, maispreferivelmente pelo menos 94%, mais preferivelmente pelomenos 95%, mais pref erivelmente pelo menos 96%, maispreferivelmente pelo menos 97%, mais preferivelmente pelomenos 98%, mais pref erivelmente pelo menos 99%, maispreferivelmente pelo menos 99,1%, mais preferivelmente pelomenos 99,2%, mais preferivelmente pelo menos 99,3%, maispref erivelmente pelo menos 99.4%,. mais pref erivelmente pelomenos 99,5%, mais preferivelmente pelo menos 99,6%, maispreferivelmente pelo menos 99,7%, mais preferivelmente pelomenos 99,8%, e ainda mais preferivelmente pelo menos 99,9%idêntico a SEQ ID N0 nomeada relevante.

Mutantes de seqüência de aminoácidos dos polipeptídeosda presente invenção podem ser preparados pela introduçãode mudanças de nucleotídeo apropriadas em um ácido nucléicoda presente invenção, ou por síntese in vitro dopolipeptídeo desejado. Tais mutantes incluem, por exemplo,deleções, inserções ou substituições de resíduos dentro daseqüência de aminoácidos. Uma combinação de deleção,inserção e substituição, pode ser feita para chegar àconstrução final, com a condição de que o produto depolipeptídeo final possua as características desejadas.Polipeptídeos mutantes .,...(alterados) podem serpreparados utilizando qualquer técnica conhecida na arte.Por exemplo, um polinucleotídeo da invenção pode sersubmetido a mutagênese in vitro. Tais técnicas demutagênese in vitro incluem subclonagem do polinucleotídeoem um vetor apropriado, transformação do vetor em uma cepa"mutator" como E.coli XL-I red (Stratagene) e propagaçãodas bactérias transformadas por um número apropriado degerações. Em outro exemplo, os polinucleotídeos da invençãosão submetidos a técnicas de mistura de DNA como amplamentedescrito por Harayama (1998). Essas técnicas de mistura deDNA podem incluir genes da invenção possivelmente além dosgenes relacionados àqueles da presente invenção, como genesde seda a partir das espécies: Himenóptero ou Neuroptera,diferentes das espécies específicas caracterizadas aqui.Produtos derivados a partir de DNA alterado/mudado podemser facilmente classificados utilizando técnicas descritasaqui para determinar se podem ser utilizados como proteínasda seda.

Ao projetar mutantes de seqüência de aminoácidos, alocalização do sítio de mutação e a natureza da mutaçãodependerão da(s) característica(s) a serem modificadas. Ossítios para mutação podem ser modificados individualmenteou em série, por exemplo, por "(1) substituir primeiramentecom escolhas de aminoácidos cónservativos e então comseleções mais radicais dependendo dos resultados obtidos,(2) deleção do resíduo alvo, ou (3) inserção de outrosresíduos adjacentes ao sítio localizado.

Deleções de seqüência de aminoácidos variamgenericamente de aproximadamente 1 a 15 resíduos, maispreferivelmente aproximadamente 1 a 10 resíduos etipicamente aproximadamente 1 a 5.resíduos contíguos.

Mutantes de substituição têm pelo menos um resíduo deaminoácido na molécula de polipeptídeo removida e umresíduo diferente inserido em seu lugar. Os sítios de maiorinteresse para mutagênese de substituição incluem sítiosidentificados como importante para função. Outros sítios deinteresse são aqueles nos quais os resíduos específicosobtidos a partir de várias cepas ou espécies são idênticos.

Essas posições podem ser importantes para atividadebiológica. Esses sítios, especialmente aquelescompreendidos em uma seqüência de pelo menos três outrossítios identicamente conservados, são preferivelmentesubstituídos em um modo relativamente conservativo. Taissubstituições conservativas são mostradas na Tabela 1 sob ocabeçalho de "substituições exemplares"' .

Como delineado acima, uma porção de alguns dospolipeptídeos da invenção tem uma estrutura de espiralenrolada. Estruturas de espiral enrolada de polipeptídeossão caracterizadas por ~ repetições heptavalentesrepresentadas pela seqüência de consenso (abcdefg)n- Em umamodalidade preferida, a porção do polipeptídeo que tem umaestrutura de espiral enrolada compreende pelo menos 10cópias da seqüência heptavalente abcdefg, e pelo menos 25%dos aminoácidos em posições a e d são resíduos de alanina.

Tabela 1. Substituições exemplares

<table>table see original document page 37</column></row><table><table>table see original document page 38</column></row><table>

Em uma modalidade preferida, o polipeptídeo que temuma estrutura de espiral enrolada compreende pelo menos 12cópias consecutivas, mais preferivelmente pelo menos 15cópias consecutivas, e ainda mais preferivelmente pelomenos 18 cópias consecutivas do heptavalente. Emmodalidades adicionais, o polipeptídeo que tem umaestrutura de de espiral enrolada 'pode ter até pelo menos 2 8cópias do heptavalente. Tipicameente, as cópias doheptavalente serão repetidas em tandem. Entretanto, não têmnecessariamente que ser repetições em tandem perfeitas, porexemplo, como mostrado nas figuras 5 e 6 alguns aminoácidospodem ser encontrados entre dois heptavalentes, ou algunsheptavalentes truncados podem ser encontrados (vide, porexemplo, Xenospiral na figura 5)

A orientação em relação a substituições de aminoácidosque podem ser feitas nos polipeptideos da invenção que têmuma estrutura de espiral enrolada é fornecida nas figuras 5e 6, bem como tabelas 6 a 10. Onde uma substituição deaminoácidos útil, predita com base em dados experimentaisfornecidos aqui está de algum modo em conflito com assubstituições exemplares fornecidas na Tabela 1 prefere-seque uma substituição baseada nos dados experimentais sejautilizada.

Estruturas de espiral enrolada de polipeptideos dainvenção têm um elevado teor de resíduos de alanina,particularmente em posições de aminoácidos a, d e e doheptavalente. Entretanto, as posições b, c, f e g têmtambém uma freqüência elevada de resíduos de alanina. Emuma modalidade preferida, pelo menos 15% dos aminoácidosnas posições a, d e/ou e dos heptavalentes são resíduos dealanina, mais preferivelmente pelo menos 25%, maispreferivelmente pelo menos 30%, mais preferivelmente pelomenos 4 0%, mais pref erivelmente pelo menos 50%. Em umamodalidade preferida, pelo menos 25% dos aminoácidos nasduas posições a e d dos heptavalentes são resíduos dealanina, mais preferivelmente pelo menos 3 0%, maispreferivelmente pelo menos . 40%, e ainda maispreferivelmente pelo menos 50%. Adicionalmente, prefere-seque pelo menos 15% dos aminoácidos nas posições b, c, f e gdos heptavalentes sejam resíduos de alanina, maispreferivelmente pelo menos 2 0%, e ainda maispreferivelmente pelo menos 25%.

Tipicamente, os heptavalentes não compreenderão nenhumresíduo de prolina ou histidina. Além disso, osheptavalentes compreenderão poucos (1 ou 2) , se algum,resíduos de fenil alanina, metionina, tirosina, cisteína,glicina triptofano. Além de alanina, aminoácidos comuns(por exemplo, maiores do que 5% mais preferivelmentemaiores do que 10%) nos heptavalentes incluem leucina(particularmente nas posições b e d) , serina(particularmente nas posições b, e e f) , ácido glutâmico(particularmente nas posições c, e e f), lisina(particularmente nas posições b, c, d, f e g) bem comoarginina na posição g.

Polipeptídeos (e polinucleotídeos) da invenção podemser purificados (isolados) a partir de uma ampla variedadede espécies Himenóptera e Neuroptera. Os exemplos deHimenópteros incluem, porém não "são limitados a qualquerespécie de Subordem Apocrita (abelhas, formigas e vespas),que incluem as seguintes famílias de insetos: Chrysididae(vespas-cuco) , Formicidae (formigas) , Mutillidae (formigasaveludadas), Pompilidae (vespas-aranha), Scoliidae,Vespidae (paper vespas de papel, vespas potter, vespões),Agaonidae (vespas de figueira), Chalcididae (calcidide),Eucharitidae (eucharitids), Eupelmidae (eupelmids),Pteromalidae (pteromalids), Evaniidae (vespas-bandeira),Braconidae, Ichneumonidae (ichneumons), Megachilidae,Apidae, Colletidae, Halictidae, e Melittidae (abelhas quecoletam óleo). Os exemplos de Neuropteros incluem espéciesa partir das seguintes famílias de insetos: Mantispidae,Chrysopidae (lagartas verdes), Myrmeleontidae (formiga-leão), e Ascalaphidae (moscas-coruja). Tais polipeptideosadicionais (e polinucleotídeos) podem ser caracterizadosutilizando os mesmos procedimentos descritos aqui parasedas a partir de Bombus terrestris, Myrmecia forficata,Oecophylla smaragdina and Mallada signata.

Além disso, se desejado, aminoácidos não naturais ouanálogos de aminoácidos químicos podem ser introduzidoscomo uma substituição ou adição nos polipeptideos dapresente invenção. Tais aminoácidos incluem, porém não sãolimitados a, D-isômeros dos aminoácidos comuns, ácido 2,4-diaminobutírico, ácido α-amino isobutírico, ácido 4-aminobutírico, ácido 2-aminobutírico, ácido 6-aminohexanóico, ácido 2-amino isobutírico, ácido 3-aminopropiônico, ornitina, norleucina, norvalina, hidróxiprolina, sarcosina, citrulina, homocitrilurriina, aciaocistéico, t-butil glicina, t-butil alanina, fenil glicina,ciclo hexil alanina, β-alanina, ácidos flúor-amino,aminoácidos designer como aminoácidos β-metila, aminoácidosCa-metila, aminoácidos Να-metila, e análogos deaminoácidos em geral.

Também compreendido no escopo da invenção sãopolipeptideos da presente invenção que são diferencialmentemodificados durante ou após síntese, por exemplo, porbiotinilação, benzilação, glicosilação, acetilação,fosforilação, amidação, derivatização por grupos debloqueio/proteção conhecidos, clivagem proteolítica,ligação a uma molécula de anticorpo ou outro ligandocelular, etc. Essas modificações podem servir para aumentara estabilidade e/ou bioativid,ade do polipeptídeo dainvenção.

Polipeptídeos da presente invenção podem serproduzidos em uma variedade de modos, incluindo produção erecuperação de polipeptídeos naturais, produção erecuperação de polipeptídeos recombinantes, e síntesequímica dos polipeptídeos. Em uma modalidade, umpolipeptídeo isolado da presente invenção é produzido porcultura de uma célula capaz de expressar o polipeptídeo sobcondições eficazes para produzir o polipeptídeo, erecuperar o polipeptídeo. Uma célula preferida para culturaé uma célula recombinante da presente invenção. Condiçõesde cultura efetivas incluem, porém não são limitadas a,meios efetivos, biorreator, temperatura, pH e condições deoxigênio que permitem produção de polipeptídeos. Um meioeficaz se refere a qualquer meio no qual uma célula écultivada para produzir um polipeptídeo da presenteinvenção. Tal meio compreende tipicamente um meio aquosotendo fontes de carbono, nitrogênio e fosfato assimiláveis,e sais, minerais, metais e outros nutrientes apropriados,como vitaminas. Células da preêente invenção podem sercultivadas em biorreatores de fermentação convencionais,frascos de agitação, tubos de teste, pratos de microtítulo,e placas petri. A cultura pode ser realizada em umatemperatura, pH e teor de oxigênio apropriado para umacélula recombinante. Tais condições de cultura estãocompreendidas nos conhecimentos de uma pessoa comconhecimentos comuns na técnica.

Polinucleotídeos

Por um "polinucleotídeo isolado", incluindo DNA, RNAou uma combinação desses, de fita única ou dupla, naorientação de sentido ou anti-sentido ou uma combinação deambos, dsRNA ou de outro modo, quer se dizer umpolinucleotideo que seja pelo menos parcialmente separado apartir das seqüências de polinucleotídeos com as quais éassociado ou ligado em seu estado nativo. Preferivelmente,o polinucleotideo isolado é pelo menos 60% livre,preferivelmente pelo menos 75% livre, e maispreferivelmente pelo menos 90% livre de outros componentescom os quais são naturalmente associados. Além disso, otermo "polinucleotideo" é utilizado de forma intercambiávelaqui com o termo "ácido nucléico".

0 termo "exógeno" no contexto de um polinucleotideo serefere ao polinucleotideo quando presente em uma célula, ouem um sistema de expressão livre de células, em umaquantidade alterada em comparação com seu estado nativo. Emuma modalidade, a célula é uma célula que não compreendenaturalmente o polinucleotideo. Entretanto, a célula podeser uma célula que compreende um polinucleotideo nãoendógeno resultando em uma quantidade alteradapreferivelmente aumentada, de produção do polipeptídeocodificado. Um polinucleotideo ; exógeno da invenção incluipolinucleotídeos que não foram separados de outroscomponentes da célula transgênica (recombinante), ousistema de expressão livre de células, no qual estápresente, e polinucleotídeos produzidos em tais células ousistemas livres de células que são subseqüentementepurificados para longe a partir de pelo menos alguns outroscomponentes.

A % de identidade de um polinucleotideo é determinadapor análise GAP (Needleman e Wunsch, 197 0) (programa GCG)com uma penalidade de criação de lacuna=5, e uma penalidadede extensão de Iacuna=O, 3. A menos que de outro modomencionado, a seqüência de consulta tem pelo menos 45nucleotideos de comprimento, e a análise GAP alinha as duasseqüências sobre uma região de pelo menos 45 nucleotideos.Preferivelmente a seqüência de consulta tem pelo menos 150nucleotideos em comprimento, e a análise GAP alinha as duasseqüências sobre uma região de pelo menos 150 nucleotideos.Mais preferivelmente, a seqüência de consulta tem pelomenos 300 nucleotideos em comprimento e a análise GAPalinha as duas seqüências sobre uma região de pelo menos300 nucleotideos. Ainda mais preferivelmente, a análise GAPalinha as duas seqüências sobre seu comprimento inteiro.

Com relação aos polinucleotideos definidos, seráreconhecido que os algarismos de % de identidade maiselevados do que aqueles fornecidos acima abrangerãomodalidades preferidas. Desse modo, onde aplicável, à luzdos algarismos de % de identidade mínimos, prefere-se queum polinucleotideo da invenção compreenda uma seqüência queé pelo menos 40%, mais preferivelmente pelo menos 45%, maispreferivelmente pelo menos 50%, mais preferivelmente pelomenos 55%, mais pref erivelmerite pelo menos 60%, maispreferivelmente pelo menos 65%, mais preferivelmente pelomenos 70%, mais preferivelmente pelo menos 75%, maispreferivelmente pelo menos 80%, mais preferivelmente pelomenos 85%, mais preferivelmente pelo menos 90%, maispreferivelmente pelo menos 91%, mais preferivelmente pelomenos 92%, mais preferivelmente pelo menos 93%, maispreferivelmente pelo menos 94%, mais preferivelmente pelomenos 95%, mais preferivelmente pelo menos 96%, maispreferivelmente pelo menos 97%, mais preferivelmente pelomenos 98%, mais pref erivelmente pelo menos 99%, maispref erivelmente pelo menos 99,1%, mais pref erivelmente pelomenos 99,2%, mais preferivelmente pelo menos 99,3%, maispref erivelmente pelo menos 99,4%, mais pref erivelmente pelomenos 99,5%, mais preferivelmente pelo menos 99,6%, maispref erivelmente pelo menos 99,7%, mais pref erivelmente pelomenos 99,8%, e ainda mais preferivelmente pelo menos 99,9%idêntico a SEQ ID N° nomeada relevante.

PolinucleotIdeos da presente invenção podem possuir,quando comparado com moléculas de ocorrência natural, umaou mais mutações que são deleções, inserções, ousubstituições de resíduos de nucleotídeo. Os mutantes podemser de ocorrência natural (isto quer dizer, isolados de umafonte natural) ; ou sintéticos (por exemplo, pela execuçãode mutagênese dirigida ao sítio no ácido nucléico) .

Os oligonucleotídeos e/ou polinucleotídeos da invençãohibridizam com um gene de seda da presente invenção, ou umaregião flanqueando o gene, sob condições rigorosas. O termo"condições de hibridização rigorosas" e similares comoutilizado aqui, se refere a parâmetros com os quais atécnica está familiarizada, incluindo a variação datemperatura de hibridização com comprimento de umoligonucleotídeo. Parâmetros de hibridização de ácidonucléico podem ser encontrados em referências que compilamtais métodos, Sambrook e outros (supra) e Ausubel, e outros(supra). Por exemplo, condições de hibridização rigorosas,como utilizado aqui, podem se referir à hibridização a 65°Cem tampão de hibridização (3,5xSSC, 0,02% Ficoll, 0,02%polivinil pirrolidona, 0,02% Albumina de soro bovino (BSA),2,5 mM NaH2PO4 (pH 7), 0,5% SDSfj, 2 mM EDTA) , seguido poruma ou mais lavagens em 0,2xSSC, 0,01% BSA a 50 °C.Alternativamente, o ácido nucléico e/ou oligonucleotídeos(que podem ser também mencionados como "iniciadores" ou"sondas") hibridizam com a região de um genoma de inseto deinteresse, como o genoma de uma abelha de mel, sobcondições utilizadas em técnicas de amplificação de ácidonucléico como PCR.

Oligonucleotídeos da presente invenção podem ser RNA,DNA ou derivados de qualquer um. Embora os termospolinucleotídeo e oligonucleotídeo tenham significadosobreposto, oligonucleotídeos são tipicamente moléculas defita única; relativamente curtas'.' 0 tamanho mínimo de taisoligonucleotídeos é o tamanho exigido para a formação de umhíbrido estável entre um oligonucleotídeo e uma seqüênciacomplementar em uma molécula de ácido nucléico alvo.Preferivelmente, os oligonucleotídeos são pelo menos 15nucleotídeos, mais preferivelmente pelo menos 18nucleotídeos, mais preferivelmente pelo menos 19nucleotídeos, mais preferivelmente pelo menos 2 0nucleotídeos, ainda mais preferivelmente pelo menos 25nucleotídeos em comprimento.

Normalmente, monômeros de um polinucleotídeo ouoligonucleotídeo são ligados por ligações de fosfodiésterou análogos do mesmo para formar oligonucleotídeos quevariam em tamanho a partir de uma unidade monoméricarelativamente curta, por exemplo, 12-18, a várias centenasde unidades monoméricas. Análogos de ligações defosfodiéster incluem: fosforotioato, fosforoditioato,fosforoselenoato, fosforodiselenoato, fosforoanilotioato,fosforanilidato, fosforamidato.

A presente invenção inclui oligonucleotídeos que podemser utilizados como, por exemplo, sondas para identificarmoléculas de ácido nucléico, ou iniciadores para produzirmoléculas de ácido nucléico. Oligonucleotídeos da presenteinvenção utilizados como sonda são tipicamente conjugadoscom um rótulo detectável como radioisótopo, uma enzima,biotina, uma molécula fluorescente ou uma moléculaquimiluminescente.

Vetores recombinantes

Uma modalidade da presente invenção inclui um vetorrecombinante, que compreende pelo menos uma molécula depolinucleotídeo isolada da presente invenção, inserida emqualquer vetor capaz de fornecer a molécula depolinucleotídeo em uma célula hospedeira. Tal vetor contémseqüências de polinucleotídeos heterólogas, isto éseqüências de polinucleotídeo que não são naturalmenteencontradas adjacentes a moléculas de polinucleotídeos dapresente invenção e que preferivelmente são derivadas deuma espécie diferente da espécie da qual a(s) molécula(s)de polinucleotídeo (s) são derivadas. O vetor pode ser RNAou DNA, procariótico ou eucariótico, e tipicamente é umtransposon (como descrito na Patente US 5.792.294), um

vírus ou um plasmídeo.

Um tipo de vetor recombinante compreende uma moléculade polinucleotídeos da presente, invenção operativamenteligado a um vetor de expressão. O termo "operativamenteligado" se refere à inserção de uma molécula depolinucleotídeos em um vetor de expressão em um modo talque a molécula seja capaz de ser expressa quandotransformada em uma célula hospedeira. Como utilizado aqui,um vetor de expressão é um vetor de DNA ou RNA que é capazde transformar uma célula hospedeira e de efetuar expressãode uma molécula de polinucleotídeos especificada.

Preferivelmente, o vetor de expressão também é capaz dereplicar dentro da célula hospedeira. Vetores de expressãopodem ser procarióticos ou eucarióticos, e são tipicamentevirus ou plasmideos. Vetores de expressão da presenteinvenção incluem quaisquer vetores que funcionam (isto é,dirigir a expressão de gene) em células recombinantes dapresente invenção, incluindo em células bacterianas,fúngicas, endoparasitos, artrópodes, de animais e plantas.Vetores de expressão particularmente preferidos da presenteinvenção podem dirigir a expressão de genes em células deplantas. Vetores da invenção tajnbém podem ser utilizadospara produzir o polipeptideo em um sistema de expressãolivre de células, tais sistemas são bem conhecidos natécnica.

Em particular, vetores de expressão da presenteinvenção contêm seqüências reguladoras como seqüências decontrole de transcrição, seqüências de controletraducionais, origens de replicação, e outras seqüênciasreguladoras que são compatíveis com a célula recombinante eque controlam a expressão de moléculas de polinucleotídeosda presente invenção. Em. particular, moléculasrecombinantes da presente invenção incluem seqüências decontrole de transcrição. Seqüências de controle detranscrição são seqüências que controlam a iniciação,alongamento e terminação de transcrição. Seqüências decontrole de transcrição particularmente importantes sãoaquelas que controlam iniciação de transcrição,seqüências promotora, intensificadora, operadora erepressora. Seqüências de controle de transcriçãoapropriadas incluem qualquer ,^seqüência de controle detranscrição que possa funcionar pelo menos em uma dascélulas recombinantes da presente invenção. Uma variedadede tais seqüências de controle de transcrição é conhecidapor aqueles versados na técnica. Seqüências de controle detranscrição preferidas incluem aquelas que funcionam emcélulas bacterianas, de levedo, artrópodes, plantas oumamíferos, como, porém não limitadas a, tac, Iac, trp, trc,oxy-pro, omp/lpp, rrnB, lambda bacteriófago, bacteriófagoT7, T7lac, bacteriófago T3, bacteriófago SP6, bacteriófagoSPOl, metalotioneína, fator de casamento-alfa, Pichiaálcool oxidase, promotores subgenômicos alfavírus (comopromotores subgenômicos de vírus Sindbis), gene deresistência a antibiótico, baculovírus, vírus de insetoHeliothis zea, vírus de vacínia, vírus de herpes, raccoonpoxvirus, outros poxvirus, adenovírus, citomégalovirus(como promotores prematuros intermediários), vírus símio40, retrovírus, actina, repetição terminal longaretroviral, vírus de Rous sarcoma, choque térmico,seqüências de controle de transcrição de nitrato e fosfatobem como outras seqüências capazes de controlar expressãode gene em células procarióticas ou eucarióticas.

Seqüências de controle de transcrição particularmentepreferidas são promotores ativos em dirigir transcrição emplantas, quer constitutivament.e ou específica em estágioe/ou tecido, dependendo do uso;:, da planta ou partes damesma. Esses promotores de planta incluem, porém não sãolimitados a, promotores que mostram expressão constitutiva,como o promotor 35S de Vírus de Mosaico de Couve-flor(CaMV), aqueles para expressão específica de folha, como opromotor do gene de subunida4e pequena de carboxilasebifosfato ribulose, aqueles para expressão específica deraiz, como o promotor a partir "do gene glutamina sintase,aqueles para expressão específica de semente, como opromotor curciferin A a partir de Brassica napus, aquelespara expressão específica de túber, como o promotor patatinclasse I a partir de batata ou aqueles para expressãoespecífica de frutas, como o promotor poligalacturonase(PG) a partir de tomate.

Moléculas recombinantes da presente invenção podemconter também (a) sinais secretores (isto é, seqüências deácido nucléico de segmento de sinal) para permitir que umpolipeptídeo expresso da presente invenção seja secretado apartir da célula que produz o polipeptídeo e/ou (b) contémseqüências de fusão que levam à expressão de moléculas deácido nucléico da presente invenção como proteínas defusão. Os exemplos de segmentos de sinais apropriadosincluem qualquer segmento de sinal capaz de dirigir asecreção de um polipeptídeo da presente invenção. Segmentosde sinais preferidos incluem, porém não são limitados a,ativador de plasminogênio de tecido (t-PA), interferon,interleucina, hormônio de crescimento, segmentos de sinalde glicoproteína de envelope viral, peptídeo de sinalNicotiana nectarin (US 5.939.288), sinal de extensin detabaco, o sinal de proteína de ,ligação de corpo de óleo deoleosina de soja, peptídeo de. sinal quitinase básicovacuolar Arabidopsis thaliana, bem como seqüências desinais nativos de um polipeptídeo da invenção. Além disso,uma molécula de ácido nucléico da presente invenção podeser unida a um segmento de fusão que orienta o polipeptídeocodificado para o proteossoma, como segmento de fusão deubiquitina. Moléculas recombinantes também podem incluirseqüências intermediárias e/ou não traduzidas circundandoe/ou dentro das seqüências de ácido nucléico da presenteinvenção.

Células hospedeiras

Outra modalidade da presente invenção inclui umacélula recombinante que compreende uma célula hospedeiratransformada com uma ou mais moléculas recombinantes dapresente invenção, ou células de progênie das mesmas. Atransformação de uma molécula de polinucleotídeo em umacélula pode ser realizada por qualquer método pelo qual umamolécula de polinucleotídeo pode ser inserida na célula.Técnicas de transformação incluem, porém não são limitadasa, transfecção, eletroporação, microinjeção, lipofecção,adsorção e fusão de protoplastoV Uma célula recombinantepode permanece unicelular ou pode crescer em um tecido,órgão ou um organismo multicelular. Moléculas depolinucleotídeo transformadas da presente invenção podempermanecer extracromossômicas ou podem integrar em um oumais sítios dentro de um cromossomo da célula transformada(isto é, recombinante) de tal modo que sua capacidade a serexpressa é retida.

Células hospedeiras apropriadas para transformaçãoincluem qualquer célula que possa ser transformada com umpolinucleotídeo da presente invenção. Células hospedeirasda presente invenção podem ser endogenamente (isto é,naturalmente) capazes de produzir polipeptídeos da presenteinvenção ou podem ser capazes de produzir taispolipeptídeos após serem transformadas com pelo menos umamolécula de polinucleotídeos da presente invenção. Ascélulas hospedeiras da presente invenção podem ser qualquercélula capaz de produzir pelo menos uma proteína dapresente invenção, e incluem células bacterianas, fúngicas(incluindo levedo), parasita, artrópodes, de animais eplantas. Os exemplos de células hospedeiras incluemSalmonella, Escherichia, Bacillus, Listeria, Saccharomyces,Spodoptera, Mycobacteria, Trichplusia, células BHK (rim defilhote de hamster), células MDCK, células CRFK, célulasCV-1, células COS (por exemplo, COS-7) e células vero.Exemplos adicionais de células hospedeiras são E.coli,incluindo derivados de E.coli K-12; Salmonella typhi;Salmonella typhimurium, incluindo cepas atenuadas;Spodoptera frugiperda; Trichoplusia ni; e células G8 demioblasto de camundongo não tumorigênico (por exemplo, ATCCCRL 124 6). Hospedeiros de células de mamíferos apropriadasadicionais incluem outras linhagens de células de rim,outras linhagens de células de fibroblasto (por exemplo,linhagens de células de fibroblasto de embrião de serhumano, murino ou galinha), linhagens de células demieloma, células de ovário de hamster chinês, célulasNIH/3T3 de camundongo, células LMTK e/ou células HeLa.Células hospedeiras particularmente preferidas são célulasde plantas como aquelas disponíveis a partir de DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH (GermanCollection of Microorganisms and Cell Cultures).

Tecnologias de DNA recombinantes podem ser utilizadaspara melhorar a expressão de uma molécula depolinucleotídeo transformada por manipulação, por exemplo,do número de cópias da molécula de polinucleotídeo em umacélula hospedeira, a eficiência com a qual aquelasmoléculas de polinucleotídeo são transcritas, a eficiênciacom a qual os transcritos resultantes são traduzidos, e aeficiência de modificações pós-translação. Técnicasrecombinantes úteis para aumentar a expressão de moléculasde polinucleotídeos da presente invenção incluem, porém nãosão limitados a, ligar operativamente moléculas depolinucleotídeo a plasmídeos com número de cópia elevado,integração da molécula de polinucleotídeo em um ou maiscromossomos de células hospedeiras, adição de seqüências deestabilidade de vetor a plasmídeos, substituições oumodificações de sinais de controle de transcrição (porexemplo, promotores, operadores, intensificadores),substituições ou modificações de sinais de controletraducionais (por exemplo, sítios de ligação de ribossomo,seqüências Shine-Dalgarno) , modificação de moléculas depolinucleotídeos da presente invenção para corresponder aouso de códon da célula hospedeira, e a deleção deseqüências que desestabilizam transcritos.

Plantas transgênicas

O termo "planta" se refere a plantas inteiras, órgãosde plantas (por exemplo, folhas, caules raízes, etc.),sementes, células de plantas e similares. Plantasconsideradas para uso na prática da presente invençãoincluem tanto monocotilédones como dicotilédones. Plantasalvo incluem, porém não são limitadas as seguintes: cereais(trigo, cevado, centeio, aveia, arroz, sorgo e culturasrelacionadas); beterraba (beterraba e beterraba paraforragera); pomos, frutas com caroço e fruta macia (maçãs,pêras, ameixas, pêssegos, amêndoas, cerejas, morangos,framboesas e amoras pretas); plantas leguminosas (feijões,lentilhas, ervilhas, sojas) ; plantas de óleo (colza,mostarda, papoula, azeitonas, girassóis, coco, plantas deóleo de mamona, sementes de cacau, amendoins); plantas depepino (polpa, pepinos, melões); plantas de fibras(algodão, linho, cânhamo, juta); frutas cítricas (laranjas,limões, toranja, tangerinas); legumes (espinafre, alface,aspargos, repolhos, cenouras, cebolas, tomates, batatas,páprica); laurácea (abacates, canela, cânfora); ou plantascomo milho, fumo, nozes, café, cana de açúcar, chá,videiras, lúpulos, turfa, bananas e plantas de borrachanatural, bem como ornamentais (flores, arbustos, árvorescom folhas largas e sempre-vivas, como coníferas).

Plantas transgênicas, como definido no contexto dapresente invenção incluem plantas (bem como partes ecélulas das plantas) e sua progênie que foram genericamentemodificadas utilizando técnicas recombinantes para causar aprodução de pelo menos um polipeptídeo da presente invençãona planta desejada ou órgão da planta. Plantas transgênicaspodem ser produzidas utilizando técnicas conhecidas naarte, como aquelas descritas genericamente por A. Slater eoutros, Plant Biotechnology - The Genetic Manipulation ofPlants, Oxford University Press (2003), e P. Christou e H.Klee, Handbook of Plant Biotechnology, John Wiley and Sons(2004) .

Um polinucleotídeo da presente invenção pode serexpresso de forma constitutiva nas plantas transgênicasdurante todos os estágios de desenvolvimento. Dependendo douso da planta ou órgãos de planta, os polipeptídeos podemser expressos em um modo especifico de estágio. Além disso,os polinucleotideos podem ser expressos especificamente para tecido.

Seqüências reguladoras que são conhecidas ou sãoverificadas como causando expressão de um gene codificandoum polipeptideo de interesse em plantas podem serutilizadas na presente invenção. A escolha das seqüênciasreguladoras utilizadas depende da planta alvo e/ou órgãoalvo de interesse. Tais seqüências reguladoras podem serobtidas a partir de plantas ou vírus de plantas, ou podemser quimicamente sintetizadas. Tais seqüências reguladorassão bem conhecidas por aqueles versados na arte.

Promotores de planta constitutivos são bem conhecidos.Além dos promotores previamente mencionados, alguns outrospromotores apropriados incluem, porém não são limitados aopromotor de sintase de nopalina, o promotor de sintase deoctopina, promotor caMV 35S, o promotor ribulose-1,5-bisfosfato carboxilase, pEmu baseado em AdhI, Actl, opromotor sintase SAM e promotores Ubi e o promotor daproteína de ligação a/b de clorofila. Alternativamente,pode ser desejável ter o(s) transgene(s) expresso em ummodo regulado. A expressão regulada dos polipeptídeos épossível pela colocação da seqüência de codificação daproteína de seda sob o controle de promotores que sãoespecíficos para tecido, específicos para desenvolvimento,ou induzíveis. Vários genes e/ou promotores reguladosespecíficos de tecido foram reportados em plantas. Essesincluem genes que codificam as proteínas de armazenagem desemente (como napin, crucif erin,., β-conglicinina, glicininae faseolina) , zeína ou proteínas de corpo de óleo (comooleosina), ou genes envolvidos em biossíntese de ácidograxo (incluindo proteína portadora de acila, desaturase deACP-estearoíla, e desaturases de ácido graxo (fad 2-1)), eoutros genes expressos durante desenvolvimento de embrião(como Bce4). Particularmente útil para expressão específicade semente é o promotor vicilina de ervilha. Outrospromotores úteis para expressão em folhas maduras sãoaqueles que são ligados no início de senescência, como opromotor SAG a partir de Arabidopsis. Uma classe depromotores específicos de frutas expressos em ou duranteantese através do desenvolvimento de frutas, pelo menos atéo início de amadurecimento, é discutida em US 4.943.674.Outros exemplos de promotores específicos de tecido incluemaqueles que dirigem expressão em túberes (por exemplo,promotor de gene patatin) e em células de fibras (umexemplo de uma proteína de célula de fibra regulada no modode desenvolvimento é fibra E6).

Outras seqüências reguladoras como seqüênciasterminadoras e sinais de poliadenilação incluem qualquertal seqüência funcionando como tal em plantas, cuja escolhaseria óbvia para o destinatário versado. A região determinação utilizada no cassete de expressão será escolhida

Λ ,

principalmente por conveniência, uma vez que as regiões determinação parecem ser relativamente intercambiáveis. Aregião de terminação que é utilizada pode ser nativa com aregião de iniciação de transcrição, pode ser nativa com aseqüência de polinucleotídeo de interesse, ou pode serderivada de outra fonte. A região de terminação pode ser deocorrência natural, ou total 'ou parcialmente sintética.Regiões de terminação convenientes são disponíveis a partirdo plasmídeo Ti de A. tumefaciens, como as regiões determinação octopina sintase e nopalina sintase ou a partirdos genes para β-faseolina, o gene Iant quimicamenteinduzível, pIN.

Várias técnicas são disponíveis para a introdução deuma construção de expressão contendo uma seqüência deácidos nucléicos que codifica um polipeptídeo de interessenas plantas alvo. Tais técnicas incluem, porém não sãolimitadas à transformação de protoplastos utilizando ométodo de cálcio/polietileno glicol, eletroporação emicroinjeção ou bombardeio de partículas (revestidas). Alémdesses denominados métodos de transformação de DNA direto,sistemas de transformação envolvendo vetores são amplamentedisponíveis, como vetores virais e bacterianos (porexemplo, a partir do gênero Agrobacterium). Após seleçãoe/ou classificação, os protoplastos, células ou partes deplantas que foram transformados podem ser regenerados emplantas inteiras, utilizando métodos conhecidos na técnica.A escolha das técnicas de transformação e/ou regeneraçãonão é crítica para essa invenção.

Para confirmar a presença dos transgenes em célulastransgênicas e plantas, uma .amplificação de reação decadeia polimerase (PCR) ou análise de Southern blot podeser executada utilizando métodos conhecidos por aquelesversados na arte. Produtos de expressão dos transgenespodem ser detectados em qualquer de uma variedade de modos,dependendo da natureza do produto, e incluem ensaio deenzima e Western blot. Um modo particularmente útil paraquantificar expressão de proteína e detectar replicação emdiferentes tecidos de planta é utilizar um gene repórter,como GUS. Após obtenção das plantas transgênicas, as mesmaspodem ser cultivadas para produzir tecidos ou partes deplantas tendo o fenótipo desejado. As partes de planta, outecido de planta, podem ser colhidos e/ou a sementecoletada. A semente pode servir como uma fonte paracultivar plantas adicionais com tecidos ou partes tendo ascaracterísticas desejadas.

Animais Hon-humanos transgênicos

Técnicas para produzir animais transgênicos são bemconhecidas na arte. Um livro geral útil sobre esse assuntoé Houdebine, Transgenic animais - generation and use(Harwood Academic, 1997).

DNA heterólogo pode ser introduzido, por exemplo, emovos de mamífero fertilizados. Por exemplo, células-troncototipotentes ou pluripotentes podem ser transformadas pormicroinjeção, precipitação mediada por fosfato de cálcio,fusão de lipossoma, infecção retroviral ou outro meio, ascélulas transformadas são então introduzidas no embrião, eo embrião então se desenvolve em um animal transgênico. Emum método altamente preferido, embriões em desenvolvimentosão infectados com um retrovírus contendo o DNA desejado, eanimais transgênicos produzidos a partir do embriãoinfectado. Em um método mais preferido, entretanto, os DNAsapropriados são co-injetados no pronúcleo ou citoplasma deembriões, preferivelmente no estágio de célula única, e osembriões deixados desenvolver :.em animais transgênicosmaduros.

Outro método utilizado para produzir um animaltransgênico envolve micro-injetar um ácido nucléico em ovosde estágio pró-nuclear por métodos padrão. Ovos injetadossão então cultivados antes da transferência para dentro deovidutos de receptores pseudográvidas.

Animais transgênicos podem ser produzidos também portecnologia de transferência nuclear. Utilizando essemétodo, fibroblastos a partir de animais doadores sãoestavelmente transfectados com um plasmídeo que incorporaas seqüências de codificação para um domínio de ligação oupartner de ligação de interesse sob o controle deseqüências reguladoras. Meios de transfecção estáveis sãoentão fundidos para oocitos enucleados, cultivados etransferidos para receptoras fêmeas.

Métodos de recuperação e produção de seda

As proteínas da seda da presente invenção podem serextraídas e purificadas a partir de células recombinantes,como células de planta, bactérias ou levedo, produzindo aproteína por uma variedade de métodos. Em uma modalidade, ométodo envolve a remoção de proteínas de células nativas apartir de células/tecidos/plantas homogeneizadas, etc.diminuindo o pH e aquecimento, seguido por fracionamento desulfato de amônio. Resumidamente, proteínas solúveis totaissão extraídas por homogeneização decélulas/tecidos/plantas. Proteínas nativas são removidaspor precipitação em pH 4,7 e então a 60°C. O sobrenadanteresultante é então dividido com sulfato de amônio a 4 0% desaturação. A proteína resultante será da ordem de 95% pura.Purificação adicional pode ser obtida com cromatografia deafinidade ou gel convencional.

Em outro exemplo, lisados de célula são tratados comconcentrações elevadas de ácido, por exemplo, HCl ou ácidopropiônico para reduzir o pH para -1-2 por 1 hora ou maisque solubilizará as proteínas da seda porém precipitaráoutras proteínas.

Agregados fibrilares formarão a partir de soluções porautomontagem espontânea de protèinas da seda da invençãoquando a concentração de proteína excede um valor crítico.Os agregados podem ser reunidos e fiados mecanicamente emfibras macroscópicas de acordo com o método de O7Brien eoutros (I. 0'Brien e outros, "Design Synthesis andfabrication of novel self-assembling fibrillar proteins",em Silk Polymers: Materials Science and Biotechnology, pág.104-117, Kaplan, Adams, Farmer e Viney, eds., c. 1994 porAmerican Chemical Society, Washington, D.C.).

Por natureza da estrutura secundária de espiralenrolada inerente, proteínas como Xenospiral-4, BBF1-4,BAF1-4 e GAFl-4 formarão espontaneamente a estruturasecundária de espiral enrolada" após desidratação. Comodescrito abaixo, a resistência de espiral enrolada pode serintensificada através de reticulação enzimática ou químicade resíduos de lisina em proximidade estreita.

Fibras de seda e/ou copolímeros da invenção têm umabaixa exigência de processamento. As proteínas da seda dainvenção exigem processamento mínimo, por exemplo, fiaçãopara formar uma fibra forte visto que espontaneamenteformam espiras enroladas fortes que podem ser reforçadoscom reticulações como reticulações de lisina. Issocontrasta com polipeptídeos de seda recombinante de aranhae B. mori que exigem técnicas d.e. fiação sofisticadas paraobter a estrutura secundária (β-folha) e resistência dafibra.

Entretanto, fibras podèm ser fiadas a partir desoluções tendo propriedades características de uma fase decristal líquida. A concentração de fibra na qual atransição de fase pode ocorrer depende da composição de umaproteína ou combinação de proteínas presentes na solução. Atransição de fase, entretanto, pode ser detectada pormonitoração da claridade e birrefringência da solução. Oinício de uma fase de cristal líquida pode ser detectadoquando a solução adquire uma aparência translúcida eregistra birrefringência quando visualizado através defiltros de polarização cruzados.

Em uma técnica de formação de fibras, fibras podem serprimeiramente extrusadas a partir da solução de proteínaatravés de um orifício para dentro de metanol, até que umcomprimento suficiente para ser coletado por um meiomecânico é produzido. A seguir uma fibra pode ser puxadapor tal meio mecânico através de uma solução de metanol;coletada, e seca. Métodos para estirar fibras sãoconsiderados bem conhecidos na técnica.

Exemplos adicionais de métodos que podem serutilizados para produzir fibras de seda e/ou copolímeros dapresente invenção são descritos em US 2004/0170827 e US2005/0054830.

Em uma modalidade preferida, fibras de seda e/oucopolímeros da invenção são reticulados. Em uma modalidade,as fibras de seda e/ou copolímeros são reticulados em umasuperfície/artigo/produto etc. de interesse utilizandotécnicas conhecidas na arte. Em outra modalidade (ou emcombinação com a modalidade anterior), pelo menos algumasproteínas da seda nas fibras de seda e/ou copolímeros sãoreticulados entre si. Preferivelmente, as proteínas da sedasão reticuladas através de resíduos de lisina nasproteínas. Tal reticulação pode ser executada utilizandotécnicas químicas e/ou enzimáticas conhecidas na arte. Porexemplo, reticulações enzimáticas podem ser catalisadas porlisil oxidase, ao passo que reticulações não enzimáticaspodem ser geradas a partir de resíduos de lisina glicada(Reiser e outros; 1992).

Anticorpos

A invenção também provê anticorpos monoclonais oupoliclonais para polipeptídeos da invenção ou fragmentosdos mesmos. Desse modo, a presente invenção provê ainda umprocesso para a produção de anticorpos monoclonais oupoliclonais para polipeptídeos da invenção.

O termo "se liga especificamente" se refere àcapacidade do anticorpo de se ligar em pelo menos umpolipeptídeo da presente invenção, porém não a outrasproteínas da seda conhecidas.

Como utilizado aqui, o termo,"epítopo" se refere a umaregião de um polipeptídeo da invenção que é ligada peloanticorpo. Um epítopo de ser administrado a um animal paragerar anticorpos contra o epítopo, entretanto, anticorposda presente invenção ligam preferivelmente especificamentea região de epítopo no contexto do polipeptídeo inteiro.

Se anticorpos policlonais forem desejados, um mamíferoselecionado (por exemplo, camundongo, coelho, cabra,cavalo, etc.) é imunizado com um polipeptídeo imunogênicoda invenção. Soro a partir do animal imunizado é coletado etratado de acordo com procedimentos conhecidos. Se sorocontendo anticorpos policlonais contiver anticorpos paraoutros antígenos, os anticorpos policlonais podem serpurificados por cromatografia de imunoafinidade. Astécnicas para se produzir e processar o anti-soropoliclonal são conhecidas na arte. Para que tais anticorpospossam ser feitos, a invenção também provê polipeptídeos dainvenção ou fragmentos dos mesmos haptenizados com outropolipeptídeo para uso como imunogenos em animais.

Anticorpos monoclonais dirigidos contra polipeptídeosda invenção também podem ser prontamente produzidos por umapessoa versada na técnica. A metodologia geral para fazeranticorpos monoclonais por hibridomas é bem conhecida.Linhagens de células que produzem anticorpos imortais podemser criadas por fusão de células, e também por outrastécnicas como transformação direta de linfócitos B com DNAoncogênico, ou transfecção com vírus Epstein-Barr. Painéisde anticorpos monoclonais produzidas podem serclassificados para várias propriedades, isto é, paraafinidade de epítopo e isotipo.

Uma técnica alternativa envolve classificação debibliotecas de exibição de fagòs onde, por exemplo, osfagos expressam fragmentos scFv na superfície de seurevestimento com uma grande variedade de regiões dedeterminar complementaridade (CDRs). Essa técnica é bemconhecida na arte.

Para fins da presente invenção, o termo "anticorpo", amenos que especificado ao contrário, inclui fragmentos deanticorpos inteiros que retêm sua atividade de ligação paraum antígeno alvo. Tais fragmentos incluem fragmentos Fv,F(ab') e F(ab')2, bem como anticorpos de cadeia única(scFv). Além disso, os anticorpos e fragmentos dos mesmospodem ser anticorpos humanizados, por exemplo, comodescrito em EP-A-239400.

Anticorpos da invenção podem ser ligados a um suportesólido e/ou embalados em kits em um recipiente apropriadojuntamente com reagentes apropriados, controles, instruçõese similares.

Preferivelmente, anticorpos da presente invenção sãorotulados de forma detectáyel. Rótulos detectáveisexemplares que permitem medição direta de ligação deanticorpo incluem radiorrótulos, fluoróforos, corantes,contas magnéticas, meios de quimiluminescência, partículascoloidais, e similares. Os exemplos de rótulos que permitemmedição indireta de ligação incluem enzimas onde osubstrato pode fornecer um produto colorido oufluorescente. Rótulos detectáveis exemplares adicionaisincluem enzimas covalentemente ligadas capazes de fornecerum sinal de produto detectável após adição de substratoapropriado. Os exemplos de enzimas apropriadas para uso emconjugados incluem peroxidase da raiz forte, fosfatasealcalina, desidrogenase malato è similares. Onde nao estãocomercialmente disponível, esses conjugados de enzima-anticorpo são prontamente produzidas por técnicasconhecidas por aqueles versados na arte. Rótulosdetectáveis exemplares, adicionais incluem biotina, que seliga com afinidade elevada a avidina ou estreptavidina;fluorocromos (por exemplo, ficobiliproteínas, ficoeritrinae aloficocianinas; fluoresceína e vermelho Texas), quepodem ser utilizados com um separador de células ativadopor fluorescência; haptenos; e similares. Preferivelmente,o rótulo detectável permité medição direta em umluminômetro de placa, por exemplo, biotina. Tais anticorposrotulados podem ser utilizados em técnicas conhecidas naarte para detectar polipeptídeos da invenção.

Composições

Composições da presente invenção podem incluir um"veículo aceitável". Os exemplos de tais veículosaceitáveis incluem água, solução salina, solução de Ringer,solução de dextrose, solução de Hank, e outras soluções desal fisiologicamente equilibradas, aquosas. Veículos nãoaquosos, como óleos fixos, óleo de gergelim, oleato deetila ou triglicerídeos podem ser também utilizados.

Em uma modalidade, o "veículo aceitável" é um "veículofarmaceuticamente aceitável". O termo veículofarmaceuticamente aceitável se refere a entidadesmoleculares e composições que não produzem uma reaçãoalérgica, tóxica ou de outro modo adversa quandoadministrada a um animal, particularmente um mamífero, emais particularmente um ser humano. Exemplos úteis deveículos farmaceuticamente aceitáveis ou diluentes incluem,porém não são limitados a, solventes, meios de dispersão,revestimentos, estabilizadores, colóides de proteção,adesivos, espessantes, agentes tixotrópicos, agentes depenetração, agentes sequestrantes e agentes de retardo deabsorção e isotônicos que nãó,! afetam a atividade dospolipeptídeos da invenção. A fluidez adequada pode sermantida, por exemplo, pelo uso de um revestimento, comolecitina, pela manutenção do tamanho exigido de partículasno caso de dispersão e pelo uso de tensoativos. Maisgenericamente, os polipeptídeos da invenção podem sercombinados com qualquer aditivo líquido ou sólido nãotóxico correspondendo às técnicas de formulação usuais.

Como delineado aqui, em. algumas modalidades umpolipeptídeo, uma fibra de seda e/ou um copolímero dainvenção é utilizada como um veículo farmaceuticamenteaceitável.

Outras composições apropriadas são descritas abaixocom referência específica a usos específicos dospolipeptídeos da invenção.

Usos

Proteínas da seda são úteis para a criação de novosbiomateriais devido a sua excepcional tenacidade eresistência. Entretanto, até a presente data as proteínasfibrosas de aranhas e insetos são proteínas grandes (maisde 100 kDa) e consistem em seqüências de aminoácidosaltamente repetitivos. Essas proteínas são codificadas porgenes grandes contendo códons altamente polarizadostornando os mesmos particularmente difíceis de se produzirem sistemas recombinantes. Por comparação, as proteínas daseda da invenção são curtas e não repetitivas. Essaspropriedades tornam os genes que codificam essas proteínasparticularmente atraentes para produção recombinante denovos biomateriais.

As proteínas da seda, fibras de seda e/ou copolímerosda invenção podem ser utilizados para um conjunto amplo ediverso de aplicações médicas, militares, industriais ecomerciais. As fibras podem ser utilizadas na fabricação dedispositivos médicos como suturas, enxertos de pele,matrizes de crescimento celular, ligamentos desubstituição, e malha cirúrgica, e em uma ampla gama deprodutos industriais e comerciais, como, por exemplo, cabo,corda, rede, linha de pescar, pano de roupas, revestimentode colete à prova de balas, pano de recipiente, mochilas,mochilas de soldados, tiras de bolsa ou carteira, materialde ligação adesivo, material de ligação não adesivo,material de tiras, tecido de tenda, lonas, coberturas depiscinas, coberturas para carros, material de cerca,vedante, material de construção, material à prova decondições climáticas, material de divisão flexível,equipamento esportivo; e, na realidade, em quase qualqueruso de fibra ou tecido para o qual a elasticidade e aresistência à tração, elevadas, são característicasdesejáveis. As proteínas da seda, fibras de seda e/oucopolímeros da presente invenção têm também aplicações emcomposições para produtos de higiene pessoal comocosméticos, tratamento de pele, tratamento de cabelos ecoloração de cabelos; e em revestimento de partículas, comopigmentos.

As proteínas da seda podem ser utilizadas em sua formanativa ou podem ser modificadas para formar derivados, quefornecem um efeito mais benéfico. Por exemplo, a proteínade seda pode ser modificada por conjugação com um polímeropara reduzir alergenicidade como descrito em US 5.981.718 eUS 5.856.451. Polímeros modificadores apropriados incluem,porém não são limitados a óxidos de polialquileno, álcoolde polivinil, poli-carboxilatos, poli(vinil pirrolidona) edextranos. Em outro exemplo, as p;roteínas da seda podem sermodificadas por digestão seletiva e junção de outrosmodificadores de proteína. Por exemplo, as proteínas daseda podem ser clivadas em unidades menores de peptídeo portratamento com ácido em uma temperatura elevada deaproximadamente 60°C. Os ácidos úteis incluem, porém nãosão limitados a, ácidos clorídrico, sulfúrico ou fosfóricodiluídos. Alternativamente, a digestão das proteínas daseda pode ser feita por trataimènto com uma base, comohidróxido de sódio, ou digestão enzimática utilizando umaprotease apropriada pode ser utilizada.

As proteínas podem ser adicionalmente modificadas parafornecer características de desempenho que são benéficas emaplicações específicas para produtos de higiene pessoal. Amodificação de proteínas para uso em produtos de higienepessoal é bem conhecida na técnica. Por exemplo, métodoscomumente utilizados são descritos em US 6.303.752, US6.284.246, e US 6.358.501. Os exemplos de modificaçõesincluem, porém não são limitados a, etoxilação parapromover intensificação de emulsão de água-óleo,siloxilação para fornecer compatibilidade lipofílica, eesterificação para auxiliar em compatibilidade comcomposições de detergente e sabão. Adicionalmente, asproteínas da seda podem ser derivadas com grupos funcionaisincluindo, porém não limitados a, aminas, oxiranes,cianatos, ésteres de ácido carboxílico, copolióis desilicone, ésteres de siloxano, alifáticos de Aminaquaternizada, uretanos, poliacrilamidas, ésteres de ácidodicarboxílico e ésteres halogenados. As proteínas da sedatambém podem ser derivadas por reação com diiminas e pelaformação de sais de metal.

Compatível com as definiçõ.e.s acima de "polipeptídeo"(e "proteína"), tais moléculas derivadas e/ou modificadassão também mencionadas aqui amplamente como "polipeptídeos"e "proteínas".

Proteínas da seda da invenção podem ser fiadas juntase/ou em feixes ou trançadas com outros tipos de fibras. Osexemplos incluem, porém não são limitados a, fibraspoliméricas (por exemplo, polipropileno, náilon,poliéster) , fibras e sedas de "Outras fontes de planta eanimal (por exemplo, algodão, lã, seda de aranha ou Bombyxmori) e fibras de vidro. Uma modalidade preferida é fibrade seda trançada com 10% de fibra de polipropileno. Apresente invenção considera que a produção de taiscombinações de fibras pode ser prontamente posta em práticapara aumentar quaisquer características desejadas, porexemplo, aparência, maciez, peso, durabilidade,propriedades de repelir água, custo de fabricaçãoaperfeiçoado, que podem ser genericamente buscadas nafabricação e produção de fibras para aplicações médica,industrial ou comercial.

Produtos de higiene pessoal

Composições para tratamento da pele e cosméticos podemser composições anidras compreendendo uma quantidade eficazde proteína de seda em um meio cosmeticamente aceitável. Osusos dessas composições incluem, porém não são limitadas a,produtos para tratamento de pele, limpeza de pele,maquiagem e anti-rugas. Uma quantidade eficaz de umaproteína de seda para composições de tratamento de pele ecosméticas é aqui definida como uma proporção deaproximadamente 10"4 a aproximadamente 30% em peso, porémpreferivelmente de aproximadamente 10"3 a 15% em peso, emrelação ao peso total da compos.ição. Essa proporção podevariar como uma função do tipo de composição paratratamento de pele ou cosmética. Composições apropriadaspara um meio cosmeticamente aceitável são descritas em US6.280.747. Por exemplo, o meio cosmeticamente aceitávelpode conter uma substância graxa em uma proporçãogenericamente de aproximadamente 10 a aproximadamente 90%em peso em relação ao peso total da composição, onde a fasegraxa contendo pelo menos uma substância graxa líquida,sólida ou semi-sólida. A substância graxa inclui, porém nãoé limitada a, óleos, ceras, gomas, e as substâncias graxasdenominadas pastosas. Alternativamente, as composiçõespodem estar na forma de uma dispersão estável como umaemulsão de água em óleo ou óleo em água. Adicionalmente, ascomposições podem conter um ou mais aditivos ou adjuvantescosméticos ou dermatológicos convencionais, incluindo,porém não limitados a, antioxidantes, agentes conservantes,cargas, tensoativos, filtros solares UVA e/ou UVB,fragrâncias, espessantes, agentes umectantes e polímerosaniônicos, não iônicos e anfotéricos, e corantes oupigmentos.

Cosméticos emulsifiçados e quase fármacos que sãoproduzíveis com o uso de materiais emulsifiçadoscompreendendo pelo menos uma proteína de seda da presenteinvenção incluem, por exemplo, cosméticos de limpeza(sabonete de beleza, lavagem facial, xampu, enxágüe e similares),produtos para tratar os cabelos (tinta decabelos, cosméticos dos cabelos e similares), cosméticosbásicos (creme geral, emulsão, creme de barbear,condicionador, colônia, loção de barbear, óleo cosmético,máscara facial, e similares) í: cosméticos de maquiagem(base, lápis de sobrancelha, creme para os olhos, sombrapara os olhos, máscara, e similares), cosméticos aromáticos(perfume e similares) , cosméticos de filtro solar ebronzeamento (creme de filtro solar e bronzeamento, loçãode filtro solar e bronzeamento, óleo de filtro solar ebronzeamento, e similares), cosméticos para as unhas (cremepara as unhas e similares) , cosméticos de eyeliner(eyeliner e similares) , cosméticos para os lábios (batom,creme para os lábios e similares) , produtos para higieneoral (pasta de dente e similares), cosméticos para o banho(produtos de banho e similares) e similares.

A composição de cosmético também pode estar na formade produtos para tratamento das unhas, como esmalte.Esmaltes são aqui definidos como composições para otratamento e coloração de unhas, compreendendo umaquantidade eficaz de proteína de seda em um meiocosmeticamente aceitável. Uma quantidade eficaz de umaproteína de seda para uso em uma composição de esmalte éaqui definida como uma proporção de aproximadamente IO"4 aaproximadamente 3 0% em peso em relação ao peso total doesmalte. Componentes de um meio cosmeticamente aceitávelpara esmaltes são descritos em US 6.280.747. 0 esmaltecontém tipicamente um solvente e uma substância de formaçãode filme, como derivados de celulose, derivados depolivinil, polímeros ou copolímeros acrílicos, copolímerosde vinil e polímeros de poliéster. A composição também podeconter um pigmento orgânico ou inorgânico.

Composições para tratamento dos cabelos são aquidefinidas como composições para o tratamento de cabelos,incluindo, porém não limitadas a xampus, condicionadores,loções, aerossóis, géis e mousses, compreendendo umaquantidade eficaz de proteína de seda em um meiocosmeticamente aceitável. Uma quantidade eficaz de umaproteína de seda para uso em uma composição para tratamentodos cabelos é aqui definida como uma proporção deaproximadamente IO"2 a aproximadamente 90% em peso emrelação ao peso total da composição. Componentes de um meiocosmeticamente aceitável para composições de tratamento decabelos são descritas em US 2004/0170590, US 6.280.747, US6.139.851 e US 6.013.250. Por exemplo, essas composições detratamento de cabelos podem ser soluções aquosas,alcoólicas ou aquosas-alcoólicas, o álcool sendopreferivelmente etanol ou isopropanol, em uma proporção deaproximadamente 1 aproximadamente 75% em peso em relação aopeso total, para as soluções aquosas-alcoólicas.

Adicionalmente, as composições de tratamento de cabelospodem conter um ou mais aditivos ou adjuvantes cosméticosou dermatológicos, convencionais, como dado acima.

Composições para coloração de cabelos são aquidefinidas como composições para a coloração, tingimento ouclareamento de cabelos, compreendendo uma quantidade eficazde proteína de seda em um meio cosmeticamente aceitável.Uma quantidade eficaz de uma proteína de seda para uso emuma composição de coloração de cabelos é aqui definida comouma proporção de aproximadamente IO"4 a aproximadamente 60%em peso em relação ao peso total da composição. Componentesde um meio cosmeticamente aceitável para composições decoloração de cabelos são descritos em US 2004/0170590, US6.398.821 e US 6.129.770. Por exemplo, composições decoloração de cabelos contêm genericamente uma mistura deagente de oxidação de corante baseado em peroxigênioinorgânico e um agente de coloração oxidável. 0 agente deoxidação de corante baseado em peroxigênio é mais comumenteperóxido de hidrogênio. Os agentes de coloração de cabelosoxidativos são formados por acoplamento oxidativo deintermediários primários (por exemplo, p-fenilenodiaminas,p-aminofenóis, p-diaminopiridinas, hidróxi indóis, aminoindóis, aminotimidinas, ou cianofenóis) com intermediáriossecundários (por exemplo fenóis, resorcinóis, m-aminofenóis, m-fenilenodiaminas, naftóis, pirazolonas,hidróxi indóis, catecóis ou pirazóis). Adicionalmente,composições de coloração de cabelos podem conter ácidos deoxidação, sequestrantes, estabilizadores, espessantes,tampões veículos, tensoativos, solventes, antioxidantes,polímeros, corantes não oxidativos e condicionadores.

As proteínas da seda podem ser também utilizadas pararevestir pigmentos e partículas de cosmético para melhorara capacidade de dispersão das partículas para uso emcosméticos e composições de revestimento. Partículas decosmético são aqui definidas como materiais em partículascomo pigmentos ou partículas inertes que são utilizadas emcomposições cosméticas. Pigmentos e partículas decosméticos apropriados incluem, porém não são limitados a,pigmentos de cor inorgânicos, pigmentos orgânicos epartículas inertes. Os pigmentos de cor inorgânicosincluem, porém não são limitados a, dióxido de titânio,óxido de zinco, e óxidos de ferro, magnésio, cobalto ealumínio. Pigmentos orgânicos incluem, porém não sãolimitados a, D&C Vermelho no. 36; D&C Laranja no. 17;pigmentos de cálcio de D&C Vermelho nos. 7, 11, 31 e 34, opigmento de bário de D&C Vermelho no. 12, o pigmento deestrôncio D&C vermelho no. 13, o pigmento de alumínio deFD&C Amarelo no. 5 e partículas de negro de fumo.Partículas inertes incluem, porém não são limitados a,carbonato de cálcio, silicato de alumínio, silicato decálcio, silicato de magnésio, mica, talco, sulfato debário, sulfato de cálcio, Nylon™ em pó, alcanosperfluorados, e outros plásticos inertes.

As proteínas da seda podem ser utilizadas também emfio dental (vide, por exemplo, US 2005/0161058) . O fio podeser fio monofilamento ou fio multifilamento, e as fibraspodem ser ou não torcidas. O fio dental pode ser embaladocomo pedaços individuais ou em um rolo com um cortador paracortar pedaços em qualquer comprimento desejado. 0 fiodental pode ser fornecido em uma variedade de formatosdiferentes de filamentos como tiras, folhas e similares,porém não limitados a eles. 0 fio pode ser revestido commateriais diferentes como cera; fio de monofilato depolitetrafluoroetileno para fio, porém não limitados aeles.

As proteínas da seda também podem ser utilizadas emsabonete (vide, por exemplo, US 2005/013 0857).

Revestimento de partícula de cosmético e pigmentoA quantidade eficaz de uma proteína de seda para usoem revestimento de partícula de cosmético e pigmento é aquidefinida como uma proporção de aproximadamente IO"4 aaproximadamente 5 0%, porém preferivelmente deaproximadamente 0,25 a aproximadamente 15% em peso emrelação ao peso seco de partícula. A quantidade ótima daproteína de seda a ser utilizada depende do tipo depigmento ou partícula de cosmético sendo revestida. Porexemplo, a quantidade de proteína de seda utilizada compigmentos de cor inorgânicos ~,,é preferivelmente entreaproximadamente 0,01% e 20% em peso. No caso de pigmentosorgânicos, a quantidade preferida de proteína de seda estáentre aproximadamente 1% e aproximadamente 15% em peso,enquanto para partículas inertes, a quantidade preferidaestá entre aproximadamente 0,25% a aproximadamente 3% empeso. Os métodos para a preparação de pigmentos revestidose partículas são descritos em US 5.643.672. Esses métodosincluem: adicionar uma solução aquosa da proteína de sedaàs partículas enquanto giram ou se misturam; formar umapasta da proteína de seda e das partículas e secagem, secarpor pulverização uma solução dá proteína de seda sobre aspartículas ou liofilizar uma pasta da proteína de seda e aspartículas. Esses pigmentos revestidos e partículas decosmético podem ser utilizados em formulações cosméticas,tintas, e similares.

Biomédico

As proteínas da seda podem ser utilizadas como revestimento em uma bandagem para promover cura deferimento. Para essa aplicação, o material de bandagem érevestido com uma quantidade eficaz da proteína de seda.Para fins de uma bandagem de cura de ferimento, umaquantidade eficaz de proteína de seda é definida aqui como uma proporção de aproximadamente IO"4 a aproximadamente 3 0%em peso em relação ao peso do material de bandagem. Omaterial a ser revestido pode ser qualquer pano ou fibramacio, biologicamente inerte, poroso. Os exemplos incluem,porém não são limitados a, algodão, seda, raiom, acetato,acrílico, polietileno, poliéster, e combinações dos mesmos.O revestimento do pano ou fibra pode ser realizado pordiversos métodos conhecidos na técnica. Por exemplo, omaterial a ser revestido pode ser mergulhado em uma soluçãoaquosa contendo a proteína de seda. Alternativamente, asolução contendo a proteína de seda pode ser pulverizadasobre a superfície do material a ser revestido utilizandouma pistola de pulverização. Adicionalmente, a soluçãocontendo a proteína de seda pode ser revestida sobre asuperfície utilizando um processo de impressão de coberturade rolo. A bandagem de ferimento pode incluir outrosaditivos incluindo, porém não limitados a: desinfetantescomo o iodo, iodeto de potássio, iodo povidon, acrinol,peróxido de hidrogênio, cloreto de benzalcônio, ecloroexidina; agentes de aceleração de cura como alantoína,cloridrato de dibucaína, e malato de clorofenil amina;agentes vasoconstritores como cloridrato de nafozolina;agentes adstringentes como óxido de zinco; e agentes degeração de crosta como ácido bórico.

As proteínas da seda da presente invenção também podemser utilizadas na forma de um filme como um material decurativo de ferimento. 0 uso de proteínas da seda, na formade um filme amorfo, como um material de curativo deferimento é descrito em US 6.175.053. O filme amorfocompreende um filme denso e não poroso de umacristalinidade abaixo de 10% que contém uma quantidadeeficaz de proteína de seda. Para um filme para tratamentode ferimento, uma quantidade eficaz de proteína de seda éaqui definida como entre aproximadamente 1 e 99% em peso. Ofilme também pode conter outros componentes incluindo,porém não limitados a outras proteínas como sericina, edesinfetantes, agentes de aceleração de cura, agentesvasoconstritores, agentes adstringentes, e agentes degeração de crosta, como descrito acima. Outras proteínascomo sericina podem compreender 1 a 99% em peso da composição. A quantidade dos outros ingredientes listados épreferivelmente abaixo de um total de aproximadamente 3 0%em peso, mais preferivelmente entre aproximadamente 0,5 e20% em peso da composição. 0 filme de curativo de ferimentopode ser preparado pela dissolução dos materiais acima mencionados em uma solução aquosa, remoção dos insolúveispor filtração ou centrifugação, e emissão da solução em umasuperfície sólida lisa como uma placa acrílica, seguido porsecagem.

As proteínas da seda da presente invenção também podem ser utilizadas em suturas (vide, por exemplo, US2005/005051). Tais suturas podem apresentar uma camisatrançada feita de fibras de seda e fibras com pesomolecular ultraelevado. 0 polietileno fornece resistência.Fibras de poliéster podem ser tecidas com o polietileno comelevado peso molecular para fornecer propriedades deamarrar aperfeiçoadas. A seda pode ser fornecida em uma corcontrastante para fornecer um traço para o reconhecimento ea identificação, aperfeiçoados, de sutura. A seda também émais adaptável ao tecido do que, outras fibras, permitindoque as extremidades sejam cortadas próximas ao nó sem

S fr ,

preocupação com interação prejudicial entre as extremidadesda sutura e tecido em volta. Propriedades de manipulação dasutura com resistência elevada também podem ser aumentadasutilizando vários materiais para revestir a sutura. A

3 0 sutura tem vantajosamente a resistência de sutura Ethibondno. 5, ainda assim tem o diâmetro, sensação e capacidade deamarar da sutura no. 2. Como resultado, a sutura é idealpara a maioria dos procedimentos ortopédicos como reparo demanguito rotador, reparo de téndão de Aquiles, reparo detendão patelar, reconstrução de ACL/PCL, procedimentos dereconstrução de ombro e quadril, e substituição por suturautilizada em ou com âncoras de sutura. A sutura pode sernão revestida, ou revestida com cera (cera de abelha, cerade petróleo, cera de polietileno, ou outros), silicone(fluido de silicone Dow Corning 202A ou outros), borrachasde silicone, PBA (ácido polibutilato), etil celulose(Filodel) ou outros revestimentos, para melhorar acapacidade lubrificante da trança, segurança de nó, ouresistência à abrasão, por exemplo.

As proteínas da seda da presente invenção também podemser utilizadas em stents (vide, por exemplo, US2004/0199241). Por exemplo, um enxerto de stent é fornecidoque inclui um stent endoluminal e um enxerto, onde oenxerto de stent inclui seda. A seda induz uma resposta emum hospedeiro que recebe o enxerto de stent, onde aresposta pode levar à adesão aumentada entre o enxerto destent de seda e o tecido do hospedeiro que está adjacente àseda do enxerto de stent de seda. A seda pode ser fixada aoenxerto por qualquer um de vários meios, por exemplo, porintertecer a seda no enxerto ou por aderência da seda aoenxerto (por exemplo, por intermédio de um adesivo ou porintermédio de sutura) . A seda ppde estar na forma de umfio, uma trança, uma folha, pó, etc. Com relação àlocalização da seca no enxerto de stent, a seda pode serfixada somente no exterior do stent, e/ou a seda pode serfixada nas regiões distais do enxerto de stent, paraauxiliar a fixar essas regiões distais em tecido vizinho nohospedeiro. Uraa ampla variedade de enxertos de stent podeser utilizada no contexto da presente invenção, dependendodo sítio e natureza de tratamento desejado. Enxertos destent podem ser, por exemplo, enxertos de tubo oubifurcados, cilíndricos ou afilados, de auto-expansão ouexpansíveis por balão, unicorpo ou modular, etc.

Além de seda, o enxerto de stent pode conter umrevestimento era um pouco ou toda a seda, onde orevestimento degrada após inserção do enxerto de stent emum hospedeiro, o revestimento desse modo retardando ocontato entre a seda e o hospedeiro. Revestimentosapropriados incluem, sem limitação, gelatina, poliésteresdegradáveis (por exemplo, PLGA, PLA, MePEG-PLGA, PLGA-PEG-PLGA, e copolímeros e misturas dos mesmos), celulose ederivados de celulose (por Qexemplo, hidróxi propilcelulose, polissacarídeos (por exemplo, ácido hialurônico,dextrano, sulfato de dextrano, quitosana), lipídeos, ácidosgraxos, ésteres de açúcar, ésteres de ácido nucléico,polianidridos, poliortoésteres e álcool de polivinil (PVA).Os enxertos de stent contendo seda podem conter um agentebiologicamente ativo (fármaco), onde o agente é liberado apartir do enxerto de stent e então induz uma respostacelular aumentada (Por exemplo, depósito de matriz celularou extracelular) e/ou resposta fibrótica em um hospedeirono qual o enxerto de stent foi inserido.

As proteínas da seda da presente invenção podem serutilizadas também em uma matriz para produzir ligamentos e30 tendões ex vivo (vide, por exemplo, US2005/0089552) . Umamatriz baseada em fibra de, seda pode ser semeada comcélulas pluripotentes, como células estromais de medulaóssea (BMSCs). 0 tendão ou ligamento bioconstruído évantajosamente caracterizado por um padrão de orientaçãocelular e/ou ondulação de matriz na direção de forçasmecânicas aplicadas, e também pela produção de marcadoresespecíficos de tendão e ligamento incluindo colágeno tipoI, colágeno tipo III, e proteínas de fibronectina ao longodo eixo geométrico de carga mecânica produzida pelas forçasmecânicas ou estimulação, se tais forças forem aplicadas.Em uma modalidade preferida, o ligamento ou tendão écaracterizado pela presença de feixes de fibras que sãodispostos em uma organização helicoidal. Alguns exemplos deligamentos ou tendões que podem ser produzidos incluem ligamento cruciforme anterior, ligamento cruciformeposterior, tendões de manguidor rotador, ligamentocolateral mediai do cotovelo e joelho, tendões flexores damão, ligamentos laterais do tornozelo e tendões eligamentos da mandíbula ou junta temporomandibular. Outrostecidos que podem ser produzidos pelos métodos da presenteinvenção incluem cartilagem (tanto articular comomeniscal), osso, músculo, pele e vasos sangüíneos.

As proteínas da seda da presente invenção também podemser utilizadas em hidrogéis (vide, por exemplo, US 2005/0266992). Hidrogéis de fibroína de seda podem sercaracterizados por uma estrutura de poros abertos quepermite seu uso como armações de engenharia de tecido,substrato para cultura de célula, curativo para queimadurae ferimento, substitutos de tecido mole, enchimento deosso, e bem como suporte para . compostos biologicamenteativos ou farmacêuticos.

As proteínas da seda também podem ser utilizadas emcomposições dermatológicas (vide, por exemplo, US2005/0019297). Além disso, as proteínas da seda da invençãoe derivados das mesmas também podem ser utilizadas emcomposições de liberada controlada (vide, por exemplo, US2004/0005363).

Artigos têxteis

As proteínas da seda da presente invenção também podemser aplicadas à superfície de fibras para uso subseqüenteem artigos têxteis. Isso provê uma monocamada do filme deproteína na fibra, resultando em um acabamento liso. US6.416.558 e US 5.232.611 descrevem a adição de umrevestimento de acabamento em fibras. Os métodos descritosnessas revelações fornecem exemplos da versatilidade deacabamento da fibra para fornecer uma boa sensação e umasuperfície lisa. Para essa aplicação, a fibra é revestidacom uma quantidade eficaz da proteína de seda. Para fins derevestimento de fibra para uso em artigos têxteis, umaquantidade eficaz de proteína de seda é aqui definida comouma proporção de aproximadamente 1 a aproximadamente 99% empeso em relação ao peso do material de fibra. Os materiaisde fibra incluem, porém não são limitados a fibras têxteisde algodão, poliésteres como raiom e Lycra™, náilon, lã, eoutras fibras naturais incluindo seda nativa. Composiçõesapropriadas para aplicar a proteína de seda sobre a fibrapodem incluir co-solventes como etanol, isopropanol,hexafluoranóis, isotiocianouranatos e outros solventespolares que podem ser misturados com água para formarsoluções ou microemulsões. A solução contendo proteína deseda pode ser pulverizada sobre a fibra ou a fibra pode serimersa na solução. Embora não seja necessária, a secageminstantânea do material de revestimento é preferida. Umprotocolo alternativo é aplicar a composição de proteína deseda sobre fibras trançadas. Uma modalidade ideal dessaaplicação é o uso de proteínas da seda para revestirteceduras estiráveis como utilizadas para meias.

Materiais compósitos

Fibras de seda podem ser adicionadas a poliuretano,outras retinas ou cargas termoplásticas para prepararplacas de painel e outros materiais de construção, ou comomóveis moldados e bancadas que substituem madeira e placade partículas. Os compósitos também podem ser utilizados emconstrução de edifícios e automotiva especialmente tetos epainéis de porta. As fibras, de seda reforçam a resinatornando o material muito mais forte e permitindoconstrução de peso leve que é de resistência igual ousuperior a outras placas de partículas e materiaiscompósitos. Fibras de seda podem ser isoladas e adicionadasa uma resina de formação de compósito sintética ou seremutilizadas em combinação com proteínas derivadas de planta,amido e óleos para produzir um material compósito de basebiológica. Os processos para a produção de tais materiaissão descritos em JP 2004284246, US 2005175825, US4.515.737, JP 47020312 e WO 2005/017004.

Aditivos de papel

As propriedades de fibras da seda da invenção podemacrescentar resistência e textura de qualidade à fabricaçãode papel. Papéis de seda são feitos por mosquear fios deseda em polpa de algodão para preparar papéis feitos à mãoextra-suaves utilizados para presentes, capas de cadernos,bolsas. Os processos para produção de produtos de papel quepodem incluir proteínas da seda da invenção sãogenericamente descritos em JP 2000139755.

Materiais avançados

Sedas da invenção têm tenacidade considerável e sedestacam entre outras sedas para manter essas propriedadesquando umedecidas (Hepburn e outros, 1979).

Áreas de crescimento substancial na indústria têxtilde roupas são os artigos têxteis técnicos e inteligentes.Há uma demanda crescente para produtos têxteis saudáveis,com elevado valor funcional, favoráveis ao meio ambiente epersonalizados. Fibras, como aquelas da invenção, que nãomudam propriedades quando umedecidas e em particular mantêmsua resistência e capacidade de extensão, são úteis pararoupas funcionais para esportes e lazer bem como roupas detrabalho e roupas de proteção.

Os desenvolvimentos em tecnologias de vigilância earmas e são induzindo inovações em equipamentos de proteçãoindividuais e sistemas e estruturas relacionados a campo debatalha. Além de exigências convencionais como durabilidadede material à exposição prolongada, desgaste intenso eproteção contra ambiente externo, os artigos têxteis deseda da invenção podem ser processados para resistir aprojéteis balísticos, incêndio e produtos químicos. Osprocessos para a produção de tais materiais são descritosem WO 2005/045122 e US 2005268443.

EXEMPLOS

EXEMPLO 1 - Preparação e análise de cDNAs de glândulasalivar do último instar tardio83/124.

As proteínas que são encontradas em sedas deeuaculeatan e neuroptera (Apis mellifera, Bombusterrestris, Myrmecia forficata, Oecophylla smaragdina,Mallada signata) foram identificadas pelo casamento depadrões de fragmentação espectral de massa consecutiva deretenção de íon (MS/MS) de peptídeos obtidos por digestãode tripsina da seda com os dados espectrais de massapreditos de proteínas codificadas por cDNAs isolados apartir da glândula salivar de larvas de instar finaltardio. Para confirmação de que não se perdeu nenhumaproteína por essa análise para á abelha de mel, os dadosespectrais de massa de peptídeo também foram comparados comdigestões trípticas virtuais de proteínas de Apis melliferapreditas pelo projeto de genoma de abelha e translações dasseqüências genômicas de abelha de mel Amel3 em todos osseis quadros de leitura.

Abelha de mel

Larvas de Apis mellifera foram obtidas a partir decolméias domésticas. Anteriormente foi mostrado que aprodução de seda em Apis mellifera é confinada à glândulasalivar durante a metade posterior do instar final (Silva-Zacarin e outros; 2003) . Durante esse período, RNA é maisabundante na extremidade posterior da glândula (Flower eKenchington, 1967) . As regiões de célula cúbica de 50glândulas salivares foram dissecadas a partir do quintoinstar tardio Apis mellifera imerso em solução salinatamponada com fosfato. A extremidade posterior da glânduladissecada foi imediatamente colocada em RNAlater® (Ambion,Aust in, TX, EUA) para estabilizar o mRNA, esubseqüentemente armazenada a 4°C.RNA total (35 μ9) foi isolado a partir das glândulassalivares de instar final tardio utilizando o RNAqueouspara kit de PCR a partir de Ambion (Austin, TX, EUA) . RNAde mensagem foi isolado a partir do RNA total utilizando okit de isolamento de Micro-FastTrack™ 2.0 mRNA a partir deInvitrogen (Calsbad, CA, EUA) de acordo com as orientaçõesdo fabricante com o mRNA isolado sendo eluído em IOul deágua isenta de RNAse.

Uma biblioteca de cDNA foi construída a partir de mRNAisolado a partir das larvas de Apis mellifra utilizando okit de construção de biblioteca de cDNA CloneMiner™ deInvitrogen (Calsbad, CA, EUA) com as seguintes modificaçõesa partir do protocolo padrão: para a síntese da primeirafita, 0,5 μΐ de iniciador de Biotin-attB2-Oligo (dT) e6PMOL.μl-1 e 0,5 μl de dNTPs em 2mM cada foi adicionado a 10μl de mRNA. Após incubação a 650C por 5 min. então 450C por2 min., 2 μl de tampão de fita 5Xfirst, 1 μl de 0.IM DTT, e0,5 μl SuperScript™ II RT a 200υ.μ1~1 foram adicionados.Para síntese de segunda fita, o volume total de todos osreagentes foi dividido ao meio e após precipitação deetanol, o cDNA foi ressuspenso e 5 μΐ de água tratada comDEPC. o adaptador aatBl (Ιμΐ) foi ligado em um volume totalde 10 μl de ao 5 μΐ de cDNA com 2μ1 5X tampão Adapter, Ιμΐ0.1M DTT e Ιμΐ de ligase de DNA T4 (1U.μl-1) a 16 °C por 48h com 0,5 μl de ligase de DNA T4 adicional (1U.μl-1)adicionado após 16 horas. o cDNA foi fracionado em tamanhode acordo com as instruções de fabricação com amostraseluindo entre 300-500 μl sendo precipitadas com etanol,ressuspensas e transformadas nas células resistentes a3 0 fagos Tl DHlOB™ E.coli como recomendado. A biblioteca decDNA compreendia aproximadamente 1.200.000 unidades deformação de colônia (cfu) com aproximadamente 1% do vetororiginal. 0 tamanho médio de inserção foi de 1,3 ± 1,4 kbp.

Oitenta e dois clones foram aleatoriamenteselecionados e seqüenciados utilizando o kit de partidaGenomeLab™ DTCS Quick (BeckmanCoulter, Fullerton CA EUA) epassados em um seqüenciador CEQ8 000 Biorad. Esses seagruparem em cinqüenta e quatro grupos (Tabela 2). Aidentificação dos cDNAs que codificaram as proteínas daseda é descrita abaixo.

Outras espécies

RNA total foi isolado a partir de 4 abelhão (Bombusterrestris) (2 μg RNA), 4 formigas bulldog (Myrmeciaforficata) (3μg RNA), aproximadamente 100 formigas Tecelãs(Oecophyla smaragdina) (0,4 μg RNA) e aproximadamente 50glândulas labiais de larvas tardias de lagarta verde(Mallada signata) utilizando o RNAqueous para kit PCR apartir de Ambion (Austin, TX, EUA). MRNA foi isolado apartir do RNA total utilizando o Kit de Isolamento Micro-FastTrack™ 2.0 mRNA a partir de Invitrogen (Calsbad, CA,EUA) em um volume final de 10 μl de água. Bibliotecas decDNA foram construídas a partir do mRNA utilizando o kit decDNA CloneMiner™ de Invitrogen· (Calsbad, CA, EUA) com asseguintes modificações a partir do protocolo padrão: para asíntese de primeira fita, 3pmol de iniciador Biotin-attB2-Oligo (dT) e lnmol cada dNTPs foram adicionados a 10 μl demRNA. Após 5 min. a 650C seguido por 2 min. a 45°C, 2 μl detampão de fita 5Xfirst, 50 nmol DTT, e IOOU SuperScript™II RT foram adicionados.

Tabela 2. cDNAs de glândula salivar de instarr final de A.mellifera e padrões de fragmentção de retenção de íon MS depeptídeos a aprtir de digestão de tripsina de seda de favode progênie tratada com SDS.

<table>table see original document page 87</column></row><table><table>table see original document page 88</column></row><table><table>table see original document page 89</column></row><table><table>table see original document page 90</column></row><table><table>table see original document page 91</column></row><table>

Para síntese de segunda fita, o volume total de todosos reagentes foi dividido ao meio em relação às quantidadesrecomendadas pelo fabricante e após precipitação de etanol,o cDNA foi ressuspenso em 5 μΐ de água tratada com DEPC. 0adaptador aatBl (1 μl) foi ligado em um volume total de 10μl a 5 μl de cDNA com 2 μl de 5X tampão de Adaptador, 50nmol DTT e IU ligase de DNA T4 a 16°C por 12 horas. Asbibliotecas de cDNA compreendiam aproximadamente 2,4 χ IO7(abelhão), 5,0 χ IO7 (formiga bulldog) e 6000 (formigaverde) unidades de formação de colônia (cfu) com umaquantidade menor do que 1% do vetor original para asbibliotecas de abelhão e formiga bulldog e maior do que 8 0%de vetor original na biblioteca de formiga verde. O tamanhomédio de inserção nas bibliotecas foi de 1,3 Kbp.

Dados de seqüência foram obtidos a partir de mais de100 clones aleatórios a partir das bibliotecas de cDNA deabelhão e formiga bulldog, 82 clones a partir de abelha demel e 60 clones de lagarta verde. As dificuldades técnicasde se obter glândulas salivares a partir das minúsculasformigas verdes (aproximadamente 1 mm de comprimento)reduziram a eficiência da biblioteca dessa espécie e comotal somente 40 seqüências foram examinadas. Um sumário dasproteínas da seda identificadas é fornecido na Tabela 3.

Tabela 3. Identificação e .propriedades dasproteínas da seda de euaculeatan

<table>table see original document page 92</column></row><table><table>table see original document page 93</column></row><table>

*também mencionado aqui como Xenspirall-4 e Xenosinrespectivamente, ** predito por PROFsec, *** predito porMARCOIL em limite de 90%

EXMEPLO 2 - Preparação e análise proteômica de sedanativa

Favo de progênie de abelha de mel após a retirada delarvas, casulos de abelhão após a retirada de larvas,casulos de formiga bulldog após a retirada de larvas, oufolhas de seda de formiga tecelã foram lavadas extensamentetrês vezes em água morna para retirar contaminantessolúveis em água e então lavadas extensamente três vezes emclorofórmio para retirar cera. Clorofórmio foi removido porenxágüe em água destilada e um subconjunto dessa seda foiretido para análise. Um subconjunto das amostras de seda deHimenóptero (formigas e abelhas) foi adicionalmente lavadopor fervura por 30 minutos e 0,05% de solução de carbonatode sódio, um procedimento padrão para retirar goma de sedade bicho-da-seda, então enxaguado em água destilada. Sedade lagarta verde foi enxaguada somente em água destilada.

Retirou-se a goma de um subconjunto das amostras de seda delagarta verde por fervura durante 30 minutos em 0,05% desolução de carbonato de sódio.

Um subconjunto do material de abelha de mel foiembebido durante a noite em 2% SDS a 95 °C, seguido por trêslavagens em água destilada. A extração em solução de SDSquente solubiliza a maioria das proteínas, porém nesse casoas folhas de seda retiveram sua conformação.

As sedas limpas foram analisadas por cromatografialíquida seguida por espectrometria de massa tandem (LCMS)como descrito abaixo.

Pedaços de seda limpa foram colocados em uma cavidadede um vZipplate' Millipore, uma bandeja de microtítulo com96 cavidades contendo um tampo de meio de cromatografia defase inversa Cl8 através do fundo de cada cavidade na qualse adicionram 20 μl de 25 mM, de bicarbonato de amôniocontendo 160 ng de tripsina do tipo sequenciamento(Promega). A seguir a bandeja foi incubada durante a noiteem um saco plástico umidifiçado a 30°C.

O material C18 foi umedecido por pipetar acetonitrila(10 μl) nos lados de cada cavidade e incubar a placa a 37°Cpor 15 min. Solução de ácido fórmico (130 μl, 1% v/v) foiadicionada a cada cavidade e após 30 min. os peptídeos apartir das proteínas de abelha digeridas foram capturadosno material C18 extraindo lentamente as soluções de cadacavidade através da base da placa sob um vácuo reduzido. Omaterial C18 foi lavado duas vezes por extração através de100 uc de solução de ácido fórmico. Peptídeos foram eluídoscom 6 μl de ácido fórmico a 1% em 70% de metanol pipetadodiretamente sobre o material C18 e imediatamentecentrifugado através do tampo Cl8 em uma bandeja demicrotítulo subjacente. Essa bandeja foi colocada sob vácuoaté que o volume em cada cavidade foi reduzidoaproximadamente 2 vezes por evaporação. Solução de ácidofórmico (10 μc) foi adicionada em cada cavidade e a bandejafoi transferida para o amostrador de placa de cavidade deum sistema de cromatografia líquida capilar Agilent 1100.

Peptídeos (8 μc) a partir do extrato de seda foramligados a uma coluna de 150x0,5 mm de 5 μπι Agilent ZorbaxSB-C18 com uma taxa de fluxo de 0,1% de ácido fórmico/5% deacetonitrila em 20μ1.πιίη~1 por um min. a seguir eluídos comgradientes de concentração crescente de acetonitrila para0,1% ácido fórmico/20% de acetonitrila durante um min. a 5μl.min-1, então a 0,1% de ácido fórmico/50% de acetonitriladurante 28 minutos, a seguir a 0,1% de ácido fórmico/95% deacetonitrila durante um minuto. A coluna foi lavada com0,1% de ácido fórmico/95% - 100% de acetonitrila durante 5min. a 20μ1.min-1 e reequilibrada com 0,1% de ácidofórmico/5% de acetonitrila durante 7 min. antes daamostragem dos peptídeos a partir da cavidade seguinte.

Eluato a partir da coluna foi introduzido em umespectrômetro de massa de retenção de íons Agilent XCTatravés da fonte de íons de eletropulverização doinstrumento adaptada com um micronebulizador.

Resumidamente, à medida que òs peptídeos estavam eluindo apartir da coluna, as varreduras' de íon positivo de espectrototal coletado por retenção de íohs (100-2200m/z); seguidaspor duas varreduras MS/MS de íons, observadas no espectrototal evitando a seleção de íons que continham somente umaúnica carga. Quando um íon era selecionado para análise deMS/MS todos os outros foram excluídos a partir do coletorde íons, o íon selecionado foi fragmentado de acordo com osajustes de "SmartFrag" e "Peptide Scan" recomendados doinstrumento. Após coleta de dois espectros de fragmentaçãopara qualquer valor m/z específico foi excluído da seleçãopara análise para um período adicional de 3 0 segundos a fimde evitar coleta de dados redundantes.

Conjuntos de dados espectrais de massa a partir doexperimento inteiro foram analisados utilizando softwareSpectrum Mill da Agilent para casar os dados com prediçõesde seqüências de proteína a partir das bibliotecas de cDNA.0 software gerou marcações em relação à qualidade de cadacasamento entre conjuntos experimentalmente observados demassas de fragmentos de p.eptídeos e as predições defragmentos que poderiam ser geradas de acordo com asseqüências de proteínas em um banco de dados fornecido.Todos os casamentos de seqüência reportados aqui receberammarcações maiores do que 20,. o ajuste default paraaceitação automática, segura de- casamentos válidos.

Essa análise identificou que cinco proteínas expressasem elevados níveis na glândula labial casavam com a seda decada uma das espécies de abelha cognata (mostradas nasTabelas 2 e 3) e quatro proteínas expressas em níveiselevados na glândula labial casaram com a seda de cada umadas espécies de formiga cognata (mostradas na Tabela 3). Aabundância de RNA de mensagem codificando essas proteínasna glândula labial das lavas foi compatível com asproteínas sendo abundantemente produzidas (abundância demensagem mostrada na Tabela 3).

Para assegurar que nenhuma das proteínas da seda deabelha de mel foi perdida por esse processo deidentificação, os inventores compararam também os dadosespectrais de massa de peptídeo de tripsina de seda deabelha de mel com um conjunto de seqüências de proteínapreditas disponíveis para o público a partir do projeto degenoma de abelha de mel, gerado por um algoritmo decomputador que tenta reconhecer genes transcritos nasseqüências de DNA genômico completo da abelha.Adicionalmente, os inventores geraram um banco de dados detranslações nos seis quadros de "leitura possíveis de cadaseqüência de DNA genômica contígua fornecida pelo projetode genoma de abelha (Amel3 release). Essas seqüências deDNA traduzidas foram apresentadas ao software Spectrum Millcomo se fossem as seqüências de proteínas muito grandes. Ocasamento de dados de peptídeo MS/MS identificou quadros deleitura aberta nas seqüências genômicas que tinham partescodificadas das proteínas de abelha isoladas sem anecessidade de primeiramente prever a organização dosgenes. Nenhuma proteína adicional foi identificada na sedapor essa análise.

EXEMPLO 3 - Análise estrutural da seda nativa

Amostras de seda nativa foram preparadas como descritono Exemplo 2. Amostras de seda foram examinadas utilizandoum espectrômetro infravermelho de transformação FourierBruker Tensor 37 com um acessório de reflexão totalatenuado por diamante Pike Miracle. A análise das regiõesde amida I e II dos espectros de sedas de abelha de mel,abelhão, formiga verde e formiga, bulldog e seda larval delagarta verde (figura 1) mostra que todas essas sedas têmuma estrutura secundária predominantemente alfa-helicoidal.

As sedas das espécies Euaculeatan têm picos dominantes nosespectros FT-IR a 1645-1646 cm"1, deslocadosaproximadamente 10 cm"1 mais baixos do que um sinal a-helicoidal clássico e alargados. Esse deslocamento no sinalα-helicoidal é típico de proteínas de espiral enrolada(Heimburg e outros; 1999). Os espectros de amostras quetiveram a goma retirada ficaram inalterados.

EXEMPLO 4 - a composição de aminoácido de sedasnativas lembra muito aquela das proteínas da sedaidentificadas

A composição de aminoácidos das sedas nativas foideterminada após 24 g de hidrólise de fase de gás a IlO0Cutilizando a química Wates AccQTag da Australian ProteomeAnalysis Facility Ltd. (Macquarie University7 Sidney).

A composição de aminoácidos medida da seda lavada comSDS era similar àquela prevista a partir das seqüências deproteína de sedas identificadas (figuras 2 e 3) .

EXEMPLO 5 - Análise estrutural das proteínas da sedaPeptídeos secretores previstos

Como esperado para proteínas da seda, o programa deprevisão de sinal SignaIP 3.0 (Bendsten e outros, 2004),que utiliza dois modelos para identificar peptídeos desinais previu que todos os genes de seda identificadoscodificaram proteínas que contêm peptídeos de sinais quealvejaram as mesmas para secreção a partir de uma célula(dados não mostrados). Os sítios de clivagem previstos dospolipeptídeos são como a seguir:

Xenospiral (AmelF1) - entre"pos 19 e 20 (ASA-GL),

Xenospira2 (AmelF2) - entre pos 19 e 20 (AEG-RV),

Xenospira3 (AmelF3) - entre pos 19 e 20 (VHA-GV),

Xenospira4 (AmelF4) - entre pos 19 e 20 (A8G-AR),

Xenosin (AmelSAl) - entre pos 19 e 20 (VCA-GV),

BBF1 - entre pos 19 e 20 (ASA-GQ),

BBF2 - entre pos 20 e 21 (AEG-HV),

BBF3 - entre pos 19 e 20 (VHA-GS),

BBF4 - entre pos 19 e 20 (ASA-GK),

BAF1 - entre pos 19 e 20 (ASA-SG),

BAF2 - entre pos 19 e 20 (ASG-RV),

BAF3 - entre pos 19 e 2 0 (ASG-NL),

BAF4 - entre pos 19 e 20 (VGA-SE),

GAF1 - entre pos 19 e 20 (ADÀ-SK),

GAF2 - entre pos 19 e 20 (ASG-GV),

GAF3 - entre pos 19 e 20 (ASG-GV),

GAF4 - entre pos 19 e 20 (VGA-SE),

MalFl - entre pos 26 e 27 (SST-AV).

Todas as quatro formigas e quatro das cinco proteínasda seda de abelha são helicoidais e formaram espirasenroladas.

A modelagem de proteína e os resultados a partir dealgoritmos de reconhecimento padrão confirmaram que a maiorparte das proteínas da seda de abelha de mel identificadasera proteínas helicoidais que formaram espiras enroladas.

Algoritmos PROFsec (Rost e Sanderf 1993) e NNPredict(McClelland e Rumelhart, 1988; Kneller e outros, 1990)foram utilizados para investigar a estrutura secundária dosgenes de seda identificados. Esses algoritmos identificaramXenospiral [GB12184-PA] (SEQ ID N°: 1), Xenospira2[GB12348 -PA] (SEQ ID N°: 3), Xenospira3 [GB17818-PA] (SEQID NO" 5) , e Xenospira4 [GB19585-PA] (SEQ ID N°: 7), comoproteínas altamente helicoidais, com entre 76-85% deestruturas helicoidais (Tabela 4). Xenosin [GB15233-PA](SEQ ID N°: 10) tinha estrutura significativamente menoshelicoidais.

Tabela 4. A estrutura secundária de proteínas da seda Apismellifera previstas por PROFsec (Rost e Sander, 1993)mostrando percentagens de hélices, folhas estendidas elaços.

<table>table see original document page 100</column></row><table>

Modelagem de proteína adicional e resultados a partirdos algoritmos de reconhecimento de padrão confirmaram quea maior parte das proteínas da seda identificadas eraproteínas helicoidais que formaram espiras enroladas.Algoritmos de PredictProtein (Rost e outros, 2 0 04) foramutilizados para investigar a estrutura secundária dos genesde seda identificados. Esses algoritmos identificaramXenospiral (SEQ ID N°: 1), Xenospira2 (SEQ ID N°: 3),Xenospira3 (SEQ ID N°:5), Xenospira4 (SEQ ID N°:7), BBFl(SEQ ID N°: 22), BBF2 (SEQ ID N°: 24), BBF3 (SEQ ID N°: 26),BBF4 (SEQ ID N°:28), BAFl (SEQ ID N°:40), BAF 2 (SEQ IDN0 :42) , BAF3 (SEQ ID N°:44), BAF4 (SEQ ID N°:46), GAFl (SEQID N°:56), GAF2 (SEQ ID N°:58), GAF3 (SEQ ID N°:60), GAF4(SEQ ID N°: 62), e MalFl (SEQ ID N°: 72) como proteínasaltamente helicoidais, com entre 69-88% de estruturahelicoidal (Tabela 3). AmelSAl [GB15233-PA] (Xenosin) (SEQID N°:10) e BBSAl (SEQ ID N°:30) tinham estruturasignificativamente menos helicoidal.

Super-enrolamento de proteínas helicoidais (espirasenroladas) se origina de uma seqüência de repetiçãoheptavalente característica normalemnte indicada como(abcdefg)n com resíduos genericametne hidrofóbicos emposição a e d, e resíduos polares ou genericametnecarregados nas posições rstantes. Os programas dereconhecimento de padrão (MARCOIL (Delorenzi e Speed,2002)), COILS (Lupas e outros, 1991) identificaram inúmerasrepetições heptavalentes típicas de de espiral enrolada emXenospiral [GB12184-PA] (SEQ ID N°: 1), Xenospira2[GB12348-PA] (SEQ ID N°: 3), Xenospira3 [GB17818-PA] (SEQID N0 : 5), e Xenospira4 [GB19585-PA] (SEQ ID N°: 7)(MARCOIL: Tabela 5; COILS: Figura 4), bem como BBFl (SEQ IDN°: 22), BBF2 (SEQ ID N°: 24), BBF3 (SEQ ID N°: 26), BBF4(SEQ ID N°: 28), BAFl (SEQ ID N°: 40), BAF 2 (SEQ ID N°:42), BAF3 (SEQ ID N°: 44), BAF4 (SEQ ID N°: 46), GAFl (SEQID N°: 56), GAF 2 (SEQ ID N°; 58), GAF 3 (SEQ ID N°: 60),GAF4 (SEQ ID N° : 62), e MalFl (SEQ ID N°: 72) (MARCOIL:Tabela 3).

Idnetificação de uma seqüência de espiral enroladanova nas proteínas da seda de abelha de melAs repetições heptavalentes de resíduos de aminoácidosidentificadas nas seqüências de Xenospiral [GB12184-PA],Xenospira2 [GB12348-PA], Xenospira3 [GB17818-PA],Xenospira4 [GB19585-PA], foram altamente indicativas,individualmente, de uma estrutura secundária de espiralenrolada (figura 5) (vide a Tabela 5 para níveis deconfiança). O fato de que os heptavalentes são encontradosde forma consecutiva e numerosa sugere que as proteínasadotam uma estutura muito regular. Heptavalentes desobreposição foram identifiçados- em duas das proteínas deabelha de mel: a maior região de espiral enrolada deXenospiral continha heptavalentes de sobreposição com umadescentragem de 3 resíduos seguido por um espaço de 5resíduos e então quatro heptavalentes consecutivos; e aregião de espiral enrolada inteira de Xenospira2 tinhamúltiplos heptavalentes de sobreposição com uma únicadescentragem e descentragem de 4 resíudos (equivalente adescentragem de 3 resíduos). A composição de aminoácidosnas várias posições do heptavalente principal é mostrada naprimeira coluna na Tabela >'6, com as posições dosheptavalentes em sobreposição indicadas em colunasadjacentes.

Tabela 5. Percentagem de resíduos nas proteínas daseda identiicadas previstas como existindo como espiralenrolada pelo algoritmo de reconhecimento de padrão MARCOIL(Delorenzi e Speed, 2002)

<table>table see original document page 102</column></row><table><table>table see original document page 103</column></row><table>

De forma surpreendente os principais heptavalentes têmuma compsição nova quando vistos coletivamente - com umaabundância incomumente elevada de alanina nas posiçõesheptavalentes 'hidrofóbicas' a e d (vide a Tabela 6 e afiugra 5). Adicoinalmetne, uma proporção elevadaheptavalente tem alanina nas posições tanto a como dcompreendidas no mesmo heptavalente (33% em Xenospiral[GB12184-PA]; 36% em Xenospira2 [GB12348-PA]; 27% emXenospira3 [GB17818-PA]; e 38% em Xenospira4 [GB19585-PA];vide as Tabelas 6 e 7).

Tabela 6. Sumário do número de cada resíduo de aminoácidonas várias posições heptavalentes em regiões de espiralenrolada de proteínas deseda de abelha de mel.

<table>table see original document page 104</column></row><table><table>table see original document page 105</column></row><table>Predições de 'PROFsec com predições de NNPredictmostradas em parênteses.

A composição de amino'cidos nas várias posiçõesheptavalentes na região de espiral enrolada das sedas dehimenóptero é resumida nas figuras 6 e 7. Como observadoacima, as posições nos heptavalentes têm uma comosição nova- as posições heptavalentes vhidrofóbicas' a e d das sedasde abelha e formig contêm níveis muito elevados de alanina(méida 58%) e níveis elevados de resíduos polares pequenos(média 21%) em comparação com outras espiras enroladas.Adiiconlamnete, a posição e é incomumente pequena ehidrofóbia (tabela 8, figura . 7) . Topograficametne essaposição é localizada adjacente aos resíduos a nas hélices.Sua similaridade de composição com os resíduos a e d sugereque as sedas adotam uma estrutura de espiral enrolada comtrês resíduos de núcleo por ct-helix. Núcleos de trêsresíduos contribuem uma interface hidrofóbica maior do quedois resíudos no núcleo (Deng e outros, 2006) - umacaracterística que auxiliaria a formação e estabilidade dede espiral enrolada.

Além disso, quando visto coletivamente as posições b,c, e, f e g dentro do heptavalente são genericametne maishidrofóbicas, menos polares e menos carregadas do queregiões de espiral enrolada de proteína anteriormentecaracterizadas (vide a figura 7, e as Tabelas 8 e 9) .Portanto, embora historicametne fosse considerado que oteor helicoidal da seda de Himenóptero aculeado fosse umaconseqüência de um teor reduzido de glicina e teoraumetnado de resíduos acídicos (Rudall e Kenchington,1971), os inventores descobriram que não são os resíduos deáciod/glicina que são responsáveis pela estrutura nova deseda porém em vez disso a posição dos resíudos de alaninanas cadeias de polipeptideos.

Tabela 8. Tamanho médio e hidrofobicidade em cadaposição heptavalente das proteínas da seda de himenópteroortólogas e da proteína de seda de lacwing verde (MalFl)mostrando que posições a, d e e (núcleo) são menores e maishidrofóbicas do que outras posições. Em alguns casos aposição b (parcialmente submersa) também é pequena ehidrofóbica.

<table>table see original document page 107</column></row><table><table>table see original document page 108</column></row><table>

EXEMPLO 6 - As proteínas da seda de abelhaprovavelmente são extensamente reticuladas

Todas as proteínas da seda de abelha contêm umaelevada proporção de lisina (6,5% - 16,3%). Uma comparaçãoentre a composição medida de aminoácido de seda de abelha,e as seqüências das proteínas da seda identificadas revelaum descasamento substancial no número de resíduos delisina, com uma quantidade bem menor de lisina detectada naseda do que esperado (figuras 2 e 3). Isso sugere queresíduos de lisina na seda foram modificados, assim nãosendo identificadas por análise de aminoácido padrão.Lisina é conhecida como formando uma variedade dereticulações: reticulações enzimáticas catalisadas porlisil oxidase ou reticulações não enzimáticas geradas apartir de resíduos de lisina glicados (Reiser, e outros,1992). A sub-representação de lisina na análise deaminoácidos de seda de abelha de mel e abelhão é compatívelcom a presença de reticulação de lisina.

Tabela 9. Número de resíduos em cada classe deaminoácidos em várias posições heptavalentes em regiões deespiral enrolada de proteínas da seda.

<table>table see original document page 109</column></row><table><table>table see original document page 110</column></row><table>

Espera-se que proteínas covalentemente reticuladassubmetidas a eletroforese de gel poliacrilamida SDS (FAGE)migrem de acordo com o peso molecular do complexoreticulado. Os inventores submeteram proteínas de glândulalabial de abelha de mel de último instar tardio a SDS PAGEe mediram a migração das proteínas da seda em relação amarcadores de proteína padrão. Bandas foram observadascorrespondendo aos monômeros de cada uma das proteínas daseda identificadas, entretanto bandas de peso molecularmais elevado contendo essas proteínas também estavampresentes, como esperado em um sistema reticulado (figura 8) .

Como descrito acima, a glândula labial de abelha demel contém uma mistura de proteínas da seda organizada edesorganizada. As proteínas <.: reticuladas observadascorrespondem provavelmente à população de proteínas daregião anterior da glândula, onde a seda é preparada paraextrusão. É razoável assumir que seda de abelha de melextracelular contém uma proporção substancialmente maiselevada de proteínas de reticulação do que é observado emuma mistura heterogênea de todos os estágios de proteínasda seda de glândula salivar. As ligações são improváveis deser reticulações de cisteína, visto que a seda não foiafetada por tratamento redutivo, e as proteínas da sedaidentificadas contêm poucos, ou nenhum, resíduos decisteína.

EXEMPLO 7 - as proteínas da seda euaculeatan diferemsignificativamente de outras proteínas da seda

A seda euaculeatan é significativamente diferente deoutros genes de seda descritos em relação à composição deaminoácidos (Tabela 10) , peso molecular das proteínasenvolvidas, estrutura secundária e propriedades físicas(Tabelas 11 e 12) . As sedas de lepidóptera são compostasprincipalmente dos resíduos de aminoácido pequeno alanina,serina e glicina (por exemplo,.- a seda de Bombyx mori,Tabela 10) e são dominados por estrutura secundária de betafolha estendida. A proteína de seda de Cotesia glomerata éelevada em asparagina e serina - a abundância do resíduomencionado por último sendo característico de sericinas deseda de Lepidóptera (colas) (Tabela 10) . Modelagem daproteína de seda de Cotesia glomerata não identificahélices ou espiras enroladas na estrutura secundária. Aocontrário, as sedas de abelha, formiga e lagarta verde sãoelevadas em alanina (Tabela 10) e são compreendidas de umalto nível de estrutura secundária helicoidal que formaespiras enroladas.Tabela 10. Composição de aminoácidos de seda e váriosinsetos com resíduos mais abundantes mostrados em negrito

<table>table see original document page 112</column></row><table>Tabela 11. Diferenças entre sedas de insetos.

<table>table see original document page 113</column></row><table>

Tabela 12 Solubilidade de sedas de insetos.<table>table see original document page 114</column></row><table>

A análise cladística das regiões de espiral enroladadas proteínas da seda das quatro espécies De himenóptero(figura 9) sugere que os genes se desenvolveram em umancestral comum que pré-data a divergência da Euaculeata apartir das vespas parasíticas. As seqüências da sedadivergiram extensamente e foram somente capazes de alinharos 210 aminoácidos que compreendem a região de espiralenrolada de cada proteína. A identidade de seqüência deaminoácidos entre as regiões de espiral enrolada de cadauma das proteínas da seda fornecidas aqui é mostrada naTabela 13 e identidade de DNA na região correspondente émostrada na Tabela 14. Embora as proteínas tenham teoressimilares de aminoácidos (especialmente níveis elevados dealanina e estrutura terciária), a identidade de seqüênciade aminoácidos primária é muito baixa. Na realidade, o geneque codifica a proteína de seda de Mallada se desenvolveuindependentemente e como tal a seqüência de proteína deseda não pode ser alinhada com as seqüências dehimenóptero. Isso indica que variedade considerável naidentidade dos aminoácidos pode ocorrer, embora não afete afunção biológica das proteínas.

Tabela 13. Percentagem de identidade entre seqüências deproteína da região de espiral enrolada das proteínas defibra em formigas e abelhas.

<table>table see original document page 115</column></row><table><table>table see original document page 116</column></row><table>

A análise cladística prevê que seda de vespaseuaculeatan é compreendida de proteínas relacionadas com aseda de formigas e abelhas e que embora essas proteínastenham composição e arquitetura similares às proteínasdescritas aqui, as mesmas terão seqüência primáriaaltamente divergida.

As seqüências de aminoácidos das proteínas da sedafornecidas aqui (figura 10) foram submetidas a comparaçõescom bancos de dados de proteína, entretanto, nenhumaproteína da técnica anterior foi identificada com qualquernível razoável de identidade de seqüência (por exemplo,nenhuma maior do que 3 0% idêntica sobre o comprimento daseqüência de proteína de seda).

Tabela 14. Percentagem de identidade entre seqüências denucleotídeo que codificam região de espiral enrolada das proteínasde fibras em formigas e abelhas<table>table see original document page 117</column></row><table><table>table see original document page 118</column></row><table>

Os quadros de leitura aberta, que codificam asproteínas da seda (fornecidas na figura 11) , foramsubmetidos à busca de banco de dados similar como aqueladescrita acima. As únicas moléculas relacionadas que foramidentificadas foram publicadas" como parte do projeto degenoma de abe ma de mel(www.ncbi.nlm.nih.gov/genome/guide/bee). Os quadros deleitura aberta tinham sido previstos pelo projeto de genomade abelha, entretanto, a função das proteínas codificadasnão tinha sido sugerida. Além disso, não há evidência deque um polinucleotídeo compreendendo o quadro de leituraaberta do mRNA já tinha sido produzido para qualquer umadessas moléculas.

Os genes que codificam Xenospiral, Xenospira2,Xenospira3 e Xenospira4 compreendem um exon que cobre oquadro de leitura aberta individual inteiro, ao passo que ogene que codifica Xenosin compreende pelo menos um intron(vide a figura 12).

EXEMPLO 8 - Expressão de proteínas da seda em plantastransgênicas

Um vetor de expressão de planta que codifica umaproteína de seda da invenção pode consistir em uma moléculade ácido nucléico recombinante codificando para a proteína(por exemplo, um polinucleotídeo fornecido em qualquer umadas SEQ ID NO's: 11 a 21, 31 a 39, 48 a 55, 64 a 71, 74 ou75) colocado a jusante do prpmotor CaMV 3 5S em umaestrutura de vetor binário contendo um gene de resistênciaà canamicina (NptII).

Para os polinucleotídeos compreendendo qualquer umadas SEQ ID N0'S 11, 13, 15, 17, 19, 31, 33, 35, 37, 48, 50,52, 54, 64, 66, 68, 70 ou 74 a construção pode compreenderainda uma região de codificação de peptídeo de sinais comopeptídeo de sinais de quitinase básico vacuolar Arabidopsisthaliana, que é colocado em quadro e a montante daseqüência que codifica a proteína de seda.

A construção que contém um polipeptídeo de codificaçãode proteína de seda é transformada separadamente emAgrobacterium tumefaciens por eletroporação antes datransformação em Arabidopsis thaliana. 0 método detransformação de hipocótilo pode ser utilizado paratransformar A. thaliana que pode ser selecionada parasobrevivência em meios seletivos compreendendo meios decanamicina. Após formação de raízes nos regeneradores asmesmas são transferidas para o solo para estabelecerplantas transgênicas primárias.

A verificação do processo de transformação pode serobtida via classificação de PCR. A incorporação e expressãode polinucleotídeos pode ser medida utilizando PCR, análisede Southern Blot e/ou LC/MS de proteínas expressasdigeridas por tripsina.

Duas ou mais construções de codificação de proteína deseda diferentes podem ser fornecidas no mesmo vetor, ouinúmeros vetores diferentes podem ser transformados naplanta cada uma codificando uma proteína diferente.

Como exemplo experimental de expressão de planta, umaversão otimizada de códon de AmelF4 (Xenospira4) (SEQ IDN°: 76) foi clonada em pET14b (Novagen), gerando pET14b-6xHis:F4op, formando uma fusão traducional em quadro com um6xhistidina no terminal-N da proteína. A seqüênciacodificando a proteína "6xHistidina:F4op" foi clonada empVEC8 (Wang e outros, 1992) sob o controle do promotor CaMV3 5S e aparelho regulador de poliadenilação, gerando pVEC8-35S-6xHis:F4op-ocs. PET14b-6xHis:F4op foi transformado emE.coli quimicamente competente e pVEC8-35S-6xHis:F4op foitransformado em discos de folha de fumo por transformaçãomediada por Agrobacterium. Proteínas a partir de E. coliresistente a antibiótico (expressão induzida) e folhas defumo foram isoladas e submetidas, à análise de western blotutilizando o anticorpo Tetra-histidina (Qiagen, Karlsrule,Alemanha) para detecção. Os vetores vazios pET14b e pVEC8-35S-ocs foram utilizados como controles negativos em seusrespectivos antecedentes hospedeiros. Como mostrado nafigura 13, esses experimentos resultaram na plantaproduzindo a proteína Xenospira4 (AmelF4).

EXEMPLO 9 - Fermentação e purificação de proteínas daseda

Construções de expressão foram construídas após asregiões de codificação de seda de genes de abelha de melAmelFl-F4 (Xenospiral a 4 respectivamente) e genes MalFl delagarta verde serem amplificadas por PCR e clonadas emvetores de expressão pET14b (Novagen, Madison, WI). Osplasmídeos de expressão resultantes foram entãoeletroporados em células Rosetta E. coli BL21 (DE3) ecultivados durante a noite em Agar LB contendo ampicilina.

Uma única colônia foi então utilizada para inocular caldoLB contendo ampicilina então cultivada a 37°C durante anoite. As células foram cultivadas por centrifugação elisadas com detergente (Bugbuster, Novagen). Corpos deinclusão foram lavados extensamente e solubilizadosnovamente em guanidínio 6M.

Esse procedimento forneceu misturas de proteínas compureza superior a 95% das proteínas de abelha de mel epureza superior a 50% da proteína MalFl de lagarta verde.

Os rendimentos de até 50% do peso úmido da pelota de célulade E. coli foram regularmente obtidos, indicando que asproteínas são fáceis de expressar desse modo.

As proteínas recombinantes de abelha de melsolubilizadas foram aplicadas a uma coluna de resina Talonpreparada de acordo com orientações de fabricação. Foramentão eluídas da coluna em 100mM Tris.HCL, 250 mM imidazolpH 8.

EXEMPLO 10 - Processamento de proteínas da seda em fios

As proteínas da seda de abelha de mel e lagarta verdeforam facilmente transformadas em fios utilizando umavariedade de métodos (vide a figura 14) utilizando oprocedimento a seguir.

O segmento anterior da glândula salivar a partir deApsi mellifera de instar final tardio foi dissecado sobsolução salina tamponada com fosfato e removido para umasuperfície plana em uma gotícula de tampão. Fórceps foramutilizados para segurar qualquer extremidade do segmento.Uma extremidade foi elevada para fora da gotícula e nosentido oposto à outra em uma taxa constante. Isso permitiuo estiramento de um fio fino que rapidamente se solidificou no ar.

As proteínas da seda recombinante larvais de lagartaverde e abelha de mel formaram fios ou folhas apósdesidratação ou concentração. .Por exemplo, por deixar aproteína solúvel cair em uma solução de butanol porconcentração das proteínas na coluna de resina Talon.

Fios também foram obtidos após mistura das proteínasda seda recombinante de lagarta verde ou abelha de mel comum solvente orgânico (como hexano) para concentrar osmesmos na interface na conformação correta, e então adiçãode um reagente para excluir os mesmos da interface (comobutanol). Os fios formados por esse procedimento tiveramespectros FT-IR similares à seda nativa indicando quecompreendiam a mesma estrutura de espiral enrolada.

Proteínas da seda a partir de outras espéciesdescritas aqui também podem ser processadas por esseprocedimento.

Será reconhecido por pessoas versadas na técnica queinúmeras variações e/ou modificações podem ser feitas nainvenção como mostrado nas modalidades específicas sem seafastar do espírito ou escopo da invenção como amplamentedescrito. As modalidades presentes devem, portanto, serconsideradas em todos os aspectos como ilustrativas e nãorestritivas.

Todas as publicações discutidas acima são incorporadasaqui na íntegra.Qualquer discussão de documentos, atos, materiais,dispositivos, artigos ou similares que foi incluída nopresente relatório descritivo é exclusivamente para fins defornecer um contexto para a presente invenção. Não deve sertomado como admissão de que todos ou quaisquer dessesassuntos formam parte da base da técnica anterior ou eramconhecimento geral comum no campo relevante à presenteinvenção como existia antes da data de prioridade de cadareivindicação desse pedido.

REFERÊNCIAS

Atkins E.D.T. (1967) J Mol Biol 24:139-141.

Bendtsen J.D., Nielsen H., von Heijne G. and Brunak S.(2004) J. Mol. Biol. 340:783-795.

Bini E., Knight D.P. e Kaplan D. L. (2004) J. Mol.

Biol. 335:27-40.

Craig C.L. and Riekel C. (2002) ComparativeBiochemistry and Physiology Part B 133:493-507.

Delorenzi M. and Speed T. (2002) Bioinformatics18:617-625.

Deng Y., Liu J., Zheng Q., Eliezer D., Kallenbach N.R.e Lu M. (2006) Structure 14:247-255.

Flower N.E. and Kenchington W.R. (1967) Journal of theRoyal Microscopical Society 86:297.

Grimaldi D. e Engel M.S. (2005) Evolution of insects.Cambridge University Press, New York.

Harayama S. (1998) Trends Biotech., 16;76-82.

Heimburg T, Schunemann J., Weber K., and Geisler N.(1999) Biochemistry 38:12727-12734.

Hepburn H.R., Chandler H. D. and Davidoff M. R. (1979)Insect Biochem. 9:66.Kneller D.G., Cohen F.E. e Langridge R. (1990) J. Mol.Biol. 214:171-182.

LaMunyon C.W. (1988) Psyche 95:203-209.

LaMunyon C.W. e Adams P.A. (1987) Annals of theEntomological Society of America 80:804-808.

Lucas F. Shaw J.T.B. e Smith S.G. (196 0) J. Mol. Biol.2:339-349.

Lucas F. e Rudall K. M. (1967) In ComprehensiveBiochemistry (Ed. Florkin M and Stotz H) Vol 26B pág. 475-559 Elsevier Amsterdam.

Lupas A., Van Dyke M. e Stock J. (1991) Science252:1162-1164.

McClelland J.L. e Rumelhart D. E. (1988) Explorationsin Parallel Distributed Processing vol 13. pp 318-362.MITPress, Cambridge MA.

Needleman, S.B. e Wunsch, CD. (1970) J. Mol. Biol,48/443-453.

Quicke D.L.J., Shaw M.R., Takahashi M. e Yanechin B.(2004) Journal of Natural History 38:2167-2181.

Reiser K., McCormick, Rucker R. B. (1992) The FASEBJournal 6:2439-2449.

Rost B. e Sander C. (1993) J. Molecular Biology232:584-599.

Rost B., Yachdav G. e Liu J. (2004) Nucleic AcidsResearch 32(Web Server issue):W321-W326.

Rudall K.M. (1962) Em Comparative Biochemistry (Ed. ByFlorkin M e Mason HS) Vol 4, pág. 297-435. Academic Press,New York.

Rudall K.M. and Kenchington W. (1971) Annual Reviewsin Entomology 16:73-96.Silva-Zacarin E.C.M., Silva De Moraes R.L.M. andTaboga S.R. (2003) J. Biosci. 6:753-764.

Speilger P.E. (1962) Annals of the EntomologicalSociety of America. 55: 69-77.

Wang M.B., Li Z.Y. e outros. (1998). Acta Hort. 4 61:401-407.

Yamada H., Shigesada K., Igarashi Y., Takasu Y.,Tsubouehi K. e Kato Y. (2004) Int. J. Wild Silkmoth andSilk 9:61-66.LISTAGEM DE SEQUENCIA

<110> Commonwealth scieritlfic and industrial ResearchOrganisation

<120> Proteínas de Seda

<,13Q> 504791

<150> US 60/723,766<1S1> 05/10/2005

<160> 77

<170> Patentin versão 3.3

<210> 1

<211> 314

<212> PRT

<213> Apis roellifera

<400> 1

Gly Leu Glu Gly Pro Gly aso Ser Leu Pro Glu Leu Val Lys Gly ser1 5 10 15

Ala Ser Ala Thr Ala ser Thr Ala vai Thr Ala Arg ser Gly Leu Arg20 25 30

Ala Gly Gln Val Ala Leu Ala ser Gln Lys Asp Ala Val Leu Gln Ala35 40 45

Gln Ala Ala Ala ser Ala Ala ser Glu Ala Arg Ala Ala Ala Asp Leu50 55 60

Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser <Sln Ala Ala65 70 75 80

Ala Lys Gly Lys Glu Thr GTu Glu Ala Ala vai Gly Gln Ala Arg Ala85 90 95

Gly Leu Glu ser vai ser Met Ala Ala Ser Ala Thr ser Ala Ala Lysido 105 110

Glu Ala ser Thr ATa Ala Lys Ala Ala Ala Ser Ala Leu ser Thr Ala115 120 125

vai vai Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val130 135 140

Ala ser asd Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala145 150 155 160

Ala Glu Ala ser vai Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys vai165 170 175

Ala Glu Glu Ala Ile Ala Arg Ala Ala ser Ala Lys Ala Ala Ala Arg160 IS 5 190

Ala Ala Ala Ala Ala Leu Ala ser ser Lys Glu Ala Ala Thr Ala ser195 200 205

Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu210 215 220

Ile Ala Glu lie Asp Lys Lys Ser Arg Glu lie Asp Ala Ala Ser ser225 230 235 240

Leu Asn Ala Arg Ala Ala ATa Lys Ala Ser Ser Arg Asn Val Glu Thr245 250 255Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys

260

265

Gln Val Val Ser Ile270

Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp275 280 285

Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu290 , 295 300

Asn Asp Phe Asp Leu Lys ser Asn Val Phe

305 310

<210> 2

<211> 333

<212> PRT

<213> Apis melli fera

<400> 2

Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe1 5 10 15

Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val20 25 *!"·■ 30

Lys Gly ser Ala ser Ala Thr Ala ser Thr Ala Val Thr Ala Arg ser35 40 45

Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val50 55 60

Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala65 70 75 80

Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu ser Ala ser Val Gln Ser85 90 95

Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln100 105 110

Ala Arg Ala Gly Leu Glu ser Val ser Met Ala Ala Ser Ala Thr ser115 120 125

Ala Ala Lys Glu Ala ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu130 135 140

Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala145 150 155 160

Glu Ala vai Ala ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala165 170 175

Asn Leu Ala Ala Glu Ala ser Val Ala Ala Glu Ala Ala Leu Lys Ala180 185 190

Glu Lys vai Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala195 200 205

Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala210 215 220

Thr Ala ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val225 230 235 240

Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala245 250 255

Ala ser ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn260

265

270

vai Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser ser Lys Gln Val275 280 285

Val 11e Pro Val Glu 1Te Lys Lys Phe Ser Glu Pro Glu Val Ser290 295 300

Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His305 310 315 320

Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe325 330

<210> 3

<211> 290

<212> PRT

<213> Apis mellifera

<400> 3

Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly1 5 10 . 15

Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser20 25 30

Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly35 40 45

Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala50 55 60

Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala65 70 75 80

Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser85 90 95

Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala100 105 110

Thr Val ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys115 120 125

Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala130 135 140

Gln vai Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile145 150 155 160

Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala165 170 175

Arg Lys Ser Ala Ala Asn Phe Leu Ala-Lys Ala Gln Ile Ala Ala Ala180 185 190

Ala Glu ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu195 200 205

Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn210 215 220

Ala ser Thr Gln Ala ser Met Ala Val Argl-Val Asp ser Gln Ala Ala225 230 235 240

Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr

245

250

255Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala260 265 270

Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys275 280 < 285

Leu Glu290

<210> 4

<211> 309

<212> PRT

<213> Apis mel!ifera

<400> 4

Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu1 5 10 15

Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp20 25 30

Ile Gln Gly Gly Tyr ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala35 40 45

Leu Gly Ser ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu50 55 ^ 60

Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala ser65 70 75 80

Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly85 90 95

Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile100 105 110

Lys Ala ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala115 120 125

Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala130 135 140

Ala Ala Lys Glu Ala Thr Arg Ala ser Ala Ala Ala Ala Glu Ala Ala145 150 155 160

Thr Glu Ala Gln Val Lys Ala Asn Ala Asp ser Ile Ile Thr Lys Arg165 170 175

Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala180 185 190

Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile195 200 .·>■■ 205

Ala Ala Ala Ala Glu ser Glu Ala Thr Lys Leu Ala Ala Glu Ala vai210 215 220

Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala225 230 235 240

Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp ser245 250 255

Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu260 265 270

Leu vai Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn275 280 285Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His290 295 300

Val Ala Lys Leu Glu305

<210> 5<211> 316<212> PRT

<213> Apis mellifera<400> 5

Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys15 10 15

Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arq20 25 30

Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu35 40 45

Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val50 55 60

Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser65 70 75 80

Ala Leu ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn85 90 95

Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys ser Leu Ala Ala Leu100 105 110

Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala115 120 125

Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg130 135 140

Leu Ala Thr Val Ala Gln Asn Val Ala Ser- Asp Leu Gln Lys Arg Thr145 150 155 160

Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln165 170 175

Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser180 185 190

Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala195 200 205

Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp210 215 220

Gly Ala Glu Arg ser Ala ser Thr Glu Ala Gln Ser Ala Ala Lys Ile225 230 235 240

Glu ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala ser Glu Asp245 250 255

ser Arg Ala Ala Gln Leu Glu Ala ser Thr Ala Ala Arg Ala Asn Val260 265 270

Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala275 280 285

Gly Ala Ala Ala Gln Leu Leu Ala Gln Alá" Lys Ala Leu Ala Glu Val290 295 300

ser ser Lys ser Glu Asn Ile Glu Asp Lys Lys Phe305 310 315

<210> 6<211> 335<212> PRT

<213> Apis melli fera<400> 6

Met Gln lie Pro Thr Phe Val Ala Ile cys Leu Leu Thr ser Gly Leu1 5 10 15 vai His Ala Gly Val Glu Glu Phe Lys Ser ser Ala Thr Glu Glu Val20 25 30

lie ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser35 40 45

Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu50 55 60

Gln ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala65 70 75 80

Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu85 90 95

Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala100 105 110

Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu115 120 125

Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala ser Ala Arg Ala130 135 140

Asn Ala Ala Thr Ala Ala Thr Gln ser Alá Leu Glu Arg Ala Gln Ala145 150 * 155 160

ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln165 170 175

Lys Arg Thr ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg180 185 190

Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp ser Ala Asn Ala Ala Leu195 200 205

Glu vai ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser210 215 220

Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser225 230 235 240

Asp Ala Asp Gly Ala Glu Arg Ser Ala ser Thr Glu Ala Gln ser Ala245 250 255

Ala Lys Ile Glu Ser vai Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala260 265 270

Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg275 280 285

Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly290 295 ' 300Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu305 310 315 320

Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe325 330 335

<210> 7<211> 323<212> PRT

<213> Apis melli fera<400> 7

Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val15 10 15

Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu20 25 30

Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg vai Gly Thr Gly Ala35 40 45

Ser Glu Val Ala Ser ser ser Gly Glu Ala Ile Ala Ile Ser Leu Gly50 55 60

Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln ser65 70 75 80

Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys85 90 95

Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr100 105 110

Ala Ala Ser Ser Ser Ala Leu Lys Ala ser Leu Ala Thr Glu Glu Ala115 120 125

Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu130 135 140

Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala145 150 155 160

Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala165 170 175

Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala180 185 190

Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp195 200 205

Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp210 215 220

Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu225 230 235 240

Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala245 250 255

Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala260 265 270

Ala Thr ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Met275 280 285

Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu290 295 300Trp Lys Thr ser Thr Lys Glu305 310

305

Glu Trp Lys Thr Thr Asn Glu Glu Trpim 315 320

320

Glu Val Lys

<210> 8

<211> 342

<212> PRT

<213> Apis mel!ifera

<400> 8

Met Lys Ile Pro ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu1 5 10 15

Ala ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr20 25 30

ser Thr Val Val Lys ser Glu Lys Val Glu Val Val Ala Pro Ala Lys35 40 45

Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly50 55 '-V 60

Thr Gly Ala Ser Glu Val Ala Ser Ser ser Gly Glu Ala Ile Ala Ile65 70 ,-,75 80

Ser Leu Gly Ala Gly Gln Ser Ala Ala G Iu Ser Gln Ala Leu Ala Ala85 90 95

Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala lie Gly Ala Ser Glu Leu100 105 110

Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala115 120 125

Arg Ala Thr Ala Ala Ser ser Ser Ala Leu Lys Ala Ser Leu Ala Thr130 135 140

Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala vai Ala Asp Ala Lys Ala145 150 155 160

Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser165 170 175

Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala180 185 190

Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala195 200 205

Lys Ala Ala Glu Ile Ala Leu Lys vai Ala Glu lie Ala Val Lys Ala210 215 220

Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala225 230 235 240

Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala vai Asn Ala Ile Ala245 250 255

Lys Ala Glu Glu Glu Ala ser Ala Gln Ala Glu Asn Ala Ala Gly Val260 265 270

Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala275 280 285

Ala Ala Ala Ala Thr ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala290

295

300

Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys305 310 315 320

Lys Glu Glu Trp Lys Thr ser Thr Lys Glu Glu Trp Lys Thr Thr Asn325 330 335

Glu Glu Trp Glu Val Lys340

<210> 9<211> 353<212> PRT

<213> Apis mel!ifera<400> 9

Gly vai Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys Glu Glu Ser15 10 15

Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys Glu Glu Arg20 25 30

Ala Ser Lys ser Lys ser Glu Arg Leu Lys Ile Arg Glu Glu Lys Arg35 40 45

Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val Val Arg Glu50 55 , 60

Lys lie Thr Lys Leu ser Ser Trp Leu Lys Glu Glu Lys Asp lie ser65 70 75 80

Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly Leu Glu Asp85 90 95

vai Thr Asp Glu Leu Asn Ile Ala Leu Lys ser Leu Lys Glu Gly Lys100 105 ., HO

Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly ser Glu Asp Val Arg Ser115 120 125

Leu Glu Glu Leu Asp Thr ser Val Val Glu Leu Leu Lys Leu Ile Lys130 135 140

Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys Asn Gly Lys145 150 155 160

Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu Glu Thr Cys165 170 175

Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys Asp Lys Lys180 185 190

Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp Leu Asp Trp195 200 205

Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu Leu Gly Gly210 215 220

Leu ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly Leu Leu Gly225 230 235 240

Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu Ile ser Glu245 25.0 255

Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser Val Asp Ser

260

265

270VaT Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser ser VaT ser Lys275 280 285

Val Thr GTu Leu Leu Asn Lys GTy Ile Asp Ile Gln Thr Ile Leu Asn290 295 300

Ala Lys Asn Gly Asp Glu Phe Asp Leu ser Gly Lys Glu Leu Lys Asn

305 310 315

Val Lys Gly Ile Phe Gly Leu He Gly ser Leu Lys Arg ser Leu Gly

325 330 335

Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro Leu Leu Lys340 345 350

Leu

<210> 10<211> 372<212> PRT

<213> Apis melli fera<400> 10

Met Lys Tyr Met Leu Leu Leu Leu Ser Ile Phe Ile Cys Ala His Ile1 5 10 15

Val cys Ala Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys20 25 30

Glu Glu ser Tyr Glu Lys Ser Glu ser Lys ser Leu Lys GTu Ile Lys35 40 45

Glu Glu Arg Ala ser Lys ser Lys Ser Glu Arg Leu.Lys Ile Arg Glu50 55 60

Glu Lys Arg Glu Glu Glu Glu Lys ser Lys Ser Leu Asn Leu Val Val65 70 75 80

vai Arq Glu Lys Ile Thr Lys Leu Ser ser Trp Leu Lys Glu Glu Lys85 9Ό 95

Asp Ile Ser Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly100 105 HO

Leu Glu Asp vai Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys115 120 125

Glu Gly Lys Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly ser Glu Asp130 135 140

Val Arg ser Leu Glu Glu Leu Asp Thr ser vai Val Glu Leu Leu Lys145 150 155 160

Leu Ile Lys Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys165 170 175

Asn Gly Lys Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Il e Leu180 185 190

Glu Thr cys Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys195 200 205

Asp Lys Lys Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp210 215 220

Leu Asp Trp Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu225 230 235 240Leu Gly Gly Leu Ser Gly Leu Leu Asn Ser Leu Lys ser Glu Lys Gly245 250 255

Leu Leu Gly Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu260 265 270

Ile Ser Glu Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser275 280 285

Val Asp Ser Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser290 295 300

Val Ser Lys Val Thr Glu Leu Leu Asn Lys Gly Ile Asp lie Gln Thr305 310 315 320

Ile Leu Asn Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu325 330 335

Leu Lys Asn Val Lys Gly Il e Phe Gly Leu Ile Gly Ser Leu Lys Arq340 345 350

Ser Leu Gly Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro355 360 365

Leu Leu Lys Leu370

<210> 11<211> 942<212> DNA<213> Apis mellifera<400> 11

ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc 60gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg 120cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct 180gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc 240gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg 300gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc 360gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa 420gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg 480gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc 540atcgcaagag cggcctctgc aaaggctgcc gcaagàgctg ctgctgccgc tctagcctcc 600tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa 660gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg 720cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg 780gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg 840gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag 900cacataaatc tgaacgactt cgacttgaag agcaacgtat tt 942

<210> 12<211> 999WO 2007/038837

PCT/AU2006/001453

<212> DNA

<213> Apis melli fera<400> 12

atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag 180aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct 240gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc 300aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg 360tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca 420gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct 480gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc 600gcaagagcgg cctctgcaaa ggctgccgca agagc-tgctg ctgccgctct agcctcctcg 660aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta 720gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt 780aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc 840aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag 900ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac 960ataaatctga acgacttcga cttgaagagc aacgtattt 999

<210> 13 <211> 870 <212> DNA <213> Apis ; melli fera t <400> 13 cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca 60ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc 120gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc 180agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc 240gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac 300caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca 360gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct 420gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt 480gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca 540gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc 600gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac 660gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg 720aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc 780PCT/AU2006/001453

gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac 840

gagaagaaaa tacatgtagc aaagttggaa 870

<210> 14<211> 927<212> DNA

<213> Apis mel!ifera

<400> 14

atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc 60

gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga 120

atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct 180

cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt 240

gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct 300

ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa 360

ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca 420

caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct 480

acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc 540

gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg 600

aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg 660

gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca 720

caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac 780

gctgaagcag ccgctgtagc gcaagccgaa actctçjtgg ttacggcaga agctgtcgca 840

gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag 900

aagaaaatac atgtagcaaa gttggaa 927

<210> 15<211> 949<212> DNA

<213> Apis mel!ifera<400> 15

ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc 60

gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc 120

ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa 180

gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc 240

gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg 300

caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca 360

gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa 420

gcctcctcca ggttagcaac ggtcgcccaa aacgtâgtca gcgacttgca gaaacggacc 480

agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga 540

acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc 600aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct 660tctgacgcgg acggcgcgga aaggtcggca tctacçgagg cacaatcagc tgcgaagatc 720gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct 780caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg 840attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt 949

<210> 16<211> .1006<212> DNA

<213> Apis mel!ifera<400> 16

atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc 60

gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac 120

ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc 180

aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca 240

gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca 300

ttgtcagccg ccgcttcagc caaggcagcc gccgeççtga aaaatgctca acaagcgcaa 360

ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420

tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc 480

tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc 540

accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg 600

aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag 660

accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct 720

gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag 780

agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa 840

ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt 900

ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960

gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt 1006

<210> 17<211> 969<212> DNA

<213> Apis mellifera<400> 17

gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag 60

aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt 120

ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg 180

ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc 240

aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta 300gttgctggcg cgactggtgc gcaggcgagagccagcttgg cgaccgaaga agcggcggaagctgccgcgg aaaaggccga atccctggcggccctctcct ccgaaagggc gaacgaattggcgcaggcca agacagcagc cgccgccaaaatagcggtga aggcggaagc ggacgcagcagccgtggcag acgcggccgc tgcccgtgccgaggaggcct cggcccaagc agagaacgccgcggcggaat cgcgagccgc tgcagctgccgctggcccgt tggcaggtga gatgaaaccaaagaaggagg agtggaaaac gtcaacgaaggaggtgaag <210> 18 <211> 1026 <212> DNA <213> Apis mellifera <400> 18 atgaagatcc catccatact cgcggtttccagggaagagg tggagacacg ggacaagaccgtggaagtcg ttgctcccgc taaggatgaaagaagagtgg gaactggagc atccgaggtgagtcttggag cagggcagtc agcggcagagacggcagcga acgccgccat aggcgcgagcgctggcgcga ctggtgcgca ggcgagagctagcttggcga ccgaagaagc ggcggaagaggccgcggaaa aggccgaatc cctggcgaaactctcctccg aaagggcgaa cgaattggctcaggccaaga cagcagccgc cgccaaagcagcggtgaagg cggaagcgga cgcagcagctgtggcagacg cggccgctgc ccgtgccgcagaggcctcgg cccaagcaga gaacgccgccgcggaatcgc gagccgctgc agctgccgccggcccgttgg caggtgagat gaaaccaccgaaggaggagt ggaaaacgtc aacgaaggaagtgaag

PCT/AU2006/001453

15/70

gctacggccg cctcctcgag cgcgttgaag 360gaggccgagg cggccgtggc tgacgccaag 420aaaaatctcg cgtcggcgag cgctcgcgcg 480gctcaagctg agagcgctgc agcggccgag 540gcagcggaaa tcgcccttaa ggtcgctgag 600gctgccgccg tggcagctgc aaaggcaaga 660gcagccgtga acgccatcgc caaggcggaa 720gccggtgttt tgcaagcagc cgcctccgcc 780gccgctgcta cctcggaggc agcggctgaa 840ccgcactgga aatgggaacg gattcctgtg 900gaagaatgga aaacgacgaa tgaagaatgg 960 969ctgctgatct ggggtttggc aagcggcgca 60aagacctcga cagtggtgaa aagcgagaaa 120cttaaattaa cgagcgagcc tatctttgga 180gcatctagca gcggtgaagc catcgcgata 240tctcaggcct tggccgcctc gcaatccaaa 300gagcttacca acaaagttgc tgctctagtt 360acggccgcct cctcgagcgc gttgaaggcc 420gccgaggcgg ccgtggctga cgccaaggct 480aatctcgcgt cggcgagcgc tcgcgcggcc 540caagctgaga gcgctgcagc ggccgaggcg 600gcggaaatcg cccttaaggt cgctgagata 660gccgccgtgg cagctgcaaa ggcaagagcc 720gccgtgaacg ccatcgccaa ggcggaagag 780ggtgttttgc aagcagccgc ctccgccgcg 840gctgctacct cggaggcagc ggctgaagct 900cactggaaat gggaacggat tcctgtgaag 960gaatggaaaa cgacgaatga agaatgggag 1020

1026

<210> 19<211> 1059<212> DNA

<213> Apis melli fera<400> 19

ggcgtaaata cagaattaaa aaaagatggtgagtcaaaga gtttaaaaga aattaaagaattgaagattc gtgaagaaaa acgcgaagaggtggtcagag aaaagattac caaactttctcctcttttgg aagaaaaaaa tggcaaaggtttaaatatcg ctcttaaatc gttgaaggagaaaggtagcg aagacgttcg ttctttggaaaaattaataa aggaaggaaa aactgaccatgtacttgtag atttggaaaa aatctcagaaaagactgtgg aagttgtaga tgataaagacaaaaatctaa atgatctaga ttggaaaaaattgcttggcg gtttaagtgg cctcttaaatcttttgaata agaatcaaat tgagttattaaatatagatt ttaatctctt cgattctgttcttttcacaa gttctgtttc aaaagttactacaattttga atgcgaaaaa tggagatgaagtcaaaggga tatttggttt gattggaagtttgaacttac cgtttaaacg tatacctctg

<210> 20<211> 1116<212> DNA

<213> Apis mellifera<400> 20

atgaaataca tgctcttgtt gctatctatagtaaatacag aattaaaaaa agatggtgaatcaaagagtt taaaagaaat taaagaagaaaagattcgtg aagaaaaacg cgaagaggaagtcagagaaa agattaccaa actttcttcacttttggaag aaaaaaatgg caaaggtctaaatatcgctc ttaaatcgtt gaaggagggcggtagcgaag acgttcgttc tttggaagaattaataaagg aaggaaaaac tgaccatggtcttgtagatt tggaaaaaat ctcagaaaacactgtggaag ttgtagatga taaagacaaa

PCT/AU2006/001453

16/70

gaactaaagg

gaacgtgctt

gaagaaaaat

tcatggctca

ctattgggtt

ggcaaaaagt

gaacttgata

gg.tgctatag

aacatacttg

aaaaaatgga

gatttagata

agtttaaaat

attcctttaa

gattctgtcg

gaattattaa

ttcgatttaa

ttgaaacgct

cttaaatta

aagagtcttacaaaatcaaaccaagagtctaagaagagaatggaagatgtttgatacttgcgagcgtcgtatttggagaaaaacttgtggataaagaatcaagataaagtcagaaaaaggtcagtgagataaagaaatttataaaggaatgcggcaaagacattaggatt

tgagaaaagcaagtgaacgtgaatctggtcagatatcagtcacggacgaggaaattcgagtgaacttttagaatggtaagatcacaaaagaggttggaaatggtggcggttcttctaggtaaaaaagaaaagacttgaaacgatattcaaattgaaaaacagaaaatata

ttcatctgtgctaaaggaagcgtgcttcaagaaaaatccatggctcaaagttgggtttggaaaaagtttgcttgatacgagctatagattatacttgaaaaaatggaata

cacatattgtagtcttatgaaatcaaaaagagagtctgaaaagagaaagaaagatgtcacatacttggaagcgtcgttgatggagaagaacttgtggatcaagaatcagg

atgcgcaggcgaaaagcgagtgaacgtttgtctggtcgtgtatcagtcctggacgagttaattcgagaaaacttttaaaatggtaaggtaacaaaagaagttggaaaaaa

6012018024030036042048054060066072078084090096010201059

60120180240300360420480540600660WO 2007/038837 PCT/AU2006/001453

aatctaaatg atctagattg gaaaaaagat ttagataaag ataaagttgg tggcggtttg 720cttggcggtt taagtggcct cttaaatagt ttaaaatcag aaaaaggtct tctaggtctt 780ttgaataaga atcaaattga gttattaatt cctttaatca gtgagataaa aaagaaaaat 840atagatttta atctcttcga ttctgttgat tctgtcgaaa gaaatttaga cttgaaactt 900ttcacaagtt ctgtttcaaa agttactgaa ttattaaata aaggaatcga tattcaaaca 960attttgaatg cgaaaaatgg agatgaattc gatttaagcg gcaaagaatt gaaaaacgtc 1020aaagggatat ttggtttgat tggaagtttg aaacgctcat taggattaga aaatatattg 1080aacttaccgt ttaaacgtat acctctgctt aaatta 1116<210> 21 <211> 1660 <212> DNA <213> Apis mellifera <400> 21 atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180aagattcgtg aaggtaattc gtgagattca agattcaaat caattaaatt tgaaaattat 240gaaagtagta ttgttaaatt ataagataga agattttatc taaaaaataa taaattaagc 300tttttgtatt tttggatatt gtagatattt ttaatataga attcttataa agttaaaaaa 360tattttataa attaaacaac tttttattat ttttatgatc taaaaattaa aaatttçaag 420ttaaagttca aattaaaaat ttgtaaaaaa tatggaaaaa acataaaaat tgaatttgtt 480gtaatttaaa aaggattttt attatttatt gattaattat gaatataagt tcgaaaaatc 540ctaaatatta atgtttaaaa ttttaattct taacaaaata tatttaattt aattcttaac 600aaagatacat ttaaagaatt tcgcaaattt aaaaattagg tttttaattt taagaatcaa 660atggtaaaaa acattttaaa tttgaaatat ataaaagtaa atcttttaat cgacaaacgg 720atgaatttat tgattagaaa aacgcgaaga ggaagaaaaa tccaagagtc tgaatctggt 780cgtggtcaga gaaaagatta ccaaactttc ttcatggctc aaagaagaga aagatatcag 840tcctcttttg gaagaaaaaa atggcaaagg tctattgggt ttggaagatg tcacggacga 900gttaaatatc gctcttaaat cgttgaagga gggcaaaaag tttgatactt ggaaattcga 960gaaaggtagc gaagacgttc gttctttgga agaacttgat acgagcgtcg ttgaactttt 1020aaaattaata aaggaaggaa aaactgacca tggtgctata gatttggaga agaatggtaa 1080ggtacttgta gatttggaaa aaatctcaga aaacatactt gaaacttgtg gatcacaaaa 1140gaagactgtg gaagttgtag atgataaaga caaaaaatgg aataaagaat caggttggaa 1200aaaaaatcta aatgatctag attggaaaaa agatttagat aaagataaag ttggtggcgg 1260tttgcttggc ggtttaagtg gcctcttaaa tagtttaaaa tcagaaaaag gtcttctagg 1320tcttttgaat aagaatcaaa ttgagttatt aattccttta atcagtgaga taaaaaagaa 1380aaatatagat tttaatctct tcgattctgt tgattctgtc gaaagaaatt tagacttgaa 1440acttttcaca agttctgttt caaaagttac tgaattatta aataaaggaa tcgatattca 1500aacaattttg aatgcgaaaa atggagatga attcgáttta agcggcaaag aattgaaaaa 1560cgtcaaaggg atatttggtt tgattggaag tttgáaacgc tcattaggat tagaaaatat 1620attgaactta ccgtttaaac gtatacctct gcttaaatta

<210> 22<211> 308<212> PRT

<213> Bombus terrestris<400> 22

Glv Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala15 10 15

Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln20 25 ' 30

Val Ala vai Ala ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala ser35 40 45

Ala Ala Ala Ala Ala Ala Ala Arg Ala ser Ala Asp Gln Ser Ala Ser50 55 60

Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala65 70 75 80

Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln85 90 95

Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala100 105 110

Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln115 120 125

Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala ser Glu130 135 140

Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala ser Ala Ala Ala Ala Ala145 150 155 160

Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu165 170 175

Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala180 185 190

Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser195 200 205

Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu210 215 220

Leu Asp Lys Lys Ser Arg Glu Val Ala Àla ser Ala Ser Ala Lys Ala225 230 .235 240

Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Iley 245 250 255

Gly Ala Asn Ile Asn vai Ala Lys Glu Val Leu Ala Ile Pro Ile Glu260 265 270

Pro Lvs Lvs Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val275 280 285Ala vai Ala Ser ser Glu ser Glu Val Lys Val Glu Thr ser ser Glu290 295 300

Ala Trp ser Ile305

<210> 23<211> 327<212> PRT

<213> Bombus terrestris<400> 23

Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe15 10 15

Ala ser Ala Gly Gln ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser20 25 30

Ala ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg35 40 45

Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala50 55 60

Asp Ala ser Ala Ala Ala Ala Ala Ala Ala Arg Ala ser Ala Asp Gln65 70 75 80

ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln ser Lys Ala Ala85 90 95

Ala Arq Ala Lys ser Ala Glu Glu ser Ala Ala Ala Thr Ala Lys Ala100 105 HO

Glu Leu Gln Ala Glu Ser Ile Ala Ala ser Ala Ser ser Asn Ala Arg115 120 125

Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala130 135 140

Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu145 150 ' 155 160

Ala ser Glu Glu Ala Lys Leu Lys Ala AlaiAla Ala Ala Ser Ala Ala165 170 175

Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile180 185 190

Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg195 200 205

Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser210 215 220

Ala Arg ser Ala Ala Glu Ala Glu Ala Lys ser Glu Val Ala Ile Leu225 230 235 240

Ile ser Glu Leu Asp Lys Lys ser Arg Glu Val Ala Ala ser Ala Ser245 250 255

Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser ser Arg Asn Ala Glu Thr260 265 270

Ala Val lie Gly Ala Asn lie Asn Val Ala Lys Glu Val Leu Ala Ile275. 280 285

Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu290 295 300

Glu Asn Val Ala Val Ala Ser ser Glu Ser Glu Val Lys Val Glu Thr305 310 315 320

ser Ser Glu Ala Trp Ser Ile325

<210> 24<211> 293<212> PRT<213> Bombus terrestris<400> 24

His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu15 10 15

Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala ser Met Glu Asn Gly20 25 30

lie Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu35 40 45

Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys50 55 60

Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala65 70 75 80

Ile Ala Lys Arg Glu Glu Ala lie Lys Ala Ser Glu Leu Ala Ser Lys85 90 95

Leu Leu Thr Ala Ala Ala Gly ser ser Glu Ala Ala Val Ser Ala Thr100 105 110

Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala115 120 125

ser Ala Ser Ala ser Glu Ala ser Ala Glu Ala Gln Val Arg Ala Asn130 135 140

Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala145 150 155 16.0

Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala165 170 175

Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu ser Glu Ala180 185 190

Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val195 200 205

Ala Val Asp Gln ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala210 215 220

Ala Thr Ala Val Gln Leu Gln ser Gln Alã Ala Asn Ala Glu Ala ser225 230 235 240

Ala vai Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser245 250 255

Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr ser Trp Gly Glu Glu260 265 270

cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu275 280 285Arg Gln Asp Asn Trp290

<210> 25

<211> 313

<212> PRT

<213> Bombus terrestris

<400> 25

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly1 5 10 15

Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro20 25 * 30

Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser35 40 45

Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu50 55 60

Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr65 70 75 80

Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala85 90 95

Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu100 105 110

Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala115 120 125

Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala130 135 140

Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln145 150 155 160

Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala165 170 175

Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys180 185 190

Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala195 200 205

Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala210 215 220

Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala225 230 235 240

Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn245 250 255

Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala260 265 270

Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser275 280 285

Trp Gly Glu Glu Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp290 295 300

Arg Leu Asn Glu Arg Gln Asp Asn Trp305 310<210> 26

<211> 313

<212> PRT

<213> Bombus terrestris

<400> 26

Gly ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu1 5 10 15

Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn20 25 30

Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr35 40 45

Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala50 55 60

Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe65 70 75 8Q

Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln85 90 95

Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln100 105 110

Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala115 120 125

Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr130 135 140

Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser145 . 150 155 160

Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala165 170 175

Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala180 185 190

Ala Ala Ile Glu Ala Lys Ala Thr Ala ser ser Glu ser Thr Ala Ala195 200 205

Ala Thr Ser Lys Ala Ala Val Leu Thr AlaiAsp Thr Ser Ser Ala Glu210 215 220

Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr225 230 235 240

Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr245 250 255

Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala260 265 270

vai Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala ser Ala Ala275 280 285

Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser290 295 300

Leu Gly Ala ser Glu Lys Asp Lys Lys305 310<210> 27<211> 332<212> PRT

<213> Bombus terrestris<400> 27

Met GTn He Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu1 5 10 15

Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val20 25 30

Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arq35 40 45

Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu50 55 60

Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys65 70 75 80

Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arq Ala Ser85 90 95

Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu100 105 110

Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu115 120 125

Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala130 135 140

Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arq145 150 155 .. 160

Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val165 170 175

Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln180 185 190

Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala195 200 205

Ala Ala Ala Ala Ala Ile Glu Ala Lys- Ala Thr Ala Ser Ser Glu Ser210 215 220

Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser225 230 235 240

Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln ser Ala ser Arg Ile245 250 255

Ala Gly Thr Ala Ala Thr Glu Gly ser ATa Asn Trp Ala Ser Glu Asn260 265 270

Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala275 280 285

Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala290 295 300

ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala305 310 315 320

Ser Ala ser Leu Gly Ala Ser Glu Lys Asp Lys Lys325 330WO 2007/038837 PCT/AU2006/001453

<210> 28<211> 338<212> PRT

<213> Bombus terrestris<400> 28

Gly Lys Pro Leu He Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu1 5 10 15

Thr ser Ser ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr20 25 30

Leu vai Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala35 40 45

Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr50 55 60

Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys65 70 75 80

Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile85 90 95

Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala100 105 110

Ala Ala Ala Gln Ala Lys Ser Ala Ala Alâ Ala Ala Ala Asn Ala Gly115 120 125

Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala130 135 140

Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu145 150 155 160

Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val Ala Leu Ala165 170 175

Arq Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala180 185 190

Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala195 200 205

Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala210 215 220

Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys vai Ala Glu Thr Ala vai225 230 . 235 240

Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala245 250 255

Arq Ala Val Ala Asp Ala Ala Ala Ser Arg Ála Thr Ala Val Asn Ala260 265 270

Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu Asn Thr Ala275 280 285

Gly vai Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys290 295 300

Ile Gly Ala Ala Ala Thr Pro Arg His Ser ser Ser Tyr Ala Trp Trp305 310 315 320

Lvs Leu Arq He Thr ser Leu Ile Val lie Leu ser Pro Arg Asn Arg325 330 335Arg Thr

<210> 29

<211> 357

<212> PRT

<213> Bombus terrestris

<400> 29

Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu1 5 10 15

Ala Ser Ala Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val20 25 30

Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly35 40 45

Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu50 55 60

Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala65 70 75 80

Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr85 90 95

Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala ser Gly100 105 110

Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala115 120 125

Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala130 135 140

Asn Ala Gly Glu ser ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala145 150 < . 155 160

Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys165 170 175

Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val180 185 190

Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala ser Thr195 200 205

Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys ser Asn210 215 220

Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys225 230 235 240

Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys vai Ala Glu245 250 255

Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala260 265 270

Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala275 280 285

vai Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp ser Ala Gln Ala Glu290 295 '.\r" 300

Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala GlnAsp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr325 330 335

Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro340 345 350

Arg Asn Arg Arg Thr

<210> 30<211> 422<212> PRT

<213> Bombus terrestris

<400> 30

Gly Asn Ser Glu ser Gly Glu Asn Trp Lys Asn Gly Glu ser Ser Glu1 5 10 15

Ser Gly Lys Asn Trp Arg Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn20 25 30

Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Asn Gly35 40 45

Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Ser Glu50 55 60

Ser Gly Lys Asn Trp Lys Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn65 70 75 80

Trp Lys Asn Gly Gly Ser ser Glu Ser Asn Lys His Trp Lys Ser Gly85 90 95

Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Gly Asn100 105 110

Lys Gly Lys Ser ser Lys Ser Ser Glu Ser Trp Lys Ser Asn Glu Asn115 120 125

Ser Lys Asn Asp Gly Ser Trp Lys ser Ser Glu Glu ser Glu Lys Trp130 135 140

Lys Asp Gly Lys Ala Val Ala Glu Asp Ser Val Ser Ile Asn Trp Ala145 150 155 160

Asp Val Lys Glu Gln Ile Ser Asn Ile Ala Thr ser Leu Glu Lys Gly165 170 175

Gly Asn Leu Glu Ala Val Leu Lys Ile Lys Lys Gly Glu Lys Lys Ile180 185 190

Ser Ser Leu Glu Glu Ile Lys Glu Lys Ile Ser Val Leu Leu Lys Trp195 200 205

Ile Gln Glu Gly Lys Asp Thr Ser Ser Leu Leu Asp Leu Lys Glu Gly210 215 220

Ser Lys Asp Ile Ala Ser Leu Lys Glu lie Lys Gly Lys Ile Leu Leu225 230 235 240

Ile Val Lys Leu Val Asn Glu Gly Lys Asp Thr Ser Gly Leu Leu Asp245 250 255

Leu Glu Ala ser Gly Lys Val Ile Leu Glii Leu Gln Ser Ala Ile Glu

355

260

265

270Lys Val Leu Val Lys Ser Glu Lys Val Thr Lys Val ser Glu Val Ser275 280 285

Gly Leu vai Lys Ser Lys Thr Val Ser Asp He Lys Pro Leu Gln Ala290 295 300

Val lie Pro Leu Ile Leu Glu Leu Gln Lys Thr Asp Ile Asn Leu ser305 310 315 320

Thr Leu Asn Lys Trp ser Thr Val Asn Val Asn ser Ile Asp Lys Glu325 330 335

Arg Val Thr Lys Thr vai Pro vai Leu Leu Gln Ser Met Lys Gly Gly340 345 350

Glu Asp lie Gln Asn Leu Leu Ser Ala Lys Gly Ala Lys Lys Leu Gly355 360 365

Ile ser Ala Leu Asp Leu Gln Ala Val Gln Gly Ala Leu Gly vai Val370 375 380

Gly Lys Leu Ser ser Gly Gly Ala Leu Asn Ser Lys Gly Leu Leu Asn385 390 395 400

Leu Lys Asp Gly Ala ser Val Leu Gly Ala Gly Lys Ile Gly Gly Leu405 410 415

Ile Pro Leu Pro Lys Leu420

<210> 31 <211> 927 <212> DNA <213> Bombus terrestris <400> 31 ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc 60gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat 120gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac 180cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca 240aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt 300gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc 360gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct 420ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc 480agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag 540gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa 600gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata 660ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca 720cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc 780aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag 840ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa 900acgagcagcg aagcatggtc aatttaa 927<210> 32<211> 984<212> DNA

<213> Bombus terrestris<400> 32

atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc

cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct 1

gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc 1

acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag 2

tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa 3

tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct 3

gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg 4

atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg 4

gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc 5

gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg 6

gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc 6

gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg 7

atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc 7

gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat 8

gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg 9

gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg 9

agcagcgaag catggtcaat ttaa 9

<210> 33<211> 882<212> DNA

<213> Bombus terrestris<400> 33

cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat

gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 1

aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 1

aagcaggcca aagacacaga ggccgcggaa gctggâgcgg ccgctgcgat tgccatcgct 2

atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 3

gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 3

gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 4

gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 4

gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 5

aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 6

gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 6

accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 7WO 2007/038837

PCT/AU2006/001453

gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 780

gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 840

tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 882

<210> 34<211> 942<212> DNA

<213> Bombus terrestris

<400> 34

atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc b0

cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 120

gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 180

aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 240

aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 300

atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 360

gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 420

gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 480

gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 540

gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct

aággctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa

gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 720

accgctcaag ctgccacagc cgttcagctg cagt.ctcaag cagctaacgc ggaagcctcc 780

gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 840

gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 900

tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 942

<210> 35<211> 942<212> DNA

<213> Bombus terrestris

<400> 35 ^ ^

ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg t>u

aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc 120

acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc 180

aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt 240

gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg 300

gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct 360

cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc 420

agagcagcca cgaccgccca agacatctcc agcg'atí|tgg agaaacgtgt cgccacctca

600660

480

gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg 540tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc 600gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact 660agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca 720gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa 780gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga 840cttgcacggg acgctagtgc cgcagctcag gcagcc^ciag aagttaaagc cttagctgaa 900gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga 942

<210> 36

<211> 999

<212> DNA

<213> Bombus terrestris

<400> 36

atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt 60agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag 120aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca 180gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa 240gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct 300gctgcttcag ccaaagctgc tgccgctgta aaggaag.caa cgcaggcaca gttgctggca 360caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc 420gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga 480gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc 540gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc 600gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct 660tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc 720agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca 780gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct 840tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt 900gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct 960agtgccagct taggtgcttc agaaaaggac aagaaatga 999

<210> 37<211> 1017<212> DNA

<213> Bombus terrestris<400> 37

ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct 60tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg 120gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata 180gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa 240ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt 300

ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca 360

gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct 420

gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta 480

gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc 540

gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa 600

gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct 660

aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg 720

aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca 780

gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac 840

tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca 900

caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg 960

aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa 1017

<210> 38<211> 1074<212> DNA

<213> Bombus terrestris

<400> 38 cn

atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc 60

aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca 120

gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct 180

tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg 240

agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta 300

ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc 360

gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg 420

gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca 480

gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag 540

gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca 600

aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg 660

gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa 720

gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa 780

acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac 840

gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct 900

gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa 960

gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag 1020

cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa 1074PCT/AU2006/001453

<210> 39

<211> 1411

<212> DNA

<213> Bombus terrestris

<400> 39 ggaaattcgg aaagcggcga aaattggaag aacggtgaaa gctccgaaag cggcaaaaat 60tggaggaaca gcggaagctc cgaaagcggc aaaaattgga agaatggcgg aagctcagaa 120agcaacaaac attggaagaa cggtggaagc tcggaaagcg gcgagaaatg gaaaaacagt 180gaaagctccg aaagcggcaa aaattggaag aacagcggaa gctccgaaag cggcaaaaat 240tggaaaaacg gcggaagctc ggaaagcaac aaacattgga agagcggtgg aagctcggaa 300agtggcgaga aatggaaaaa cagtgaaagc ggaaataaag gcaaaagctc aaaaagcagc 360gaaagttgga agagcaacga aaactcgaag aacgacggca gctggaagag cagtgaagaa 420tcagaaaagt ggaaagatgg taaagcagtg gcggaagaca gcgttagtat aaactgggca 480gatgtcaaag agcagattag caacattgct acátccttag aaaagggtgg taacctcgag 540gctgtattga aaataaagaa aggagaaaag aaaatttcaa gtttggagga aatcaaggag 600aaaatctctg tcctactgaa atggattcaa gaaggcaaag atactagcag cctattagat 660ttgaaagagg gtagcaagga tattgcgtcg ttgaaagaaa tcaaaggaaa gatccttttg 720attgttaaat tagtgaacga agggaaagac actagtggtc ttttagattt agaagcgagt 780ggcaaagtaa ttttagaatt gcaaagcgcc atagaaaagg ttctcgtaaa gtcagaaaag 840gtaaccaaag tatctgaagt ttccggttta gtaaaaagca aaactgtctc ggacataaaa 900ccgcttcaag cagtaattcc tttaatcctt gaattgcaaa aaacagacat taaccttagt 960accttaaaca agtggtccac tgttaacgta aattctatag ataaagaacg cgtcacgaaa 1020acggttccag tgctccttca atccatgaaa ggaggcgaag atattcagaa ccttttgagt 1080gcgaaaggtg caaagaaact tggcattagt gctttggact tacaggcagt tcaaggagct 1140cttggcgtgg ttggaaagct aagttcaggt ggtgcgttga actcaaaagg cttgttgaac 1200ttgaaagacg gcgctagtgt gttaggtgca ggaaaaatcg gaggattaat tcctttaccg 1260aaactttaag agatagaccg ataaaggcag atatactctc i ggaagatttt tttggaagtt 1320gaatagtccg caaaaaaatt atctctgatt attataattt agcctaaaat attaaataaa 1380atggagaaat aacgttgaaa tatataaata a 1411

<210> 40<211> 403<212> PRT

<213> Myrmecia forficata<400> 40

υ ittt ι

Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser1Ala Ala Ser Ala Ser Ala15 10 15

Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala20 25 30

Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg35 40 45

Val Gly Ala ser Arg Ala Ala Ala Thr Leu vai Ala Ser Ala Ala Val50 55 60

Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln65 70 75 80

Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu85 90 95

Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala100 105 110

Glu Ala Gln ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu115 120 125

Ser Ala Ser Leu Asp Ala Ala Ala vai Glu Ala Glu Val Ala Ala Ala130 135 140

Thr ser Lys Ser ser Ala Gly Gln Ala Leirdn ser Ala Gln Thr Ala145 150 155 160

Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys165 170 175

Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met180 185 190

Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln195 200 205

Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala210 215 220

Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala.225 230 235 240

Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala245 250 255

Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg260 265 270

Ala ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser275 280 285

Ser Ile Arg Arg Asp Glu Leu Ile Glu Il& Gly Ala Glu Phe Gly Lys290 295 300

Ala Ser Gly Glu vai lie Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln305 310 315 320

Asp Ala Ile Ala Thr Ala Glu Ala ser Ser Ser Ala Ser Ala Val Gly325 330 335

Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val340 345 350

Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser355 360 365

Ser ser ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser370 375 380

Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr385 390 395 400

Leu Leu Leu<210> 41<211> 422<212> PRT

<21Β> Myrmecia forficata<400> 41

Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe1 5 10 15

Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Vly Arg Ser Ala Ala Ser20 25 30

Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys35 40 45

Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile50 55 60

Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser65 70 75 80

Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala85 9.0 95

Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys100 105 110

Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln115 120 125

Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val130 135 140

Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val145 150 155 160

Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala165 170 175

Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr180 185 190

Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala195 200 205

Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala210 215 220

Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala225 230 235 240

Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala245 250 255

Lys Ala Ala Met Ala.Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln260 265 270

Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser275 280 285

Lys ser Arg Ala ser Asp Ala Lys Val Ash Ala Val Ala Arg Ala Ala290 295 300

Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu305 310 315 320

Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg ser AsnWO 2007/038837

PCT/AU2006/001453

325

330

335

Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala ser340 345 350

Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly ser Gly Lys Trp355 360 365

Ser Arg Val Ser Lys Gly Lys Gly Trp Ala ser Ser Asn Ala Asp Ala370 375 380

Asp Ala ser Ser ser ser lie lie Ile Gly Gly Leu Lys Arg Gly Gly385 390 395 400

Leu Gly ser Glu Ala Ser Ala Ala Ala ser Ala Glu Ala Glu Ala Ser405 410 415

Ala Gly Thr Leu Leu Leu420

<210> 42

<211> 392

<212> PRT

<213> Myrmecia forficata

<400> 42

Arg Val Ile Glu ser ser ser ser Ala ser Ala Gln Ala Ser Ala ser1 5 10 15

Ala Gly ser Arg Gly Leu Leu Gly Lys Arg pro Ile Gly Lys Leu Glu20 25 30

Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu ser Leu35 40 45

Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp vai50 55 60

Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr65 70 75 80

Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala85 90 95

Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln100 105 110

Ala Gly Ala Val Ala Asn ser Ala Ala Glu Arq Ala Ile Ala Ala Met115 120 125

Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys130 135 140

Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr145 150 155 160

Ala Ala Ala ser Ala ser Lys Ile Ser ser Gln Glu ser Ala Ala ser165 170 175

Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile180 185 190

lie Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu195 200 205

Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys ser Leu Ser

210

215

220Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala ser225 230 235 240

Ala Glu Ala Gln Ile Lys Leu ser Gln Ala Arg Ala Ala Val Ala Arg245 250 255

Ala Ala Ala Asp Gln Ala Val cys Ser Ser Gln Ala Gln Ala Ala ser260 265 270

Gln Ile Gln ser Arg Ala Ser Ala Ser Glu ser Ala Ala Ser Ala Gln275 280 285

ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala *290 295 300

Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met ser Leu Lys Asn Asp305 310 315 320

Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu325 330 335

Ala Val ser Ile ser Lys Gly His Arg Gly Gly Ile Arg ser Gly ser340 345 350

Ile Ser Glu Ala ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly355 360 365

Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala ser370 375 380

Ala Gly Ser Ser Ala Asp Ssr Leu385 390

<210> 43<211> 411<212> PRT

<213> Myrmecia forficata<400> 43

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu15 10 15

Ala ser Gly Arg Val Ile Glu Ser Ser ser ser Ala Ser Ala Gln Ala20 25 30

Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly35 40 45

Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu50 55 ·■' 60

Glu ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly65 70 75 80

Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp85 90 95

vai Ala Thr Leu Thr Asp Gln Arg Ser Leu vai Asp Leu Gly Leu Gly100 105 HO

Pro vai Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr115 120 125

Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile130 135 140

Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val145 150 155 160Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala165 170 175

Arg Ala Thr Ala Ala Ala ser Ala Ser Lys Ile Ser ser Gln Glu Ser180 185 190

Ala Ala Ser Ala Ala Asn Ala Ala Asn Alá Glu Ala Lys Ala Asn Ala195 200 205

Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala210 215 220

Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys225 230 235 240

Ser Leu ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala245 250 255

Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu ser Gln Ala Arg Ala Ala260 265 270

Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln275 280 285

Ala Ala Ser Gln Ile Gln Ser Arg Alá Ser Ala Ser Glu Ser Ala Ala290 295 300

Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr305 310 315 320

Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu325 330 335

Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala340 345 350

Gl u Gly Glu Ala Val Ser Ile Ser Lys Gly- His Arg Gly Gly Ile Arg355 360 365

Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser ser Asn Val Ser370 375 380

Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala385 390 395 400

Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu405 410

<210> 44<211> 375<212> PRT

<213> Myrmecia forficata<400> 44

Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala ser Ala1 5 10 15

Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro20 25 30

Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile35 40 45

Lys Asp vai Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys50 55 60

Leu Gly Leu Gly Trp Lys Lys Val ser Met Gly Val Glu Arg Ala Glu65

70

75

80

Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile85 90 95

Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ála Ala Trp Ala Ser Ala100 105 HO

Gln Ala ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser115 120 125

Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser130 135 140

Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr145 150 155 160

Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala165 170 175

Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala180 185 190

Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu195 200 205

Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser210 215 ^ 220

Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala225 230 235 240

Ala Gly Gln Ala Ser Thr Ala Ala Glu Glü Ala Gln Ser Ala Gln Glu245 250 255

Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr vai Met Leu Glu Lys Ala260 265 270

Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala275 280 285

ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu290 295 300

Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala tíly Ala Ser Ala305 310 315 320

Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys325 330 335

Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys340 345 350

Glv Ser ser ser Ala ser Ala Ser Ala Ser Ala Ser Ala Glu Ala ser355 360 365

Ser Arg Leu Gly Lys Asp Trp

<210> 45<211> 394<212> PRT

<213> Myrmecia forficata<400> 45

Met Lys lie Pro Ala Ile Leu vai Thr ser Phe Leu Ala Trp Gly Leu

370

375

1

5

10WO 2007/038837 PCT/AU2006/001453

Ala Ser Gly Asn Leu Leu Lys Glu ser Lys Ala Ser Ala Ser Ala Ser20 25 30

Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu35 40 45

Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val50 55 60

Phe Asp Ile Lys Asp Val Val Leu Ser Ala vai Asp Glu Ile Asn Gly65 70 75 80

Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val ser Met Gly Val Glu85 90 95

Arq Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile100 105 HO

Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp115 120 125

Ala ser Ala Gln Ala Ser Ala Asp Ala Leu Ala ser Ala Arg vai Ala130 135 140

Gln Ala ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu145 150 155 160

Ala Leu ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala165 170 175

Ala Ala Thr Leu Asd Ala Met Asp Arg Trir Met Glu Asn Ala Arg Ala180 185 190

Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn195 200 205

Arg ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala210 215 220

ser Ala Leu Asn Asn Glu Ala Ala Val ASη Ala Ala Ala Ala Ala Ala225 230 235 240

Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr245 250 255

Ala Arg Ala Ala Gly Gln Ala ser Thr Ala Ala Glu Glu Ala Gln Ser260 265 270

Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu275 280 285

Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr290 295 300

Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala ser Ala Ile305 310 315 320

Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly325 330 335

Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser340 345 350

Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr355 360 365

Glv ser Lys Gly Ser Ser Ser Ala Ser Al?à ser Ala Ser Ala Ser Ala370 375 380

Glu Ala ser Ser Arg Leu Gly Lys Asp Trf385 390

<210> 46<211> 422<212> PRT

<213> Myrmecia forficata<400> 46

Ser Glu Leu Glu ser Glu Ala ser Ala Ala Ala Ser Ala Gln Ala Glu1 5 10 15

Ala ser ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser20 25 30

Ala ser Ala Ser Ala ser Ala ser Ala Gly ser Arg Gly Gly Ser Lys35 40 45

Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys50 55 60

ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile65 70 75 80

Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly85 90 95

lie Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala100 105 110

Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys115 120 125

Ala Val Ala Met Val Glu Ala Ala Ala GTu Ala Glu Ile Glu Val Ala130 135 140

Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala145 150 155 160

Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly165 170 175

Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala180 185 190

Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala195 200 205

Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala210 215 220

Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala lie Glu Gln Glu225 230 235 240

Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu245 250 255

Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala ser Ala Glu260 265 270

Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg-Ala Ser Val Ala Arg Ala275 280 285

Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly290 295 300

Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu305 310 315 320Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile ser Val Asn Ala Asp Leu325 330 335

ser Lys ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln340 345 350

Glu vai Lys Lys Ile ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys355 360 365

Glu Gly Arg Ser Lys Val Ser Ser Asn Ala ser Ala Arg Ala ser Ala370 375 380

Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly ser Lys Trp Gly Arg Gln385 390 395 400

Leu Ser Ala Ser ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser405 410 415

Gln Leu Leu Lys Val Trp420

<210> 47<211> 441<212> PRT

<213> Myrmecia forficata<400> 47

Met Lys lie Pro Ala lie Leu Ala Thr Ser Leu Leu lie Trp Gly Leu15 10 15

Val Gly Ala Ser Glu Leu Glu Ser Glu Ala ser Ala Ala Ala ser Ala20 25 30

Gln Ala Glu Ala Ser ser ser Gly Arg ser Gly Lys Leu ser Ala Ser35 40 45

Gln Ala ser Ala Ser Ala ser Ala Ser Ala Ser Ala Gly Ser Arg Gly50 55 60

Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser65 70 ' 75 80

Glu Ala Lys Ser Ala Ala Ala lie Ala VaT Glu Gly Ala Lys Ile Gly85 90 95

Thr Gly lie Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg100 105 110

Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala115 120 125

Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr130 135 140

Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile145 150 155 160

Glu vai Ala Asn Gln Glu vai Ala Ala vai Lys Leu ser Thr Trp Ala165 170 175

Ala Lys Ala Ala Arg Ile vai Glu Glu Asp ser Ala Ala Val Arg Ala180 185 190

Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu195 200 205

Arg Arg Ala Asn Glu Glu ser Glu Ala Ala Asn Glu Leu Ala Gln Ala210 215 220

ser ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg225 230 235 240

Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile245 250 255

Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu260 265, 270

Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala275 280 285

Ser Ala Glu ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val290 295 300

Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr305 310 315 320

Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys325 330 335

Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn340 345 350

Ala Asp Leu ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly355 360 365

Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lvs Gly Gly Trp Gly370 375 380

Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala ser Ala Arg385 390 395 400

Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp405 í. 410 415

Gly Arg Gln Leu Ser Ala Ser Ser Ala ser Ala Asp Ala Asn Ala Glu420 425 430

Ala Asp Ser Gln Leu Leu Lys Val Trp435 440

<210> 48

<211> 1212

<212> DNA ·

<213> Myrmecia forficata

<400> 48

agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct

gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct 1

ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct 1

tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag 2

agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg 3

gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg 3

aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag 4

gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc 4

gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc 5

caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag 6gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg 660gctatcgcgg cagcgaaaca atcggaggcg agagácgccg gcgccgaggc caaggccgcc 720atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg 780gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc 840gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct 900gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa 960gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca 1020agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc 1080tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc 1140ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca 1200ctcctgctgt aa 1212

<210> 49

<211> 1269

<212> DNA

<213> Myrmecia forficata

<400> 49

atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc 60gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag 120gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt 180agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc 240gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg 300gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc 360gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag 420accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc 480gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca 540tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa 600ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac 660gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct 720atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg 780gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca 840agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt 900gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag 960ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac 1020gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc 1080ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg 1140aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc 1200ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc 1260

ctgctgtaa 1269

<210> 50<211> 1179<212> DNA

<21Β> Myrmecia forficata

<400> 50 „

cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga bO

ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc 120

gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc 180

ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc 240

cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag BOO

atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc 360

gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt 420

gtcaccacca aagccgccaa agctgccgag gccaetatgg ccgctactgc ccgtgccacc 480

gccgccgcct cagcctccaa gatatccagt caggaãjícag ccgcatcggc cgctaacgcc 540

gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc 600

ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg 660

aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc 720

gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat

caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca

tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc

accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat

ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc 1020

agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca 1080

agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta 1140

gcgggagcat cagcgggcag cagtgccgac tccctttga H79

780840900960

<210> 51<211> 1236

<212> DNA t^Sr

<213> Myrmecia forficata

<400> 51 cn

atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg bu

gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc 120

ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa 180

gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga 240

ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt 300

acggatcagc gttctcttgt ggatctcggt cteggcccgg tcgcgaacga ggccgagatc 360ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg 420gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc 480accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc 540gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc 600aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg 660gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa 720tcgcttagcg ccgctcaggc cgccgccaag gcacàagcca ggaacgccga ggcctccgcc 780gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag 840gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc 900gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc 960gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg 1020tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc 1080aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc 1140agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg 1200ggagcatcag cgggcagcag tgccgactcc ctttga 1236<2i0> 52 <211> 1128 <212> DNA <213> Myrmecia forficata <400> 52 aatctcctta aggagtcgaa agcttccgcg tccgtgtccg cgtccgcttc cgcgagggcc 60agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg 120atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac 180ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag 240gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc 300agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct 360agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc 420gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg 480ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag 540gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta 600cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca 660gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc 720gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag 780aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc 840gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct 900atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc 960caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag 1020CT/AU2006/001453

aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc 1080gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag 1128

<210> 53

<211> 1185

<212> DNA

<213> Myrmecia forficata

atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat 60ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc 120ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc 180gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc 240gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg 300aacgcagccg ctgccgccga ggcattggcg atgatcaàga agattgccat ggcccgcagc 360agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc 420gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag 480gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg 540gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc 600agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt 660atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc 720gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca 780ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac 840gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct 900agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc 960aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa 1020gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag 1080aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc 1140agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag 1185

<210> 54

<211> 1269

<212> DNA

<213> Myrmecia forficata

<400> 54 , ,

agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct bü

ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca 120

gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag 180

agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc 240

ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg 300

gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa 360cttgccgaca agaccaccgc caaagcggtcatcgaggtgg ccaatcagga ggtcgcagccgcaaggatag tcgaggaaga cagcgccgccgccgcgagag ctgccgccgc cgccgagagagaacttgctc aagcgtcatc tgccgctgcccgtgaggccg ctgccgctgc cttggctatcgccgtcattt tggctcgcaa ggcacaagatgctgcgatga acgcccgtgt catcgcttccaatcgcgcta gtgtggcgcg tgccagtgcgaccgatgccg gcgccactgc cgagatcgcgatcaaccccg gcccgttgcc gaagatcatcgtcgaggcca tgaagatcac ccggggtcaaaaaggtggct ggggatgggg aaaggaaggaagagctagtg ccagcgccaa tgcagccgccctatccgcat catccgcgtc ggctgacgccgtgtggtga

<210> 55

<211> 1326

<212> DNA

<213> Myrmecia forficata

<400> 55

atgaagattc cagcgatact tgcgacgtccgagctcgaat cggaagcgag tgcggcggcgcgctccggca aactgtccgc gtctcaggctggcagcagag gtggcagcaa aggtggctgggaggcgaaga gcgccgccgc gatcgcggtcaataccgcgt ccgcatccgc ggaggcgctcgcggaggcgc aagccgcagc cgcaggtcaggccgacaaga ccaccgccaa agcggtcgccgaggtggcca atcaggaggt cgcagccgtcaggatagtcg aggaagacag cgccgccgtggcgagagctg ccgccgccgc cgagagacgccttgctcaag cgtcatctgc cgctgccgccgaggccgctg ccgctgcctt ggctatcgccgtcattttgg ctcgcaaggc acaagatgccgcgatgaacg cccgtgtcat cgcttccgcc

gccatggtcg aagcggcagc cgaggccgaa 420gtcaaattat cgacttgggc cgctaaagca 480gtgagggcgg ctgccggcaa attgcttttg 540cgcgccaacg aggaatccga ggcggccaac 600gccgaggccg aagccaaagc gaacgccggc 660gccgaggccg ccgtcgccat cgaacaagaa 720gçccgtttga atgctgaagc cgcagccgcc 780gccgaatccg aggccagtga agatctggag 840gccggtgccg ctgaggcaaa ggctatcgcc 900gcctacagtt gggccaagaa gggcgaactg 960agcgtcaacg ccgatctgtc caagagcgag 1020gtacaggaag tcaagaaaat cagcactcac 1080aggtcgaagg tatcttccaa cgctagtgcc 1140ggtagcctcg gcagcaaatg gggaagacaa 1200aacgccgaag ccgacagcca gttgctgaaa 1260 1269ctcctcatct ggggtcttgt cggcgccagc 60tctgcgcaag cggaagcgtc ctcgtctggt 120tccgccagcg cgtccgccag cgcgtcagcc 180ggccagctcc gccgtggtga tgttaagagc 240gaaggagcta aaatcggcac cggaatcgga 300tcacgaggac tcggcatcgg acaggcggcc 360gcagaggtcg ccgcgaaatc gtgcgaactt 420atggtcgaag cggcagccga ggccgaaatc 480aaattatcga cttgggccgc taaagcagca 540agggçggctg ccggcaaatt gcttttggcc 600gccaacgagg aatccgaggc ggccaacgaa 660gaggccgaag ccaaagcgaa cgccggccgt 720gaggccgccg tcgccatcga acaagaagcc 780cgtttgaatg ctgaagccgc agccgccgct 840gaatccgagg ccagtgaaga tctggagaat 900cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc 960

gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc 1020

aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc 1080

gaggccatga agatcacccg gggtcaagta caggáágtca agaaaatcag cactcacaaa 1140

ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga 1200

gctagtgcca gcgccaatgc agccgccggt agcctC^gca gcaaatgggg aagacaacta 1260

tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg 1320

tggtga 1326

<210> 56<211> 372<212> PRT<213> Oecophylla smaragdina<400> 56

Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala15 10 15

Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly20 25 30

Ser vai Ile Ser Glv Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr35 40 45

Ser vai Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn50 55 ., 60

Àla Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu65 70 <75 80

Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg ser Leu Ala Asp Asp85 90 95

Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala100 105 110

Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala115 120 125

Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln130 135 140

Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala145 150 155 160

Ala Gly ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala165 170 175

Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser180 185 190

Arg Ala Ala Ser Ala Ala Thr Gln Arg Afa Val Ala Ala Gln Asn Ala195 200 205

Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala1. Ala Gln Ala Glu Ala Arg210 215 220

Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala225 230 235 240

Gln Arg Asn Tyr Ala Ala Ala Lys Ala ser Ala Ser Ala Gly Ser vai245

250

255

Val Ala Glu Gln Asp Ala Gln ser Arg Ala Ala Asp Ala Glu Val Asn260 265 270

Ala Val Ala Gln Ala Ala Ala Arg Ala ser Val Arg Asn Gln Glu Ile275 280 285

vai Glu lie Gly Ala Glu Phe Gly Asn Ala ser Gly Gly Val Ile Ser290 295 300

Thr Gly Thr Arg ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly305 310 315 320

Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser325 330 335

Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu340 345 350

Gly Ser ser Glu Ala ser Ala Asn Ala Glti Ala Glu Ser Ser Ala Ser355 360 365

Ser Tyr ser ser370

<210> 57

<211> 391

<212> PRT

<213> Oecophylla smaragdina

<400> 57

Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe1 5 10 15

Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser ser Ala Ser Ala Ser20 25 30

Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val35 40 45

Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala50 55 60

Ser Thr Thr ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala65 70 ' 75 80

Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu85 90 95

Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu100 105 110

Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln ser115 120 125

Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu130 135 140

Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val145 150 155 160

Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile165 170 175

Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys

180

185

190Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu195 200 205

Ala Leu Ser Arg Ala Ala ser Ala Ala Thr Gln Arg Ala Val Ala Ala210 215 220

Gln Asn Ala Ala Ala Ala ser Ala Ala Ser Ala Gly Ala Ala Gln Ala225 230 235 240

Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu245 250 255

Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala ser Ala ser Ala260 265 270

Gly ser Val vai Ala Glu Gln Asp Ala Gln ser Arg Ala Ala Asp Ala275 280 285

Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn290 295 300

Gln Glu lie Val Glu Ile Gly Ala Glu Phe Gly Asn Ala ser Gly Gly305 310 315 320

Val Ile ser Thr Gly Thr Arg Ser ser Gly Gly Lys Gly Val Ser Val325 330 335

Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr ser Ser ser340 345 350

Ser ser Ser Ser Glv ile Asn Lys Gly His Pro Arg Trp Gly His Asn355 ' 360 365

Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser370 375 380

Ser Ala ser Ser Tyr Ser Ser385 390

<210> 58<211> 381<212> PRT

<213> Oecophylla smaragdina<400> 58

Gly Val Ile Gly Pro Asp Thr Ser ser Ser Ser Gln Ala ser Ala Ser15 10 15

Ala ser Ala Ser Ala Ser Ala Ser Ala Ser ser Ser Ala Ser Ile Gly20 25 30

Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly35 40 45

Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala vai Val Glu50 55 60

Ser Ala Ile Ser Asp Val ser Thr Leu Thr Asp Asp Arg Thr Leu Asn65 70 75 «0

Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln85 90 95

Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys100 105 HO

Gln ser Ile Ala Ala He Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala115 120 125Ser Ile vai Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala130 135 140

Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val ser Ser145 150 155 160

Glu Gln Phe Ala Ala Glu Ala Arg Ala Alá Ala Asp Ala Glu Ala Lys165 170 175

Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala180 185 190

Glu Ala Ala Thr Gly Leu ser Ala ser Ala Gly Lys Ala Gln Gln Ser195 200 205

Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala210 215 220

Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala225 230 235 240

Lys Ala Ala Val Ser Arg Ala ser Ala Asp Gln Ser Val Cys Thr Ser245 250 255

Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala ser Ala Ala Glu260 265 270

Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala275 280 285

Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala290 295 300

Glu Ser Phe Lys Arg Glu Leu ser Ser Vátf Val Leu Glu Ala Glu Ala305 . 310 315 320

Asn Ala Ser Ala ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser325 330 335

Ser ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser ser340 345 350

Tyr Gly ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala355 360 365

Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala370 375 380

<210> 59<211> 400<212> PRT

<213> Oecophylla smaragdina<400> 59

Met Lys lie Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu15 10 15

Ala Ser Gly Gly Val Ile Gly Pro Asp Thr ser Ser ser Ser Gln Ala20 25 tiV 30

ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala35 40 45

ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu50 55 60

Ala vai Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala65 70 75 80

Val Val Glu Ser Ala Ile ser Asp Val Ser Thr Leu Thr Asp Asp Arg85 90 95

Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu ser Leu Ala100 105 110

Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala115 120 125

Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu130 135 140

Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala145 150 155 160

Thr Ala Ala Ala Thr Ala Arg Ala Thr AÍà Val Ala Glu Ala Ala Lys165 170 175

vai ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala180 185 190

Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala195 200 205

Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala210 215 220

Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys225 230 235 240

Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile245 250 255

Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val260 265 270

Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser275 280 285

Ala Ala Glu Ser Ala Ala Ser Ala Gln ser Glu Ala Asn Thr Ile Ala290 295 300

Ala Glu Ala vai Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln305 310 315 320

Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu ser Ser Val Val Leu Glu325 330 335

Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser340 345 350

Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly355 360 365

Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe370 375 380

Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala ser Arg Ala Glu Ala Ala385 390 395 400

<210> 60

<211> 376<212> PRT

<213> Oecophylla smaragdina<400> 60Gly Val Pro Lys Glu Leu Gly Thr ser lie Ser ser Ala Ser Ala Ser1 5 10 15

Ala Ser Ala ser Ala ser Ala Thr Ala ser ser ser Ser Lys Asn Val20 25 30

His Leu Leu Pro Leu Lys ser Glu His Gly Ile Val Ile Asp Lys ser35 40 45

Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn50 55 60

Gly Ala Pro Asn lie Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu65 70 75 80

Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile85 90 95

Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala100 105 110

Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala115 120 125

Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala130 135 140

Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala145 150 155 160

Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg165 170 175

Ala Ala Thr ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala180 185 190

Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu ser lie Ala Lys195 200 205

Ala Ala ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala210 215 220

Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser225 230 235 240

Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu245 250 255

Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala260 265 270

Gln Leu Glu Glu Lys Val ser Ala Asp Gln Gln Ala Ala Ser Ala Ser275 280 285

Thr Asp Thr ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala290 295 300

ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn305 310 315 320

Thr Ala Ser ser Ser Ala Gln Ala Ser Ala Gln Ala ser Ala Leu Ala325 330 335

Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly340 345 350

Gly Ala Thr Ser Ala Ser Ala ser Ala Ser Ala Ser Ala Ser Ala Gln355 360 365

Ser Ser Ser Gln Gly Leu Val Tyr<210> 61<211> 395<212> PRT

<213> oecophylla smaragdina<400> 61

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu1 5 10 15

Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala20 25 30

Ser Ala ser Ala ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser35 40 45

Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile50 55 60

Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp65 70 75 80

Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser85 90 95

Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala100 105 110

Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val115 120 125

Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr130 135 140

Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg145 150 155 160

Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala165 170 175

Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln180 185 190

Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala195 200 205

Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser210 215 220

Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp225 230 235 240

Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn245 250 255

Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala260 265 270

Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln275 280 285

Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala290 295 300

Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala

305

310

315

320Ala Leu Ala ser Thr Val Asn Ala Ile Asn Asp Gly vai Val Ile Gly325 330 335

Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala ser Ala Gln Ala Ser340 345 350

Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr355 360 365

Lys lie Gly Gly Ala Thr ser Ala ser Ala Ser Ala ser Ala Ser Ala370 375 380

ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr385 390 ,,, 395

<210> 62<211> 424<212> PRT

<213> Oecophylla smaragdina<400> 62

Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala ser Ala Glu Ala15 10 15

Ser Ala Ser ser Ser Ala Tyr Gly ser Lys Tyr Gly Ile Gly Ser Gly20 25 30

Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser35 40 45

Ala ser Ala Ser ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr50 55 60

Gly Val Ser Asn Thr Ala Ser Ala ser Ala Glu Ala Leu Ser Arg Gly65 70 75 80

Leu Gly lie Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly85 90 95

Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr100 105 τ HO

Ala Gln Ala Val Ala Leu Val Glu Lys vai Ala Arg Ala Glu Val Asp115 120 125

Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala130 135 140

Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala145 150 155 160

Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu165 170 175

Arg Ala Asn Glu Asp ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr180 185 190

Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu195 200 205

Ala Gly Ala ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu210 215 220

Gln Glu Thr vai Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg225 230 235 240

ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala ser245 250 255Ala Glu Ala Glu Ala Ser ser Asp Leu Asn Asn Arg Ala Asn Ala Ala260 265 270

Arg ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu275 280 285

Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr ser ser ser Glu Lys Gly290 295 c 300

Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val ser Val Thr Ala305 310 315 320

Gly Leu Thr Gln Asn Glu Ile Ala Gly ser Gly Ala Ala Ala Ser Ala325 330 335

ser Ala Ser Ala Leu Ala Ser Ala ser Ala Gly Ala Gly Ala Gly Ala340 345 350

Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala355 360 365

Gly Ala Gly Ala Gly Ala Gly Ala ser Ala Gly Ala ser Ala Gly Ala370 375 380

Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu385 390 395 400

His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala405 410 415

Glu Ala Asn Ser Ser Ala Tyr Ala420

<210> 63<211> 443<212> PRT

<213> oecophylla smaragdina<400> 63

Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu15 10 15

Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser20 25 30

Ala Glu Ala Ser Ala ser ser ser Ala Tyr Gly ser Lys Tyr Gly Ile35 40 45

Gly ser Gly Ala Val ser Gly Ala Ser Ala Ser Ala ser Ala ser Ala50 55 60

ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala lie Glu Gly Val Asn65 70 75 80

Val Glv Thr Gly Val ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu85 90 95

Ser Arq Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala100 105 110

Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala115 120 125

Lys ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala130 135 140

Glu vai Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala145 150 155 160

Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu165 170 175

Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly ser Lys180 185 190

Ala Gln Glu Arg Ala Asn Glu Asp Ser lie Glu Ala Asn Glu Leu Ala195 200 205

Gl η Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala210 215 220

Ala Gln Glu Ala Gly Ala ser Ala Leu Ala lie Ala Gln Ala Ala Leu225 230 235 240

Asn lie Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr245 250 255

Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala260 265 270

Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala275 280 285

Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val290 295 300

Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser305 310 315 320

Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile vai ser325 330 335

vai Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly ser Gly Ala Ala340 345 350

Ala ser Ala ser Ala Ser Ala Leu Ala ser Ala ser Ala Gly Ala Gly355 360 365

Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val370 375 380

Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser385 390 395 400

Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser ser Leu Leu Leu Pro Gln405 410 415

Ser Lys Leu His Pro Ile Ser Arg Ser ser Ala Ser Ala Ser Ala Ser420 425 430

Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala435 440

<210> 64<211> 1119<212> DNA<213> Oecophylla smaragdina<400> 64

agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca 60tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac 120atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag 180gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc 240accgcgtccg ctgaaaaaaa cgccgaggcg cgttecttgg ccgacgatgc ggccgttcta 300gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa 360ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg 420gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct 480gccggtagcg ccctgâcggc tctcaaattg gcacgcaaac aggaagcgga atccaataat 540gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa 600cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa 660gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc 720caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa 780gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga 840gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc 900ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga 960gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac 1020aaaggacatc ccagatgggg gcacaattgg ggtttaggtt rír cttcggaagc gtcagcaaac 1080gctgaagccg aaagcagcgc ttcctcttat tcatcttaa 1119<210> 65 <211> 1176 <212> DNA <213> Oecophylla smaragdina <400> 65 atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc 60aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca 120gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc 180atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca 240gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc 300gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt 360cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga 420tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta 480tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc 540ggtagcgccc tgacggctct caaattggca cgcaaapagg aagcggaatc caataatgcc 600gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga 660gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct 720gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa 780agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat 840gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc 900agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga 960gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct 1020

caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa 1080

ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct 1140

gaagccgaaa gcagcgcttc ctcttattca tcttaa 1176

<210> 66<211> 1146<212> DNA

<213> Oecophylla smaragdina<400> 66

ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca 60

gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc 120

aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg 180

gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac 240

ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc 300

gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc 360

accgaaaagg cagagtacct tgcgtcgatc gtCgccacca aggcagcgaa ggccgccgag 420

gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc 480

gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct 540

tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc 600

agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct 660

aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc 720

aaagccgccg tgagccgagc aagcgccgat caatccgtçt gtacgtccca ggcacaagcc 780

gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa 840

gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct 900

caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc 960

aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg 1020

agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga 1080

cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct 1140

gcgtaa 1146

<210> 67<211> 1203<212> DNA

<213> Oecophylla smaragdina<400> 67

atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga 60

gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca 120

tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat 180

gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc 240gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt 300ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc 360agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc 420gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc 480acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag 540caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc 600atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc 660gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag 720gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa 780gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc 840agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc 900aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa 960gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat 1020gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt 1080tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac 1140ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg 1200taa 1203<210> 68 <211> 1131 <212> DNA <213> oecophylla smaragdina <400> 68 ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc 60gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag 120catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc 180gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc 240gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc 300gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc 360gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt 420agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg 480gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc 540gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc 600gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc 660gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg 720caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc 780caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc 840gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct 900gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat 960

accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat 1020

gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc 1080

gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g 1131

<210> 69

<211> 1188

<212> DNA

<213> Oecophylla smaragdina<400>

atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt 60gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca 120tccgcgaccg cgtcctccag tagcaagaat •-C«e > gttcacttat taccattgaa aagcgagcat 180ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat 240gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca 300aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc 360gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa 420gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga 480gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc 540gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca 600cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg 660gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat 720gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa 780gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag 840gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat 900caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc ~ I tgaagctgcc 960gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc 1020gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg 1080cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca 1140tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag 1188

<210> 70<211> 1275<212> DNA

<213> Oecophylla smaragdina

<400> 70 ^ cn

agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca bu

tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc 120

gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta 180

aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga 240ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc 300gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag 360aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg 420gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct 480gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa 540gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa 600gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc 660cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga 720tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag 780gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc 840gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca 900tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca 960ggtctgaccc agaacgaaat agcgggatca ggageggccg ctagtgctag tgccagtgct 1020cttgccagtg ccagtgccgg tgccggtgcc ggtgcá^gtg caggagccgg tgcaagtgca 1080ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg 1140agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc 1200catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt 1260tcggcgtatg cgtaa 1275

<210> 71

<211> 1332

<212> DNA

<213> Oecophylla smaragdina

<400> 71

atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc 60gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc 120gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc 180tctgccagcg cgtctgctag cgcatcagcc agcag-tgctc ccgcgatcga aggagtaaac 240gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc 300ggcatcggac aagcggctgc cgaagcgcaa gccgct&çcg ctggccaagc ggcgatcgct 360gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa 420gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca 480gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc 540ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac 600tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc 660aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt 720aacatcgagc aagagactgt taaattgacc cgtcaggccc agaatactcg tctcagatct 780gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc 840

agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag 900

accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc 960

gagaaaggcg agatcaccaa tcccggtcct ctgccçaaga tcgtcagtgt taccgcaggt 1020

ctgacccaga acgaaatagc gggatcagga gcggçcgcta gtgctagtgc cagtgctctt 1080

gccagtgcca gtgccggtgc cggtgccggt gcaggggcag gagccggtgc aagtgcagga 1140

gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt 1200

gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat 1260

ccaatctcca ggtcttccgc ctctgcctcc gcttçcgccg aggccgaagc taacagttcg 1320

gcgtatgcgt aa 1332

<210> 72<211> 562<212> prt

<213> Mallada signata<400> 72

Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala1S ίο 15

Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala20 25 30

Ala Gly Leu Gly Ala Ala Ser Gly Ala Ata Arg Arg Asn Val Ala Val35 40 45

Gly Ala Asn Gly Ala Ala Ala Ala ser Ala^Ala Ala Ala Ala Ala Arg50 55 * 60

Arg Ala Gly Ala lie Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala65 70 75 80

Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala85 90 95

Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly100 105 110

Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys115 120 125

Gly Gly Ala Ile Gly Leu Asn Ala Gly**Àla Ser Ala Asn Val Gly Ala130 135 140

Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala SerI45 150 155 160

Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu165 170 175

Asn Ala Gly Ala ser Ala Asn Ala Ala ATa Ala Ala Ala Lys Lys ser180 185 190

Gly Ala Val Gly Leu Asn Ala Gly Ala ServWla Asn Ala Ala Ala Ala195 200 205

Ala Ala Lys Lys ser Gly Ala Val Ala Ala Asn ser Ala Ala Ser Ala210 215 220Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn225 230 235 240

Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala245 250 255

Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu260 265 270

Arg Lys Asn Ala Leu Ala Ile Ala ser Asp Ala Ala Ala Val Arg Ala275 280 285

Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala290 295 300

Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr305 310 315 320

Leu Ala Ser Asp Ala Ala Arg Arg Ala Sér Asn Ala Ala Thr Ala Ala325 330 335

Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala-Ala Thr Ala Ala ser Asn340 345 350

Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala355 360 365

Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val ser Ala Ile370 375 380

Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr385 390 395 400

Asn Arg Ala Ala Glu Ala ser Asp Ala Ala Ala Ile Ala Ala Asp Ala405 410 415

Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala420 425 430

Arg vai ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly435 440 445

Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala vai Ala Arg Ala Ser Asp450 455 460

Ala Ala Ala Ala Gln Ala Asp Gly vai Ala Ile Ala vai Asn Gly Ala465 470 - 475 480

Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala485 490 495

Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg500 505 510

Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala515 520 525

Gly Gly Leu Ala Ala Gly ser Asn Ala Gly Ile Ala Ala Gly Ala Ala530 535 540

Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile545 550 555 560

Ala Leu

<210> 73<211> 588<212> PRT<213> Mallada signata<400> 73

Met Ala Ala Ser Asn Lys Ile Ile Phe Sér Phe Leu Ala Ile Val Leu1 5 10, 15

Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala vai Leu lie Ser Gly20 25 30

ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala35 40 45

Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala50 55 60

Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala65 70 75 80

Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly85 90 95

Leu Asn Gly Ala Ala Gly Ala Asn vai Ala Val Ala Gly Gly Lys Lys100 105 110

Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser115 120 125

Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly130 135 140

Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu145 150 155 160

Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn165 170 175

Gly Ala Ile Gly Leu Asn ser Ala Ala Ser Ala Asn Ala Ala Ala Ala180 185 190

Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala195 200 205

Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn210 215 220

Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys ser Gly225 230 235 240

Ala Val Ala Ala Asn ser Ala Ala ser Ala Asn Ala Ala Ala Ala Ala245 250 255

Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu ser260 265 270

Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala275 280 285

Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala290 295 300

Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala305 310 315 320

Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp325 330 335

Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala ser Asp Ala Ala340 345 350Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp355 360 365

Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala370 375 380

Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala385 390 395 400

Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala405 410 415

Arg Ala Ala Asp Ala Asp Ala Ile Ala Thri Asn Arg Ala Ala Glu Ala420 425 430

Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp435 440 445

Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu450 455 460

Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly ser Asp Ala Ala Ala Glu465 470 475 480

Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala485 490 495

Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala500 505 510

Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly515 520 525

Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly530 535 540

Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly545. 550 1 555 560

Ser Asn Ala Gly Ile Ala Ala Gly Ala Alá ser Gly Leu Ala Arg Gly565 570 575

Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu580 585

<210> 74<211> 1689<212> DNA

<213> Mallada signata<400> 74

gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct 60gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt 120gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct 180gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct 240gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta 300gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat 360ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc 420aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca 480gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct 540tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga 600gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc 660gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat 720gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa 780aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc 840agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa 900gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact 960ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc 1020actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc 1080gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat 1140gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc 1200aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct 1260gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc 1320gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc 1380agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct 1440actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc 1500gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc 1560gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg 1620gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata 1680gcattgtaa 1689

<210> 75

<211> 1767

<212> DNA

<213> Mallada signata

<400> 75

atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc 60acacactgtt catcaacagc tgtattgatt tctggtçcgg ctgctggtgc ttcctcacac 120aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt 180ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc 240gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca 300gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct 360ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac 420ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta 480aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga 540cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt 600ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct 660gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga 720gctgttgctg ccaattccgc tgcttcagca aatgcágctg ctgctgcaca aaagaaagcc 780gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa 840gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa 900aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc 960gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc 1020cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca 1080gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc 1140actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct 1200gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat 1260gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct 1320gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta 1380agtgatgcct tagctctcgc cgctaatgct gctgeccgag gatctgatgc cgccgctgaa 1440gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc 1500attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga 1560gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt 1620gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt 1680tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa 1740gtttgcgcag ctagaatagc attgtaa 1767

<210> 76

<211> 975

<212> DNA

<213> Artificial

<220>

<223> Honeybee siTk protein (Xenospira4) open reading frame optimizedfor plant expression (before sub-cloned into pETl4b and pVEC8)

<400> 76 atggctagag aagaggttga gactagggat aagactaaga cttctactgt ggtgaagtct 60gagaaggttg aagttgtggc tccagctaag gatgagctta agttgacttc tgagccaatt 120ttcggaagaa gagtgggaac tggagcttct gaagtggctt cttctagtgg agaggctatt 180gctatttctc ttggagctgg acaatcagca gcagagtctc aagctcttgc tgcttctcag 240tctaagactg ctgctaacgc tgctattggt gcttctgagc ttactaacaa ggtggcagct 300cttgttgctg gtgctactgg tgctcaagct agagctactg ctgcttcttc ttctgctctt 360aaggcttctc ttgctactga agaggctgct gaagaagctg aagctgctgt tgcagatgct 420aaagcagctg ctgagaaggc tgagtctctt gctaagaacc ttgcttctgc tagtgctaga 480gctgctcttt cttctgagag ggctaatgag cttgctcagg ctgaaagtgc tgcagctgct 540gaagctcaag ctaagaccgc tgctgctgcc aaagcagctg agattgctct taaggtggca 600gagattgctg taaaagctga ggcagatgct gcègccgçag ccgtggcagc tgcaaaagct 660agagctgtgg ctgatgcagc agccgccagg gctgctgctg ttaacgctat tgctaaggct 720

gaagaagagg cttcagctca agctgagaac gcagctggtg ttcttcaagc agctgcaagt 780

gctgctgctg agtcaagagc agcagcagcc gctgccgcag ctacttctga agcagcagct 840

gaagcaggac cacttgctgg tgaaatgaag ccaceacatt ggaagtggga gaggattcca 900

gtgaagaaag aagagtggaa aacttctaca aaagaggaat ggaaaactac taacgaagag 960tgggaggtga agtga :975

<210> 77

<211> 324

<212> PRT

<213> Artificial

<220>

<223> Honeybee siIk protein (Xenospira4) encoded by open reading frameoptimized for plant expression Çwithout transiational fusion)

<400> 77

Met Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr15 10 15

vai Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu20 25 30

Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly35 40 45

Ala Ser Glu Val Ala Ser Ser Ser Gly Glti Ala Ile Ala Ile Ser Leu50 55 60

i-

Gly Ala Gly Gln ser Ala Ala Glu ser Gln Ala Leu Ala Ala Ser Gln65 70 75 80

Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn85 90 95

Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala100 105 110

Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu115 120 125

Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala130 135 140

Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg145 150 155 160

Ala Ala Leu ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser165 170 175

Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala180 185 190

Ala Glu Ile Ala Leu Lys Val Ala Glu I^le Ala Val Lys Ala Glu Ala195 200 205

Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala210 215 ü; 220

Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala225 230 235 240

Glu Glu Glu Ala ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln245 250 255

Ala Ala Ala ser Ala Ala Ala Glu ser Arg Ala Ala Ala Ala Ala Ala260 265 270

Ala Ala Thr ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu275 280 285

Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro vai Lys Lys Glu290 295 300

Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu305 310 315 320

Trp Glu Val Lys

Claims

1. Polipeptídeo de seda substancialmente purificadoe/ou recombinante caracterizado pelo fato de que pelo menosuma porção do polipeptídeo tem uma estrutura de espiralenrolada.

2. Polipeptídeo, de acordo com a reivindicação 1,caracterizado pelo fato de que a porção do polipeptídeo quetem uma estrutura de espiral enrolada compreende pelo menos10 cópias da seqüência heptavalente abcdefg, e em que pelomenos 25% dos aminoácidos nas posições a e d são resíduosde alanina.

3. Polipeptídeo, de acordo com a reivindicação 1,caracterizado pelo fato de que a porção do polipeptídeo quetem uma estrutura de espiral enrolada compreende pelo menos10 cópias da seqüência heptavalente abcdefg, e pelo menos25% dos aminoácidos nas posições a, d e e são resíduos dealanina.

4. Polipeptídeo, de acordo com qualquer uma dasreivindicações 1, 2 ou 3, caracterizado por compreender umaseqüência selecionada entre:i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N°: 1; SEQ ID N°: 2; SEQ ID N°:22; SEQ ID N°: 23; SEQ ID N0 : 40; SEQ ID N0 : 41; SEQ ID N°:56 e SEQ ID N°: 57; Ί,,ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntica a qualquer uma ou mais entre SEQ ID N°: 1, SEQ IDN0 :2, SEQ ID N°: 22, SEQ ID N°: 23, SEQ ID N°:40, SEQ IDN°:41, SEQ ID N0:56 e SEQ ID N°:57; eiii) um fragmento biologicamente ativo de i) ou ii) .

5. Polipeptídeo, de acordo com qualquer uma dasreivindicações 1, 2 ou 3, caracterizado por compreender umaseqüência selecionada entre:i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N0 : 3; SEQ ID N0 : 4; SEQ ID N°:-24; SEQ ID N°: 25; SEQ ID N°: 42; SEQ ID N°: 43; SEQ ID N°:-58 e SEQ ID N0: 59;ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntica a qualquer uma ou mais das SEQ ID N° : 3, SEQ IDN0 :4, SEQ ID N0 :24, SEQ ID N°: 25, SEQ ID N°: 42, SEQ IDN0:43, SEQ ID N°:58 e SEQ ID N°:59; eiii) um fragmento biologicamente ativo de i) ou ii).

6. Polipeptideo, de acordo com qualquer uma dasreivindicações 1, 2 ou 3, caracterizado por compreender umaseqüência selecionada entre:i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N°: 5; SEQ ID N°: 6; SEQ ID N°:-26; SEQ ID N°: 27; SEQ ID N°: 44; SEQ ID N°: 45; SEQ ID N°:-60 e SEQ ID N°: 61;ii) uma seqüência de aminoácidos que é pelo menos 30%idêntica a qualquer uma ou mais das SEQ ID N0 : 5, SEQ IDN°: 6, SEQ ID N°: 26, SEQ ID N°: 27, SEQ ID N°: 44, SEQ IDN0 :45, SEQ ID N0:60 e SEQ ID N°:61; eiii) um fragmento biologicamente ativo de i) ou ii).

7. Polipeptideo, de acordo com qualquer uma dasreivindicações 1, 2 ou 3, caracterizado por compreender umaseqüência selecionada entre:i) uma seqüência de aminoácidos como fornecido emqualquer uma entre SEQ ID N°: 7; SEQ ID N°: 8; SEQ ID N°:-28; SEQ ID N°: 29; SEQ ID N°: 46; SEQ ID N°: 47; SEQ ID N°:-62 e SEQ ID N0: 63;ii) uma seqüência de aminoácidos que é pelo menos 30%idêntica a qualquer uma ou mais das SEQ ID N0 : 7, SEQ IDN°: 8, SEQ ID N°: 28, SEQ ID N°: 29, SEQ ID N°: 46, SEQ IDN°:47, SEQ ID N0:62 e SEQ ID N°:63; eiii) um fragmento biologicamente ativo de i) ou ii).

8. Polipeptídeo, de acordo com qualquer uma dasreivindicações 1, 2 ou 3, caracterizado por compreender umaseqüência selecionada entre:i) uma seqüência de aminoácidos como fornecido em SEQID N°: 72 OU SEQ ID N°: 73;ii) uma seqüência de aminoácidos que é pelo menos 30%idêntica a SEQ ID N°: 72 e/ou SEQ ID N°: 73; eiii) um fragmento biologicamente ativo de (i) ou (ii).

9. Polipeptideo de seda substancialmente purificadoe/ou recombinante caracterizado por compreender umaseqüência selecionada entre:i) uma seqüência de aminoácido como fornecido emqualquer uma das SEQ ID N°: 9; SEQ ID N°: 10 e SEQ ID N°: 30;ii) uma seqüência de aminoácidos que é pelo menos 3 0%idêntico a qualquer um ou mais das SEQ ID N0: 9, SEQ ID N°:e SEQ ID N0: 30; eiii) um fragmento biologicamente ativo de i) ou ii).

10. Polipeptídeo, de acordo com qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6 , 7, 8 ou 9, caracterizadopelo fato de que pode ser purificado a partir de umaespécie de Himenóptera pu Neuropirera.

11. Polipeptídeo, de acordo com a reivindicação 10,caracterizado pelo fato de que a espécie de Himenóptera éApis mellifera, Oecophylla smaragdina, Myrmecia foricata ouBombus terrestris.

12. Polipeptídeo, de acordo com a reivindicação 10,caracterizado pelo fato de que a espécie de Neuroptera éMallada signata.

13. Polipeptídeo, de acordo com qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ou 12,caracterizado pelo fato de ser fundido com pelo menos outropolipeptídeo.

14. Polinucleotídeo isolado e/ou exógeno que codificaum polipeptídeo de seda caracterizado pelo fato de que pelomenos uma porção do polipeptídeo tem uma estrutura deespiral enrolada.

15. Polinucleotídeo, de acordo com a reivindicação 14,caracterizado pelo fato de que o polinucleotídeo compreendeuma seqüência selecionada entre:i) uma seqüência de nucleqtídeos como fornecido emqualquer uma de SEQ ID N°: 11; SEQ ID N° : 12; SEQ ID N°:-31; SEQ ID N°: 32; SEQ ID N°: 48; SEQ ID N°: 49; SEQ ID N°:-64 e SEQ ID N0: 65;ii) uma seqüência de nucleotídeos codificando umpolipeptídeo de qualquer uma das reivindicações 1 a 4 ou 10a 13,iii) uma seqüência de nucleotídeos que é pelo menos-30% idêntica qualquer um ou mais das SEQ ID N°: 11; SEQ IDN°: 12; SEQ ID N°: 31; SEQ ID N°: 32; SEQ ID N°: 48; SEQ IDN°: 49; SEQ ID N°: 64 e SEQ ID N°: 65; eiv) uma seqüência que hibridiza com qualquer um entrei) a iii) sob condições rigorosas·.

16. Polinucleotídeo, de acordo com a reivindicação 14,caracterizado pelo fato de que o polinucleotídeo compreendeuma seqüência selecionada entre:i) uma seqüência de nucleotídeos como fornecido emqualquer uma das SEQ ID N°: 13; SEQ ID N°: 14; SEQ ID N°:33; SEQ ID N°: 34; SEQ ID N°: 50; SEQ ID N°: 51; SEQ ID N°:-66 e SEQ ID N°: 67; .ii) uma seqüência de nucleotídeos codificando umpolipeptídeo de qualquer uma das reivindicações 1 a 3, 5 ou-10 a 13,iii) uma seqüência de nucleotídeos que é pelo menos-30% idêntico a qualquer uma ou mais entre SEQ ID N°: 13;SEQ ID N°: 14; SEQ ID N°: 33; SEQ ID N°: 34; SEQ ID N°: 50;SEQ ID N°: 51; SEQ ID N°: 66 e SEQ ID N°: 67; eiv) uma seqüência que hibridiza com qualquer um entrei) a iii) sob condições rigorosas.

17. Polinucleotídeo, de acordo com a reivindicação 14,caracterizado pelo fato de que o polinucleotídeo compreendeuma seqüência selecionada entre: /i) uma seqüência de nucleotídeos como fornecido emqualquer uma entre SEQ ID N°: 15; SEQ ID N°: 16; SEQ ID N°:-35; SEQ ID N°: 36; SEG ID N°: 52; SEQ ID N°: 53; SEQ ID N°:-68 e SEQ ID N0: 69,ii) uma seqüência de nucleotídeos codificando umpolipeptídeo de qualquer uma das reivindicações 1 a 3, 6 ou-10 a 13,iii) uma seqüência de nucleotídeos que é pelo menos-30% idêntica a qualquer um ou mais das SEQ ID N° : 15; SEQID N°: 16; SEQ ID N°: 35; SEQ ID N0: 36; SEG ID N°: 52; SEQID N°: 53; SEQ ID N°: 68 e SEQ ID N°: 69, eiv) uma seqüência que hibridiza com qualquer um de i)a iii) sob condições rigorosas.

18. Polinucleotídeo, de acordo com a reivindicação 14,caracterizado pelo fato de que o polinucleotídeo compreendeuma seqüência selecionada entre:i) uma seqüência de nucleotídeos como fornecido emqualquer uma entre SEQ ID N°: 17; SEQ ID N°: 18; SEQ ID N°:- 37; SEQ ID N°: 38; SEG ID N°: 54; SEQ ID N°: 55; SEQ ID N°:- 70; SEQ ID N°: 71 e SEQ ID N°: 76Tii) uma seqüência de nucleotídeos codificando umpolipeptídeo de qualquer uma das reivindicações 1 a 3, 7 ou- 10 a 13,iii) uma seqüência de nucleotídeos que é pelo menos- 30% idêntica a qualquer um ou mais das SEQ ID N°: 17; SEQID N°: 18; SEQ ID N0: 37; SEQ ID N°: 38; SEG ID N°: 54; SEQID N°: 55; SEQ ID N°: 70; SEQ ID N°: 71 e SEQ ID N°: 76, eiv) uma seqüência que hibridiza com qualquer um de i)a iii) sob condições rigorosas.

19. Polinucleotídeo, de acòrdo com a reivindicação 14,caracterizado pelo fato de que o polinucleotídeo compreendeuma seqüência selecionada entre:i) uma seqüência de nucleotídeos como fornecido na SEQID N°: 74 OU SEQ ID N°: 75,ii) uma seqüência de nucleotídeos codificando umpolipeptídeo de qualquer uma das reivindicações 1, 2 ou 3,- 8 ou 10, 11, 12 ou 13,iii) uma seqüência de nucleotídeos que é pelo menos- 30% idêntica a SEQ ID N°: 74 e/ou SEQ ID N°: 75; eiv) uma seqüência que hibridiza com qualquer um de i)a iii) sob condições rigorosas.

20. Polinucleotídeo isolado e/ou exógeno caracterizadopelo fato de compreender uma seqüência selecionada entre:i) uma seqüência de nucleotídeos como fornecido emqualquer um entre SEQ ID N°: 19; SEQ ID N°: 20; SEQ ID N°:-21 e SEQ ID N0: 39;ii) uma seqüência de nucleotídeos codificando umpolipeptídeo de qualquer uma das reivindicações 1, 2 ou 3ou 9, 10, 11, 12 ou 13,iii) uma seqüência de nucleotídeos que é pelo menos-30% idêntica a qualquer uma ou Mais de SEQ ID N°: 19; SEQID N°: 20; SEQ ID N°: 21 e SEQ ID N°: 39; eiv) uma seqüência que hibridiza com qualquer um de i)a iii) sob condições rigorosas.

21. Vetor caracterizado pelo fato de compreender pelomenos um polinucleotídeo de qualquer uma das reivindicações-14, 15, 16, 17, 18, 19 ou 20.

22. Vetor, de acordo com a reivindicação 21,caracterizado pelo fato de ser um vetor de expressão.

23. Célula hospedeira caracterizada pelo fato decompreender pelo menos um polinucleotídeo de qualquer umadas reivindicações 14, 15, 16, ~17, 18, 19 ou 20, e/ou pelomenos um vetor da reivindicação 21 ou reivindicação 22.

24. Célula hospedeira, de acordo com a reivindicação-23, caracterizada pelo fato de ser uma célula bacteriana,de levedo ou planta.

25. Processo para preparar um polipeptídeo de qualqueruma das reivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,-12 ou 13 caracterizado pelo fato de compreender cultivo deuma célula hospedeira da reivindicação 23 ou reivindicação-24, ou um vetor da reivindicação 22, sob condições quepermitem expressão do polinucleotídeo que codifica opolipeptídeo, e recuperar o polipeptídeo expresso.

26. Planta transgênica caracterizada pelo fato decompreender um polinucleotídeo exógeno que codifica pelomenos um polipeptídeo de qualquer uma das reivindicações 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 OU 13.

27. Animal não humano transgênico caracterizado pelofato de compreender um polinucleotídeo exógeno que codificapelo menos um polipeptídeo de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6 , 7, 8, 9, 10, 11, 12 ou 13 .

28. Anticorpo caracterizado pelo fato de ligarespecificamente um polipeptídeo de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ou 12.

29. Fibra de seda caracterizada pelo fato decompreender pelo menos um polipeptídeo de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13.

30. Fibra, de acordo com a reivindicação 29,caracterizada pelo fato de que pelo menos alguns dospolipeptídeos são reticulados.

31. Fibra, de acordo com a reivindicação 30,caracterizada pelo fato de que pelo menos alguns dosresíduos de lisina dos polipeptídeos são reticulados.

32. Copolímero caracterizado pelo fato de compreenderpelo menos dois polipeptídeos de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13 .

33. Copolímero, de acordo com a reivindicação 32,caracterizado pelo fato de compreender um polipeptídeo dareivindicação 4, um polipeptídeo da reivindicação 5, umpolipeptídeo da reivindicação 6, e um polipeptídeo dareivindicação 7.

34. Copolímero, de acordo com a reivindicação 33,caracterizado pelo fato de compreender ainda umpolipeptídeo da reivindicação 9.

35. Copolímero, de acordo com a reivindicação 33 ou-34, caracterizado pelo fato de que pelo menos alguns dospolipeptídeos são reticulados.

36. Copolimero7 de acordo com a reivindicação 35,caracterizado pelo fato de que pelo menos alguns dosresíduos de lisina dos polipeptídeos são reticulados.

37. Produto caracterizado pelo fato de compreenderpelo menos um polipeptídeo de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13,uma fibra de seda de qualquer uma das reivindicações 2 9 a-31, e/ou um copolímero de qualquer uma das reivindicações-32, 33, 34, 35 ou 36.

38. Produto, de acordo com a reivindicação 37,caracterizado pelo fato de que o produto é selecionado dogrupo que consiste em: produto de higiene pessoal, artigostêxteis, plásticos, e produtos biomédicos.

39. Composição caracterizada pelo fato de compreenderpelo menos um polipeptídeo de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13,uma fibra de seda de acordo com qualquer uma dasreivindicações 29, 30 ou 31 e/ou ,um copolímero de qualqueruma das reivindicações 32, 33, 34, 35 ou 36, e um ou maisveículos aceitáveis.

40. Composição, de acordo com a reivindicação 39,caracterizada pelo fato de compreender ainda um fármaco.

41. Composição, de acordo com a reivindicação 39,caracterizada pelo fato de ser para uso como remédio, umdispositivo médico ou um cosmético.

42. Composição caracterizada pelo fato de compreenderpelo menos um polinucleotídeo de qualquer uma dasreivindicações 14, 15, 16, 17, 18, 19 ou 20, e um ou maisveículos aceitáveis.

43. Método de tratar ou prevenir uma doençacaracterizado pelo fato de compreender administrar umacomposição que compreende ,ura fármaco para tratar ouprevenir a doença e um veículo farmaceuticamente aceitável,em que o veículo farmaceuticamente aceitável é selecionadoentre pelo menos um polipeptídeo de qualquer uma dasreivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13,uma fibra de seda de qualquer uma das reivindicações 29, 3 0ou 31 e/ou um copolímero de qualquer uma das reivindicações- 32, 33, 34, 35 ou 36.

44. Uso de pelo menos um polipeptídeo de qualquer umadas reivindicações 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou- 13, uma fibra de seda de qualquer uma das reivindicações- 29, 30 ou 31, e/ou um copolímero de qualquer uma dasreivindicações 32, 33, 34, 35 ou 36, e um fármaco,caracterizado pelo fato de ser para a fabricação de ummedicamento para tratar ou prevenir uma doença.

45. Kit caracterizado por compreender pelo menos umpolipeptídeo de qualquer uma das reivindicações 1, 2, 3, 4,- 5, 6, 7, 8, 9, 10, 11, 12 ou 13, pelo menos umpolinucleotídeo de qualquer uma das reivindicações 14 a 20,pelo menos um vetor da reivindicação 21 ou reivindicação- 22, pelo menos uma fibra de seda de qualquer uma dasreivindicações 29, 30 ou 31 e/ou um copolímero de qualqueruma das reivindicações 32, 33, 34, 35 ou 36.